文字挖掘
大学的一个项目(Modul Text Mining)。 任务是从walterfootball.com网站上检索NFL游戏报告,并将文本中的球员统计信息映射到Kaggle数据集( )。
执行
要生成数据,如果不下载,则需要Python(所需的库:os,re,json,请求,BeautifulSoup,ijson和datetime)和R(所需的库:stringr,rjson,rlist,tidyverse和标记器)。 首先,执行python脚本,然后执行R脚本“ ExecutePipeline.R”。
输出
可以在文件夹“数据/输出”中找到输出。 为了进行可视化,您可以查看或文件夹“输出”中。