# :bug:**2023年美赛成绩爬虫和可视化分析**
:arrow_heading_down:**你可以通过以下两种方式运行本程序**
#### :golf:**1.一键运行安装包**
1. 去release中解压MCM-ICM-Crawler文件,其中已经帮你配置好tesseract目录中的**tesseract.exe文件和**和**tessdata语言包**,你只需要更改config.yaml文件中的线程数和爬取数量。
2. 进入终端输入指令 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt安装依赖。
3. 输入指令python run.py即可运行程序。
#### :computer:**2.源码运行**
需要python版本>=3.8
1. git clone https://github.com/leost123456/MCM-ICM-Crawler.git 到本地仓库,或者直接下载源码。
2. 下载tesseract和其语言包,windows用户可去[链接](**https://digi.bib.uni-mannheim.de/tesseract/)**进行下载,并完成安装。
3. 完成安装后,在config.yaml文件中填写tesseract目录中的**tesseract.exe文件的路径**、**tessdata语言包**的路径、线程数和爬取数量。
4. 在终端中输入指令 pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt安装依赖。
5. 最后输入指令python run.py 程序即可运行。
#### :o:**3.输出结果**
1. 所有成绩奖状图片(将存放在result目录下的Award picture目录中)
2. 文件数据(包括队伍号、队员名称、指导老师名称、学校、奖项,存放在result目录下的data.csv文件中)
3. 可视化图片(8张分析图片)
---
### :black_flag:**结果展示**
**最终一共获得了20615条数据,可视化如下所示:**
**1.美赛各奖项计数情况**
[![image.png](https://i.postimg.cc/4yPt6wSP/image.png)](https://postimg.cc/BP8Xs5sP)
**2.美赛各参加学校计数前十五名**
[![image.png](https://i.postimg.cc/tgRgPpHK/image.png)](https://postimg.cc/5XG1Wcyg)
**3.获得Successful Participant奖项最多前十五名学校名称**
[![Successful-Participant.png](https://i.postimg.cc/dVwQPwDh/Successful-Participant.png)](https://postimg.cc/8jXgL8RG)
**4.获得Honorable Mention奖项最多前十五名学校名称**
[![Honorable-Mention.png](https://i.postimg.cc/MG48TSZb/Honorable-Mention.png)](https://postimg.cc/GBkf76yH)
5**.获得Meritorious Winner奖项最多前十五名学校名称**
[![Meritorious-Winner.png](https://i.postimg.cc/yYP4R9YN/Meritorious-Winner.png)](https://postimg.cc/566RdXzc)
6.**获得Finalist奖项最多前十五名学校名称**
[![Finalist.png](https://i.postimg.cc/59SkKJc7/Finalist.png)](https://postimg.cc/MXXDXhpV)
**7.获得Outstanding Winner奖项最多前十五名学校名称**
[![Outstanding-Winner.png](https://i.postimg.cc/RCpwZpwC/Outstanding-Winner.png)](https://postimg.cc/F1cYPZPw)
---
### :key:**免责声明**
**本项目仅供学习参考,如用于其他违法行为,后果自负,本人概不负责。**
没有合适的资源?快使用搜索试试~ 我知道了~
2023年美赛成绩爬虫一键运行和可视化分析(数学建模,mathematical modeling,Crawler).zip
共49个文件
dll:13个
exe:11个
svg:7个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 15 浏览量
2024-04-11
19:40:04
上传
评论
收藏 11.02MB ZIP 举报
温馨提示
1、资源内容:历届数学建模比赛题汇整理资料和一些思路,源码参考。适用于打算参加数学建模思路参考及一些算法参数等。 2、适用人群:计算机,电子信息工程、数学等专业的学习者,作为“参考资料”参考学习使用。 3、解压说明:本资源需要电脑端使用WinRAR、7zip等解压工具进行解压,没有解压工具的自行百度下载即可。
资源推荐
资源详情
资源评论
收起资源包目录
2023年美赛成绩爬虫一键运行和可视化分析(数学建模,mathematical modeling,Crawler).zip (49个子文件)
newModel
Universal.py 11KB
LICENSE 34KB
config.yaml 572B
run.py 5KB
plugin
pytesseract
__init__.py 626B
pytesseract.py 15KB
__pycache__
pytesseract.cpython-38.pyc 15KB
__init__.cpython-38.pyc 723B
poppler-0.68.0
bin
zlib1.dll 101KB
pdftotext.exe 808KB
libtiff3.dll 368KB
freetype6.dll 540KB
README 2KB
pdftohtml.exe 1.48MB
AUTHORS 145B
pdftoppm.exe 474KB
libpoppler-79.dll 18.65MB
libpng16-16.dll 190KB
libcairo-2.dll 1.09MB
COPYING3 34KB
README-XPDF 15KB
libexpat-1.dll 430KB
BINARIES 1KB
libstdc++-6.dll 1.44MB
libfontconfig-1.dll 273KB
jpeg62.dll 125KB
libgcc_s_dw2-1.dll 916KB
pdfimages.exe 867KB
pdffonts.exe 471KB
pdfseparate.exe 447KB
pdftops.exe 501KB
COPYING 18KB
libpoppler-cpp-0.dll 2.19MB
pdftocairo.exe 1.71MB
pdfunite.exe 550KB
libpixman-1-0.dll 525KB
pdfinfo.exe 1.09MB
pdfdetach.exe 457KB
requirements.txt 99B
.gitignore 51B
README.md 3KB
result
获得Finalist奖项最多前十五名学校名称.svg 93KB
美赛各参加学校计数前十五名条形图.svg 88KB
美赛各奖项计数条形图.svg 53KB
获得Outstanding Winner奖项最多前十五名学校名称.svg 89KB
data.csv 2.06MB
获得Honorable Mention奖项最多前十五名学校名称.svg 96KB
获得Meritorious Winner奖项最多前十五名学校名称.svg 93KB
获得Successful Participant奖项最多前十五名学校名称.svg 96KB
共 49 条
- 1
资源评论
白话Learning
- 粉丝: 3452
- 资源: 2488
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功