没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
《大学计算机》课程报告
专业班级
学
姓
号
名
项 目
得 分
2017 年 6 月 15 日
第 1 页
中超球队身价历年排名数据分析处理
一、任务描述
使用 python 编写爬虫程序获取中超球队 2013-2018 身价排名,内容包括排名序号、球队名称、球队身
价、年份,并将获取数据保存到 txt 文件中,再将 txt 文件数据转入 excel 文件中。
使用 excel 工具对获取的电影信息进行数据处理。
使用 Jannchie/Historical 工具对统计分析结果进行动态可视化处理,利用 excel 工具对统计分析结果进
行图表可视化处理,使用百度图说对统计分析结果进行可视化处理。
二、数据获取
1 数据描述
数据来源:500 彩票网中超页面球队身价排名。
数据获取:Python 爬虫爬取网页数据。
2 使用工具
Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,它拥有一个强大的
基本类库和数量众多的第三方扩展。
3 数据获取步骤
第一步:从网页上获取 HTML 内容。
第二步:分析网页内容并提取有用数据,采用列表存储球队所涉及的表单数据
第三步:将获得的数据写入 Excel 文件。
4 程序代码
1) 获取数据代码如下
第2页
r = requests.get(url, timeout=30)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
ulist.append([tds[0].string, tds[1].string, tds[2].string,
tds[3].string, tds[4].string, tds[5].string,tds[6].string])
num = 10
file = open('wz.txt', 'r', encoding='UTF-8')
f = open('pm.txt', 'w',encoding='UTF-8')
print("{:^10}\t{:^6}\t{:^10}\t{:^6}\t{:^10}\t{:^6}\t{:^10}\t{:^6}".format
("排名","球队名称","球队身价","平均身价","球员数量","平均年龄","联赛排名","年份"))
f.write("{:^10},{:^6},{:^10},{:^6},{:^10},{:^6},{:^10},{:^6}".format("排名
","球队名称","球队身价","平均身价","球员数量","平均年龄","联赛排名","年份")+"\n")
for line in file:
url = line[5:]
a = line[0:5]
uinfo = []
html = getHTMLText(url)
fillUnivList(uinfo, html)
for i in range(num):
u = uinfo[i]
print("{:^10}\t{:^6}\t{:^10}\t{:^6}\t{:^10}\t{:^6}\t{:^10}\t{:^6}".
format(u[0],u[1],u[2][1:-1],u[3][1:-1],u[4],u[5],u[6],a))
f.write("{:^10},{:^6},{:^10},{:^6},{:^10},{:^6},{:^10},{:^6}".format
(u[0],u[1],u[2][1:-1],u[3][1:-1],u[4],u[5],u[6],a)+"\n")
f.close()
file.close()
第3页
剩余10页未读,继续阅读
资源评论
- m0_748295892023-05-31资源很实用,内容详细,值得借鉴的内容很多,感谢分享。
春哥111
- 粉丝: 1w+
- 资源: 5万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功