### py爬虫+数据分析实战项目
#### 记录日常练手实战项目源代码,以及PY系列的内容,涵盖了
- 1、星巴克店铺数量及分布城市的分析
- 2、微信好友中的男女比例、个性签名、全国分布的可视化
- 3、使用 Selenium 自动爬取斗鱼直播间的数据,包括直播间 图片、详情链接、标题、分类、热度、主播等
- 4、Kaggle上的一个经典比赛项目:泰坦尼克号生存预测。(附上项目链接:https://www.kaggle.com/c/titanic/data) 在这里,要求你完成对哪些人可能生存的分析,特别是要求您运用机器学习的工具来预测哪些乘客幸免于难
- 5、使用 Scrapy_Redis 抓取京东图书的信息,有图书的大类别(book_category)、图书小类别的 url(s_href)、图书的小类别(s_cate)、图片(book_img)、书名(book_name)、作者(book_author)、出版社(book_press)、出版时间(book_publish_date)、价格(book_price)等
- 6、爬取及分析拉勾网数据分析职位的相关信息,利用爬虫软件(八爪鱼)爬取数据,再从多维度(区域、 薪资、学历、技能要求等)进行分析,使用 python 分析库分析区域分布、薪资分布及其各个 字段之间的关联
免责声明:
1.本资源仅供学习和交流使用,不保证其准确性、完整性、及时性或适用性。
2.本资源仅包含一般信息,不构成专业建议。在使用本资源时,请务必自行研究并谨慎决策。
3.我已尽力确保本资源的正确性和合法性,但不对其准确性、完整性和及时性做出保证。
4.本资源不应用于商业用途。
5.在使用本资源的过程中,用户应自行承担所有风险和责任,并遵守相关法律法规。
6.对于因使用本资源而产生的任何损失或损害,我概不负责。
请确保在使用本资源时仔细阅读并遵守以上免责声明。如果您有任何疑问或需要进一步帮助,请联系我。
没有合适的资源?快使用搜索试试~ 我知道了~
基于python的爬虫+数据分析实战项目.zip
共16个文件
ipynb:4个
zip:3个
csv:3个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
1 下载量 167 浏览量
2024-02-05
19:56:01
上传
评论 1
收藏 7.07MB ZIP 举报
温馨提示
基于python的爬虫+数据分析实战项目.zip 基于python的爬虫+数据分析实战项目.zip ### py爬虫+数据分析实战项目 #### 记录日常练手实战项目源代码,以及PY系列的内容,涵盖了 - 1、星巴克店铺数量及分布城市的分析 - 2、微信好友中的男女比例、个性签名、全国分布的可视化 - 3、使用 Selenium 自动爬取斗鱼直播间的数据,包括直播间 图片、详情链接、标题、分类、热度、主播等 - 4、Kaggle上的一个经典比赛项目:泰坦尼克号生存预测。 在这里,要求你完成对哪些人可能生存的分析,特别是要求您运用机器学习的工具来预测哪些乘客幸免于难 - 5、使用 Scrapy_Redis 抓取京东图书的信息,有图书的大类别(book_category)、图书小类别的 url(s_href)、图书的小类别(s_cate)、图片(book_img)、书名(book_name)、作者(book_author)、出版社(book_press)、出版时间(book_publish_date)、价格(book_price)等 - 6、爬取及分析拉勾网数据分析职位的相关信息,利用爬虫软件(八爪鱼)爬取数据,再从多维度(区域、 薪资、学历、技能要求等)进行分析,使用 python 分析库分析区域分布、薪资分布及其各个 字段之间的关联
资源推荐
资源详情
资源评论
收起资源包目录
爬虫+数据分析实战项目(基于python)-Spider-Data_Analysis.zip (16个子文件)
Spider-Data_Analysis-master
_config.yml 26B
Titanic
titanic_pred.csv 3KB
titanic.ipynb 145KB
titanic数据集.zip 34KB
星巴克数据分析
Starbucks.ipynb 101KB
store-locations.zip 1.13MB
微信好友可视化分析
friend_pyecharts.ipynb 68KB
friend.csv 24KB
京东图书信息爬取.zip 9KB
爬取斗鱼直播间数据(Selenium)
douyu_spider.py 2KB
6.lagou
des.txt 480KB
lagou_DT.csv 545KB
lagou_DT.ipynb 277KB
DT.jpg 313KB
SimHei.ttf 9.58MB
README.md 2KB
共 16 条
- 1
资源评论
武昌库里写JAVA
- 粉丝: 3136
- 资源: 1872
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 农村信用社联合社计算机信息系统投产与变更管理办.docx
- 农村信用社联合社计算机信息系统数据管理办法.docx
- 利用SPSS作临床效度分析线上计算网站介绍-医学研究部统计谘.(医学PPT课件).ppt
- 利用Zabbix监控mysqldump定时备份数据库状态.docx
- 利用计算机解决问题的基本过程.doc
- 化工铁路通信工程总结.doc
- 北京大学网络教育软件工程作业.docx
- 医药公司(连锁店)计算机操作规程未新系统的自行按照旧制修改-新系统过制的编号加修模版.doc
- 医药公司(连锁店)计算机系统操作规程模版.doc
- 医药连锁门店计算机系统的操作和管理程序未新系统的自行按照旧制修改-新系统过制的编号加修模版.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功