# <p align="center">interesting-python: 有趣的Python爬虫和数据分析小项目</p>
<p align="center">
<a href="">
<img src="https://img.shields.io/badge/状态-持续更新中-brightgreen.svg">
</a>
<a href="https://github.com/python/cpython">
<img src="https://img.shields.io/badge/Python-3.6-blue.svg">
</a>
<a href="https://wx1.sinaimg.cn/mw690/007yVcwsgy1g03lo67ikoj30u00f0ta0.jpg">
<img src="https://img.shields.io/static/v1.svg?label=%E5%BE%AE%E4%BF%A1%E5%85%AC%E4%BC%97%E5%8F%B7&message=Alfred%E6%95%B0%E6%8D%AE%E5%AE%A4&color=ff69b4">
</a>
<a href="https://github.com/Alfred1984/interesting-python">
<img src="https://img.shields.io/github/stars/Alfred1984/interesting-python.svg?style=social">
</a>
<a href="https://github.com/Alfred1984/interesting-python">
<img src="https://img.shields.io/github/forks/Alfred1984/interesting-python.svg?style=social">
</a>
</p>
## 简介
可以用Python实现的有趣的小项目,内容包括Python爬虫、Python数据分析、机器学习、深度学习等,持续更新中。
本Repository主要用于存放项目代码,对应的项目文章可以关注公众号。
</br>
作者:Alfred
微信公众号:[Alfred数据室](https://wx1.sinaimg.cn/mw690/007yVcwsgy1g03lo67ikoj30u00f0ta0.jpg)(原名为Alfred在纽西兰)
合作请加微信号:AlfredLabAssistant
</br>
## Alfred数据室课程
应诸位读者朋友的要求,Alfred数据室将陆续推出 **《实战玩转数据科学》** 系列课程,课程分为数据获取、数据分析、大数据分析三个部分,从如何获取数据、怎么分析数据、通过什么方法分析海量数据三方面带大家玩转数据分析。
数据获取部分子课程 **[《实战玩转Python爬虫》](https://study.163.com/course/introduction/1209511875.htm?share=2&shareId=480000001946441)** 现已正式上线。课程以目标为导向,从项目出发,十大案例掌握数据获取,让Python爬虫学习思路更清晰,路径更明确。详情可点击:[实战玩转Python爬虫](https://study.163.com/course/introduction/1209511875.htm?share=2&shareId=480000001946441)
可以扫描以下二维码进行课程咨询哦:
<img src="https://github.com/Alfred1984/interesting-python/blob/master/Mia%E4%BA%8C%E7%BB%B4%E7%A0%81.jpg" width="150" />
</br>
### 项目介绍
1. **LiveStreaming**:
- 内容: 爬取了西瓜直播(今日头条旗下APP)各类型游戏的主播直播数据107.5万条,并分析直播平台和游戏主播行业是否真如我们想象般的暴利
- 对应微信公众号文章:《[游戏直播行业真的如你想象般暴利?](https://mp.weixin.qq.com/s/-B8cWjB6db6t0gNmqJ34GQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★★☆
</br>
2. **LaborDay**:
- 内容: 按全国各个城市抓取飞猪“景点门票”栏的景点门票销售数据,并且分析五一哪些景点会人挤人,哪些景点值得一去
- 对应微信公众号文章:《[五一不看人人人人人人,哪儿耍合适?](https://mp.weixin.qq.com/s/iuCNreCuKzrggdXtvurpkQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★☆☆☆
</br>
3. **KrisWu**:
- 内容: 随机抓取吴亦凡发表《大碗宽面》微博的微博转发数据10万条,并分析该条微博的真假转发比例,以及大家对于这首歌的情感倾向如何
- 对应微信公众号文章:《[大碗宽面 VS 律师函警告,情感分析吴亦凡自黑式圈粉!](https://mp.weixin.qq.com/s/Neh3asFZAtcIzywwXstBYQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
4. **ESL**:
- 内容: 爬取外籍人员招聘网站JobLEADChina上的外籍英语老师招聘数据945条,万行教师人才网上的英语老师招聘数据5780条,以及微信群成员信息498条,分析外教教师的招聘状况
- 对应微信公众号文章:《[没经验没学历的外教为啥能拿1.4W+的高薪?](https://mp.weixin.qq.com/s/BMfiB08gWy66zzvCe2lJmQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★☆☆☆☆
</br>
5. **ICU996**:
- 内容: 爬取程序员集体抵制996的Github热门项目[996.ICU](996.ICU)中,Issues页面讨论数据和点了star的程序员Github个人信息数据,并且分析这群抵制996的程序员都是何方神圣
- 对应微信公众号文章:《[大胆,都是哪些程序员在反对996?!](https://mp.weixin.qq.com/s/BZhHcEwdUJNJRVFix8NRSQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★☆☆☆
</br>
6. **Paediatrician**:
- 内容: 爬取[丁香人才网](https://www.jobmd.cn/)10950条涵盖儿科、内科、外科、妇产科、眼科的招聘数据,并且分析儿科医生的生存处境
- 对应微信公众号文章:《[儿科医生的眼泪,全被数据看见了](https://mp.weixin.qq.com/s/3SCI4kL-YX-9q1WDY23J-A)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
7. **CaiXuKun**:
- 内容: 随机抓取蔡徐坤100万+转发的微博《再见,“任性的”千千…》的10万条转发数据,并且分析蔡徐坤真假转发流量的比例以及真假粉丝的用户画像
- 对应微信公众号文章:《[用大数据扒一扒蔡徐坤的真假流量粉](https://mp.weixin.qq.com/s/j1kgf2RR7jssbWa7uWC-uA)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
8. **BSGS_Rent**:
- 内容: 爬取北上广深四个城市的链家租房房源信息,并且分析四个城市的租房现状和考虑因素
- 对应微信公众号文章:《[北上广深租房图鉴](https://mp.weixin.qq.com/s/sb-g7sGmPJPIsfF23INlmQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
9. **Fireworks_and_Pm2.5**:
- 内容: 爬取全国367个城市的空气质量指数数据,并分析烟花爆竹对空气质量的影响,以及城市禁放烟花爆竹是否有效
- 对应微信公众号文章:《[六万条数据全面解析,城市春节禁放烟花爆竹真的有用吗?](https://mp.weixin.qq.com/s/TO9ouZXOThiM5iOHqt0i0A)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
10. **TheWanderingEarth**:
- 内容: 爬取电影《流浪地球》的猫眼评论和评分,并分析该电影出现低分的原因
- 对应微信公众号文章:《[十万条评论告诉你,给《流浪地球》评1星的都是什么心态?](https://mp.weixin.qq.com/s/3d_ycK0D1KfbjQJ3m7FhEQ)》
- 适合人群:Python爬虫学习者、Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度:★★★☆☆
</br>
11. **Weibo_Comment_Pics**:
- 内容: 模拟登陆微博手机端爬取海量表情包
- 对应微信公众号文章:《[开年表情包局部富有指南,盘它!](https://mp.weixin.qq.com/s/iTtVXMVdoTBxWHzEzbQH1Q)》
- 适合人群:Python爬虫学习者
- 难度:★★★☆☆
</br>
12. **English_names**:
- 内容: 分析美国婴儿取名数据,为取英文名提供一些建议
- 对应微信公众号文章:《[看完这篇分析,楼下的Tony和Kevin都改名了!](https://mp.weixin.qq.com/s/7dGJbueO-_cLuw9d8mPUyg)》
- 适合人群:Python数据分析学习者、Pandas使用者、数据可视化学习者
- 难度�
没有合适的资源?快使用搜索试试~ 我知道了~
有趣的Python爬虫和Python数据分析小项目
共151个文件
py:46个
md:31个
csv:31个
需积分: 0 1 下载量 126 浏览量
2024-01-17
20:34:58
上传
评论
收藏 48.47MB ZIP 举报
温馨提示
python项目
资源推荐
资源详情
资源评论
收起资源包目录
有趣的Python爬虫和Python数据分析小项目 (151个子文件)
scrapy.cfg 292B
scrapy.cfg 260B
scrapy.cfg 256B
data.csv 15.22MB
all_data.csv 13.43MB
donald_trump_twitter.csv 8.91MB
data.csv 5.51MB
AQI_Data.csv 3.93MB
data_sample.csv 3.08MB
data1.csv 2.34MB
watermelon.csv 1.96MB
mlalgorithm.csv 1.32MB
data2.csv 994KB
data3.csv 793KB
中小学.csv 738KB
datamining.csv 523KB
data4.csv 518KB
com_detailed.csv 463KB
job_detailed.csv 369KB
lychee.csv 201KB
machinelearning.csv 196KB
jobleadchina.csv 176KB
外语培训.csv 57KB
job_list.csv 39KB
幼儿园.csv 27KB
data_gm.csv 24KB
city_tencent.csv 22KB
city.csv 21KB
city_data.csv 12KB
city_data.csv 12KB
discount.csv 12KB
职业院校.csv 4KB
salary.csv 865B
us_media.csv 589B
20G 绝地求生比赛数据集分析.ipynb 13.67MB
xigua.ipynb 2.46MB
liziqi.ipynb 1.28MB
北上广深租房图鉴.ipynb 1.16MB
《我是大侦探》到底怎么了?(下:情感分析篇).ipynb 1.01MB
Babynames.ipynb 991KB
儿科医生.ipynb 746KB
jay.ipynb 579KB
Fireworks and Pm2.5.ipynb 465KB
长安十二时辰.ipynb 337KB
donald_trump_twitters.ipynb 321KB
CaiXuKun.ipynb 300KB
数据分析.ipynb 297KB
TheWanderingEarth.ipynb 284KB
数据挖掘、机器学习算法实习生需求分析.ipynb 252KB
lychee.ipynb 242KB
996.ipynb 237KB
laborday.ipynb 205KB
eq_final.ipynb 186KB
KrisWu.ipynb 170KB
Country_Road.ipynb 151KB
Baidu_Robin.ipynb 83KB
erangel.jpg 2.4MB
比心.JPG 678KB
miramar.jpg 286KB
reward.jpg 195KB
Mia二维码.jpg 40KB
README.md 11KB
readme.md 4KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 2KB
readme.md 1KB
readme.md 1KB
readme.md 1KB
readme.md 1KB
readme.md 1KB
readme.md 1KB
readme.md 434B
readme.md 75B
readme.md 35B
readme.md 35B
readme.md 31B
readme.md 25B
readme.md 25B
readme.md 23B
readme.md 23B
readme.md 23B
readme.md 23B
readme.md 23B
readme.md 2B
readme.md 1B
coffee.png 249KB
font_decode.py 8KB
dingxiang_job.py 8KB
photo_clawler.py 7KB
house_data_crawler.py 6KB
settings.py 4KB
youku_comments.py 4KB
comment_crawler.py 4KB
共 151 条
- 1
- 2
资源评论
zero2100
- 粉丝: 166
- 资源: 2464
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功