# 51job_spiders
前程无忧爬虫
【程序运行前确保项目需要的库都已下载】
# 数据爬取:
```
1、修改51job_info.py代码66行,根据需要修改页数,默认2页,数据分析需要海量数据时可修改成1000页
2、运行51job_info.py
3、输入职位关键词 如:大数据、C语言、软件开发
4、爬取到的数据将储存在51job.xls
```
程序中注释内容包含大量调试信息,遇到异常时可以打开注释,查看运行情况
爬取过程中因为单页内容较多,请耐心等候
如果程序未能爬取到信息,可能的原因是缺少包,或者该网页源码被修改,需要重新定义正则
# 数据清洗与数据可视化
```
1、运行51job_clean.py
2、代码默认对职位的清洗条件的非大数据相关的职位,需要根据你们搜索的职位自行修改
3、清洗后的数据将储存在51job2.xls,(若清洗后的数据中还有错误数据,可修改清洗条件或手动将错误数据删除)
4、运行51job_view.py
4、pyecharts动态图将生成 .html 文件,用浏览器打开即可
```
没有合适的资源?快使用搜索试试~ 我知道了~
爬取前程无忧网中大数据相关岗位数据并可视化分析.rar
共10个文件
html:3个
py:3个
xls:2个
需积分: 5 3 下载量 44 浏览量
2024-04-06
19:15:52
上传
评论
收藏 6.29MB RAR 举报
温馨提示
# 51job_spiders 前程无忧爬虫 【程序运行前确保项目需要的库都已下载】 # 数据爬取: ``` 1、修改51job_info.py代码66行,根据需要修改页数,默认2页,数据分析需要海量数据时可修改成1000页 2、运行51job_info.py 3、输入职位关键词 如:大数据、C语言、软件开发 4、爬取到的数据将储存在51job.xls ``` 程序中注释内容包含大量调试信息,遇到异常时可以打开注释,查看运行情况 爬取过程中因为单页内容较多,请耐心等候 如果程序未能爬取到信息,可能的原因是缺少包,或者该网页源码被修改,需要重新定义正则 # 数据清洗与数据可视化 ``` 1、运行51job_clean.py 2、代码默认对职位的清洗条件的非大数据相关的职位,需要根据你们搜索的职位自行修改 3、清洗后的数据将储存在51job2.xls,(若清洗后的数据中还有错误数据,可修改清洗条件或手动将错误数据删除) 4、运行51job_view.py 4、pyecharts动态图将生成 .html 文件,用浏览器打开即可 ```
资源推荐
资源详情
资源评论
收起资源包目录
爬取前程无忧网中大数据相关岗位数据并可视化分析.rar (10个子文件)
51job_info.py 5KB
51job_clean.py 3KB
51job_view.py 5KB
学历要求动态饼图.html 5KB
chromedriver.exe 14.46MB
51job.xls 903KB
51job2.xls 251KB
大数据城市需求分布图.html 26KB
工作经验要求漏斗图.html 4KB
README.md 1KB
共 10 条
- 1
资源评论
艾派森
- 粉丝: 17w+
- 资源: 31
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功