# 51job数据爬取与分析
#### 介绍
从51job上爬取了10万条(耗时50秒左右)职位数据,抽取“数据分析”岗,进行数据清洗,然后做了分析
#### 使用说明
1. get_data.py :获取数据的爬虫程序,将爬取的数据存储在本地mysql数据库中。
2. 数据清洗.ipynb :从数据库中读取数据并清洗,将结果输出到Excel表格
- 获取工作名中包含“数据”的工作信息
- 从‘6-8千/月’等工资格式中提取出有效薪资salary如:7000。
- 根据salary做一次分箱,方便之后进行分析
- 提取工作的城市信息
- 提取工作要求中的“学历要求”
- 参照provinces.py中提供的省份字典,获取工作对应的省份
- 根据工作福利条数生成福利得分treatment_score
3. job1.pbix :使用powerBI 对数据进行大致分析
- 月薪的描述性统计信息
- 月薪范围计数对比
- 不同学历的月薪均值
- 热门城市热力图、地图
- 福利词云图
#### 参与贡献
1. Fork 本仓库
2. 新建 Feat_xxx 分支
3. 提交代码
4. 新建 Pull Request
#### 扩展
1. 可以分析其他职位的数据
2. 实习岗和全职岗可分开
## 预览
### 数据预览
清洗前:
![1](/imgs/1.png)
清洗后:
![1](/imgs/2.png)
### 数据分析结果
![1](/imgs/3.png)![1](/imgs/4.png)
![1](/imgs/5.png)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
介绍 从51job上爬取了10万条(耗时50秒左右)职位数据,抽取“数据分析”岗,进行数据清洗,然后做了分析 使用说明 get_data.py :获取数据的爬虫程序,将爬取的数据存储在本地mysql数据库中。 数据清洗.ipynb :从数据库中读取数据并清洗,将结果输出到Excel表格 获取工作名中包含“数据”的工作信息 从‘6-8千/月’等工资格式中提取出有效薪资salary如:7000。 根据salary做一次分箱,方便之后进行分析 提取工作的城市信息 提取工作要求中的“学历要求” 参照provinces.py中提供的省份字典,获取工作对应的省份 根据工作福利条数生成福利得分treatment_score job1.pbix :使用powerBI 对数据进行大致分析 月薪的描述性统计信息 月薪范围计数对比 不同学历的月薪均值 热门城市热力图、地图 福利词云图
资源推荐
资源详情
资源评论
收起资源包目录
job51_analysis-master.zip (12个子文件)
job51_analysis-master
.gitignore 1KB
51job数据爬取与分析
get_data.py 5KB
provinces.py 89KB
job1.pbix 1.63MB
数据清洗.ipynb 69KB
job_data.xlsx 661KB
imgs
3.png 124KB
1.png 249KB
5.png 420KB
4.png 205KB
2.png 165KB
README.md 1KB
共 12 条
- 1
资源评论
- zhizhi2050302024-03-02实在是宝藏资源、宝藏分享者!感谢大佬~
yanglamei1962
- 粉丝: 2515
- 资源: 838
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功