# 51job数据爬取与分析
#### 介绍
从51job上爬取了10万条(耗时50秒左右)职位数据,抽取“数据分析”岗,进行数据清洗,然后做了分析
#### 使用说明
1. get_data.py :获取数据的爬虫程序,将爬取的数据存储在本地mysql数据库中。
2. 数据清洗.ipynb :从数据库中读取数据并清洗,将结果输出到Excel表格
- 获取工作名中包含“数据”的工作信息
- 从‘6-8千/月’等工资格式中提取出有效薪资salary如:7000。
- 根据salary做一次分箱,方便之后进行分析
- 提取工作的城市信息
- 提取工作要求中的“学历要求”
- 参照provinces.py中提供的省份字典,获取工作对应的省份
- 根据工作福利条数生成福利得分treatment_score
3. job1.pbix :使用powerBI 对数据进行大致分析
- 月薪的描述性统计信息
- 月薪范围计数对比
- 不同学历的月薪均值
- 热门城市热力图、地图
- 福利词云图
#### 参与贡献
1. Fork 本仓库
2. 新建 Feat_xxx 分支
3. 提交代码
4. 新建 Pull Request
#### 扩展
1. 可以分析其他职位的数据
2. 实习岗和全职岗可分开
## 预览
### 数据预览
清洗前:
![1](/imgs/1.png)
清洗后:
![1](/imgs/2.png)
### 数据分析结果
![1](/imgs/3.png)![1](/imgs/4.png)
![1](/imgs/5.png)
yanglamei1962
- 粉丝: 2613
- 资源: 909
最新资源
- 海尔:企业品牌归根到底是文化.docx
- 马蔚华:幸福企业是基业长青的企业文化.docx
- 没有“三个共同”,就没有企业文化.docx
- 马云:倒立是阿里巴巴的文化精髓.docx
- 内圣外王,用文化缔造未来.docx
- 企业家,请抱着感恩的心态做企业.docx
- 牛根生:用培训克隆企业文化.docx
- 企业家 企业文化.docx
- 企业家是企业文化的倡导者.docx
- 企业家的魅力打造.docx
- 企业家企业文化的辩证关系 所有员工的文化特征.docx
- 王均豪:百年企业的传承应靠文化.docx
- 什么是真正的企业家精神.docx
- 王石淡出万科决策层 选择理想是企业文化进步.docx
- 张瑞敏眼中的企业文化.docx
- 魏杰论企业文化的四大类型.docx
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈