# 👨💻 WorkAggregation
基于数据技术的互联网行业招聘信息聚合系统
本系统以Python为核心,依托web展示,所有功能在网页就可以完成操作,爬虫、分析、可视化、互动独立成模块,互通有无。具体依托python的丰富库实现,爬虫使用Requests爬取,使用lxml、beautifulsoup4解析。使用numpy、pandas分析数据,使用pyecharts做可视化,使用Flask进行web后台建设。数据通过csv、MySQL、配置文件来进行存储互通。
为了拓展功能编写了定时器,微信推送,为了适应团队合作编写了函数注册器,参数迭代器。爬虫数据来自前程无忧、齐鲁人才网、猎聘网、拉勾网等等网站,需要的基本数据一应俱全。
## 觉得不错欢迎给star⭐哦
## 部分网站爬虫可能已无法使用 注意使用时的爬虫选项
## ~~在线demo http://58.87.66.50/~~ 服务器到期
## ToDo
- 缺失爬虫补充
- 改善爬取时UI
## 截图
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123347.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123917.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123715.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123555.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220124101.png"/>
<img src="https://github.com/xming521/picture/blob/master/QQ截图20200220123731.png"/>
## 环境
- Windows \ Linux (未测试)
- Python 3.6 : **numpy , pandas , Requests , pyecharts , lxml , PyMySQL**
- MySQL 8.0.11
- Chrome(内核版本60以上)
## 安装
1. 运行 install_package.bat(出错管理员权限下尝试)
2. 修改mysql配置 位于/analysis/analysis_main.py
系统本身有一个可视化的配置文件,即您不需要再导入数据进行分析,如果想重新分析,需要导入数据库数据还需按照数据库字段修改input_data.py内容
3. 将js.7z 解压放在/static 目录下
4. 运行 server.py 来运行web服务器
5. 使用Chrome访问 http://127.0.0.1
### 数据库字段
<img src="https://github.com/xming521/picture/blob/master/db.png"/>
## 架构
系统大致结构如下图,spider目录存放爬虫代码,analysis目录承担了导入、分析、渲染图表、交互等功能,data目录存放原始数据,conf目录存放图表、mysql配置文件。导入处理分析入口统一由analysis_main控制,由server调用,其他功能直接由server调用,所有功能在主页就可以启动。
![](https://github.com/xming521/picture/blob/master/job2.png)
![](https://github.com/xming521/picture/blob/master/job1.jpg)
## 鸣谢
鸣谢 server酱、 pyechart 、腾讯云等的产品或技术支持
猰貐的新时代
- 粉丝: 1w+
- 资源: 3014
最新资源
- Comsol表面等离激元增强黑磷吸收
- VTD carsim simulink联合仿真工程
- 西门子恒压供水程序,有详细的注释和图纸,一拖多2-6泵自由组合,水箱无负压共18种模式自由选择,画面根据选择自动切画面,pld由plc调节不限变频器型号,smart sr20+am03最多提供3十1辅
- 基于java的贫困认定管理平台开题报告.docx
- 基于java的汽车服务商城系统开题报告.docx
- 基于java的汽车维修保养智能预约系统开题报告.docx
- matlab计算红外(序列)热像熵值、b值、粗糙度、分形维数或均值方差m文件程序(单个参数),亲测运行有效 专业性和针对性强
- 欧姆龙cp1h带两个nc413模块,总共十个轴控制程序案例,还有DD马达控制,内带详细注释,包含nc413所有参数设置,写入,定位控制,附带昆仑通泰触摸屏程序和dd马达程序,有兴趣的可以学习
- 基于java的私人定制旅游系统的开题报告.docx
- MATLAB遗传算法GA求解TSP旅行商问题,可选PMX交叉、OX交叉及其它多种交叉方式,在算法中引入2-opt变异算子、进化逆转算子提高算法局部搜索能力,利用国际通用的TSPLIB数据集中的eil5
- 基于java的体育用品交易网站的开题报告.docx
- 基于java的通讯录管理系统的开题报告.docx
- 信捷PLC程序插键槽机全套程序方案,用信捷plc触摸屏伺服驱动,绝对值伺服电机 实现对两轴伺服进行插键槽控制,对刀快捷,调试简单 PLC通讯绝对值伺服,回绝对值原点,绝对值伺服电池记忆零点,不用重
- CNN-LSTM的时间序列预测(Matlab) 1.所有程序经过验证,保证可以运行; 2.预测的是单变量时间序列数据; 3.所有文件放在一个文件夹运行,文件解释如下: CNN-LSTMTS.m为主程序
- 机器人离线编程仿真软件 LabVIEW 可提供源码供学习
- NXP S32K MPC5748 ,Renesas Rh850 ,Tricore Tc397 UDS Doip 以太网 刷写,CAN LIN UDS刷写 多个汽车开发诊断刷写量产工程 可定制开发 A
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈