# visualization
互联网行业分析,数据源于前程无忧招聘网站,数据分析基于spark平台,数据大屏基于echarts
### 数据源
各个城市的精度data/BaiduMap_cityCenter.txt来源于百度地图开放平台,crawler/cityInfo.py含爬取前程无忧各个城市的编号,爬取的岗位关键字在data/job.csv(静态数据,我是从别的招聘网获取的,前程无忧的分类比较广),爬取代码crawler/qcwy.py,结果为/data/data.csv
### 数据分析
数据分析是基于spark平台,数据储存在hdfs上,开发环境是Jupyter,由于我的分布式平台是在虚拟机搭建的,所以本项目的各个模块(爬虫、数据分析、数据大屏)是分离的,将/data/data.csv上传至hdfs,分析代码位于/visual.ipynb,分析结果保存为json文件,将分析结果文件保存至data/。由于html规则,json文件不能直接由JavaScript打开,懒是原罪,没有写后端通信,我在这些json文件的头部加入window变量,改为js文件,html直接导入。
### 数据大屏
里面的词云有点问题,如果我在词云的配置中设置maskImage,第一次打开网页无法显示词云,得需要刷新才能完整显示,懒是原罪,我把maskImage换了个位置,并没有解决这个问题
因为数据均保存为静态数据,因此可以忽略数据爬取和数据分析这一部分代码,直接打开visual/index.html
### [预览](https://zyoungbright.github.io/visualization/visual/index.html)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
互联网行业分析,数据源于前程无忧招聘网站,数据分析基于spark平台,数据大屏基于echarts 数据源 各个城市的精度data/BaiduMap_cityCenter.txt来源于百度地图开放平台,crawler/cityInfo.py含爬取前程无忧各个城市的编号,爬取的岗位关键字在data/job.csv(静态数据,我是从别的招聘网获取的,前程无忧的分类比较广),爬取代码crawler/qcwy.py,结果为/data/data.csv 数据分析 数据分析是基于spark平台,数据储存在hdfs上,开发环境是Jupyter,由于我的分布式平台是在虚拟机搭建的,所以本项目的各个模块(爬虫、数据分析、数据大屏)是分离的,将/data/data.csv上传至hdfs,分析代码位于/visual.ipynb,分析结果保存为json文件,将分析结果文件保存至data/。由于html规则,json文件不能直接由JavaScript打开,懒是原罪,没有写后端通信,我在这些json文件的头部加入window变量,改为js文件,html直接导入。
资源推荐
资源详情
资源评论
收起资源包目录
基于spark+echarts实现的互联网行业数据大屏分析源码+项目说明.zip (48个子文件)
code
data
data.csv.bask 13.13MB
cityCode.txt 27KB
daySalary.js 3KB
BaiduMap_cityCenter.txt 16KB
ExperienceDegreeSalary.js 2KB
allData.js 33.28MB
symbol.js 30KB
job.csv 2KB
cityInfo.js 13KB
cityJobNum.js 7KB
data.csv 18.95MB
cityCompanytype.js 42KB
description.js 46KB
validCity.js 2KB
cityInfo.csv 12KB
citySalary.js 10KB
keywordNum.js 5KB
analy
visual.ipynb 14KB
crawler
cityInfo.py 2KB
qcwy.py 3KB
visual
font
DS-DIGIT.TTF 25KB
js
echarts-wordcloud.js 50KB
spot.js 10KB
flexible.js 1KB
echarts-wordcloud.min.js.map 72KB
echarts-wordcloud.js.map 56KB
echarts.js 3.46MB
china.js 137KB
echarts.min.js 965KB
echarts-wordcloud.min.js 16KB
echarts.min.js.bak 727KB
index.js 25KB
time.js 690B
jquery.js 108KB
jquery.liMarquee.js 37KB
css
index.less 6KB
liMarquee.css 1KB
index.css 6KB
index.html 31KB
images
weather.png 2KB
jt.png 72KB
lbx.png 81KB
line.png 4KB
bg.jpg 252KB
wordCloudMask.png 23KB
head_bg.png 8KB
map.png 302KB
README.md 1KB
共 48 条
- 1
资源评论
被代码搞废的挖掘机
- 粉丝: 6011
- 资源: 7260
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功