# welcome to use my project
# 欢迎使用我的项目
## *使用前* __必读__
```
项目作者:YELLOWZAN
IDE: Pycharm Professional、VScode、
Python version :3.9.13
Database:Mysql version-5.8
其它工具:phpmyadmin
```
食用方法:
git clone https://github.com/YELLOWZAN/Shixiseng_visual_with_flask.git
本项目所需依赖环境已在requirements.txt文件中。
**使用前请先创建虚拟环境!**
(具体创建方法自行百度,建议创建在项目根目录下)
然后在虚拟环境内安装requirements.txt的依赖,运行命令:
```shell
pip install -r requirements.txt
```
建议使用pycharm专业版运行项目
如若使用vscode等其它编辑器请先激活虚拟环境,然后再在虚拟环境下执行主程序文件
```shell
(venv)powershell:python ./app.py
```
执行之后打开本地环回地址127.0.0.1:5000即可访问页面,如果需要进行公网访问请将host设置为0.0.0.0,端口随意但切勿与其它服务撞车。
## 可视化流程大致如下:
1.寻找数据,收集数据并处理好数据。
2.对数据进行分析,以做出合理的图表。
3.先对数据生成图表页面,存放在**templates**文件夹
4.在app.py文件中对设定文件进行文件路由调用以及负载均衡(**如果需要**)
# 所需技术栈
__HTML、Python、JavaScript、Mysql、flask__
**本项目为河池学院大数据20班可视化课程项目设计,分为几大模块:**
## 1.数据爬取
数据爬取文件夹位于项目根目录下的.\pa_chong\
主程序文件为spider-demo.py,在运行前需要对所爬取的网页进行网页结构分析,对所需数据进行xpath定位或者re正则定位,提取我们所需要的数据。
然后,分析服务器是否存在反爬虫,比如字体反爬、ip封锁、验证码等,定制化相应的措施
对于实习僧这个网站来说,反爬措施为字体反爬与IP封锁,我们仅需对其get(access)、token(parmas)、等做处理即可,然后进行字体重编码,因为其网页前端的字体为自定义字体。
**爬虫文件我本人手写,反爬程序为定制化反爬,禁止用于非法用途!**
**爬虫文件我本人手写,反爬程序为定制化反爬,禁止用于非法用途!**
**爬虫文件我本人手写,反爬程序为定制化反爬,禁止用于非法用途!**
## 2.数据处理
数据处理比较常规,主要流程有清理空缺值,检查是否存在异常值等等,部分字段用到编码的手段,以方便后期的数据建模
处理完成的数据存放于./data_clear/clean_data/目录下
## 3.数据存储
这一部分为将数据放入数据库存储,由于时间关系我们尚未设计完成
## 4.静态页面生成
代码位于./page_create.ipynb ,其中OLD文件为旧的页面生成notebook文件。
使用pyecharts代码整合我们所爬取到的数据进行生成静态页面,注意,echarts与pyecharts是两种不同的玩意!
## 5.前后端交互
项目运行方法:
```shell
cd ./ #项目根目录
python app.py #启动flask并调用所需文件
```
需要注意的是,如果后期需要添加其它页面,请先在templates目录下生成所需的HTML页面文件,然后修改index.html以达到JS调用
修改方法如下:
```shell
cd ./templates # 进入html页面目录
```
然后使用编辑器修改index.html代码
所需修改位置为(xpath地址):/html/body/div/div[1]/ul
```html
<li>
<a href="#" onclick="showContent('出勤频率分布.html')"> # showContent函数内引号内容修改为所调用的文件
<i class="fas fa-cloud"></i> 出勤频率分布 # 将此处修改为所显示的链接名称
</a>
</li>
```
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 课程设计 基于Python+Flask+PyEcharts实习僧网站数据可视化源码+部署文档+全部数据资料 高分项目.zip课程设计 基于Python+Flask+PyEcharts实习僧网站数据可视化源码+部署文档+全部数据资料 高分项目.zip 【备注】 1、该项目是个人高分项目源码,已获导师指导认可通过,答辩评审分达到95分 2、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 3、本项目适合计算机相关专业(人工智能、通信工程、自动化、电子信息、物联网等)的在校学生、老师或者企业员工下载使用,也可作为毕业设计、课程设计、作业、项目初期立项演示等,当然也适合小白学习进阶。 4、如果基础还行,可以在此代码基础上进行修改,以实现其他功能,也可直接用于毕设、课设、作业等。 欢迎下载,沟通交流,互相学习,共同进步!
资源推荐
资源详情
资源评论
收起资源包目录
课程设计 基于Python+Flask+PyEcharts实习僧网站数据可视化源码+部署文档+全部数据资料 高分项目.zip (64个子文件)
Flask系统部署文档.md 3KB
Shixiseng_visual_with_flask-main
__init__.py 299B
page_create.ipynb 15KB
app.py 1KB
pa_chong
data
实习僧数据挖掘岗位.xls 243KB
实习僧大数据岗位.xls 255KB
实习僧数据分析岗位.xls 296KB
file.ttf 10KB
font.xml 161KB
spider_demo.py 6KB
LICENSE 1KB
数据清理.ipynb 43KB
page_create_OLD.py 736B
停用词大全.txt 10KB
区域划分
区域划分规则.txt 436B
省级划分
西藏.txt 51B
浙江.txt 270B
湖北.txt 332B
山西.txt 182B
四川.txt 294B
内蒙古.txt 278B
河北.txt 282B
河南.txt 319B
江西.txt 169B
福建.txt 193B
吉林.txt 262B
安徽.txt 185B
湖南.txt 273B
青海.txt 66B
新疆.txt 491B
江苏.txt 332B
云南.txt 334B
甘肃.txt 183B
山东.txt 390B
宁夏.txt 83B
海南.txt 73B
广东.txt 358B
辽宁.txt 269B
重庆.txt 38B
贵州.txt 240B
陕西.txt 110B
广西.txt 192B
黑龙江.txt 287B
地区划分
华东.txt 1KB
华中.txt 928B
港澳台.txt 564B
华南.txt 627B
华北.txt 762B
东北.txt 822B
西北.txt 941B
西南.txt 965B
templates
实习期分布.html 6KB
工资分布.html 8KB
职位福利待遇.html 255KB
出勤频率分布.html 5KB
wordcloud.html 8KB
index.html 3KB
所属行业分布图.html 16KB
requirements.txt 2KB
data_clear
file_clear_master.py 11B
clean_data
实习僧数据清洗1.csv 184KB
.gitignore 3KB
README.md 4KB
171265889347208773632.zip 416B
共 64 条
- 1
资源评论
不走小道
- 粉丝: 3210
- 资源: 5120
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功