### 1、项目介绍
本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏。效果如下:
![image-20230612133737420](./README.assets/image-20230612133737420.png)
![f280a159-35f3-4d8a-bcef-012dd20dd279](./README.assets/f280a159-35f3-4d8a-bcef-012dd20dd279.png)
![91c6e606-349a-498f-9e9a-6e5b0ea3f3b4](./README.assets/91c6e606-349a-498f-9e9a-6e5b0ea3f3b4.png)
每个模块都有详情页,可以通过点击首页各个模块的标签,进行访问。
基于数据可视化的游客行为分析系统,包含以下几类图表:
- 景点数量各区县分布地图
- 景点数量各区县分布图
- 景点评分分布图
- 景点浏览时间分布图
- 景点评论词云图
- 景点浏览人数占比分析
- 景点人数占比分析
- 景点评分数据排名
还有登录注册界面,可以自己注册账号。
### 2、python库安装
本项目使用的python环境是3.8,Django4.0。(建议3.8及以上,不然可能装不了Django4)
**这里以conda环境为例:**
```shell
# 创建虚拟环境
conda create --name py38 python=3.8.13
# 激活环境
conda activate py38
# 安装库
pip install -i https://pypi.douban.com/simple -r requirements.txt
```
### 3、MySQL部署
#### 3.1、创建库
```shell
# 创建数据库
create database hunan_web;
# 使用数据库
use hunan_web;
```
#### 3.2、设置数据库信息
在 [settings.py](hunan_web/settings.py)文件中修改数据库连接信息
```python
DATABASES = {
"default": {
"ENGINE": "django.db.backends.mysql",
'OPTIONS': {
'charset': 'utf8mb4',
},
"NAME": "hunan_web",
"USER": "用户名",
"PASSWORD": "密码",
"HOST": "127.0.0.1",
"POST": 3306
}
}
```
#### 3.3、创建表
sql文件存在了部分数据,可以直接使用。
```shell
# 切换数据库, hunan_web可以替换成你要使用的数据库名
use hunan_web;
# 导入数据,推荐使用绝对路径
source ./new_hunan_web.sql
```
### 4、爬虫运行
##### 进行增量爬取
```shell
# 启动scrapy爬虫
scrapy crawl qunaer
```
![image-20230612145034448](./README.assets/image-20230612145034448.png)
运行可能会有问题,使用以下方法解决
```shell
# ImportError: cannot import name 'SSLv3_METHOD' from 'OpenSSL.SSL'
pip3 install pyopenssl==22.0.0
# AttributeError: module 'lib' has no attribute 'OpenSSL_add_all_algorithms'
pip3 install cryptography==38.0.4
```
如果上面的方法也不能解决,就把scrapy库升级到最新版本。
```python
# 升级
pip install --upgrade scrapy
```
### 5、web运行
启动后根据提示访问链接即可。
```python
# 运行web,默认8000端口
python manage.py runserver
```
![image-20230612141826864](./README.assets/image-20230612141826864.png)
### 6、总结
完成上面的部署就可以运行本程序了。
如果你想采集其他城市的数据进行分析,可以修改 [qunaer.py](spider_qunaer/spiders/qunaer.py) 中的链接地址。
如果你想绘制其他的图形,可以修改 [all_map.py](mainapp/utils/all_map.py) 中的pyecharts代码,并适当修改 [views.py](mainapp/views.py) 。
### 其他
看到很多小伙伴star了,感谢你们喜欢这个项目。如果遇到问题可以提交issue给我一起改进这个项目吧。
也看到了很多小伙伴转载到其他平台了,希望可以注明出处让更多人看到,谢谢你们。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
### 1、项目介绍 本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏。效果如下: ![image-20230612133737420](./README.assets/image-20230612133737420.png) ![f280a159-35f3-4d8a-bcef-012dd20dd279](./README.assets/f280a159-35f3-4d8a-bcef-012dd20dd279.png) ![91c6e606-349a-498f-9e9a-6e5b0ea3f3b4](./README.assets/91c6e606-349a-498f-9e9a-6e5b0ea3f3b4.png) 每个模块都有详情页,可以通过点击首页各个模块的标签,进行访问。 基于数据可视化的游客行为分析系统,包含以下几类图表: - 景点数量各区县分布地图 - 景点数量各区县分布图 - 景点评分分布图 - 景点浏览时间分布图 - 景点评论词云图 - 景点浏览人数占比分析 - 景点人数占比分析 - 景点评分数据排名 还有登录注册界面,可
资源推荐
资源详情
资源评论
收起资源包目录
本项目Scrapy进行数据爬取,并使用Django框架+PyEcharts实现可视化大屏 (152个子文件)
scrapy.cfg 269B
theme.bundle.css 308KB
table.min.css 299KB
bootstrap.css 196KB
bootstrap.min.css 158KB
bootstrap.css 143KB
bootstrap.min.css 97KB
bootstrap-grid.css 66KB
bootstrap-grid.min.css 49KB
libs.bundle.css 39KB
style.css 10KB
index.css 9KB
bootstrap-reboot.css 5KB
bootstrap-reboot.min.css 4KB
datepicker.css 4KB
base.css 3KB
signin.css 1KB
default.db 8KB
.DS_Store 6KB
.DS_Store 6KB
.DS_Store 6KB
.gitattributes 188B
index.html 24KB
index.html 17KB
register.html 2KB
login.html 1KB
login.jpg 12KB
echarts.min.js 999KB
echarts-all.js 950KB
echarts.min.js 691KB
echarts.common.min.js 435KB
jquery.js 281KB
jquery.slim.js 229KB
bootstrap.bundle.js 225KB
base.js 175KB
table.min.js 136KB
bootstrap.js 134KB
jquery.min.js 87KB
jquery-2.2.1.min.js 84KB
bootstrap.bundle.min.js 81KB
jquery.slim.min.js 71KB
bootstrap.min.js 61KB
china.js 60KB
index.js 46KB
hunan.js 45KB
bootstrap.min.js 27KB
dataTool.js 23KB
bmap.js 16KB
common.js 653B
bootstrap.min.css.map 639KB
bootstrap.css.map 504KB
bootstrap.bundle.js.map 417KB
bootstrap.bundle.min.js.map 302KB
bootstrap.js.map 265KB
bootstrap.min.js.map 181KB
bootstrap-grid.css.map 160KB
jquery.min.map 135KB
bootstrap-grid.min.css.map 112KB
jquery.slim.min.map 108KB
bootstrap-reboot.css.map 76KB
bootstrap-reboot.min.css.map 32KB
README.md 3KB
f280a159-35f3-4d8a-bcef-012dd20dd279.png 623KB
img.png 382KB
91c6e606-349a-498f-9e9a-6e5b0ea3f3b4.png 340KB
fe414dfef62d4e51818a873cb422a390.png 315KB
image-20230612133737420.png 217KB
true.png 175KB
true.png 175KB
title.png 77KB
image-20230612145034448.png 75KB
image-20230612141822750.png 66KB
image-20230612141826864.png 66KB
logo.png 6KB
line1.png 5KB
line.png 5KB
mintitle.png 3KB
mintitle_1.png 2KB
t_2.png 539B
t_1.png 506B
t_3.png 472B
t_5.png 471B
t_4.png 427B
t_6.png 393B
t_7.png 290B
all_map.py 13KB
qunaer.py 5KB
views.py 4KB
middlewares.py 4KB
settings.py 3KB
settings.py 3KB
0001_initial.py 2KB
0001_initial.py 2KB
models.py 1KB
models.py 1KB
urls.py 1KB
items.py 1KB
manage.py 665B
pipelines.py 634B
auth.py 471B
共 152 条
- 1
- 2
资源评论
Tony小周
- 粉丝: 498
- 资源: 28
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功