# Douban-book-info-crawl-and-visualize
一个基于 neo4j 和 flask 的豆瓣图书数据采集分析及可视化平台。结合基于python bs4的豆瓣图书数据爬取,使用neo4j图数据库进行储存分析,并使用flask进行可视化展示,前端视图可视化使用了基于webgl的 [force-graph](https://github.com/vasturiano/3d-force-graph) 库
新增对csv支持
爬虫使用方法:
DbBot_scheduler.py [-h] [-b BID] [-run] [-m MODE] [-clr] [-p]
命令行参数含义: -run: 启动爬虫,-b:书籍在豆瓣上的ID,-m 爬虫运行模式,1代表从某本书开始爬取,2代表从边缘节点扩充, -clr 清空数据库, -p 使用代理服务器, -use_db 使用数据库
使用方法举例:
从ID为21979017的书开始进行广度优先爬取,并使用代理:
python Douban_robot\DbBot_scheduler.py -run -m 1 -b 21979017 -p
在数据库已经有多于一个节点的情况下,从边缘节点扩充数据库:
python Douban_robot\DbBot_scheduler.py -run -m 2
CSV模式,不使用数据库,将爬取数据存入CSV :(不推荐)
python Douban_robot\DbBot_scheduler.py -run -m 1 -b 21979017 -p -use_db 0
启动可视化服务器,使用neo4j作为后台数据库:
python Douban_book_visulization\book_vis_server.py
启动可视化服务器,不使用数据库,仅读取CSV文件:(不推荐)
python Douban_book_visulization\book_vis_server.py -csv
效果1(neo4j browser):
![image](https://github.com/lusixing/Douban-book-info-crawl-and-visualize/blob/master/images/graph1.png)
效果2(使用flask+force-graph进行前端查询和展示):
![image](https://github.com/lusixing/Douban-book-info-crawl-and-visualize/blob/master/images/graph2.jpg)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
【资源说明】 1、该资源内项目代码都是经过测试运行成功,功能正常的情况下才上传的,请放心下载使用。 2、适用人群:主要针对计算机相关专业(如计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网、数学、电子信息等)的同学或企业员工下载使用,具有较高的学习借鉴价值。 3、不仅适合小白学习实战练习,也可作为大作业、课程设计、毕设项目、初期项目立项演示等,欢迎下载,互相学习,共同进步! 一个基于 neo4j 和 flask+webgl 的豆瓣图书数据采集分析及可视化平台(python源码+项目说明)(基于python bs4的豆瓣图书数据爬取,使用neo4j图数据库进行储存分析,并使用flask + webgl 进行可视化展示).zip
资源推荐
资源详情
资源评论
收起资源包目录
一个基于 neo4j 和 flask+webgl 的豆瓣图书数据采集分析及可视化平台(python源码+项目说明)(基于python bs4的豆瓣图书数据爬取,使用neo4j图数据库进行储存分析,并使用flask + webgl 进行可视化展示).zip (19个子文件)
code_30312
Douban_book_visulization
templates
gData_display_test1.html 5KB
404.html 178B
index_with_2dfg_basic.html 2KB
settings.html 323B
gData_display_test0.html 5KB
book_vis_server.py 6KB
static
js
d3-force.min.js 8KB
app.js 50B
d3-quadtree.min.js 5KB
force-graph.js 254KB
images
1.txt 2B
graph1.png 887KB
graph2.jpg 79KB
README.md 2KB
Douban_robot
1.txt 4B
DbBot_scheduler.py 2KB
csv_dealer.py 5KB
douban_robot.py 8KB
gdb_broker.py 4KB
共 19 条
- 1
资源评论
- m0_577437232024-04-08只有源码没有说明
龙年行大运
- 粉丝: 1252
- 资源: 3826
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 使用NetBeans连接SQLserver2008数据库教程中文WORD版最新版本
- XPath实例中文WORD版最新版本
- XPath语法规则中文WORD版最新版本
- XPath入门教程中文WORD版最新版本
- ORACLE数据库管理系统体系结构中文WORD版最新版本
- Sybase数据库安装以及新建数据库中文WORD版最新版本
- tomcat6.0配置oracle数据库连接池中文WORD版最新版本
- hibernate连接oracle数据库中文WORD版最新版本
- MyEclipse连接MySQL的方法中文WORD版最新版本
- MyEclipse中配置Hibernate连接Oracle中文WORD版最新版本
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功