# Python_Spark_Analysis_DoubanMovie_Crawler
基于豆瓣电影爬虫及Spark数据分析可视化设计
开发环境:PyCharm + Python3.7 + Spark + Idea + Mysql + Echart
可视化网站入口:http://localhost:8080/login.html
账号密码: admin/1
由于我国经济的不断增长,人们的物质生活也在不断提升,因此越来越多的人观影需求增加以丰富精神生活,为分析当下用户的观影偏好以及方便人们从众多的影片中作出合适的选择,本文基于Spark分析平台及python爬虫技术等设计了一个豆瓣电影数据分析可视化系统,以完成对豆瓣电影网页的数据进行爬取,进而以折线图图、直方图等多种数据可视化的形式直观的展示给用户,从而分析用户观影偏好以及为用户选择影片时提供一定的参考。
该豆瓣电影数据分析分析可视化系统主要可以实现至少对一万条电影数据的爬取和分析,可以从中分析出热门电影类型数据占比、历年电影上线走势、电影高频词统计分析、电影评分等级分析、影评时间统计分析、上线电影数量较高年份五大模块。
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
开发环境:PyCharm + Python3.7 + Spark + Idea + Mysql + Echart 可视化网站入口:http://localhost:8080/login.html 资源中包含源码和数据库脚本 基于Spark分析平台及python爬虫技术等设计了一个豆瓣电影数据分析可视化系统,以完成对豆瓣电影网页的数据进行爬取,进而以折线图图、直方图等多种数据可视化的形式直观的展示给用户,从而分析用户观影偏好以及为用户选择影片时提供一定的参考。 该豆瓣电影数据分析分析可视化系统主要可以实现至少对一万条电影数据的爬取和分析,可以从中分析出热门电影类型数据占比、历年电影上线走势、电影高频词统计分析、电影评分等级分析、影评时间统计分析、上线电影数量较高年份五大模块。 =======说明======= 资源来源于网络分析,仅供参考。如有侵权请告知
资源推荐
资源详情
资源评论
收起资源包目录
基于python+Spark的豆瓣电影爬虫及数据分析可视化设计 (235个子文件)
_SUCCESS 0B
_SUCCESS 0B
WordNum.class 9KB
TypeNum.class 8KB
LvNum.class 8KB
CommontNum.class 7KB
YearNum.class 7KB
WordUtil.class 757B
.part-r-00000.crc 7KB
.part-r-00000.crc 3KB
._SUCCESS.crc 8B
._SUCCESS.crc 8B
layui.css 78KB
layer.css 14KB
laydate.css 7KB
code.css 1KB
login.css 1KB
reg.css 1KB
home.css 114B
movie.csv 864KB
movie.csv 78KB
iconfont.eot 46KB
loading-0.gif 6KB
loading-2.gif 2KB
loading-1.gif 701B
.gitignore 184B
.gitignore 184B
index.html 2KB
register.html 2KB
login.html 889B
home.html 306B
spark_movie_web.iml 16KB
spark_movie.iml 559B
jieba-analysis-1.0.2.jar 2.09MB
mysql-connector-java-5.1.35.jar 946KB
commons-lang3-3.3.1.jar 403KB
AccountValidatorUtil.java 3KB
UserController.java 3KB
MapReduceETL.java 3KB
CommontNum.java 2KB
MovieController.java 2KB
RouteConfig.java 1KB
LoginFilter.java 753B
UserInfo.java 461B
MovieApp.java 453B
Conf.java 389B
IndexController.java 339B
CommentNum.java 330B
Words.java 322B
LvNum.java 322B
Type.java 320B
CommentNumMapper.java 230B
WordsMapper.java 215B
LvNumMapper.java 214B
YearNum.java 212B
YearNumMapper.java 189B
UserMapper.java 188B
TypeMapper.java 180B
bgm.jpg 456KB
echarts.min.js 727KB
layui.js 284KB
jquery.js 82KB
README.md 1KB
part-r-00000 864KB
part-r-00000 350KB
icon.png 11KB
icon-ext.png 6KB
getm.py 5KB
spark_movie.sql 1.47MB
iconfont.svg 299KB
iconfont.ttf 45KB
requirements.txt 347B
iconfont.woff 30KB
iconfont.woff2 25KB
uiDesigner.xml 9KB
uiDesigner.xml 9KB
pom.xml 4KB
jarRepositories.xml 1KB
compiler.xml 1KB
Maven__com_google_guava_listenablefuture_9999_0_empty_to_avoid_conflict_with_guava.xml 871B
Maven__org_springframework_boot_spring_boot_starter_thymeleaf_2_1_0_RELEASE.xml 798B
Maven__org_springframework_boot_spring_boot_starter_logging_2_1_0_RELEASE.xml 784B
Maven__org_springframework_boot_spring_boot_starter_tomcat_2_1_0_RELEASE.xml 777B
Maven__com_fasterxml_jackson_module_jackson_module_jaxb_annotations_2_9_7.xml 772B
Maven__org_springframework_boot_spring_boot_autoconfigure_2_1_0_RELEASE.xml 770B
Maven__com_fasterxml_jackson_module_jackson_module_parameter_names_2_9_7.xml 765B
Maven__org_springframework_boot_spring_boot_starter_jdbc_2_1_0_RELEASE.xml 763B
Maven__org_springframework_boot_spring_boot_starter_json_2_1_0_RELEASE.xml 763B
Maven__org_thymeleaf_extras_thymeleaf_extras_java8time_3_0_1_RELEASE.xml 761B
Maven__org_springframework_boot_spring_boot_starter_web_2_1_0_RELEASE.xml 756B
Maven__org_apache_hadoop_hadoop_mapreduce_client_jobclient_3_2_2.xml 742B
Maven__com_fasterxml_jackson_jaxrs_jackson_jaxrs_json_provider_2_9_7.xml 740B
Maven__org_springframework_boot_spring_boot_starter_2_1_0_RELEASE.xml 728B
Maven__com_fasterxml_jackson_datatype_jackson_datatype_jsr310_2_9_7.xml 724B
Maven__org_apache_hadoop_hadoop_mapreduce_client_common_3_2_2.xml 721B
Maven__org_hibernate_validator_hibernate_validator_6_0_13_Final.xml 717B
Maven__com_fasterxml_jackson_datatype_jackson_datatype_jdk8_2_9_7.xml 710B
Maven__org_apache_hadoop_hadoop_mapreduce_client_core_3_2_2.xml 707B
Maven__org_apache_tomcat_embed_tomcat_embed_websocket_8_5_45.xml 696B
Maven__org_springframework_spring_expression_5_1_2_RELEASE.xml 694B
共 235 条
- 1
- 2
- 3
资源评论
- m0_675720632024-11-03资源值得借鉴的内容很多,那就浅学一下吧,值得下载!
abments
- 粉丝: 2213
- 资源: 3503
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 深圳建筑工程公司分包工程管理制度.docx
- 深圳建筑工程公司管理人员行为准则.docx
- 深圳建筑工程公司管理手册(100页).docx
- 深圳建筑工程公司计算机和网络管理制度.docx
- 深圳建筑工程公司经营预算管理制度.docx
- 深圳建筑工程公司生产管理制度.docx
- 深圳建筑公司会议管理制度.docx
- 深圳建筑公司保密管理制度.docx
- 深圳建筑公司信息管理制度.docx
- 深圳建筑工程公司项目考核管理制度.docx
- 深圳建筑工程经营计划管理制度.docx
- 基于Python OpenCV实现的答题卡识别判卷源代码+报告+答辩PPT
- 2206.11253v2.pdf
- 汇编语言基础:搭建与配置DOSBox环境及汇编、链接、调试的基本步骤
- MUC汇编语言中的简单算术运算程序设计与调试
- 汇编语言实验:探索字符输入输出与数据转换技术
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功