# bigdata-movie-recommend
# 电影推荐分析系统
本次项目基于Python爬虫与Movielens数据集作为数据来源,获取CSV格式的数据,使用Hadoop HDFS作为数据的分布式存储平台,使用MongoDB作为数据结构化、规范化的处理并对运算结果进行存储,使用Spark暴露对外SQL接口,使用Spark进行数据处理运算,执行核心算法,使用SCALA语言编程,调用Spark MLlib等代码库进行机器学习算法执行,得到推荐结果。使用VUE前端框架与Flask后端框架进行结果可视化平台搭建。
## 过程简述
### 基于MovenLens 数据集
- 收集MovieLens数据集,包含16万个电影,2400万条评分,67万条评价标签,将csv文件上传到完全分布式HDFS文件系统
- scala、spark读取HDFS文件,整理导入MongoDB数据库
- MongoDB中加载数据,利用sparkRdd统计热门电影、高分电影,统计分年月、分类别的热门、高分电影数据
- 基于ALS协同过滤算法,得到用户电影推荐和相似电影推荐
- 通过 TF-IDF 算法对标签的权重进行调,计算电影的内容特征向量,实现基于内容的电影推荐
- 使用python、pymongo和matplotlib,读取MongoDB数据并进行可视化
- 使用python实现SVD奇异值分解进行电影推荐
- Python flask构建后端数据服务,vue构建前端页面,交互式展示数据。
### 基于豆瓣数据集
- 破解滑动验证块,爬虫爬取豆瓣电影短评数据
- 利用Jieba分词库对电影短评分词,利用snowNLP对文本情感分析
- 利用wordcloud制作词云
## 部分结果展示
- 日历图和热力图的绘制,体现电影在一年中的热度情况。以下选取了某部较为热门的电影,在1996年上映时候的每天的热度情况。
![rili](https://frozenwhale.oss-cn-beijing.aliyuncs.com/img/rili.png)
- 用户电影推荐
![yonghu](https://frozenwhale.oss-cn-beijing.aliyuncs.com/img/yonghu.png)
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
bigdata-movie-recommend-master.zip (21个子文件)
bigdata-movie-recommend-master
pom.xml 3KB
src
main
java
constant
MongoConstant.scala 617B
Config.scala 157B
als
AlsRecommender.scala 4KB
AlsTrainModel.scala 2KB
Test.scala 346B
model
MovieRecommendation.scala 96B
UserRecommendation.scala 95B
Movie.scala 167B
Tag.scala 116B
Recommendation.scala 71B
MongoConfig.scala 63B
GenresRecommendation.scala 119B
Rating.scala 127B
dataload
LoadData.scala 4KB
META-INF
MANIFEST.MF 8KB
statistics
Test.scala 397B
StatisticsRecommender.scala 5KB
content
ContentRecommend.scala 3KB
README.md 2KB
movie_recommend.iml 80B
共 21 条
- 1
资源评论
机器学习的喵
- 粉丝: 486
- 资源: 1252
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- STM8L101F3P6单片机+CC1100模块433M遥控器设计硬件(原理图+PCB)工程文件.zip
- 上传下载铁人下载系统 Liuxing 1.0-liuxing1.0.rar
- 南京邮电大学数学实验实力雄厚,凭借其优秀的师资力量、丰富的实践教学资源和卓越的科研成果,成为国内一流的数学实验教学和科研基地
- 【火爆朋友圈的今天吃什么源码 v1.0】随机的为用户带来每一天的用餐选择和推荐.rar
- MPU6050中文版数据手册
- 上传下载手机电影下载-mobiledy.rar
- 响应式旅游网站源码下载 马尔代夫旅游网站.rar
- CMS小涴熊漫画连载系统漫画网站源码 带采集API.rar
- 福袋点点.apk
- 基于STM32的电子秤采用0.96寸OLED显示UI界面源码.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功