## 项目说明
基于 `spark` 对 `movielens` 的数据分析和推荐模型,数据分析部分使用 `pyspark` , 推荐模型使用 `spark` 的 `mlib` 库中 `ALS` 模型。
## 结构说明
- `code`
- `analysis.py` 为数据分析代码,
- `JavaALSExample.java `为推荐模型的主要代码,
- 完整项目为 `als-project`
- `als.jar` 是推荐模型的打包文件。
- `data`:`movielens` 的数据集,里面 README 有详细的数据说明
- `output`:推荐模型的输出结果
## 环境配置
```
虚拟机 : VMware Workstation Pro 14
Ubuntu 镜像 : ubuntu-18.04-live-server-amd64.ios
jdk : 1.8.0_161
节点 : master slave1 slave2
hadoop: 2.8.4
spark: 2.3.1
python: 3.6
```
## 运行项目
将打包好的 `als.jar` 传到虚拟机中
启动 `hadoop`
启动 `spark`
将数据集上传到 `HDFS` 中,同时确保输出文件的目录不存在,否则会报错
运行 `spark-submit` 命令,提交 `jar` 包
## 数据来源
http://grouplens.org/datasets/movielens/1m/
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
spark-movielens-master.zip (41个子文件)
spark-movielens-master
report.pdf 772KB
data
README 5KB
users.dat 131KB
ratings.dat 23.45MB
movies.dat 167KB
output
user.txt 688KB
movie.txt 688KB
Assets
media
image2.png 7KB
image8.png 23KB
image9.png 23KB
image1.png 13KB
image3.png 9KB
image7.png 71KB
image5.png 107KB
image4.png 50KB
image6.png 66KB
.gitignore 7B
README.md 1KB
code
analysis.py 3KB
als.jar 4KB
JavaALSExample.java 9KB
als-project
pom.xml 2KB
src
main
java
JavaALSExample.java 9KB
META-INF
MANIFEST.MF 50B
out
artifacts
als_jar
als.jar 4KB
als.iml 80B
.idea
hydra.xml 447B
uiDesigner.xml 9KB
artifacts
als_jar.xml 266B
workspace.xml 25KB
misc.xml 529B
scala_compiler.xml 179B
compiler.xml 524B
junitgenerator-prj-settings.xml 249B
target
classes
JavaALSExample$Movie.class 1KB
JavaALSExample$Rating.class 2KB
JavaALSExample.class 12KB
META-INF
MANIFEST.MF 50B
JavaALSExample$User.class 2KB
als-1.0-SNAPSHOT.jar 5KB
maven-archiver
pom.properties 100B
共 41 条
- 1
资源评论
机器学习的喵
- 粉丝: 509
- 资源: 1269
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 高德地图AMap-adcode-citycode
- 123111111111111
- PDF加密转APK大师1.0.0(解压密码1234)
- ProSP3.CD-ROM.iso
- 六一儿童节主题-少儿编程教学-scratch游戏demo设计
- main.m
- 基于Python.Numpy实现BP卷积神经网络识别手写数字源码(含超详细注释+使用说明).zip
- 个人 ACM 的 Wiki的静态网站.zip
- 基于Python.Numpy实现BP卷积神经网络识别手写数字源码(含超详细注释+使用说明).zip
- opencv4.8.0-opencv4.9.0-opencv-contrib4.8.0-opencv-contrib4.9.0
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功