# MovieLens-RecSys
基于Movielens-1M数据集实现的User Based Collaborative Filtering和Item Based Collaborative Filtering推荐算法
# 简介
项亮所著的《[推荐系统实践](https://book.douban.com/subject/10769749/)》一书是非常优秀的推荐系统入门书籍,但书中只描述了单步的计算如何实现,缺乏一个完整的示例来展示推荐系统从建立数据集到评估模型的整个过程,初学者学起来容易迷茫,因此我基于Movielens 1M数据集分别实现了User Based Collaborative Filtering(以下简称UserCF)和Item Based Collaborative Filtering(以下简称ItemCF)两个算法,包含“切分训练集与测试集-训练模型-推荐-评估”一整套流程,可以帮助初学者更快速地理解推荐系统中的协同过滤算法。
程序最终给出的是Precision、Recall、Coverage、Popularity四项衡量模型质量的指标,而具体的电影推荐结果并未保留,如果需要此部分数据可自行修改代码。
# 运行
1. 获取代码
根据自己使用的Python版本获取相应的分支
Python 3.x:
```shell
git clone https://github.com/Lockvictor/MovieLens-RecSys.git
```
Python 2.x:
```shell
git clone -b python2 https://github.com/Lockvictor/MovieLens-RecSys.git
```
如果不使用Git,也可在Github页面上手动选择分支然后下载。
2. 下载数据集
下载Movielens 1M数据集[ml-1m.zip](http://files.grouplens.org/datasets/movielens/ml-1m.zip),并解压到项目MovieLens-RecSys文件夹下
3. 运行代码
以UserCF为例,直接在终端运行以下命令即可:
```shell
# 部分Linux上会同时存在Python的2和3两个版本,3.x版对应的命令是python3
# Windows用户无论安装的是2或3,命令都是python
python usercf.py
#python3 usercf.py
```
Linux用户的话更推荐下面这个命令:
```shell
python usercf.py > run.log 2>&1 &
#python3 usercf.py > run.log 2>&1 &
```
该命令会让程序在后台运行,可以等待运行结束再查看日志,或者通过`tail -f run.log`即时查看日志。
# 注意事项
UserCF算法中,由于用户数量多,生成的相似性矩阵也大,会占用比较多的内存,不过一般电脑都没问题。
ItemCF算法中,每次推荐都需要找出一个用户的所有电影,再为每一部电影找出最相似的电影,运算量比UserCF大,因此推荐的过程比较慢。
没有合适的资源?快使用搜索试试~ 我知道了~
基于MovieLens-1M数据集实现的协同过滤算法demo+源代码+文档说明
共4个文件
py:2个
md:1个
gitignore:1个
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 12 浏览量
2024-04-16
16:55:01
上传
评论
收藏 6KB ZIP 举报
温馨提示
- 不懂运行,下载完可以私聊问,可远程教学 该资源内项目源码是个人的毕设,代码都测试ok,都是运行成功后才上传资源,答辩评审平均分达到96分,放心下载使用! <项目介绍> 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 --------
资源推荐
资源详情
资源评论
收起资源包目录
MovieLens-RecSys-master.zip (4个子文件)
MovieLens-RecSys-master
usercf.py 7KB
itemcf.py 6KB
.gitignore 774B
README.md 2KB
共 4 条
- 1
资源评论
机器学习的喵
- 粉丝: 491
- 资源: 1252
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功