# UserCF_Spark
<p>基于Spark实现User的协同过滤CF</p>
<p> 原始数据u.data格式为(user_id,item_id,rating,timestamp),这所有的数据来源是通过943个用户对1682个items进行打分。</p>
<p> u.data数据被加载到hive表里面,所以spark操作的数据源为hive</p>
<p> 计算用户相似度时,使用了向量的余弦定理cosine。</p>
<p>详细讲解:https://blog.csdn.net/weixin_39400271/article/details/100058486</p>
没有合适的资源?快使用搜索试试~ 我知道了~
基于Spark实现User的协同过滤CF.zip
共11个文件
xml:7个
iml:1个
md:1个
需积分: 5 0 下载量 69 浏览量
2024-05-19
21:56:21
上传
评论
收藏 21KB ZIP 举报
温馨提示
协同过滤算法(Collaborative Filtering)是一种经典的推荐算法,其基本原理是“协同大家的反馈、评价和意见,一起对海量的信息进行过滤,从中筛选出用户可能感兴趣的信息”。它主要依赖于用户和物品之间的行为关系进行推荐。 协同过滤算法主要分为两类: 基于物品的协同过滤算法:给用户推荐与他之前喜欢的物品相似的物品。 基于用户的协同过滤算法:给用户推荐与他兴趣相似的用户喜欢的物品。 协同过滤算法的优点包括: 无需事先对商品或用户进行分类或标注,适用于各种类型的数据。 算法简单易懂,容易实现和部署。 推荐结果准确性较高,能够为用户提供个性化的推荐服务。 然而,协同过滤算法也存在一些缺点: 对数据量和数据质量要求较高,需要大量的历史数据和较高的数据质量。 容易受到“冷启动”问题的影响,即对新用户或新商品的推荐效果较差。 存在“同质化”问题,即推荐结果容易出现重复或相似的情况。 协同过滤算法在多个场景中有广泛的应用,如电商推荐系统、社交网络推荐和视频推荐系统等。在这些场景中,协同过滤算法可以根据用户的历史行为数据,推荐与用户兴趣相似的商品、用户或内容,从而提高用户的购买转化率、活跃度和社交体验。 未来,协同过滤算法的发展方向可能是结合其他推荐算法形成混合推荐系统,以充分发挥各算法的优势。
资源推荐
资源详情
资源评论
收起资源包目录
基于Spark实现User的协同过滤CF.zip (11个子文件)
content
pom.xml 13KB
src
main
scala
com
cjs
UserCF.scala 6KB
LICENSE 34KB
.idea
hydra.xml 365B
workspace.xml 15KB
misc.xml 513B
scala_compiler.xml 183B
compiler.xml 528B
encodings.xml 172B
user_cf.iml 80B
README.md 510B
共 11 条
- 1
资源评论
生瓜蛋子
- 粉丝: 3824
- 资源: 5235
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功