没有合适的资源?快使用搜索试试~ 我知道了~
融合项目属性偏好的矩阵分解推荐模型.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 176 浏览量
2022-11-28
20:26:14
上传
评论
收藏 343KB DOCX 举报
温馨提示
试读
20页
融合项目属性偏好的矩阵分解推荐模型.docx
资源推荐
资源详情
资源评论
伴随着传统 PC 互联网以及移动互联网的高速发展,电子商务已经渗透到
生产生活的各个方面,为人们的生产生活带来了极大便利。然而,电子商务在给
人们带来机遇的同时,也面临着很大的挑战。特别是随着电子商务的高速发展,
无论是商家还是用户,都面临着信息过载的困扰。用户希望能够在尽可能短的
时间内在海量的商品信息中获取自己喜欢的或者感兴趣的商品,而商家则希望
使用最高效的方式帮助用户找到自己喜欢的商品。
为了解决这类问题,个性化推荐系统应运而生。所谓个性化推荐系统,旨在
根据用户的历史消费喜好预测用户对未知产品或服务的偏好,进而为用户推荐
合适的产品或服务,提高用户的满意度
[1-2]
。
目前,在个性化推荐领域,使用最为广泛的推荐算法是基于协同过滤的推荐
算法。而协同过滤算法是基于集体智慧的思想,无论是基于记忆的协同过滤,还
是基于模型的协同过滤,其主要思想都是通过用户对于商品的历史购买记录来
帮助用户寻找自己可能喜欢的商品。目前基于协调过滤的推荐算法已经被广泛
应用于个性化电子商务推荐、新闻推荐、音乐推荐等诸多领域
[3⇓ -5]
。
基于协同过滤的推荐算法被证明在实践中有着很好的效果,可以分为基于
内存的协同过滤
[6]
以及基于模型的协同过滤
[7]
两类算法,目前被广大学者持续研
究。BOBADILLA 等
[8]
提出了一种新的协同过滤度量方式,将 MSD 和 Jaccard
度量结合起来,可获得更好的精度。LIU 等
[9]
提出了一种新的用户相似性模型,该
模型不仅考虑了用户评级的局部上下文信息,而且考虑了用户行为的全局偏好。
此外,改进的相似性度量模型不仅考虑了两个用户之间的公共评级比例,同时也
考虑到不同的用户有不同的评级偏好。实践证明,该模型具有很好的预测精度。
LI 等
[10]
提出新的跨域协同过滤推荐模型,将 CF 域视为一个二维站点时间坐标系,
在这个坐标系上,多个相关域共享多个相关 CF 域的公共评级知识,以提高 CF 的
性能。
然而,面对数据稀疏、冷启动等一系列问题,基于记忆的协同过滤算法无法
准确地计算出物品与物品、用户与用户之间的相似度,进而无法为用户推荐准
确的商品。特别是对于大多数新用户来说,因其较少的历史购买记录,甚至根本
没有相关购买记录或评分记录,所以无法为其寻找其最近邻用户,从而影响推荐
的准确性。针对此类问题,国内外学者进行了深入的研究:传统的基于内存的协
同过滤技术在面临数据稀疏、冷启动问题时遭遇推荐瓶颈,其最主要原因在于
传统的基于记忆的协同过滤技术只是过度关注用户或项目的近邻,而忽视了用
户或项目本身,同时也忽略了两种实体之间的关联。所以基于此,国内外学者在
协同过滤推荐算法的基础上提出了一种新的基于模型的协同过滤——矩阵分
解算法(Matrix Factorization,MF)。矩阵分解算法的核心思想是用户的特征矩阵
与项目的特征矩阵都可以表示为低维的特征向量,而用户的评分则可以用此二
者之特征向量的内积表示。尽管大量的矩阵分解算法能够将用户与项目的信息
进行充分挖掘,从而提高推荐效果
[11]
,但对于评分较少的冷用户信息,依旧无法有
效挖掘。此时,越来越多的辅助信息被加入到矩阵分解框架之中,比如人口统计
学信息、社会化网络信息、项目描述信息等,在一定程度上提高了推荐精准度,
同时对于冷启动用户的推荐效果也有所提升。比如 MANZATO
[12]
提出了一种基
于用户偏好与电影类型/类别的分解矩阵的推荐算法。使用这种用户类型矩阵
分解模型的优点是需要较少的计算资 源,矩阵的稀疏性更小 ,维数更低 ,推荐准
确性更高。为了解决用户项目评价模型的极大稀疏性,QIN 等
[13]
提出了一种基
于加权项目类别的协同过滤推荐算法,该算法将用户物品的高维评价数据转化
为用户类别的低维统计数据,并作为用户特征模型。在模型的基础上,加入遗忘
功能和用户属性信息,对用户模型进行两次优化。实验结果表明,该模型能够较
好地应对用户物品评级问题的稀疏性,同时较好地解决冷启动问题。
上述算法以矩阵分解为基础,同时融合更多其他辅助信息,对于应对冷启动
问题有显著的效果。尽管目前深度学习算法已被大量应用于个性化推荐领域,
并且也取得了一些成绩。然而,目前的研究主要聚焦于探索应用于个性化推荐
而提出新的深度学习架构上,比如注意力机制、卷积神经网络、生成对抗网络、
图神经网络等
[14⇓ ⇓ -17]
。尽管取得了一定的效果,但这些依赖于复杂网络结构的工
作有大量的参数,需要耗费更多的计算资源,同时在可扩展性以及可解释性等方
面也存在一定的问题。所以,笔者采取以矩阵分解为基础的推荐模型,同时考虑
用户、商品属性信息,考虑用户对物品属性的偏好信息等,最终对于冷启动用户
进行项目评分的预测,取得了较好的结果。
笔者的贡献主要包括:
(1) 在进行用户相似度计算时,融合了用户本身信息,包括年龄、性别、职
业等,以及用户对于项目偏好的信息,即用户对于项目属性偏好的差异。进行相
似度计算后,进行了比较粗略的评分预测,并将这一结果融入到新的矩阵分解之
中。
(2) 根据用户相似度,计算出冷启动用户对项目的初始预测值,同时在进行
矩阵分解时,融合用户的属性信息、用户对项目属性的偏好信息、项目属性信
息等,作为辅助信息对矩阵分解的隐类分解起到增强作用,更能提高最终冷启动
用户的推荐效果。
(3) 在数据集 movielens 及 douban 上进行了大量实验。实验表明,笔者给
出的模型与现有矩阵分解模型相比,有更好的推荐准确性以及可扩展性。
1 相关工作
在基于用户的协同过滤推荐中,评分信息是一个 m×n 阶矩阵,m 行代表 m
个用户,n 列代表 n 个项目。第 i 行第 j 列的元素值代表用户 i 对项目 j 的评分。
评分值一般是 1~5 之间的整数。评分越大,表示用户越喜欢该项目。用户项目
评分数据矩 R 的各元素阵如表 1 所示。
表 1 用户项目评分矩阵
用户
项目 1
…
项目 j
…
项目 n
用户 1
R
1,1
…
R
1,j
…
R
1,n
︙
︙
︙
︙
用户 i
R
i,1
…
R
i,j
…
R
i,n
︙
︙
︙
︙
用户 m
R
m,1
…
R
m,j
…
R
m,n
新窗口打开| 下载 CSV
1.1 基于用户的 K 最近邻算法
K 最近邻(K-NearestNeighbor,KNN)分类算法是最著名的数据挖掘算法之
一
[18-19]
,早期被应用于文本分类研究中,取得了非常好的分类效果。随着个性化
推荐技术的流行,K 最近邻作为非常重要的基于领域的协同过滤方法,也被广泛
应用。在个性化推荐领域,K 最近邻又被分为基于用户的 K 最近邻以及基于项
目的 K 最近邻。它们的核心都是计算相似度
[20]
。
剩余19页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3758
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功