没有合适的资源?快使用搜索试试~ 我知道了~
融合标签和内容信息的矩阵分解推荐方法.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 22 浏览量
2022-06-26
11:25:47
上传
评论
收藏 543KB DOCX 举报
温馨提示
![preview](https://dl-preview.csdnimg.cn/85783640/0001-9d6c75518837e567001e210a2b0a75d8_thumbnail-wide.jpeg)
![preview-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/scale.ab9e0183.png)
试读
19页
融合标签和内容信息的矩阵分解推荐方法.docx
资源推荐
资源详情
资源评论
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![docx](https://img-home.csdnimg.cn/images/20210720083331.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![](https://csdnimg.cn/release/download_crawler_static/85783640/bg1.jpg)
1 引 言
当今网络信息爆炸式增长,个性化推荐算法极大地减少了人们获取目标资源
的时间
[1
,2
]
。目前的推荐算法主要分为三类:协同过滤方法、基于内容的方法和
混合方法。其中,协同过滤方法在推荐系统研究中最具代表性,该方法根据预测的
用户评分确定待推荐物品,广泛应用在电影推荐、地点推荐和商品推荐中。但是,
用户规模的指数级增长引发了严重的数据稀疏和冷启动问题 ,迫使协同过滤方法
频繁面对新用户和新物品,极大地限制了该方法的性能提升。因此,如何解决数据
稀疏和冷启动挑战成为国内外学者广泛关注的问题
[3
]
。矩阵分解
[4
]
是一种基于模
型的协同过滤推荐方法,在评分预测中取得了很好的效果。但是,矩阵分解的建模
过程高度依赖于历史评分,难以克服数据稀疏性和冷启动问题对算法性能的限制。
针对这一问题的研究发现
[5
]
,利用辅助信息表征用户和物品特征,能够有效缓解稀
疏评分数据的影响,克服冷启动问题对预测性能的制约。常用的辅助信息主要来
源于两类数据:标签数据和内容数据。标签数据以结构化的数据形式直观地描
述物品特征、表征用户偏好。内容数据以非结构化的数据形式提供语义化的特
征描述,常见的内容数据包括电影摘要、新闻内容、用户评论等。随着自然语言
处理技术的成熟,越来越多的学者利用丰富的内容信息解决数据稀疏问题
[6
]
。
虽然,利用辅助信息能够在一定程度上缓解稀疏评分数据和冷启动问题对预
测算法性能的影响,但是,单纯利用标签数据或内容数据的方法仍然存在局限:标
签数据存在语义模糊、不能体现逻辑关系的缺陷,在应用中难以摆脱表达歧义、
不能明确表达标签语义的问题
[7
]
;内容数据只能反映物品的全貌,不能精确刻画不
同物品的特征差异。两部电影的标签和内容信息如 图
1
所示,从标签的角度分析,
两部电影在导演、编剧、主演、地区和年份属性上存在较大差异。然而 ,从内容
的角度分析,二者却具有相似的剧情。可见,利用单方面的标签或内容信息难以区
分具有部分相似特征的物品,融合标签和内容信息才能更好地体现不同物品之间
的区别和联系。尤其在互联网迅速发展、网络数据呈现多元化、异构化特点的
现实背景下,综合利用标签和内容信息对提高推荐算法性能和克服数据稀疏、解
决冷启动问题具有重要的现实意义。
图 1
图 1电影的标签和内容信息示例
Fig.1Example of Tag and Content Information of a Movie
![](https://csdnimg.cn/release/download_crawler_static/85783640/bg2.jpg)
本文提出一种融合标签数据、内容数据和用户-物品评分数据的矩阵分解推
荐方法,并在真实电影评分数据集上验证了其预测效果。利用深度学习技术解决
基 于 预 测 评 分 的 推 荐 系 统 中 的 异 构 信 息 融 合 问 题 , 采 用 卷 积 神 经 网 络
[8
]
(Convolutional Neural Network,CNN)实现内容数据的深层次特征提取,采用
深度神经网络
[9
]
(Deep Neural Networks,DNN)实现内容特征与标签特征的深
度融合,利用综合的物品特征向量实现基于矩阵分解的评分预测。
本文的主要工作如下:
(1)提出一种融合标签信息、内容信息和用户评分信息的矩阵分解算法,基
于神经网络模型获取物品的深层次特征并应用于用户评分预测,减小预测误差。
(2)实现内容和标签的异构信息融合,利用综合特征向量更好地表征物品特
征,克服稀疏评分数据和冷启动问题对矩阵分解算法预测性能的限制。
(3)在真实电影评分数据集上的实验表明,本文方法降低了评分预测误差。
同时,融合异构信息能够借助标签数据缓解内容数据中无关词的干扰,提升矩阵分
解算法在应对噪声数据方面的鲁棒性。
2 相关研究
2.1 矩阵分解推荐方法
协同过滤
[10
]
分为基于内存的协同过滤和基于模型的协同过滤,是基于预测评
分的推荐算法之一。矩阵分解
[11
]
(Matrix Factorization,MF)是基于模型协同过
滤的代表方法,由于其良好的准确性和可扩展性,受到研究者的广泛关注,并产生了
众 多 变 种 方 法 。 最 早 的 矩 阵 分 解 模 型 以 奇 异 值 分 解
[12
]
( Singular Value
Decomposition,SVD)为代表,将用户对物品的评分分解为用户特征向量和物品
特征向量的内积。在此基础上,研究者陆续提出多种 SVD 模型的变体以提高推荐
的准确性,例如 SVD++
[13
]
和 PMF
[14
]
等。Zhang 等
[15
]
提出针对大型稀疏数据集的深
度变分矩阵分解推荐模型(DVMF),通过深层的非线性结构获得用户和物品的
潜在特征表示向量计算向量内积,提高了矩阵分解算法在大型数据集上的预测性
能。Liu 等
[16
]
采用基于粒度结构、自上而下的动态推荐策略,提出一种动态三向粒
度推荐模型(DTWGR),利用 SVD、SVD++和 NMF 三种方法构建收视率的预
测模型,提高了预测准确率。
尽管矩阵分解算法相比其他方法在评分预测中取得了更好的效果 ,但是矩阵
分解的建模过程依赖评分数据,数据稀疏性极大地限制了算法性能的进一步提升。
针对这一问题,国内外学者提出利用辅助信息缓解稀疏数据对推荐性能的影响。
Pujahari 等
[17
]
提 出 一 种 概 率 矩 阵 分 解 ( Probabilistic Matrix
Factorization,PMF)模型,该模型采用“偏好关系”作为输入,使用矩阵共分解技术
将用户和物品的辅助信息集成到模型中。该研究表明,通过增加辅助信息生成的
商品排序列表能够获得更好的推荐效果。Shen 等
[18
]
从用户评论中构建情感词典,
计算用户对物品的情感得分作为描述用户和物品特征的补充信息,结合用户历史
评分提出基于情感分析和评分矩阵的可靠性矩阵分解算法(SBMF+R)。该研
究表明,利用用户评论能够缓解评分数据稀疏性的影响,从而提高预测性能。
![](https://csdnimg.cn/release/download_crawler_static/85783640/bg3.jpg)
2.2 利用标签的推荐方法
标签是一类描述信息的关键词,被广泛应用于推荐算法研究
[19
,20
]
。一方面,标
签数据可以直观地反映物品的某些特征;另一方面,标签数据可以准确表达用户的
兴趣偏好。涂海丽等
[7
]
利用用户在商品检索时使用标签的频率和时间构建商务社
区中的商品本体,提出一种基于聚类和类内相似度的商品推荐方法。叶佳鑫等
[21
]
以用户使用频率最高的标签为线索,基于不同领域内标签数据之间的关联性,提出
一种跨域资源推荐方法,该方法采用 DBSCAN 算法
[22
]
聚类标签向量,提出基于 TF-
IDF 算法
[23
]
的二次推荐策略,实现个性化程度更强的图书推荐。马闻锴等
[24
]
利用标
签数据提出基于马尔科夫链模型的推荐方法,将用户-标签-物品的三维关系拆解
为用户-标签和标签-物品关系,利用马尔科夫链模型计算用户与物品之间的匹配
度完成推荐。朱峙成等
[25
]
将商品的不同属性视为多个标签,据此生成用户画像,提
出一种基于隐马尔科夫模型模型的推荐方法,利用多标签数据解决了数据稀疏问
题,同时采用不同的数据处理机制提高了模型的泛化能力。文俊浩等
[26
]
利用用户-
标签矩阵和资源-标签矩阵提出一种基于标签偏好概率的协同过滤推荐方法 ,实现
基于用户偏好值预测的电影推荐,该研究克服了基于标签的传统推荐算法中存在
的语义模糊问题,提高了推荐结果的精确度。
可见,利用标签数据能够缓解推荐算法面临的数据稀疏问题,提高算法的预测
性能。但是,标签数据以关键词的形式表达特征,缺少语义解释,容易造成表达歧义
和信息干扰,致使改进的推荐算法未能从根本上解决数据稀疏问题。
2.3 利用内容的推荐方法
当前利用内容的推荐方法大多使用神经网络模型实现内容特征提取 ,将特征
工程和结果预测整合到一个模型中进行参数优化,在以推荐为目标的前提下,这类
模型可以实现特征的自动学习,改变了依赖人工特征工程的传统推荐策略。Da’u
等
[27
]
提出 AODR 模型,使用卷积神经网络从评论文本中提取物品的潜在特征,然后
将其融合到协同过滤模型的物品特征向量中,以丰富物品特征表示、优化推荐效
果。Liu 等
[28
]
提出一种基于混合神经网络的推荐模型,采用注意力机制从评分和评
论中学习用户和物品的特征向量,结合预测评分筛选用于描述用户和物品特征的
有用评论。Chen 等
[29
]
提出 DCC-PersIRE 模型,采用无监督的深度学习技术从地
点描述文本中学习地点的嵌入式特征表示向量,将其与用户签到记录和地点类别
信息融合,预测用户兴趣和签到行为。
矩阵分解与神经网络模型的结合,为解决矩阵分解面临的数据稀疏问题提供
了有效的技术方案。Wu 等
[30
]
提出一种基于神经网络的双正则化矩阵分解模型,利
用用户和物品的内容描述文本补充特征表示,克服了矩阵分解算法依赖评分数据
建模所面临的数据稀疏难题。Kim 等
[31
]
提出一种基于卷积神经网络的上下文感知
矩 阵 分 解 模 型 进 行 电 影 评 分 预 测 , 从 故 事 摘 要 中 学 习 电 影 的 内 容 隐 特 征 , 在
MovieLens 数据集上的实验验证了使用内容数据缓解数据稀疏问题的有效性。
虽然学者们已经针对基于矩阵分解的评分预测算法开展了大量研究 ,并试图
利用标签和内容信息解决评分数据稀疏问题,但是基于内容的评分预测算法对相
似物品区分度不高,限制了预测效果。目前综合利用标签和内容数据的研究成果
较少,推荐系统内的异构信息融合问题没有得到很好地解决。
![](https://csdnimg.cn/release/download_crawler_static/85783640/bg4.jpg)
综上所述,本文利用神经网络模型
[9
]
,提出一种融合标签和内容特征的矩阵分
解推荐方法。旨在通过融合标签和内容数据解决矩阵分解模型面临的评分数据
稀疏问题,为推荐系统研究中的异构信息融合问题提供借鉴。
3 本文方法
本 文 提 出 融 合 标 签 、 内 容 数 据 和 用 户 - 物 品 评 分 数 据 的 矩 阵 分 解 算 法
( Matrix Factorization Method Combining Tag and Content
Information,TCMF),实现流程如图
2
所示。TCMF 从物品的标签和内容中提取
深层次特征,通过深度特征融合得到物品的综合特征向量,结合用户-物品评分数
据实现评分预测。
图 2
图 2基于异构信息融合的矩阵分解算法流程
Fig.2Process of Matrix Factorization Algorithm Based on Heterogeneous
Information Fusion
3.1 数据描述
剩余18页未读,继续阅读
资源评论
![avatar-default](https://csdnimg.cn/release/downloadcmsfe/public/img/lazyLogo2.1882d7f4.png)
![avatar](https://profile-avatar.csdnimg.cn/3f07197aad004e4fa57ac5a008eb6aaf_weixin_57147647.jpg!1)
罗伯特之技术屋
- 粉丝: 3936
- 资源: 1万+
![benefits](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-1.c8e153b4.png)
下载权益
![privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-2.ec46750a.png)
C知道特权
![article](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-3.fc5e5fb6.png)
VIP文章
![course-privilege](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-4.320a6894.png)
课程特权
![rights](https://csdnimg.cn/release/downloadcmsfe/public/img/vip-rights-icon.fe0226a8.png)
开通VIP
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![voice](https://csdnimg.cn/release/downloadcmsfe/public/img/voice.245cc511.png)
![center-task](https://csdnimg.cn/release/downloadcmsfe/public/img/center-task.c2eda91a.png)
最新资源
- 机器学习客观题测验,备战期末复习的题库
- HBR740语音识别协处理芯片开发工具包(硬件参考设计原理图+PCB+51单片机软件驱动源码DEMO例程+文档资料).zip
- 数据库管理工具:dbeaver-ce-23.0.1-macos-aarch64.dmg
- M25P20, M25P40, M25P80, M25P16, M25P32, M25P64存储 SPI FLASH C语言驱动
- Matlab基于PCA算法的简单图像人脸识别.zip
- 免费的画图工具drawio,可以代替visio,版本24.5.3,适用于windows
- 瑞昱RTL8723DS-WiFi-linux- android 驱动 内含详细移植说明,支持android4.4
- AMSR/ADEOS-II L1A Raw Observation Counts, Version 3用户手册
- zaopingshujufenxi.zip
- 六级作文模板万能句型pdf.zip
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback](https://img-home.csdnimg.cn/images/20220527035711.png)
![feedback-tip](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![dialog-icon](https://csdnimg.cn/release/downloadcmsfe/public/img/green-success.6a4acb44.png)