没有合适的资源?快使用搜索试试~ 我知道了~
基于用户行为自适应推荐模型研究 .docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 31 浏览量
2022-06-26
16:10:32
上传
评论
收藏 284KB DOCX 举报
温馨提示
试读
21页
基于用户行为自适应推荐模型研究 .docx
资源推荐
资源详情
资源评论
1 引言
大数据时代数据无时无刻不在大量产生。海量数据不仅带来了信息同时也
带来了信息超载问题
这对于数据处理来说是一个巨大的挑战。大量学者为解决
信息超载问题提出了解决方案:搜索引擎
最常见的例子是用户通过搜索关键
词来定向获取信息。虽然在一定程度上缓解了问题但是这种方法仍旧存在缺陷。
普通用户欠缺相关领域的专业知识在输入关键词时不一定准确加大了搜索对应
信息的难度。而且不同用户往往有不同的搜索需求搜索引擎无法识别出用户的
特征并主动返回个性化的反馈结果。直到个性化推荐系统的问世 才更有效地缓
解了信息超载问题。
为了向用户提供更加智能的个性化服务个性化推荐系统
根据不同用户的历
史行为数据过滤用户购买意向较弱的项目并且选择满足用户需求的项目
。推荐
系统的核心是通过分析用户信息、物品信息、购买记录、历史评分、评论信息
等数据构建用户画像基于用户画像构建不同的推荐规则并匹配用户感兴趣的物
品进行推荐。这种方法不需要手动输入关键字降低了用户使用的复杂程度以及
信息不匹配的概率弥补了传统搜索引擎的不足。
目前主流的推荐模型仍然存在一些不足对于不同类型用户无法自适应调节
推荐结果难以满足用户的多态性需求。同时推荐系统中的核心问题:冷启动、
数据稀疏、相似度计算等并未完全解决。本文提出的自适应推荐模型将根据不
同场景自动选择合适的相似度计算方法提高了相似度计算的准确性。
2 相关研究
传统的相似度算法如余弦相似度、 相关系数都是基于共同评分项
目忽略了共同评分项目数量对于相似度计算的影响共同评分数越多用户之间应
该越相似。基于这个问题一些新的改进方法被相继提出。 算法
基于
相关系数( )设置了一个阈值
当共同评分项目数量大于 时不惩罚 相似度否则将引入惩罚因子降低相
似度。考虑到评分信息较少的情况下不必惩罚相似度故切换为普通的 相
似度算法。 等
提出的方法降低了少量共同评分项目数量的用户相似度
与 算法思想类似。 等
在一定程度上提高了推荐模型的自适应能力。
为缓解冷启动问题使新用户以及新项目能够得到有效的推荐 ! 等
"
引入多个相似度度量方法动态选择每个相似度的权重并加权推荐。这种方法能
够利用不同相似度算法的优势缓解了用户冷启动的问题。但是该方法存在一个
缺陷 : 没有 分析 不 同 时 期 的 评 分 数 量对 于相 似度 计 算 的 影响 。基 于这 个 问
题#$ 等
%
设计了 & 算法分析不同相似度算法的缺点并从多方面分析了用户
评分数据。但是该模型忽略了不同用户在同一物品上的评分规律以及同一用户
对不同物品的评分习惯。 等
'
提出的 ()*+ 算法利用用户评分信息的全局性
影响选择邻居用户解决了 & 算法的这一问题。*
提出的模糊推荐方法是
解决冷启动问题的另一种思路不再利用评分信息而是使用用户属性计算相似度。
同时兴趣偏移问题也得到了广泛的关注
。, 等
介绍了时间衰减概念并在
相似度计算中引入时间衰减函数。-$!. 等
在预测评分时添加了时间权
重函数提高了相近评分时间对于相似度计算的权重。
目前的研究中推荐模型层次化程度较低构造的算法
往往包含多种功能。
如果将不同算法按功能划分层次能使推荐过程更加清晰并且能实现更加多样的
推荐策略。
3 模型设计
在个性化推荐中常常需要根据不同的用户类型进行推荐。有研究证实新用
户更容易选择热门的项目而老用户会慢慢开始浏览较冷门的项目
"
即用户的活
跃度与选择项目的冷门程度成反比。
根据实际情况可以推断不同类型用户需要的推荐策略不一样选择合适的推
荐策略能弥补推荐算法只能适应单一场景的不足同时也为冷门项目以及新项目
提供了更高的价值。在满足用户兴趣爱好的前提下适当为用户提供更加多元的
推荐可以拓宽用户的兴趣领域。将推荐模型分为三层不仅实现了用户的自适应
推荐而且规范了推荐流程提高了推荐效率。
三层协同结构的框架如图
所示。
图
图 1三层协同框架
Fig.1Three-Tier Collaboration Framework
/策略层设计
() 用户细分
用户可以大致分为新用户以及老用户两类根据用户评分记录数量可以更进
一步将用户划分为 个级别:一级用户、二级用户、三级用户以及四级用户 其
中一级和二级用户属于新用户三级和四级用户属于老用户。
假设训练集中用户评分数量为 n依据文献
以及数据分布统计分析设置
两个阈值 α0、 β(α>β>0120313')分别为二级三级用户评分数量阈值和三
级四级用户评分数量阈值即当 n≤α40 时用户为二级用户5当 n≤β41 时用
户为三级用户5当 n>β31 时用户为四级用户。具体划分规则如下:
① 当 n=06' 时为一级用户。一级用户定义为新注册的用户训练集中该
用户的评分数量为 '即训练集中并没有该用户的历史评分记录 而在测试集中该
用户首次出现。由于缺乏历史行为数据该类用户的推荐显得极不稳定。部分推
荐系统会在注册时让用户自主选择喜爱的类型实现冷启动但是这样可能会导致
用户的不适从而对推荐系统的智能化产生质疑。
② 当 0<n≤α'740 时为二级用户。二级用户定义为有过少量评分记录的
用户训练集中该用户的评分数量小于等于阈值 α0该类用户历史行为数据稀少
高度稀疏的评分数据会给协同过滤算法带来不小的挑战利用评分项目矩阵计算
的相似度可信度较小所以考虑使用其他推荐算法保证推荐的质量。新出现的项
目如果符合用户的偏好可以考虑推荐给该类用户缓解新项目冷启动的问题。
③ 当 α<n≤β0741 时为三级用户。三级用户定义为评分数据适中的用户
训练集中该用户的评分数量小于等于阈值 β1从大量的评分数据中可以分析出该
类用户的偏好使用基于用户的协同过滤算法不仅有较高的准确率同时也能拓宽
用户兴趣。
④ 当 n>β31 时为四级用户。四级用户定义为活跃用户训练集中该用户
的评分数量大于阈值 β1该部分用户有大量的评分数据为其推荐冷门项目不仅
能提高冷门项目的价值也能帮助用户选择适合自己的项目。故该类用户在三级
用户推荐的基础上增加了冷门项目推荐。
() 策略设计
① 当用户为一级用户时即用户为新注册用户还没有过行为记录。为这类用
户推荐当前最流行的项目即热门推荐。
② 当用户为二级用户时由于评分项目数量过于稀少选择冷启动推荐方法。
根据用户属性相似度选择最近邻居将邻居喜欢的项目推荐给该用户即属性推荐。
③ 当用户为三级用户时根据用户评分记录计算各个用户之间的 相似
度和预测类中用户未购买项目的评分再利用评分预测后的完整矩阵计算每个用
户之间的 ! 相似度最后计算项目喜爱度并加入推荐池。
④ 当用户为四级用户时用户会偏向选择一些冷门项目。预测用户可能喜欢
的冷门项目与三级用户推荐算法的推荐结果一起放入推荐池。
剩余20页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3651
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- vscode配置c/c 环境教程
- vscode配置c/c 环境教程
- 基于matlab实现电磁优化计算功能,进行线型规划优化电磁设计.rar
- 基于matlab实现带精英策略的非支配排序遗传算法matlab 源码.rar
- 基于matlab实现差分进化算法,最新的用于替代遗传算法,是以后的主要发展方法.rar
- VSCode配置c/c++环境教程.md
- 基于matlab实现标准合作型协同进化遗传算法matlab源程序
- 七下人教.zip
- 基于matlab实现本份代码能对图像进行gabor滤波处理,结合指纹方向图以及指纹沟壑频率特性,对指纹图像进行增强.rar
- 基于matlab实现RBM神经网络实现了手写数字体识别的GUI程序.rar
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功