改进的协同过滤算法在电影推荐系统中的应用
刘文佳 张骏
摘 要:随着互联网的快速发展,电影的海量供给和用户多样化的需求间的矛盾日趋突出,
将个性化推荐技术和电影系统的有机结合对用户和运营商来说是一个双赢的局面。主要研究
协同过滤算法在电影推荐系统中的应用,协同过滤是目前应用最为广泛且成功的一种推荐技
术,但也暴露出诸多问题,比如数据稀疏性、用户兴趣变化等。通过对基于项目的协同过滤
算法的分析,分别引入了共同评分权重函数和时间权重函数对相似度计算方法和预测评分计
算方法进行了改进,并通过在 Movielens 数据集上验证了改进的协同过滤算法较传统的协同
过滤在推荐准确度上有了明显的提升。
关键词:协同过滤;电影推荐;相似度;时间因子
中图分类号:F49 文献标识码:Adoi:10.19311/j.cnki.1672-3198.2018.17.028
1 引言
隨着信息技术的快速发展,互联网上的资源呈现指数级的增长态势,“信息过载”问题愈发突
出。“信息过载”是数据量剧增后的一种必然结果,针对此问题,相关专家学者相继提出了以
分类目录、搜索引擎、推荐系统为代表的解决方案。不同于前两种解决方案,需要提前知晓
用户的需求,方能提供信息的查询结果;推荐系统通过挖掘用户的行为数据,建立用户兴趣
模型,从而主动地提供信息个性化的信息服务,逐渐受到学术界和工业界的关注和研究。目
前,Amazon 的图书推荐、Facebook 的好友推荐、今日头条的新闻推荐以及 YouTube的视频
推荐等,均取得了不俗的成绩。
以电影、电视剧、自制剧等代表的网络视频已经成为网民信息获取和文化消费的主要形态之
一,是满足人民群众精神文化需求的重要渠道之一。据中国互联网络信息中心(CNNIC)发
布的第 41 次《中国互联网络发展状况统计报告》显示:截止至 2017 年 12 月,我国网络视
频用户规模达 5.78 亿,较 2016 年增长了 6 个百分点,在中国各类互联网应用,视频类应用
程序持续保持前 5 名的位置。这也充分说明以电影为代表的视频领域仍具有很大的发展前景。
而通常人们较难准确地表达自己的需求,其次互联网上的电影资源日趋庞大,使得电影的海
量供给和用户多样化的需求之间的矛盾日益突出,此时个性化推荐技术与电影系统的有机结
合显得尤为重要,既能帮助用户快速地发现其喜爱的电影,减少用户搜索电影的盲目性;同
时用户对电影推荐系统的忠诚度的提升又能助力运营商以 VIP 付费服务、广告投放等手段增
加经济收益。目前,基于协同过滤的推荐算法、基于内容的推荐算法、基于关联规则的推荐
算法被广泛应用到电影推荐系统中,其中协同过滤算法以其对推荐对象无结构要求、能新异
发现等优点在电影推荐系统中应用最为广泛。因此,本文主要研究协同过滤算法及其在电影
推荐系统的应用。
2 相关工作
2.1 传统的协同过滤算法
协同过滤算法主要分为两类:(1)基于内存的协同过滤,其理论基础是 KNN 模型,根据相
似邻居来产生推荐;(2)基于模型的协同过滤,其理论基础是机器学习,通过优化设定指标
来建立最优模型来产生推荐。已有研究表明,基于内存的协同过滤能获得更好的推荐准确度,
但暴露出诸多问题:数据稀疏性、用户兴趣变化、可拓展性差等;基于模型的协同过滤具有
更好的可拓展性,但由于模型需要离线构建,不能较好地反映用户的实时兴趣,因此,在推
荐质量上不如基于内存的协同过滤。
基于内存的协同过滤主要包括基于用户的协同过滤和基于项目的协同过滤,其基本思想大致
相同,区别在于相似度的计算,基于用户的协同过滤根据用户相似度来产生推荐,基于项目
评论1
最新资源