没有合适的资源?快使用搜索试试~ 我知道了~
融入空间关系的矩阵分解POI推荐模型.docx
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 9 浏览量
2022-11-30
09:27:12
上传
评论
收藏 181KB DOCX 举报
温馨提示
试读
13页
融入空间关系的矩阵分解POI推荐模型.docx
资源推荐
资源详情
资源评论
推荐系统是根据用户的某些行为收集用户的偏好,推荐给用户适合他们偏爱的服务或
者物品
[1]
。推荐系统在网上购物、浏览器搜索、外卖等领域具有广泛的应用。随着社交网
络、全球定位技术和移动互联服务的发展,基于位置的社交网络(location-based social
network,LBSN)服务也随之流行起来,例如 Foursquare、Gowalla、Yelp
[2]
等服务。这
些 LBSN 服务通过用户的社交媒体将用户访问一个位置或签到的信息分享给社交网络好
友,通过这种签到信息,可以发掘出用户与其签到位置的相互关系,并以此帮助人们寻找
他们感兴趣的地方。兴趣点(point of interest,POI)推荐是根据用户的历史签到信息
[3]
学
习用户的访问偏好,推荐给人们感兴趣但没有访问过的位置。POI 推荐不仅能够帮助人们
发现未知的感兴趣的地方,而且能够帮助营业者吸引潜在用户。
目前,POI 推荐面临着数据稀疏和隐性反馈的使用这两大问题
[4]
。针对数据稀疏性,
很多研究者尝试使用加边信息来解决数据稀疏的问题
[5-10]
。由于空间因素在 POI 推荐中能
产生较大影响,文献[11]研究了空间聚类现象以及空间距离对于用户签到行为的影响;文
献[12-13]首先研究空间聚类现象,通过 Tobler 的地理学第一定律
[14]
得出“一个用户倾向访
问附近的 POI”,然后根据用户签到数据,分析得出用户签到的概率服从幂律分布;文献
[15]通过分析用户活动性提出了一种包括二维高斯核密度分析算法和一维幂律算法的推荐
框架;文献[13]通过人类活动的阶段性表现研究时间对 POI 推荐的影响;文献[16]通过将
时间的影响分为长期影响、短期影响和时变影响来分析时间对 POI 推荐的作用,取得了较
好的结果。除了空间和时间因素外,还有学者考虑了社交关系
[6, 17-20]
。文献[6]提出了一种评
价社交关系的一种度量,即信任度,由信任度来计算不同社交关系的影响程度;文献[17]
提出了潜在的社交关系,认为用户潜在的社交关系会对用户的偏好产生影响,但是社交关
系因素对于 POI 推荐系统性能的提升作用有限。也有研究提出使用社交评论信息来帮助推
荐
[17, 21-23]
,如文献[22]研究了用户评论的语义信息,并给出了这些信息对于 POI 推荐性能
的提升;文献[24]使用卷积矩阵分解(matrix factorization,MF)方式较好地融入了社交评
论信息。针对隐性反馈使用问题,文献[25-27]采用加权矩阵分解(weighted matrix
factorization,WMF)或负采样方法来解决该问题,分别是为每个元素增加一个权重或者
概率的方式和用缺失数据建模的方式。这两种方法是目前针对隐性反馈使用问题的主要应
对方法。
针对 POI 推荐系统中的数据稀疏性,本文采用融入空间关系的方法来缓解该问题。当
前研究虽然考虑了地理因素的影响
[4, 9, 12-13, 28-29]
,并且分析了地理因素的影响模式,但一般
都是从空间距离的角度分析该因素的作用,较少考虑空间拓扑关系的影响,而空间拓扑关
系是地理空间相关关系的重要组成部分。对于空间分析,空间关系的确立非常重要,因此
考虑空间拓扑关系对于融入地理空间要素的 POI 推荐至关重要。本文在融入空间关系时,
将空间关系进一步细分为空间距离关系与空间拓扑关系,缓解了数据稀疏的影响。
针对隐性反馈使用问题,本文采用 WMF 技术来缓解此问题,提出合作竞争矩阵分解
模型(cooperative competition matrix factorization,CC-MF),首先通过分析影响 POI
推荐的相关关系,将空间关系因素融入到推荐模型中,从用户与 POI 关系的角度融入空间
距离因素,从 POI 与 POI 关系的角度融入考虑空间拓扑关系的空间距离因素,然后综合它
们间的合作关系和竞争关系寻找空间关系的影响。通过使用隐语义模型和 WMF 以及曝光
矩阵分解模型完成推荐任务的启发
[27]
,从关系的角度分析空间关系因素的影响,并把空间
关系融入到 MF 模型中,完成 POI 推荐。
1. 兴趣点推荐
1.1 问题描述
在 POI 推荐中,极度的数据稀疏严重影响 POI 推荐结果的精度。例如,本文使用的
用户 POI 签到 Foursquare 数据集的数据密度为 0.81%。而在推荐系统方面流行的
movielens 数据集(small)的数据密度为 1.7%,由此可见 POI 推荐任务形势更加严峻。
POI 推荐的数据稀疏性提高了推荐算法运算复杂性及正确推荐的难度。
根据数据反馈得到的信息类型可以将数据反馈分为显性反馈和隐性反馈
[26]
,显性反馈
数据能够获取正例和负例,通过正例获得用户喜欢什么,通过负例获得用户不喜欢什么,
因此只需要通过这些显性反馈去推测用户的偏爱。但是,显性反馈数据获取很困难。而隐
性反馈数据(例如签到数据)只有正例,没有负例,该类问题被称为单类问题
[25]
。在用户-
POI 矩阵中,有签到信息的元素标记为 1,没有签到信息的元素标记为 0,如图 1 所示。
对于没有签到信息的元素,不知道是用户不喜欢还是用户没接触过此 POI,或是其他原
因。隐性反馈不能直接得出用户的偏好,但是能利用它帮助推荐,因此隐性反馈值得深入
考虑。
图 1 用户-POI 矩阵
Figure 1. User-POI Matrix
下载: 全尺寸图片 幻灯片
1.2 矩阵分解
MF 技术是协同过滤(collaborative filtering,CF)技术中比较流行的一种处理方法。
将 MF 运用到推荐算法上,可以将 m 个用户在 n 个 POI 上的原始用户签到矩阵 R
m×n
分解
为一个用户特征矩阵 P
m×k
和物品特征矩阵 Q
k×n
,P 和 Q 的隐性特征空间的维度为 k。用户
原始签到矩阵 R 通常是一种非常稀疏的矩阵,且矩阵中元素的个数也能达到千万甚至上
亿,使用 MF 技术可以有效降低数据的维度,合理有效地利用有限的信息。
奇异值分解(singular value decomposition,SVD)是矩阵分解的一种形式,不同于
其他矩阵分解方法,SVD 适用于任何矩阵。对于矩阵 A
m×n
,可以通过 SVD 得到
A
m×n
→X
m×k
×Y
k×n
。因为 MF 的扩展性极好和易于实现,研究人员提出了多种拓展 MF 算
法,以适应不同推荐任务和改进原始 MF 模型。SVD++是 MF 中的一个经典模型,它是基
于用户的某些隐性反馈信息能够从侧面反映用户的某些偏好的假设提出的。局部低秩矩阵
近似(local low rank matrix approximation,LLORMA)是由文献[30]根据矩阵分解出来的
矩阵需要满足局部低秩假设提出的。WMF 是文献[25]提出用来解决单类问题的一种策略,
使用的是加权低秩逼近技术;还有一种策略是负采样技术。社交正则化(social
regularization,SR
ui
)是由文献[31]提出的,它将隐性的社交关系融入到了 MF 中,认为用
户的隐性社交关系也能影响人们的选择。除此之外,还有融合深层神经网络和 MF 的推荐
技术
[32]
,如广义矩阵分解与多层感知机结合等。
1.3 地理信息的作用
地理信息与人们的生活密切相关,它已经在人们的生活中变得常见,许多研究者已将
其作为影响 POI 推荐的因素加入考虑。如文献[12]提出的统一协同 POI 推荐框架——基于
用户偏好和社交影响以及地理影响的推荐(user preferen- ce/social
influence/geographical influence based recommendation,USG),将用户偏好、社交信
息、地理信息等因素加入到 POI 推荐模型中,帮助推荐。对于地理信息,他们先对数据进
行统计分析,然后从分析结果中总结距离与用户签到之间的关系。文献[4]提出了特征空间
分离因子分解模型(feature-space separated factorization model,FSS-FM)模型,加入
了时间因素和空间因素的影响,它认为 POI 的隐性特征中包含时间序列特征和空间特征,
并通过时间邻居和空间邻居来进行进一步的求解。文献[33]中提出了一个使用视觉内容、
剩余12页未读,继续阅读
资源评论
罗伯特之技术屋
- 粉丝: 3578
- 资源: 1万+
下载权益
C知道特权
VIP文章
课程特权
开通VIP
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功