没有合适的资源?快使用搜索试试~ 我知道了~
推荐系统常考面试大题.pdf
需积分: 35 43 下载量 170 浏览量
2020-05-17
09:45:33
上传
评论 2
收藏 2.92MB PDF 举报
温馨提示
试读
136页
这篇文章总结了推荐系统领域相关的40多道常见面试考题,是相关从业者总结得来的,如果正在准备推荐相关的面试的话可以看一看,其中的解析非常详细实用!
资源推荐
资源详情
资源评论
目录
请详细说说协同过滤的原理..................................................................................................................... 2
搜索和推荐中的精度和召回(recall)分别是什么意思? ................................................................... 14
推荐系统有哪些常用的评价标准 .......................................................................................................... 18
请详细聊聊推荐系统里的排序算法...................................................................................................... 20
怎么解决推荐系统中的冷启动问题? ................................................................................................. 33
请聊聊你所了解的推荐系统算法 .......................................................................................................... 38
了解隐语义模型在推荐系统中的应用的么? .................................................................................... 42
如何通俗理解奇异值分解 ....................................................................................................................... 51
请通俗的解释下什么叫张量分解?...................................................................................................... 70
请说说隐语义模型 LFM 背后的原理 .................................................................................................... 76
请详细说说你对 Learning to rank 的通俗理解 .................................................................................. 83
简述推荐系统的演进史 ........................................................................................................................ 116
推荐系统评估(从用户\内容提供方\网站角度)................................................................................ 117
推荐系统常用评估指标 ........................................................................................................................ 117
推荐系统准确性(学术界)的评估函数 ................................................................................................ 118
推荐系统多样性&新颖性&惊喜性..................................................................................................... 119
解释 Exploitation & Exploration.......................................................................................................... 119
Bandit 算法-原理 ................................................................................................................................... 119
什么是多层重叠试验框架? .................................................................................................................. 120
预训练方法 BERT 和 OpenAI GPT 有什么区别?.......................................................................... 120
对比 BERT、OpenAI GPT、ELMo 预训练模型架构间差异.......................................................... 121
GCN 方法分为哪两类? ...................................................................................................................... 121
什么是图卷积神经网络? .................................................................................................................... 122
如何理解图卷积算法? ........................................................................................................................ 122
GCN 有哪些特征? ................................................................................................................................ 123
已知基于数据驱动的机器学习和优化技术在单场景内的 A/B 测试上,点击率、转化率、成交
额、单价都取得了不错的效果。 但是,目前各个场景之间是完全独立优化的,这样会带来
哪些比较严重的问题 ? ...................................................................................................................... 123
什么是多场景联合排序算法 ? ......................................................................................................... 124
IRGAN 框架具体是什么?.................................................................................................................... 124
推荐页与搜索页特性有什么不同?................................................................................................... 125
推荐系统常用的评价指标有哪些?................................................................................................... 125
请画出点击率预估流程图,分为那两部分? ................................................................................. 127
使用 FFM 有哪些需要注意的地方...................................................................................................... 128
什么是 DSSM?有什么优缺点? .......................................................................................................... 128
什么是 wide&deep 模型? .................................................................................................................. 129
Join training 和 ensemble training 有什么区别?.......................................................................... 130
简述 DeepFM 模型? ............................................................................................................................ 130
Collaborative Knowledge Base Embedding 使用哪三种知识的学习?.................................... 131
怎样将知识图谱引入推荐系统 ?..................................................................................................... 131
普通的逻辑回归能否用于大规模的广告点击率预估 ,为什么? ............................................ 132
FTRL 在准备训练数据(特征工程)和训练模型时有哪些 trick ? .......................................... 132
阿里最新开源的 X-Deep Learning 为 Online Learning 提供了哪些解决方案? ................... 133
特征交叉(特征组合)方式有哪些? ....................................................................................................... 134
特征选择的方法有哪些? ...................................................................................................................... 135
简述 Multi-task learning(MLT)多任务学习 ...................................................................................... 135
如何离线评价召回阶段各种模型算法的好坏?由于没有明确的召回预期值,所以无论 rmse
还是 auc 都不知道该怎么做? ........................................................................................................... 136
请详细说说协同过滤的原理
解析:
1 推荐引擎的分类
推荐引擎根据不同依据如下分类:
根据其是不是为不同的用户推荐不同的数据,分为基于大众行为(网站管理员自行推荐,
或者基于系统所有用户的反馈统计计算出的当下比较流行的物品)、及个性化推荐引擎
(帮你找志同道合,趣味相投的朋友,然后在此基础上实行推荐);
根据其数据源,分为基于人口统计学的(用户年龄或性别相同判定为相似用户)、基于内
容的(物品具有相同关键词和 Tag,没有考虑人为因素),以及基于协同过滤的推荐(发
现物品,内容或用户的相关性推荐,分为三个子类,下文阐述);
根据其建立方式,分为基于物品和用户本身的(用户-物品二维矩阵描述用户喜好,聚类算
法)、基于关联规则的(The Apriori algorithm 算法是一种最有影响的挖掘布尔关联规
则频繁项集的算法)、以及基于模型的推荐(机器学习,所谓机器学习,即让计算机像人
脑一样持续学习,是人工智能领域内的一个子领域)。
关于上述第二个分类(2、根据其数据源)中的基于协同过滤的推荐:随着 Web2.0 的发
展,Web 站点更加提倡用户参与和用户贡献,因此基于协同过滤的推荐机制因运而生。
它的原理很简单,就是根据用户对物品或者信息的偏好,发现物品或者内容本身的相关
性,或者是发现用户的相关性,然后再基于这些关联性进行推荐。
而基于协同过滤的推荐,又分三个子类:
基于用户的推荐(通过共同口味与偏好找相似邻居用户,K-邻居算法,你朋友喜欢,你也可
能喜欢),
基于项目的推荐(发现物品之间的相似度,推荐类似的物品,你喜欢物品 A,C 与 A 相似,
可能也喜欢 C),
基于模型的推荐(基于样本的用户喜好信息构造一个推荐模型,然后根据实时的用户喜好信
息预测推荐)。
我们看到,此协同过滤算法最大限度的利用用户之间,或物品之间的相似相关性,而后基
于这些信息的基础上实行推荐。下文还会具体介绍此协同过滤。
不过一般实践中,我们通常还是把推荐引擎分两类:
第一类称为协同过滤,即基于相似用户的协同过滤推荐(用户与系统或互联网交互留下的
一切信息、蛛丝马迹,或用户与用户之间千丝万缕的联系),以及基于相似项目的协同过
滤推荐(尽最大可能发现物品间的相似度);
第二类便是基于内容分析的推荐(调查问卷,电子邮件,或者推荐引擎对本 blog 内容的
分析)。
2 协同过滤推荐
协同过滤是利用集体智慧的一个典型方法。要理解什么是协同过滤 (Collaborative Filteri
ng, 简称 CF),首先想一个简单的问题,如果你现在想看个电影,但你不知道具体看哪
部,你会怎么做?大部分的人会问问周围的朋友或者称之为广义上的邻居(neighborhoo
d),看看最近有什么好看的电影推荐,而我们一般更倾向于从口味比较类似的朋友那里得
到推荐。这就是协同过滤的核心思想。如下图,你能从图中看到多少信息?
2.1 协同过滤推荐步骤
做协同过滤推荐,一般要做好以下几个步骤:
1)若要做协同过滤,那么收集用户偏好则成了关键。可以通过用户的行为诸如评分(如
不同的用户对不同的作品有不同的评分,而评分接近则意味着喜好口味相近,便可判定为
相似用户),投票,转发,保存,书签,标记,评论,点击流,页面停留时间,是否购买
等获得。如下面第 2 点所述:所有这些信息都可以数字化,如一个二维矩阵表示出来。
2)收集了用户行为数据之后,我们接下来便要对数据进行减噪与归一化操作(得到一个用
户偏好的二维矩阵,一维是用户列表,另一维是物品列表,值是用户对物品的偏好,一般
是 [0,1] 或者 [-1, 1] 的浮点数值)。
下面再简单介绍下减噪和归一化操作。
所谓减噪:用户行为数据是用户在使用应用过程中产生的,它可能存在大量的噪音和用户
的误操作,我们可以通过经典的数据挖掘算法过滤掉行为数据中的噪音,这样可以是我们
的分析更加精确(类似于网页的去噪处理)。
所谓归一化:将各个行为的数据统一在一个相同的取值范围中,从而使得加权求和得到的
总体喜好更加精确。最简单的归一化处理,便是将各类数据除以此类中的最大值,以保证
归一化后的数据取值在 [0,1] 范围中。至于所谓的加权,很好理解,因为每个人占的权值
剩余135页未读,继续阅读
资源评论
StephenBarrnet
- 粉丝: 3380
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功