没有合适的资源?快使用搜索试试~ 我知道了~
(项目案例)天猫品牌推荐.docx
需积分: 10 0 下载量 45 浏览量
2021-03-19
11:19:35
上传
评论
收藏 925KB DOCX 举报
温馨提示
试读
39页
大数据
资源推荐
资源详情
资源评论
本项目是基于阿里巴巴天猫电商平台真实脱敏数据的数据分析推荐项目,主要用于
《大数据分析项目实践》课程 ,占用课时 课时,项目中部分模块还应用在《机器学
习》和《 云端开发》课程中。
项目背景:
在天猫,每天会有数千万的用户通过品牌发现自己喜欢的商品,品牌推荐是连接商家
和消费者的最重要的纽带,此外,品牌推荐在大促销活动中更是举足轻重,以 年双
为例,如果大家在双 上买过东西,应该会有印象,无论是在 上还是无限上,会
场的组织形式通常是品牌,而不是单品,因为品牌可以承载更多的信息。通过品牌组织,
实现个性化会场,改变原来千人一面的风格,做到千人千面。帮助消费者从众多品牌中快
速找到自己喜欢的,因此,品牌推荐具有非常切实的业务意义。
什么是推荐系统
利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模
拟销售人员帮助客户完成购买过程。
为什么要有推荐系统
随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能
找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题
中的消费者不断流失。
为了解决这些问题,个性化推荐系统应运而生。个性化推荐系统是建立在海量数据挖掘基
础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策
支持和信息服务。
目的 1:帮助用户找到想要的商品
帮用户找到想要的东西,谈何容易。商品茫茫多,甚至是我们自己,也经常点开淘宝,
面对眼花缭乱的打折活动不知道要买啥。在经济学中,有一个著名理论叫长尾理论(
)。
套用在互联网领域中,指的就是最热的那一小部分资源将得到绝大部分的关注,而剩
下的很大一部分资源却鲜少有人问津。这不仅造成了资源利用上的浪费,也让很多口味偏
小众的用户无法找到自己感兴趣的内容。
目的 2:降低信息过载
互联网时代信息量已然处于爆炸状态,若是将所有内容都展示给用户是不现实的,用户
也无从阅读,信息的利用率将会十分低下。因此我们需要推荐系统来帮助用户过滤掉对于
他来说低价值的信息。
目的 3:提高站点的点击率、转化率
推荐系统能让用户在网站内点击浏览更多的商品和服务,一个好的推荐系统还可以将用
户的访问最大限度的转换为购买行为。
目的 4:为用户画像,提供定制化服务
每当系统成功推荐了一个用户感兴趣的内容后,我们对该用户的兴趣爱好等维度上的形
象是越来越清晰的。当我们能够精确描绘出每个用户的形象之后,就可以为他们定制一系
列服务,让拥有各种需求的用户都能在我们的平台上得到满足。
个性化推荐系统
个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。
个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商
务网站为其顾客购物提供完全个性化的决策支持和信息服务。
个性化推荐系统的实现方法一般有:基于人口统计学的推荐、基于内容的推荐、基于协
同过滤的推荐等。
基于人口统计学的推荐
这是最为简单的一种推荐算法,它只是简单的根据系统用户的基本信息发现用户的相
关程度,然后将相似用户喜爱的其他物品推荐给当前用户。
系统首先会根据用户的属性建模,比如用户的年龄,性别,兴趣等信息。根据这些特
征计算用户间的相似度。比如系统通过计算发现用户 和 比较相似。就会把 喜欢的物
品推荐给 。
优势:
不需要历史数据,没有冷启动问题
不依赖于物品的属性,因此其他领域的问题都可无缝接入。
不足:
算法比较粗糙,效果很难令人满意,只适合简单的推荐
基于内容的推荐
与基于人口统计学的推荐的方法相类似,只不过这次的重心转移到了物品本身。使用
物品本身的相似度而不是用户的相似度。
系统首先对物品(图中举电影的例子)的属性进行建模,图中用类型作为属性。在实
际应用中,只根据类型显然过于粗糙,还需要考虑演员,导演等更多信息。通过相似度计
算,发现电影 和 相似度较高,因为他们都属于爱情类。系统还会发现用户 喜欢电影
,由此得出结论,用户 很可能对电影 也感兴趣。于是将电影 推荐给 。
优势:
对用户兴趣可以很好的建模,并通过对物品属性维度的增加,获得更好的
推荐精度
不足:
物品的属性有限,很难有效的得到更多数据
物品相似度的衡量标准只考虑到了物品本身,有一定的片面性
需要用户的物品的历史数据,有冷启动的问题
基于协同过滤的推荐
协同过滤简单来说是利用某兴趣相投、拥有共同经验之群体的喜好来推荐用户感兴趣
的信息,个人通过合作的机制给予信息相当程度的回应(如评分)并记录下来以达到过滤
的目的进而帮助别人筛选信息,回应不一定局限于特别感兴趣的,特别不感兴趣信息的纪
录也相当重要。
基于用户协同过滤()
基于用户的协同过滤推荐机制和基于人口统计学的推荐机制都是计算用户的相似度,
并基于“邻居”用户群计算推荐,但它们所不同的是如何计算用户的相似度,基于人口统
计学的机制只考虑用户本身的特征,而基于用户的协同过滤机制可是在用户的历史偏好
的数据上计算用户的相似度,它的基本假设是,喜欢类似物品的用户 可能有相同或者相
似的口味和偏好。
基于项目协同过滤( )
基于项目的协同过滤推荐和基于内容的推荐其实都是基于物品相似度预测推荐,
只是相似度计算的方法不一样,前者是从用户历史的偏好推断,而后者是基于物品本
身的属性特征信息。
协同过滤的优势:
它不需要对物品或者用户进行严格的建模,而且不要求物品的描述是机器
可理解的,所以这种方法也是领域无关的。
这种方法计算出来的推荐是开放的,可以共用他人的经验,很好的支持用
户发现潜在的兴趣偏好
推荐个性化、自动化程度高、能够有效的利用其他相似用户的回馈信息、
加快个性化学习的速度。
不足:
方法的核心是基于历史数据,所以对新物品和新用户都有“冷启动”的问题。
推荐的效果依赖于用户历史偏好数据的多少和准确性。
在大部分的实现中,用户历史偏好是用稀疏矩阵进行存储的,而稀疏矩阵
上的计算有些明显的问题,包括可能少部分人的错误偏好会对推荐的准确
度有很大的影响等等。
对于一些特殊品味的用户不能给予很好的推荐。
由于以历史数据为基础,抓取和建模用户的偏好后,很难修改或者根据用
户的使用演变,从而导致这个方法不够灵活。
怎么样才算一个好的推荐系统
好的推荐系统不仅仅能够准确预测用户的行为,而且能够扩展用户的视野,帮助用户发
现那些他们可能会感兴趣,但却不那么容易发现的东西。
同时,推荐系统还要能够帮助商家将那些被埋没在长尾中的好商品介绍给可能会对它
们感兴趣的用户。
评价指标
用户满意度
对于用户行为,可分为显性和隐性之分。若用户购买了推荐的商品,则说明在一定程
度上满意,可用购买率度量。还可用用户反馈界面收集,通过统计两种按钮的单击情况度
量。更一般的情况下,用点击率、用户停留时间和转化率等指标度量。
准确度
描述推荐系统预测用户行为的能力。一般通过离线数据集上算法给出的推荐列表和用
户行为的重合率来计算。重合率越大则准确率越高。
评分预测(即打分):一般用 !"#$(均方根误差)和 "$(平均绝对误差)计算。
!"#$ 加大了对预测不准的用户物品评分的惩罚,对系统的测评更加苛刻。
%& 推荐(即个性化推荐):一般用准确率'%()和召回率'()计算。两
者取值在 和 之间,数值越接近 ,查准率或查全率就越高。准确率和召回率的定义如
下:其中 !'*)表示推荐的列表,'*)表示真实的行为列表,为了全面测评 %& 推荐,一
般会选取不同的推荐列表长度计算出一组准确率和召回率,画出对应的曲线。
剩余38页未读,继续阅读
资源评论
E_N_D123
- 粉丝: 4
- 资源: 7
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功