没有合适的资源?快使用搜索试试~ 我知道了~
从零开始用 python 搭建推荐引擎1
需积分: 0 2 下载量 157 浏览量
2022-08-03
18:37:48
上传
评论
收藏 1.26MB PDF 举报
温馨提示
试读
45页
简介当今社会的每个人都面临着各种各样的选择。例如,如果我漫无目的想找一本书读,那么关于我如何搜索就会出现很多可能。这样一来,我可能会浪费很多时间在网上浏览,并且
资源详情
资源评论
资源推荐
从零开始用python搭建推荐引擎
数据派
(给Python开发者加星标,提升Python技能)
作者:PulkitSharma;翻译:申利彬,付宇帅
简介
当今社会的每个人都面临着各种各样的选择。例如,如果我漫无目的想找一本书读,
那么关于我如何搜索就会出现很多可能。这样一来,我可能会浪费很多时间在网上浏
览,并且在各种各样的网站上搜寻,希望能找到有价值的书籍。这个时候我可能寻找
别人的推荐。
如果有一家网站或者手机应用可以基于我以前阅读的书籍向我推荐新的书籍,那对我
肯定有很大的帮助。这时我会有如下愉快的体验,登录网站,就可以看到符合我兴趣
的10本书籍,不用浪费时间在网站上搜寻。
这就是推荐引擎所做的事情,它们的力量现在正被大多数企业所使用。从亚马逊到
Netflix,谷歌到谷歌阅读,推荐引擎是机器学习技术中最广泛的应用之一。
在本文中,将介绍各种推荐引擎算法以及使用Python构建它们的基本框架。我们还将
讨论这些算法工作背后的数学原理,最后使用矩阵分解技术创建属于我们自己的推荐
引擎。
1什么是推荐引擎?
一直到现在,人们也会倾向于买朋友或者信任的人推荐商品。当对某个商品有任何疑
问时,人们往往会采用这种方式。但是随着数字时代的到来,这个圈子已经扩展到包
括使用某种推荐引擎的在线网站。
一个推荐引擎使用不同的算法过滤数据,并向用户推荐最相关的物品。它首先存储客
户过去的行为数据,然后基于这些数据向客户推荐他们可能购买的物品。
如果一个全新的用户访问一个电子商务网站,网站没有该用户的任何历史数据。那么
在这样的场景中,网站是如何向用户推荐产品呢?一种可能的方法是向客户推荐卖的
最好的商品,也就是该商品需求量很大。还有另外一种可能的方法是向用户推荐可以
给网站带来最大利润的商品。
如果我们可以根据用户的需要和兴趣向用户推荐一些商品,这可以对用户体验产生积
极的影响,最后可以达到多次访问的效果。因此,现在的企业通过研究用户过去的行
为数据来构建聪明和智能的推荐引擎。
目前我们对推荐引擎有了直观的认识,现在让我们来看看它们是如何工作的。
2推荐引擎是如何工作的?
在深入探讨这个主题之前,我们首先考虑一下如何向用户推荐商品:
我们可以向一个用户推荐最受欢迎的商品
可以根据用户偏好(用户特征)把用户分为多个细分类别,然后基于他们
属于的类别推荐商品。
上述两种方法都有缺点。在第一种方法中,对于每一个用户来说最受欢迎的商品都是
相同的,所以用户看到的推荐也是相同的。在第二种方法中,随着用户数量的增加,
用户特征也随着增加。因此将用户划分为多个类别将会是一件非常困难的任务。
这里的主要问题是我们无法为用户具体的兴趣定制推荐。这就像亚马逊建议你买一台
笔记本电脑,仅仅是因为它被大多数购物者购买。但幸运的是,亚马逊(或其他大公
司)并没有使用上述方法来推荐商品。他们使用一些个性化的方法来帮助他们更准确
地推荐产品。
我们现在来看看推荐引擎是如何通过以下步骤来工作的。
2.1数据收集
收集数据是构建推荐引擎的第一步也是最关键的一步。可以通过两种方式收集数据:
显式和隐式。显示数据是用户有意提供的信息,比如电影排名,相反隐氏数据则不是
用户主动提供,而是从数据流中收集得到的信息,例如搜索历史、点击率、历史订单
等。
在上面的图片中,Netflix正在以用户对不同电影的评分形式明确地收集数据。
上图可以看到Amazon记录的用户历史订单,这是一个隐式数据收集模式的例子。
2.2数据存储
数据量决定了模型的建议有多好,例如,在电影推荐系统中,用户对电影的评价越
多,推荐给其他用户的效果就越好。数据类型对采用何种存储类型有很重要的影响,
这种类型的存储可以包括一个标准的SQL数据库、NoSQL数据库或某种类型的对象存
储。
2.3数据过滤
在收集和存储数据之后,我们必须对其进行过滤,以便提取出最终推荐所需的相关信
息。
剩余44页未读,继续阅读
狼You
- 粉丝: 23
- 资源: 324
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0