没有合适的资源?快使用搜索试试~ 我知道了~
电商系统如何做搜索引擎?1
需积分: 0 0 下载量 69 浏览量
2022-08-03
18:29:01
上传
评论
收藏 979KB PDF 举报
温馨提示
试读
19页
1. 客户端请求通过Load Blance到Blender 2. Blender调用QP,QP调用运营平台,其中运营平台主要负责将日常运营数据 3. Blend
资源详情
资源评论
资源推荐
电
商
系
统
如
何
做
搜
索
引
擎
?
李伟山
作者:李伟山,历任华为,阿里技术专家,米么技术总监,在分布式,大容量高并发等
领域,有一定积累。
来自:米么骚客
0什么搜索引擎?
搜索引擎(search engine)是指根据一定的策略、运用特定的计算机程序搜集
互联网上的信息,在对信息进行组织和处理后,为用户提供检索服务的系
统。数据其实就是一块块的砖头,当用户需要的时候搜索引擎搬过来。我们
的宗旨就是在最短的时间内,让用户找到他们最想要的东西。
1电商系统为什么需要搜索引擎
电
商
搜
索
业
务
特
点
:
第一点,电商系统的商品数量『庞大』,搜索页的PV高。某宝2013年有7亿线
上商品, List的PV7亿+相当于每秒有 8000个请求
第二点,电商的搜索引擎并没有爬虫系统,因为所有的数据都是结构化的,一
般都是Mysql或者 Oracle 的数据库,所以不用像百度一样用『爬虫』去不断去
别的网站找内容,当然,电商其实也有自己的『爬虫』系统,一般都是抓取友商
的价格,再对自己进行调整。
第三点,电商搜索引擎的过滤功能其实比搜索功能要常用,甚至大于搜索本
身。什么是过滤功能?一般我们网站买东西的时候,搜了一个关健词,比如运动
鞋,然后所有相关品牌或者其他分类的选择就会呈现在我们面前。对百度而言,
搜什么词就是什么词,如果是新闻的话,可能在时间上会有一个过滤的选项。
第四点,电商搜索引擎支持各种维度的排序,包括支持人气、销量、信用、价
格、发货地等属性的排序,且对数据的实时性要求非常高。对一般的搜索引擎,
只有非常重要的网站,比如一些重量级的门户网站,百度的收录是非常快的,但
是对那些流量很小的网站,可能一个月才会爬一次。电商搜索对数据的实时性要
求主要体现在价格和库存两个方面。
第五点,电商搜索引擎的效果不仅要考虑买家(信息消费方,结果多样性),
还得考虑卖家(信息提供方,曝光率)。
第六点,电商搜索引擎另一个特点就是不能丢品,比如我们在淘宝、天猫开了
个店铺,然后好不容易搞了一次活动,但是却搜不到了,这是无法忍受的。除此
之外,电商搜索引擎与推荐系统和广告系统是相互融合的,因为搜索引擎对流量
的贡献是最大的,所以大家都希望把广告系统能跟其融合。
第七点, 保证高可用,容灾、异常保护、降级(降级:QPS维度、在Clustermap
上来做,正常来说,我们有20列,如果系统负载高的话查询只分布到10列,这样
就高了1倍的QPS) 。异常保护:Latency 、在Searcher上来做,如果系统负载较
高的话,Searcher上会直接丢弃一些耗时的Query。
剩余18页未读,继续阅读
马虫医生
- 粉丝: 24
- 资源: 324
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0