Elasticsearch学习文档.doc
Elasticsearch 学习文档 Elasticsearch 是一个基于 Lucene 的搜索服务器,提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,是当前流行的企业级搜索引擎。 Elasticsearch 的实现原理主要分为以下几个步骤:首先用户将数据提交到 Elastic Search 数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。 Elasticsearch 是分布式的,这意味着索引可以被分成分片,每个分片可以有 0 个或多个副本。每个节点托管一个或多个分片,并充当协调器将操作委托给正确的分片。再平衡和路由是自动完成的。 Elasticsearch 的功能包括: 1.分布式的搜索引擎和数据分析引擎 2.搜索:网站的站内搜索,IT 系统的检索 3.数据分析:电商网站,统计销售排名前 10 的商家 4.全文检索,结构化检索,数据分析 5.全文检索:我想搜索商品名称包含某个关键字的商品 6.结构化检索:我想搜索商品分类为日化用品的商品都有哪些 7.数据分析:我们分析每一个商品分类下有多少个商品 8.对海量数据进行近实时的处理 9.分布式:ES 自动可以将海量数据分散到多台服务器上去存储和检索 10.海联数据的处理:分布式以后,就可以采用大量的服务器去存储和检索据,自然而然就可以实现海量数据的处理了 11.近实时:检索数据要花费 1 小时(这就不要近实时,离线批处理,batch processing) Elasticsearch 的应用场景包括: 1.站内搜索:主要和 Solr 竞争,属于后起之秀 2.NoSQL Json 文档数据库:主要抢占 Mongo 的市场,它在读写性能上优于 Mongo ,同时也支持地理位置查询,还方便地理位置和文本混合查询。 3.监控:统计、日志类时间序的数据存储和分析、可视化,这方面是引领者 4.国外:Wikipedia(维基百科)使用 ES 提供全文搜索并高亮关键字、StackOverflow(IT 问答网站)结合全文搜索与地理位置查询、Github 使用 Elasticsearch 检索 1300 亿行的代码 5.国内:百度(在云分析、网盟、预测、文库、钱包、风控等业务上都应用了 ES,单集群每天导入 30TB+数据,总共每天 60TB+)、新浪 、阿里巴巴、腾讯等公司均有对 ES的使用 Elasticsearch 是与名为 Logstash 的数据收集和日志解析引擎以及名为 Kibana 的分析和可视化平台一起开发的。这三个产品被设计成一个集成解决方案,称为“Elastic Stack”(以前称为“ELK stack”)。
















剩余63页未读,继续阅读


- 粉丝: 0
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


最新资源
- 有效的品牌管理国讯通信集团品牌理念及输出(1).ppt
- 电子商务物流配送系统分析与设计(1).doc
- AutoCAD第04讲-使用AutoCAD绘制直线市公开课特等奖市赛课微课一等奖课件(1).pptx
- 第二章2联合站自动化(1).pptx
- 2023年安徽省2级c语言水平考试试卷(1).doc
- 香料公司信息化管理讲座(1).pptx
- 医院门诊一卡通收费信息化发展研究(1).docx
- 计算机图像识别技术的发展现状与趋势(1).docx
- 互联网+背景下物业管理的问题研究(1).docx
- 基于51单片机控制的自动停泊小车的设计与实现毕业设计论文(2)(1).doc
- windows通过bat调用fffmpeg转换MP4->MP3
- Git commit写得烂?这套提交规范我收藏了三年.doc
- Spring Boot与Docker镜像构建实战,从本地跑通到云部署.doc
- 前端跨域彻底搞懂:CORS原理 + Nginx代理配置实战.doc
- 别再用if-else写逻辑了!策略模式实战+线上案例.doc


