没有合适的资源?快使用搜索试试~ 我知道了~
Solr 教程 pdf
3星 · 超过75%的资源 需积分: 16 68 下载量 54 浏览量
2017-04-11
18:42:15
上传
评论
收藏 975KB PDF 举报
温馨提示
试读
96页
solr教程、由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引 擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择:
资源推荐
资源详情
资源评论
目录
1 概述 ......................................................................................................................................... 4
1.1 企业搜索引擎方案选型 ............................................................................................. 4
1.2 Solr 的特性 ................................................................................................................. 4
1.2.1 Solr 使用 Lucene 并且进行了扩展 ............................................................... 5
1.2.2 Schema(模式) ............................................................................................ 6
1.2.3 查询 ................................................................................................................... 6
1.2.4 核心 ................................................................................................................... 6
1.2.5 缓存 ................................................................................................................... 7
1.2.6 复制 ................................................................................................................... 7
1.2.7 管理接口 ........................................................................................................... 7
1.3 Solr 服务原理 .............................................................................................................. 8
1.3.1 索引 ................................................................................................................... 8
1.3.2 搜索 ................................................................................................................... 10
1.4 源码结构 ................................................................................................................... 12
1.4.1 目录结构说明 ................................................................................................. 12
1.4.2 Solr home 说明 .............................................................................................. 14
1.4.3 solr 的各包的说明 ......................................................................................... 16
1.5 版本说明 ................................................................................................................... 18
1.5.1 1.3 版本 ........................................................................................................... 18
1.5.2 1.4 版本 ........................................................................................................... 18
1.6 分布式和复制 Solr 架构 ......................................................................................... 18
2 Solr 的安装与配置 .............................................................................................................. 19
2.1 在 Tomcat 下 Solr 安装 .......................................................................................... 19
2.1.1 安装准备 ......................................................................................................... 19
2.1.2 安装过程 ......................................................................................................... 20
2.1.3 验证安装 ......................................................................................................... 21
2.2 中文分词配置 ........................................................................................................... 22
2.2.1 mmseg4j ........................................................................................................ 22
2.2.2 paoding .......................................................................................................... 28
2.3 多核(MultiCore)配置 ......................................................................................... 32
2.3.1 MultiCore 的配置方法 .................................................................................. 33
2.3.2 为何使用多 core ? ....................................................................................... 35
2.4 配置文件说明 ........................................................................................................... 35
2.4.1 schema.xml .................................................................................................. 36
2.4.2 solrconfig.xml ............................................................................................... 39
3 Solr 的应用 .......................................................................................................................... 46
3.1 SOLR 应用概述 ....................................................................................................... 46
3.1.1 Solr 的应用模式 ............................................................................................. 46
3.1.2 SOLR 的使用过程说明 ................................................................................. 47
3.2 一个简单的例子 ....................................................................................................... 48
3.2.1 Solr Schema 设计 ........................................................................................ 48
3.2.2 构建索引 ......................................................................................................... 48
3.2.3 搜索测试 ......................................................................................................... 49
3.3 搜索引擎的规划设计 ............................................................................................... 49
3.3.1 定义业务模型 ................................................................................................... 49
3.3.2 定制索引服务 ................................................................................................... 51
3.3.3 定制搜索服务 ................................................................................................... 52
3.4 搜索引擎配置 ........................................................................................................... 52
3.4.1 Solr Schema 设计(如何定制索引的结构?) ............................................... 52
3.5 如何进行索引操作? ............................................................................................... 56
3.5.1 基本索引操作 ................................................................................................. 56
3.5.2 批量索引操作 ................................................................................................. 58
3.6 如何进行搜索 ........................................................................................................... 62
3.6.1 搜索语法 ......................................................................................................... 62
3.6.2 排序 ................................................................................................................. 68
3.6.3 字段增加权重 ................................................................................................. 68
3.6.4 Solr 分词器、过滤器、分析器 ..................................................................... 69
3.6.5 Solr 高亮使用 ................................................................................................. 76
4 SolrJ 的用法 ........................................................................................................................ 77
4.1 搜索接口的调用实例 ............................................................................................... 77
4.2 Solrj 的使用说明 ...................................................................................................... 80
4.2.1 Adding Data to Solr .................................................................................... 80
4.2.2 Directly adding POJOs to Solr ................................................................ 82
4.2.3 Reading Data from Solr ............................................................................. 85
4.3 创建查询 ................................................................................................................... 86
4.4 使用 SolrJ 创建索引 ................................................................................................ 86
4.5 Solrj 包的结构说明 .................................................................................................. 87
4.5.1 CommonsHttpSolrServer .......................................................................... 87
4.5.2 Setting XMLResponseParser ................................................................... 88
4.5.3 Changing other Connection Settings .................................................... 88
4.5.4 EmbeddedSolrServer ..................................................................................... 89
5 Solr 的实际应用测试报告 .................................................................................................. 89
5.1 线下压力测试报告 ................................................................................................... 89
5.2 线上环境运行报告 ................................................................................................... 90
6 solr 性能调优 ........................................................................................................................ 90
6.1 Schema Design Considerations ........................................................................... 90
6.1.1 indexedfields ............................................................................................. 90
6.1.2 storedfields ................................................................................................ 91
6.2 ConfigurationConsiderations .............................................................................. 91
6.2.1 mergeFactor .................................................................................................. 91
6.2.2 mergeFactor Tradeoffs ............................................................................... 92
6.3 Cache autoWarm Count Considerations ........................................................... 92
6.4 Cache hit rate(缓存命中率) ................................................................................ 92
6.5 Explicit Warming of Sort Fields ............................................................................ 92
6.6 OptimizationConsiderations ................................................................................ 93
6.7 Updates and Commit Frequency Tradeoffs ...................................................... 93
6.8 Query Response Compression ............................................................................ 94
6.9 Embedded vs HTTP Post ....................................................................................... 95
6.10 RAM UsageConsiderations(内存方面的考虑)................................................ 95
6.10.1 OutOfMemoryErrors ..................................................................................... 95
6.10.2 Memory allocated to the Java VM ............................................................. 95
7 FAQ ...................................................................................................................................... 96
7.1 出现乱码或者查不到结果的排查方法:................................................................ 96
1 概述
1.1 企业搜索引擎方案选型
由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引
擎的功能需求,目前在实现搜索引擎的方案上有集中方案可供选择:
1) 基于 Lucene 自己进行封装实现站内搜索。工作量及扩展性都较大,不采用。
2) 调用 Google、Baidu 的 API 实现站内搜索。同第三方搜索引擎绑定太死,无法满足后
期业务扩展需要,暂时不采用。
3) 基于 Compass+Lucene 实现站内搜索。适合于对数据库驱动的应用数据进行索引,
尤其是替代传统的 like‘%expression%’来实现对 varchar 或 clob 等字段的索引,对于实现站
内搜索是一种值得采纳的方案。但在分布式处理、接口封装上尚需要自己进行一定程度的封
装。
4) 基于 Solr 实现站内搜索。封装及扩展性较好,提供了较为完备的解决方案,因此在门
户社区中采用此方案。
基于以述的几种方案的综合分析,对于我们公司的搜索引擎方案,采用 solr 来实现比较合
适。
1.2 Solr 的特性
ApacheSolr 是一个开源的搜索服务器,Solr 使用 Java 语言开发,主要基于 HTTP 和
Apache Lucene 实现。定制 Solr 索引的实现方法很简单,用 POST 方法向 Solr 服务器发
送一个描述所有 Field 及其内容的 XML 文档就可以了。定制搜索的时候只需要发
送 HTTPGET 请求即可,然后对 Solr 返回的信息进行重新布局,以产生利于用户理解的页
面内容布局。Solr1.3 版本开始支持从数据库(通过 JDBC)、RSS 提要、Web 页面和文件
中导入数据,但是不直接支持从二进制文件格式中提取内容,比如 MSOffice、AdobePDF
或其他专有格式。
更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配
置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的
索引。此外,很多 Lucene 工具(如 Nutch、Luke)也可以使用 Solr 创建的索引
Solr 的特性包括:
ü 高级的全文搜索功能
ü 专为高通量的网络流量进行的优化
ü 基于开放接口(XML 和 HTTP)的标准
ü 综合的 HTML 管理界面
ü 可伸缩性-能够有效地复制到另外一个 Solr 搜索服务器
ü 使用 XML 配置达到灵活性和适配性
ü 可扩展的插件体系
1.2.1 Solr 使用 Lucene 并且进行了扩展
ü 一个真正的拥有动态域(DynamicField)和唯一键(UniqueKey)的数据模式(DataSchema)
ü 对 Lucene 查询语言的强大扩展!
ü 支持对结果进行动态的分组和过滤
ü 高级的,可配置的文本分析
ü 高度可配置和可扩展的缓存机制
ü 性能优化
ü 支持通过 XML 进行外部配置
ü 拥有一个管理界面
ü 可监控的日志
剩余95页未读,继续阅读
资源评论
- 攻城狮joe2017-11-21只有部分啊!!!
- Blues_0072017-09-02正好需要。
AndyChen陈郑游
- 粉丝: 275
- 资源: 25
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 永宏PLC例程源码东芝350T压铸机PLC程序
- Visual Basic语言教程.docx
- 永宏PLC例程源码18层永宏电梯程序
- Scratch语言教程.docx
- (资源包名是松下不必介意实际是台达)台达PLC例程源码自制收线架台达PLC程序(有注释)与威沦触摸屏程序
- Rust语言教程.docx
- (资源包名是松下不必介意实际是台达)台达PLC例程源码用台达PLC485通信控制11台英威腾变频启动停止速度设定
- (资源包名是松下不必介意实际是台达)台达PLC例程源码用台达EH2-40PLC两台控制5台台达ASDA-B伺服,天任文本作对话的
- (资源包名是松下不必介意实际是台达)台达PLC例程源码液压切块机程序
- (资源包名是松下不必介意实际是台达)台达PLC例程源码压瓦机
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功