没有合适的资源?快使用搜索试试~ 我知道了~
资源推荐
资源详情
资源评论
开源企业搜索引擎的
应用教程
目 录
概述
企业搜索引擎方案选型
的特性
使用并且进行了扩展
(模式)
查询
核心
缓存
复制
管理接口
服务原理
索引
搜索
源码结构
目录结构说明
说明
的各包的说明
版本说明
版本
版本
分布式和复制 架构
的安装与配置
在下安装
安装准备
安装过程
验证安装
中文分词配置
!"#
多核($#%)配置
$#%的配置方法
为何使用多?
配置文件说明
&
'#"(!(类型)
'#"(字段)
!('#"(复制字段)
"(#'#"(动态字段)
)*#&)
的应用
应用概述
的应用模式
的使用过程说明
一个简单的例子
)设计
构建索引
搜索测试
搜索引擎的规划设计
定义业务模型
定制索引服务
定制搜索服务
搜索引擎配置
)设计+如何定制索引的结构,-
定义好需要的类型('#"(!)
定义好需要的字段('#")
如何进行索引操作?
基本索引操作
新增、更新索引
删除索引
1) 删除制定ID的索引......................................................................................................34
2) 删除查询到的索引数据..............................................................................................34
3) 删除所有索引数据......................................................................................................34
批量索引操作
通过%.文件的方式提交
数据库数据导入生成索引(/0!1"/01)
1) 全量更新索引..............................................................................................................35
2) 增量更新索引..............................................................................................................36
如何进行搜索
搜索语法
查询参数说明
1) 常用..............................................................................................................................37
2) 不常用..........................................................................................................................37
3) 其它..............................................................................................................................37
的检索运算符
查询的一些常用语法
排序
字段增加权重
分词器、过滤器、分析器
高亮使用
2的用法
搜索接口的调用实例
的使用说明
3""#/
/#(""#42
"#/*
创建查询
使用 2创建索引
包的结构说明
%1!5
#6$!4
%#%##
78"""5
的实际应用测试报告
线下压力测试报告
线上环境运行报告
性能调优
/#%#"#
))#"&"*#"
))"*#"
)%*##%#"#
'
'"**
%9%%#"#
%#(缓存命中率)
7&!##9#*'#")
)!##:#%#"#
;!""%#'<("**
=(!%!#
78"""5144
)3$;%#"#(内存方面的考虑)
*$(7
$("25.$
)))'**#((影响内存使用量的因素)
'3=)
出现乱码或者查不到结果的排查方法:
1 概述
企业搜索引擎方案选型
由于搜索引擎功能在门户社区中对提高用户体验有着重在门户社区中涉及大量需要搜索引擎的
功能需求,目前在实现搜索引擎的方案上有集中方案可供选择:
基于 Lucene 自己进行封装实现站内搜索。工作量及扩展性都较大,不采用。
调用 Google、Baidu 的 API 实现站内搜索。同第三方搜索引擎绑定太死,无法满足后
期业务扩展需要,暂时不采用。
基于 Compass+Lucene 实现站内搜索。适合于对数据库驱动的应用数据进行索引,
尤其是替代传统的 来实现对 或 等字段的索引,对于
实现站内搜索是一种值得采纳的方案。但在分布式处理、接口封装上尚需要自己进行一定
程度的封装。
基于 Solr 实现站内搜索。封装及扩展性较好,提供了较为完备的解决方案,因此在门户
社区中采用此方案。
基于以述的几种方案的综合分析,对于我们公司的搜索引擎方案,采用 solr 来实现比较合适。
的特性
是一个开源的搜索服务器,使用 语言开发,主要基于 和
!实现。定制 索引的实现方法很简单,用 "方法向 服务器发送一
个描述所有 #$及其内容的 %& 文档就可以了。定制搜索的时候只需要发送 '(请求
即可,然后对 返回的信息进行重新布局,以产生利于用户理解的页面内容布局。版
本开始支持从数据库(通过 )*+)、,提要、-页面和文件中导入数据,但是不直接支持
从二进制文件格式中提取内容,比如 &".、$)#或其他专有格式。
更重要的是,Solr 创建的索引与 Lucene 搜索引擎库完全兼容。通过对 Solr 进行适当的配
置,某些情况下可能需要进行编码,Solr 可以阅读和使用构建到其他 Lucene 应用程序中的索引。
此外,很多 Lucene 工具(如 Nutch、 Luke)也可以使用 Solr 创建的索引
的特性包括:
高级的全文搜索功能
专为高通量的网络流量进行的优化
基于开放接口(6$ 和 14)的标准
综合的 1$ 管理界面
可伸缩性-能够有效地复制到另外一个 搜索服务器
使用 6$ 配置达到灵活性和适配性
可扩展的插件体系
使用并且进行了扩展
一个真正的拥有动态域+/(#'#"-和唯一键+;#<>(-的数据模式+/-
对 查询语言的强大扩展!
支持对结果进行动态的分组和过滤
高级的,可配置的文本分析
高度可配置和可扩展的缓存机制
性能优化
支持通过 6$ 进行外部配置
拥有一个管理界面
可监控的日志
支持高速增量式更新+'#;!"-和快照发布+!/##8#-
(模式)
定义域类型和文档的域
能够驱动智能处理
声明式的 分析器规范
动态域能够随时增加域
拷贝域功能允许对一个域进行多种方式的索引,或者将多个域联合成一个可搜索的域
显式类型能够减少对域类型的猜测
能够使用外部的基于文件的终止词列表,同义词列表和保护词列表的配置
查询
拥有可配置响应格式(6$?6@2A@4(@8()的 14 接口
高亮的上下文搜索结果
基于域值和显式查询的片段式搜索('")
对查询语言增加了排序规范
常量的打分范围+%#-和前缀式查询-没有 #"*@"@或者 A
因子,对查询匹配的词没有数量限制
函数查询+'#=(-通过关于一个域的数值或顺序的函数对打分进行影响
性能优化
核心
可插拔的查询句柄(=(1")和可扩展的 6$ 数据格式
使用唯一键的域能够增强文档唯一性
能够高效地进行批量更新和删除
用户可配置的文档索引变化触发器(命令)
并发控制的搜索器
能够正确处理数字类型,从而能够进行排序和范围搜索
能够控制缺失排序域的文档
剩余53页未读,继续阅读
资源评论
- snr6202012-11-07基础教程,值得参考~
- cereusxing2015-07-23值得参考的基础教程
詠逺的朋友
- 粉丝: 9
- 资源: 9
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- 基于matlab实现配电网三相潮流计算方法,对几种常用的配电网潮流计算方法进行了对比分析.rar
- 基于matlab实现配电网潮流 经典33节点 前推回代法潮流计算 回代电流 前推电压 带注释.rar
- 基于matlab实现模拟退火遗传算法的车辆调度问题研究,用MATLAB语言加以实现.rar
- 基于matlab实现蒙特卡洛的的移动传感器节点定位算法仿真代码.rar
- 华中数控系统818用户说明书
- 基于matlab实现卡尔曼滤波器完成多传感器数据融合 对多个机器人的不同传感器数据进行融合估计足球精确位置.rar
- 基于matlab实现进行简单车辆识别-车辆检测.rar
- 基于JSP物流信息网的设计与实现
- 基于matlab实现车牌识别程序,和论文,自己做的,做毕业设计的可以看看 .rar
- Windows系统下安装与配置Neo4j的步骤
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功