没有合适的资源?快使用搜索试试~ 我知道了~
Lucene入门与使用.pdf
4星 · 超过85%的资源 需积分: 10 18 下载量 91 浏览量
2011-09-24
09:53:42
上传
评论
收藏 160KB PDF 举报
温馨提示
试读
7页
Lucene入门与使用 简单入门教程 lucene的检索算法属于索引检索,即用空间来换取时间,对需要检索的文件、字符流进行全文索引,在检索的时候对索引进行快速的检索,得到检索位置,这个位置记录检索词出现的文件路径或者某个关键词。 在使用数据库的项目中,不使用数据库进行检索的原因主要是:数据库在非精确查询的时候使用查询语言“like %keyword%”,对数据库进行查询是对所有记录遍历,并对字段进行“%keyword%”匹配,在数据库的数据庞大以及某个字段存储的数据量庞大的时候,这种遍历是致命的,它需要对所有的记录进行匹配查询。因此,lucene主要适用于文档集的全文检索,以及海量数据库的模糊检索,特别是对数据库的 xml或者大数据的字符类型。
资源推荐
资源详情
资源评论
Lucene 入门与使用
文章出处:
http://www.diybl.com/course/3_program/java/javashl/2008222/100408.html
本文主要面向具体使用,适用于已熟悉 java 编程的 lucene 初学者。
1. Lucene 的简介
1.1 Lucene 历史
org.apache.lucene 包是纯 java 语言的全文索引检索工具包。
Lucene 的作者是资深的全文索引/检索专家,最开始发布在他本人的主页上,
2001 年 10 月贡献给 APACHE,成为 APACHE 基金 jakarta 的一个子项目。
目前,lucene 广泛用于全文索引/检索的项目中。
lucene 也被翻译成 C#版本,目前发展为 Lucene.Net(不过最近好象有流产的
消息)。
1.2 Lucene 原理
lucene 的检索算法属于索引检索,即用空间来换取时间,对需要检索的文件、
字符流进行全文索引,在检索的时候对索引进行快速的检索,得到检索位置,这
个位置记录检索词出现的文件路径或者某个关键词。
在使用数据库的项目中,不使用数据库进行检索的原因主要是:数据库在非
精确查询的时候使用查询语言“like %keyword%”,对数据库进行查询是对所有
记录遍历,并对字段进行“%keyword%”匹配,在数据库的数据庞大以及某个
字段存储的数据量庞大的 时候,这种遍历是致命的,它需要对所有的记录进行
匹配查询。因此,lucene 主要适用于文档集的全文检索,以及海量数据库的模糊
检索,特别是对数据库的 xml 或者大数据的字符类型。
2.Lucene 的下载和配置
2.1 Lucene 的下载
lucene在jakarta项目中的发布主页:
http://jakarta.apache.org/lucene/docs/index.html。
以下主要针对 windows 用户,其它用户请在上面的地址中查找相关下载。
lucene 的.jar 包的下载(包括.jar 和一个范例 demo):
资源评论
- qjtimes20092011-10-12内容还行,就是太旧了,Lucene的版本现在都更新到3.4.0了.
- liang_huan2011-10-31资源老了点!可以的话麻烦上传新版本的!
暴击时刻
- 粉丝: 0
- 资源: 5
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功