下载 >  开发技术 >  Java > Lucene+Nutch搜索 光盘源码

Lucene+Nutch搜索 光盘源码 评分:

1.光盘中所附代码的运行环境 操作系统Microsoft Windows 2000/XP及以上 服务器Tomcat 5.5版本 数据库SQL Server 2000以上版本 Java 支持环境JDK 1.6.0版本 2.本书所附光盘范例 代码安装说明:在Eclipse环境下直接选取“import->Existing Project”,导入希望调试的工程。为了测试方便,每个工程保持独立,能够独立编译和运行,部分工程需要引入Lucene相应的Jar包支持。 光盘内文件列表说明: Eclipse工程/LuceneChapter1 说明:本书第一章Eclipse工程文件,测试编程环境的源代码。 文件列表: HelloEclipse.java // Eclipse 测试代码 Eclipse工程/LuceneChapter2 说明:本书第二章Eclipse工程文件,搜索引擎原理简单实现的源代码。 文件列表: infoItem.java // infoItem结构 WebCrawler.java // 自己编写的WebCrawler示例代码 WebHttpClient.java // 自己编写的WebHttpClient示例代码 WebParamCrawler.java // 自己编写的WebParamCrawler示例代码 WebParser.java // 自己编写的网页解析WebParser代码 WebParserFilter.java // 网页解析过滤WebParserFilter代码 WordIndex.java // 索引测试WordIndex代码 Eclipse工程/LuceneChapter3 说明:本书第三章Eclipse工程文件,搜索引擎Lucene Demo实现的源代码。 文件列表: CreateIndex.java // 使用Lucene创建索引Demo代码 DemoTest.java // Lucene测试代码 LuceneSearch.java // Lucene检索测试代码 Eclipse工程/LuceneChapter4 说明:本书第四章测试文件,测试网站examweb页面以及下载列表; 文件列表: multiurls.txt // Nutch下载的Url列表 index.htm // 测试网站网页 more.htm // 测试网站网页 music.htm // 测试网站网页 stillmore.htm // 测试网站网页 zqzs.htm // 测试网站网页 Eclipse工程/LuceneChapter5 说明:本书第五章Eclipse工程文件,搜索引擎Lucene 索引实现和测试的源代码。 文件列表: LuceneIndexDatabase.java // 使用Lucene创建数据库数据索引 LuceneIndexDelete.java // 索引内容删除代码 LuceneIndexDeleteId.java // 按照文档ID删除索引文件代码 LuceneIndexDeleteOptimize.java // 删除后文档编号压缩实例代码 LuceneIndexInteger.java // 数字类型索引代码 LuceneIndexList.java // 索引实例 LuceneIndexLocalDisk.java // 本地磁盘纯文本文件索引 LuceneIndexManager.java // 索引管理实例 LuceneIndexNumber.java // 数字类型数据索引 LuceneIndexParam.java // 索引参数测试 LuceneIndexText.java // 索引纯文本文档 LuceneIndexTypes.java // 索引类型实例 LuceneIndexUnsearch.java // 索引实例实例代码 LuceneIndexUpdate.java // 索引更新实例代码 Eclipse工程/LuceneChapter6 说明:本书第六章Eclipse工程文件,搜索引擎Lucene检索实现的源代码。 文件列表: LuceneRAMSearchText.java // 使用内存索引的代码 LuceneSearchQueryType.java // 各种检索类型演示代码 LuceneSearchSpanQuery.java // SpanQuery检索演示代码 LuceneSearchText.java // 对文本索引检索实例代码 Eclipse工程/LuceneChapter7 说明:本书第七章Eclipse工程文件,搜索引擎查询器实现的源代码。 文件列表: BoostChangeQuery.java // Boost参数的演示实例 BoostFieldQuery.java // 修改文档域Boost参数的检索实例 BoostQuery.java // 修改文档Boost参数的检索实例 LuceneSortExplain.java // 检索评分参数输出测试代码 SortByField.java // 按域排序代码 SortByFieldInverse.java // 检索结果逆向排序代码 SortByMultiFields.java // 多域索引代码 SortDocID.java // 按照文档编号索引 SortExtendSearch.java // 自定义排序扩展检索代码 SortExtendTest.java // 排序扩展测试代码 SortRelavence.java // 排序调整代码 Eclipse工程/LuceneChapter8 说明:本书第八章Eclipse工程文件,搜索引擎分析器实现的源代码。 文件列表: ChineseAnalyzer.java // ChineseAnalyzer代码 ChineseFilter.java // ChineseAnalyzer依赖的过滤器 ChineseTokenizer.java // ChineseAnalyzer依赖的分词器 CJKAnalyzer.java // 使用CJKAnalyzer进行中文分析 CJKTokenizer.java // CJKAnalyzer依赖的内部类 ICTCLASAnalyzer.java // 使用ICTCLASAnalyzer进行中文分析 LuceneChineseAnalyzerText.java //使用ChineseAnalyzer进行中文分析代码 LuceneCJKAnalyzerText.java //使用CJKAnalyzer进行中文分析代码 LuceneDefaultAnalyzerText.java // 默认分析器索引代码 LuceneIKAnalyzerText.java // 使用IKAnalyzer进行中文分析代码 LuceneJEAnalyzerText.java // 使用JEAnalyzer进行中文分析代码 LuceneKeywordAnalyzerText.java // 使用KeywordAnalyzer进行分析 LuceneMIKAnalyzerText.java // 使用MIKAnalyzer进行中文分析代码 LuceneSearchAnalyzer.java // SearchAnalyzer演示代码 LuceneSimpleAnalyzerText.java // SimpleAnalyzer分析演示代码 LuceneStandardAnalyzerText.java // StandardAnalyzer分析演示代码 LuceneStopAnalyzerText.java // StopAnalyzer分析演示代码 LuceneWhitespaceAnalyzerText.java // WhitespaceAnalyzer分析演示代码 Eclipse工程/LuceneChapter9 说明:本书第九章Eclipse工程文件,搜索引擎分析器实现和测试的源代码。 文件列表: ChineseAnalyzer.java // 中文分词演示代码代码 ChineseFilter.java // 一个内部依赖文件中文过滤器代码 ChineseTokenizer.java // 一个内部依赖文件中文切分器代码 DataBaseTool.java // 数据库基础工具代码代码 HtmlParserExtraction.java // HtmlParser提取HTML文件内容代码 HtmlParserGetBaiduUrls.java // HtmlParser获取检索结果页链接代码 HtmlParserGetLexerUrls.java // HtmlParser中使用Lexer获取链接代码 HtmlParserGetPageUrls.java // 获取网页所有链接代码 iTextPDFExtractor.java // 使用iText解析PDF文档代码 PDFBoxHello.java // PDFBox测试代码 PDFBoxLuceneIndex.java // PDFBox创建PDF文件的Lucene索引 PDFBoxPathIndex.java // PDFBox创建指定目录PDF文档索引 POIOfficeExtractor.java // POI处理Excel和Word文档代码 ResultBean.java // 结果集管理类 XercesXMLExtractor.java // 使用Xerces的XML解析 XMLExtractor.java // XML文件内容解析 Eclipse工程/LuceneChapter10 说明:本书第十章Eclipse工程文件,搜索引擎的源代码。 文件列表: MultiSocketClient.java // 多客户端程序 SockClient.java // Socket通信客户端 SockServer.java // Socket通信服务器 SockServer2.java // 带检索功能的Socket通信服务器 DistributedSearch.java // Nutch分布式检索代码 DistributedSearchTest.java // Nutch分布式检索测试代码 Eclipse工程/LuceneChapter11 说明:本书第十一章Eclipse工程文件,Nutch专题搜索引擎实例的源代码。 文件列表: createkeywordstable.sql // 关键词配置数据库 DataBaseTool.java // 数据库运行参数访问工具 RadarSpecialSearchEngine.java // 信息监控搜索 index.jsp // Web首页 resultprocess.jsp // 检索结果处理Web页面 search.jsp // 检索调用结果Web页面 Eclipse工程/LuceneChapter12 说明:本书第十二章Eclipse工程文件,Lucene实现企业搜索实例的源代码。 文件列表: BNVConfig.xml // 系统运行参数配置文件 ConfigClassify.java // 配置文件解析参数组管理 ConfigField.java // 配置文件域访问类 ConfigManager.java // 配置文件管理,组织参数文件 create_luceneinfo.sql // 实例数据库创建脚本 databaseTool.java // 复杂的数据库访问工具 datatool.java // 数据库访问工具 EBNVIndex.java // 负责索引的总体控制和调用 FileDocument.java // 文档类 FileManager.java // 负责文件和内容管理 LuceneIndexLocalDisk.java // 负责本地文档解析加载和索引 SearchResultBean.java // 负责组织检索结果 SearchTool.java // Lucene内容检索类 XMLExtractor.java // XML文档解析类 results.jsp // 搜索web页面
...展开详情收缩
2009-04-28 上传大小:21.94MB
分享
收藏 (4) 举报

评论 共11条

workusual 很多例子,比较全,是完整的光盘,工程可以直接导入eclipse
2014-05-17
回复
u014088102 代码很完整,不过为什么是只读的,不能修改啊T___T
2014-04-24
回复
zhaibl 是完整的光盘,里面的工程可以直接导入eclipse,谢谢楼主!
2014-04-22
回复
coloic 这个资料真心不错,感谢楼主和CSDN给我们这些小虾们的无私帮助
2014-01-11
回复
fanzhang1990 代码很完整,但是部分有些缺失,需要自己查找错误
2013-05-31
回复
b080310 学习 lunche中,很好的参考实例!
2013-05-19
回复
sirnuo eclipse下已经成功运行。 用起来有点复杂。 谢谢。
2013-04-15
回复
yuanxiju 代码很完整,但是部分有些缺失,需要自己查找错误
2012-12-03
回复
xiaoxio006 嗯,代码很全,昨天刚下载了书,现在又有代码,实在是太方便了
2012-08-01
回复
china_squirrel 还不错,都是些工程代码!谢了,就是扣的分有点多!呵呵
2012-03-02
回复
Lucene+Nutch搜索光盘资料

Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料Lucene+Nutch搜索光盘资料

立即下载
Lucene+Nutch搜索源码.part1.rar

Lucene+Nutch搜索源码.part1.rar Lucene+Nutch搜索源码.part2.rar

立即下载
Lucene+Nutch 搜索引擎开发 光盘原码 2

Lucene+Nutch 搜索引擎开发 光盘原码 2

立即下载
lucene+nutch搜索引擎开发原书配套源码

lucene+nutch搜索引擎开发原书配套源码

立即下载
lucene+nutch搜索引擎开发源码2

lucene+nutch搜索引擎开发源码第二部分

立即下载
Lucene+nutch搜索引擎开发》_源码_Ch1-10

Lucene+nutch搜索引擎开发 源码 王学松 人民邮电出版社 1-10

立即下载
Lucene+nutch搜索引擎开发》_源码_Ch11-12

Lucene+nutch搜索引擎开发 源码 王学松 人民邮电出版社 11-12

立即下载
lucene+nutch搜索引擎开发原书配套源码part_1

lucene+nutch搜索引擎开发原书配套源码part_1

立即下载
Lucene+Nutch搜索引擎开发(配套光盘资源)

《Lucene+Nutch搜索引擎开发》配套的光盘资源,有助于搜索引擎Nutch开发学习。

立即下载
lucene+nutch搜索引擎开发原书配套源码part_2

lucene+nutch搜索引擎开发原书配套源码part_2

立即下载
Lucene+Nutch搜索源码.part2.rar

Lucene+Nutch搜索源码.part1.rar rar 货真价实 希望对你有帮助

立即下载
Lucene+Nutch搜索源码

Lucene+nuctch一书的全部源码 测试源码 和几个简单的项目 (Lucene+ Nuctch a book all the source code and test a few simple items)

立即下载
Lucene+Nutch搜索引擎开发

Lucene+Nutch搜索引擎开发

立即下载
lucene+nutch搜索引擎光盘源码(1-8章)

lucene+nutch搜索引擎光盘源码(1-8章),一次上传不了那么多所以分卷了。

立即下载
lucene+nutch搜索引擎开发源码1

lucene+nutch搜索引擎开发一书源码第一部分,因为源码太大,所以分两部分。

立即下载
Lucene+nutch搜索引擎开发

Lucene+nutch搜索引擎开发

立即下载
Lucene+nutch搜索引擎开发 源代码

《Lucene+nutch搜索引擎开发》书附带的源代码

立即下载
Lucene+nutch搜索引擎开发(源代码)

Lucene+nutch搜索引擎开发(源代码),内含本书的PDF电子下载地址。

立即下载
lucene+nutch搜索引擎(12章源码

lucene+nutch搜索引擎(12章源码)

立即下载
lucene+nutch搜索引擎(1-11章源码

lucene+nutch搜索引擎(1-11章源码)

立即下载

热点文章

img

spring mvc+mybatis+mysql+maven+bootstrap 整合实现增删查改简单实例.zip

资源所需积分/C币 当前拥有积分 当前拥有C币
5 0 0
点击完成任务获取下载码
输入下载码
为了良好体验,不建议使用迅雷下载
img

Lucene+Nutch搜索 光盘源码

会员到期时间: 剩余下载个数: 剩余C币: 剩余积分:0
为了良好体验,不建议使用迅雷下载
VIP下载
您今日下载次数已达上限(为了良好下载体验及使用,每位用户24小时之内最多可下载20个资源)

积分不足!

资源所需积分/C币 当前拥有积分
您可以选择
开通VIP
4000万
程序员的必选
600万
绿色安全资源
现在开通
立省522元
或者
购买C币兑换积分 C币抽奖
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
为了良好体验,不建议使用迅雷下载
确认下载
img

资源所需积分/C币 当前拥有积分 当前拥有C币
3 0 0
为了良好体验,不建议使用迅雷下载
VIP和C币套餐优惠
img

资源所需积分/C币 当前拥有积分 当前拥有C币
5 4 45
您的积分不足,将扣除 10 C币
为了良好体验,不建议使用迅雷下载
确认下载
下载
您还未下载过该资源
无法举报自己的资源

兑换成功

你当前的下载分为234开始下载资源
你还不是VIP会员
开通VIP会员权限,免积分下载
立即开通

你下载资源过于频繁,请输入验证码

您因违反CSDN下载频道规则而被锁定帐户,如有疑问,请联络:webmaster@csdn.net!

举报

  • 举报人:
  • 被举报人:
  • *类型:
    • *投诉人姓名:
    • *投诉人联系方式:
    • *版权证明:
  • *详细原因: