目 录
1 背景与意义.............................................................................................................................1
1.1 研究背景.......................................................................................................................1
1.2 国内外研究现状...........................................................................................................1
1.3 研究的目的和意义.......................................................................................................2
1.4 本文研究的主要内容...................................................................................................2
2 需求分析.................................................................................................................................3
2.1 可行性分析...................................................................................................................3
2.2 搜索引擎工作原理.......................................................................................................4
2.3 Nutch 相关技术与机制分析.........................................................................................6
2.3.1 Nutch 技术基础...................................................................................................6
2.3.2 Nutch 体系结构...................................................................................................6
2.3.3 Nutch 工作流程...................................................................................................7
2.4 基于 Nutch 的搜索引擎的需求分析...........................................................................8
2.4.1 系统总体目标.....................................................................................................8
2.4.2 系统功能目标.....................................................................................................8
2.4.3 系统结构分析.....................................................................................................9
2.4.4 系统性能要求.....................................................................................................9
3 系统设计...............................................................................................................................10
3.1 系统总体架构设计.....................................................................................................10
3.2 数据获取.....................................................................................................................11
3.3 信息索引.....................................................................................................................13
3.3.1 索引基本结构...................................................................................................13
3.3.2 本系统的索引...................................................................................................14
3.4 查询处理.....................................................................................................................15
3.4.1 信息查询原理...................................................................................................15
3.4.2 本系统的查询...................................................................................................16
3.4.3 中文分词技术...................................................................................................16
3.5 结果排序.....................................................................................................................18
3.5.1 Nutch 排序机制研究.........................................................................................18
3.5.2 排序修改方法设计...........................................................................................19
4 编码与实现...........................................................................................................................20
4.1 开发环境.....................................................................................................................20