奥搜科技有限公司
目录
奥搜科技有限公司............................................................................................................................1
——搜索引擎的研究与实现............................................................................................................1
开发时间:2005 年 4 月...................................................................................................................1
目录....................................................................................................................................................2
摘要....................................................................................................................................................4
第一章 引言.......................................................................................................................................5
第二章 搜索引擎的结构...................................................................................................................6
2.1 系统概述................................................................................................................................6
2.2 搜索引擎的构成....................................................................................................................6
2.2.1 网络机器人.......................................................................................................................6
2.2.2 索引与搜索.......................................................................................................................6
2.2.3 Web 服务器.......................................................................................................................7
2.3 搜索引擎的主要指标及分析................................................................................................7
2.4 小节........................................................................................................................................7
第三章 网络机器人...........................................................................................................................8
3.1 什么是网络机器人................................................................................................................8
3.2 网络机器人的结构分析........................................................................................................8
3.2.1 如何解析 HTML...............................................................................................................8
3.2.2 Spider 程序结构................................................................................................................9
3.2.3 如何构造 Spider 程序.....................................................................................................10
3.2.4 如何提高程序性能.........................................................................................................13
3.2.5 网络机器人的代码分析...................................................................................................14
3.3 小节......................................................................................................................................16
第四章 基于 LUCENE 的索引与搜索..........................................................................................16
4.1 什么是 LUCENE 全文检索...................................................................................................16
第 2 页 共 30 页