目录
Ⅲ
目 录
摘 要 ........................................................................................................................................... I
ABSTRACT ................................................................................................................................ Ⅱ
第一章 绪 论 .............................................................................................................................. 1
1.1 研究工作背景和意义 ....................................................................................................... 1
1.2 机器学习国内外研究历史和现状 ................................................................................... 1
1.3 LTR 研究背景和现状 ........................................................................................................ 2
第二章 机器学习基础 ................................................................................................................ 3
2.1 机器学习基础 ................................................................................................................... 3
2.2 机器学习分类 ................................................................................................................... 3
2.3 机器学习基本原理 ........................................................................................................... 3
第三章 爬虫基础 ........................................................................................................................ 5
3.1 爬虫基本原理 ................................................................................................................... 5
3.2 爬虫搜索策略分类 ........................................................................................................... 5
3.3 爬虫常见问题以及解决办法 ........................................................................................... 6
第四章 搜索引擎基础 ................................................................................................................ 8
4.1 搜索引擎基本原理 ........................................................................................................... 8
4.2 数据爬取 ........................................................................................................................... 8
4.3 文本特征值处理 ............................................................................................................... 8
4.3.1 提取文本 ................................................................................................................. 8
4.3.2 分词 ......................................................................................................................... 9
4.3.3 去停用词 ................................................................................................................. 9
4.3.4 除噪 ......................................................................................................................... 9
4.4 索引 ................................................................................................................................... 9
4.2.1 索引组织方式 ......................................................................................................... 9
4.2.2 建立索引 ............................................................................................................... 11
4.2.3 搜索引擎中的索引 ............................................................................................... 11
4.5 检索模型和搜索排序 ..................................................................................................... 13
4.5.1 初始子集的选取 ................................................................................................... 13
4.5.1 检索模型 ............................................................................................................... 13
4.6 LTR ................................................................................................................................... 15
4.6.1 单文档方法(PointWise) ....................................................................................... 15
4.6.2 文档对方法(PairWise) ......................................................................................... 16