V
3.1.1 邮件信头关键字段提取 .............................................................................. 21
3.1.2 邮件信体内容分解 ...................................................................................... 21
3.1.3 信体内容解码 .............................................................................................. 22
3.2 向量空间模型 ........................................................................................................... 23
3.2.1 基本概念 ...................................................................................................... 23
3.2.2 项的确定 ...................................................................................................... 23
3.2.3 项的权重 ...................................................................................................... 25
3.3 特征项选择 ................................................................................................................ 26
3.4 小结 ........................................................................................................................... 28
第四章 支持向量机理论 ........................................................................................................ 29
4.1 统计学习理论 ............................................................................................................ 29
4.1.1 经验风险 ...................................................................................................... 29
4.1.2 复杂性与推广能力 ...................................................................................... 30
4.1.3 VC 维 ............................................................................................................. 30
4.1.4 结构风险最小化 .......................................................................................... 30
4.2 支持向量机 ............................................................................................................... 33
4.2.1 最优分类面 ................................................................................................... 33
4.2.2 支持向量机 .................................................................................................. 36
4.2.3 核函数 .......................................................................................................... 37
4.3 支持向量对偶寻优算法 ........................................................................................... 38
4.3.1 块算法(chunking algorithm )............................................................. 38
4.3.2 固定工作集方法 .......................................................................................... 38
4.3.3 SMO(Sequential Minimal Optimization )方法 ................................. 39
4.4 小结 ........................................................................................................................... 39
第五章 支持向量机算法在邮件过滤中的应用..................................................................... 40
5.1 基于支持向量机的邮件过滤算法............................................................................ 40
5.2 实验与性能分析 ....................................................................................................... 41
5.2.1 性能评价准则 .............................................................................................. 41
5.2.2 训练集与测试集的选择 .............................................................................. 41
5.2.3 实验分析与说明 .......................................................................................... 42
5.3 小结 ........................................................................................................................... 46