SVM 分类器
1.1 题目的主要研究内容
(1)①分类器的原理和算法流程;②利用现有的任意公开数据集实现分类
器分类,并利用某种评价标准对分类结果进行分析评判。
(2)组内负责工作:查阅资料,包括 SVM 分类器的概念、工作原理以及
算法流程等,并且进行手动推演 SVM 公式。
1.2 题目研究的工作基础或实验条件
(1)硬件环境:Windows
(2)软件环境:Python;Matlab
1.3 设计思想
通过查阅资料,学习了 SVM 分类器的原理和算法流程,并手动推演公式。
之后利用现有的数据集在 Python 和 Matlab 中分别进行上机实现分类器分类,最
后针对分类结果进行分析评判。
(1)SVM 分类器概念
支持向量机(Support Vector Machine, SVM)是一类按有监督学习方式对数
据进行二元分类的广义线性分类器,其决策边界是对样本求解的最大边距超平面。
在几何中,超平面是一个空间的子空间,它是维度比所在空间小一维的空间。
如果数据空间本身是三维的,则其超平面是二维平面,而如果数据空间本身是二
维的,则其超平面是一维的直线。在二分类问题中,如果一个超平面能够将数据
划分为两个集合,其中每个集合中包含单独的一个类别,我们就说这个超平面是
数据的“决策边界”。
支持向量机的主要目标是得到一条能用于分组的最佳分界线。为了找出最佳
分界线,首先需要从一组中找出距离另一组最近的外围数据点,然后在两组的外
围数据点之间画出最佳分界线。由于这些外围数据点在寻找最佳分界线的过程中
起了支持作用,因此它们叫作支持向量。
支持向量机就是要使超平面和支持向量之间的间隔尽可能的大,这样超平面