SVM理论与算法分析.pdf资源-CSDN文库

版权申诉

181 浏览量 2023-11-11 22:13:58 上传评论收藏 1.61MB PDF 举报

资源推荐

资源详情

资源评论

硬间隔线性支撑向量机

假设给定一个特征空间上的训练数据集：

T =

{

(

)

，

(

)

， €，

(

)

}

其中，x

• R

, y

•

{

+1,‚1

}

,i = 1,2,€,N, x

为第 i 个特征向量或实例， y

为x

的类标记，当 y

= 1时，称x

为

正例，当 y

= ‚1时，称x

为负例；(x

，y

)为样本点。

假设训练数据集是线性可分的（存在硬间隔），那么学习的目标是在特征空间找到一个分离超平面，能将实

例分到不同的类。分离超平面方程w ƒ x + b = 0，它由法向量 w 和截距 b 决定，可用

(

w,b

)

表示。分离超平面

将特征空间分为两部分，一部分是正类，一部分是负类。法向量指向的一侧为正类，另一侧是负类。

一般地，当训练数据集线性可分时，存在无穷个分离超平面可将两类数据正确分开，感知机利用误分类最小

的策略，求得分离超平面，不过这是的解有无穷多。线性可分支撑向量机利用间隔最大化求最优分离超平面，

解唯一。

一、模型推导

1.函数间隔：一般来说，一个点距离分离超平面的远近可以表示分类预测的确信程度。在超平面w ƒ x + b = 0

确定的情况下，|w ƒ x + b|能够相对地表示（注意：真实距离为

|wƒx+b|

„w„

）点x距离超平面的远近。而w ƒ x + b的

符号与类标记y的符号是否一致能够表示分类是否正确。所以可用标量y

(

w ƒ x + b

)

来表示分类的正确性及确信

度，值为正表示分类正确，值为负表示分类错误。

超平面

(

…,†

)

关于样本点

(‡

，

‰

)

的函数间隔为：

‹

= •

(

Ž ƒ •

+ •

)

超平面

(

…,†

)

关于训练数据集T 的函数间隔：

‹

= ‘Œ’

Œ=“,”,€,•

‹

= ‘Œ’

Œ=“,”,€,•

•

(

Ž ƒ •

+ •

)

2.几何间隔：函数间隔可以表示分类预测的正确性及确信度，但是选择分离超平面时，只有函数间隔还不够。

因为只要成比例地改变 w 和 b，虽然超平面并没有改变，但函数间隔（它是

(

w,b

)

的线性函数）却依原比例同

等改变。为了将

(

w,b

)

表示的超平面的唯一化，即每个超平面对应R

n+1

中的唯一向量

(

w,b

)

，可以对法向量 w

加以规范化约束„ w „= 1，这时函数间隔称为几何间隔。

超平面

(

…,†

)

关于样本点

(‡

，

‰

)

的几何间隔为：

‹

„ Ž „

= •

(

„ Ž „

ƒ •

•

„ Ž „

)

超平面

(

…,†

)

关于训练数据集T 的几何间隔为：

Š = ‘Œ’

Œ=“,”,€,•

= ‘Œ’

Œ=“,”,€,•

•

(

„ Ž „

ƒ •

•

„ Ž „

)

3.间隔最大化

支撑向量机学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。对于线性可分

的训练数据集而言，线性可分分离超平面有无穷多个，每一个都是一个感知机，但是几何间隔最大的分离超

平面时唯一的。

间隔最大化的直观解释是：对训练数据集找到几何间隔最大的超平面意味着以充分大的却新都对训练数据进

行分类。也就是说，不仅将正负实例点要分开，而且对最难分的实例点（离超平面最近的点）也有足够多大

的确信度将它们分开。

因此所要优化的问题表示为：

‘–•

Ž,•

—.˜. •

(

„ Ž „

ƒ •

•

„ Ž „

) ™ Š, Œ = “,”,€,•

改写为，

€•‚

ƒ,„

…

†

‡ ƒ ‡

ˆ.‰. Š

‹

(

ƒŒ‚

‹

+„

)

• …

†,

‹=Ž,•,•,‘

’†的取值不影响最优化问题的解（如果w

“

是最优解，那么”w

“

,”b

“

也是最优解，因此’†是变动的可以取到任

意值，如果固定’†，w

“

也就变得唯一了），令’† = 1,等价变换为，

€•‚

ƒ,„

‡ ƒ ‡

ˆ.‰. Š

‹

(

ƒŒ‚

‹

+„

)

• Ž, ‹ = Ž,•,•,‘

（目标函数是支撑间隔，约束是样本点在间隔边界或外侧，目标是寻找支撑向量使得间隔最大化）等价变换

为（标准无等式约束的凸二次规划，这是为了运算方便），

€‹•

ƒ,„

•

‡ ƒ ‡

•

ˆ.‰. Ž–Š

‹

(

ƒŒ‚

‹

+„

)

— ˜, ‹ = Ž,•,•,‘

凸二次规划问题存在全局最优解w

“

。

（4）分离超平面与分类决策函数

分离超平面:

“

Œ‚+ „

“

= ˜

分类决策函数:

™

(

‚

)

= ˆ‹š•

(

“

Œ‚ +„

“

)

（5）支撑向量与间隔边界

在线性可分情况下，训练数据集的样本点中与分离超平面距离最近的样本点的实例称为支撑向量，支撑向量

是使约束条件等号成立的点，即Ž–Š

‹

(

ƒŒ‚

‹

+„

)

= ˜，对于正例点，支撑向量在超平面ƒŒ‚

‹

+„ = Ž上，对

于负例点，支撑向量在超平面ƒŒ‚

‹

+„ = –Ž上，没有实例点落在这两个平行的超平面（间隔边界）之间，

这两个超平面之间的距离称为间隔，它依赖于分离超平面的法向量 w，等于

•

‡ƒ‡

。

在决定分离超平面时只有支持向量起作用，而其他实例点并不起作用。如果移动支持向量将改变所求的解，

但是如果在间隔边界以外移动其他实例点，甚至去掉这些点，则解是不会改变的。显然支撑向量是训练集中

重要的样本。

二、模型求解

将原始问题转化为 Lagrange 对偶问题，通过求解对偶问题来获得原始问题的最优解：对每个不等式约束引入

Lagrange 乘子›

，

1．Lagrange 对偶函数：

(

ƒ,„,•

)

•

‡ ƒ ‡

•

–ž•

‹

(

ƒŸ‚

‹

+„

)

‘

‹=Ž

+ž•

‹

‘

‹=Ž

其中› =

(

›

,›

,•,›

)

为拉格朗日乘子向量，›

• 0，i= 1,2,•,N。

2.对偶问题：

max

›

min

w,b

(

w,b,›

)

（1）求€‹•

ƒ,„

(

ƒ,„,•

)

(

w,b,›

)

= w–ž›

i=1

= 0

(

w,b,›

)

= –ž›

i=1

= 0

得出

w = ž›

i=1

剩余15页未读，继续阅读

评论收藏

内容反馈

版权申诉

hhappy0123456789

粉丝: 59
资源: 5万+

SVM理论与算法分析.pdf

SVM理论及算法分析.pdf

论文研究-一种基于AdaBoost-SVM的流量分类方法.pdf

论文研究-一种基于预分类的高效SVM中文网页分类器.pdf

论文研究-基于PAC-Bayes边界理论的SVM模型选择方法.pdf

论文研究-运动想象脑电信号特征提取与分类算法研究.pdf

论文研究-支持向量机理论及算法研究综述.pdf

论文研究-基于PSO_SVM_AdaBoost的煤层底板突水预测研究.pdf

论文研究-基于模糊熵特征选择算法的SVM在漏洞分类中的研究.pdf

优质文档 十大经典数据挖掘算法R语言实现 共28页.pdf

大数据算法十大经典算法.pdf

MATLAB神经网络43个案例分析.pdf+源码

论文研究-基于粗糙集的带决策规则边界的邮件过滤算法.pdf

Origin绘制相关性热图插件(Correlation Plot)

（免费）Chrome浏览器插件axure-chrome-extension

vep视频快速加密提取器

noc指导教师资格认证题库

2011-2022年北大数字普惠金融指数数据（包括省市县）.zip

最新版YS9082HC主控开卡工具 YS9082HC-MPToolV8.00.00.18.826-HCS1A25E2023062

糖尿病数据集diabetes.csv（免费）

IEEE 802.11be（WiFi7） 协议原文pdf文档

Mann -kendall突变检验的MATLAB代码

全国统计用区划代码和城乡划分代码(2023版)

Axhub Charts Pro V2.1.1.rplib

青霉素发酵过程仿真数据

数学建模2022国赛C题省一论文

ESRI-Licensing文件夹，安装arcgispro无法破解登录

运动想象Physics-Informed Attention Temporal Convolutional Network源码

EPSON L4263 L4266 L4267 L4268 L4269-ECC打印机清零软件

最新资源

优质文档十大经典数据挖掘算法R语言实现共28页.pdf

IEEE 802.11be（WiFi7）协议原文pdf文档