SVM-KNN.rar_knn_knn_svm_matlabknn_svmknn_svm-knnmatlab

共1个文件

pdf：1个

版权申诉

4 浏览量 2022-09-20 18:12:45 上传评论收藏 47KB RAR 举报

资源详情

资源评论

资源推荐

收起资源包目录

SVM-KNN.rar （1个子文件）

SVM.pdf 63KB

基于统计学习理论的支持向量机算法研究

1 理论背景

基于数据的机器学习是现代智能技术中的重要方面，研究从观测数据（样本）出发寻找

规律，利用这些规律对未来数据或无法观测的数据进行预测。迄今为止，关于机器学习还没

有一种被共同接受的理论框架，关于其实现方法大致可以分为三种

[3]

：

第一种是经典的（参数）统计估计方法。包括模式识别、神经网络等在内，现有机器学

习方法共同的重要理论基础之一是统计学。参数方法正是基于传统统计学的，在这种方法中，

参数的相关形式是已知的，训练样本用来估计参数的值。这种方法有很大的局限性，首先，

它需要已知样本分布形式，这需要花费很大代价，还有，传统统计学研究的是样本数目趋于

无穷大时的渐近理论，现有学习方法也多是基于此假设。但在实际问题中，样本数往往是有

限的，因此一些理论上很优秀的学习方法实际中表现却可能不尽人意。

第二种方法是经验非线性方法，如人工神经网络（ANN）。这种方法利用已知样本建立非

线性模型，克服了传统参数估计方法的困难。但是，这种方法缺乏一种统一的数学理论。

与传统统计学相比，统计学习理论（Statistical Learning Theory 或 SLT）是一种专门研究

小样本情况下机器学习规律的理论。该理论针对小样本统计问题建立了一套新的理论体系，

在这种体系下的统计推理规则不仅考虑了对渐近性能的要求，而且追求在现有有限信息的条

件下得到最优结果。V. Vapnik 等人从六、七十年代开始致力于此方面研究

[1]

，到九十年代中

期，随着其理论的不断发展和成熟，也由于神经网络等学习方法在理论上缺乏实质性进展，

统计学习理论开始受到越来越广泛的重视。

统计学习理论的一个核心概念就是 VC 维(VC Dimension)概念，它是描述函数集或学习机

器的复杂性或者说是学习能力(Capacity of the machine)的一个重要指标，在此概念基础上发展

出了一系列关于统计学习的一致性(Consistency)、收敛速度、推广性能(Generalization

Performance)等的重要结论。

统计学习理论是建立在一套较坚实的理论基础之上的，为解决有限样本学习问题提供了

一个统一的框架。它能将很多现有方法纳入其中，有望帮助解决许多原来难以解决的问题（比

如神经网络结构选择问题、局部极小点问题等）；同时，这一理论基础上发展了一种新的通用

学习方法──支持向量机（Support Vector Machine 或 SVM），已初步表现出很多优于已有方

法的性能。一些学者认为，SLT 和 SVM正在成为继神经网络研究之后新的研究热点，并将推

动机器学习理论和技术有重大的发展。

支持向量机方法是建立在统计学习理论的 VC 维理论和结构风险最小原理基础上的，根

据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度，Accuracy)和学习能力(即

无错误地识别任意样本的能力)之间寻求最佳折衷，以期获得最好的推广能力(Generalizatin

Ability)。支持向量机方法的几个主要优点有：

1. 它是专门针对有限样本情况的，其目标是得到现有信息下的最优解而不仅仅是样本数

趋于无穷大时的最优值；

2. 算法最终将转化成为一个二次型寻优问题，从理论上说，得到的将是全局最优点，解

决了在神经网络方法中无法避免的局部极值问题；

3. 算法将实际问题通过非线性变换转换到高维的特征空间(Feature Space)，在高维空间中

构造线性判别函数来实现原空间中的非线性判别函数，特殊性质能保证机器有较好的

推广能力，同时它巧妙地解决了维数问题，其算法复杂度与样本维数无关；

在 SVM 方法中，只要定义不同的内积函数，就可以实现多项式逼近、贝叶斯分类器、

径向基函数(Radial Basic Function 或 RBF)方法、多层感知器网络等许多现有学习算法。

统计学习理论从七十年代末诞生，到九十年代之前都处在初级研究和理论准备阶段，近

几年才逐渐得到重视，其本身也趋向完善，并产生了支持向量机这一将这种理论付诸实现的

有效的机器学习方法。目前，SVM算法在模式识别、回归估计、概率密度函数估计等方面都

有应用。例如，在模式识别方面，对于手写数字识别、语音识别、人脸图像识别、文章分类

等问题，SVM 算法在精度上已经超过传统的学习算法或与之不相上下。

目前，国际上对这一理论的讨论和进一步研究逐渐广泛，而我国国内尚未在此领域开展

研究，因此我们需要及时学习掌握有关理论，开展有效的研究工作，使我们在这一有着重要

意义的领域中能够尽快赶上国际先进水平。由于 SLT 理论和 SVM 方法尚处在发展阶段，很

多方面尚不完善，比如：许多理论目前还只有理论上的意义，尚不能在实际算法中实现；而

有关 SVM 算法某些理论解释也并非完美（J.C.Burges 在[2]中就曾提到结构风险最小原理并不

能严格证明 SVM 为什么有好的推广能力）；此外，对于一个实际的学习机器的 VC 维的分析

尚没有通用的方法；SVM方法中如何根据具体问题选择适当的内积函数也没有理论依据。因

此，在这方面我们可做的事情是很多的。

2 方法介绍

SVM是从线性可分情况下的最优分类面发展而来的，基本思想可用图 1的两维情况说明。

图中，实心点和空心点代表两类样本，H 为分类线，H

、H

分别为过各类中离分类线最近的

样本且平行于分类线的直线，它们之间的距离叫做分类间隔（margin）。所谓最优分类线就是

要求分类线不但能将两类正确分开（训练错误率为 0），而且使分类间隔最大。分类线方程为

⋅

bwx ，我们可以对它进行归一化，使得对线性可分的样本集 ),(

yx ， ni ,...,1

，

R∈x ，

}1,1{

−

∈

，满足

niby

,,1,01])[( L=≥−+⋅xw (1)

此时分类间隔等于 2/||w||，使间隔最大等价于使||w||

最小。满足条件(1)且使

w 最小的分类

面就叫做最优分类面，H

、H

上的训练样本点就称作支持向量。

利用 Lagrange 优化方法可以把上述最优分类面问题转化为其对偶问题[2]，即：在约束条

件

i i

∑

0, (2a )

和 α

≥ 0 i=1，…n (2b)

下对α

求解下列函数的最大值：

∑∑

⋅−=

jijiji

yyQ

1,1

)(

)( xxαααα (3)

为原问题中与每个约束条件（1）对应的 Lagrange 乘子。这是一个不等式约束下二次函数

寻优的问题，存在唯一解。容易证明，解中将只有一部分（通常是少部分）α

不为零，对应

的样本就是支持向量。解上述问题后得到的最优分类函数是













+⋅=+⋅=

∑

iii

bybf

)(sgn})sgn{()( xxxwx α , (4)

式中的求和实际上只对支持向量进行。b

是分类阈值，可以用任一个支持向量（满足(1)中的

等号）求得，或通过两类中任意一对支

持向量取中值求得。

对非线性问题，可以通过非线性变

换转化为某个高维空间中的线性问题，

在变换空间求最优分类面。这种变换可

能比较复杂，因此这种思路在一般情况

下不易实现。但是注意到，在上面的对

偶问题中，不论是寻优目标函数(3)还是

分类函数(4)都只涉及训练样本之间的

内积运算 )(

xx ⋅ 。设有非线性映射Φ :

→ Η将输入空间的样本映射到高维

(可能是无穷维)的特征空间Η中。当在特征空间 H 中构造最优超平面时，训练算法仅使用空间

中的点积，即Φ(x

)

Φ(x

)，而没有单独的Φ(x

)出现。因此，如果能够找到一个函数 K 使得

K( x

, x

)=Φ(x

)

Φ(x

)，这样，在高维空间实际上只需进行内积运算，而这种内积运算是可以

用原空间中的函数实现的，我们甚至没有必要知道变换Φ的形式。根据泛函的有关理论，只

要一种核函数 K( x

，x

)满足 Mercer 条件，它就对应某一变换空间中的内积。

因此，在最优分类面中采用适当的内积函数 K( x

，x

)就可以实现某一非线性变换后的线

性分类，而计算复杂度却没有增加，此时目标函数(3)变为：

∑∑

−=

jijiji

KyyQ

1,1

),(

)( xxαααα , (5)

而相应的分类函数也变为

)),(sgn()(

bKyf

iii

∑

xxx α

， (6)

这就是支持向量机。

这一特点提供了解决算法可能导致的“维数灾难”问题的方法：在构造判别函数时，不

是对输入空间的样本作非线性变换，然后在特征空间中求解；而是先在输入空间比较向量(例

图 1 最优分类面

评论收藏

内容反馈

版权申诉

JonSco

粉丝: 66
资源: 1万+

SVM-KNN.rar_knn_knn_svm_matlab knn_svm knn_svm-knn matlab

评论0

最新资源

SVM-KNN.rar_knn_knn_svm_matlab knn_svm knn_svm-knn matlab

评论0

svm-knn.rar_KNN-SVM_SVM-KNN_SVM_KNN组合模型_svm knn_组合模型

SVM.rar_SVM-KNN_简单SVM

knn.zip_For Better_Multi SVM_knn_knn matlab_knn svm

matlab.rar_hybrid_hybrid-svm-knn_matlab 均衡器_均衡器_均衡器 设计

论文研究-基于SVM-KNN算法的Web分类研究与实现 .pdf

SVM.rar_LDA KNN_feature reduction_kernel svm_kernel_matrix_lda s

one-all-knn-svm.rar_SVM_python SVM 分类_signm53_svm python_不平衡 分类

knn.zip_ANN_KNN ANN SVM_SVM KNN 识别_knn svm ann_knn 分类器

libsvm-2.81.rar_LibSVM_libSVM kNN_svmlight_分类器

knnsvm.zip_KNN 分类_SVM_SVM 结合_SVM和KNN_knn svm

gabor.rar_Gabor+SVM_gabor knn_gabor滤波_knn gabor_knn滤波

ML.rar_KNN回归_SVM_mostlyehy_svm回归_回归树

Day8-KNN.xmind

论文研究-改进SVM-KNN的不平衡数据分类.pdf

室内定位.zip_KNN实现定位_SVM_svm 室内定位_svm室内定位_室内定位

matlab_SVM_knn_分类算法_源码.zip

论文研究-基于SVM-KNN的半监督托攻击检测方法.pdf

KNN，SVM，决策树，朴素贝叶斯.rar_SVM_python SVM 分类_sklearn 包的基本使用_sklearn分类

冰河的渗透实战笔记-冰河.pdf

大灰狼远控2021最新版，解压密码222

J-LINK V10 V11固件.rar

ISO21434.pdf

Web安全漏洞扫描工具-AWVS14

CTF 竞赛入门指南（ctf-all-in-one）.pdf

Web中间件常见漏洞总结.pdf

stm32f103 adc采样+dma传输+fft处理 频率计_fft处理_stm32_ADCFFT_频率计_ADC采样_

jts-1.14.zip

CobaltStrike4.4.zip

最新资源

matlab.rar_hybrid_hybrid-svm-knn_matlab 均衡器_均衡器_均衡器设计

one-all-knn-svm.rar_SVM_python SVM 分类_signm53_svm python_不平衡分类

stm32f103 adc采样+dma传输+fft处理频率计_fft处理_stm32_ADCFFT_频率计_ADC采样_