基于ODR和BSMOTE结合的不均衡数据SVM分类算法_不均衡数据分类资源-CSDN文库

172 浏览量 2021-01-14 20:46:55 上传评论 1 收藏 241KB PDF 举报

资源推荐

资源详情

资源评论

第 26 卷第 10 期

Vol. 26 No. 10

控制与决策

Control and Decision

2011 年 10 月

Oct. 2011

基于 ODR 和 BSMOTE 结合的不均衡数据 SVM 分类算法

文章编号: 1001-0920 (2011) 10-1535-07

陶新民, 童智靖, 刘玉, 付丹丹

(哈尔滨工程大学信息与通信工程学院，哈尔滨 150001)

摘要: 针对传统的支持向量机 (SVM) 算法在数据不均衡的情况下分类效果不理想的缺陷, 为了提高 SVM 算法在

不均衡数据集下的分类性能, 提出一种新型的逐级优化递减欠采样算法. 该算法去除样本中大量重叠的冗余和噪声

样本, 使得在减少数据的同时保留更多的有用信息, 并且与边界人工少数类过采样算法相结合实现训练样本数据集

的均衡. 实验表明, 该算法不但能有效提高 SVM 算法在不均衡数据中少数类的分类性能, 而且总体分类性能也有所

提高.

关键词: 不均衡数据；支持向量机算法；边界人工少数类过采样算法；逐级优化递减

中图分类号: TP18 文献标识码: A

SVM classiﬁer for unbalanced data based on combination of ODR and

BSMOTE

TAO Xin-min, TONG Zhi-jing, LIU Yu, FU Dan-dan

(College of Information and Communication Engineering，Harbin Engineering University，Harbin 150001，China.

Correspondent：TAO Xin-min，E-mail：[email protected])

Abstract: The classiﬁcation result of classical support vector machine(SVM) algorithm in the case of unbalanced data

set is not satisfactory. In order to improve the SVM algorithm’s classiﬁcation performance under unbalanced data set,

a novel under-sampling algorithm based on optimization of decreasing reduction(ODR) is presented. The algorithm is

applied to under-sample the majority class instances for removal of a large number of overlapping samples of redundant

and noise samples, which consequently makes reservations for the majority class instances with more useful information,

and the ODR under-sampling algorithm is combined with border synthetic minority over-sample technique(BSMOTE) to

achieve a balanced training sample data set. The experimental results show that the proposed method can not only improve

classiﬁcation performance of SVM in the minority class data, but also increase the overall classiﬁcation performance.

Key words: unbalanced data；support vector machine；BSMOTE；optimization of decreasing reduction

1 引引引言言言

支持向量机 (SVM) 是以统计学习理论为基础的

一种新型机器学习方法

[1]

. 它克服了神经网络和传统

分类器过学习、局部极值点和维数灾难等诸多缺点,

具备较强的泛化能力, 目前已成为机器学习领域的一

个新的研究热点.

由于 SVM 方法属于有监督分类算法, 需要数目

相同的不同类别样本进行训练才能获得较好的泛化

能力. 但是, 现实生活中的很多数据样本均是不均衡

的, 例如商业欺诈

[2]

、疾病诊断

[3]

、文本分类

[4]

等数据

集. 针对不均衡数据集进行分类时, 各个类别的样本

数目存在较大的差异, 导致不同类别的样本对于训练

算法提供的信息不对称, 使得利用 SVM 算法处理不

均衡数据时

[5]

, 训练后得到的分类面会向少数类样本

偏移, 从而使 SVM 过度拟合多数类样本点而低估了

少数类样本点, 导致算法错分率增大. 因此, 如何实现

SVM 算法在不均衡数据下的正确分类便成为众多学

者关注的重点.

目前, 提高不均衡数据下 SVM 算法性能的研究

主要集中在算法层面和数据层面. 算法层面的方法是

指对分类算法本身进行操作, 即修改已有的分类算法

或者提出新的算法. 对于已有的算法, 通过调节不同

收稿日期: 2010-05-27；修回日期: 2010-07-26.

基金项目: 国家自然科学基金项目(61074076)；中国博士后科学基金项目(20090450119)；中国博士点新教师基金项目

(20092304120017)；黑龙江省博士后基金项目(LBH-Z08227).

作者简介: 陶新民(1973−), 男, 副教授, 从事智能信号处理、智能计算等研究；童智靖(1986−), 男, 硕士生, 从事模式识

别的研究.

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余6页未读，立即下载

评论收藏

内容反馈

weixin_38631599

粉丝: 9
资源: 944

基于ODR和BSMOTE 结合的不均衡数据SVM分类算法

最新资源

基于ODR和BSMOTE 结合的不均衡数据SVM分类算法

SMOTE结合SVM算法matlab实现

基于ODR和BSMOTE结合的不均衡数据SVM分类算法

基于随机下采样和SMOTE的不均衡SVM分类算法

论文研究-基于BSMOTE和逆转欠抽样的不均衡数据分类算法.pdf

基于谱聚类欠取样的不均衡数据SVM分类算法

不均衡数据下基于SVM的故障检测新算法

STM32 GPIO 配置之ODR, BSRR, BRR 详解

电子诉讼庭审中心主义的程序实现——以借鉴和反思淘宝ODR经验为视角.docx

ODR DSP电脑调音软件

电商平台内部消费争端解决机制(ODR)研究.pdf

【SVM分类】基于蝙蝠算法改进SVM实现数据分类附matlab代码 上传.zip

【SVM分类】基于人工蜂群算法改进SVM实现数据分类matlab源码.md

【SVM预测】基于蝙蝠算法改进SVM实现数据分类.md

ODR-DabMux:ODR-DabMux是DAB（数字音频广播）多路复用器，是ODR-mmbTools的一部分

【精品】智慧医院BI运维决策与CDR临床数据中心建设-杨波.pdf

ODR配置实例[归纳].pdf

MMA845x应用手册AN4071.pdf

ODR-DabMod:ODR-DabMod是DAB（数字音频广播）调制器，是ODR-mmbTools的一部分

关于CRH、CRL、ODR和IDR寄存器的使用总结.zip_crl寄存器_stm32 crl crh_stm32IDR_stm3

道德与 DR 中的“O”相结合-研究论文

在线争议解决（ODR）：从电子商务到其对诉诸司法的概念和实践的转变影响（在线争议解决（Odr）：从电子商务到其对诉诸司法的概念和实践的转变影响）-研究论文

电商平台内部消费争端解决机制(ODR)研究.zip

在线争议解决（ODR）：这是什么，它的前进方向是什么？-研究论文

轨道数据处理软件getorb2.3.2

ICM-42688-P六轴 IMU运动传感器游戏手柄ARVR头显/机器人/运动设备专用

在线纠纷解决机制ODR的构建以B2C电子商务模式下的纠纷解决为视角.pptx

odr:按需路由——一个简单的替代IP

最新资源

【SVM分类】基于蝙蝠算法改进SVM实现数据分类附matlab代码上传.zip