2017
年
10
月
第
31
卷
第
5
期
装甲兵工程学院学报
Journal of Academy of Armored Force Engineering
Oct. 2017
Vol. 31 No. 5
文
章编号
: 1672-1497( 2017) 05-0086-05
基于支持向量回归的软件缺陷密度预测模型
杨
腾翔
1
,
万 琳
1
,
王
钦钊
2
,
马
振宇
1,3
,
韩
志贺
4
( 1.
陆
军装甲兵学院信息工程系
,
北京
100072; 2.
陆军装甲兵学院控制工程系
,
北京
100072;
3.
陆军装甲兵学院技术保障工程系
,
北京
100072; 4. 31689
部队
,
吉林 四平
136000)
摘 要
:
针对软件缺陷密度的预测问题
,
构建了一种基于支持向量回归
( Support Vector Regression,SVR)
的
软件缺陷
密度预测模型
,
指出影响回归预测精度的主要因素
。
首先
,
对软件度量元数据进行提取
,
利用归一化和随机序列的
方法对缺陷数据进行预处理
,
并将数据分成训练集和测试集进行回归预测
;
然后
,
引入网格搜索的方法对支持向量
回归模型中的参数进行优化
,
大大提高了预测的精度
;
最后
,
通过实验对比其他
5
种机器学习算法
,
验证了预测模
型的有效性
。
关键词
:
支持向量回归
( SVR)
;
网
格搜索
;
软件缺陷密度预测
中图分类号
: TP311. 5
文献标志码
: A DOI: 10. 3969 /j. issn. 1672-1497. 2017. 05. 017
Prediction Model of Software Defect Density Based on
Support Vector Regression
YANG Teng-xiang
1
,WAN Lin
1
,WANG Qin-zhao
2
,MA Zhen-yu
1,3
,HAN Zhi-he
4
( 1. Department of Information Engineering,Army Academy of Armored Forces,Beijing 100072,China;
2. Department of Control Engineering,Army Academy of Armored Forces,Beijing 100072,China;
3. Department of Technical Support Engineering,Army Academy of Armored Forces,Beijing 100072,China;
4. Troop No. 31689 of PLA,Siping 136000,China)
Abstract: In order to predict the software defect density,a prediction model of software defect density
based on Support Vector Regression ( SVR ) is constructed. The main factors that affect SVR prediction
accuracy are data processing and parameter selection . Firstly,the metric metadata of software is extrac-
ted,and the normalization and the random sequences methods are used to preprocess the defect data. The
data is divided into training set and test set for regression prediction. Then the grid search method is used
to optimize the parameters of the SVR model,greatly improving the prediction accuracy. Finally,the va-
lidity of the prediction model is verified by comparing experiments with the other five kinds of machine
learning algorithms.
Keywords: Support Vector Regression ( SVR)
; grid search;
software defect density prediction
收
稿日期
: 2017-06-02
作者简介
:
杨腾翔
( 1993-)
,
男
,
硕
士研究生
。
软件缺陷预测主要用于判别软件中是否包含缺
陷
,
预
测软件中包含缺陷的数量或密度
。
预测过程
属于机器学习的范畴
,
依据不同方法构建预测模型
,
完成软件缺陷的预测工作
。
软件缺陷预测
[1-4]
大
致
可分为静态缺陷预测和动态缺陷预测
,
其中
:
静态缺
陷预测主要是依据软件静态属性预测软件中是否包
含缺陷
;
动态缺陷预测则是为了建立缺陷与相应时
间阶段之间的规则联系
,
记录出现缺陷数量较多的
时间段
。
目前
,
软件缺陷预测模型主要有基于支持
向量机
( Support Vector Machine,SVM)
的预测模型
、
基于神经网络的预测模型
[5]
和
基于
LASSO-SVM
的
预测模型
[6]
等
。
另
外
,
研究者结合数据挖掘算法对
模型的预测效果不断进行了改进
,
如
:
姜慧研等
[7]
提
出了利用蚁群算法对软件缺陷预测模型进行改
评论0