没有合适的资源?快使用搜索试试~ 我知道了~
增加度量元的迁移学习跨项目软件缺陷预测_娄丰鹏1
需积分: 0 0 下载量 39 浏览量
2022-08-03
19:58:08
上传
评论
收藏 2.09MB PDF 举报
温馨提示
试读
5页
网络出版地址: http: / /kns.cnki.net/kcms/detail/61.1450.TP.20180307.1427.052.html增加度量元
资源详情
资源评论
资源推荐
收稿日期
: 2017
-
08
-
12
修回日期
: 2017
-
12
-
28
网络出版时间
: 2018
-
03
-
07
基金项目
:
国家自然科学基金
( 61272273)
作者简介
:
娄丰鹏
( 1991
-
) ,
女
,
研究生
,
研究方向为信息安全
、
机器学习与数据挖掘
;
荆晓远
,
教授
,
博导
,
研究方向为模式识别
、
图像与信号处
理
、
信息安全
、
机器学习与数据挖掘
。
网络出版地址
: http: / / kns.cnki.net /kcms/detail /61.1450.TP.20180307. 1427.052.html
增加度量元的迁移学习跨项目软件缺陷预测
娄丰鹏
1
,
吴 迪
2
,
荆晓远
3
,
吴 飞
3
( 1.
南京邮电大学 计算机学院
,
江苏 南京
210003;
2.
武汉大学 计算机学院 软件工程国家 重点实验 室
,
湖北 武汉
430072;
3.
南京邮电大学 自动化学院
,
江苏 南京
210003)
摘 要
:
目前
,
结合机器学习方法和 软件 缺陷 预测技术自动地学习模型来发现软件中的缺陷
,
已经成为跨项目缺陷预测的
主要方法
。
由于源项目和目标项目之间的特征分布差异
,
跨项目相关性预测的表现通常较差
。
针对该问题
,
可以使用从
源项目中提取知识并 将其转移到目标项目的转移学习技术来提高预测性能
,
并提出了一种增加度量元的迁移学习方法进
行跨项目的软件缺陷预测
。
该方法首先使用分类 器对数据集进行一次项目内预测
,
并将预测结果作为新的度量元加入数
据集
。
然后采用迁移学习方 法将源项目中提取的知识转移至目标项目
,
并使用分类器预测目标项目
。
在
AEEEM
数据集
上的实验结果表明
,
该算法提高了跨项目软件缺陷预测效率
。
关键词
:
跨项目
;
机器学习
;
软件缺陷预测
;
迁移学习
;
分类器
中图分类号
: TP301.6
文献标识码
: A
文章编号
: 1673
-
629X( 2018) 07
-
0103
-
05
doi
: 10.3969/j.issn.1673
-
629X.2018.07.022
Cross
-
project Software Defect Prediction Based on Transfer
Learning with Metrics
LOU Feng
-
peng
1
,WU Di
2
,JING Xiao
-
yuan
3
,WU Fei
3
( 1.School of Computer,Nanjing University of Posts and Telecommunications,N anjing 210003,China;
2.State Key Laboratory of Software Engineering,School of Computer,Wuhan University,Wuhan 430072,China;
3.School of Automation,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)
Abstract: The combination of machine learning method and software defect prediction technology to automatically learn the model to find
the software defects has become the main method of cross
-
project defect prediction in recent years.However,the performance of cross
-
project prediction is generally poor largely due to feature distribution differences between the source and target projects.In this cases,we
propose a method to add the prediction results as a metric to the original data set to form a new data set for cross
-
project software defect
predictio n.First,a classifier is used to predict the data set in a project,and the predicted result is added as a new metric to the data set.Sec-
ond,a transfer learning method is applied to transfer knowledge from original source project to target project,and a classifier is used to
predict target project,thus effectively improving the prediction accuracy. The experiment on AEEEM data set shows that the proposed
method significantly improves cross
-
project prediction performance.
Key words: cross
-
project; machine learning; software defect prediction; transfer learning; classifier
0
引 言
软件缺陷通常导致系统发生故障
,
进而造成财政
和金融损失
。
软件在正式发布之前
,
可以通过不同级
别的测试来检 验和删除这些缺陷
。
因此
,
软件缺陷预
测
是保证系统正 常运行的一个至关重要的步骤
。
在软件工程领域
,
软件缺陷预测已经成为一个重
大的研究课题
,
引起了很多学者的高度重视
[1
-
2]
。
近
年来
,
已经提出了许多有效的软件缺陷预测方法
[3
-
5]
。
这些方法是通 过从软件仓库中挖掘数据集
,
然后使用
机器学习分类 器预测一个学习模型
[6]
,
通过该模型可
以对软件缺陷 进行预测
[7]
。
近年来比较流 行的机器学
习分类器有很 多
,
如决策树
( decision tree,DT) 、
随机森
第
28
卷 第
7
期
2018
年
7
月
计算机技术与发展
COMPUTER TECHNOLOGY AND DEVELOPMENT
Vol.28 No.7
July 2018
文润观书
- 粉丝: 26
- 资源: 317
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功
评论0