基于网络表征学习的混合缺陷预测模型.docx资源-CSDN文库

版权申诉

67 浏览量 2022-06-03 21:43:51 上传评论收藏 30KB DOCX 举报

资源推荐

资源详情

资源评论

基于网络表征学习的混合缺陷预测模型

刘成斌　郑巍　樊鑫　杨丰玉

摘要：针对软件系统模块间具有依赖关系的问题，通过对软件系统网络结构进行分析，

构建了基于网络表征学习的混合缺陷预测模型。首先，将软件系统以模块为单位转换成软

件网络;然后，使用网络表征技术来无监督学习软件网络中每个模块的系统结构特征;最后，

结合系统结构特征和卷积神经网络学习的语义特征构建一个混合缺陷预测模型。实验结果

表明：在 Apache 三个开源软件 poi、lucene 和 synapse 上所提混合缺陷预测模型具有

更好的缺陷预测效果，其 F1 指标比最优模型——基于卷积神经网络（CNN）的缺陷预测

模型分别提高了 3.8%、1.0%、4.1%。软件网络结构特征分析为缺陷预测模型的构建提

供了有效的研究思路。

关键词：软件网络;缺陷预测;卷积神经网络;语义特征;网络表征学习

中图分类号：

TP311.53（软件维护）文献标志码：A

Hybrid defect prediction model based on network representation learning

LIU Chengbin 1，2， ZHENG Wei1，2*， FAN Xin1，2， YANG Fengyu 1，2

（1. School of Software， Nanchang Hangkong University， Nanchang

Jiangxi 330063， China;

2. Software Evaluation Center， Nanchang Hangkong University，

Nanchang Jiangxi 330063， China）

Abstract：

Aiming at the problem of the dependence between software system

modules， a hybrid defect prediction model based on network representation

learning was constructed by analyzing the network structure of software

system. Firstly， the software system was converted into a software network

on a module-by-module basis. Then， network representation technique was

used to perform the unsupervised learning on the system structural feature of

each module in software network. Finally， the system structural features and

the semantic features learned by the convolutional neural network were

combined to construct a hybrid defect prediction model. The experimental

results show that the hybrid defect prediction model has better defect

prediction e:ects in three open source softwares， poi， lucene and synapse

of Apache， and its F1 index is respectively 3.8%， 1.0%， 4.1% higher than

that of the optimal model based on Convolutional Neural Network （CNN）.

Software network structure feature analysis provides an e:ective research

thought for the construction of defect prediction model.

Key words：

software network; defect prediction; Convolutional Neural Network （CNN）;

semantic feature; network representation learning

0 引言

随着软件规模的增长，软件缺陷预测技术[1-2]的研究对保证软件可靠性具有重要意

义。软件缺陷预测技术研究软件系统中的缺陷分布，检测出软件中有问题的模块，可用于

辅助软件测试人员进行有目的的测试，在软件部署阶段前充分检测软件内在缺陷，及时修

复有缺陷的软件模块，从而缩短软件开发生命周期、提高软件可靠性。

传统缺陷预测技术主要研究缺陷数量与软件规模的关系。Halstead 等[3]研究了软件

体积度量元与软件缺陷的关系，得出缺陷数量和体积度量元的正比例关系式。Lipow[4]对

其进行了改进，提出了缺陷与可执行代码行数之比是代码行数自然对数的二次函数关系，

并且对于不同的计算机语言函数系数具有差异。Takahashi 等[5]则结合软件文档数量给

出缺陷密度估计式，缺陷率是关于软件规范变更频率、程序员技能、软件设计文档的线性

函数。传统缺陷预测技术只能通过关系式估算缺陷密度，从而预计测试成本。

从机器学习的角度来看，软件缺陷预测是一个分类问题。运用机器学习的方法可以从

历史测试数据中学习，从而发现潜在可能有问题的模块。大量经典机器学习算法用于研究

軟件缺陷预测：Khoshgoftaar 等[6]对 7 种基于逻辑回归和决策树软件缺陷预测模型进行

了比较，提出使用误分类代价作为模型性能比较的统一指标;Fenton 等[7]研究了基于贝

叶斯概率模型的软件缺陷预测方法，实验结果表明基于贝叶斯概率模型的缺陷预测方法通

用性能较好;Vandecruys 等[8]综合比较了基于支持向量机、逻辑回归、K 近邻软件缺陷

预测方法，发现不同的机器学习算法在相同的指标上性能差异并不显著;傅艺绮等[9]提出

利用集成学习将不同预测算法的预测结果作为软件度量，并进行再次预测的组合机器学习

的软件缺陷预测模型，在 Eclipse 数据集实验结果表明，该方法可以有效提高预测准确率;

李勇等[10]总结了缺陷预测流程，比较不同场景下的模型性能，得出缺陷预测算法的性能

由度量特征和算法模型决定，但不同场景下决定算法性能的关键特征有所差异;陈翔等[11]

对缺陷预测进行了系统的研究，总结了影响预测性能的三个关键因素：度量指标、缺陷预

测方法和缺陷数据;Arisholm 等[12]将指标分为面向对象代码指标、复杂性指标、过程指

标等，得出特定缺陷建模技术对分类精度影响有限，然而不同的特征指标对于预测性能影

响比较显著。

2）软件模块系统结构特征提取。根据软件基本模块的依赖关系来构建描述整个软件

系统的软件网络，在软件网络中应用表征学习技术无监督学习模块系统结构特征。

3）混合特征预测缺陷。将以上步骤得到的模块系统结构特征，结合 CNN 学习到的语

义特征和手工提取的统计指标作为 Softmax 神经网络的输入预测缺陷。

2.1 语义特征的提取

为了捕获软件模块丰富的语义特征，需要提取模块的词序列表示，然后利用 CNN 高

效的特征提取能力学习模块的语义。基于网络表征学习的混合缺陷预测具体提取语义特征

的流程如图 3 所示，具体步骤如下：

1）从软件系统模块构建抽象语法树。抽象语法树构建算法可以提取变量声明、循环、

判断、类声明、接口定义、继承、异常等含有软件模块执行逻辑的语义信息，以树结构的

形式表示程序模块的执行逻辑信息[19]。

2）软件模块的词序列的抽取。从软件模块构建抽象语法树之后，利用深度优先算法

遍历抽象语法树，抽取满足以下三种类型的节点[13]添加到软件模块词序列：方法调用和

剩余11页未读，继续阅读

评论收藏

内容反馈

版权申诉

智慧安全方案

粉丝: 3837
资源: 59万+

基于网络表征学习的混合缺陷预测模型.docx

基于K阶互信息估计的位置感知网络表征学习.docx

基于卷11积神经网络的在线评论情感分析模型.docx

基于数据关联狄利克雷混合模型的电网净负荷不确定性表征研究.docx

一种融合表示学习与主题表征的作者合作预测模型.docx

基于改进CART算法的降雨量预测模型.docx

基于低秩表征学习的图像记忆性预测模型

基于深度学习的PCB缺陷检测研究.docx

基于机器学习的股票市场预测模型文档集.zip

基于深度学习的渣土车违规行为分析-论文参考学习.docx

面向代码演化的集成软件缺陷预测模型.docx

基于美国交通部数据的航空运输延误分析预测模型.docx

基于R语言的上海房价预测模型.docx

基于BS架构的网络教学平台的设计与实现.docx

基于深度学习网络模型与大数据自动训练的工件缺陷识别算法研究.pdf

MATLAB数学建模算法 预测模型 回归预测模型.docx

基于微信平台的高职英语的移动学习模式研究.docx

线性规划模型 MATLAB 代码详细讲解.docx

基于深度学习的机器人应用研究.docx

基于微信公众号的移动学习资源的设计研究.docx

基于TensorFlow的深度学习时序预测方案.docx

网络营销学习心得体会多篇.docx.docx

BP神经11网络算法预测模型.docx

学习网络营销心得体会.docx

利用Matlab实现基于小波变换的遥感图像融合.docx

构建合作型团队5.1、如何创建合作型团队思维模型.docx

公司使用的各种缺陷管理工具.docx

电子商务之价格优化算法：粒子群优化：基于粒子群优化的价格预测模型.docx

2012-2016年中国购物中心投资分析及前景预测报告.docx

最新资源

MATLAB数学建模算法预测模型回归预测模型.docx