1. 每个缺陷数据集对应一个真实的JAVA软件项目,数据集保存在一个csv文件中(同时额外提供了arff格式的数据文件);
2. 数据集中每一行称为一个样本,对应一个真实的软件模块(即一个class文件);
3. 每个样本由两部分组成:61个软件度量元(software metrics)和相应的标签(即该模块是否存在缺陷,其中clean表示无缺陷,buggy表示有缺陷),其中最后一列是标签;
4. AEEEM数据是由Marco D’Ambros等人收集的,论文详见附件;
5. 每个度量元(比如著名的CK度量元-详见CK-metrics.png)的含义,可参见Marco D’Ambros的论文,详见附件;
6. 缺陷预测模型是指通过机器学习等方法建立度量元X与缺陷Y之间的映射关系f:Y=f(X);
7. 从机器学习的角度来说,缺陷预测模型可分为监督、半监督和无监督学习模型,其中大部分都是有监督学习模型;
8. 对于给定的(带标签)缺陷数据集,建模过程中,可以对训练数据进行数据清洗、特征选择等,且对具体的训练算法(比如决策树、支持向量机、随机森林等)没有特别限制,具体哪种训练算法好,需要自己去实验;
没有合适的资源?快使用搜索试试~ 我知道了~
温馨提示
软件管理与测试实训课程设计_基于java实现的机器学习代码错误分类检测项目源码(带项目文档+说明书).zip 软件管理与测试实训课程设计_基于java实现的机器学习代码错误分类检测项目源码(带项目文档+说明书).zip 软件管理与测试实训课程设计_基于java实现的机器学习代码错误分类检测项目源码(带项目文档+说明书).zip 【备注】 该项目代码主要针对计算机、自动化等相关专业的学生从业者下载使用,代码经过运行验证,放心下载使用。 也可作为期末课程设计、课程大作业、毕业设计等。具有较高的学习借鉴价值!也可直接当做个人项目使用。
资源推荐
资源详情
资源评论


























收起资源包目录





































































































共 119 条
- 1
- 2
资源评论


zui初的梦想
- 粉丝: 822
- 资源: 1751
上传资源 快速赚钱
我的内容管理 展开
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助


安全验证
文档复制为VIP权益,开通VIP直接复制
