Hits:
Indexed by:Journal Papers
Date of Publication:2019-01-16
Journal:计算机工程
Included Journals:PKU
Volume:45
Issue:8
Page Number:80-85
ISSN No.:1000-3428
Key Words:开源软件;软件缺陷报告;特征选择;机器学习;严重性评估;修复率
Abstract:针对Bugzilla缺陷跟踪系统的Eclipse项目软件缺陷报告数据集,使用特征选择和机器学习算法对向量化的原始数据进行特征降维、权重优化等处理,得到数据维度较低的优化数据集,并采用分类算法评估软件缺陷报告严重程度.通过对4种特征选择算法及4种机器学习算法处理结果的交叉对比表明,使用信息增益特征选择算法对原始数据集进行特征优化,并结合多项式贝叶斯算法对优化数据集进行训练与测试,可使软件缺陷报告严重性预测的AUROC值提高至0.767.