Release Time:2019-11-04 Hits:
Indexed by: Journal Papers
Date of Publication: 2019-01-16
Journal: 计算机工程
Included Journals: PKU
Volume: 45
Issue: 8
Page Number: 80-85
ISSN: 1000-3428
Key Words: 开源软件;软件缺陷报告;特征选择;机器学习;严重性评估;修复率
Abstract: 针对Bugzilla缺陷跟踪系统的Eclipse项目软件缺陷报告数据集,使用特征选择和机器学习算法对向量化的原始数据进行特征降维、权重优化等处理,得到数据维度较低的优化数据集,并采用分类算法评估软件缺陷报告严重程度.通过对4种特征选择算法及4种机器学习算法处理结果的交叉对比表明,使用信息增益特征选择算法对原始数据集进行特征优化,并结合多项式贝叶斯算法对优化数据集进行训练与测试,可使软件缺陷报告严重性预测的AUROC值提高至0.767.