Release Time:2019-03-10 Hits:
Indexed by: Journal Article
Date of Publication: 2015-09-15
Journal: 计算机科学
Included Journals: CSCD、ISTIC、PKU
Volume: 42
Issue: 9
Page Number: 159-164
ISSN: 1002-137X
Key Words: 软件仓库挖掘;数据驱动方法;特征提取;缺陷报告摘要
Abstract: 在软件仓库挖掘领域,通常将软件工程任务转换成数据挖掘问题进行解决.领域特征的使用严重影响了软件任务的解决效果.然而,如何根据特定任务从软件仓库数据中提取有价值的特征,在软件仓库挖掘领域尚缺乏系统的研究.数据驱动特征提取方法是一种新的特征提取方法.对于给定的软件工程任务,该方法从任务的数据集中选取部分数据(如源代码、缺陷报告等),招募若干志愿者人工完成该任务,并要求志愿者说明在人工完成特定软件工程任务时所考虑的因素.通过分析这些因素,可以提取所需的领域特征.以缺陷报告摘要任务为例进行实验,结果表明新方法能够发现高效的领域特征,并取得比现有方法更好的预测效果.