党延忠
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:系统工程研究所
学科:管理科学与工程. 系统工程
电子邮箱:yzhdang@dlut.edu.cn
扫描关注
文本粗分类数据中噪声的快速修正算法
点击次数:
论文类型:期刊论文
发表时间:2009-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSCD、CSSCI
卷号:28
期号:5
页面范围:700-705
ISSN号:1000-0135
关键字:文本分类;集团结构;模块度优化;噪声数据
摘要:训练数据中的噪声数据对文本分类结果的精度会造成不良影响,本文提出了一种对噪声数据进行修正的快速算法.针对以前的算法,每次迭代只对一个文档进行修正,迭代次数与噪声数据数量相当,算法运行效率较低的问题,本文通过分析调整文档所属类别对评价指标的影响,提出依据模块度变化量判断噪声数据,一次迭代过程中可以对多个文档进行修正处理,从而提高算法效率.实验结果表明,本文所提算法能够更快地修正粗分类数据中的噪声,算法复杂度从以前算法的O(Tnm2)降低为O(Tnm).该算法可以用于对大数据量数据进行处理,实用价值更高.