Hits:
Indexed by:期刊论文
Date of Publication:2012-01-05
Journal:计算机工程
Included Journals:CSCD
Volume:38
Issue:1
Page Number:195-196,210
ISSN No.:1000-3428
Key Words:特征选择;特征权重;余弦相似度;质心;文本分类
Abstract:基于质心的文本分类方法对模型较敏感,分类性能较差.为此,提出一种基于特征选择的类别质心向量构建方法FSCC.计算特征与类别之间的特征选择值,利用质心特征权重计算公式得到类别的质心向量,并采用非归一化的余弦相似度计算文档与质心间的距离,实现文本分类.实验结果表明,与基于质心的方法和支持向量机方法相比,FSCC方法的分类效果更好.