location: Current position: Home >> Scientific Research >> Paper Publications

基于潜在语义索引的SVM文本分类模型

Hits:

Indexed by:期刊论文

Date of Publication:2009-01-01

Journal:情报学报

Included Journals:PKU、ISTIC、CSCD、CSSCI

Volume:28

Issue:6

Page Number:827-833

ISSN No.:1000-0135

Key Words:支持向量机;核空间;潜在语义索引;文本分类

Abstract:本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.

Pre One:软件执行过程的加权复杂网络

Next One:支持向量机分类算法研究