周宽久

个人信息Personal Information

教授

博士生导师

硕士生导师

任职 : 大连理工大学软件评测中心主任

性别:男

毕业院校:哈尔滨工业大学

学位:博士

所在单位:软件学院、国际信息与软件学院

学科:软件工程. 计算机系统结构

办公地点:开发区校区综合楼409

联系方式:zhoukj@dlut.edu.cn 13804248599

电子邮箱:zhoukj@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于潜在语义索引的SVM文本分类模型

点击次数:

论文类型:期刊论文

发表时间:2009-01-01

发表刊物:情报学报

收录刊物:PKU、ISTIC、CSCD、CSSCI

卷号:28

期号:6

页面范围:827-833

ISSN号:1000-0135

关键字:支持向量机;核空间;潜在语义索引;文本分类

摘要:本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.