周宽久
个人信息Personal Information
教授
博士生导师
硕士生导师
任职 : 大连理工大学软件评测中心主任
性别:男
毕业院校:哈尔滨工业大学
学位:博士
所在单位:软件学院、国际信息与软件学院
学科:软件工程. 计算机系统结构
办公地点:开发区校区综合楼409
联系方式:zhoukj@dlut.edu.cn 13804248599
电子邮箱:zhoukj@dlut.edu.cn
扫描关注
基于潜在语义索引的SVM文本分类模型
点击次数:
论文类型:期刊论文
发表时间:2009-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSCD、CSSCI
卷号:28
期号:6
页面范围:827-833
ISSN号:1000-0135
关键字:支持向量机;核空间;潜在语义索引;文本分类
摘要:本文将潜在语义索引理论与支持向量机方法相结合,对文本向量各维与文本的语义联系进行特征抽取,建立了完整的基于潜在语义索引的支持向量机文本分类模型,分析了该方法与分词的维数以及SVM惩罚因子选择之间的关系.并在NN-SVM分类算法的基础上,通过计算样本点与其最近邻点类别的异同以及该点与其k个同类近邻点在核空间的平均距离来修剪混淆点,提出了一种改进的NN-SVM算法:KCNN-SVM算法.利用该算法对降维后的训练集进行修剪.实验表明,用新的模型进行文本分类,与单纯支持向量机相比,受到文本分词维数以及支持向量机惩罚因子的影响更小,其分类正确率更高.