大连理工大学主页平台管理系统李丽双用支持向量机进行中文地名识别的研究 Home

Current position: Home >> Scientific Research >> Paper Publications

基于修正SVM-KNN组合算法的汉语专有名词自动抽取

Release Time:2019-03-10 Hits:

Indexed by: Journal Article

Date of Publication: 2011-01-01

Journal: 情报学报

Included Journals: CSSCI、ISTIC、PKU

Volume: 30

Issue: 6

Page Number: 610-617

ISSN: 1000-0135

Key Words: KNN;SVM;专有名词抽取;不平衡数据

Abstract: 专有名词的自动抽取是文本挖掘、信息检索和机器翻译等领域的关键技术.本文研究了组合SVM和KNN两种分类器进行汉语专有名词自动抽取的方法.对样本在空间的不同分布使用不同的分类方法,当测试样本与SVM最优超平面的距离大于给定的阈值时使用SVM分类,否则使用KNN;在实际训练语料中,常常是负类样本数远多于正类样本数,而传统KNN方法对不平衡训练集存在敏感性,所以提出了用归一化的思想对传统的KNN方法进行修正.实验表明,用SVM与修正的KNN组合算法进行汉语专有名词抽取比单一的SVM方法以及原始的SVM-KNN方法更具优越性,而且这种方法可以推广到其他非平衡分布样本的分类问题.

Prev One:Recognizing Chinese person names based on hybrid models

Next One:A multi-dimensional ontology model for product lifecycle knowledge management

Home

Scientific Research

Teaching Research

Awards and Honours

Enrollment Information

Student Information

My Album

Blog

基于修正SVM-KNN组合算法的汉语专有名词自动抽取