Current position: Home >> Scientific Research >> Paper Publications

基于混合模型的中国人名自动识别

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2007-03-30

Journal: 中文信息学报

Included Journals: CSCD、ISTIC、PKU

Volume: 21

Issue: 2

Page Number: 22-28

ISSN: 1003-0077

Key Words: 计算机应用;中文信息处理;支持向量机;概率统计;混合模型;人名识别

Abstract: 本文提出了一种支持向量机(SVM)和概率统计模型相结合的中国人名自动识别方法.该方法首先按字抽取特征向量的属性得到训练集,采用多项式核函数建立SVM人名识别模型,然后在特征空间中计算测试样本到SVM最优超平面的距离,当该距离大于给定的阈值时使用SVM对测试样本进行分类,否则使用概率统计方法.实验表明,采用混合模型,对样本在空间的不同分布使用不同的方法可以取得比单独使用SVM或概率统计更好的分类效果,系统开式综合指标F-值比单纯使用支持向量机方法提高了1.51%.

Prev One:基于支持向量机的中文文本中地名识别

Next One:Bootstrapping for Chinese word sense disambiguation based on grouping strategy