location: Current position: Home >> Scientific Research >> Paper Publications

SVM与规则相结合的中文地名自动识别

Hits:

Indexed by:期刊论文

Date of Publication:2006-09-30

Journal:中文信息学报

Included Journals:PKU、ISTIC、CSCD

Volume:20

Issue:5

Page Number:51-57

ISSN No.:1003-0077

Key Words:计算机应用;中文信息处理;中文地名识别;支持向量机;机器学习;基于规则的后处理

Abstract:在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足.实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%.

Pre One:汉英机器翻译中趋向动词处理研究

Next One:开放式汉语自动分词的学习机制