Hits:
Indexed by:期刊论文
Date of Publication:2006-09-30
Journal:中文信息学报
Included Journals:PKU、ISTIC、CSCD
Volume:20
Issue:5
Page Number:51-57
ISSN No.:1003-0077
Key Words:计算机应用;中文信息处理;中文地名识别;支持向量机;机器学习;基于规则的后处理
Abstract:在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足.实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%.