Hits:
Indexed by:期刊论文
Date of Publication:2012-01-01
Journal:大连理工大学学报
Included Journals:Scopus、EI、PKU、ISTIC、CSCD
Volume:52
Issue:2
Page Number:285-289
ISSN No.:1000-8608
Key Words:中文信息处理; 中文地名识别; 条件随机域; 基于规则的后处理
Abstract:采用递增式学习策略优化条件随机域(conditional random
fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,
最终实现了CRF与规则相结合的中文地名识别系统。实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007
NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94。67%、92。35%和93。50%。