论文类型:期刊论文
发表刊物:中文信息学报
收录刊物:CSCD、ISTIC、PKU
卷号:17
期号:2
页面范围:36-41
ISSN号:1003-0077
关键字:计算机应用;中文信息处理;中文地名识别;构词可信度;接续可信度;自动分词
摘要:本文针对有特征词的中文地名识别进行了研究.该系统使用从大规模地名词典和真实文本语料库得到的统计信息以及针对地名特点总结出来的规则,通过计算地名的构词可信度和接续可信度从而识别中文地名.该模型时自动分词的切分作了有效的调整,系统闭式召回率和精确率分别为90.24%和93.14%,开式召回率和精确率分别达86.86%和91.48%.
