论文类型:期刊论文
发表刊物:中文信息学报
收录刊物:CSCD、PKU
卷号:15
期号:2
页面范围:31-37,44
ISSN号:1003-0077
关键字:双词同现频度;单词频度;学习机制;中文姓名识别
摘要:专有名词的识别对自动分词有重要意义。本文针对如何识别中文姓名做了有益的尝试,主要采用基于统计方法,进行中文姓名识别。本文建立了有监督学习机制,提出了句子切分结果可信度等概念,并在此基础上建立了较好的统计模型,系统闭式精确率和召回率分别达95.97%和95.52%,开式精确率和召回率分别达92.37%和88.62%。
