论文类型:会议论文
页面范围:233-239
关键字:中文机构名称;单词频度;双词同现频度;专名自动识别;识别模型
摘要:本文机构名称是专名的一种,量大且层出不穷,因而大多不能收入词典,这便给自然语言处理,尤其是机器翻译和机器理解带来很大困扰.本文将统计和规则两种方法结合起来,建立了中文机构名称的识别模型.系统闭式精确率和召回率分别达92.5﹪和92﹪,开式精确率和召回率分别达88.5﹪和76.6﹪.
