Hits:
Indexed by:期刊论文
Date of Publication:2006-04-30
Journal:小型微型计算机系统
Included Journals:PKU、ISTIC、CSCD
Volume:27
Issue:4
Page Number:715-719
ISSN No.:1000-1220
Key Words:汉语自动分词;人名识别;未登录词识别
Abstract:根据中国人名和外国人名的构成特点产生潜在中国人名和外国人名,然后把它们作为节点词加入到句子的分词有向图中,利用上下文信息对有向图的边赋值,使有向图最短路径对应句子正确切分. 在确定句子正确切分时识别出句子中的外国人名和中国人名. 该方法可以避免由分词结果造成的人名不能被召回的现象,提高了人名识别的召回率. 通过对真实语料的测试,在封闭测试中该方法对中国人名和外国人名识别的综合指标F值为97.30%.