location: Current position: Home >> Scientific Research >> Paper Publications

中文文本中外国人名与中国人名同步识别方法

Hits:

Indexed by:期刊论文

Date of Publication:2006-04-30

Journal:小型微型计算机系统

Included Journals:PKU、ISTIC、CSCD

Volume:27

Issue:4

Page Number:715-719

ISSN No.:1000-1220

Key Words:汉语自动分词;人名识别;未登录词识别

Abstract:根据中国人名和外国人名的构成特点产生潜在中国人名和外国人名,然后把它们作为节点词加入到句子的分词有向图中,利用上下文信息对有向图的边赋值,使有向图最短路径对应句子正确切分. 在确定句子正确切分时识别出句子中的外国人名和中国人名. 该方法可以避免由分词结果造成的人名不能被召回的现象,提高了人名识别的召回率. 通过对真实语料的测试,在封闭测试中该方法对中国人名和外国人名识别的综合指标F值为97.30%.

Pre One:基于AdaBoost.MH算法的汉语多义词消歧

Next One:基于Proxy的网络机器翻译系统