Hits:
Indexed by:会议论文
Date of Publication:2007-10-13
Page Number:396-401
Key Words:中文命名实体;一体化识别;模糊支持向量机;层叠模型;自然语言处理
Abstract:针对中文命名实体构成的复杂性,提出了一种基于模糊支持向量机的层叠模型。基于最长次长匹配一体化分词标注结果,在底层利用支持向量机基于单字特征进行人名、简单地名和机构名的识别;在高层回到词的层面,利用支持向量机基于词特征对复杂地名和机构名进行识别。通过基于单字和基于词的模糊支持向量机的结合,实现了对命名实体的一体化识别。模糊支持向量机的引入,降低了噪声样本和异常数据的影响,提高了系统识别精度。