Hits:
Indexed by:会议论文
Date of Publication:2007-08-06
Page Number:83-88
Key Words:组块分析;浅层句法分析;中文信息处理;词性扩展;统计学习
Abstract:给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料中的特殊符号、并列关系以及较粗的词性进行了词性扩展,并采用了一种基于标点符号分割段的voting方法.实验表明,三个基本模型中CRF识别效果最好,而组合方法能进一步提高组块识别的精确率、召回率、F值。