Release Time:2019-03-09 Hits:
Indexed by: Conference Paper
Date of Publication: 2007-08-06
Page Number: 83-88
Key Words: 组块分析;浅层句法分析;中文信息处理;词性扩展;统计学习
Abstract: 给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料中的特殊符号、并列关系以及较粗的词性进行了词性扩展,并采用了一种基于标点符号分割段的voting方法.实验表明,三个基本模型中CRF识别效果最好,而组合方法能进一步提高组块识别的精确率、召回率、F值。