Hits:
Indexed by:期刊论文
Date of Publication:2009-01-15
Journal:中文信息学报
Included Journals:PKU、ISTIC、CSCD
Volume:23
Issue:1
Page Number:16-22
ISSN No.:1003-0077
Key Words:计算机应用;中文信息处理;组块识别;条件随机域(CRFs);分布式策略;基于CRFs的错误驱动;浅层句法分析
Abstract:该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块.该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F值大小顺序处理类型冲突.实验结果表明,基于CRFs的分布式策略及错误驱动方法识别汉语组块是有效的,系统开放式测试的精确率、召回率、F值分别达到94.90%、91.00%和92.91%,好于单独的CRFs方法、分布式策略方法及其他组合方法.