论文类型:期刊论文
发表刊物:中文信息学报
收录刊物:CSCD、ISTIC、PKU
卷号:23
期号:1
页面范围:16-22
ISSN号:1003-0077
关键字:计算机应用;中文信息处理;组块识别;条件随机域(CRFs);分布式策略;基于CRFs的错误驱动;浅层句法分析
摘要:该文提出了一种基于CRFs的分布式策略及错误驱动的方法识别汉语组块.该方法首先将11种类型的汉语组块进行分组,结合CRFs构建不同的组块识别模型来识别组块;之后利用基于CRFs的错误驱动技术自动对分组组块进行二次识别;最后依据各分组F值大小顺序处理类型冲突.实验结果表明,基于CRFs的分布式策略及错误驱动方法识别汉语组块是有效的,系统开放式测试的精确率、召回率、F值分别达到94.90%、91.00%和92.91%,好于单独的CRFs方法、分布式策略方法及其他组合方法.
