论文类型:期刊论文
发表刊物:中文信息学报
收录刊物:CSCD、ISTIC、PKU
卷号:20
期号:6
页面范围:17-24
ISSN号:1003-0077
关键字:计算机应用;中文信息处理;组块分析;错误驱动学习;支持向量机(SVM);规则集
摘要:给出了一种错误驱动学习机制与SVM相结合的汉语组块识别方法.该方法在SVM组块识别的基础上,对SVM识别结果中的错误词语序列的词性、组块标注信息等进行分析,获得候选校正规则集;之后按照阈值条件对候选集进行筛选,得到最终的校正规则集;最后应用该规则集对SVM的组块识别结果进行校正.实验结果表明,与单独采用SVM模型的组块识别相比,加入错误驱动学习方法后,组块识别的精确率、召回率和F值均得到了提高.
