党延忠

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:系统工程研究所

学科:管理科学与工程. 系统工程

电子邮箱:yzhdang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于组合核的中文实体关系抽取研究

点击次数:

论文类型:期刊论文

发表时间:2012-01-01

发表刊物:情报学报

收录刊物:PKU、ISTIC、CSSCI

卷号:31

期号:7

页面范围:702-708

ISSN号:1000-0135

关键字:关系抽取 组合核 平面核 卷积树核

摘要:将基于特征向量的平面核和基于句法分析树的结构核组合,进行中文实体关系抽取.首先进行特征选择实验,为构造平面核中的特征向量选择最优特征集合,特征包括实体大类、实体子类、实体类别等实体信息以及实体对在句子中的前后词信息.在定义结构核函数时,从包含两个实体的句子中提取最短路径包含树(shortest path tree,SPT),然后使用卷积树核函数来计算两棵SPT树的相似度.在ACE RDC 2005中文语料库上进行实体关系大类的抽取实验,其F值达到了68.50%,比两个单独核函数的方法分别提高4.36%和17.37%.同时,在组合核中也进行了特征选择实验,得到了最好关系抽取性能的F值为70.58%,说明单独平面核的最优特征集在组合核中未必最优.结果表明,本文利用实体语义信息构造平面核并与结构核组合,对于中文实体关系抽取具有较好的性能.