论文类型:期刊论文
发表刊物:中文信息学报
收录刊物:CSCD、ISTIC、PKU
卷号:27
期号:1
页面范围:86-92,128
ISSN号:1003-0077
关键字:蛋白质交互关系抽取;SVM;树核;组合核;修剪策略
摘要:蛋白质交互关系(PPI)抽取是生物医学信息抽取领域的一个重要部分,具有很高的应用价值和实际意义.该文使用一种基于SVM的组合核方法进行蛋白质关系抽取,将基于特征的平面核和基于结构的卷积树核组合.一棵完整的句法解析树中包含了较多噪声,需对其修剪以提高PPI抽取效果.首先讨论不同的树的剪裁策略对实验结果的影响,分别使用完全树、最小完全树、最小树和最短路径闭包树进行实验,最短路径闭包树效果最好;然后在最短路径闭包树的基础上提出一种动态拓展树,该树取得了明显优于其他解析树的效果.最后基于组合核在AIMED上进行10倍交叉实验,精确率、召回率和F值分别达到了82.40%、51.30%和63.23%.
