王健

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

学科:计算机应用技术

办公地点:创新园大厦B811

联系方式:0411-84706009-2811

电子邮箱:wangjian@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

一种模板与图核融合的蛋白质关系抽取方法

点击次数:

论文类型:会议论文

发表时间:2010-08-12

页面范围:539-546

关键字:蛋白质关系抽取;模板;图核融合;句法分析器;生物医学文献

摘要:随着生物医学文献的急剧增加,从文本中自动抽取蛋白质的相互作用关系,成为文本挖掘领域研究中的重要方向。目前主流的蛋白质关系抽取方法大多侧重于提取句子的结构化特征信息,对句中词信息没有进行深入发掘,特别是对复杂长难句的处理时间消耗大。本文提出了一种新的模板方法,利用两类句法分析器生成结构化句子,从中找到存在特定意义的模板序列,通过模板快速匹配句子。本方法能够同图核方法进行有效融合,解决图核方法难以处理复杂长难句的不足,提高实验效率。本方法在AIMed 语料上使用十倍交叉验证的F 值达到了63.1%。