Hits:
Indexed by:会议论文
Date of Publication:2010-08-12
Page Number:539-546
Key Words:蛋白质关系抽取;模板;图核融合;句法分析器;生物医学文献
Abstract:随着生物医学文献的急剧增加,从文本中自动抽取蛋白质的相互作用关系,成为文本挖掘领域研究中的重要方向。目前主流的蛋白质关系抽取方法大多侧重于提取句子的结构化特征信息,对句中词信息没有进行深入发掘,特别是对复杂长难句的处理时间消耗大。本文提出了一种新的模板方法,利用两类句法分析器生成结构化句子,从中找到存在特定意义的模板序列,通过模板快速匹配句子。本方法能够同图核方法进行有效融合,解决图核方法难以处理复杂长难句的不足,提高实验效率。本方法在AIMed 语料上使用十倍交叉验证的F 值达到了63.1%。