杨志豪

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

电子邮箱:yangzh@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

生物医学文献中的蛋白质关系抽取研究

点击次数:

论文类型:期刊论文

第一作者:赵哲焕

合写作者:杨志豪,孙聪,林鸿飞

发表时间:2018-07-15

发表刊物:中文信息学报

卷号:32

期号:7

页面范围:82-90

ISSN号:1003-0077

关键字:关系词抽取;蛋白质实体识别;蛋白质关系抽取

摘要:蛋白质关系抽取研究对于生命科学各领域的研究具有广泛的应用价值.但是,基于机器学习的蛋白质关系抽取方法普遍停留在二元关系抽取,失去了丰富的关系类型信息,而基于规则的开放式信息抽取方法可以抽取完整的蛋白质关系("蛋白质1,关系词,蛋白质2"),但是召回率较低.针对以上问题,该文提出了一种混合机器学习和规则方法的蛋白质关系抽取框架.该框架先利用机器学习方法完成命名实体识别和二元关系抽取,然后利用基于句法模板和词典匹配的方法抽取表示当前两个蛋白质间关系类型的关系词.该方法在AImed语料上取得了40.18% 的F值,远高于基于规则的Stanford Open IE方法.