李丽双

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

学科:计算机应用技术. 计算机软件与理论

办公地点:创新大厦A930

电子邮箱:lils@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于迁移学习的蛋白质交互关系抽取

点击次数:

论文类型:期刊论文

发表时间:2016-01-01

发表刊物:中文信息学报

收录刊物:PKU、ISTIC、CSCD

卷号:30

期号:2

页面范围:160-167

ISSN号:1003-0077

关键字:蛋白质交互关系抽取; 迁移学习; 负迁移

摘要:作为生物医学信息抽取领域的重要分支,蛋白质交互关系(Protein-Protein
   Interaction,PPI)抽取具有重要的研究意义。目前的研究大多采用统计机器学习方法,需要大规模标注语料进行训练。训练语料过少,会降低关系
   抽取系统的性能,而人工标注语料需要耗费巨大的成本。该文采用迁移学习的方法,用大量已标注的源领域(其它领域)语料来辅助少量标注的目标领域语料(本领
   域)进行蛋白质交互关系抽取。但是,不同领域的数据分布存在差异,容易导致负迁移,该文借助实例的相对分布来调整权重,避免了负迁移的发生。在公共语料库
   AIMed上实验,两种迁移学习方法获得了明显优于基准算法的性能;同样方法在语料库IEPA上实验时,TrAdaboost算法发生了负迁移,而改进的
   DisTrAdaboost算法仍保持良好迁移效果。