李丽双
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:女
毕业院校:大连理工大学
学位:博士
所在单位:计算机科学与技术学院
学科:计算机应用技术. 计算机软件与理论
办公地点:创新大厦A930
电子邮箱:lils@dlut.edu.cn
扫描关注
基于双向LSTM和两阶段方法的触发词识别
点击次数:
论文类型:期刊论文
发表时间:2017-01-01
发表刊物:中文信息学报
收录刊物:CSCD
卷号:31
期号:6
页面范围:147-154
ISSN号:1003-0077
关键字:触发词识别 两阶段方法 双向LSTM 依存词向量 trigger detection two-stage method bidirectional LSTM dependency word embeddings
摘要:生物事件抽取是生物文本挖掘领域的一个重要分支,而触发词识别作为事件抽取的重要子过程,已经吸引了众多的关注.现有的触发词识别方法多为浅层的一阶段方法,训练代价较大,且需要丰富的领域知识抽取大量特征,人工成本较高.因此,该文提出了一种基于两阶段和双向LSTM神经网络的触发词识别方法.首先,将触发词识别分为识别和分类两个阶段,有效地缓解了训练过程中存在的类不平衡问题;其次,在两个阶段中均采用目前性能较好的双向LSTM神经网络来完成二分类任务和多分类任务,避免了浅层机器学习方法抽取人工特征时的代价.此外,利用PubM ed数据库下载大规模语料训练带有依存关系的词向量,获得了更加丰富的语义信息,从而有效地提高了触发词的识别性能.该文方法在生物事件抽取通用语料MLEE上已获得目前最好抽取性能,F值为78.46%.