杨志豪

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

电子邮箱:yangzh@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于编辑距离和多种后处理的生物实体名识别

点击次数:

论文类型:期刊论文

发表时间:2008-09-05

发表刊物:计算机工程

收录刊物:PKU、ISTIC、CSCD

卷号:34

期号:17

页面范围:21-22,25

ISSN号:1000-3428

关键字:文本挖掘;实体识别;编辑距离;条件随机域

摘要:基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称编写对识别算法"扩充词典,利用编辑距离算法提高识别召回率.在后处理阶段,使用前后缀词扩展、POS扩展、合并邻近实体及利用上下文线索等方法进一步提高性能.实验结果表明.使用该方法即使利用内部词典也可以获得较好的识别效果.