杨志豪
个人信息Personal Information
教授
博士生导师
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:计算机科学与技术学院
电子邮箱:yangzh@dlut.edu.cn
扫描关注
基于编辑距离和多种后处理的生物实体名识别
点击次数:
论文类型:期刊论文
发表时间:2008-09-05
发表刊物:计算机工程
收录刊物:PKU、ISTIC、CSCD
卷号:34
期号:17
页面范围:21-22,25
ISSN号:1000-3428
关键字:文本挖掘;实体识别;编辑距离;条件随机域
摘要:基于编辑距离和多种后处理的生物医学文献实体名识别方法通过"全称编写对识别算法"扩充词典,利用编辑距离算法提高识别召回率.在后处理阶段,使用前后缀词扩展、POS扩展、合并邻近实体及利用上下文线索等方法进一步提高性能.实验结果表明.使用该方法即使利用内部词典也可以获得较好的识别效果.