Hits:
Indexed by:期刊论文
Date of Publication:2006-05-30
Journal:计算机与应用化学
Included Journals:PKU、ISTIC、CSCD
Volume:23
Issue:5
Page Number:395-398
ISSN No.:1001-4160
Key Words:候选词;编辑距离;分类器
Abstract:生物实体名识别对生物医学文献的信息抽取有重要的意义.本文针对如何识别蛋白质名进行了有益的尝试,主要采用了基于词典的方法,其中运用了近似搭配算法和首词查询的方法进行蛋白质名识别,同时结合机器学习方法训练了一个分类器来过滤候选词以提高识别的准确率.