Hits:
Indexed by:期刊论文
Date of Publication:2012-04-01
Journal:计算机应用
Included Journals:PKU、ISTIC、CSCD
Volume:32
Issue:4
Page Number:1074-1077
ISSN No.:1001-9081
Key Words:信息抽取;自然语言处理;蛋白质关系抽取;特征;支持向量机
Abstract:针对蛋白质交互作用关系( PPI)抽取方法中特征利用的片面性问题,提出了一种从上下文环境和句法结构中抽取特征的方法.该方法抽取词法特征、位置特征、距离特征、依存句法特征和深层句法特征等丰富特征构成特征集,并且使用支持向量机( SVM)分类器进行PPI抽取.方法在5个公开的PPI语料上进行了评估.实验结果表明,丰富特征有效地利用了更为全面的信息,避免丢失重要特征的危险,得到了较好的PPI抽取性能.即在AImed语料上的实验取得了59.2%的F值和85.6%的曲线下面积(AUC)值.