Hits:
Indexed by:期刊论文
Date of Publication:2011-01-01
Journal:情报学报
Included Journals:PKU、ISTIC、CSSCI
Volume:10
Issue:10
Page Number:1044-1052
ISSN No.:1000-0135
Key Words:知识发现;共现;特征;H1N1
Abstract:目前,生物医学文献的数量正以爆炸性的速度增长,这些文献中隐含着大量有用的信息,挖掘这些文献可以形成医学假设.然而,传统的基于简单共现的方法会产生大量的目标词,从而导致准确率下降.本文提出一种新的选取连接词的方法,使用统计特征和文本特征来代替每一个连接词并表示为向量形式,然后把这些词分类为相关和不相关.使用相关的连接词发现目标词,可以提高知识发现的准确率.本文通过Swanson的两组经典实验--雷诺氏病和鱼油、偏头痛和镁,使用有效连接词的比例变化作为依据验证了方法的有效性.最后,本文以H1N1为初始词,进行开放式和闭合式知识发现研究,得到了较好的效果.