Hits:
Indexed by:期刊论文
Date of Publication:2015-01-15
Journal:中文信息学报
Included Journals:PKU、ISTIC、CSCD
Volume:29
Issue:1
Page Number:82-87
ISSN No.:1003-0077
Key Words:术语抽取;信息熵;词频分布变化
Abstract:在分别研究了基于信息熵和基于词频分布变化的术语抽取方法的情况下,该文提出了一种信息熵和词频分布变化相结合的术语抽取方法.信息熵体现了术语的完整性,词频分布变化体现了术语的领域相关性.通过应用信息熵,即将信息熵结合到词频分布变化公式中进行术语抽取,且应用简单语言学规则过滤普通字符串.实验表明,在汽车领域的语料上,应用该方法抽取出1 300个术语,其正确率达到73.7%.结果表明该方法对低频术语有更好的抽取效果,同时抽取出的术语结构更完整.