李丽双

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

学科:计算机应用技术. 计算机软件与理论

办公地点:创新大厦A930

电子邮箱:lils@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于信息熵和词频分布变化的术语抽取研究

点击次数:

论文类型:期刊论文

发表时间:2015-01-15

发表刊物:中文信息学报

收录刊物:PKU、ISTIC、CSCD

卷号:29

期号:1

页面范围:82-87

ISSN号:1003-0077

关键字:术语抽取;信息熵;词频分布变化

摘要:在分别研究了基于信息熵和基于词频分布变化的术语抽取方法的情况下,该文提出了一种信息熵和词频分布变化相结合的术语抽取方法.信息熵体现了术语的完整性,词频分布变化体现了术语的领域相关性.通过应用信息熵,即将信息熵结合到词频分布变化公式中进行术语抽取,且应用简单语言学规则过滤普通字符串.实验表明,在汽车领域的语料上,应用该方法抽取出1 300个术语,其正确率达到73.7%.结果表明该方法对低频术语有更好的抽取效果,同时抽取出的术语结构更完整.