王健

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:女

毕业院校:大连理工大学

学位:博士

所在单位:计算机科学与技术学院

学科:计算机应用技术

办公地点:创新园大厦B811

联系方式:0411-84706009-2811

电子邮箱:wangjian@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

一种基于排序学习方法的查询扩展技术

点击次数:

论文类型:期刊论文

发表时间:2015-05-15

发表刊物:中文信息学报

收录刊物:PKU、ISTIC、CSCD

卷号:29

期号:3

页面范围:155-161

ISSN号:1003-0077

关键字:信息检索;查询扩展;伪相关反馈;排序学习

摘要:查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加准确地描述用户信息需求.排序学习方法利用机器学习的知识构造排序模型对数据进行排序,是当前机器学习与信息检索交叉领域的研究热点.该文尝试利用伪相关反馈技术,在查询扩展中引入排序学习算法,从文档集合中提取与扩展词相关的特征,训练针对于扩展词的排序模型,并利用排序模型对新查询的扩展词集合进行重新排序,将排序后的扩展词根据排序得分赋予相应的权重,加入到原始查询中进行二次检索,从而提高信息检索的准确率.在TREC数据集合上的实验结果表明,引入排序学习算法有助于提高伪相关反馈的检索性能.