潘东华
个人信息Personal Information
副教授
硕士生导师
性别:男
毕业院校:长春光学精密机械研究所
学位:硕士
所在单位:系统工程研究所
电子邮箱:gyise@dlut.edu.cn
扫描关注
一种修正的向量空间模型在信息检索中的应用
点击次数:
论文类型:期刊论文
发表时间:2008-04-15
发表刊物:哈尔滨工业大学学报
收录刊物:EI、PKU、ISTIC、CSCD
卷号:40
期号:4
页面范围:666-669
ISSN号:0367-6234
关键字:文本信息检索 向量空间模型 同义词词典 查询扩展
摘要:为了提高文本信息检索系统检索性能,针对信息检索系统中普遍使用的向量空间模型(VSM)所固有的缺陷,提出一种新的修正的向量空间模型(MVSM).该模型重新定义了查询索引项的内容,将修饰词与中心词组成的合成短语引入到查询语句及传统的向量空间检索模型的信息表示中,并重新计算作为特征索引项的合成短语的权重值.在此基础上,又对查询索引项使用了基于同义词词典的查询扩展策略.实验结果表明:用合成短语作为查询索引项进行检索,使检索能够在相对精确的范围内进行,提高检索查准率;对查询进行同义扩展,能够使更多的语义相关的文本被检索出来,提高检索查全率.因此,在信息检索系统中应用修正的向量空间模型能够较好地改善检索性能.