的个人主页 http://faculty.dlut.edu.cn/2003011129/zh_CN/index.htm
点击次数:
论文类型:期刊论文
发表时间:2012-01-15
发表刊物:计算机应用研究
收录刊物:PKU、ISTIC、CSCD
卷号:29
期号:1
页面范围:145-147
ISSN号:1001-3695
关键字:HITS;网页链接增幅;主题偏离;优先情节;扩散理论
摘要:传统的HITS算法单纯地对网页的链接结构进行分析,忽视了页面内容分析和网页的链接增幅,导致了主题偏离和搜索精度不高的问题.针对上述问题进行研究与分析,将超链接信息检索方法与页面内容相结合,根据优先情节和增长定律,提出了一种改进的基于扩散理论的HITS算法.实验结果表明,与传统的HITS和SALSA算法相比,该HITS算法能够有效地限制主题偏离,提高搜索精度,具有较高的实用价值.