Current position: Home >> Scientific Research >> Paper Publications

一种有效的专题信息集中和检索策略

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2010-06-15

Journal: 计算机应用研究

Included Journals: CSCD、ISTIC、PKU

Volume: 27

Issue: 6

Page Number: 2106-2108

ISSN: 1001-3695

Key Words: HITS算法;锚文本;网页标题;专题相关度;向量模型;专题训练集

Abstract: Internet上专题资源网页汇聚和检索是垂直搜索引擎中的核心问题,HITS算法是早期解决这个问题的经典算法,很多文献对它进行了改进,但无论索引的主题相关率还是引擎的查准率都有提高的余地.提出一种基于锚文本和标题信息过滤并结合网页内容相关度判断的HITS专题检索策略,利用专题训练集判断主题相关度,很好地解决了只依靠查询字符串判断的弊端.实验表明,此策略能很好地提高专题信息汇聚精确度和检索的准确率,并且减少了非相关URL的下载量.

Prev One:非接触式浮体六自由度监测系统研究

Next One:基于空间PACT和颜色特征的场景语义识别