扫描手机二维码

欢迎您的访问
您是第 位访客

开通时间:..

最后更新时间:..

  • 吴江宁 ( 教授 )

    的个人主页 http://faculty.dlut.edu.cn/1989011035/zh_CN/index.htm

  •   教授   硕士生导师
论文成果 当前位置: 中文主页 >> 科学研究 >> 论文成果
一种基于后缀树的Web搜索结果聚类方法

点击次数:
论文类型:期刊论文
发表时间:2010-01-01
发表刊物:情报学报
收录刊物:PKU、ISTIC、CSCD、CSSCI
卷号:29
期号:1
页面范围:78-83
ISSN号:1000-0135
关键字:Web搜索;后缀树;文档聚类
摘要:为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量.测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性.

 

辽ICP备05001357号 地址:中国·辽宁省大连市甘井子区凌工路2号 邮编:116024
版权所有:大连理工大学