Qr code
中文
吴江宁

Professor
Supervisor of Master's Candidates


Gender:Female
Alma Mater:香港大学
Degree:Doctoral Degree
School/Department:001173
Discipline:Management Science and Engineering
Business Address:管理学院 223房间
E-Mail:
Click:Times

Open Time: ..

The Last Update Time: ..

Current position: Home >> Scientific Research >> Paper Publications
一种基于后缀树的Web搜索结果聚类方法

Hits:

Indexed by:Journal Article

Date of Publication:2010-01-01

Journal:情报学报

Included Journals:CSSCI、CSCD、ISTIC、PKU

Volume:29

Issue:1

Page Number:78-83

ISSN:1000-0135

Key Words:Web搜索;后缀树;文档聚类

Abstract:为同时满足Web搜索结果聚类的关联性、快速性以及类别描述的可浏览性等需求,本文提出了一种适合中文Web信息搜索结果的后缀树聚类算法,其中后缀树的构建以中文汉字为基本单位,一种有效的策略解决了基于二进制方法合并短语类后的类别描述问题,利用短语类语义层面的相似性合并同义短语类,有效地改善了聚类结果的质量.测试结果表明:与传统的文档聚类算法相比,基于后缀树的算法在Web文档聚类的精度和效率方面具有较强的优越性.