Release Time:2019-03-09 Hits:
Indexed by: Conference Paper
Date of Publication: 2004-08-26
Page Number: 406-413
Key Words: 主题识别;文本聚类;信息检索
Abstract: 文本的主题识别是TDT研究计划的核心任务之一.本文研究了文本主题识别的主要算法,并分析了采用不同的文本特征包括Unigram和NGram可以改善算法的性能.同时,针对现有搜索流程的不足,提出了一个基于主题识别技术的应用模型.最后,在该应用模型的基础上设计并实现了一个原型系统.