Hits:
Indexed by:会议论文
Date of Publication:2004-08-26
Page Number:406-413
Key Words:主题识别;文本聚类;信息检索
Abstract:文本的主题识别是TDT研究计划的核心任务之一.本文研究了文本主题识别的主要算法,并分析了采用不同的文本特征包括Unigram和NGram可以改善算法的性能.同时,针对现有搜索流程的不足,提出了一个基于主题识别技术的应用模型.最后,在该应用模型的基础上设计并实现了一个原型系统.