Release Time:2019-03-12 Hits:
Indexed by: Conference Paper
Date of Publication: 2015-10-24
Page Number: 601-605
Key Words: 短文本 类簇描述 类簇标签生成 短文本排序 PageRank算法
Abstract: 从产生大量短文本的微博、微信、用户评论、交互式问答系统等社会化媒体出发,在分析短文本特点的基础上,对短文本聚类得到的类簇描述方法进行了研究。首先,基于网页排序的PageRank算法思想提出短文本重要性排序计算方法;其次,通过选取最具代表性的短文本完成对类簇的描述,满足了用户快速了解类簇内容的需求;再其次,在选取出的几个短文本中进行分词和词频统计,提出按语法规则合并高频词的类簇标签生成方法;最后,以某幼儿教育公司自动问答系统为例,对所提出的类簇标签生成方法进行了验证和分析。