王宇

个人信息Personal Information

教授

硕士生导师

性别:男

毕业院校:吉林大学

学位:博士

所在单位:信息管理与信息系统研究所

学科:信息管理与电子政务

办公地点:管理楼518

电子邮箱:ywang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

短文本聚类簇描述及标签生成方法

点击次数:

论文类型:会议论文

发表时间:2015-10-24

页面范围:601-605

关键字:短文本 类簇描述 类簇标签生成 短文本排序 PageRank算法

摘要:从产生大量短文本的微博、微信、用户评论、交互式问答系统等社会化媒体出发,在分析短文本特点的基础上,对短文本聚类得到的类簇描述方法进行了研究。首先,基于网页排序的PageRank算法思想提出短文本重要性排序计算方法;其次,通过选取最具代表性的短文本完成对类簇的描述,满足了用户快速了解类簇内容的需求;再其次,在选取出的几个短文本中进行分词和词频统计,提出按语法规则合并高频词的类簇标签生成方法;最后,以某幼儿教育公司自动问答系统为例,对所提出的类簇标签生成方法进行了验证和分析。