王宇
个人信息Personal Information
教授
硕士生导师
性别:男
毕业院校:吉林大学
学位:博士
所在单位:信息管理与信息系统研究所
学科:信息管理与电子政务
办公地点:管理楼518
电子邮箱:ywang@dlut.edu.cn
扫描关注
短文本聚类簇描述及标签生成方法
点击次数:
论文类型:会议论文
发表时间:2015-10-24
页面范围:601-605
关键字:短文本 类簇描述 类簇标签生成 短文本排序 PageRank算法
摘要:从产生大量短文本的微博、微信、用户评论、交互式问答系统等社会化媒体出发,在分析短文本特点的基础上,对短文本聚类得到的类簇描述方法进行了研究。首先,基于网页排序的PageRank算法思想提出短文本重要性排序计算方法;其次,通过选取最具代表性的短文本完成对类簇的描述,满足了用户快速了解类簇内容的需求;再其次,在选取出的几个短文本中进行分词和词频统计,提出按语法规则合并高频词的类簇标签生成方法;最后,以某幼儿教育公司自动问答系统为例,对所提出的类簇标签生成方法进行了验证和分析。