论文成果

基于语义图优化算法的中文微博观点摘要研究

发表时间:2017-01-01 点击次数:

论文类型:期刊论文

发表刊物:山东大学学报(理学版)

收录刊物:CSCD

文献类型:J

卷号:52

期号:7

页面范围:59-65

ISSN号:1671-9352

关键字:微博摘要;语义图优化;TF-IDF;句子相似度

摘要:为从海量微博中高效地获取不同话题下的关键信息,微博观点摘要成为自然语言处理领域近期研究的热点之一.基线方法基于TF-IDF 算法抽取微博句中的关键词,并据此计算微博的重要性分数,直接筛选出观点摘要;朴素改进方法在基线方法的基础上,增加了情感分类步骤,并利用微博句之间的语义距离,将摘要句候选集中语义重复、重要度较小的句子去除,生成观点摘要;基于语义图优化算法的方法在朴素改进方法的基础上,利用微博句的重要性分数及微博句之间的语义距离构建语义图结构,并通过图优化算法筛选出观点摘要.朴素改进方法在COAE2016 评测任务一测试数据集上,10 个话题的平均ROUGE-1 值达到26. 39%,平均ROUGE-2 值达到 0. 68%,平均ROUGE-SU4 值达到5. 69%,且评测官方公布结果显示,该方法在9 项评价指标中获得6 项最佳性能.基于语义图优化算法的方法在评测样例数据集上进行了实验,结果显示,该方法比朴素改进方法在ROUGE- 1,ROUGE-2,ROUGE-SU4 值上分别提升了0. 63%,1. 51%,2. 69%.

发表时间:2017-01-01