Hits:
Indexed by:期刊论文
Date of Publication:2017-01-01
Journal:山东大学学报(理学版)
Included Journals:CSCD
Volume:52
Issue:7
Page Number:59-65
ISSN No.:1671-9352
Key Words:微博摘要;语义图优化;TF-IDF;句子相似度
Abstract:为从海量微博中高效地获取不同话题下的关键信息,微博观点摘要成为自然语言处理领域近期研究的热点之一.基线方法基于TF-IDF 算法抽取微博句中的关键词,并据此计算微博的重要性分数,直接筛选出观点摘要;朴素改进方法在基线方法的基础上,增加了情感分类步骤,并利用微博句之间的语义距离,将摘要句候选集中语义重复、重要度较小的句子去除,生成观点摘要;基于语义图优化算法的方法在朴素改进方法的基础上,利用微博句的重要性分数及微博句之间的语义距离构建语义图结构,并通过图优化算法筛选出观点摘要.朴素改进方法在COAE2016 评测任务一测试数据集上,10 个话题的平均ROUGE-1 值达到26. 39%,平均ROUGE-2 值达到 0. 68%,平均ROUGE-SU4 值达到5. 69%,且评测官方公布结果显示,该方法在9 项评价指标中获得6 项最佳性能.基于语义图优化算法的方法在评测样例数据集上进行了实验,结果显示,该方法比朴素改进方法在ROUGE- 1,ROUGE-2,ROUGE-SU4 值上分别提升了0. 63%,1. 51%,2. 69%.