论文名称:基于语义图优化算法的中文微博观点摘要研究 论文类型:期刊论文 发表刊物:山东大学学报(理学版) 收录刊物:CSCD 卷号:52 期号:7 页面范围:59-65 ISSN号:1671-9352 关键字:微博摘要;语义图优化;TF-IDF;句子相似度 摘要:为从海量微博中高效地获取不同话题下的关键信息,微博观点摘要成为自然语言处理领域近期研究的热点之一.基线方法基于TF-IDF 算法抽取微博句中的关键词,并据此计算微博的重要性分数,直接筛选出观点摘要;朴素改进方法在基线方法的基础上,增加了情感分类步骤,并利用微博句之间的语义距离,将摘要句候选集中语义重复、重要度较小的句子去除,生成观点摘要;基于语义图优化算法的方法在朴素改进方法的基础上,利用微博句的重要性分数及微博句之间的语义距离构建语义图结构,并通过图优化算法筛选出观点摘要.朴素改进方法在COAE2016 评测任务一测试数据集上,10 个话题的平均ROUGE-1 值达到26. 39%,平均ROUGE-2 值达到 0. 68%,平均ROUGE-SU4 值达到5. 69%,且评测官方公布结果显示,该方法在9 项评价指标中获得6 项最佳性能.基于语义图优化算法的方法在评测样例数据集上进行了实验,结果显示,该方法比朴素改进方法在ROUGE- 1,ROUGE-2,ROUGE-SU4 值上分别提升了0. 63%,1. 51%,2. 69%. 发表时间:2017-01-01