Release Time:2019-03-10 Hits:
Indexed by: Journal Article
Date of Publication: 2011-11-25
Journal: 现代图书情报技术
Included Journals: CSSCI、PKU
Issue: 11
Page Number: 48-53
Key Words: 标题党新闻;新闻标题抽取;新闻正文信息抽取;句子相似度计算;主题句抽取
Abstract: 针对目前网络上的标题党新闻,提出一种标题党新闻自动识别的算法。通过分析新闻网页构成的特点,抽取出新闻标题和新闻正文;以句子关系矩阵为基础,提出一种以语句为单位的主题句抽取算法;根据句子相似度计算结果来进行判断。实验表明,本方法的识别精度可达到80%,是一种有效的方法。