location: Current position: Home >> Scientific Research >> Paper Publications

基于主题句相似度的标题党新闻鉴别技术研究

Hits:

Indexed by:期刊论文

Date of Publication:2011-11-25

Journal:现代图书情报技术

Included Journals:PKU、CSSCI

Issue:11

Page Number:48-53

Key Words:标题党新闻;新闻标题抽取;新闻正文信息抽取;句子相似度计算;主题句抽取

Abstract:针对目前网络上的标题党新闻,提出一种标题党新闻自动识别的算法。通过分析新闻网页构成的特点,抽取出新闻标题和新闻正文;以句子关系矩阵为基础,提出一种以语句为单位的主题句抽取算法;根据句子相似度计算结果来进行判断。实验表明,本方法的识别精度可达到80%,是一种有效的方法。

Pre One:Web2.0下客户反馈信息挖掘的HNC方法

Next One:期刊文献数据仓库的设计与实现