location: Current position: Home >> Scientific Research >> Paper Publications

基于句子关系图的网页文本主题句抽取

Hits:

Indexed by:期刊论文

Date of Publication:2009-03-25

Journal:现代图书情报技术

Included Journals:PKU、CSSCI

Issue:3

Page Number:57-61

ISSN No.:1003-3513

Key Words:主题句;句子关系图;句子相似度

Abstract:针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系.抽取文本主题句的任务转化为搜索图中边最多的点.利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题.选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性.

Pre One:Text Representation and Classification Based on Multi-Instance Learning

Next One:基于句子的文本表示及中文文本分类研究