Hits:
Indexed by:期刊论文
Date of Publication:2009-03-25
Journal:现代图书情报技术
Included Journals:PKU、CSSCI
Issue:3
Page Number:57-61
ISSN No.:1003-3513
Key Words:主题句;句子关系图;句子相似度
Abstract:针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系.抽取文本主题句的任务转化为搜索图中边最多的点.利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题.选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性.