Current position: Home >> Scientific Research >> Paper Publications

基于句子相似度的文本主题句提取算法研究

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2011-01-01

Journal: 情报学报

Included Journals: CSSCI、ISTIC、PKU

Volume: 30

Issue: 6

Page Number: 605-609

ISSN: 1000-0135

Key Words: 句子相似度 主题句提取 文本分割 句子关系图

Abstract: 文本主题提取是文本挖掘领域的重要研究内容,解决文本信息泛滥的重要手段.为了解决现有文本主题句提取中一些局部主题容易被忽略的问题,本文提出一种"先分割,再提取"的思想.首先将文本表示为句子的线性序列,句子表示为词的线性序列,并对每个句子都预处理为含有实词的词汇链,然后基于知网(Hownet)计算相邻句子相似度.基于句子相似度,采用文本分割技术将文本分为多个关于子主题的句子包,通过句子关系图对这些句子包进行主题句提取.最后选用不同的语料库,设计进行了可接受性测试,实验结果验证该算法是可行、有效地.

Prev One:An Extraction Algorithm of Topic Sentence for Text

Next One:基于主题分割与PageRank算法的文本主题抽取