王宇

个人信息Personal Information

教授

硕士生导师

性别:男

毕业院校:吉林大学

学位:博士

所在单位:信息管理与信息系统研究所

学科:信息管理与电子政务

办公地点:管理楼518

电子邮箱:ywang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于句子关系图的网页文本主题句抽取

点击次数:

论文类型:期刊论文

发表时间:2009-03-25

发表刊物:现代图书情报技术

收录刊物:PKU、CSSCI

期号:3

页面范围:57-61

ISSN号:1003-3513

关键字:主题句;句子关系图;句子相似度

摘要:针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系.抽取文本主题句的任务转化为搜索图中边最多的点.利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题.选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性.