王宇
个人信息Personal Information
教授
硕士生导师
性别:男
毕业院校:吉林大学
学位:博士
所在单位:信息管理与信息系统研究所
学科:信息管理与电子政务
办公地点:管理楼518
电子邮箱:ywang@dlut.edu.cn
扫描关注
基于句子关系图的网页文本主题句抽取
点击次数:
论文类型:期刊论文
发表时间:2009-03-25
发表刊物:现代图书情报技术
收录刊物:PKU、CSSCI
期号:3
页面范围:57-61
ISSN号:1003-3513
关键字:主题句;句子关系图;句子相似度
摘要:针对网页文本结构信息少、噪声大的特点,将句子看作点,将句子间的相似性看作边,用句子关系图描述文本中句子间的关系.抽取文本主题句的任务转化为搜索图中边最多的点.利用语义词典,将句子相似度定义为句子语义相似度,解决短文本词频相似度低的问题.选用互联网公开语料进行测试,抽取的主题句达到平均80.6%的可接受性.