王宇
个人信息Personal Information
教授
硕士生导师
性别:男
毕业院校:吉林大学
学位:博士
所在单位:信息管理与信息系统研究所
学科:信息管理与电子政务
办公地点:管理楼518
电子邮箱:ywang@dlut.edu.cn
扫描关注
基于句子包相似度的文本复制检测研究
点击次数:
论文类型:会议论文
发表时间:2009-10-23
页面范围:758-762
关键字:text copy detection;sentence bag;similarity of sentence;text representation
摘要:对学术论文的复制检测研究进行了概述和分析.为实现语义相同写法不同的文本的复制检测,提出基于句子包相似度的复制检测算法.该算法注重从句子语义的角度计算句子间的相似度,首先把文本切分成句子包,然后定义并计算句子的相似度,再在此基础上计算句子包的相似度,从而得到文本相似度.本文最后分别从全集复制、超集复制、子集复制和移位复制等几个方面对提出的算法进行了测试和分析,实验结果表明该算法是可行的、高效的.