王宇

个人信息Personal Information

教授

硕士生导师

性别:男

毕业院校:吉林大学

学位:博士

所在单位:信息管理与信息系统研究所

学科:信息管理与电子政务

办公地点:管理楼518

电子邮箱:ywang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于句子包相似度的文本复制检测研究

点击次数:

论文类型:会议论文

发表时间:2009-10-23

页面范围:758-762

关键字:text copy detection;sentence bag;similarity of sentence;text representation

摘要:对学术论文的复制检测研究进行了概述和分析.为实现语义相同写法不同的文本的复制检测,提出基于句子包相似度的复制检测算法.该算法注重从句子语义的角度计算句子间的相似度,首先把文本切分成句子包,然后定义并计算句子的相似度,再在此基础上计算句子包的相似度,从而得到文本相似度.本文最后分别从全集复制、超集复制、子集复制和移位复制等几个方面对提出的算法进行了测试和分析,实验结果表明该算法是可行的、高效的.