location: Current position: Home >> Scientific Research >> Paper Publications

基于句子包相似度的文本复制检测研究

Hits:

Indexed by:会议论文

Date of Publication:2009-10-23

Page Number:758-762

Key Words:text copy detection;sentence bag;similarity of sentence;text representation

Abstract:对学术论文的复制检测研究进行了概述和分析.为实现语义相同写法不同的文本的复制检测,提出基于句子包相似度的复制检测算法.该算法注重从句子语义的角度计算句子间的相似度,首先把文本切分成句子包,然后定义并计算句子的相似度,再在此基础上计算句子包的相似度,从而得到文本相似度.本文最后分别从全集复制、超集复制、子集复制和移位复制等几个方面对提出的算法进行了测试和分析,实验结果表明该算法是可行的、高效的.

Pre One:基于文本结构树的论文复制检测算法

Next One:港口数据立方体的关联规则挖掘