Current position: Home >> Scientific Research >> Paper Publications

基于文本结构树的论文复制检测算法

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2009-10-25

Journal: 现代图书情报技术

Included Journals: CSSCI、PKU

Issue: 10

Page Number: 50-55

Key Words: 复制检测;句子相似度;句子包;结构树

Abstract: 针对目前学术界抄袭现象日趋严重的问题,提出基于文本结构树的论文复制检测算法。将一篇论文分为三层的结构树:最上层的根节点表示整篇论文,分支节点表示句子包,叶节点表示句子。根据一个函数和句子的综合相似度计算句子相似度,以最大句子相似度计算叶节点相似度,上层节点的相似度由相邻的下层节点相似度计算得到。选用中国期刊全文数据库中的论文进行测试,实验结果证明该算法是可行的、高效的。

Prev One:Comparison of Prim and Kruskal on Shanghai and Shenzhen 300 Index hierarchical structure tree

Next One:基于句子包相似度的文本复制检测研究