史彦军
开通时间:..
最后更新时间:..
点击次数:
论文类型:期刊论文
第一作者:金博
通讯作者:Teng, H.-F.
合写作者:史彦军,滕弘飞
发表时间:2005-04-10
发表刊物:大连理工大学学报
收录刊物:EI、PKU、ISTIC、CSCD、Scopus
卷号:45
期号:2
页面范围:291-297
ISSN号:1000-8608
关键字:知网;语义;文本相似度;复制检测;信息检索
摘要:相似度的计算在信息检索及文档复制检测等领域具有广泛的应用前景. 研究了文本相似度的计算方法,在知网语义相似度的基础上,将基于语义理解的文本相似度计算推广到段落范围,进而可以将这种段落相似度推广到篇章相似度计算. 给出了文本(包括词语、句子、段落)相似度的计算公式及算法,用于计算两文本之间的相似度. 实例验证表明,该算法与现有典型的相似度计算方法相比,计算准确性得到提高.