朴勇

个人信息Personal Information

副教授

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:软件学院、国际信息与软件学院

办公地点:大连经济开发区大连理工大学软件学院

联系方式:15641190702

电子邮箱:piaoy@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

一种XML文档结构相似度计算方法

点击次数:

论文类型:期刊论文

发表时间:2010-04-15

发表刊物:控制与决策

收录刊物:PKU、ISTIC、CSCD、EI、Scopus

卷号:25

期号:4

页面范围:497-501

ISSN号:1001-0920

关键字:结构相似度;位置权重;最长公共子序列

摘要:对XML文档树路径模型进行扩展,加入了路径的频率信息.基于此路径-频率模型,提出一种带有位置权重的基于路径的结构相似度计算方法(WLCS),并在此基础上提出基于路径频率的XML文档结构向量化方法.在真实数据集上的实验结果表明,WLCS方法召回率和准确率均高于当前存在的基于路径计算相似度的方法,适合于对来自不同DTD的XML文档的相似度比较.