朴勇
个人信息Personal Information
副教授
硕士生导师
性别:男
毕业院校:大连理工大学
学位:博士
所在单位:软件学院、国际信息与软件学院
办公地点:大连经济开发区大连理工大学软件学院
联系方式:15641190702
电子邮箱:piaoy@dlut.edu.cn
扫描关注
一种XML文档结构相似度计算方法
点击次数:
论文类型:期刊论文
发表时间:2010-04-15
发表刊物:控制与决策
收录刊物:PKU、ISTIC、CSCD、EI、Scopus
卷号:25
期号:4
页面范围:497-501
ISSN号:1001-0920
关键字:结构相似度;位置权重;最长公共子序列
摘要:对XML文档树路径模型进行扩展,加入了路径的频率信息.基于此路径-频率模型,提出一种带有位置权重的基于路径的结构相似度计算方法(WLCS),并在此基础上提出基于路径频率的XML文档结构向量化方法.在真实数据集上的实验结果表明,WLCS方法召回率和准确率均高于当前存在的基于路径计算相似度的方法,适合于对来自不同DTD的XML文档的相似度比较.