朴勇

个人信息Personal Information

副教授

硕士生导师

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:软件学院、国际信息与软件学院

办公地点:大连经济开发区大连理工大学软件学院

联系方式:15641190702

电子邮箱:piaoy@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于张量的XML相似度计算方法

点击次数:

论文类型:期刊论文

发表时间:2016-01-21

发表刊物:控制与决策

收录刊物:PKU、ISTIC、CSCD、Scopus、EI

卷号:31

期号:9

页面范围:1711-1714

ISSN号:1001-0920

关键字:扩展标记语言;综合相似度;张量分析;特征降维

摘要:扩展标记语言(XML)带有一定的结构和语义信息,与普通文本相比, XML具有描述精确、表现形式丰富等特点,但同时也使得传统的自然语言处理和数据挖掘等技术不能直接应用。根据XML内容和结构并非独立,内容影响结构,结构作用于内容,提出一种基于张量的XML特征降维及综合相似度计算方法。针对XML文档,使用张量表示并采用基于最大互信息的方法对其进行降维,采用将XML结构和内容相融合的综合相似度度量方法确定结构和内容的内在联系及共同作用方式,提高XML综合相似度计算性能。实验及结果分析验证了所提出方法的有效性。