王延章

个人信息Personal Information

教授

博士生导师

硕士生导师

任职 : 电子政务模拟仿真国家地方联合工程研究中心主任

性别:男

毕业院校:大连理工大学

学位:博士

所在单位:信息与决策技术研究所

电子邮箱:yzwang@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

一种基于主动学习的相似记录匹配方法

点击次数:

论文类型:期刊论文

发表时间:2009-02-05

发表刊物:计算机工程

收录刊物:PKU、ISTIC、CSCD

卷号:35

期号:3

页面范围:211-213

ISSN号:1000-3428

关键字:信息集成;相似记录匹配;主动学习;决策树

摘要:针对当前相似记录匹配方法中存在的问题,提出一种改进的机器学习匹配方法.该方法聚类相似记录,生成决策树学习委员会,由学习委员会主动挑选信息量最大的相似记录,由用户标注匹配结果后对学习委员会成员进行训练,自主学习不同数据源间相似记录匹配规则.实际数据的实验分析验证了该方法可以在有效减少训练实例数量的同时获得较高的匹配精度.