顾宏
开通时间:..
最后更新时间:..
点击次数:
论文类型:会议论文
发表时间:2015-10-20
页面范围:63-63
摘要: 偏标记学习是人们最近提出的一种弱监督机器学习框架,由于放松了训练数据集的构造条件,只需知道训练样本的真实标记的一个候选集合就可进行学习,可以更方便地处理很多领域的实际问题。在该框架下,训练数据的标记信息不再具有单一性和明确性,这就使得学习算法的构建变得比传统分类问题更加困难,目前只建立了几种面向小规模训练数据的学习算法。本文先利用ECOC技术将原始偏标记训练集转换为若干标准二分类数据集,然后基于变分高斯过程模型在每个二分类数据集上构建一个具有较低计算复杂度的二分类算法,最终实现了一种面向大规模数据的快速核偏标记学习算法。仿真实验结果表明,本文算法在预测精度几乎相当的情况下,训练时间要远远快于已有的核偏标记学习算法,利用普通的PC机处理样本规模达到百万级的问题只需要40分钟。