Hits:
Indexed by:期刊论文
Date of Publication:2015-03-15
Journal:计算机科学
Included Journals:PKU、ISTIC、CSCD
Volume:42
Issue:3
Page Number:241-244,260
ISSN No.:1002-137X
Key Words:分类;排序聚合;近邻传播聚类;集成特征选择
Abstract:针对高维数据中的类标记仅与少部分特征关联紧密的问题,提出了基于排序聚合和聚类分组的特征随机选择集成学习方法.采用排序聚合技术对特征进行过滤,选出与样本分类相关的特征,以bicor关联系数作为关联衡量标准,利用近邻传播聚类算法进行分组,使不同组的特征互不关联,然后从每个分组中随机选择一个特征生成特征子集,便可得到多个既存在差异性又具备区分能力的特征子集,最后分别在对应的特征子空间训练基分类器,采用多数投票进行融合集成.在7个基因表达数据集上的实验结果表明,提出的方法分类误差较低,分类性能稳定,可扩展性好.