Professor
Supervisor of Master's Candidates
Open time:..
The Last Update Time:..
Indexed by:期刊论文
Date of Publication:2013-02-10
Journal:计算机技术与发展
Included Journals:ISTIC
Issue:2
Page Number:1-6
ISSN No.:1673-629X
Key Words:半监督聚类;未标注数据;标注数据;相似度;多项式模型;模糊聚类
Abstract:半监督聚类算法通常利用标注数据优化类别描述参数(如类的中心),然后通过类别描述参数划分无标注数据的类别,但是没有考虑标注数据对其周围无标注数据的类别划分的直接作用.文中提出一种双向选择调整策略,在根据类别描述参数对数据进行类别划分之后,利用标注数据调整其周围未标注数据的类别标签,从而提高类别划分的准确度.该方法根据标注数据周围的数据密度来动态确定数据调整范围,并采用新的相似度计算方法提高被调整的数据准确度.文中利用双向选择调整策略改进了基于多项式模型的半监督聚类算法和半监督模糊聚类算法,并使用多个标准数据集进行实验.实验结果表明改进的算法有效提高了半监督聚类的准确性.