的个人主页 http://faculty.dlut.edu.cn/1989011035/zh_CN/index.htm
点击次数:
论文类型:期刊论文
发表时间:2013-02-10
发表刊物:计算机技术与发展
收录刊物:ISTIC
期号:2
页面范围:1-6
ISSN号:1673-629X
关键字:半监督聚类;未标注数据;标注数据;相似度;多项式模型;模糊聚类
摘要:半监督聚类算法通常利用标注数据优化类别描述参数(如类的中心),然后通过类别描述参数划分无标注数据的类别,但是没有考虑标注数据对其周围无标注数据的类别划分的直接作用.文中提出一种双向选择调整策略,在根据类别描述参数对数据进行类别划分之后,利用标注数据调整其周围未标注数据的类别标签,从而提高类别划分的准确度.该方法根据标注数据周围的数据密度来动态确定数据调整范围,并采用新的相似度计算方法提高被调整的数据准确度.文中利用双向选择调整策略改进了基于多项式模型的半监督聚类算法和半监督模糊聚类算法,并使用多个标准数据集进行实验.实验结果表明改进的算法有效提高了半监督聚类的准确性.