顾宏
开通时间:..
最后更新时间:..
点击次数:
论文类型:期刊论文
发表时间:2010-06-15
发表刊物:电子与信息学报
收录刊物:EI、PKU、ISTIC、CSCD、Scopus
卷号:32
期号:6
页面范围:1284-1288
ISSN号:1009-5896
关键字:孤立点挖掘;一类支持向量机;癌症检测
摘要:一类支持向量机将数据样本映射到高维空间,通过与坐标原点保持最大间隔的特征超平面检测孤立点.实际应用中算法对坐标原点的选择依赖性较强,检测性能受数据样本的分布影响较大;将算法转化为求解二类问题在一定程度上克服了这些不足,但其带来的数据不平衡问题受到现实中孤立点样本稀少或者不存在的影响.该文提出了"孤立点一类支持向量机"算法,并在此基础上设计了一种无监督的孤立点检测方法.分别基于超平面距离和概率输出大小定义两种孤立点异常程度,设定不同权值合并两种异常程度输出,将获得的可疑孤立点特征信息引入算法;在特征空间划分距离可疑孤立点最大间隔的超平面,分析在全部样本上的预测输出大小进而交互更新两部分的数据样本.在UCI数据集上进行了仿真实验,数据结果表明了该文方法能有效的提高检测率,降低误报率;同时样本交叉更新提高了检测的稳定性.