杨建华

个人信息Personal Information

教授

博士生导师

硕士生导师

性别:男

毕业院校:吉林工业大学

学位:硕士

所在单位:控制科学与工程学院

电子邮箱:jianhuay@dlut.edu.cn

扫描关注

论文成果

当前位置: 中文主页 >> 科学研究 >> 论文成果

基于数据填补和连续属性的朴素贝叶斯算法

点击次数:

论文类型:期刊论文

发表时间:2016-01-01

发表刊物:计算机工程与应用

收录刊物:PKU、ISTIC、CSCD

卷号:52

期号:1

页面范围:133-140

ISSN号:1002-8331

关键字:朴素贝叶斯(NB);期望最大值(EM)算法;连续属性;核密度估计;蛋白质纯化

摘要:朴素贝叶斯算法(NB)在处理分类问题时通常假设训练样本的数值型连续属性满足正态分布,其分类精度也受到训练数据完整性的影响,而实际采样数据很难满足上述要求.针对数据缺失问题,基于期望最大值算法(EM),将朴素贝叶斯分类器利用已有的不完整数据进行参数学习;针对样本数值型连续属性非正态分布的情况,基于核密度估计,利用其分布密度(Distribution Density)和新的分析计算方法来求最大后验分布,同时用标准数据集的分类实验验证了改进的有效性.将改良的算法EM-DNB应用在生物工程蛋白质纯化工艺预测中,实验结果表明,预测精度有所提高.