基于高维数据的加权朴素贝叶斯算法研究
2020-06-03分类号:TP181
【部门】山西财经大学统计学院 山西财经大学信息管理学院
【摘要】针对具有复杂结构的高维数据分类问题,文章提出一种基于特征选择和约简的加权朴素贝叶斯算法(WNBC-FSR)。该算法基于距离相关和最大信息系数的方法,从相关性和冗余性两个角度对高维数据进行特征筛选;采用属性和类别变量间的最大信息系数对属性进行加权,构建并训练加权朴素贝叶斯算法。实验结果表明:在几种算法的比较中,无论是从AUC还是F1值来看,WNBC-FSR算法的分类效果均是最优的。
【关键词】距离相关系数 最大信息系数 相关性 冗余性 加权朴素贝叶斯
【基金】国家社会科学基金资助项目(17BTJ010);; 山西省自然科学基金资助项目(2014011022-2)
【所属期刊栏目】统计与决策
文献传递