标题
  • 标题
  • 作者
  • 关键词

基于高维数据的加权朴素贝叶斯算法研究

2020-06-03分类号:TP181

【作者】赵海霞  李赟  石洪波  
【部门】山西财经大学统计学院  山西财经大学信息管理学院  
【摘要】针对具有复杂结构的高维数据分类问题,文章提出一种基于特征选择和约简的加权朴素贝叶斯算法(WNBC-FSR)。该算法基于距离相关和最大信息系数的方法,从相关性和冗余性两个角度对高维数据进行特征筛选;采用属性和类别变量间的最大信息系数对属性进行加权,构建并训练加权朴素贝叶斯算法。实验结果表明:在几种算法的比较中,无论是从AUC还是F1值来看,WNBC-FSR算法的分类效果均是最优的。
【关键词】距离相关系数  最大信息系数  相关性  冗余性  加权朴素贝叶斯
【基金】国家社会科学基金资助项目(17BTJ010);; 山西省自然科学基金资助项目(2014011022-2)
【所属期刊栏目】统计与决策
文献传递