基于随机森林的加权特征选择算法
2018-09-30分类号:TP18
【部门】太原理工大学数学学院
【摘要】文章提出了一种基于随机森林的加权特征选择算法WRFFS。算法以随机森林为基础,以分类精度作为筛选特征子集的标准,通过在数据集上构造多棵决策树,采用交叉验证的方式进行特征的重要性度量,各决策树的权重和特征重要性度量加权求和决定了最终的特征重要性排序,然后再采用序列后向选择法(Se-quential backward selection,SBS)进行特征的筛选,其中决策树的权重由该决策树与预测结果的相符程度来决定。最后,通过对比实验表明该方法WRFFS比已有文献中方法具有更好的分类性能。
【关键词】高维数据 随机森林 加权特征选择 封装式
【基金】国家自然科学基金资助项目(11402157);; 山西省回国留学人员科研资助项目(2015-032);; 山西省高等学校科技创新项目(2015121);; 山西省应用基础研究项目(2016021013)
【所属期刊栏目】统计与决策
文献传递