基于随机森林的变量重要性研究
2022-02-25分类号:TP181;O212.1
【部门】广东财经大学大数据与教育统计应用实验室 广东财经大学统计与数学学院
【摘要】对变量进行重要性度量是变量选择的依据。变量选择在复杂数据的统计建模和解释预测中具有广泛的研究背景。基于随机森林算法,文章对回归问题中的最小深度、变量在根节点的分裂频次、置换重要性、节点纯度等变量重要性度量进行了原理阐述,并采用数值模拟研究了各种重要性度量的性能,为新方法的设计提供了基础。
【关键词】随机森林 最小深度 分裂频次 节点纯度 置换重要性
【基金】广东省自然科学基金面上项目(2020A1515011580);; 广东财经大学校级学位与研究生教育改革研究项目(2021YB08);; 广东高校省级重点平台和重大科研项目特色创新项目(2018GKTSCX010)
【所属期刊栏目】统计与决策
文献传递