缺失数据的处理方法及其发展趋势
2019-11-28分类号:F224;O212
【部门】广西大学广西制造系统与先进制造技术重点实验室 广西大学机械工程学院
【摘要】文章介绍了数据缺失的现象、概念、出现的领域以及产生的原因,总结了数据缺失机制和数据缺失模式;综述了目前缺失数据常用的处理方法:加权法、删除法、统计学插补法以及机器学习插补法,并综合比较了各种方法的适用范围和优缺点;最后提出了针对高维数据的缺失处理、复合缺失数据特征的处理、新领域的缺失数据处理将是未来缺失数据处理方法的研究方向。
【关键词】缺失数据 处理方法 单一插补 多重插补 方法比较
【基金】国家自然科学基金资助项目(71562002;51965006);; 广西自然科学基金资助项目(2018GXNSFAA050111);; 广西制造系统与先进制造技术重点实验室项目(16-380-12S011;17-259-05S006);; 广西高等教育本科教学改革工程项目(2017JGA126);; 广西研究生教育创新计划项目(YCSW2019035)
【所属期刊栏目】统计与决策
文献传递