运用Gibbs抽样解决数据缺失
2011-06-30分类号:TP311.13
【部门】东华大学旭日工商管理学院
【摘要】在数据仓库中,传统的缺失值处理方法均存在一定程度缺陷。文章主要论述将统计中的Gibbs抽样仿真概念应用到数据仓库中的缺失值处理中,在满足原有数据条件分布充足的条件下,能够解决传统数据仓库缺失值处理工作量大、数据偏置等问题,并且该方法能够使用excel完成仿真过程,简单易行,可操作性强,能够更为直接和有效的解决现实中的数据仓库中缺失值处理问题。
【关键词】数据仓库 缺失值处理 Gibbs抽样仿真 条件分布充足条件
【基金】
【所属期刊栏目】统计与决策
文献传递