基于聚类关联规则的缺失数据处理研究
2011-02-15分类号:TP311.13
【部门】厦门大学经济学院 台湾辅仁大学统计资讯系 厦门大学
【摘要】本文提出了基于聚类和关联规则的缺失数据处理新方法,通过聚类方法将含有缺失数据的数据集相近的记录归到一类,然后利用改进后的关联规则方法对各子数据集挖掘变量间的关联性,并利用这种关联性来填补缺失数据。通过实例分析,发现该方法对缺失数据处理,尤其是对在先验辅助信息缺失情况下的海量数据集具有较好的效果。
【关键词】聚类 关联规则 缺失数据 插补
【基金】国家社科基金重点项目“国家统计数据质量管理问题研究”(09AZD0345)阶段性成果
【所属期刊栏目】统计研究
文献传递