标题
  • 标题
  • 作者
  • 关键词

大数据背景下多重抽样框方法探讨

2020-01-07分类号:O212.2;TP311.13

【作者】高詹清  刘艺璇  贺建风  
【部门】中国人民大学经济学院  上海财经大学经济学院  华南理工大学经济与贸易学院  
【摘要】当前所获取的大数据并非都是总体数据,通常未能完全覆盖总体,因其多源异构的特性,致使传统的数据分析方法受阻。文章将抽样调查方法引入到大数据中,对大数据背景下应用多重抽样框的必要性进行剖析,并主要针对大数据中数据多源异构的难点,将每个来源数据作为一个抽样框进行处理,提出了大数据中多重抽样框的构建。进而根据大数据的数据特征进行分类,针对不同情况确定是否需要进行分阶段抽样设计,并提出运用SF估计量对基于多重抽样框的总体进行估计,此估计量较为符合大数据中多重抽样估计的需求,并能对总体有较好的估计。
【关键词】大数据  多重抽样框  多源数据  SF估计量
【基金】国家社会科学基金资助项目(19BTJ022);; 广东省科技计划项目(2019A101002003;2018A070712009);; 广州市“羊城青年学人”项目(17QNXR02);; 华南理工大学中央高校基本科研业务费重点项目(XYZD201906)
【所属期刊栏目】统计与决策
文献传递