大数据背景下非概率抽样的统计推断问题
2016-03-15分类号:C81
【部门】中国人民大学应用统计科学研究中心 中国人民大学统计学院 中国人民大学
【摘要】利用大数据进行抽样,很多情况下由于抽样框的构造比较困难,使得抽取的样本属于非概率样本,传统的抽样推断理论难以应用到非概率样本中,如何解决非概率抽样的统计推断问题,是大数据背景下抽样调查面临的严重挑战。本文提出了解决非概率抽样统计推断问题的基本思路:一是抽样方法,可以考虑基于样本匹配的样本选择、链接跟踪抽样方法等,使得到的非概率样本近似于概率样本,从而可采用概率样本的统计推断理论;二是权数的构造与调整,可以考虑基于伪设计、模型和倾向得分等方法得到类似于概率样本的基础权数;三是估计,可以考虑基于伪设计、模型和贝叶斯的混合概率估计。最后,本文以基于样本匹配的样本选择为例探讨了具体解决方法。
【关键词】大数据 非概率抽样 统计推断
【基金】中国人民大学2015年度拔尖创新人才培育资助计划成果
【所属期刊栏目】统计研究
文献传递