非概率样本与概率样本的融合推断新方法
2023-04-24分类号:O212.2
【部门】湖北大学数学与统计学学院 中南财经政法大学统计与数学学院 暨南大学经济学院
【摘要】随着大数据与网络调查的发展,非概率样本重新引起了人们的关注与重视,然而非概率样本入样概率未知,利用非概率样本推断总体存在一定的困难。概率样本入样概率已知,然而其无回答率不断上升使得数据缺失日益严重,而有缺失的概率样本可能会产生有偏的总体估计。文章考虑非概率样本与概率样本的优缺点,提出结合非概率样本与概率样本对总体进行融合推断的方法。假设非概率样本所有变量数据完整,概率样本协变量数据完整而目标变量缺失,首先,对非概率样本建立超总体局部多项式回归模型,预测概率样本缺失的目标变量,得到完整的概率样本数据;然后,结合非概率样本与概率样本,建立倾向得分模型估计各样本单元的倾向得分,并采用倾向得分逆加权和倾向得分加权组调整两种方法进一步进行调整,得到非概率样本的入样概率估计,从而构造非概率样本的权数;最后,对两类样本的权数进一步进行调整,将两类样本融合为一个样本,实现对总体的估计。模拟与实证研究表明,基于超总体模型与倾向得分模型的非概率样本与概率样本融合得到的总体估计在偏差、方差与均方误差上都小于单个样本的总体估计,估计效果较好。
【关键词】超总体模型 倾向得分模型 非概率样本 概率样本 局部多项式回归模型
【基金】国家社会科学基金资助项目(21XTJ006)
【所属期刊栏目】统计与决策
文献传递