基于Adaptive LASSO Logistic倾向得分模型的网络调查样本推断方法
2022-03-21分类号:TP311.13
【部门】湖北大学数学与统计学学院 华中农业大学理学院
【摘要】网络调查是大数据背景下一种重要的抽样调查方法,然而大多数网络调查样本属于非概率样本,其入样概率未知,需要进行建模估计。之前的研究大多通过构建Logistic倾向得分模型计算入样概率,但是Logistic倾向得分模型通常适用于协变量或混杂变量较少的情况,存在较多协变量或混杂变量时如何进行倾向得分建模推断是一个亟待解决的问题。针对此问题,文章充分考虑经典的变量选择方法Adaptive LASSO的降维特点,提出对网络调查样本建立Adaptive LASSO Logistic倾向得分模型估计倾向得分,进一步利用倾向得分逆加权、未加权与加权均值、未加权与加权中位数的分组调整方法,从而估计总体。研究表明:基于Adaptive LASSO Logistic倾向得分模型的总体均值估计的偏差、方差与均方误差都比基于Logistic倾向得分模型的总体均值估计的偏差、方差与均方误差小。
【关键词】Adaptive LASSO 倾向得分 网络调查样本 加权调整
【基金】国家社会科学基金资助项目(18BTJ022)
【所属期刊栏目】统计与决策
文献传递