标题
  • 标题
  • 作者
  • 关键词

异质性数据下广义线性模型的Maximin似然比估计及应用

2018-06-25分类号:O212.1

【作者】秦磊  夏传信  施建军  
【部门】对外经济贸易大学统计学院  北大光华管理学院  对外经济贸易大学大数据与风险管理研究中心  中国教育审计学会  教育部高等学校统计学类专业教学指导委员会  
【摘要】针对具有多个来源的异质性数据,文献中通常提出复杂程度较高的模型用于描述每个数据子总体的特征,而本文着眼于刻画不同数据子总体的共性进而建立一个简单的模型。在参数估计方面,本文借鉴了普通线性模型的Maximin估计思想,提出了适用于广义线性模型的Maximin似然比估计方法及稀疏结构下的惩罚估计。该方法通过最大化所有子总体中似然比统计量的最小值,构建了一个简单而保守的模型,以减少数据来源较多而呈现的复杂性。本文所提方法适用于因变量服从正态分布、两点分布、泊松分布等指数族分布的情形,丰富了前人的研究成果,具有更好的实践意义。模拟分析显示,相比于经典的估计方法,Maximin似然比估计方法不仅能够有效地探寻子总体的共性,而且具有较高的样本外预测精度。本文的方法也适用于政府统计和经济统计中具有异质性的大型数据集。
【关键词】异质性  指数族分布  Maximin似然比估计  惩罚估计
【基金】北京市自然科学基金项目“大规模成分数据的分类算法及应用研究”(4164100);; 国家自然科学基金项目“基于广义SICA惩罚函数的高维数据参数估计与变量选取研究”(61603092)资助
【所属期刊栏目】统计研究
文献传递