标题
  • 标题
  • 作者
  • 关键词

大数据下Leverage重要性抽样方法的稳健改进

2016-08-15分类号:F224

【作者】秦磊  熊巍  田茂再  
【部门】对外经济贸易大学统计学院  对外经济贸易大学大数据与风险管理研究中心  中国人民大学统计学院  中国人民大学应用统计研究中心  
【摘要】大数据以其巨大的样本容量或超高的变量维度使得直接计算变得不再可能,如何有效地抽取一个合适的计算样本是值得思考的问题。本文借鉴Leverage重要性抽样的思想,提出了两种稳健的改进抽样算法,不仅有效地抽取了代表性高的计算样本进行回归估计,还规避了方差大和异质性导致协方差矩阵估计不准的问题。模拟数据的分析显示,相比于Ma(2015)的方法,本文提出的方法具有更为优良的估计结果。
【关键词】大数据  重要性抽样  异质性问题  协方差矩阵
【基金】对外经济贸易大学学科建设专项经费“大数据下Leverage重要性抽样方法的稳健改进”(XK2016107);; 对外经济贸易大学中央高校基本科研业务费专项资金资助“高维成分数据的稀硫分类算法及应用”(15QD15);; 对外经济贸易大学中国企业“走出去”协同创新中心科研项目“大数据与投资选点”(201504YY006A)资助
【所属期刊栏目】统计研究
文献传递