标题
  • 标题
  • 作者
  • 关键词

大规模数据的分块SCAD惩罚回归分析

2018-04-10分类号:F224.0

【作者】蔡超  许启发  蒋翠侠  王艳明  
【部门】山东工商学院统计学院  合肥工业大学管理学院  
【摘要】受到计算内存的限制,大规模数据的回归分析往往难以奏效。为此,借用“化整为零”的思想,提出了一个新的回归分析方法:分块SCAD惩罚回归。该方法核心在于:将大规模数据划分成若干个块,对每一个块进行SCAD惩罚回归,最后将每个块的参数估计结果进行简单平均作为全样本回归系数估计的近似。进一步,在理论上证明了分块SCAD惩罚回归的变量选择效果与渐近性质。数值模拟和实际应用结果表明:分块SCAD惩罚回归不仅能够显著降低计算内存的需求和计算时间,而且其变量选择、参数估计和预测结果等与全样本回归基本一致。
【关键词】回归分析  大规模数据  分块数据  SCAD惩罚  变量选择
【基金】国家自然科学基金(71671056);; 国家社会科学基金(14BTJ028,15BJY008);; 教育部人文社会科学研究规划基金项目(14YJA790015)支持
【所属期刊栏目】数理统计与管理
文献传递