标题
  • 标题
  • 作者
  • 关键词

融合统计思想的大数据算法

2018-07-25分类号:F224

【作者】李扬  张长  朱建平  
【部门】中国人民大学应用统计科学研究中心  中国人民大学统计学院  中国人民大学统计咨询研究中心  厦门大学管理学院MBA中心  厦门大学数据挖掘研究中心  
【摘要】海量化的数据规模作为大数据的第一个特征,带来了计算上的首要挑战。大规模样本不一定能够完全替代总体,因此大数据分析的算法设计不仅要考虑精简计算成本,还要考虑如何刻画估计结果的不确定性。本文以分治自助算法和子集双重自助算法为例讨论了兼具计算效率提升和不确定性评价的可并行计算的大数据统计算法设计,通过比较分析探讨设计思想与未来的研究方向。
【关键词】自助法  不确定性  大规模数据  并行计算
【基金】中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)“生物医学大数据的统计方法基础研究”(15XNI011)的阶段性成果
【所属期刊栏目】统计研究
文献传递