大规模数据的L_1惩罚分位数回归方法研究——基于特征筛选和随机抽样方法
2021-07-25分类号:O212.1
【部门】山东工商学院统计学院
【摘要】为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据L_1惩罚分位数回归方法(FSSLQR)和先抽样后筛选的大规模数据L_1惩罚分位数回归方法(SFSLQR),其数值模拟和实际应用结果表明:FSSLQR和SFSLQR方法不仅能够显著降低计算内存和运行时间,而且其估计预测和变量选择的结果与全量L_1惩罚分位数回归基本一致。此外,与Xu等(2018)提出的大规模数据的L_1惩罚分位数回归方法(SLQR)相比,FSSLQR和SFSLQR方法在估计预测、变量选择和运行时间等方面都更具优势。
【关键词】L_1惩罚分位数回归 大规模数据 特征筛选 随机抽样
【基金】国家自然科学基金(11901356);; 山东省社会科学规划研究项目(20CTJJ01);; 全国统计科学研究项目(2019320)
【所属期刊栏目】数理统计与管理
文献传递