大样本线性回归模型的子抽样及变量选择
2022-01-22分类号:O212.1
【部门】北方工业大学理学院
【摘要】文章考虑了大样本下线性回归中同时进行快速估计和变量选择的问题,即针对一个存在稀疏解的大样本线性模型,根据重要性抽样分布从全数据集抽取少量子样本,对该子样本进行自适应Lasso估计。通过随机模拟研究,将该算法分别应用在几种不同的数据集中,并从模型预测精度和可解释性两个方面比较了四种子抽样方法在该算法下的表现。模拟结果表明,所提出的算法具有良好表现,在计算开销上也具有一定优势。
【关键词】大样本 数据降维 子抽样算法 变量选择
【基金】国家社会科学基金资助项目(20BTJ046)
【所属期刊栏目】统计与决策
文献传递