标题
  • 标题
  • 作者
  • 关键词

基于分而治之的Lasso方法对海量基因数据的研究与验证

2018-07-06分类号:Q811.4

【作者】兰晓然  张灏  
【部门】太原理工大学数学学院  亚利桑那大学数学系  
【摘要】Lasso是一种以一范数为基础的变量选择方法。相比于其他方法,Lasso不仅可以精确地选择出与类属性强相关的变量,而且还保持了变量选择的稳定性。但是Lasso研究在高维海量的基因数据时会出现计算机开销过大的情况。针对这一问题,文章提出一种分而治之的Lasso方法。首先将数据集分成K份,对每一份进行变量选择,再把每份系统的合并,重新进行变量选择。通过检验结果显示,基于分而治之的Lasso方法,在海量的基因数据中进行关联变量选择表现很好。
【关键词】Lasso  分而治之方法  海量基因数据
【基金】国家自然科学基金资助项目(11571009)
【所属期刊栏目】统计与决策
文献传递