高维数据选元:方法比较及其在纳税评估中的应用
2013-08-31分类号:F810.42;F224
【部门】中国人民大学商学院 江苏省盐城市国税局 中国人民银行征信中心博士后科研工作站 中国科学院数学与系统科学研究院
【摘要】线性回归中当备选变元的个数(p)大于样本量(n),尤其当p>>n时,很多经典的统计推断可能失效。因此,高维数据分析技术的理论和实证探讨很有必要。本文讨论了高维数据分析面临的3种新问题,并介绍了SIS、LASSO等6种高维选元方法。模拟部分选用了5种评价准则比较了上述6种方法的选元效果,对比后发现p/n比率和选元效果是相关的:p/n比率较高时SIS的选元效果最好,而当p/n比率降低,特别是降低到p
【关键词】高维数据 降维 选元方法 SIS LASSO
【基金】国家自然科学基金项目(71003100);; 教育部人文社会科学研究资助项目(11YJC630270);; 中央高校基本科研业务费专项资金项目(11XNK027;10XNF020)
【所属期刊栏目】管理评论
文献传递