基于fused惩罚的稀疏主成分分析
2019-04-25分类号:C815
【部门】中国人民大学应用统计中心 美国北卡州立大学
【摘要】本文旨在研究基于fused惩罚的稀疏主成分分析方法,以适用于相邻变量之间高度相关甚至完全相等的数据情形。首先,从回归分析角度出发,提出一种求解稀疏主成分的简便思路,给出一种广义的稀疏主成分模型——GSPCA模型及其求解算法,并证明在惩罚函数取1-范数时,该模型与现有的稀疏主成分模型——SPC模型的求解结果一致。其次,提出将fused惩罚与主成分分析相结合,得到一种fused稀疏主成分分析方法,并从惩罚性矩阵分解和回归分析两个角度,给出两种模型形式。在理论上证明了两种模型的求解结果是一致的,故将其统称为FSPCA模型。模拟实验显示,FSPCA模型在处理相邻变量之间高度相关甚至完全相等的数据集上表现良好。最后,将FSPCA模型应用于手写数字识别,发现与SPC模型相比,FSPCA模型所提取的主成分具备更好的解释性。
【关键词】主成分分析 稀疏化方法 fused惩罚 手写数字识别 可解释性
【基金】国家自然科学基金项目“基于非结构化数据的个人信用评价”(71873137);国家自然科学基金项目“非对称随机波动建模及其在金融风险管理中的应用研究”(71471173)的资助
【所属期刊栏目】统计研究
文献传递