超高维生存数据中基于相关性秩排序的变量筛选法和FDR控制
2023-10-16分类号:O212.1
【部门】湖北大学数学与统计学学院 湖北大学应用数学湖北省重点实验室 中南财经政法大学统计与数学学院
【摘要】由于超高维生存数据存在删失,因此处理超高维完全数据的变量筛选法大多不再适用。大多数变量筛选法虽能以较大的概率保留所有重要变量,即具有确定筛选性,但却未能很好地控制错误发现率(FDR),所以寻找一种可以平衡模型的可解释性和稳定性的降维方法显得尤为重要。文章探讨了超高维生存数据中基于相关性秩排序且不依赖于模型的变量筛选法和FDR控制,提出了一种使用Knockoff协变量指定变量筛选阈值的两步过程,可以将FDR控制在预先指定的水平α下。数值模拟和实证分析的结果表明,在FDR水平α大于或等于1 s (s是重要变量数量)的情况下,提出的两步CR-Knockoff过程同时具有确定筛选和FDR控制的性能。
【关键词】相关性秩 无模型筛选 Fixed-X Knockoff过滤器 超高维生存数据 CR-Knockoff
【基金】科技大数据湖北省重点实验室(中国科学院武汉文献情报中心)开放基金课题资助课题(E3KF291001);; 湖北大学专业学位研究生课程案例库建设项目(104017544)
【所属期刊栏目】统计与决策
文献传递