带有治愈亚组的区间删失数据的变量选择方法研究
2021-12-01分类号:R195.1;O212.1
【部门】广州大学经济与统计学院
【摘要】带有治愈亚组的区间删失数据常见于周期性随访或检查的医学研究中,此时研究总体中有一部分个体不会发生所感兴趣的事件,而对于每个发生所感兴趣事件的个体,其事件的发生时间落入某一时间区间内而非被精确地观测到。此外,在实际问题中,我们时常会遇到协变量维数较高的情形,而如何进行变量选择以识别出对疾病发生有重要影响的因素十分重要。本文研究带有治愈亚组的区间删失数据的变量选择问题,我们采用最小近似信息准则方法并提出一种惩罚期望极大化算法来同时实现变量选择和参数估计,所提出方法的一个重要优点是在变量选择过程中无须选择最优调节参数。通过数值模拟,我们比较所提出方法与一般的正则化方法如LASSO,ALASSO,以及SCAD在有限样本下的表现。结果表明,所提出方法有很高的变量选择准确率且在计算上比LASSO,ALASSO和SCAD更加快速、高效。最后,我们将所提出方法应用到一组有关于尼日利亚新生儿童死亡率的区间删失数据中。
【关键词】失效时间 区间删失 变量选择 BIC准则 非混合治愈率模型
【基金】国家自然科学基金(11901128);; 广东省自然科学基金项目(2018A030310068)
【所属期刊栏目】数理统计与管理
文献传递