基于分布式Logistic模型的多源对公贷款违约预测方法
2023-11-03分类号:F832.4;F224
【部门】中国人民大学应用统计中心 中国人民大学统计学院 四川农村信用社银行公司业务部
【摘要】随着存储技术的发展,数据的规模和来源日益丰富。商业银行各支行具有相同或相似的业务规划,但各支行对公贷款的违约情况存在明显的异质性。本文基于分布式计算构建对公贷款风险用户识别模型,并首次将处理分布式异质数据的隐私保护模型应用于信用风险评估中。区别于现有的分而治之模型,本文采用先导抽样和一步更新算法,在保护客户隐私的同时,能够有效地融合不同数据源的异质性数据信息,进而使得一步更新估计量具有与全样本估计量相同的收敛速度和渐近方差。模拟表明,不同数据源的异质性越强,本文所提出的一步更新算法的优势就越显著。最后将本文方法应用于我国西南某商业银行的违约用户识别问题,显著提高了预测的准确性。
【关键词】分布式计算 隐私保护 多源数据 大规模异质性数据 Logistic回归
【基金】教育部人文社会科学重点研究基地重大项目(22JJD910001)
【所属期刊栏目】数理统计与管理
文献传递