处理不平衡征信数据的零膨胀信用评级模型
2019-02-01分类号:F832.4
【部门】安康学院数学与统计学院 中国人民大学应用统计科学研究中心 国网能源研究院有限公司
【摘要】征信数据中的客户往往呈现"好多坏少"的不平衡结构,这种结构使得一般的分类模型在预测客户信用表现时失效。本文基于零膨胀计数模型的建模思想,分别提出处理因变量为二分类变量、多分类变量、计数变量的零膨胀信用评级模型(ZICSM),将客户结构拆分为稳定好客户、不稳定好客户和坏客户三个部分,利用模型自身优势形成严谨和宽松的两套贷款审批机制。ZICSM模型对目标函数进行权数调整,使模型更加关注"坏"客户,在目标函数中加入惩罚项,使模型具备组变量选择功能。此外,本文提出兼顾风险把控和市场份额的RS得分指标,借以评价信用评级模型的分类效果。模拟研究和实证研究的结果表明,ZICSM模型能够提升金融机构的贷款收益,增加其审批机制的灵活性,适用于处理征信数据的不平衡问题。
【关键词】信用评级模型 不平衡数据 零膨胀模型 特征选择 RS得分
【基金】教育部人文社会科学重点研究基地重大项目(15JJD910002)
【所属期刊栏目】数理统计与管理
文献传递