基于重抽样法处理不平衡问题的信用评级模型
2020-03-31分类号:F832.4
【部门】国网能源研究院有限公司 中国人民大学统计学院
【摘要】由于履约客户的数量远远大于违约客户,征信数据具备严重的不平衡特征,常用的处理方法较少同时考虑金融机构所关注的违约损失和市场份额因素。本文基于违约损失因素提出迭代重抽样集成模型(IRIM),利用迭代欠抽样方法提升模型对"坏"客户的关注,采用集成方法将弱分类模型转变为强分类模型;基于市场份额因素改进常用的F-value指标,引入评价分类效果的RS指标。在6类不平衡关系下进行模拟研究,并对SSBF数据和中国某银行征信数据进行实证研究。结果表明,与常用的方法和指标相比,迭代重抽样集成模型能够在确保市场份额不过度减少的情况下降低金融机构的违约风险,RS指标能够恰当地权衡市场份额和违约风险的关系。
【关键词】信用评级模型 不平衡 迭代重抽样 评价指标
【基金】教育部人文社会科学重点研究基地重大项目(15JJD910002)
【所属期刊栏目】管理评论
文献传递