基于蚁群算法优化随机森林模型的汽车保险欺诈识别研究
2017-06-20分类号:F842.634;TP18
【部门】山东科技大学数学与系统科学学院统计系
【摘要】汽车保险欺诈在全球范围内逐步蔓延,车险欺诈识别越来越受到社会关注。本文针对实际汽车保险索赔数据中样本数量大且不平衡的特点,提出了平衡随机森林和蚁群结合的组合分类器。首先,对高维、不平衡的车险索赔数据集进行特征选择与分类,将随机森林的特征重要性评价得分和数据的统计检验得分作为启发式信息,利用蚁群算法进行智能搜索,把随机森林的分类精度反馈给蚁群进行信息素的实时更新,挖掘出判别车险欺诈的特征组合。然后将基于蚁群优化算法的平衡随机森林模型应用到汽车保险欺诈识别中。研究结果表明:基于蚁群优化随机森林算法的汽车保险欺诈识别模型能够更好地对车险索赔数据进行分类预测,挖掘车险欺诈规律,具有更好的精确度和稳健性。
【关键词】汽车保险欺诈 平衡随机森林 蚁群优化算法 启发式信息
【基金】国家自然科学基金项目“基于结构化大数据深度挖掘的非寿险保险公司经营风险模型研究”(61502280);国家自然科学基金面上项目“扩展逻辑Petri网理论及其在跨组织业务过程协同中的应用研究”(61472228); 山东省自然科学基金面上项目“扩展逻辑工作流网理论及其在组织间业务过程协同中的应用研究”(ZR2014FM009); 山东科技大学研究生科技创新项目“基于数据挖掘技术的非寿险公司客户价值和风险管理研究”(SDKDYC170341)
【所属期刊栏目】保险研究
文献传递