车险定价中风险保费类别的构造——基于广义线性模型与数据驱动的分箱方法
2022-09-15分类号:F841.334
【部门】南开大学金融学院
【摘要】本文基于广义线性模型和数据驱动的分箱方法,对连续型自变量进行分箱处理,最终构建车险定价中的风险保费类别。本文数据来源于R软件包CASdatasets的法国三责险索赔频数数据集freMTPL2freq和索赔强度数据集freMTPL2sev。本文先运用R软件包mgcv,构建了一组索赔频数和索赔强度广义可加模型(GAMs)。再运用R软件包evtree,用进化树算法对连续型自变量进行分箱处理,将连续型变量转化为包含多个水平的分类变量。在此基础上,应用分箱处理得到的分类变量及其他分类变量,构造了另一组索赔频数和索赔强度广义线性模型(GLMs)。本文将由分箱后构造的GLMs和由分箱前构造的GAMs进行模型预测结果对比,发现GLMs和GAMs计算出的预测保费非常接近,而GLMs比GAMs更易直观解释。由此,本文研究得到了一个更简单直接的模型,可作为实务中更复杂车险定价模型的较好替代。
【关键词】车险定价 广义线性模型 进化树算法 分箱 风险保费类别
【基金】国家自然科学基金面上项目“基于整值时间序列和相依结构的保险风险建模与最优管理策略研究”(项目编号:71971216)
【所属期刊栏目】中央财经大学学报
文献传递