基于KS检验的高斯混合模型分裂与合并算法
2018-06-15分类号:TP301.6
【部门】天津科技大学计算机科学与信息工程学院
【摘要】高斯混合模型是有限个独立高斯模型的线性组合,估计其子模型个数是一个重要的研究问题.一类典型的算法是以最短描述长度为目标函数,在迭代过程中通过对子模型进行分裂与合并操作确定子模型个数.这类方法一般采用熵比、KL散度和模型相似度作为分裂和合并的判别准则.但是熵比或KL散度准则对稀疏子模型和凹形子模型过于敏感导致过度分裂,模型相似度准则不能反映合并后模型的高斯拟合优度导致过度合并.在算法的迭代过程中,这些过度分裂与合并操作产生振荡现象.针对估计子模型个数时出现的过度分裂与合并问题,基于KS检验的高斯混合模型的分裂与合并算法选择熵比与KS检验作为分裂的判别准则,模型相似度和KS检验作为合并的判别准则.最后在六个数据集上进行了实验证明算法的有效性.
【关键词】高斯混合模型 最短描述长度 熵比 KS检验
【基金】国家自然科学基金(61402332,61502338,61402331);; 天津市科学技术委员会项目(17JCQNJC00400,15ZCZDGX00200,15JCQNJC00700)资助
【所属期刊栏目】中国科学技术大学学报
文献传递