混合型数据聚类方法的比较
2019-05-28分类号:TP311.13
【部门】北京航空航天大学数学与系统科学学院 北京航空航天大学"数学、信息与行为"教育部重点实验室 北京大学前沿交叉学科研究院
【摘要】为了科学使用真实世界数据,探索适用于日益常见的混合型数据的聚类方法,文章分析和比较了两种典型的混合型数据聚类方法K-prototypes与ClustMD,改进了聚类方法关键参数选择方法,并提出聚类稳定性指标。结果表明,两种聚类方法均具有很高的有效性和稳定性,各有优缺点。当数据相关性强、数据缺失严重或非连续变量较多时,建议使用K-prototypes。
【关键词】混合型数据 聚类有效性 聚类稳定性
【基金】
【所属期刊栏目】统计与决策
文献传递