一种改进的K-Prototypes聚类算法
2008-03-10分类号:F224
【部门】中国人民大学统计学院 中国人民大学统计学院 北京100872 北京100872
【摘要】传统的K-Prototypes聚类算法是利用划分的思想来对混合数据进行聚类,但是当混合数据的维度增大时,对象之间的差异度几乎相等,使得此算法难以进行。针对上述缺陷,文章提出一种改进的K-Prototyes聚类算法,聚类前先剔除各类中不相关的维度,将高维混合数据投影降维后再进行聚类。文中给出了Heart Disease Databases的算例,验证了算法的有效性。
【关键词】高维混合数据 投影寻踪聚类 K-Prototyes聚类
【基金】国家自然科学基金资助项目(10431010);; 教育部重点基地重大项目(05JJD910001)
【所属期刊栏目】统计与决策
文献传递