分类属性数据的泛化中心聚类算法
2014-12-25分类号:TP311.13
【部门】北京科技大学东凌经济管理学院
【摘要】针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。
【关键词】聚类算法 泛化中心 分类属性 K-modes
【基金】国家自然科学基金资助项目(71271027); 中央高校基本科研业务费专项资金(FRF-TP-10-006B); 高等学校博士学科点专项科研基金(20120006110037)
【所属期刊栏目】运筹与管理
文献传递