一种可选初始聚类中心的改进k均值算法
2014-06-30分类号:TP311.13
【部门】长安大学理学院
【摘要】传统的k均值算法对初始聚类中心具有一定的敏感性,聚类结果会随着不同的初始聚类中心波动。针对这一缺点,文章提出一种选择初始聚类中心的算法,该算法首先计算数据对象两两之间的相异度函数,构造一种新的相异度矩阵,然后选取k个与其他数据对象相异度较低且个数最多的数据对象作为初始聚类中心。实验表明,在给定聚类个数k的情况下,这样改进后的k均值算法比随机选取初始聚类中心的传统k均值算法以及已经提出的其中一种改进的k均值算法有更高的准确率,且可消除对初始聚类中心的敏感性。
【关键词】k均值算法 初始聚类中心 相异度矩阵
【基金】国家自然科学基金资助项目(41071247)
【所属期刊栏目】统计与决策
文献传递