大样本数据聚类的改进方法
2009-01-10分类号:O212.1
【部门】上海大学悉尼工商学院
【摘要】K-means算法是处理大样本数据的聚类分析的常用算法之一。该算法的不足之处是聚类的数目k必须事先给定。文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类;并采用实际数据说明了方法的合理性和有效性。
【关键词】大样本数据 K-means算法 有效性指标 黄金分割法
【基金】
【所属期刊栏目】统计与决策
文献传递