标题
  • 标题
  • 作者
  • 关键词

大样本数据聚类的改进方法

2009-01-10分类号:O212.1

【作者】卞亦文  
【部门】上海大学悉尼工商学院  
【摘要】K-means算法是处理大样本数据的聚类分析的常用算法之一。该算法的不足之处是聚类的数目k必须事先给定。文章提出应用黄金分割法来度量有关该聚类的有效性,该方法能自动优化确定最佳的聚类个数,以此实现大样本数据的有效聚类;并采用实际数据说明了方法的合理性和有效性。
【关键词】大样本数据  K-means算法  有效性指标  黄金分割法
【基金】
【所属期刊栏目】统计与决策
文献传递