论聚类分析中聚类标准化与正交化的必要性
2012-06-10分类号:O212.4
【部门】中国人民大学统计学院
【摘要】聚类分析是三大多元统计分析方法之一,在许多领域都有广泛的应用,特别是在模式识别或无学习分类领域,发挥着不可替代的作用。除谱系聚类的ward方法外,聚类分析的关键依据是样品间距。样品间距完全脱胎于几何中的距离概念,但样品间距在几何距离三角可加性里所隐含的各变量量纲必须一致且必须正交的两个关键特性或许是有意或许是不经意地被模糊了。文章认为各变量量纲一致且正交应是聚类分析的强制要求,而主成分分析是正交化的最佳手段,应该成为聚类分析程序相关模块的缺省设置或唯一选项。
【关键词】聚类分析 距离 正交化
【基金】教育部人文社会科学重点研究基地2009年重大项目(2009JJD910001)
【所属期刊栏目】统计与决策
文献传递