基于局部密度的不确定数据聚类算法
2017-12-25分类号:TP311.13
【部门】兰州交通大学自动化与电气工程学院 兰州交通大学经济管理学院
【摘要】【目的】为解决由经典聚类算法改进而来的不确定数据聚类算法往往存在原有算法本身的缺点问题,提出一种新的不确定数据聚类方法。【方法】改进不确定距离的度量方法,确保两个不确定对象在以一定概率存在的前提下,再进行二者概率差异的比较;确定聚类中心后,依据局部密度定义最大支持点、密度链域等概念,据此提出一种将数据对象归入相应聚类中心所在簇的新算法。【结果】利用UCI机器学习库中的数据集验证本文聚类算法,实验结果表明,F值较传统不确定数据聚类算法(UK-Means和FDBSCAN)在两组数据集上分别最高提升13.23%
【关键词】不确定数据 截止距离 局部密度 密度链域
【基金】国家自然科学基金项目“基于复杂网络的商务大数据聚类与管理应用研究”(项目编号:71461017)的研究成果之一
【所属期刊栏目】数据分析与知识发现
文献传递