基于密度的不确定数据流聚类算法
2017-08-15分类号:TP311.13
【部门】东北大学计算机科学与工程学院
【摘要】不确定性的出现使传统算法无法直接用于聚类不确定数据流。该文提出一种不确定数据流环境下基于密度的聚类算法,其中提出不确定度的概念以衡量不确定数据的分布信息,并在改进面向确定数据的聚类算法DENCLUE的基础上,提出一种可处理数据不确定度的UDENCLUE算法,以降低数据的不确定性对聚类结果产生的影响;提出滑动窗口下基于密度的不确定数据流聚类算法USDENCLUE,通过聚类特征指数直方图技术实现快速剪枝,可以高效处理噪音数据、演化数据流并生成任意形状的簇;采用真实数据集及人工合成数据集对USDENCLUE与C
【关键词】不确定数据流 聚类 密度 滑动窗口
【基金】国家自然科学基金面上项目(61173029,61672144)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递