标题
  • 标题
  • 作者
  • 关键词

基于密度峰值聚类的不平衡数据过抽样方法

2024-04-29分类号:TP311.13

【作者】张智驹
【部门】重庆航天职业技术学院智能信息工程学院  
【摘要】大多数不平衡数据过抽样方法依赖于太多参数,容易生成噪声并难以处理流形数据集。为此,文章提出了一种基于密度峰值聚类的不平衡数据过抽样方法(OVMEDPC)。首先,OVMEDPC用密度峰值聚类(DPC)来发现不平衡数据的空间结构;其次,OVMEDPC设计了一种基于密度峰值聚类的噪声过滤方法来移除噪声;最后,OVMEDPC设计了一种基于密度峰值聚类的插值技术来生成少数类的合成样本。实验证明,就随机森林分类器而言,OVMEDPC在F-measure和G-mean上优于5个先进的过抽样方法。
【关键词】不平衡分类  过抽样方法  分类  密度峰值  聚类
【基金】
【所属期刊栏目】统计与决策
文献传递