非平衡数据集的改进SMOTE再抽样算法
2012-06-15分类号:C81
【部门】中国人民大学应用统计科学研究中心 中国人民大学统计学院
【摘要】非平衡数据集的不均衡学习特点通常表现为负类的分类效果不理想。改进SMOTE再抽样算法,将过抽样和欠抽样方式有机结合,有针对性地选择近邻并采用不同策略合成样本。实验表明,分类器在经此算法处理后的非平衡数据集的正负两类上,均可获得较理想的分类效果。
【关键词】SMOTE算法 再抽样 非平衡数据集
【基金】
【所属期刊栏目】统计研究
文献传递