基于密度峰值聚类和相对距离的半监督自训练方法
2024-09-06分类号:TP18;TP311.13
【部门】重庆公共运输职业学院智能装备学院 重庆能源职业学院汽车工程学院
【摘要】半监督自训练方法属于半监督自标记方法的一种,它能同时利用有标记样本和无标记样本来训练分类器。然而,对半监督自训练方法而言,误标记是一个不容忽视的问题。为此,文章提出了一种基于密度峰值聚类和相对距离的半监督自训练方法(STDPRD)。在迭代的自训练过程中,STDPRD首先用密度峰值聚类来选取具有高置信度的无标记样本,再标记他们;其次,STDPRD用相对距离来过滤掉在迭代过程中被误标记的样本;然后,STDPRD把在迭代过程中被正确标记的样本加入有标记集中;最后,STDPRD用被扩充的有标记集来训练给定的分类器,训练完成后,输出被训练的分类器。仿真实验结果表明,在真实数据集上,STDPRD的表现优于4种流行的半监督自训练方法。
【关键词】半监督学习 半监督分类 相对距离 误标记
【基金】
【所属期刊栏目】统计与决策
文献传递