基于关联分类算法的PU学习研究
2017-11-25分类号:TP311.13
【部门】南京大学信息管理学院 江苏省数据工程与知识服务重点实验室
【摘要】【目的】基于常用的关联分类算法CBA进行PU学习研究。【方法】将训练集中比例为?的正样本作为未被识别出的正样本,与负样本一起组成未标记样本集,从而构建PU学习场景。其中,基于全部正类别分类关联规则对样本进行分类,并使用分类关联规则相对置信度衡量分类关联规则分类结果的可信度。【结果】当?取值分别为0、0.3、0.6、0.9时,在实验数据集上,本文方法的分类结果的AUC值较CBA算法分别平均提高6.21%、11.15%、13.50%、16.56%,较POSC4.5算法分别平均提高11.27%、15.03%、1
【关键词】关联分类 PU学习 CBA算法
【基金】
【所属期刊栏目】数据分析与知识发现
文献传递