标题
  • 标题
  • 作者
  • 关键词

基于模糊度的半监督自步协同下的微信流业务识别

2020-03-09分类号:TP18;TN929.5

【作者】刘玮康  秦晓卫  卫国  
【部门】中国科学院无线光电通信重点实验室(中国科学技术大学)  
【摘要】网络数据流的精准业务识别是实现差异化服务的先决条件,常用的监督学习在构建训练数据集时因需要大量人力标注因而难以实施,基于少量标注数据的半监督学习成为研究的热点之一。自步协同训练(Self-paced Co-training)的半监督框架在处理未标记数据时采用了从易到难、多视角协同的方法,但该方法仅以置信度为选取依据给样本打伪标签,容易导致多视角的差异性在训练过程中逐步下降,从而引起协同增益下降、模型性能受限等问题。因此面向微信数据流识别问题,提出了一种基于模糊度的自步协同训练模型(Fuzziness Based Self-paced Co-training, FBSpaCo),在标注伪标签时进一步引入模糊度评估机制,实验表明该模型在保证置信度的前提下有效的避免了训练过程中两视角差异性下降,较已有方法较大提升了识别准确度。
【关键词】数据流识别  半监督学习  自步协同训练  模糊度
【基金】国家科技重大专项(2017ZX03001011-004)资助
【所属期刊栏目】中国科学技术大学学报
文献传递