域泛化问题中基于Mixup与对比损失的特征转换模型(英文)
2024-04-15分类号:TP18
【部门】中国科学技术大学管理学院统计与金融系
【摘要】当表示基础数据分布的域在训练和测试数据集之间存在差异时,传统的深度神经网络的性能会大幅下降。域泛化方法旨在仅使用源域的训练数据来提高在未知目标域上的泛化能力。主流的域泛化算法通常对一些流行的特征提取网络(如Res Net)进行修改,或者在特征提取网络之后添加更复杂的参数模块。流行的特征提取网络通常在大规模数据集上进行了较好的预训练,因此具有较强的特征提取能力,而对其进行修改会削弱这种能力。添加更复杂的参数模块会导致更深的网络,并且对计算资源要求更高。本文基于域泛化中流行的特征提取网络,提出了一种新的特征转换模型,不做任何更改或添加任何模块。通过结合对比损失和数据增强策略(即Mixup),该特征转换模型的泛化能力得到了提升,并提出了一种新的样本选择策略来与Mixup和对比损失相协作。在基准数据集PACS和Domainnet上的实验结果表明,该方法优于传统的域泛化方法。
【关键词】对比损失 数据增强 深度神经网络 域泛化 特征转换
【基金】supported by the National Natural Science Foundation of China (12171451);; Anhui Center for Applied Mathematics
【所属期刊栏目】中国科学技术大学学报
文献传递