基于有限训练数据和开放集学习的鲁棒小型关键词检测系统
2024-08-28分类号:TP18;TN912.3
【部门】西北工业大学航海学院 西北工业大学深圳研究院
【摘要】关键词检测旨在从语音中检测出待识别的关键词,深度神经网络为小型关键词检测任务提供了有效的解决方案。大多数现有关键词检测方法采用Softmax最小化交叉熵损失函数,假设测试和训练样本来自相同分布,侧重于在训练集上最大化分类精度,而未考虑训练集外的未知语音。若训练数据有限,关键词检测系统在遇到未知语音时,实现鲁棒性和高准确率仍比较困难。该文研究了开放集学习方法,结合深度特征编码器和基于卷积原型学习、互斥点学习的分类器,用于开放集关键词检测任务。该文提出的关键词检测方法不仅提高了关键词的分类精度,而且具有较好的非关键词检测性能。在Google Speech Commands数据集V0.01和V0.02,以及由LibriS peech衍生的LibriW ords数据集上的试验结果表明:该文提出的关键词检测方法在大多数评估指标上优于基线方法。
【关键词】有限训练数据 关键词检测 开放集识别 原型学习
【基金】国家自然科学基金面上项目(62176211);; 深圳市科创委国际合作研究项目(GJHZ20240218114401004)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递