标题
  • 标题
  • 作者
  • 关键词

基于迁移学习的噪声鲁棒语音识别声学建模

2017-11-16分类号:TN912.34

【作者】易江燕  陶建华  刘斌  温正棋  
【部门】中国科学院自动化研究所模式识别国家重点实验室  中国科学院大学人工智能技术学院  中国科学院自动化研究所中国科学院脑科学与智能技术研究中心  
【摘要】为了提高噪声环境下语音识别系统的鲁棒性,提出了一种基于迁移学习的声学建模方法。该方法用干净语音的声学模型(老师模型)指导带噪语音的声学模型(学生模型)进行训练。学生模型在训练过程中,尽量使其逼近老师模型的后验概率分布。学生模型和老师模型间的后验概率分布差异通过相对熵(KL divergence)加以最小化。CHiME-2数据集上的实验结果表明,该方法的平均词错率(WER)比基线的绝对下降了7.29%,比CHiME-2竞赛第一名的绝对下降了3.92%。
【关键词】鲁棒语音识别  声学模型  神经网络  迁移学习
【基金】国家”八六三”高技术项目(2015AA016305);; 国家自然科学基金面上项目(61425017,61403386);; 中国科学院战略性先导科技专项(GrantXDB02080006)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递