基于DNN-LSTM的VAD算法
2018-04-10分类号:TN912.34
【部门】太原理工大学信息工程学院
【摘要】基于深度神经网络(deep neural network,DNN)的语音活动性检测(voice activity detection,VAD)忽略了声学特征在时间上的相关性,在带噪环境下性能会明显下降。该文提出了一种基于深度神经网络和长短时记忆单元(long-short term memory,LSTM)的混合网络结构应用于VAD问题。进一步对语音帧的动态信息加以分析利用,同时结合DNN-LSTM结构使用一种基于上下文信息的代价函数用于网络训练。实验语料基于TIDIGITS语音库,使用Noisex-92噪
【关键词】语音活动性检测(VAD) 深度神经网络(DNN) 长短时记忆单元(LSTM)
【基金】国家自然科学基金资助项目(61371193);; 国家级大学生创新创业训练项目(201610112007)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递