跨语言声学模型在维吾尔语语音识别中的应用

2018-02-06分类号：TP183;TN912.34

【作者】努尔麦麦提·尤鲁瓦斯刘俊华吾守尔·斯拉木热依曼·吐尔逊达吾勒·阿布都哈依尔

【部门】新疆大学信息科学与工程学院科大讯飞股份有限公司

【摘要】对维吾尔语而言,由于数据采集和标注存在各种困难,用于训练声学模型的语音数据不够充分。为此,该文研究了基于长短期记忆网络的跨语言声学模型建模方法,利用汉语庞大的训练数据训练深度神经网络声学模型,然后将网络的输出层权重去掉,用随机化的方式产生与维吾尔语输出层对应的权重值,采用反向传播的方式,利用维吾尔语语音数据更新所有权重来训练维吾尔语声学模型。实验结果表明:该方法使维吾尔语转写和听写识别错误率分别比基线系统相对降低了20%和30%。该方法利用汉语大数据来训练神经网络的隐藏层,使维吾尔语声学模型能在一个较好的

【关键词】声学模型维吾尔语跨语言长短期记忆

【基金】国家自然科学基金项目(61363063,U1603262,61462084);; 新疆维吾尔自治区重点实验室项目(2015KL013)

【所属期刊栏目】清华大学学报(自然科学版)

文献传递