基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法
2017-08-15分类号:TN912.34
【部门】清华大学电子工程系
【摘要】语音识别模型中帧间独立假设在给模型计算带来简洁的同时,不可避免地降低了模型精度,增加了识别错误。该文旨在寻找一种既能满足帧间独立假设又能保持语音信息的特征。分别提出了基于k均值和基于归一化类内方差的语音识别自适应聚类特征提取算法,可以自适应地实现聚类特征流的提取。将该自适应特征分别应用在Gauss混合模型-隐Markov模型、基于段长分布的隐Markov模型和上下文相关的深度神经网络模型这3种语音识别模型中,与基线系统进行了实验对比。结果表明:采用基于归一化类内方差的自适应特征可以使得3种语言模型的识别错
【关键词】特征提取 自适应聚类特征 帧间独立假设 归一化类内方差
【基金】国家自然科学基金面上项目(61374120)
【所属期刊栏目】清华大学学报(自然科学版)
文献传递