基于高层信息特征的重叠语音检测

2017-01-15分类号：TN912.3

【作者】马勇鲍长春

【部门】北京工业大学电子信息与控制工程学院江苏师范大学物理与电子工程学院

【摘要】重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用通用背景模型(universal background model,UBM)提取语音的语言学高层信息特征,并融合这些特征和Mel频率倒谱系数(Mel frequency cepstral coefficient,MFCC)特征建立隐Markov模型(hidden Markov model,HMM)检测重叠语音,然后对处理后的语音进行说话人分割。实验结果表明:对于由TIMIT语音库生成的数

【关键词】重叠语音检测高层信息特征说话人分割

【基金】国家自然科学基金资助项目(61471014)

【所属期刊栏目】清华大学学报(自然科学版)

文献传递