标题
  • 标题
  • 作者
  • 关键词

基于深度神经网络及隐马尔科夫模型的生猪状态音频识别

2022-05-06分类号:TN912.34;TP183;S828

【作者】彭硕  刘东阳  时国龙  李广博  慕京生  辜丽川  焦俊  
【部门】安徽农业大学信息与计算机学院  蒙城县京徽蒙农业科技发展有限公司  
【摘要】针对传统音频识别方法在生猪音频信号识别中识别率较低的问题,将深度神经网络及隐马尔可夫模型理论作为生猪音频信号识别依据,以长白猪的吃饭声、发情声、嚎叫声、哼叫声和生病长白猪的喘气声为识别对象,利用卡尔曼滤波和改进的EMD-TEO倒谱距离端点检测算法对生猪音频信号进行预处理,把提取的39维的梅尔频率倒谱系数(Mel-frequency cepstral coefficient,MFCC)作为网络学习和识别的数据集,构建基于深度神经网络及隐马尔科夫模型的生猪状态音频识别模型。试验结果表明:1)隐马尔可夫隐状态数设置为5,深度神经网络隐藏层设置为3层,每层128个节点的深度神经网络-隐马尔可夫模型(Deep neural network-hidden Markov model,DNN-HMM),对5种生猪状态音频,即吃饭声、嚎叫声、哼叫声、发情声和病猪喘气声的识别率为70%、95%、75%、80%和95%,总体识别率83%;2)相较于传统的高斯混合模型-隐马尔可夫模型(Gaussian mixture model-hidden Markov model,GMM-HMM),DNN-HMM对相应音频的识别率分别提高了5%、5%、15%、30%、30%,总体识别率提高了17%;3)DNN-HMM模型对于5种不同类型的生猪音频信号均呈现出较好的识别效果。基于DNNHMM生猪音频识别模型,对生猪不同状态下音频的识别具有较高正确率,且更为可靠。
【关键词】生猪  MFCC  卡尔曼滤波  DNN-HMM  识别  音频信号
【基金】安徽省科技重大攻关项目(16030701092);; 安徽省2019年度科技重大专项(201903a06020009)
【所属期刊栏目】中国农业大学学报
文献传递