基于Inception-CSA深度学习模型的鸟鸣分类
2023-01-16分类号:Q958;TP18;TN912.3
【部门】中南林业科技大学计算机与信息工程学院/人工智能应用研究所
【摘要】为进一步提高通过声音识别鸟类的精确度,本研究提出基于Inception-CSA深度学习模型的鸟鸣声分类方法,包含鸟鸣声音频样本预处理、特征提取、分类器分类等步骤。首先将鸟鸣声样本预处理成尺寸相同的梅尔频谱图,作为鸟鸣声特征图;再利用Inception-CSA模型对鸟鸣声特征图进行特征提取,其中Inception模块提取鸟鸣声特征图中的多尺度局部时频域特征,CSA模块获取鸟鸣声特征图的全局注意力权重,将二者的输出结合得到更强的特征图,接着利用最大池化层对特征图进行下采样;最后利用全连接层进行分类,得到最终的分类结果。以采集的华南地区自然环境中的10种野生鸟类的鸣叫声构建数据集,用于实验部分以验证方法的有效性。结果表明,本研究提出的方法在自建数据集上准确率达到了93.11%,相比于基于其他经典模型的分类方法,基于Inception-CSA模型的分类方法在拥有较少模型参数量的同时达到了更高的准确率。
【关键词】卷积神经网络 鸟鸣声分类 深度学习 梅尔频谱图 Inception
【基金】国家自然科学基金(62276276);; 智慧物流技术湖南省重点实验室项目(2019TP1015);; 湖南省研究生科研创新项目(CX20210879)
【所属期刊栏目】华中农业大学学报
文献传递

