基于生成对抗网络的树种识别方法
2024-02-04分类号:S718.49;TP183;TP391.41
【部门】黑龙江八一农垦大学信息工程学院 山东华宇工学院信息工程学院
【摘要】【目的】利用卷积神经网络模型进行图像自动识别时,为防止模型过拟合通常需要大量训练样本。本研究为提高树种识别准确率,在原有叶片图像基础上进行图像样本扩充来保证训练质量,提出一种融合生成对抗网络与卷积神经网络的树种识别方法。【方法】在Pytorch框架下,采集10种常见树种(山杨、梣叶槭、榆、刺槐、紫丁香、杜仲、火炬树、山荆子、水曲柳、红端木)叶片图像作为研究对象。首先,采用均值滤波去噪和尺寸归一化对图像进行预处理。其次,以生成对抗网络生成的图像扩充数据集,其中,以深度卷积生成对抗网络(DCGAN)模型为基础并对其进行改进,建立残差条件深度卷积生成对抗网络(RC-DCGAN)模型,将随机噪声和类别标签作为生成器的输入,以控制样本生成过程;在生成器中嵌入残差结构,使生成模型学习更多特征信息,以提高生成图像质量。然后,将原始图像和扩充图像作为卷积神经网络(CNN)的训练集,一方面,使用RC-DCGAN模型和旋转、镜像、改变对比度等传统图像扩充方法,扩充图像11 400幅;另一方面,将原始图像与生成图像、原始图像与传统扩充图像,分别输入至CNN中进行训练,并在原始图像的每个类别中随机挑选50幅对模型进行测试,以验证生成对抗网络对提升识别准确率的可行性。最后,确定适合试验要求的CNN分类模型,并与AlexNet模型、VGG-16模型、VGG-19模型、 ResNet18模型的识别效果进行对比,以检验本研究方法的可行性。【结果】RC-DCGAN模型比DCGAN模型生成的图像质量更高,贴合真实图像;利用生成对抗网络扩充图像的方法与ResNet30树种识别模型,训练准确率为99.03%,平均验证识别准确率为97.20%;而在相同树种识别模型下,传统图像扩充方法的识别率为95.50%;在相同数据集下,AlexNet模型、VGG-16模型、VGG-19模型、ResNet18模型所获得的识别率分别为86.52%、87.57%、91.43%、93.25%,均低于本研究模型的识别率。【结论】联合生成对抗网络和卷积神经网络的方法对本研究10种树种叶片图像的识别准确率最高,且克服了使用传统图像处理扩充方法使模型泛化能力下降的问题,说明利用生成对抗网络对图像扩充的方法具有可行性和有效性,可为相关研究工作提供借鉴。
【关键词】卷积神经网络 树种识别 生成对抗网络 残差结构
【基金】国家自然科学基金项目(31170518);; 黑龙江省科技攻关项目(GC01KC156);; 黑龙江省教育规划课题(GJC1319071)
【所属期刊栏目】林业科学
文献传递