基于生成对抗网络的树种识别方法

2024-02-04分类号：S718.49;TP183;TP391.41

【作者】苏彤许杰

【部门】黑龙江八一农垦大学信息工程学院山东华宇工学院信息工程学院

【摘要】【目的】利用卷积神经网络模型进行图像自动识别时，为防止模型过拟合通常需要大量训练样本。本研究为提高树种识别准确率，在原有叶片图像基础上进行图像样本扩充来保证训练质量，提出一种融合生成对抗网络与卷积神经网络的树种识别方法。【方法】在Pytorch框架下，采集10种常见树种（山杨、梣叶槭、榆、刺槐、紫丁香、杜仲、火炬树、山荆子、水曲柳、红端木）叶片图像作为研究对象。首先，采用均值滤波去噪和尺寸归一化对图像进行预处理。其次，以生成对抗网络生成的图像扩充数据集，其中，以深度卷积生成对抗网络（DCGAN）模型为基础并对其进行改进，建立残差条件深度卷积生成对抗网络（RC-DCGAN）模型，将随机噪声和类别标签作为生成器的输入，以控制样本生成过程；在生成器中嵌入残差结构，使生成模型学习更多特征信息，以提高生成图像质量。然后，将原始图像和扩充图像作为卷积神经网络（CNN）的训练集，一方面，使用RC-DCGAN模型和旋转、镜像、改变对比度等传统图像扩充方法，扩充图像11 400幅；另一方面，将原始图像与生成图像、原始图像与传统扩充图像，分别输入至CNN中进行训练，并在原始图像的每个类别中随机挑选50幅对模型进行测试，以验证生成对抗网络对提升识别准确率的可行性。最后，确定适合试验要求的CNN分类模型，并与AlexNet模型、VGG-16模型、VGG-19模型、 ResNet18模型的识别效果进行对比，以检验本研究方法的可行性。【结果】RC-DCGAN模型比DCGAN模型生成的图像质量更高，贴合真实图像；利用生成对抗网络扩充图像的方法与ResNet30树种识别模型，训练准确率为99.03%，平均验证识别准确率为97.20%；而在相同树种识别模型下，传统图像扩充方法的识别率为95.50%；在相同数据集下，AlexNet模型、VGG-16模型、VGG-19模型、ResNet18模型所获得的识别率分别为86.52%、87.57%、91.43%、93.25%，均低于本研究模型的识别率。【结论】联合生成对抗网络和卷积神经网络的方法对本研究10种树种叶片图像的识别准确率最高，且克服了使用传统图像处理扩充方法使模型泛化能力下降的问题，说明利用生成对抗网络对图像扩充的方法具有可行性和有效性，可为相关研究工作提供借鉴。

【关键词】卷积神经网络树种识别生成对抗网络残差结构

【基金】国家自然科学基金项目（31170518）;; 黑龙江省科技攻关项目（GC01KC156）;; 黑龙江省教育规划课题（GJC1319071）

【所属期刊栏目】林业科学

文献传递