标题
  • 标题
  • 作者
  • 关键词

改进Mask R-CNN 的馆藏报纸图像内容分割

2023-11-07分类号:G250.7;TP391.41

【作者】倪劼   叶江松   谢恩泽
【部门】南京图书馆  
【摘要】开展馆藏报纸图像内容分割研究,能提升文字识别准确率,对促进机器识别取代人工操作、提高图书馆数字化工作效率具有重要意义。文章根据报纸图像呈现的特征,提出一种基于改进Mask R-CNN的算法,实现报纸图像内容分割。首先,通过优化锚框比例和损失函数,对原始Mask R-CNN算法进行改进。其次,采用数据增强、调整训练参数开展样本训练。最后,通过实验的方式对改进后的Mask R-CNN算法训练模型和原始算法训练模型进行比较,并采用AP_bbox和AP_segm评价指标对实验结果进行评估,改进后的算法训练模型AP_bbox为0.935,AP_segm为0.943,均超过原始算法训练模型。实验结果表明,改进后的Mask R-CNN算法能够实现报纸图像内容有效检测与分割。
【关键词】Mask R-CNN  报纸数字化  内容分割  目标检测
【基金】江苏省图书馆学会研究课题“基于深度学习的民国时期报纸数字化关键内容研究”(项目编号:22YB067)研究成果
【所属期刊栏目】图书馆论坛
文献传递