标题
  • 标题
  • 作者
  • 关键词

卷积神经网络在古籍汉字识别中的应用实践

2019-03-20分类号:G255.1;H12

【作者】郭利敏  葛亮  刘悦如  
【部门】上海图书馆  上海宝开软件有限公司  同济大学图书馆  
【摘要】文章尝试将卷积神经网络用于数字人文古籍汉字的元数据加工,将古籍汉字识别问题转换为卷积神经网络的分类问题,在缺乏训练集的情况下通过数据生成技术构建训练集进行模型训练,并用于古籍汉字的识别。通过TensorFlow平台,对773个汉字生成约24万个训练样本,网络模型可自行判定不可识别的图片;在提高精确率同时,对这部分数据可直接转由人工识别,系统更为可靠,作为数字人文古籍元数据加工的半自动化工具,旨在提高古籍资源在数字人文应用研究中的效率。
【关键词】智慧图书馆  人工智能  卷积神经网络  数字人文  古籍汉字识别
【基金】
【所属期刊栏目】图书馆论坛
文献传递