卷积神经网络在古籍汉字识别中的应用实践
2019-03-20分类号:G255.1;H12
【部门】上海图书馆 上海宝开软件有限公司 同济大学图书馆
【摘要】文章尝试将卷积神经网络用于数字人文古籍汉字的元数据加工,将古籍汉字识别问题转换为卷积神经网络的分类问题,在缺乏训练集的情况下通过数据生成技术构建训练集进行模型训练,并用于古籍汉字的识别。通过TensorFlow平台,对773个汉字生成约24万个训练样本,网络模型可自行判定不可识别的图片;在提高精确率同时,对这部分数据可直接转由人工识别,系统更为可靠,作为数字人文古籍元数据加工的半自动化工具,旨在提高古籍资源在数字人文应用研究中的效率。
【关键词】智慧图书馆 人工智能 卷积神经网络 数字人文 古籍汉字识别
【基金】
【所属期刊栏目】图书馆论坛
文献传递