文本数字化图像OCR识别的准确度测度实验与提高
2010-05-10分类号:TP391.41
【部门】郑州大学信息管理系
【摘要】基于英国国家图书馆的Reshelp和Burney两个古旧英文报纸数字化项目,作者对文本型数字图像的OCR识别的准确度进行测试实验,结果显示整体准确度不高,且从高到低依次为字符、单词、重要单词、大写字母开头的重要单词。然后,将OCR识别周期划分为数字扫描对象的获取、数字图像的生产、数字图像的处理和文本识别等四个阶段,分析每个阶段影响准确度的因素,探讨提高准确度的具体措施。
【关键词】OCR识别 准确度测试 信息资源数字化
【基金】河南省高校科技创新人才支持计划(2008-551)资助
【所属期刊栏目】图书情报知识
文献传递