标题
  • 标题
  • 作者
  • 关键词

文本数字化图像OCR识别的准确度测度实验与提高

2010-05-10分类号:TP391.41

【作者】臧国全  
【部门】郑州大学信息管理系  
【摘要】基于英国国家图书馆的Reshelp和Burney两个古旧英文报纸数字化项目,作者对文本型数字图像的OCR识别的准确度进行测试实验,结果显示整体准确度不高,且从高到低依次为字符、单词、重要单词、大写字母开头的重要单词。然后,将OCR识别周期划分为数字扫描对象的获取、数字图像的生产、数字图像的处理和文本识别等四个阶段,分析每个阶段影响准确度的因素,探讨提高准确度的具体措施。
【关键词】OCR识别  准确度测试  信息资源数字化
【基金】河南省高校科技创新人才支持计划(2008-551)资助
【所属期刊栏目】图书情报知识
文献传递