一种验证OCR识别质量的装置的制作方法

文档序号:15493809发布日期:2018-09-21 21:12阅读:183来源:国知局

本实用新型涉及图像识别领域,具体涉及一种验证OCR识别质量的装置。



背景技术:

目前,市面上有多种OCR(Optical Character Recognition,光学字符识别)的识别软件,例如汉王OCR、清华紫光文通TH-OCR、丹青中英日文OCR等,但是由于受到文档质量以及识别技术等因素的影响,其识别质量存在差异是不可避免的。通常人们需要对文档进行识别时,往往不能确定使用哪个软件识别效果更好一些。因此,急需一种针对OCR软件识别质量验证的装置或工具,能够自动检测OCR软件的识别效果,为人们的使用提供参考。



技术实现要素:

本实用新型的目的在于针对上述现有技术中的问题,提供一种验证OCR识别质量的装置,通过二维码,对原始的待识别文档以及经过OCR软件识别过的文档进行差异对比,进而得出OCR软件识别结果的准确率,为人们选择识别软件提供参考。

为了实现上述目的,本实用新型采用的技术方案为:

包括能够输入待识别文档的输入模块,输入模块连接能够判断待识别文档类型并对应生成标准二维码的二维码生成模块,二维码生成模块同时将待识别文档经过不同的OCR软件生成相应的比对二维码;所述的二维码生成模块连接用于比较标准二维码与比对二维码的验证模块,验证模块根据二维码对比后的结果,能够输出各个OCR软件的识别质量。

所述二维码生成模块能够判断待识别文档类型为电子版文档还是打印版文档,若为电子版文档,基于行生成标准二维码,若为打印版文档,基于图像生成标准二维码。

所述的输入模块包括适用于打印版文档的扫描装置以及适用于电子版文档的数据存储传输装置。所述的扫描装置包括扫描仪、传真机或摄影器材中的任意一种或几种的组合;数据存储传输装置包括USB接口和光驱。

二维码生成模块包括根据扫描装置或数据存储传输装置所传输文档,判断待识别文档类型并对应生成标准二维码的二维码生成器,以及用于将待识别文档经过不同的OCR软件进行识别的OCR识别模块,待识别文档经过OCR识别后再通过二维码生成器生成比对二维码。

所述的验证模块采用具有显示功能的计算机或者嵌入式终端。

与现有技术相比,本实用新型具有如下的有益效果:待识别文档通过输入模块传输至二维码生成模块,二维码生成模块判断待识别文档类型并对应生成标准二维码,二维码生成模块同时将待识别文档经过不同的OCR软件生成相应的比对二维码,二维码生成模块连接用于比较标准二维码与比对二维码的验证模块,通过比较标准二维码与比对二维码之间的差异,根据比较后的结果,输出OCR软件识别的准确率,进而为人们选择识别软件提供参考。

进一步的,本实用新型输入模块包括适用于打印版文档的扫描装置以及适用于电子版文档的数据存储传输装置,扫描装置与数据存储传输装置分别提供打印文档与电子文档的输入通道。二维码生成模块能够判断待识别文档类型为电子版文档还是打印版文档,若为电子版文档,基于行生成标准二维码,若为打印版文档,基于图像生成标准二维码。本实用新型能够适用于不同类型待识别文档的录入与识别质量验证,具有较好的应用前景。

附图说明

图1本实用新型的整体结构框图;

附图中:1-输入模块;2-二维码生成模块;3-验证模块。

具体实施方式

下面结合附图对本实用新型做进一步的详细说明。

参见图1,本实用新型在结构上包括输入模块1、二维码生成模块2及验证模块3,输入模块1能够输入待识别的文档,二维码生成模块2能够判断待识别文档类型并对应生成标准二维码,二维码生成模块2同时将待识别文档经过不同的OCR软件生成相应的比对二维码,验证模块3比较标准二维码与比对二维码,并根据二维码对比后的结果,输出识别质量。

本实用新型的输入模块1通过输入装置实现,输入装置包括扫描装置和数据存储传输装置,扫描装置适用于打印版文档,该装置可以是扫描仪、传真机或者任何摄影器材;数据存储传输装置适用于电子版文档,该装置包括USB接口和光驱。

二维码生成模块2主要包括二维码生成器以及OCR识别模块组成,二维码生成器是将输入模块1由不同通道传输进来的文档生成二维码,若为数据存储传输通道,则基于行生成标准二维码,若为扫描仪、传真机或者任何摄影器材通道,则基于图像生成标准二维码,另外待识别的文档还需要经过OCR识别之后再通过二维码生成器生成比对二维码。

验证模块3采用具有显示功能的计算机或者嵌入式终端。

本实用新型在具体识别过程中:

步骤1,输入模块1输入待识别的文档;

步骤2,二维码生成模块2将待识别的文档以及经过OCR软件识别过的文档分别生成二维码,具体步骤包括:a.首先判断待识别文档的类型,如果是电子版文档,则基于行自动生成标准二维码;如果是打印版文档,则基于图像自动生成标准二维码;(标准二维码代表原始文档生成的二维码,是最准确的);b.将待识别的文档(无论是电子版还是打印版)经过OCR软件进行识别,将识别后的文档自动生成比对二维码;(比对二维码为经过OCR软件识别处理之后的文档生成的二维码);其中在步骤b中,OCR软件识别过程中,可以选择使用多种识别软件,例如汉王OCR、清华紫光文通TH-OCR、丹青中英日文OCR等进行识别,识别之后分别生成对应的二维码,可以表示为二维码21、二维码22…

步骤3,验证模块3将标准二维码(原始文档)和比对二维码(识别后文档)使用二维码算法进行差异对比,得出OCR软件识别结果的准确率。

在该步骤中,比对二维码代表上述步骤b中二维码21、二维码22、…,所以,在验证模块,可以将标准二维码分别与二维码21、二维码22等进行差异对比,进而可以输出多个OCR软件的识别质量,从而为人们的使用提供参考。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1