字符识别锐度确定的制作方法

文档序号:20921719发布日期:2020-05-29 14:14阅读:241来源:国知局
字符识别锐度确定的制作方法



背景技术:

许多因素可影响在制造期间成像系统和设备的品质。一个因素可以是各种内部组件、诸如传感器和透镜元件的最终精确对准。影响图像系统和设备的品质的另一因素可以是各种组件中每一个的品质。所述各种组件中的每一个本身经受制造期间的不完美。

附图说明

图1是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的示例性系统的组件的布置。

图2是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的另一系统的组件的示例性布置。

图3是一图解,其图示了根据本公开内容的来自图像捕获和字符识别的结果的两个示例。

图4是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的示例性过程操作。

图5是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的过程操作。

图6是执行根据本公开内容的操作的示例性电子设备的框图。

图7是施行操作以用于执行根据本公开内容的指令的示例性电子设备的框图。

通过参考附图中所示出的示例,本公开内容可以被本领域技术人员更好地理解,并且使得其众多特征和优点对于本领域技术人员而言显而易见。在不同的附图中使用相同的参考符号指示相似或相同的项。

具体实施方式

图1-7图示了用于测量或确定电子图像锐度的示例性设备和技术。一些图像系统和设备被设计用于光学识别文本的目的。捕获并且处理图像,并且生成识别结果。识别过程可显著受到被提供到识别引擎的图像的品质所影响。

用于评估透镜和成像系统分辨率的一种光学途径是调制转移函数(mtf)或对比度传递函数(ctf)。某些分辨率确定依赖于满足任意mtf/ctf值的交替的黑/白线(线对)的空间频率,所述任意mtf/ctf值通常从0到1被归一化。为1的mtf/ctf是理想化,但是mtf/ctf值越高,在透镜品质和总体成像系统性能方面就越好。一旦对于特定的设备或系统已经在某个空间频率上实现了最小mtf/ctf值,成像光学器件就被认为充分足够好。然而,在向消费者和终端用户传达有意义的度量方面,常规的途径走得不够远。

为了确定mtf,成像系统或设备捕获倾斜边缘目标的图像。对于ctf,线对被使用并且需要光学目标中的高水平印刷精度,因为目标的边缘需要非常锐利并且不应具有空隙。测量达高水平精度等同于高成本地印刷随时间而磨损的光学目标。取决于使用和曝光量,光学目标通常需要频繁的更换。

可以通过首先从倾斜边缘目标、诸如已经被旋转一些度数的矩形的电子图像捕获图像数据来计算mtf曲线。从对图像数据进行采样而产生边缘扩展函数(edgespreadfunction)。在取得数据的导数时,可以计算线扩展函数。线扩展函数的傅里叶变换产生mtf,其在空间频率之上被绘制。空间频率被定义为各自具有某个厚度的交替的黑线和白线。例如,为1线对/mm的空间频率意指一个黑白线各自为0.5mm宽。对于某些成像光学器件,这不难解析,并且导致相对高的mtf。

然而,如果成像设备必须解析10线对/mm,其中每条线宽度(黑线或白线)是0.05mm宽,则输出mtf可能相对低。这样的结果可示出:光学设备在解析越来越细的特征方面不是很好。对于可接受的图像锐度的一般规则如下被确定:通过使用mtf曲线来找到实现mtf50(mtf的50%)的空间频率。然后将该频率与预定义的空间频率上的目标mtf进行比较。一旦已经通过成像系统实现了目标mtf,光学器件就不需要任何细化或改变。

对线对数据进行滤波和操纵是有挑战性的,因为很多取决于图像数据中噪声的量。噪声直接有关于光学器件的品质,并且复杂地有关。噪声可大大影响ctf计算,因为线对差直接有关于ctf。无论mtf或ctf是否用于锐度确定,如果这些值不与同用户更相关的某事物耦合或相互关联,则对于mtf和ctf而言没有现实意义。

本文中所述的技术中的一些通过使用被训练用于读取并且评估电子图像中的文本的机器学习途径而不需要高水平精度。光学目标中文本的印刷空隙和锯齿边缘不阻止如下成像系统:所述成像系统配备有用于评估电子图像中的文本的机器学习途径。事实上,在确保成像系统和设备不过度灵敏中,具有空隙和边缘的文本是有帮助的。使用本文中所述的技术中的一些来用于确定图像锐度提供图像锐度和装备效用的更有意义的度量。如本文中所述的图像锐度的一个度量使用文本大小易辨认性作为用于解析光学目标上以小点大小的某个字体或字体族的文本的能力的度量。除了测量成像设备或系统的光学品质之外,作为成像设备或后期处理软件的部分,本文中所述的技术还可以用于评估并且进一步调谐锐化实现方式。基于与不通过软件控制的后期过程来在成像设备内使能够实现锐化特征的相同图像捕获系统相比,图像是更经常通过还是不通过,所述技术增强字符识别。

在用于评估或测量图像锐度的系统的示例中,图像捕获器从成像设备接收图像。图像解析器隔离电子图像的一部分,所述部分包括字符、诸如特定字体的字符。光学字符识别(ocr)引擎或其部分隔离字符并且标识字符的一方面。例如,字符的一方面可以是其字体、其字体族、其高度、其典型高度、其宽度、其特征尺寸、其特征尺寸之一、以及其在字符集内或字母表内的标识。

锐度检测器将字符的该方面与锐度评级相互关联,其中所述锐度评级可以用于将图像分类为通过或不通过。作为一个示例,从图像中所确定的字符的标识可以对照字符的真值进行比较,并且比较的结果用于选择锐度评级。锐度评级可以被应用于字符、图像、成像设备、系统、或其任何组合。过程中的一些或全部可以被重复。结果、连同成像设备或系统的一个或多个方面一起可以被应用以训练ocr引擎。

图1是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的示例性系统的组件的布置。在图1中,锐度确定系统100包括成像设备101。成像设备101包括与图像传感器103对准的透镜102。透镜102包括一个或多个透镜元件。图像传感器103被耦合到一个或多个处理器104。系统100包括图像捕获器105。图像捕获器105包括图像接收器106。系统100还包括光学识别器107,所述光学识别器107包括光学字符识别(ocr)引擎108。当图像中存在多个字符的时候,ocr引擎108可以隔离一个字符、多于一个字符、或每个字符。系统100包括锐度检测器110,所述锐度检测器110被耦合到系统100的其它元件。

系统100经由成像设备101来捕获光学目标115的电子图像112,所述光学目标115包括在光学目标115的第一侧120上的一个或多个字符116。在图1中,每个字符116具有所定义的文本大小。光学目标115位于成像设备101的视场117内。光学目标115可以采取承载字符的任何材料的形式,诸如纸浆上或作为所印刷的页面的部分的印刷字符、被手写在表面上的字符、从透明基底所切割的字符、被压印到诸如金属板材之类的表面中的印章字符、从基底材料的表面中所蚀刻的字符、在浅浮雕(basrelief)中所雕刻的字符、在注入模塑期间在表面上所形成的字符等等。

在图1中,光学目标115在平面中关于一组x-、y-和z-轴119而被对准。光学目标115的定向可以参考该组x-、y-和z-轴119而被描述。字符116在该平面中以相对于参照物的角度121而被定向,所述参照物诸如成像设备101或光学目标115的第一边缘122。每个字符116包括某些性质、诸如特征尺寸118、垂直高度、水平宽度、和倾斜角。每个字符116可属于某个字体或字体族。成像设备101和透镜102沿着光轴124、相对于光学目标115而被对准。

根据一个示例,在电子图像112的捕获期间,光111向光学目标115的第一侧120提供照明。一旦捕获了电子图像112,光学识别器107就生成字符116中一个或多个的识别结果113。锐度检测器110对照相应字符116的真值来比较识别结果113。基于所述比较,以及一个或多个其它考虑,生成锐度评级114。作为一个示例,锐度评级是“通过”、“不通过”,或诸如当数值对照预定义的阈值而进行比较的时候的其它评级。锐度评级114可以被应用到系统100、成像设备101或其组件、电子图像112、光学目标115、字体或字体族、各种组件的定向等等。电子组件可以被收集到电子设备123中,所述电子设备123执行用于确定锐度评级114的操作。

图2是一种图解,其图示了根据本公开内容的用于基于字符识别来确定图像锐度的另一示例性系统的组件的布置。在图2中,系统200包括图像捕获设备201,所述图像捕获设备201包括透镜202。图像捕获设备201可以在针对锐度的测试下。图像捕获设备201被装配在包括字符116的光学目标115上方的支撑物203上。图像捕获设备201经由通信信道204而被耦合到计算设备205。

计算设备205通过诸如键盘207之类的一个或多个输入设备而接收输入。在被耦合到计算设备205的电子显示器206上示出从光学目标115的电子图像中得到的信息。例如,从电子图像被隔离的字符116通过计算设备205而被显示在电子显示器206上。计算设备205在电子显示器206上显示输入请求,并且当识别结果未能匹配字符116的真值的时候,计算设备205提示以用于用户输入。用户(未被图示)在电子显示器上所显示的图像中录入字符的标识。计算设备205通过物理用户输入而接受数字值。

基于所录入的字符标识以及从对光学目标112所捕获的图像中得到的电子信息来训练光学识别器。用户可以监控字符的锐度评级是否是恰当的,其具有通过防止假阳性和假阴性来增大机器学习算法准确性的所意图的目标。该目标经由光学识别器来被实现。计算机设备可以被配置成基于用户输入来为图像捕获设备201提供锐度分辨率值。

光学识别器可以被耦合到训练数据库。光学识别器可以通过周期性地对照训练数据库来重训练它而被改进。训练数据库可以在各种时候通过添加通过测试各种系统和设备所收集的图像而被扩增或增强。图像的添加可以批量地或逐一递增地进行,因为每个附加的图像通过经受锐度评估的系统或设备而被捕获。

指令可以用于选择捕获特定图像的设备的标识符,其中所述标识符有关于设备的物理特性。这是所测试的设备。设备的标识符的示例包括序列号、透镜的物理尺寸、透镜群组的放大率、以及光学系统的焦距。其它标识符是可能的。另外的指令可以用于利用与设备相关联的标识符、字符的识别结果、以及光学目标中字符的真值来训练光学识别器。

图3是一图解,其图示了根据本公开内容的来自图像捕获和字符识别的结果的两个示例。在图3中,示例包括第一电子图像的第一部分301和第二电子图像的第二部分307。第一电子图像(未被示出)已从第一设备被捕获,所述第一设备在相对于光学目标的第一配置中而被定向和布置。第二电子图像(未被示出)已从第二设备被捕获,所述第二设备在相对于光学目标的第二配置中而被定向和布置。

在图3中,第一部分301包括通过相应的第一字符边界303而被隔离的第一字符302。第一字符边界303在超过每个相应的第一字符302的四个外边缘的裕度距离处被提供。在图3中,第一字符302具有一个特定字体、诸如timesnewroman的各种大小。在另一实现方式中,第一字符302在多个字体或字体族中。

在图3中,第二部分307包括通过相应的第二字符边界309而被隔离的第二字符308。相对于第一字符302,第二字符308不太锐利或不太对焦。在图3中,第二部分307可以来自不同的电子图像捕获设备、不同的电子图像捕获系统、不同的光学目标、在不同的光学条件下所捕获的图像、或其组合。

通过将ocr或ocr的组件应用到第一部分301的字符302中的一个或多个而得到第一结果304。第一结果304包括第一所识别的字符或第一所标识的字符305,其形成第一字符集306。在图3中,第一所标识的字符305中的每一个对应于该字符302的相应的真值。通过将ocr或ocr的组件应用到第二部分307的第二字符308而得到第二结果310。第二结果310包括第二所标识的字符311,其形成第二字符集312。在图3中,第二所标识的字符311中的一些被不正确地标识。具体地,第二字符集312的前四个字符应当是“a”、“b”、“c”和“d”,而不是图3中所示出的“n”、“a”、“a”和“a”。ocr系统、诸如图2的系统200可以被视为ocr管(pipe)。根据一个实现方式,ocr管不对图像进行后期处理以通过操纵字符而使得系统正确地确定所捕获的字母。代替地,系统的目标是使用成像设备或系统的如下能力:为系统的组件或为整个成像系统提供与其光学性能相关的信息并且生成光学评级或锐度评级。

可以通过比较一个或多个所标识的字符305、311与针对这些字符的相应真值来生成锐度评级。在图3中,基于第一所标识的字符305中的一个或多个的第一锐度评级应优于基于第二所标识的字符311的第二锐度评级。

如本文中进一步详细解释的,各种方法有可能用于基于所标识的字符305、311来确定相应的锐度评级、针对包括第一字符302的第一图像的一个评级、以及针对包括第二字符308的第二图像的另一评级。作为第一示例,锐度评级可以基于对所标识的字符305、311与其相应的真值的第一恰当成对比较进行标识。对于第一字符集306,将基于被恰当地标识为“a”的第一字符“a”来确定第一锐度评级。对于第二字符集312,将基于被恰当地标识为“e”的第五字符“e”来确定第二锐度评级。

图4是一流程图,其图示了根据本公开内容的用于训练锐度检测系统的示例性过程操作。在图4中,在操作402处,从测试下的设备(dut)、诸如图1的成像设备101以及图2的图像捕获设备201捕获电子图像。在图4中,在操作404处,电子图像被预处理以标识电子图像中字符的位置。在操作406处,通过图像文本分类器来对一个或多个字符进行分类。在操作408处,所述一个或多个字符被识别,诸如通过ocr引擎或其组件。在操作410处,所识别的字符对照其真实标识或地面实况来被检查。如果字符被正确地识别,则在操作412处为测试下的设备生成“通过”等级。如果字符被不正确地识别,则采取另外的操作。

在操作414处,电子图像被采样,并且待识别的字符的图像被显示以用于手动识别。

在操作416处,经由用户输入设备(例如鼠标按钮事件、键录入事件)来接受手动输入。例如,在操作416处,用户可视地检查在电子屏幕上所显示的字符的图像,并且如果字符易辨认,则用户录入针对该字符的值。也就是说,字符被认为与被认为可接受的易辨认性准则对准。在其它示例中,易辨认的字符也可能是人类可读的。

在操作418处,关于所采样的图像是否易辨认而做出确定。也就是说,所采样的图像与易辨认性准则相对准。如果不是,在操作420处,报告“不通过”等级。在其它示例中,所采样的图像也可能是人类可读的。

在图5中,如果字符是易辨认的(例如人类可读),在操作422处,基于所标识的字符来创建采样数据。基于所述采样数据,在操作424处,创建训练图像,并且在操作426处,为对应训练图像的文本分类创建标签。在操作428处,基于所创建的训练图像及其相应地来自操作424和426的对应标签而对多类分类进行训练。在操作422处所创建的采样数据可以被添加到从通过一个或多个其它成像系统或设备而对相同的或不同的光学目标所拍摄的一个或多个图像中得到的其它采样数据。通过组合从以下操作402直到操作422中所得到的采样数据,ocr引擎可以被细化并且超越仅仅在工厂处或在ocr引擎的初始调谐期间的原始训练而被进一步训练。作为示例,在从工厂处正制造的设备集拍摄图像时,可以为ocr引擎创建采样数据、训练图像和字符标签的大量收集。

图5是一示例性流程图,其图示了用于训练锐度检测系统的过程操作。在图5中,在操作502处,图像接收器接收图像以用于处理。在操作504处,图像的一部分被隔离,其中该部分包括文本字符。在操作506处,标识所隔离的文本字符的一方面。在操作508处,所隔离的文本字符的一方面与锐度评级相互关联。

在操作508处,相互关联可以包括一个或多个操作。例如,在操作510处,基于文本字符的真值来调节锐度评级。在操作512处,基于标识了针对文本字符的字体或字体族而调节锐度评级。在操作514处,基于所隔离的文本字符的字符高度或基于所隔离的文本字符的字体或字体族的平均字符高度来调节锐度评级。在操作516处,基于文本字符的整数点大小或文本字符的半数点大小来调节锐度评级。所述整数点大小和半数点大小可以关于光学目标的度量单位。在操作518处,基于文本字符的每英寸点的所标识的特征数(cppi)而调节锐度评级。在操作520处,诸如基于从光学目标反射离开并且到成像光学器件中的光的度量、光强度、色温等等来调节锐度评级。入射光的度量可以在操作502处图像接收器接收图像的时间处或接近所述时间处被做出,并且被用作锐度评级的另外的修饰符或描述符。作为操作的另一示例,相互关联可以包括确定来自所接收的电子图像的文本字符的几何方面,将所述几何方面匹配到预定文本大小的集合中的一文本大小,并且基于所匹配的文本大小来选择所定义的文本大小。

在操作522处,基于文本字符的一方面超过预定的阈值来生成“通过”/“不通过”评级。作为示例,可以基于所定义的文本大小超过预定文本大小阈值来生成“通过”/“不通过”评级。作为另一示例,“通过”/“不通过”评级可以包括生成“通过”值。在操作524处,通过使用锐度评级和所隔离的文本字符,锐度检测器、光学识别器或系统的其它组件被进一步训练,从而改善后续识别和锐度任务上的性能。所述方法可涉及传送“通过”/“不通过”评级。例如,系统的组件在针对锐度的训练之后可发起电子通信,所述电子通信包括基于由图像接收器所接收的图像的锐度评级。

图6是示例性电子设备的框图,所述示例性电子设备执行操作以用于通过接受电子图像608而确定所指定的分辨率并且使得所指定的分辨率609可用。电子设备600可以包括任何成像设备、诸如图1的成像设备101。处理器601可以是一个或多个中央处理单元(cpu)、微处理器、和/或适合用于检索和执行被存储在机器可读存储介质602中的指令的其它硬件设备。处理器601可以取出、解码和执行指令603、604、605、606、和607以使能够执行应用,如下所述。作为可替换方案,处理器601可以包括一个或多个电子电路,所述电子电路包括用于执行指令603、604、605、606、和607中一个或多个的功能性的多个电子组件。处理器601可以取在诸如图1中所图示的实施例之类的其它实施例中所述的处理器的形式,其中电子设备123包括处理器104。

机器可读存储介质602可以是存储可执行指令的任何电子、磁性、光学或其它物理存储设备。因而,机器可读存储介质602可以是例如随机存取存储器(ram)、电可擦除可编程只读存储器(eeprom)、存储驱动器、光盘等等。如以下详细描述的,机器可读存储介质602可以被编码有用于捕获电子图像并且获得所指定的分辨率的可执行指令。

电子图像捕获指令122可以初始接收电子图像608。例如,图像608可以从图1的图像传感器103、从图2的图像捕获设备201被接收。“光学识别文本字符”指令604然后可以在所接收的电子图像608上执行一个或多个操作。例如,处理器601可以在电子图像的一个或多个部分上执行解析、表征、评估或识别任务。特定的指令可以提供识别的结果。结果可以是针对在电子图像608中出现的一个或多个字符的标识。

在执行了光学识别指令604之后,通过处理器604来执行“比较结果”指令605。字符识别的结果对照其真值来被比较。基于执行“比较”指令605的结果,“选择所定义的文本大小作为所指定的分辨率”指令606由处理器601来执行。

接下来,“存储所指定的分辨率”指令607由处理器601来执行。这些指令607可以向一个或多个处理器、诸如图6中的处理器603提供所指定的分辨率609或以其它方式使得所指定的分辨率609可用于一个或多个处理器、诸如图6中的处理器603。可替换地,这些指令607可以向一个或多个存储器提供所指定的分辨率710或以其它方式使得所指定的分辨率710可用于一个或多个存储器。

图7是示例性系统、诸如电子设备700的框图,所述示例性系统施行操作以用于执行超越图7中所图示的以及与其相关地描述的那些之外的指令。在图7中,电子设备700可以包括任何成像设备、诸如图1的成像设备101。在图1的示例性实施例中,电子设备123包括处理器104。

处理器701可以是一个或多个中央处理单元(cpu)、微处理器、和/或适合用于检索和执行被存储在机器可读存储介质702中的指令的其它硬件设备。处理器701可以取出、解码和执行指令703-711,单个地或以指令的群组,以使能够执行应用和操作,如下进一步所述。作为可替换方案,处理器701可以包括一个或多个电子电路,所述电子电路包括用于执行指令703-711中一个或多个的功能性的多个电子组件。

机器可读存储介质702可以是存储可执行指令的任何电子、磁性、光学或其它物理存储设备。因而,机器可读存储介质702可以是例如随机存取存储器(ram)、电可擦除可编程只读存储器(eeprom)、存储驱动器、光盘等等。如以下详细描述的,机器可读存储介质702可以被编码有可执行指令,所述可执行指令用于处理电子图像以及从其中所得到的信息,并且提供各种种类的电子输出。

“确定字符的垂直高度”指令703可以由处理器701来执行,从而确定在电子图像、诸如图7的图像709以及图1的图像112中所表示的字符的示例性方面。

在图7中,“使垂直高度与所定义的文本大小相互关联”指令704可以被执行。针对一个或多个字符的垂直高度可以与所定义的文本大小相互关联。垂直高度可以对应于、匹配、或近似匹配预定的、已知标准文本大小或所定义的文本大小。作为示例,垂直高度可以基于从电子图像、诸如图7的图像709中的一个或多个字符所标识的高度而被相互关联到12点字体大小。

还在图7中,“根据结果与其真值的比较而确定每英寸点的特征数(cppi)”指令705可以由处理器701来执行。基于潜在字符的一方面,指令705可以根据识别文本字符的结果与其真值的成功比较来确定cppi。可以执行另外的指令。例如,“将cppi匹配到一个文本大小”指令706可以被执行以基于cppi来确定文本大小。

在图7中,可以执行另外的指令。“选择与设备相关联的标识符”指令707可以由处理器701来执行。作为示例,选择序列号或型号。随后,“利用标识符以及真值来训练ocr引擎”指令708可以被执行。ocr引擎或有关的指令当除了字符图像之外还被提供有图像捕获设备的序列号或型号的时候可以从而被训练以展现经改进的识别。其它信息可以被提供或获得,作为指令708中的标识符。

根据另外的实现方式,“在显示设备上显示所捕获的电子图像和真值”指令709可以由处理器701执行以在电子显示器上向用户提供一个或多个字符的图像。字符可已经被识别或可尚未被识别。跟在指令709之后,“提示用户以用于输入”指令710可以由处理器701执行。作为响应,提示用户以提供用户输入。

可以执行又另外的指令。例如,在图7中“经由设备来接受物理用户输入并且提供锐度分辨率值”指令711可以由处理器701通过从机器可读存储介质702访问指令711来被执行。

另外,本文中所述的示例还可以用于基于当与使锐度特征关断的图像相比的时候图像是否更经常通过/不通过来评估并且此外调谐锐度途径,以及它们在增强字符中多好地起作用。此外,本文中所述的示例可以用于取决于基于字符大小和字体所实现的字符识别准确性来验证并且此外调谐锐度途径。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1