一种识别印刷品上字符的方法及装置制造方法

文档序号：6506827阅读：176来源：国知局

一种识别印刷品上字符的方法及装置制造方法
【专利摘要】本申请涉及一种识别印刷品上字符的方法及装置。该方法可以包括：对所述印刷品进行拍摄以获取要识别的图像；对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像；将得到的分层图像进行图层合并，以得到处理后图像；从所述处理后图像中提取每个字符的图像；以及对提取出的每个字符的图像进行字符识别。采用本申请的技术方案，在对例如证件等印刷品进行图像处理时，能够实现对该印刷品上字符的更有效、更精确的识别。
【专利说明】—种识别印刷品上字符的方法及装置

【技术领域】
[0001]本申请涉及图像识别【技术领域】，尤其涉及一种识别印刷品上字符的方法及装置。

【背景技术】
[0002]在以往的OCR (Optical Character Recognit1n,光学字符识别)识别中，对于一些外部比较光滑，反射较强的印刷品上文字的识别，例如经过表面覆膜处理的印刷品上的文字的识别、或者例如各类证件照或各种卡(尤其是过塑处理的证件(驾驶证、行驶证等))上文字的识别，往往会存在识别率较低或者另外因为表面覆膜反光从而存在识别错误的情况，造成这种问题的本质在于识别的过程中无法进行有效的滤光，导致OCR识别源的字体存在模糊或者对比度过大的问题，同时，由于各种印刷品往往存在多种不同的字体，也会在识别上带来的字符无法匹配或匹配错误的问题。
[0003]目前，在OCR的识别技术发展上，面向证照的需求越来越多，而现有的OCR技术的发展方向都趋向于对于完整图像信息的识别与搜寻，针对目前的证照识别来看，现行的几种OCR识别方案中，对于身份证、护照等的识别，现阶段虽然有较为成熟的高识别率引擎与算法，但对于类似驾照、工作证等的识别上，由于这些证件在最终颁发的时候都会对证件进行过塑处理，同时也由于各个地区的类似证件打印并不像身份证一样具备统一的打印标准与字体，从而导致了现行的证照识别中，针对需要识别的证照往往会存在由于曝光过度导致图像模糊以及针对变形字体的识别效率低的问题，从本质而言，在于现行的识别方法中并没有完全考虑这两个方面的需要。

【发明内容】

[0004]本申请的主要目的在于提供一种识别印刷品上字符的方法及装置，以解决现有技术存在的对印刷品上字符进行识别中的图像处理问题以及字符识别问题，其中:
[0005]根据本申请的一个方面，提供了一种识别印刷品上字符的方法，其特征在于，包括:对所述印刷品进行拍摄以获取要识别的图像；对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像；将得到的分层图像进行图层合并，以得到处理后图像；从所述处理后图像中提取每个字符的图像；以及对提取出的每个字符的图像进行字符识别。
[0006]根据本申请的实施例，在该方法中，对所述印刷品进行拍摄以获取要识别的图像，包括:在进行拍摄时按预定条件进行曝光设置。
[0007]根据本申请的实施例，在该方法中，对所述每一幅复制图像分别进行不同的图像处理以得到至少两幅分层图像，包括:对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像；以及对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像。
[0008]根据本申请的实施例，在该方法中，对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像，包括:识别所述复制图像中的噪点；将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值；以及将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值以得到第一分层图像。
[0009]根据本申请的实施例，在该方法中，识别所述复制图像中的噪点包括:将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值；判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内；以及将灰度值与计算灰度值的差值的绝对值超出预定阈值范围的像素点识别为噪点。
[0010]根据本申请的实施例，在该方法中，对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像，包括:将所述复制图像划分为至少两个子区域；以及对每个子区域分别进行灰度调整，以得到第二分层图像。
[0011]根据本申请的实施例，在该方法中，将所述分层图像进行合并，以得到处理后图像，包括:对所述分层图像中相对应像素点的灰度值取中值，得到每个像素点的灰度值中值；以及将每个像素点的灰度值替换为该像素点的灰度值中值，以得到处理后图像。
[0012]根据本申请的实施例，在该方法中，提取出所述处理后图像中每个字符的图像，包括:确定所述处理后图像中的文本图像的位置；以及对所述文本图像进行字符分割，提取出所述文本图像中的每个字符的图像。
[0013]根据本申请的实施例，在该方法中，获取所述处理后图像中的文本图像的位置，包括:通过边缘检测识别出每行像素中的边缘纹理；对每行像素的边缘纹理做直方图，并根据对所述直方图的分析确定边缘基元的识别阈值；根据所述边缘基元的识别阈值统计每行的边缘基元的数目，并记录每行边缘基元的开始位置和结束位置；识别所述处理后图像中的非空白行；判断当前非空白行是否满足预设条件，如果满足，则进行下一非空白行的检测；以及当连续检测到超过预定数目的非空白行满足所述预设条件时，根据每一非空白行边缘基元的开始位置和结束位置确定文本图像的位置。
[0014]根据本申请的实施例，在该方法中，对提取出的每个字符的图像进行字符识别，包括:利用BP神经网络对所述每个字符的图像进行字符识别。
[0015]本申请的另一方面，提供了一种识别印刷品上字符的装置，其特征在于，包括:采集模块，用于对所述印刷品进行拍摄以获取要识别的图像；分层处理模块，用于对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像；图层合并模块，用于将得到的分层图像进行图层合并，以得到处理后图像；提取模块，用于从所述处理后图像中提取每个字符的图像；以及识别模块，用于对提取出的每个字符的图像进行字符识别。
[0016]与现有技术相比，根据本申请的技术方案，通过对印刷品进行拍摄并对要识别的图像进行分层图像处理，并通过图层合并进行效果补偿，能够提升图像质量，提高识别的准确率。

【专利附图】

【附图说明】
[0017]此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中:
[0018]图1是本申请实施例的一种识别印刷品上字符的方法的流程图；
[0019]图2是本申请实施例的图1中的步骤S102中，去除噪点处理的步骤SI的流程图；
[0020]图3是本申请实施例的图2中的步骤S201的流程图；
[0021]图4是本申请实施例的图1中的步骤S102中，对比度增强处理的步骤S2的流程图；
[0022]图5是本申请实施例的图1中的步骤S103的流程图；
[0023]图6是本申请实施例的图1中的步骤S104的流程图；
[0024]图7是本申请实施例的图6中的步骤S601的流程图；以及
[0025]图8是本申请实施例的一种识别印刷品上字符的装置的结构框图。

【具体实施方式】
[0026]本申请的主要思想在于，通过对带有文字的印刷品进行拍摄，将得到的图像复制成至少两幅图像分别进行不同的图像处理得到分层图像，并对各分层图像进行图层合并，得到处理后的图像，再对所述处理后的图像进行文本提取和文字识别。
[0027]为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。
[0028]根据本申请的实施例，提供了一种识别印刷品上字符的方法。
[0029]本申请可以应用于对印有字符的印刷品上的字符进行识别，例如，可以用于证件的识别，尤其是对过塑处理过的证件进行识别。
[0030]参考图1，图1是本申请实施例的一种识别印刷品上字符的方法流程图:如图1所示，在步骤SlOl中，对所述印刷品进行拍摄以获取要识别的图像。
[0031]在进行拍摄时，由于图像采集设备参差不齐，拍摄时可能受到各个方面的影响，例如曝光时间、曝光补偿等，可能导致拍摄出来的图像效果不好，同时也会影响后续对图像的处理。因此，在进行拍摄时，可以在拍摄前按预定条件进行曝光设置，得到效果更好的图片。通过对同类型图像在相同环境(例如光强等条件)下进行拍摄时曝光相关的参数设置不同而产生不同效果的情况进行统计，并设定所述预定条件。
[0032]在步骤S102中，对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像。也就是说，将拍摄的图像复制成多份，对得到的每一幅复制图像分别进行图像处理，并且对每一幅图像所进行的图像处理是不同的，这就相当于对原图像进行分层处理，从而获得经过不同处理的分层图像。
[0033]所述不同的图像处理可以包括:去除噪点处理、对比度增强处理。还可以包括其他的图像处理，例如，路径着色处理、图形切割处理、纹理识别预处理等，经过这些图像处理后，就会得到多幅分层图像。
[0034]步骤S102可以进一步包括步骤:S1对所述复制图像中的一幅进行去除噪点处理得到第一分层图像；以及步骤S2对所述复制图像中的另一幅进行对比度增强处理得到第二分层图像。
[0035]图2为进行去除噪点处理的步骤SI的具体流程图，如图2所示，步骤SI可以包括:
[0036]步骤S201，识别所述复制图像中的噪点。如图3所示，步骤S201可以进一步包括子步骤 S301-S303。
[0037]在子步骤S301中，将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值。
[0038]在子步骤S302中，判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内。
[0039]在子步骤S303中，将灰度值与计算灰度值的差值的绝对值超出预定阈值范围的像素点识别为噪点。其中预定阈值范围可以根据具体的条件进行设置，或者还可以根据以往进行噪点识别及处理过程中累积的经验值进行设置。
[0040]步骤S202，在识别出所述复制图像中的噪点后，将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值。由于像素点是以纵横两个方向均匀排布的，因此，每个像素点都会有八个相邻的像素点，因此，将每个噪点的灰度值与其相邻的八个像素点的灰度值进行求和在求平均值作为该噪点的去噪灰度值。
[0041]步骤S203，将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值得到第一分层图像。得到每个噪点的去噪灰度值后，将所述复制图像中的每个噪点的灰度值替换为该噪点的去噪灰度值，而其他的像素点(不是噪点)的灰度值不变，得到经去除噪点处理的第一分层图像。
[0042]数字图像在采集过程中，由于照明或物体本身等原因，经常会出现目标区域对比度低的情况，可对图像进行对比度增强处理。
[0043]图4为对所述复制图像进行对比度处理的步骤S2的流程图，如图4所示，步骤S2可以包括:
[0044]步骤S401，将所述复制图像划分为至少两个子区域。
[0045]进行对比度增强处理的基本思想，是将图像按灰度区间划分为两段或多段，分别进行灰度变换，从而增强图像的对比度。
[0046]首先，可以通过对复制图像的灰度直方图的分析确定划分子区域的数目以及划分的子区域的边界阈值。灰度直方图是统计图像中不同灰度级的像素出现频率的，因此根据灰度直方图可以得到所述复制图像灰度值的分布情况，并根据所述复制图像灰度值的分布情况来确定将图像划分为多个子区域，并确定划分区域的边界阈值以确定相邻两个区域的分段点，并按分段点将所述复制图像分成至少两个子区域。在子区域的划分上，可以根据图像的灰度直方图有多少波峰或波谷来确定划分子区域的数目，并以谷作为子区域边界阈值。在边界阈值的设定方面，可以根据对图像引擎进行训练来确定，即，对大量类似要识别图像的图像进行训练以确定的合适的边界阈值，而分段点的确定可以根据选取的边界阈值进行计算，或者还可以在直方图上设定阈值来确定分段点。
[0047]步骤S402，对每个子区域分别进行灰度调整，以得到第二分层图像。
[0048]对每个子区域分别进行灰度调整，具体而言，就是根据需要，将每个子区域中各个像素按照预定规则进行灰度值的变换，以突出感兴趣目标所在的灰度区间，相对抑制那些不感兴趣的灰度空间，可以采用线性变换，即利用预设线性变换公式进行灰度值的变换，并得到第二分层图像。
[0049]在步骤S103中，将得到的分层图像进行图层合并，以得到处理后图像。
[0050]图5为步骤S103的具体流程图，如图5所示，步骤S103可以包括:
[0051]步骤S501，对所述各分层图像中相对应像素点的灰度值取中值，得到每个像素点的灰度值中值。
[0052]具体来说，在上述的步骤S102中得到的每幅分层图像都是针对各相同的复制图像分别进行不同图像处理后的图像，因此各幅分层图像中的像素点仍然还是原来的像素点，表达的还是相同的图形信息，只是经过不同的图像处理后，每个像素点的灰度可能产生了变化，因此，对每幅分层图像中相对应的像素点的灰度值取中值，可以为每个像素点确定一个合适的新灰度值。
[0053]步骤S502,将每个像素点的灰度值替换为该像素点的灰度值中值,得到处理后图像。
[0054]具体来说，可以在拍摄得到的图像的原图像或另一幅复制图像中，将得到的每个像素点的灰度值中值作为该像素点的新灰度值，将每个像素点的灰度值调整为该像素点的灰度值中值，得到处理后图像，这样就完成了分层图像的图层合并，得到了处理后的图像。可选地，在完成了图像合并后，考虑到图像质量的需要，还可以将得到的所述处理后图像中符合预定条件的像素点进行重新的灰度着色，从而在图像上更加强地将图像进行标注，例如，将趋近于纯黑像素(灰度值超过一定值的点)的像素点的灰度值加2，以提升偏黑像素的颜色深度。
[0055]对得到的处理后图像，还可以进行与原图像的对比，将所述处理后的图像每个像素点的灰度值与原图像的对应像素点的灰度值相减得到每个像素点的灰度值差，并判断所述灰度值差的绝对值是否超过预定阈值，如果该点的灰度值差超过预定阈值，则还需对该点的灰度值进行灰度值的调整。
[0056]在步骤S104中，从所述处理后图像中提取每个字符的图像。
[0057]参考图6，图6为步骤S104的具体流程图。对每个字符进行提取，可以先通过纹理分析确定所述处理后图像中文本图像的位置，再对文本图像进行字符分割以提取这每个字符。
[0058]如图6所示，步骤S104可以包括步骤S601和步骤S602。
[0059]在步骤S601中，获取所述处理后图像中的文本图像的位置。可参考图7所示，图7为步骤S601的具体流程图，具体而言，可以包括以下步骤:
[0060]步骤S701，通过边缘检测识别出每行像素中的边缘纹理。所述边缘纹理，是指图像中灰度发生急剧变化的区域，可以通过设置一个预设阈值变化范围来进行识别，即，识别出灰度变化超出所述预设阈值变化范围的区域。
[0061]步骤S702，对每行像素的边缘纹理做直方图，并根据对所述直方图的分析确定边缘基元的识别阈值。所述边缘基元可以为灰度值在预定阈值范围内的像素点。所述边缘基元的识别阈值，可以为利用自适应阈值算法进行计算得到的动态阈值。
[0062]步骤S703，根据所述边缘基元的识别阈值统计每行中边缘基元数目，并记录每行边缘基元的开始位置和结束位置。
[0063]步骤S704，识别所述处理后图像中的非空白行。可以根据所述处理后图像的灰度直方图，将灰度值极差(灰度值最大值与最小值的差)低于预定阈值的行识别为空白行，其余识别为非空白行。例如，将灰度值极差低于直方图中最大灰度值与最小灰度值之间振幅(极差)的5%的行识别为空白行。在后续的处理中将识别出的空白行作为空白背景，不做后续处理，后续处理中只将非空白行作为处理目标。其中，预定阈值可以为根据对多种样本图片进行训练后得到的变量，例如，针对于目前已知训练后的证照图片而言，可以将预定阈值设为灰度直方图中最大灰度值与最小灰度值之间振幅的5%，针对其它类型的图片识别，该变量可以根据对其他类型图像进行训练的结果进行配置。
[0064]步骤S705，判断当前非空白行是否满足预设条件，如果满足，则进行下一非空白行的检测。其中，所述预设条件，可以将大量字符样本送入BP神经网络中进行训练学习，根据BP神经网络训练后得到的结果来确定，例如，判断每行中的边缘基元的数目是否达到预定数目。
[0065]步骤S706，当连续检测到超过预定数目的非空白行满足所述预设条件时，根据每一非空白行的边缘基元的开始位置和结束位置确定文本图像的位置。
[0066]对于上述确定所述处理后图像中的文本图像的位置的步骤S701-S706，执行顺序不限于上述一种，还可以采用其他的顺序执行，例如，可以先识别所述处理后图像中的非空白行，再对识别出的非空白行进行其他的步骤识别、判断等。
[0067]在步骤S602中，对所述文本图像进行字符分割，提取出所述文本图像中的每个字符的图像。
[0068]对所述文本图像进行分割可以利用投影法进行行切分和字切分以提取出所述文本图像中每个字符的图像。行切分，就是将一行一行的字符切分出来，形成单行字符文本图像。可以沿行的方向水平投影，通过识别文字行与行之间的空白进行行切分。字切分，就是在进行了行切分并得到的单行字符文本图像后，将单个字符图像从每个单行字符文本图像中切分出来，得到每个字符的单个字符图像。
[0069]在步骤S105中，对提取出的每个字符的图像进行文字识别。
[0070]可以利用BP神经网络对所述字符进行文字识别，将每个字符的图像送入BP神经网络系统中进行字符的识别。
[0071]其中，BP神经网络中的预先对字符样本的训练可以通过的对字符样本的图像矩阵进行训练的方法，即，先对字符样本的图像进行归一化处理，得到每个字符样本的图像矩阵，再对所述每个字符样本的图像矩阵进行BP神经网络(误差反向传播)训练学习。
[0072]在进行每个字符图像的识别时将所述每个字符的图像送入BP神经网络中进行字符的识别。
[0073]本申请还提供了一种识别印刷品上字符的装置，图8是根据本申请实施例的识别印刷品上字符的装置800的结构框图，如图所示该装置800可以包括:采集模块810，分层处理模块820，图层合并模块830，提取模块840，以及识别模块850。
[0074]采集模块810可以用于对所述印刷品进行拍摄以获取要识别的图像。
[0075]分层处理模块820可以用于对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像。
[0076]图层合并模块830可以用于将得到的分层图像进行图层合并，以得到处理后图像。
[0077]提取模块840可以用于从所述处理后图像中提取每个字符的图像。
[0078]识别模块850可以用于对提取出的每个字符的图像进行字符识别。
[0079]根据本申请的一个实施例，所述采集模块810可以进一步用于在进行拍摄时按预定条件进行曝光设置。
[0080]根据本申请的一个实施例，所述分层处理模块820可以包括去噪处理模块和对比度增强模块。
[0081]去噪处理模块可以用于对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像。
[0082]对比度增强模块可以用于对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像。
[0083]根据本申请的一个实施例，所述去噪处理模块可以包括:噪点识别模块，去噪灰度值获取模块，以及噪点去除模块。
[0084]噪点识别模块可以用于识别所述复制图像中的噪点。
[0085]去噪灰度值获取模块可以用于将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值。
[0086]噪点去除模块可以用于将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值以得到第一分层图像。
[0087]根据本申请的一个实施例，所述噪点识别模块可以包括:计算子模块，判断子模块，以及识别子模块。
[0088]计算子模块可以用于将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值。
[0089]判断子模块可以用于判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内。
[0090]识别子模块可以用于将灰度值与计算灰度值的差值绝对值超出预定阈值范围的像素点识别为噪点。
[0091]根据本申请的一个实施例，所述对比度增强模块可以包括图像分区模块和灰度调整模块。
[0092]图像分区模块可以用于将所述复制图像划分为至少两个子区域。
[0093]灰度调整模块可以用于对每个子区域分别进行灰度调整，以得到第二分层图像。
[0094]根据本申请的一个实施例，所述合并模块830可以包括:取值模块和灰度值替换模块。
[0095]取值模块可以用于对所述分层图像中相对应像素点的灰度值取中值，得到每个像素点的灰度值中值。
[0096]灰度值替换模块可以用于将每个像素点的灰度值替换为该像素点的灰度值中值，得到处理后图像。
[0097]根据本申请的一个实施例，所述提取模块840可以包括:
[0098]位置获取模块，可以用于获取所述处理后图像中的文本图像的位置；
[0099]字符分割模块，可以用于对所述文本图像进行字符分割，提取出所述文本图像中的每个字符的图像。
[0100]根据本申请的一个实施例，所述位置获取模块可以进一步包括:边缘检测模块，阈值获取模块，统计记录模块，非空白行识别模块，条件判断模块，以及位置确定模块。
[0101]边缘检测模块可以用于通过边缘检测识别出每行像素中的边缘纹理。其中，所述边缘纹理可以为灰度值发生剧烈变化的区域。
[0102]阈值获取模块可以用于对每行像素的边缘纹理做直方图，并根据对所述直方图分析确定边缘基元的识别阈值。
[0103]统计记录模块可以用于根据所述边缘基元的识别阈值统计每行上边缘基元的数量，并记录每行边缘基元的开始位置和结束位置。
[0104]非空白行识别模块可以用于识别所述处理后图像中的非空白行。
[0105]条件判断模块可以用于判断当前非空白行是否满足预设条件，如果满足，则进行下一非空白行的检测。
[0106]位置确定模块可以用于当连续检测到超过预定数目的非空白行满足所述预设条件时，根据每一非空白行的边缘基元的开始位置和结束位置确定文本图像的位置。
[0107]根据本申请的一个实施例，所述识别模块850可以进一步用于，利用BP神经网络对所述每个字符的图像进行字符识别。
[0108]由于本实施例的装置所实现的功能基本相应于前述图1至图7所示的方法实施例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。
[0109]在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
[0110]内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
[0111]计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0112]还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0113]本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0114]以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。
【权利要求】
1.一种识别印刷品上字符的方法，其特征在于，包括: 对所述印刷品进行拍摄以获取要识别的图像；对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像；将得到的分层图像进行图层合并，以得到处理后图像；从所述处理后图像中提取每个字符的图像；以及对提取出的每个字符的图像进行字符识别。
2.根据权利要求1所述的方法，其特征在于，对所述印刷品进行拍摄以获取要识别的图像，包括:在进行拍摄时按预定条件进行曝光设置。
3.根据权利要求1所述的方法，其特征在于，对所述每一幅复制图像分别进行不同的图像处理以得到至少两幅分层图像，包括: 对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像；以及对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像。
4.根据权利要求3所述的方法，其特征在于，对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像，包括: 识别所述复制图像中的噪点；将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值；以及将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值以得到第一分层图像。
5.根据权利要求4所述的方法，其特征在于，识别所述复制图像中的噪点包括: 将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值；判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内；以及将灰度值与计算灰度值的差值的绝对值超出预定阈值范围的像素点识别为噪点。
6.根据权利要求3所述的方法，其特征在于，对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像，包括: 将所述复制图像划分为至少两个子区域；以及对每个子区域分别进行灰度调整，以得到第二分层图像。
7.根据权利要求1所述的方法，其特征在于，将所述分层图像进行合并，以得到处理后图像，包括: 对所述分层图像中相对应像素点的灰度值取中值，得到每个像素点的灰度值中值；以及将每个像素点的灰度值替换为该像素点的灰度值中值，以得到处理后图像。
8.根据权利要求1所述的方法，其特征在于，提取出所述处理后图像中每个字符的图像，包括: 获取所述处理后图像中的文本图像的位置；以及对所述文本图像进行字符分割，提取出所述文本图像中的每个字符的图像。
9.根据权利要求8所述的方法，其特征在于，获取所述处理后图像中的文本图像的位置，包括: 通过边缘检测识别出每行像素中的边缘纹理；对每行像素的边缘纹理做直方图，并根据对所述直方图的分析确定边缘基元的识别阈值；根据所述边缘基元的识别阈值统计每行的边缘基元的数目，并记录每行边缘基元的开始位置和结束位置；识别所述处理后图像中的非空白行；判断当前非空白行是否满足预设条件，如果满足，则进行下一非空白行的检测；以及当连续检测到超过预定数目的非空白行满足所述预设条件时，根据每一非空白行的边缘基元的开始位置和结束位置确定文本图像的位置。
10.根据权利要求1所述的方法，其特征在于，对提取出的每个字符的图像进行字符识另IJ，包括:利用BP神经网络对所述每个字符的图像进行字符识别。
11.一种识别印刷品上字符的装置，其特征在于，包括: 采集模块，用于对所述印刷品进行拍摄以获取要识别的图像；分层处理模块，用于对所述图像进行复制以得到至少两幅复制图像，并对每幅复制图像分别进行不同的图像处理以得到至少两幅分层图像；图层合并模块，用于将得到的分层图像进行图层合并，以得到处理后图像；提取模块，用于从所述处理后图像中提取每个字符的图像；以及识别模块，用于对提取出的每个字符的图像进行字符识别。
12.根据权利要求11所述的装置，其特征在于，所述采集模块，进一步用于在进行拍摄时按预定条件进行曝光设置。
13.根据权利要求11所述的装置，其特征在于，所述分层模块包括: 去噪处理模块，用于对所述复制图像中的一幅进行去除噪点处理以得到第一分层图像；以及对比度增强模块，用于对所述复制图像中的另一幅进行对比度增强处理以得到第二分层图像。
14.根据权利要求13所述的装置，其特征在于，所述去噪处理模块，包括: 噪点识别模块，用于识别所述复制图像中的噪点；去噪灰度值获取模块，用于将每个噪点的灰度值与其周围相邻的八个像素点的灰度值相加并取平均值作为每个噪点的去噪灰度值；以及噪点去除模块，用于将所述复制图像中每个噪点的灰度值替换为该噪点的去噪灰度值以得到第一分层图像。
15.根据权利要求14所述的装置，其特征在于，所述噪点识别模块包括: 计算子模块，用于将所述复制图像中每个像素点的灰度值与其左右两个相邻像素点的灰度值相加并取平均值作为每个像素点的计算灰度值；判断子模块，用于判断每个像素点的灰度值与其计算灰度值的差值的绝对值是否在预定阈值范围内；以及识别子模块，用于将灰度值与计算灰度值的差值的绝对值超出预定阈值范围的像素点识别为噪点。
16.根据权利要求13所述的装置，其特征在于，所述对比度增强模块包括: 图像分区模块，用于将所述复制图像划分为至少两个子区域；以及灰度调整模块，用于对每个子区域分别进行灰度调整，以得到第二分层图像。
17.根据权利要求11所述的装置，其特征在于，所述合并模块包括: 取值模块，用于对所述分层图像中相对应像素点的灰度值取中值，得到每个像素点的灰度值中值；以及灰度值替换模块，用于将每个像素点的灰度值替换为该像素点的灰度值中值，得到处理后图像。
18.根据权利要求11所述的装置，其特征在于，所述提取模块包括: 位置获取模块，用于获取所述处理后图像中的文本图像的位置；以及字符分割模块，用于对所述文本图像进行字符分割，提取出所述文本图像中的每个字符的图像。
19.根据权利要求18所述的装置，其特征在于，所述位置获取模块包括: 边缘检测模块，用于通过边缘检测识别出每行像素中的边缘纹理；阈值获取模块，用于对每行像素的边缘纹理做直方图，并根据对所述直方图分析确定边缘基元的识别阈值；统计记录模块，用于根据所述边缘基元的识别阈值统计每行上边缘基元的数量，并记录每行边缘基元的开始位置和结束位置；非空白行识别模块，用于识别所述处理后图像中的非空白行；条件判断模块，用于判断当前非空白行是否满足预设条件，如果满足，则进行下一非空白行的检测；以及位置确定模块，用于当连续检测到超过预定数目的非空白行满足所述预设条件时，根据每一非空白行的边缘基元的开始位置和结束位置确定文本图像的位置。
20.根据权利要求11所述的装置，其特征在于，所述识别模块进一步用于，利用BP神经网络对所述每个字符的图像进行字符识别。
【文档编号】G06K9/20GK104346609SQ201310331468
【公开日】2015年2月11日申请日期:2013年8月1日优先权日:2013年8月1日
【发明者】侯放申请人:阿里巴巴集团控股有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：侯放
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：显示方法与可携式装置制造方法
上一篇：文件系统的缓存方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。