卡片信息识别方法及装置与流程

文档序号：12468628阅读：328来源：国知局

本公开涉及图像处理技术领域，尤其涉及一种卡片信息识别方法及装置。

背景技术：

在日常生活中，出现了各种各样的卡片。其中，对于一些卡片，卡片信息在该卡片中的位置是固定的，例如，该卡片为身份证，该身份证的背面通常包括签发机关和有效日期等信息，该信息在该身份证的背面中的位置均是固定的。该类卡片在日常生活中通常被广泛使用，以身份证为例，身份证的背面的信息可以用于指示该身份证是由哪个机关签发的，以及该身份证是哪一年办理的，当前是否有效等。在日常使用过程中，为了能够获取到卡片中的卡片信息，通常需要终端对该卡片进行识别。

在相关技术中，卡片信息识别过程通常包括：对卡片进行拍照，之后，终端利用相关技术确定该卡片中的指定区域，例如，针对身份证的背面，该指定区域可以为国徽区域，相应地，该相关技术可以为LBP(Local Binary Pattern，局部二值模式)特征与级联Adaboost的结合技术。之后，由于该类卡片具有很强的结构信息特征，也即是，固定区域对应固定卡片信息，因此，在标准的卡片图像中，以所确定的指定区域作为参照物，终端即可确定该卡片中其它卡片信息的区域，从而确定该区域对应的卡片信息，如此，即可实现对该卡片进行识别。

技术实现要素：

为克服相关技术中存在的问题，本公开提供一种卡片信息识别方法及装置。

第一方面，提供一种卡片信息识别方法，所述方法包括：

从第一图像中确定第一指定区域，所述第一图像为对第二图像进行灰度化处理后的图像，所述第二图像为对待识别的卡片进行拍摄得到，所述卡片中的卡片信息位于所述卡片中的指定位置；

基于所述第一指定区域，确定第二指定区域，所述第二指定区域与所述第一指定区域之间的距离为预设距离；

基于所述第二指定区域，对所述第一图像进行旋转校正；

基于旋转校正后的第一图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

可选地，所述基于所述第二指定区域，对所述第一图像进行旋转校正，包括：

从所述第一图像中切割出所述第二指定区域，得到第二指定区域图像；

对所述第二指定区域图像进行二值化处理，得到二值化区域图像，所述二值化区域图像中包括多个第一连通区域，各个第一连通区域是指连续包括多个像素点的区域；

对所述二值化区域图像进行形态学膨胀和腐蚀处理，得到多个第二连通区域，各个第二连通区域均包括至少一个第一连通区域；

从所述多个第二连通区域中确定最大第二连通区域，所述最大第二连通区域是指包含像素点最多的第二连通区域；

在所述最大第二连通区域中确定连通直线；

确定所述连通直线与水平方向之间的夹角，并基于所述夹角对所述第一图像进行平面旋转，以实现对所述第一图像进行旋转校正。

可选地，所述在所述最大第二连通区域中确定连通直线，包括：

确定所述最大第二连通区域包括的所有像素点中每个像素点的坐标；

基于所述所有像素点中每个像素点的坐标，通过指定拟合算法，确定所述连通直线。

可选地，所述基于旋转校正后的第一图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别，包括：

在旋转校正后的第一图像的指定位置上进行区域切割，得到初步切割图像；

对所述初步切割图像进行二值化处理，得到二值化处理图像；

对所述二值化处理图像进行去燥处理，得到去燥处理图像；

从所述去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对所述多个单字符图像中的每个单字符图像进行识别。

可选地，所述对所述二值化处理图像进行去燥处理，得到去燥处理图像，包括：

确定多个第三连通区域，所述多个第三连通区域为所述二值化处理图像的连通区域；

对于所述多个第三连通区域中的每个第三连通区域，确定所述第三连通区域包括的像素点的个数；

当所述第三连通区域包括的像素点的个数小于或等于预设数量时，对所述第三连通区域进行去燥处理。

可选地，所述方法还包括：

当所述第三连通区域包括的像素点的个数大于所述预设数量时，判断所述第三连通区域的宽度与高度的比值；

当所述第三连通区域的宽度与高度的比值大于预设阈值时，对所述第三连通区域进行去燥处理。

第二方面，提供一种卡片信息识别装置，所述装置包括：

第一确定模块，用于从第一图像中确定第一指定区域，所述第一图像为对第二图像进行灰度化处理后的图像，所述第二图像为对待识别的卡片进行拍摄得到，所述卡片中的卡片信息位于所述卡片中的指定位置；

第二确定模块，用于基于所述第一确定模块确定的所述第一指定区域，确定第二指定区域，所述第二指定区域与所述第一指定区域之间的距离为预设距离；

旋转校正模块，用于基于所述第二确定模块确定的所述第二指定区域，对所述第一图像进行旋转校正；

识别模块，用于基于所述旋转校正模块所旋转校正后的第一图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

可选地，所述旋转校正模块包括：

第一切割子模块，用于从所述第一图像中切割出所述第二指定区域，得到第二指定区域图像；

区域二值化处理子模块，用于对所述第二指定区域图像进行二值化处理，得到二值化区域图像，所述二值化区域图像中包括多个第一连通区域，各个第一连通区域是指连续包括多个像素点的区域；

形态学处理子模块，用于对所述二值化区域图像进行形态学膨胀和腐蚀处理，得到多个第二连通区域，各个第二连通区域均包括至少一个第一连通区域；

第一确定子模块，用于从所述多个第二连通区域中确定最大第二连通区域，所述最大第二连通区域是指包含像素点最多的第二连通区域；

第二确定子模块，用于在所述最大第二连通区域中确定连通直线；

旋转子模块，用于确定所述连通直线与水平方向之间的夹角，并基于所述夹角对所述第一图像进行平面旋转，以实现对所述第一图像进行旋转校正。

可选地，所述第二确定子模块用于：

确定所述最大第二连通区域包括的所有像素点中每个像素点的坐标；

基于所述所有像素点中每个像素点的坐标，通过指定拟合算法，确定所述连通直线。

可选地，所述识别模块包括：

第二切割子模块，用于在旋转校正后的第一图像的指定位置上进行区域切割，得到初步切割图像；

图像二值化处理子模块，用于对所述初步切割图像进行二值化处理，得到二值化处理图像；

去燥处理子模块，用于对所述二值化处理图像进行去燥处理，得到去燥处理图像；

第三切割子模块，用于从所述去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对所述多个单字符图像中的每个单字符图像进行识别。

可选地，所述去燥处理子模块用于：

确定多个第三连通区域，所述多个第三连通区域为所述二值化处理图像的连通区域；

对于所述多个第三连通区域中的每个第三连通区域，确定所述第三连通区域包括的像素点的个数；

当所述第三连通区域包括的像素点的个数小于或等于预设数量时，对所述第三连通区域进行去燥处理。

可选地，所述去燥处理子模块还用于：

当所述第三连通区域包括的像素点的个数大于所述预设数量时，判断所述第三连通区域的宽度与高度的比值；

当所述第三连通区域的宽度与高度的比值大于预设阈值时，对所述第三连通区域进行去燥处理。

第三方面，提供一种卡片信息识别装置，所述装置包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

基于所述第一指定区域，确定第二指定区域，所述第二指定区域与所述第一指定区域之间的距离为预设距离；

基于所述第二指定区域，对所述第一图像进行旋转校正；

基于旋转校正后的第一图像和所述卡片信息在所述卡片中的指定位置，对所述卡片中的卡片信息进行识别。

本公开的实施例提供的技术方案可以包括以下有益效果：对待识别的卡片进行拍摄并进行灰度化处理后，得到第一图像，从该第一图像中确定第一指定区域，并基于该第一指定区域，确定与该第一指定区域之间的距离为预设距离的第二指定区域，基于该第二指定区域，对该第一图像进行旋转校正，以使该第一图像中的卡片处于摆正状态。之后，再基于摆正后的该第一图像和卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别，提高了识别的准确性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种卡片信息识别方法的流程图。

图2A是根据另一示例性实施例示出的一种卡片信息识别方法的流程图。

图2B是图2A实施例所涉及的一种第一图像的示意图。

图2C(1)是图2A实施例所涉及的一种二值化区域图像的示意图。

图2C(2)是图2A实施例所涉及的一种经过形态学膨胀和腐蚀处理后的二值化区域图像的示意图。

图2D是图2A实施例所涉及的另一种经过形态学膨胀和腐蚀处理后的二值化区域图像的示意图。

图2E是图2A实施例所涉及的一种旋转校正后的第一图像的示意图。

图2F是图2A实施例所涉及的一种二值化处理图像的示意图。

图2G是图2A实施例所涉及的一种去燥处理图像的示意图。

图3是根据一示例性实施例示出的一种卡片信息识别装置的框图。

图4是根据一示例性实施例示出的一种卡片信息识别装置400的框图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在相关技术中，根据卡片信息在卡片中的指定位置，确定卡片信息所在的区域，从而基于所确定的区域，对该卡片中的卡片信息进行识别。然而，在实际应用场景中，可能由于拍摄角度等原因，导致卡片在拍摄后得到的图像中并不是处于摆正状态，如此，如果根据上述指定位置对该卡片中的卡片信息进行识别，则容易导致识别出现误差。

为此，在本公开实施例中，提供了一种卡片信息识别方法，通过对拍摄及灰度化处理后的第一图像进行旋转校正处理，使得该第一图像中的卡片处于摆正状态，如此，在基于指定位置对该卡片中的卡片信息进行识别时，可以提高识别的准确性。本公开实施例提供的卡片信息识别方法可以由终端执行，该终端至少具有拍摄功能，用于对待识别的卡片进行拍摄。该终端可以为诸如手机、平板电脑、计算机等之类的终端，本公开实施例对此不做限定。

图1是根据一示例性实施例示出的一种卡片信息识别方法的流程图，如图1所示，该卡片信息识别方法用于终端中，包括以下步骤。

在步骤101中，从第一图像中确定第一指定区域，该第一图像为对第二图像进行灰度化处理后的图像，该第二图像为对待识别的卡片进行拍摄得到，该卡片中的卡片信息位于该卡片中的指定位置。

在步骤102中，基于该第一指定区域，确定第二指定区域，该第二指定区域与该第一指定区域之间的距离为预设距离。

在步骤103中，基于该第二指定区域，对该第一图像进行旋转校正。

在步骤104中，基于旋转校正后的第一图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

在本公开实施例中，对待识别的卡片进行拍摄并进行灰度化处理后，得到第一图像，从该第一图像中确定第一指定区域，并基于该第一指定区域，确定与该第一指定区域之间的距离为预设距离的第二指定区域，基于该第二指定区域，对该第一图像进行旋转校正，以使该第一图像中的卡片处于摆正状态。之后，再基于摆正后的该第一图像和卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别，提高了识别的准确性。

可选地，基于该第二指定区域，对该第一图像进行旋转校正，包括：

从该第一图像中切割出该第二指定区域，得到第二指定区域图像；

对该第二指定区域图像进行二值化处理，得到二值化区域图像，该二值化区域图像中包括多个第一连通区域，各个第一连通区域是指连续包括多个像素点的区域；

对该二值化区域图像进行形态学膨胀和腐蚀处理，得到多个第二连通区域，各个第二连通区域均包括至少一个第一连通区域；

从该多个第二连通区域中确定最大第二连通区域，该最大第二连通区域是指包含像素点最多的第二连通区域；

在该最大第二连通区域中确定连通直线；

确定该连通直线与水平方向之间的夹角，并基于该夹角对该第一图像进行平面旋转，以实现对该第一图像进行旋转校正。

在本公开实施例中，通过旋转校正的方式对该第一图像进行校正，不需要对卡片的四条边进行定位，提高了识别的鲁棒性和准确度。

可选地，在该最大第二连通区域中确定连通直线，包括：

确定该最大第二连通区域包括的所有像素点中每个像素点的坐标；

基于该所有像素点中每个像素点的坐标，通过指定拟合算法，确定该连通直线。

在本公开实施例中，通过确定该最大第二连通区域包括的所有像素点中每个像素点的坐标，实现了在该最大第二连通区域中确定连通直线。

可选地，基于旋转校正后的第一图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别，包括：

在旋转校正后的第一图像的指定位置上进行区域切割，得到初步切割图像；

对该初步切割图像进行二值化处理，得到二值化处理图像；

对该二值化处理图像进行去燥处理，得到去燥处理图像；

从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

在本公开实施例中，对该卡片校正后，根据卡片中的卡片信息在该卡片中的指定位置，将该卡片信息切割出来，并通过一系列处理，将该卡片信息切割成多个单个字符图像，通过OCR模块对该多个单字符图像中的每个单字符图像进行识别，从而实现对该卡片信息的识别。

可选地，对该二值化处理图像进行去燥处理，得到去燥处理图像，包括：

确定多个第三连通区域，该多个第三连通区域为该二值化处理图像的连通区域；

对于该多个第三连通区域中的每个第三连通区域，确定该第三连通区域包括的像素点的个数；

当该第三连通区域包括的像素点的个数小于或等于预设数量时，对该第三连通区域进行去燥处理。

在本公开实施例中，在对该卡片信息进行切割之前，还根据各个第三连通区域所包括的像素点的个数，确定该第三连通区域对应的是否为有效字符，并当该第三连通区域对应的不为有效字符时，对该二值化处理图像进行去燥处理，从而提高了识别的效率。

可选地，该方法还包括：

当该第三连通区域包括的像素点的个数大于该预设数量时，判断该第三连通区域的宽度与高度的比值；

当该第三连通区域的宽度与高度的比值大于预设阈值时，对该第三连通区域进行去燥处理。

在本公开实施例中，在对该卡片信息进行切割之前，还根据各个第三连通区域的宽度与高度的比值，确定该第三连通区域对应的是否为有效字符，并当该第三连通区域对应的不为有效字符时，对该二值化处理图像进行去燥处理，从而提高了识别的效率。

上述所有可选技术方案，均可按照任意结合形成本公开的可选实施例，本公开实施例对此不再一一赘述。

图2A是根据一示例性实施例示出的一种卡片信息识别方法的流程图，如图2A所示，该卡片信息识别方法用于终端中，该卡片信息识别方法包括以下步骤：

在步骤201中，从第一图像中确定第一指定区域，该第一图像为对第二图像进行灰度化处理后的图像，该第二图像为对待识别的卡片进行拍摄得到，该卡片中的卡片信息位于该卡片中的指定位置。

本公开实施例所提供的卡片信息识别方法可以用于对指定卡片进行识别，该指定卡片是指卡片信息位于卡片的指定位置的卡片。在实际应用场景中，由于用户拍摄角度等原因，导致在对待识别的卡片进行拍摄后得到的第二图像中，卡片不是处于摆正状态，如图2B所示，在该种情况下，如果根据指定位置对该卡片中的卡片信息进行识别，将导致识别出现误差，影响识别效果。为此，在本公开实施例中，在对该第二图像进行识别之前，对该第二图像进行校正处理。

其中，为了避免卡片本身带有的颜色对后续处理造成影响，这里对该第二图像进行灰度化处理，得到该第一图像，终端后续基于该第一图像进行卡片识别。终端从该第一图像中确定第一指定区域，通常情况下，该第一指定区域用于指示该卡片中的指定图标或指定字符，该指定图标或指定字符通常不会随着卡片的变化而发生变化。

例如，请参考图2B，若该卡片为身份证，且对该身份证的背面信息进行识别，则该第一指定区域可以为该身份证的背面的国徽所在的区域21。在一种可能的实现方式中，可以采用LBP特征与级联Adaboost结合，从该第一图像中确定国徽所在的区域，具体实现过程可以参见相关技术，这里不做详细介绍。

当然，若该卡片其它类型卡片，还可以通过其它相关技术从该第一图像中确定该第一指定区域，例如，若该卡片为身份证，且对该身份证的正面信息进行识别，则该第一指定区域可以为该身份证的正面的头像所在的区域，在该种情况下，可以通过人脸检测方法，从该第一图像中确定头像所在的区域。

在步骤202中，基于该第一指定区域，确定第二指定区域，该第二指定区域与该第一指定区域之间的距离为预设距离。

其中，该预设距离可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。

与该第一指定区域类似，该第二指定区域可以用于指示上述指定图标或指定字符。例如，请参考图2B，若该卡片为身份证，且对该身份证的背面信息进行识别，则该第二指定区域可以为“中华人民共和国”字符所在的区域22。

需要说明的是，该第二指定区域的大小可以为预设大小，其中，该预设大小可以由用户根据实际需求自定义设置，也可以由该终端默认设置，本公开实施例对此不做限定。如上述，为了能够将“中华人民共和国”多个字符均包括在内，通常可以将该预设大小设置的较大一些。

在步骤203中，基于该第二指定区域，对该第一图像进行旋转校正。

终端基于上述第一指定区域，确定该第二指定区域后，即可基于该第二指定区域，对该第一图像进行旋转校正，其实现过程可以包括如下步骤2031至步骤2036：

步骤2031：从该第一图像中切割出该第二指定区域，得到第二指定区域图像。

步骤2032：对该第二指定区域图像进行二值化处理，得到二值化区域图像，该二值化区域图像中包括多个第一连通区域，各个第一连通区域是指连续包括多个像素点的区域。

终端对从该第一图像中切割出第二指定区域后，对该第二指定区域进行二值化处理，例如，请参考图2C(1)，其中，得到的该二值化区域图像中包括多个第一连通区域，例如，该“中”字对应一个第一连通区域，类似的，每个字符均对应一个单独的第一连通区域，另外，由于在切割过程中，可能将该卡片的其它内容也切割进来了，因此，从图2C(1)可以看出，该二值化区域图像中还包括其它多个第一连通区域。

步骤2033：对该二值化区域图像进行形态学膨胀和腐蚀处理，得到多个第二连通区域，各个第二连通区域均包括至少一个第一连通区域。

例如，请参考图2C(2)，该图2C(2)为经过形态学膨胀和腐蚀处理后的图像，该图像中包括多个第二连通区域。

其中，对该二值化区域图像进行形态学膨胀和腐蚀处理的实现过程可以参见相关技术，本公开实施例对此不做详细介绍。

步骤2034：从该多个第二连通区域中确定最大第二连通区域，该最大第二连通区域是指包含像素点最多的第二连通区域。

步骤2035：在该最大第二连通区域中确定连通直线。

其中，在该最大第二连通区域中确定连通直线的实现过程可以包括：确定该最大第二连通区域包括的所有像素点中每个像素点的坐标，基于该所有像素点中每个像素点的坐标，通过指定拟合算法，确定该连通直线。

在一种可能的实现方式中，该指定拟合算法可以为最小二乘法。即终端确定该最大第二连通区域包括的所有像素点中每个像素点的坐标，得到多个离散点，之后，基于该多个离散点，通过该最小二乘法，即可确定上述连通直线，具体实现过程可以参见相关技术。例如，请参考图2D，终端在该最大第二连通区域中确定的连通直线为直线23，该连通直线可以通过直线方程的方式表示。

步骤2036：确定该连通直线与水平方向之间的夹角，并基于该夹角对该第一图像进行平面旋转，以实现对该第一图像进行旋转校正。

该连通直线与水平方向之间的夹角即为卡片与水平面之间的夹角，因此，为了能够将该第一图像中的卡片摆正，终端基于该夹角对该第一图像进行平面旋转，使得该连通直线与水平面之间的夹角为零度，从而将该第一图像中的卡片摆正，例如，请参考图2E，旋转校正后的图像如图2E所示。

上述通过旋转校正的方式对该第一图像进行校正，不需要对卡片的四条边进行定位，提高了识别的鲁棒性和准确度。

将该第一图像旋转校正后，使得该第一图像中的卡片处于摆正状态，之后，终端即可基于该旋转校正后的第一图像，对该卡片中的卡片信息进行识别，具体实现包括如下步骤204至步骤207。

在步骤204中，在旋转校正后的第一图像的指定位置上进行区域切割，得到初步切割图像。

如前文所述，由于该卡片具有较强的结构性，该指定位置对应指定的卡片信息，因此，当对该第一图像旋转校正后，即可在旋转校正后的第一图像的指定位置上进行区域切割，进一步地，终端可以根据第一指定区域，确定该指定位置，之后，在旋转校正后的第一图像的指定位置上进行区域切割，以进行后续识别处理。例如，请参考图2E，对图2E中的指定位置24进行区域切割，得到如图2F所示的初步切割图像。

在步骤205中，对该初步切割图像进行二值化处理，得到二值化处理图像。

在步骤206中，对该二值化处理图像进行去燥处理，得到去燥处理图像。

在实际应用场景中，该二值化处理图像中除了包括有效字符(例如，文字)之外，可能还包括其它符号等，例如该符号可以为“.”(点)或“—”(横杠)等等。为了提后续识别的效率，可以对该二值化处理图像进行去燥处理。

也即是，确定多个第三连通区域，该多个第三连通区域为该二值化处理图像的连通区域，对于该多个第三连通区域中的每个第三连通区域，确定该第三连通区域包括的像素点的个数，当该第三连通区域包括的像素点的个数小于或等于预设数量时，对该第三连通区域进行去燥处理。

其中，该预设数量可以由用户根据实际需求自定义设置，也可以由终端默认设置，本公开实施例对此不做限定。

与上述同理，该第三连通区域是指连续包括多个像素点的区域。当该第三连通区域包括的像素点的个数小于或等于预设数量时，说明该第三连通区域中包括的可能是一个诸如“.”(点)等之类的符号，因此，需要对该第三连通区域进行去燥处理。

另外，在一种可能的实现方式中，确定该第三连通区域包括的像素点的个数之后，当该第三连通区域包括的像素点的个数大于该预设数量时，判断该第三连通区域的宽度与高度的比值，当该第三连通区域的宽度与高度的比值大于预设阈值时，对该第三连通区域进行去燥处理。

也即是，请参考图2F，该图2F示例性地示出了一种二值化处理图像的示意图，该二值化处理图像中可能还包括“—”(横杠)之类的符号，该类符号的特征在于，其对应的该第三连通区域所包括的像素点的个数可能大于上述预设数量，但其对应的该第三连通区域的宽度远远大于高度。因此，当该第三连通区域包括的像素点的个数大于该预设数量时，并不能说明该第三连通区域对应的是一个有效字符，终端进一步地判断该第三连通区域的宽度与高度的比值。当该第三连通区域的宽度与高度的比值大于预设阈值时，说明该第三连通区域对应的可能是一个“—”(横杠)符号，因此，终端对该第三连通区域进行去燥处理。

需要说明的是，上述判断是否需要对该第三连通区域进行去燥处理的方式仅是示例性，在另一实施例中，当该第三连通区域中包括的是一个诸如“.”(点)等之类的符号时，还可以根据该第三连通区域所包括的像素点的坐标，判断是否需要对该第三连通区域进行去燥。由于诸如“.”(点)之类的符号通常位于第三连通区域的下端，因此，当该第三连通区域所包括的像素点的坐标位于下端时，对该第三连通区域进行去燥处理。

另外，上述对该第三连通区域进行去燥处理的实现过程是指：将该第三连通区域中所包括的所有像素点的像素值均更改为背景颜色所对应的像素值。

在步骤207中，从该去燥处理图像中切割出多个单字符图像，并通过OCR模块对该多个单字符图像中的每个单字符图像进行识别。

终端对该二值化处理图像进行去燥处理后，即可对所得到的去燥处理图像进行切割。请参考图2G，该图2G示例性地示出了一种去燥处理图像，该终端可以通过分别向X轴和Y轴进行积分投影的方法，对该去燥处理图像进行切割，得到多个多个单字符图像。之后，该终端对切割好的单个字符进行OCR(Optical Character Recognition，光学字符识别)。其中，在该OCR模块中，本公开实施例可以通过CNN(Convolutional Neural Networks，卷积神经网络)技术对该单字符图像进行分类识别。如此，即实现了对该卡片中的卡片信息进行识别。

当然，需要说明的是，在本公开实施例中，仅是以在OCR模块中，通过CNN技术对该单字符图像进行分类识别为例进行说明，在另一实施例中，还可以通过其它技术对该单字符图像进行识别，本公开实施例对此不做限定。

需要说明的是，通过上述步骤204至步骤207，可以实现基于旋转校正后的第一图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别的步骤。

图3是根据一示例性实施例示出的一种卡片信息识别装置的框图。参照图3，该装置包括第一确定模块310，第二确定模块320、旋转校正模块330和识别模块340。

第一确定模块310，用于从第一图像中确定第一指定区域，该第一图像为对第二图像进行灰度化处理后的图像，该第二图像为对待识别的卡片进行拍摄得到，该卡片中的卡片信息位于该卡片中的指定位置；

第二确定模块320，用于基于该第一确定模块310确定的该第一指定区域，确定第二指定区域，该第二指定区域与该第一指定区域之间的距离为预设距离；

旋转校正模块330，用于基于该第二确定模块320确定的该第二指定区域，对该第一图像进行旋转校正；

识别模块340，用于基于该旋转校正模块330所旋转校正后的第一图像和该卡片信息在该卡片中的指定位置，对该卡片中的卡片信息进行识别。

可选地，该旋转校正模块330包括：

第一切割子模块，用于从该第一图像中切割出该第二指定区域，得到第二指定区域图像；

区域二值化处理子模块，用于对该第二指定区域图像进行二值化处理，得到二值化区域图像，该二值化区域图像中包括多个第一连通区域，各个第一连通区域是指连续包括多个像素点的区域；

形态学处理子模块，用于对该二值化区域图像进行形态学膨胀和腐蚀处理，得到多个第二连通区域，各个第二连通区域均包括至少一个第一连通区域；

第一确定子模块，用于从该多个第二连通区域中确定最大第二连通区域，该最大第二连通区域是指包含像素点最多的第二连通区域；

第二确定子模块，用于在该最大第二连通区域中确定连通直线；

旋转子模块，用于确定该连通直线与水平方向之间的夹角，并基于该夹角对该第一图像进行平面旋转，以实现对该第一图像进行旋转校正。

可选地，该第二确定子模块用于：

确定该最大第二连通区域包括的所有像素点中每个像素点的坐标；

基于该所有像素点中每个像素点的坐标，通过指定拟合算法，确定该连通直线。

可选地，该识别模块340包括：

第二切割子模块，用于在旋转校正后的第一图像的指定位置上进行区域切割，得到初步切割图像；

图像二值化处理子模块，用于对该初步切割图像进行二值化处理，得到二值化处理图像；

去燥处理子模块，用于对该二值化处理图像进行去燥处理，得到去燥处理图像；

第三切割子模块，用于从该去燥处理图像中切割出多个单字符图像，并通过光学字符识别OCR模块对该多个单字符图像中的每个单字符图像进行识别。

可选地，该去燥处理子模块用于：

确定多个第三连通区域，该多个第三连通区域为该二值化处理图像的连通区域；

对于该多个第三连通区域中的每个第三连通区域，确定该第三连通区域包括的像素点的个数；

当该第三连通区域包括的像素点的个数小于或等于预设数量时，对该第三连通区域进行去燥处理。

可选地，该去燥处理子模块还用于：

当该第三连通区域包括的像素点的个数大于该预设数量时，判断该第三连通区域的宽度与高度的比值；

当该第三连通区域的宽度与高度的比值大于预设阈值时，对该第三连通区域进行去燥处理。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不做详细阐述说明。

图4是根据一示例性实施例示出的一种卡片信息识别装置400的框图。例如，装置400可以是移动电话，计算机，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等。

参照图4，装置400可以包括以下一个或多个组件：处理组件402，存储器404，电源组件406，多媒体组件408，音频组件410，输入/输出(I/O)的接口412，传感器组件414，以及通信组件416。

处理组件402通常控制装置400的整体操作，诸如与显示，电话呼叫，数据通信，相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器420来执行指令，以完成上述的方法的全部或部分步骤。此外，处理组件402可以包括一个或多个模块，便于处理组件402和其他组件之间的交互。例如，处理组件402可以包括多媒体模块，以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在装置400的操作。这些数据的示例包括用于在装置400上操作的任何应用程序或方法的指令，联系人数据，电话簿数据，消息，图片，视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现，如静态随机存取存储器(SRAM)，电可擦除可编程只读存储器(EEPROM)，可擦除可编程只读存储器(EPROM)，可编程只读存储器(PROM)，只读存储器(ROM)，磁存储器，快闪存储器，磁盘或光盘。

电源组件406为装置400的各种组件提供电源。电源组件406可以包括电源管理系统，一个或多个电源，及其他与为装置400生成、管理和分配电源相关联的组件。

多媒体组件408包括在所述装置400和用户之间的提供一个输出接口的屏幕。在一些实施例中，屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板，屏幕可以被实现为触摸屏，以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界，而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中，多媒体组件408包括一个前置摄像头和/或后置摄像头。当装置400处于操作模式，如拍摄模式或视频模式时，前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如，音频组件410包括一个麦克风(MIC)，当装置400处于操作模式，如呼叫模式、记录模式和语音识别模式时，麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中，音频组件410还包括一个扬声器，用于输出音频信号。

I/O接口412为处理组件402和外围接口模块之间提供接口，上述外围接口模块可以是键盘，点击轮，按钮等。这些按钮可包括但不限于：主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器，用于为装置400提供各个方面的状态评估。例如，传感器组件414可以检测到装置400的打开/关闭状态，组件的相对定位，例如所述组件为装置400的显示器和小键盘，传感器组件414还可以检测装置400或装置400一个组件的位置改变，用户与装置400接触的存在或不存在，装置400方位或加速/减速和装置400的温度变化。传感器组件414可以包括接近传感器，被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器，如CMOS或CCD图像传感器，用于在成像应用中使用。在一些实施例中，该传感器组件414还可以包括加速度传感器，陀螺仪传感器，磁传感器，压力传感器或温度传感器。

通信组件416被配置为便于装置400和其他设备之间有线或无线方式的通信。装置400可以接入基于通信标准的无线网络，如WiFi，2G或3G，或它们的组合。在一个示例性实施例中，通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中，所述通信组件416还包括近场通信(NFC)模块，以促进短程通信。例如，在NFC模块可基于射频识别(RFID)技术，红外数据协会(IrDA)技术，超宽带(UWB)技术，蓝牙(BT)技术和其他技术来实现。

在示例性实施例中，装置400可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现，用于执行上述方法。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器404，上述指令可由装置400的处理器420执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

一种非临时性计算机可读存储介质，当所述存储介质中的指令由移动终端的处理器执行时，使得移动终端能够执行上述图1或图2A实施例所涉及的卡片信息识别方法。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杨松;陈志军;万韶华
技术所有人：北京小米移动软件有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。