复杂背景卡面信息识别方法及系统的制作方法

文档序号：6503684阅读：112来源：国知局

复杂背景卡面信息识别方法及系统的制作方法
【专利摘要】本申请提供一种复杂背景卡面信息识别方法及系统。该方法包括：定位待识别的所述卡面的图像中的字符信息所在区域，以获取一个或多个字符信息图像；对获取的所述字符信息图像进行复杂特征向量提取；根据所述复杂特征向量，识别所述字符信息图像中的字符信息。本申请解决了复杂卡面背景下(如银行卡）的信息准确识别的问题，其基于复杂图像特征，克服了传统基于阈值分割的方法所面临的无法对复杂背景卡面信息进行有效准确识别的缺陷，提升了卡面信息识别准确度，实现高效率的复杂背景卡面信息的识别。
【专利说明】复杂背景卡面信息识别方法及系统

【技术领域】
[0001] 本申请涉及图像处理领域，尤其涉及一种复杂背景卡面信息识别方法及系统。

【背景技术】
[0002] 随着互联网的发展，在线支付、手机支付等快捷支付已经越来越普遍。在此期间，需要银行卡用户直接输入卡信息的情况越来越多。使用图像捕捉设备获取银行卡卡面信息，辅助信息快速录入也已成为潮流趋势。
[0003] 目前，光学字符识别技术可用于解码使用包括但不限于扫描仪和数码相机在内的各种类型的图像捕捉设备获得的诸如水平的文本行之类的字符的图像，用于读取银行卡卡片表面所印制之信息，如卡号，有效期，持卡人姓名及银行卡发卡组织等。光学字符识别方法，其基本计算流程为图像前景背景分割、二值化、细化、编码与识别。由于具有单调背景假设，传统的光学字符识别系统中，文字前景与背景的分割比较简便；在提取出的文字前景可进行二值化、细化、编码而后进行识别，整体上计算比较简便，计算量少。然而，此类方法主要适用于单调背景的文本识别，无法识别出复杂背景中的字符。因而，基于传统光学字符识别原理的识别技术有很大的局限性，其局限性主要是基于识别结果可靠程度比较低，其次传统光学字符识别方法主要针对单调背景文本文件设计，无法有效应用于通常具有复杂背景图案的银行卡的卡面信息识别，用户需要花费较多精力检查、校正识别结果，以保证所保存信息的正确性。
[0004] 因此，需求一种能够从复杂背景卡面图像中准确识别出卡面信息的技术。

【发明内容】

[0005] 本申请的主要目的在于提供一种复杂背景卡面信息识别方法及其系统，以解决实现复杂卡面背景下(如银行卡）的信息准确识别的问题。
[0006] 根据本申请的一个方面的实施例，提供一种复杂背景卡面信息识别方法，包括：定位待识别的所述卡面的图像中的字符信息所在区域，以获取一个或多个字符信息图像；对获取的所述字符信息图像进行复杂特征向量提取；根据所述复杂特征向量，识别所述字符信息图像中的字符信息。
[0007] 根据本申请的另一方面的实施例，提供一种复杂背景卡面信息识别系统，包括：定位单元，定位待识别的所述卡面的图像中的字符信息所在区域，以获取一个或多个字符信息图像；第一特征提取单元，对获取的所述字符信息图像进行复杂特征向量提取；字符信息识别单元，根据所述复杂特征向量，识别所述字符信息图像中的字符信息。
[0008] 与现有技术相比，本申请提供一种基于复杂图像特征如Harris、SIFT特征、适用于复杂背景的卡面信息识别方法及其系统，克服了传统基于阈值分割的方法所面临的无法对复杂背景卡面信息进行有效准确识别的缺陷，提升了卡面信息识别准确度，实现高效率的复杂背景卡面信息的识别。

【专利附图】

【附图说明】
[0009] 此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中： [0010] 图1是本申请一个实施例的复杂背景卡面信息识别方法的主要流程图；
[0011] 图2是本申请一个实施例的识别方法中优选的预处理方法的流程图；
[0012] 图3是本申请一个实施例的预处理方法中特征提取计算方式示意图；
[0013] 图4是本申请一个实施例的识别方法中优选的字符定位方法的流程图；
[0014] 图5是本申请一个实施例的字符定位方法中图像匹配滑动方向顺序图；
[0015] 图6是本申请一个实施例的识别方法中优选的判断识别方法流程图；
[0016] 图7是本申请一个实施例的复杂背景卡面信息识别系统的结构框图。

【具体实施方式】
[0017] 本申请的主要思想在于基于复杂图像特征的、适用于复杂背景的卡面信息识别，其应用复杂图像特征如Harris与SIFT特征，通过采集大量经标记数据样本训练分类器如支持向量机、人工神经网络等获得训练后的具有能进行识别的一系列参数数据的分类器 (以下称为识别器)，该识别器被用于匹配通过上述识别器分割出的字符图像区域以获得相应的字符信息，从而解决了传统基于阈值分割的方法所面临的无法识别复杂背景信息的问题。
[0018] 为使本申请的目的、技术方案和优点更加清楚，以下结合附图及具体实施例，对本申请作进一步地详细说明。
[0019] 本申请并不做图片前景、背景分割，直接使用待识别字符候选区域整体作为文字前景计算其特征向量，并使用机器学习方法训练分类器以获得识别器；同时，为获得准确的字符候选区域，本申请的计算中需进行多次识别，且所使用的图像特征较大，计算相对复杂因而对运行平台的要求比较高。
[0020] 图1示出了本申请一个实施例的复杂背景卡面信息识别方法的主要流程图100。
[0021] 步骤S110,输入待识别的具有复杂背景卡片的卡面图像。
[0022] 通常利用图像捕捉装置如摄像头、照相机、扫描仪等获取待识别的对象(如银行卡）的卡面图像。这些具有复杂背景的卡面图像上，有各种需要录入的信息，主要是字符信息，包括：数字、字母、文字、其他各种字符。
[0023] 步骤S120,在该卡面图像上，定位关心信息/待识别的字符信息(如卡片的各种信息：卡号、数字、日期、姓名等等）的图像区域。
[0024] 可以经过粗略定位到精确定位(或叫准确定位）的过程。
[0025] 例如，定位待识别的银行卡的卡面图像上的字符(包括数字、卡号、文字等）信息所在的区域。
[0026] 这里可以根据卡片，如银行卡制作标准，对银行卡卡号区域、有效日期区域、持卡人姓名区域等这些包括字符(数字、卡号）的区域，进行初步定位，如优选字符信息定位方法 400所提及的粗略定位。
[0027] 然后再进行准确定位，例如基于卡面纹理信息在初步定位结果周边进行快速进一步精确定位，从而获得卡面字符信息区域的准确定位。优选地，可以采用字符信息定位方法 400提及的准确定位方式实现，其甚至能在精确定位过程中获得单个字符信息区域对应的字符信息图像。
[0028] 步骤S130,基于对卡面图像上的字符信息区域的定位，对待识别的字符信息图像中的字符信息进行识别。
[0029] 卡面信息主要是各种字符信息包括文字(如持卡人姓名、有效日期)、数字(如银行卡的卡号、日期号码）等。主要如下：
[0030] 第一，获得单个的字符信息图像(每个单独的字符信息的图像)。
[0031] 一种方式是在准确定位字符信息区域后，对于不同字符信息区域，可以进行字符信息的分割。分割方式例如：可以将卡号信息区域分割成21个子区域作为卡号备选区域、可以将有效日期区域分为月份和年份(月份与年份信息用反斜杠"/"分割)、可以将持卡人姓名分出其各个英文字母。这样能确定单个的字符信息区域，并获取单个的字符信息图像。
[0032] 优选的另一种方式，可以在定位时就获得字符信息图像，例如：通过下述字符信息定位步骤400,定位出每个字符信息的准确位置，并在该准确定位过程中，就获得单个的字符信息图像，并将一系列的单个的字符信息图像提供以备识别使用。由此，可以接收已经获得的每个单独的字符信息图像。
[0033] 第二，对获得的一系列字符信息图像(一系列单个的字符信息的图像)，进行特征提取，优选地，可以采用下述预处理方法200中的特征提取方式，如对24*24像素标准图像的8*8像素逐点计算，获得如Harris等角点特征、SIFT有旋转不变性的特征（即复杂特征向量)。
[0034] 第三，再根据这些特征（复杂特征向量)，利用已经预先训练分类器得到的识别器，来进行判断以识别出对应图像区域中的字符信息。可以通过机器学习算法(神经网络、支持向量机SVM等分类器）预先对字符数据库进行训练，得到识别器（即带参数数据的分类器或称字符分类器)，通过提取字符显著特征如上述Harris、SIFT等复杂特征向量，用识别器进行分类识别判断从而识别出字符信息。优选地，如利用下述优选的预处理方法200及字符信息的判断识别方法600。
[0035] 步骤S140,对识别出的结果进行验证，采用算法来校验经识别器判断识别出的字符信息。优选地，对于银行卡卡片来说，可以使用银行卡卡号编码普遍采用的Luhn模十校验算法校验例如判断识别方法600中识别出的卡号以确认最终识别结果。校验成功则输出最终结果。校验失败时还可以提供出错信息。
[0036] 如图2所示，为复杂背景卡面信息识别方法中可采用的优选预处理方法流程图 200。
[0037] 采集步骤S210,预先采集大量的图像数据样本并对这些图像数据样本进行分割和标记。由此能获得大量的分类好的单独的字符信息图像(样本图像)。
[0038] 在对输入的待识别的图像上的信息进行识别之前，需要进行预处理，以便获得能对待识别的信息进行识别的样本(字符信息样本）数据库以及识别器(训练后带参数数据的分类器)。
[0039] 具体一种方式，可以是预先采集大量的卡面(如：信用卡）图像数据样本，通常是带字符信息的图像，然后对这些图像数据样本进行分割，将分割后获得的单个字符信息图像 (下称样本图像）进行标记。
[0040] 通过该分割，可以将图像数据样本中的字符信息分开，形成单独的字符信息图像 (样本图像)。而通过该标记，能将采集的样本图像中各个单独的字符信息图像，确定到其所属的字符信息类别中去。
[0041] 该分割、标记（即图像数据样本分析）可以由人工或机器算法等方式，指定采集的分割后的样本图像(单独的字符信息图像）所属字符信息的类别。
[0042] 这里，采集方式，可以通过图像捕捉/摄取装置来提供银行卡图像以进行图像数据样本采集。
[0043] 例如：通过图像采集装置采集样本用的银行卡片的图像，这些卡片的卡面图像上包含诸如卡号、日期等字符信息（图像数据样本)。接下来可以对这些图像数据样本做分析 (分割和标记)，比如人工方式分析，具体的可以是使用图像编辑工具，如Photoshop等，可以在采集到的这些图像数据样本上找到数字字符所在区域，选取一个数字字符的范围，如第一位6,则将覆盖6这个数字的范围取出，另行保存为一个图像，即分割图像数据样本为单独的字符信息图像(样本图像)，并将它的标记设定为6,即标记该作为样本图像的单独的字符信息图像所属字符信息类别。
[0044] 归一化步骤S220,将获得的各个标记后的样本图像，进行归一化处理。
[0045] 具体如，将一样本图像进行放大、矫正或缩小至标准大小的处理。优选地，全部样本图像都统一为24*24个像素大小。
[0046] 归一化处理，可以包括样本图像的矫正与缩放等图像处理操作。通过缩放能够将图像大小归一化。这里，通过矫正，还可以进一步将采集(如拍摄)的图像存在比如旋转方向的情形将其旋转回到标准方向的情形(如人们习惯使用的字符信息方向）。
[0047] 这里，进一步还可以将这些归一化后的样本图像，保存在适当的存储设备、数据库和/或缓存中。
[0048] 特征提取步骤S230,在每个归一化后的样本图像上进行特征提取处理，对其进行特征向量描述。由此获得进行判断识别字符信息所需的样本图像的复杂向量特征，作为特征样本。
[0049] 具体而言，在一标准图像上（即统一图像大小标准)，这里，可以是进行过归一化处理的样本图像，如24*24个像素大小的图像，对该图像上的每个8*8像素的图像逐点计算其图像特征。提取的图像特征如：Harris特征（Harris角点检测算法即基于灰度图像的角点提取算法中使用的图像特征，如与角点有关的特征向量)、SIFT (Scale-invariant feature transform尺度不变特征转换)特征(为SIFT提取影像中局部特征算法中使用的图像特征，如对尺度缩放、旋转、亮度变化无关的特征向量)、等等。
[0050] -个对24*24样本图像上每个8*8图像素的图像逐点提取上述复杂特征向量的方式，例如：可以是将一个8*8像素块与其相邻的8*8像素块构成一个大的图像区块如16*16 的大区块进行；该大区块可以选取比如36最强维特征向量描述；同时，该区块可以在标准图像上如该24*24的图像上，按照8像素的步长，分别在横向、纵向移动，组合后最终针对该 24*24标准的样本图像，可以得到高维特征向量描述的整个24*24的字符图案。
[0051] 逐点计算，例如：横向、纵向分别按8像素步长移动，每个像素块(区块）有16个像素，所以横向、纵向分别有2个位置计算该36维的特征向量。特征向量的总长度为 36*2*2=144。如图 3 所示。
[0052] 进一步的，该高维特征向量(如上述例子中144维)还可以进行降维，降低维度后能提升下面将描述的识别处理过程中的识别速度。降维方法例如可以采用主元分析PCA等降低维度的算法。
[0053] 这里，提取出归一化后的各个样本图像中的图像特征，优选地，是提取较复杂的图像特征，且尽量为方向不变的复杂特征向量，可以作为本申请下面将描述的识别处理过程中需要使用的各个样本图像的特征样本，尤其是在识别处理中，通过目标检测识别的方式进行光学识别，需要用到这类复杂的特征样本(如Harris特征、SIFT特征等方向不变的复杂特征向量)，以在识别处理过程中克服复杂的卡面背景造成的影响。
[0054] 这里，提取出图像的这些特征，将会作为特征样本在判断识别时的识别算法中使用，这些特征样本进一步可以保存到各种存储设备、缓存、数据库等中。
[0055] 基于上述方式，本申请无需对卡片图像进行前景、背景的分割，直接使用待识别字符的卡面图像的候选区域的整体作为文字前景，计算其特征向量，也就是用到了更多的更复杂的图像特征，其在识别准确度、识别结果可靠程度上，都将高于传统的传统二值分割方法分分割前景、背景而识别前景的方式。
[0056] 训练步骤S240,利用特征提取步骤S205中提取出的样本图像的特征，作为图像信息的识别处理中的特征样本，并以这些特征样本训练分类器，以获得相应的识别处理(如识别算法）所用的含参数数据的分类器即识别器。
[0057] 分类器，如采用支持向量机SVM或人工神经网络。
[0058] 而分类器训练，比如，训练支持向量机SVM或人工神经网络等分类器。
[0059] 这里，基于提取的复杂特征向量，例如，在步骤S205中提取的多个样本图像的 Harris特征，可以利用Harris特征进行分类器训练，可以得到一个包含参数数据的分类器即识别器。该识别器基于存有的特征样本，将用于对待识别的字符信息图像的判断识别处理。
[0060] 如图4所示，为复杂背景卡面信息识别方法中可采用的优选的字符定位方法流程图 400。
[0061] 粗略定位步骤S410,对输入的需要识别的卡面(如银行卡)的卡面图像上的字符信息区域进行粗略定位。
[0062] 这里，输入的需要识别的卡面图像，可以通过图像捕捉/摄取装置提供具有复杂背景的卡面(诸如银行卡）的图像。并且，需要识别的卡面，是具有复杂背景的卡片表面，如各种银行卡(信用卡）等。传统的光学字符识别系统，需要对文字(字符）前景和背景分割，也就只能对背景简单的卡面进行字符信息识别。卡面背景复杂的银行卡等卡面，其无法分割前景和背景，因而，是无法采用传统光学字符识别系统对其上的信息(文字、字符等）进行识别的。
[0063] 具体而言，先对背景复杂的卡面的图像，进行粗略的字符信息位置区域的定位。可以使用经验信息，比如银行卡片的国际标准IS07810、IS07816等，来粗略的定位需要进行识别的卡面图像上的字符位置区域，比如：定位首位字符(卡号）的横向、纵向位置区域(或者末位字符/卡号的横向、纵向位置区域)。在这个位置区域的基础上，再进行下述的准确定位。
[0064] 准确定位步骤S420 (或称精确定位步骤)，基于上述粗略定位的字符信息区域，进行准确字符信息区域定位。
[0065] 这些卡面上的字符信息是待识别的卡面的图像中一系列待识别的字符(如数字、卡号、文字、字母、其他符号等）信息。
[0066] 准确定位可以获得待识别卡面图像上的不同字符区域所在位置，进而定位到各个字符信息所在位置，还能获得每个字符信息所在区域并获得相应的一系列单个的字符信息的图像。以便识别处理中能利用检测到的这些单个字符信息的字符信息图像。
[0067] 具体地，在上述粗略定位的字符信息区域的首字符位置附近，滑动识别器进行检测，将利用该识别器检测时的最大响应位置作为最终首位字符(例如：卡号、数字）所在的位置。
[0068] 其中，该分类器优选地，可以是支持向量机和人工神经网络等分类器。
[0069] 其中，检测优选地，可以从粗略定位的字符信息区域(如粗略定位的首位字符大致区域）的中间位置开始，然后按照图5所示图像匹配(识别器检测）滑动方向顺序图中的数字所显示的顺序，上下左右地对各个位置利用识别器进行检测(先在1指示的位置检测、再滑动到2指示的位置检测、接着滑到3指示的位置，……一直到9指示的位置)，当识别器检测到某个位置时，输出大于某个阈值时即停止检测搜索，并输出首字符定位的位置。这样能减少检测次数、提1?定位速度。
[0070] 同样，还可以通过准确定位首字符的上述具体方式，来对最后一个(末尾）字符的位置进行准确定位。
[0071] 并且，将首字符和末尾字符之间按照24*24像素大小均匀分配，可以获得多个中间字符信息所在区域。这样，沿横向滑动该识别器，就能逐步获得位于首字符和末尾字符之间的各个字符信息的位置。这些不同位置的字符信息也就能准确地被定位。
[0072] 准确定位了这些字符信息所在位置，进而由识别器的检测（图像的匹配)，也就能获得每个字符信息所在区域的相应的每个字符信息图像，从而，由首字符到末尾字符的一系列字符信息图像被取得。
[0073] 类似的，复杂背景卡面上的如银行卡卡面上的其他字符信息所在区域，例如有效日期、姓名、卡种标识等等，也都可以采用上述方式进行准确定位，并可基于此去获取这些不同位置所在的字符信息图像。
[0074] 如图6所示，为复杂背景卡面信息识别方法中可采用的优选的字符信息的判断识别方法流程图600。
[0075] 接收步骤S610,接收根据定位字符信息区域得到字符信息图像。
[0076] 输入的待识别的卡面的图像经过定位处理后，可以获得一系列字符信息所在区域、甚至获取到相应的一系列字符信息图像。接收这些待识别的字符信息图像。
[0077] 优选地，采用字符信息定位方法400中的识别器检测的准确定位字符信息所在区域的方式，获得一系列单个的字符信息的字符信息图像。接收的即为这些字符信息图像。
[0078] 特征提取步骤S620,基于得到的字符信息图像，进行图像特征的提取。
[0079] 该图像特征提取步骤，可参见预处理方法200中的特征提取方式，分析出字符信息定位方法400中得到的一系列字符信息图像中的每一个(如单个的字符信息的图像)，提取出方向不变的复杂特征向量（Harris特征、SIFT特征等)。
[0080] 判断识别步骤S630,基于提取的复杂特征向量，将这些图像特征（复杂特征向量）送入识别器中进行识别。
[0081] 优选地，如预处理方法200中运用复杂特征向量样本训练后得到的识别器，进行判断识别，确定待识别的单个的字符信息图像中对应的字符信息。如对卡号进行识别判断，则判断某个含有一数字字符的图像(有个像数字"1"的字符信息的图像)是否属于这个数字 (是否表示数字"1")。
[0082] 这里，由于采用方向不变的复杂特征向量，通过目标检测方法进行光学字符信息识别（即识别算法)，因而不受复杂卡面背景的影响。
[0083] 这里，运用的不同的分类器，其训练得到的识别器分类判断次数不同。使用二类分类器，比如支持向量机SVM，对数字字符信息的进行分类判断时，待识别的数字字符信息图像需要通过10个数字字符的该识别器判断以确定是哪个数字（10次分类才能判断属于哪个数字)。而使用多类分类器，如人工神经网络，则对数字字符信息进行分类判断时，该待识别的数字字符信息图像做一次分类就可以判断出来，即通过1个识别器进行判断即可。 [0084] 根据本申请的实施例，还提供对应于所述识别方法的一种复杂背景卡面的信息的识别系统700。如图7所示的一种复杂背景卡面的信息的识别系统结构框图。
[0085] 优选地，该系统700包括：输入单元710,输入待识别的具有复杂背景卡片的卡面图像；定位单元720,输入单元710输入的该卡面图像上，定位关心信息/待识别的字符信息；字符信息判断识别单元730,基于定位单元720定位该卡面图像上的字符信息所属区域，对待识别的字符信息图像中的字符信息进行识别；验证单元740,对判断识别单元730 识别出的结果进行验证；预处理单元750,以预先获得特征样本和利用特征样本训练分类器后得到的识别器(带有一系列参数数据的分类器)，以应用于判断识别单元730的待识别字符信息图像特征提取和字符信息的判断识别。
[0086] 输入单元710,优选地，通常利用图像捕捉装置如摄像头、照相机、扫描仪等获取待识别的对象(如银行卡）的卡面图像。这些具有复杂背景的卡面图像上，有各种需要录入的信息，主要是字符信息，包括：数字、字母、文字、其他各种字符。
[0087] 定位单元720,实现如步骤S120的处理。优选地，可以包括粗略定位单元721和准确定位单元722,以实现字符信息定位方法400的处理。优选地，粗略定位单元721和准确定位单元722分别实现步骤S410和步骤S420的处理。
[0088] 字符信息判断识别单元730,实现步骤S130的处理。优选地，可以包括接收图像信息单元731、第一特征提取单元732、判断识别单元733,实现判断识别方法600的处理。接收图像信息单元731，获取准确定位所得到的一系列字信息符图像，如利用方法400的处理得到字符信息图像（即方法600的步骤S610的处理);第一特征提取单元732,提取图像特征 (步骤S620的处理，参照方法200中的图像特征提取步骤S230的处理）以提取出复杂特征向量；判断识别单元733,其利用方法200中的步骤S240训练得到的识别器以及步骤S230 提取的特征样本，基于特征提取单元732提取的图像特征进行分类判断，以识别出字符图像信息所属字符信息(步骤S630的处理)。
[0089] 验证单元740,优选地，实现验证步骤S140的处理。如，对于银行卡卡片来说，可以使用银行卡卡号编码普遍采用的Luhn模十校验算法校验例如判断识别单元733中识别出的卡号以确认最终识别结果。校验成功则输出最终结果。校验失败时还可以提供出错信肩、。
[0090] 预处理单元750,优选地，实现预处理方法200的处理。优选地，可以包括：采集单元751以实现步骤S210处理、归一化单元752以实现步骤S220的处理、第二特征提取单元 753以实现步骤S230的处理、以及训练单元754以实现步骤S240的处理。
[0091] 由于本实施例的系统所实现的功能基本相应于前述图1至图6所示的方法实施例，故本实施例的描述中未详尽之处，可以参见前述实施例中的相关说明，在此不做赘述。 [0092] 本申请采用了方向不变的复杂特征向量，并通过目标检测的方法进行光学字符识另IJ，克服了复杂卡面背景造成的影响，并且，识别结果可靠程度得到提升，在复杂背景的卡面信息识别中应用，其正确性准确性高。
[0093] 在一个典型的配置中，计算设备包括一个或多个处理器（CPU)、输入/输出接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器 (RAM)和/或非易失性内存等形式，如只读存储器（ROM)或闪存（flash RAM)。内存是计算机可读介质的示例。
[0094] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存（PRAM)、静态随机存取存储器（SRAM)、动态随机存取存储器（DRAM)、其他类型的随机存取存储器（RAM)、只读存储器（ROM)、电可擦除可编程只读存储器（EEPR0M)、快闪记忆体或其他内存技术、只读光盘只读存储器 (CD-ROM)、数字多功能光盘（DVD)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体（transitory media),如调制的数据信号和载波。
[0095] 本说明书中的各个实施例一般采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似的部分互相参见即可。
[0096] 本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块或单元。一般地，程序模块或单元可以包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。一般来说，程序模块或单元可以由软件、硬件或两者的结合来实现。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块或单元可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0097] 最后，还需要说明的是，术语"包括"、"包含"或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句"包括一个……"限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0098] 本领域内的技术人员应明白，本申请的实施例可提供为方法、系统、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。
[0099] 本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其主要思想；同时，对于本领域的一般技术人员，依据本申请的思想，在【具体实施方式】及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。
【权利要求】
1. 一种复杂背景卡面信息识别方法，其特征在于，包括：定位待识别的所述卡面的图像中的字符信息所在区域，以获取一个或多个字符信息图像；对获取的所述字符信息图像进行复杂特征向量提取；根据所述复杂特征向量，识别所述字符信息图像中的字符信息。
2. 根据权利要求1所述的方法，其特征在于，定位待识别的卡面图像中的字符信息所在区域，以获取一个或多个字符信息图像，包括：粗略定位步骤，基于复杂背景卡面的制作标准，初步定位字符信息所在区域；准确定位步骤，根据初步定位的字符信息所在区域，利用一识别器按一定方向顺序进行检测，获取准确的每一个字符信息所在位置，并获取相应位置的字符信息图像。
3. 根据权利要求2所述的方法，其特征在于，粗略定位步骤还包括：初步定位字符信息所在区域时，能粗略定位首位字符信息和/或末位字符信息所在位置；准确定位步骤还包括：在所述首位字符信息和/或末位字符信息所在位置附近，利用所述识别器按上下左右的方向顺序滑动匹配以进行检测，获得准确的首位字符信息和/或末位字符信息的位置；按统一图像大小标准，均匀分配由首位字符信息和/或末位字符信息的准确位置所确定的字符信息所在区域，对分配出的每个字符信息所在区域利用所述识别器按上下左右的方向顺序滑动匹配以进行检测，获得准确的每个字符信息的位置；基于每个字符信息的准确的位置，获取相应位置区域的每个字符信息图像。
4. 根据权利要求1所述的方法，其特征在于，对获取的所述字符信息图像进行复杂特征向量提取包括：基于定位所获取的一个或多个字符信息图像，对所述字符信息图像统一大小标准；预设一像素块，对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征，以获得所述字符信息图像的复杂特征向量。
5. 根据权利要求4所述的方法，其特征在于，所述逐点计算图像特征包括：所述像素块与其相邻的像素块形成区块，对所述区块选取36维的特征向量描述；在所述字符信息图像上按8像素的步长分别沿横向、纵向移动，组合得到对所述字符信息图像的高维的特征向量描述。
6. 根据权利要求1所述的方法，其特征在于，还包括：预处理步骤，其中，采集大量具有复杂背景的卡面图像数据样本并进行分割和标记，以获得标记了分类的字符信息图像；对所述标记了分类的字符信息图像，进行归一化处理，以获得统一大小标准的字符信息图像；预设一像素块，对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征，以获得所述字符信息图像的复杂特征向量作为特征样本；利用所述特征样本，进行分类器训练，以获得识别处理用的所述识别器。
7. 根据权利要求6所述的方法，其特征在于，根据所述复杂特征向量，识别所述字符信息图像中的字符信息包括：基于特征样本，将所述字符信息图像送入所述识别器，判断并识别出相应的字符信息。
8. 根据权利要求6所述的方法，其特征在于，预设一像素块，对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征，以获得所述字符信息图像的复杂特征向量作为特征样本包括：所述像素块与其相邻的像素块形成区块，对所述区块选取36维的特征向量描述；在所述字符信息图像上按8像素的步长分别沿横向、纵向移动，组合得到对所述字符信息图像的高维的特征向量描述。
9. 根据权利要求4或6所述的方法，其特征在于：字符信息图像的统一大小标准，是将所述字符图像统一为24*24像素标准图像；预设的一像素块为8*8像素块；所述复杂特征向量包括方向不变的特征向量。
10. 根据权利要求1所述的方法，其特征在于，还包括：输入步骤，利用图像捕捉方式输入待识别的所述卡面的图像；验证步骤，对识别出的所述字符信息进行验证以确认最终识别结果。
11. 一种复杂背景卡面信息识别系统，其特征在于，包括：定位单元，定位待识别的所述卡面的图像中的字符信息所在区域，以获取一个或多个字符信息图像；第一特征提取单元，对获取的所述字符信息图像进行复杂特征向量提取；字符信息识别单元，根据所述复杂特征向量，识别所述字符信息图像中的字符信息。
12. 根据权利要求11所述的系统，其特征在于，定位单元包括：粗略定位单元，基于复杂背景卡面的制作标准，初步定位字符信息所在区域；准确定位单元，根据初步定位的字符信息所在区域，利用一识别器按一定方向顺序进行检测，获取准确的每一个字符信息所在位置，并获取相应位置的字符信息图像。
13. 根据权利要求12所述的系统，其特征在于，粗略定位单元还包括：初步定位字符所在区域时，能粗略定位首位字符信息和/或末位字符信息所在位置；准确定位单元还包括：在所述首位字符信息和/或末位字符信息所在位置附近，利用所述识别器按上下左右的方向顺序滑动匹配以进行检测，获得准确的首位字符信息和/或末位字符信息的位置；按统一图像大小标准，均匀分配由首位字符信息和/或末位字符信息的准确位置所确定的字符信息所在区域，对分配出的每个字符信息所在区域利用所述识别器按上下左右的方向顺序滑动匹配以进行检测，获得准确的每个字符信息的位置；基于每个字符信息的准确的位置，获取相应位置区域的每个字符信息图像。
14. 根据权利要求11所述的系统，其特征在于，第一特征提取单元包括：基于定位所获取的一个或多个字符信息图像，对所述字符信息图像统一大小标准；预设一像素块，对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征，以获得所述字符信息图像的复杂特征向量。
15. 根据权利要求14所述的系统，其特征在于，第一特征提取单元中，所述逐点计算图像特征包括：所述像素块与其相邻的像素块形成区块，对所述区块选取36维的特征向量描述；在所述字符信息图像上按8像素的步长分别沿横向、纵向移动，组合得到对所述字符信息图像的高维的特征向量描述。
16. 根据权利要求11所述的系统，其特征在于，还包括：预处理单元，所述预处理单元包括：采集单元，采集大量具有复杂背景的卡面图像数据样本并进行分割和标记，以获得标记了分类的字符信息图像；归一化单元，对所述标记了分类的字符信息图像，进行归一化处理，以获得统一大小标准的字符信息图像；第二特征提取单元，预设一像素块，对所述字符信息图像上的每个所述像素块的图像逐点计算图像特征，以获得所述字符信息图像的复杂特征向量作为特征样本；训练单元，利用所述特征样本，进行分类器训练，以获得识别处理用的所述识别器。
17. 根据权利要求16所述的系统，其特征在于，字符信息识别单元包括：判断识别单元，其基于特征样本，将所述字符信息图像送入所述识别器，判断并识别出相应的字符信肩、。
18. 根据权利要求16所述的系统，其特征在于，第二特征提取单元包括：所述像素块与其相邻的像素块形成区块，对所述区块选取36维的特征向量描述；在所述字符信息图像上按8像素的步长分别沿横向、纵向移动，组合得到对所述字符信息图像的高维的特征向量描述。
19. 根据权利要求14或16所述的系统，其特征在于：字符信息图像的统一大小标准，是将所述字符图像统一为24*24像素标准图像；预设的一像素块为8*8像素块；所述复杂特征向量包括方向不变的特征向量。
20. 根据权利要求11所述的系统，其特征在于，还包括：输入单元，利用图像捕捉方式输入待识别的所述卡面的图像；验证单元，对识别出的所述字符信息进行验证以确认最终识别结果。
【文档编号】G06K9/20GK104217203SQ201310216817
【公开日】2014年12月17日申请日期:2013年6月3日优先权日:2013年6月3日
【发明者】陈果, 李扬申请人:支付宝（中国）网络技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈果;李扬;
技术所有人：支付宝（中国）网络技术有限公司;
我是此专利的发明人

上一篇：基线电容校准的制作方法
上一篇：一种用泰勒级数解析计算电力系统电压稳定防界点的方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。