数字区域的识别方法和识别装置、移动终端的制作方法

文档序号：9471926阅读：409来源：国知局

数字区域的识别方法和识别装置、移动终端的制作方法
【技术领域】
[0001]本公开涉及图像处理技术领域，尤其涉及数字区域的识别方法、数字区域的识别装置和移动终端。
【背景技术】
[0002]随着科技的不断发展，终端设备能够执行越来越多的功能，尤其是智能手机等移动终端，已经成为人们日常生活中不可或缺的一部分。
[0003]举例而言,OCR (Optical Character Recognit1n,光学字符识别)几乎成为所有终端设备必备的功能，使得很多原本需要用户手动输入的场景下，可以通过OCR技术自动识别和输入信息，比如在使用“充值卡”时，无需用户手动输入账户名和密码，而直接通过OCR技术自动识别即可，有助于提高用户的工作效率。
[0004]具体地，终端设备需要首先获取“充值卡”的图像，再从该图像中识别出账户名和密码等数字。然而，该“充值卡”的图像上显然还会包含很多其他信息，从而造成对账户名和密码等数字的干扰和影响，导致误识别或无法识别等情况的发生。

【发明内容】

[0005]为克服相关技术中存在的问题，本公开提供一种数字区域的识别方法、数字区域的识别装置和移动终端。
[0006]根据本公开实施例的第一方面，提供一种数字区域的识别方法，包括:
[0007]获取对象的待识别图像；
[0008]调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像；
[0009]根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。
[0010]在该技术方案中，由于区域分类器是预先基于对象的样本图像的样本训练而得至IJ，使得在利用该区域分类器对对象进行分类识别时，其分类依据实际上来源于对象自身的区域设置特点，不仅能够适应于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出待识别图像中的数字区域，便于执行后续的OCR处理。
[0011]在一示例性实施例中，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。在该技术方案中，通过对第一分类器的级联优化，使得到的第二分类器融合了所有区域训练样本的样本特征，从而有助于提升识别的准确度。
[0012]在一示例性实施例中，每个所述第一分类器是由相应区域训练样本的方向梯度直方图(Histogram of Oriented Gradient, HOG)特征经过线性判别分析(LinearDiscriminant Analysis, LDA)投影后得到。在该技术方案中,通过采用HOG特征,使得能够根据梯度分布来更好地描述区域训练样本；同时，通过LDA投影对HOG特征进行降维处理，从而有助于降低第二分类器的训练难度，提高训练效率。
[0013]在一示例性实施例中，对应于数字区域的每个区域训练样本包括至少两个数字字符。在该技术方案中，通过使每个区域训练样本中包含多个数字字符，从而能够表达出单个字符无法表达出的区域结构特征，有助于提升训练得到的区域分类器的区域识别准确度。其中，区域训练样本中应当包含两位数字字符下的所有情况(如00、01……99)，以避免遗漏而导致后期识别失败；此外，每个区域训练样本中也可以包含其他数量的数字字符，则也应当确保包含相应数量的数字字符下的所有情况(如000、001……999)。
[0014]在一示例性实施例中，根据所述区域分类器识别所述待识别图像中的数字区域包括:在所述待识别图像上依次选取预设大小的候选区域；通过所述区域分类器判别每个所述候选区域的类型；将判别结果为数字区域类型的候选区域进行合并。
[0015]在该技术方案中，通过依次选取候选区域并识别其类型，从而将判别为数字区域类型的候选区域合并，以得到最终的数字区域。其中，候选区域的大小可以根据实际需求进行预先设置，当候选区域较大时有助于提升识别效率，而当候选区域较小时则有助于提升识别精准度。
[0016]在一示例性实施例中，将判别结果为数字类型的候选区域进行合并包括:根据数字区域的形状特征和/或数字区域在所述对象中的分布特征，筛除被判定为数字区域类型的候选区域中与数字区域无关的候选区域，并对剩余的数字类型的候选区域进行合并。
[0017]在该技术方案中，数字区域的形状特征包括:数字区域呈矩形、与对象的边沿平行、数字区域内的数字字符排列为一排或多排、数字区域为预设长度等；而数字区域在对象中的分布特征包括:数字区域在对象上的相对设置位置、数字区域与对象之间的相对显示比例等。基于数字区域的形状特征和/或分布特征，即可筛除不符合要求的候选区域，消除误判断的影响；同时，通过合并符合要求的数字区域类型的候选区域，从整体上得到组成待识别图像上的数字区域。
[0018]在一示例性实施例中，还包括:按照预设比例对所述待识别图像进行缩放操作，以得到多个显示比例的待识别图像；根据所述区域分类器识别每个显示比例的待识别图像中的数字区域；以及，根据识别出的每个数字区域在相应的待识别图像中的相对位置，合并所有显示比例的待识别图像中识别出的数字区域，以作为所述待识别图像中的数字区域。
[0019]在该技术方案中，通过基于图像缩放操作的金字塔扫描，使得在不同显示比例的待识别图像上分别实现区域特征识别，有助于消除显示比例的差异而导致的识别误差。
[0020]在一示例性实施例中，在根据所述区域分类器识别出所述待识别图像中的数字区域之后，还包括:将所述区域分类器识别出的数字区域作为候选数字区域，并对每个候选数字区域中的字符进行切分操作；调用预配置的数字判别器，并根据所述数字判别器识别切分得到的每个字符；筛除所述候选数字区域中的非数字字符，并将剩余字符对应的区域作为所述待识别图像中的数字区域。
[0021]在该技术方案中，当区域分类器对应的区域训练样本中包含至少两个数字字符时，其更倾向于整体区域特征的识别，从而导致识别出的数字区域中可能包含有非数字字符。因此，将区域分类器得到的数字区域重新作为候选数字区域，并实现基于数字判别器的字符类型识别，能够有效消除候选数字区域中包含的非数字字符，避免影响后续的OCR处理等。
[0022]在一示例性实施例中，所述数字判别器由对应于所述对象中的数字区域内的数字字符和非数字区域内的非数字字符的字符训练样本生成，且所述字符训练样本来自所述对象的样本图像。在该技术方案中，由于数字判别器是预先基于对象的样本图像的样本训练而得到，使得在利用该数字判别器对字符类型进行识别时，其分类依据实际上来源于对象自身的字符特点，从而不仅能够适用于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出非数字字符，使最终得到的数字区域更加准确。
[0023]在一示例性实施例中，所述数字判别器是由相应训练样本的方向梯度直方图特征经过支持向量机的训练而得到。
[0024]根据本公开实施例的第二方面，提供一种数字区域的识别装置，包括:
[0025]图像获取单元，用于获取对象的待识别图像；
[0026]分类器调用单元，用于调用预配置的对应于所述对象的区域分类器，所述区域分类器由对应于所述对象中的数字区域和非数字区域的区域训练样本生成，且所述区域训练样本来自所述对象的样本图像；
[0027]区域识别单元，用于根据所述区域分类器识别出所述待识别图像中的数字区域，以供对所述数字区域进行光学字符识别。
[0028]在该技术方案中，由于区域分类器是预先基于对象的样本图像的样本训练而得至IJ，使得在利用该区域分类器对对象进行分类识别时，其分类依据实际上来源于对象自身的区域设置特点，不仅能够适应于多种环境条件(每个样本图像均可以认为对应于一种环境条件)，而且具有更强的识别能力和更好的识别效果，从而准确识别出待识别图像中的数字区域，便于执行后续的OCR处理。
[0029]在一示例性实施例中，所述区域分类器是由每个区域训练样本对应的第一分类器级联得到的第二分类器。在该技术方案中，通过对第一分类器的级联优化，使得到的第二分类器融合了所有区域训练样本的样本特征，从而有助于提升识别的准确度。
[0030]在一示例性实施例中，每个所述第一分类器是由相应区域训练样本的方向梯度直方图特征经过线性判别分析投影后得到。在该技术方案中，通过采用HOG特征，使得能够根据梯度分布来更好地描述区域训练样本；同时，通过LDA投影对HOG特征进行降维处理，从而有助于降低第二分类器的训练难度，提高训练效率。
[0031]在一示例性实施例中，对应于数字区域的每个区域训练样本包括至少两个数字字符。在该技术方案中，通过使每个区域训练样本中包含多个数字字符，从而能够表达出单个字符无法表达出的区域结构特征，有助于提升训练得到的区域分类器的区域识别准确度。其中，区域训练样本中应当包含两位数字字符下的所有情况(如00、01……99)，以避免遗漏而导致后期识别失败；此外，每个区域训练样本中也可以包含其他数量的数字字符，则也应当确保包含相应数量的数字字符下的所有情况(如000、001……999)。
[0032]在一示例性实施例中，所述区域识别单元包括:区域选取子单元，用于在所述待识别图像上依

完整全部详细技术资料下载

当前第1页1 2 3 4 5

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张涛;陈志军;张祺深;
技术所有人：小米科技有限责任公司;
我是此专利的发明人

上一篇：一种基于通信方式来自动定位捕杀蚊虫的方法
上一篇：遥感图像土地利用分类结果的修正方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。