一种身份证号码识别方法及装置与流程

文档序号:12916132阅读:697来源:国知局
一种身份证号码识别方法及装置与流程

本发明涉及图像识别技术领域,特别涉及一种身份证号码识别方法及装置。



背景技术:

身份证记载了持有人的个人信息和唯一的标识信息即身份证号码,在进行人员管理时具有重要的作用。身份证登记常采用手工填写的方式,工作效率低,填写出错率高。因此急需采用身份证号码自动识别技术自动识别身份证号码。

身份证号码自动识别技术可以广泛应用于服务行业、交通系统和公安系统等需要身份证检验的部门,通过对身份证号码的自动识别,节省了大量的人力物力,因而身份证号码识别技术具有广阔的应用前景。

现有技术中,在识别身份证号码时,可以采用无线射频识别(radiofrequencyidentification,rfid)方法识别身份证号码,但是采用rfid方法的设频识别设备成本较高,不利于广泛应用。

在进行身份证号码识别时,应用较广泛的是采用光学字符识别(opticalcharacterrecognition,ocr)方法进行识别,但是由于ocr方法,不能根据身份证图像的特点对身份证号码进行定位和识别,因此在进行身份证号码识别时,准确率较差。



技术实现要素:

本发明实施例公开了一种身份证号码识别方法及装置,用以解决现有技术中在进行身份证号码识别时,准确率较差的问题。

为达到上述目的,本发明实施例公开了一种身份证号码识别方法,所述方法包括:

在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行;

根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域;

采用列扫描线对所述第一区域中的图像进行逐列扫描,根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域;针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。

进一步地,在采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描之前,所述方法还包括:

对所述身份证图像进行二值化处理,并对二值化处理后的身份证图像进行均值滤波处理。

进一步地,所述根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域包括:

针对每一列,识别位于列扫描线上的像素点,若列扫描线上存在像素值小于预设的像素阈值的像素点,将该列作为目标列;

根据每个目标列确定第二候选区域,其中,所述第二候选区域中包含的每一列均为目标列;

根据所述第一区域在所述身份证图像中的位置,在所述第二候选区域中确定包含身份证号码中的每个第一字符的每个第二区域。

进一步地,所述根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符包括:

针对所述每个第二字符,根据针对该第二字符预存的模板对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值;根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符,其中所述第一特征值和第二特征值根据对应子区域内大于预设像素值的像素点的数量确定。

进一步地,所述方法还包括:

针对所述每个第二字符,根据该第二字符对应的每个模板,采用相同的预设划分方式将每个模板划分为多个第一子区域;在每个模板中选取数量相同,且对应的多个目标第一子区域,针对每个目标第一子区域,根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值;根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值。

进一步地,所述根据针对该第二字符预存的每个模板中对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值包括:

采用预设划分方式将所述第二区域划分为多个第二子区域,根据针对该第二字符预存的每个模板中对应的子区域,选取对应的每个目标第二子区域;

根据位于每个目标第二子区域中像素值大于设定阈值的像素点的数量,确定每个目标第二子区域的第二特征值。

进一步地,所述预设划分方式为分别沿水平方向和垂直方向对区域进行等间隔划分。

进一步地,根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符包括:

确定该第二区域对应的每个第二特征值与每个第二字符对应的每个第一特征值的方差值,将方差值最小时对应的第二字符确定为该第二区域中的身份证号码的第一字符。

本发明实施例公开了一种身份证号码识别装置,所述装置包括:

扫描模块,用于在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;

识别确定模块,用于针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行;根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域;

所述扫描模块,还用于采用列扫描线对所述第一区域中的图像进行逐列扫描;

所述识别确定模块,还用于根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域;

匹配模块,用于针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。

进一步地,所述装置还包括:

预处理模块,用于对所述身份证图像进行二值化处理,并对二值化处理后的身份证图像进行均值滤波处理。

进一步地,所述识别确定模块,具体用于针对每一列,识别位于列扫描线上的像素点,若列扫描线上存在像素值小于预设的像素阈值的像素点,将该列作为目标列;根据每个目标列确定第二候选区域,其中,所述第二候选区域中包含的每一列均为目标列;根据所述第一区域在所述身份证图像中的位置,在所述第二候选区域中确定包含身份证号码中的每个第一字符的每个第二区域。

进一步地,所述匹配模块,具体用于针对所述每个第二字符,根据针对该第二字符预存的模板对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值;根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符,其中所述第一特征值和第二特征值根据对应子区域内大于预设像素值的像素点的数量确定。

进一步地,所述装置还包括:

划分确定模块,用于针对所述每个第二字符,根据该第二字符对应的每个模板,采用相同的预设划分方式将每个模板划分为多个第一子区域;在每个模板中选取数量相同,且对应的多个目标第一子区域,针对每个目标第一子区域,根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值;根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值。

进一步地,所述匹配模块,具体用于采用预设划分方式将所述第二区域划分为多个第二子区域,根据针对该第二字符预存的每个模板中对应的子区域,选取对应的每个目标第二子区域;根据位于每个目标第二子区域中像素值大于设定阈值的像素点的数量,确定每个目标第二子区域的第二特征值。

进一步地,所述匹配模块,具体用于确定该第二区域对应的每个第二特征值与每个第二字符对应的每个第一特征值的方差值,将方差值最小时对应的第二字符确定为该第二区域中的身份证号码的第一字符。

本发明实施例公开了一种身份证号码识别方法及装置,所述方法包括:在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行;根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域;采用列扫描线对所述第一区域中的图像进行逐列扫描,根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域;针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。由于在本发明实施例中,根据身份证图像中的每一行上的像素点的像素值确定目标行,根据目标行确定第一候选区域,并且结合身份证号码在身份证图像中的位置,确定包含身份证号码的第一区域;根据第一区域中的每一列上的像素点的像素值,确定包含身份证号码中的每个字符的第二区域,然后根据模板识别第二区域中的字符。因为结合了身份证的结构特点,确定身份证号码的所在的区域更加准确快速,从而提高了识别身份证号码的准确率。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例1提供的一种身份证号码识别过程示意图;

图2a为本发明实施例提供的一种身份证图像示意图;

图2b为本发明实施例提供的一种身份证图像示意图;

图3为本发明实施例提供的一种身份证图像的行投影直方图;

图4为本发明实施例提供的一种身份证号码的列投影直方图;

图5为本发明实施例提供的一种区域划分示意图;

图6为本发明实施例提供的一种身份证号码识别过程示意图;

图7为本发明实施例提供的一种身份证号码识别装置结构图。

具体实施方式

为了提高识别身份证号码的准确率,本发明实施例提供了一种身份证号码识别方法及装置。

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1:

图1为本发明实施例提供的一种身份证号码识别过程示意图,该过程包括以下步骤:

s101:在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行。

本发明实施例提供的身份证号码识别方法应用于电子设备。

电子设备获取待识别的身份证图像,对该身份证图像进行扫描,根据扫描线上的像素点确定身份证号码的区域。

电子设备在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描,也就是沿垂直于该行扫描线的方向对所述身份证图像进行逐行扫描。

针对行扫描线扫过的每一行,识别位于行扫描线上的像素点,判断该行扫线上是否存在像素值小于预设的像素阈值的像素点,如果行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行。否则,不作为目标行,也就是非目标行。直至遍历所有的行,确定出每个目标行。

因为身份证图像中的像素点比较简单,可以简单的分为黑色像素点和白色像素点,其中,像素值小于预设的像素阈值的像素点可以称为黑色像素点,像素值不小于预设的像素阈值的像素点可以称为白色像素点。

s102:根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域。

当确定出每个目标行后,可以根据每个目标行确定第一候选区域,具体的可以是,识别相邻的两目标行之间是否存在非目标行,如果否,将该相邻的两目标行之间的区域确定为第一子候选区域,直至遍历所有的目标行,确定完所有的第一子候选区域,针对每个第一子候选区域,确定是否存在与其相邻的另一第一子候选区域,如果存在,则将相邻的两个第一子候选区域更新为一个第一子候选区域,并再次确定是否存在与更新后的第一子候选区域相邻的另一第一子候选区域,重复上述确定过程;如果不存在,将第一子候选区域或更新后的第一子候选区域确定为第一候选区域。根据每个目标行确定的第一候选区域中包含的每一行均为目标行。

当确定出第一候选区域后,可以根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域。

身份证号码在图像中的位置可以如图2a所示,位于身份证图像的右下方(图中所示的上、下、左、右),身份证图像中还包含用户的个人信息和用户的人像,身份证号码、个人信息和人像所在的区域均包含黑色像素点,其他不带任何信息的区域中不包含黑色像素点,采用像素阈值确定目标行,可以滤除身份证图像中不含黑色像素点的非目标行。因为第一候选区域中包含的每一行均为目标行,理想情况下,图2a中包含两个第一候选区域,即第一候选区域1和第一候选区域2,根据身份证号码在图像中的位置,可以确定第一候选区域2为包含身份证号码的第一区域。

s103:采用列扫描线对所述第一区域中的图像进行逐列扫描,根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域。

当确定出包含身份证号码的第一区域后,可以采用列扫描线对所述第一区域中的图像进行逐列扫描,根据位于列扫描线上的像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域。

所述列扫描线为平行于身份证图像的短边的扫描线,采用列扫描线沿身份证的长边方向对所述第一区域进行逐列扫描,也就是沿垂直于该列扫描线的方向对所述第一区域进行逐列扫描。

针对列扫描线扫过的每一列,根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域。

s104:针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。

电子设备中预先保存有身份证号码的每个第二字符的模板,当确定出包含身份证号码中的每个第一字符的每个第二区域,可以针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。具体的可以是,将第二区域中的图像与预存的模板对应的图像进行匹配,将匹配度最高的模板对应的图像确定为该第二区域中的图像,则根据该匹配度最高的模板确定该第二区域中的身份证号码的第一字符。图像匹配可以理解为,根据区域中的不同像素值的像素点的分布情况进行匹配。图像匹配确定匹配度的过程为现有技术,在本发明实施例中对该过程不进行赘述。

预先保存的身份证号码的每个第二字符的模板,为身份证号码使用的“ocr-b10bt”字体的数字0-9和字母x的图像的模板。

由于在本发明实施例中,根据身份证图像中的每一行上的像素点的像素值确定目标行,根据目标行确定第一候选区域,并且结合身份证号码在身份证图像中的位置,确定包含身份证号码的第一区域;根据第一区域中的每一列上的像素点的像素值,确定包含身份证号码中的每个字符的第二区域,然后根据模板识别第二区域中的字符。因为结合了身份证的结构特点,确定身份证号码的所在的区域更加准确快速,从而提高了识别身份证号码的准确率。

实施例2:

为了避免身份证图像中的无关信息和噪声对识别身份证号码的干扰,进一步提高识别身份证号码的准确率,在上述实施例的基础上,在本发明实施例中,在采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描之前,所述方法还包括:

对所述身份证图像进行二值化处理,并对二值化处理后的身份证图像进行均值滤波处理。

在本发明实施例中,电子设备在获取到待识别的身份证图像后,可以将该身份证图像转为256级灰度图,并设置像素阈值对灰度图进行二值化处理。由于身份证图像在获取时,可能存在光照影响,以及自身存在污损情况,将身份证图像进行二值化处理可以去除大量无关信息,提高识别身份证号码的准确率。

在对身份证图像进行了二值化处理后,可以对该二值化处理后的身份证图像进行均值滤波处理。例如可以采用3*3模板进行均值滤波处理,也就是针对选取的目标像素点,将该目标像素点周围的8个像素点的像素值的均值作为该目标像素点的像素值。进行均值滤波处理可以滤除身份证图像中的噪声,提高识别身份证号码的准确率。

实施例3:

在上述各实施例的基础上,在本发明实施例中,所述根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域包括:

针对每一列,识别位于列扫描线上的像素点,若列扫描线上存在像素值小于预设的像素阈值的像素点,将该列作为目标列;

根据每个目标列确定第二候选区域,其中,所述第二候选区域中包含的每一列均为目标列;

根据所述第一区域在所述身份证图像中的位置,在所述第二候选区域中确定包含身份证号码中的每个第一字符的每个第二区域。

在本发明实施例中,电子设备根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域。

针对列扫描线扫过的每一列,识别位于列扫描线上的像素点,判断该列扫线上是否存在像素值小于预设的像素阈值的像素点,如果列扫描线上存在像素值小于预设的像素阈值的像素点,将该列作为目标列。否则,不作为目标列,也就是非目标列。直至遍历所有的列,确定出每个目标列。

当确定出每个目标列后,可以根据每个目标列确定第二候选区域,具体的可以是,识别相邻的两目标列之间是否存在非目标列,如果否,将该相邻的两目标列之间的区域确定为第二候选区域,直至遍历所有的目标行,确定完所有的第二子候选区域,针对每个第二子候选区域,确定是否存在与其相邻的另一第二子候选区域,如果存在,则将相邻的两个第二子候选区域更新为一个第二子候选区域,并再次确定是否存在与更新后的第二子候选区域相邻的另一第二子候选区域,重复上述确定过程;如果不存在,将第二子候选区域或更新后的第二子候选区域确定为第二候选区域。根据每个目标列确定的第二候选区域中包含的每一列均为目标列。

当确定出第二候选区域后,可以根据第一区域在所述身份证图像中的位置,在所述第二候选区域中确定包含身份证号码中的每个第一字符的每个第二区域。

电子设备中可以预先保存有身份证号码所在的区域在身份证图像中的位置,因为电子设备并不知道当前采集的包含身份证号码的身份证图像是如图2a所示,即身份证号码在身份证图像中的右下方(图2a所示的上、下、左、右)还是如图2b所示,即身份证号码在身份证图像中的左上方(图2b所示的上、下、左、右)。所以在电子设备中预先保存有身份证号码所在的区域在身份证图像中的两个位置的信息,图2a中身份证号码在身份证图像中的位置可以称为第一位置上,图2b中身份证号码在身份证图像中的位置可以称为第二位置上。将身份证号码位于身份证图像的第一位置上的图像称为正向图像,将身份证号码位于身份证图像的第二位置上的图像称为反向图像。

电子设备中还可以预先保存身份证号码所在的区域在身份证图像中的一个位置,例如保存上述第一位置,当确定出包含身份证号码的第一区域后,可以判断第一区域是否位于预设位置上,如果是,则可以认为获取的身份证图像是正向图像,如图2a所示,如果判断第一区域未位于预设位置上,则可以认为获取的身份证图像是反向图像,如图2b所示,需要将该身份证图像旋转180度后,作为正向图像。其中,身份证图像的反向与正向是针对身份证的同一面来说的,身份证图像由正向到反向、或由反向到正向旋转,只需进行180度旋转,该180度旋转是以垂直于该身份证图像的水平面的垂线为中心进行旋转的。

因为身份证号码为18个字符,且包含身份证号码的第一区域中还包含“公民身份证号码”6个字符,理想情况下,电子设备确定出的第二候选区域为24个,当身份证图像是正向图像时,即如图2a所示时,可以将靠后的18个第二候选区域中的每个第二候选区域确定为第二区域,当身份证图像是反向图像时,即如图2b所示时,可以将靠前的18个第二候选区域中的每个第二候选区域确定为第二区域。

图3为身份证图像的行投影直方图,h代表身份证图像的短边,采用行扫描线对图2a所示的身份证图像由下至上(图2a所示的上、下、左、右)进行行扫描,根据行扫描线上的像素值小于预设像素阈值的像素点的数量,确定身份证图像的行投影直方图,图3中的h1-h2对应的直方图为身份证号码所在的第一区域对应的投影直方图。

图4为身份证号码的列投影直方图,w代表身份证图像的长边,采用列扫描线对图2a所示的身份证号码由左至右(图2a所示的上、下、左、右)进行列扫描,根据列扫描线上的像素值小于预设像素阈值的像素点的数量,确定身份证号码的行投影直方图,图4中的w1-w2、……、wk-3-wk-2、wk-1-wk、wk+1-wk+2对应的直方图为身份证号码中的每个第一字符所在的第二区域对应的投影直方图。

实施例4:

在识别第二区域中的身份证号码的第一字符时,可以将第二区域与预存的模板中的图像采用图像匹配的方式进行匹配,为了进一步提高识别的身份证号码的字符的准确性,在进行匹配时,可以是针对每个子区域,根据子区域对应的特征值进行匹配。在上述各实施例的基础上,在本发明实施中,所述根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符包括:

针对所述每个第二字符,根据针对该第二字符预存的模板对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值;根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符,其中所述第一特征值和第二特征值根据对应子区域内大于预设像素值的像素点的数量确定。

在本发明实施例中,每个第二字符的模板可以被划分为多个子区域,并且保存有每个第二字符的模板的每个子区域的第一特征值。

电子设备在根据预存的身份证号码的每个第二字符的模板,识别第二区域中的身份证号码的第一字符时,可以是针对每个第二字符,根据针对该第二字符预存的模板中对应子区域的第一特征值,确定该第二区域中对应子区域的第二特征值,第一特征值和第二特征值是根据对应子区域内大于预设像素值的像素点的数量确定的。例如,可以是将该子区域中的大于预设像素值的像素点的数量与不大于预设像素值的像素点的数量的比值确定为特征值,也可以是将该子区域中的大于预设的像素值的像素点的数量与该子区域中的所有像素点的数量的比值确定为特征值。对应子区域可以是第二字符的模板和第二区域中的所有子区域或部分子区域,只要第二字符的模板中的子区域与第二区域中的子区域相对应即可。

当确定出第二区域中对应子区域的第二特征值后,则可以根据每个第二字符的模板对应的每个第一特征值和第二区域对应的每个第二特征值,识别该第二区域中的身份证号码的第一字符。

具体的可以是,针对第二区域和第二字符的模板,确定第二区域和第二字符的模板中对应子区域中第一特征值与第二特征值的第一差绝对值。针对每个第二区域和每个第二字符,将对应子区域的第一差值绝对值的和作为目标差绝对值。将与该第二区域的目标差绝对值最小的第二字符的模板的图像确定为该第二区域中的第一字符的图像,因此识别了该第二区域中的身份证号码的第一字符。

实施例5:

每个第二字符可以对应一个模板,也可以对应多个模板,多个模板为该第二字符不同字号的模板。在预先保存每个第二字符的模板中对应子区域的第一特征值,可以选取任意一个字号的模板,确定该模板中的第一子区域的特征值,也可以是针对多个模板,确定第二字符的模板中的第一子区域的特征值。在上述各实施例的基础上,在本发明实施例中,所述方法还包括:

针对所述每个第二字符,根据该第二字符对应的每个模板,采用相同的预设划分方式将每个模板划分为多个第一子区域;在每个模板中选取数量相同,且对应的多个目标第一子区域,针对每个目标第一子区域,根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值;根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值。

在本发明实施中,电子设备中预先保存有预设的划分方式,在确定每个第二字符的对应子区域的第一特征值时,针对每个第二字符,根据该第二字符对应的每个模板,采用相同的预设划分方式将每个模板划分为多个第一子区域。如果每个第二字符对应10种字号,则对应10个模板,每个模板划分为6个第一子区域。

针对每个第二字符,在该第二字符的每个模板中选取数量相同,且对应的多个目标第一子区域,针对每个目标第一子区域,根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值,当确定出所有的目标第一子区域的第一特征值时,再根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值。针对每个第二字符,该第二字符的每个模板对应的子区域是采用相同的划分方式划分的,不同的第二字符的子区域划分方式可以相同,也可以不同。每个模板选取的子区域可以是每个模板中的全部子区域,也可以是部分子区域。只要选取的子区域相对应即可。

如果每个模板划分为6个第一子区域,如果每个模板中选取6个第一子区域作为目标第一子区域,则每个第二字符对应6*10=60个目标第一子区域,如果每个模板中选取4个第一子区域作为目标第一子区域,则每个第二字符对应4*10=40个目标第一子区域。

在根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值时,可以是将该目标第一子区域中的大于预设像素值的像素点的数量与不大于预设像素值的像素点的数量的比值确定为第一子特征值,也可以是将该目标第一子区域中的大于预设的像素值的像素点的数量与该目标第一子区域中的所有像素点的数量的比值确定为第一子特征值。

在根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值时,具体的可以是,针对每个第二字符,针对该第二字符中的每个模板中对应的目标第一子区域,将每个目标第一子区域的第一子特征值的中的任意一个或中值作为每个目标第一子区域的第一特征值。为提高确定的第一特征值的准确性,可以是将每个第一子特征值的平均值确定为第二特征值。

实施例6:

在上述实施例的基础上,在本发明实施例中,所述根据针对该第二字符预存的每个模板中对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值包括:

采用预设划分方式将所述第二区域划分为多个第二子区域,根据针对该第二字符预存的每个模板中对应的子区域,选取对应的每个目标第二子区域;

根据位于每个目标第二子区域中像素值大于设定阈值的像素点的数量,确定每个目标第二子区域的第二特征值。

在本发明实施例中,电子设备中预先保存有预设的划分方式,在确定每个第二区域的对应子区域的第二特征值时,采用预设划分方式将该第二区域划分为多个第二子区域,根据针对该第二字符预存的每个模板中对应的子区域,选取对应的每个目标第二子区域,第二字符的每个模板中选取的目标第一子区域的数量与第二区域中选取的目标第二子区域的数量相同,且相互对应。

在根据位于每个目标第二子区域中像素值大于设定阈值的像素点的数量,确定每个目标第二子区域的第二特征值时,具体的可以是,将该目标第二子区域中的大于预设像素值的像素点的数量与不大于预设像素值的像素点的数量的比值确定为第二特征值,也可以是将该目标第二子区域中的大于预设的像素值的像素点的数量与该目标第二子区域中的所有像素点的数量的比值确定为第二特征值。第一特征值与第二特征值的确定过程相同。

上述各实施例在进行区域划分时,可以是任意划分的,只要保证第二区域与第二字符的模板的划分方式相同即可,为了进一步提高确定的模板的准确率,从而提高了识别身份证号码的第一字符的准确率,在进行区域划分时,可以分别沿水平方向和垂直方向对该区域进行等间隔划分。

图5为区域划分示意图,以字符“9”为例,将该字符“9”所在的区域h*w,沿水平方向进行等间隔划分,划分为多个a*w的子区域,沿垂直方向进行等间隔划分,划分为多个b*h的子区域。较优的,沿水平方向和垂直方向分别划分为10等分,则a=h/10,b=w/10。

另外,因为不同的字符的模板是不同的,在选取子区域时,针对每个字符的模板选取的子区域也可以是不同的,具体的,可以根据不同的字符的特点进行子区域的选取,例如针对字符“9”,选取3个a*w的子区域,4个b*h的子区域,针对字符“1”,选取3个a*w的子区域,5个b*h的子区域等。除了在选取的数量不同,也可以在选取的位置上有所不同,例如,针对字符“9”,选取靠边缘位置的子区域,针对字符“1”,选取靠中间位置的子区域。同一字符的不同模板选取的对应的子区域数量相同,位置也相同。

在对第二区域和模板进行区域划分时,较优的,沿水平方向和垂直方向分别划分为10等分,在选取子区域时,较优的选取6个子区域,则第一特征值为6个第二特征值为6个,选取的第二区域的子区域与模板的子区域的位置相对应。

在确定第二区域中的身份证号码的第一字符时,可以采用特征值求差值的方法进行确定,为了使确定的模板的更加准确,在根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符时,可以是针对每个第二区域,确定该第二区域对应的每个第二特征值与每个第二字符对应的每个第一特征值的方差值,将方差值最小时对应的第二字符确定为该第二区域中的身份证号码的第一字符。

图6为本发明实施例提供的一种身份证号码识别过程示意图,电子设备在获取到身份证图像后,对该身份证图像进行二值化处理及均值滤波处理。针对处理后的身份证图像,先进行行扫描,确定包含身份证号码的第一区域,然后对该第一区域进行列扫描,确定包含身份证号码的每个第一字符的第二区域。针对每个第二区域,确定该第二区域对应的第一特征值,将该第一特征值与模板对应的第二特征值进行相似度匹配,识别该第二区域中的身份证号码的第一字符。

图7为本发明实施例提供的一种身份证号码识别装置结构图,所述装置包括:

扫描模块71,用于在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;

识别确定模块72,用于针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行;根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域;

所述扫描模块71,还用于采用列扫描线对所述第一区域中的图像进行逐列扫描;

所述识别确定模块72,还用于根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域;

匹配模块73,用于针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。

在图7中,所述装置还包括:

预处理模块74,用于对所述身份证图像进行二值化处理,并对二值化处理后的身份证图像进行均值滤波处理。

所述识别确定模块72,具体用于针对每一列,识别位于列扫描线上的像素点,若列扫描线上存在像素值小于预设的像素阈值的像素点,将该列作为目标列;根据每个目标列确定第二候选区域,其中,所述第二候选区域中包含的每一列均为目标列;根据所述第一区域在所述身份证图像中的位置,在所述第二候选区域中确定包含身份证号码中的每个第一字符的每个第二区域。

所述匹配模块73,具体用于针对所述每个第二字符,根据针对该第二字符预存的模板对应子区域的第一特征值,确定所述第二区域中对应子区域的第二特征值;根据所述第一特征值和第二特征值,识别所述第二区域中的身份证号码的第一字符,其中所述第一特征值和第二特征值根据对应子区域内大于预设像素值的像素点的数量确定。

在图7中,所述装置还包括:

划分确定模块75,用于针对所述每个第二字符,根据该第二字符对应的每个模板,采用相同的预设划分方式将每个模板划分为多个第一子区域;在每个模板中选取数量相同,且对应的多个目标第一子区域,针对每个目标第一子区域,根据位于该目标第一子区域中像素值大于设定阈值的像素点的数量,确定该目标第一子区域的第一子特征值;根据每个对应的目标第一子区域的第一子特征值,确定每个目标第一子区域的第一特征值。

所述匹配模块73,具体用于采用预设划分方式将所述第二区域划分为多个第二子区域,根据针对该第二字符预存的每个模板中对应的子区域,选取对应的每个目标第二子区域;根据位于每个目标第二子区域中像素值大于设定阈值的像素点的数量,确定每个目标第二子区域的第二特征值。

所述匹配模块73,具体用于确定该第二区域对应的每个第二特征值与每个第二字符对应的每个第一特征值的方差值,将方差值最小时对应的第二字符确定为该第二区域中的身份证号码的第一字符。

本发明实施例公开了一种身份证号码识别方法及装置,所述方法包括:在待识别的身份证图像中,采用平行于身份证图像的长边的行扫描线,沿身份证图像的短边方向对所述身份证图像进行逐行扫描;针对每一行,识别位于行扫描线上的像素点,若行扫描线上存在像素值小于预设的像素阈值的像素点,将该行作为目标行;根据每个目标行确定第一候选区域,其中,所述第一候选区域中包含的每一行均为目标行;根据身份证号码在身份证图像中的位置,在第一候选区域中确定包含身份证号码的第一区域;采用列扫描线对所述第一区域中的图像进行逐列扫描,根据位于列扫描线上像素点的像素值,在所述第一区域中确定包含身份证号码中的每个第一字符的每个第二区域;针对每个第二区域,根据预存的身份证号码的每个第二字符的模板,识别该第二区域中的身份证号码的第一字符。由于在本发明实施例中,根据身份证图像中的每一行上的像素点的像素值确定目标行,根据目标行确定第一候选区域,并且结合身份证号码在身份证图像中的位置,确定包含身份证号码的第一区域;根据第一区域中的每一列上的像素点的像素值,确定包含身份证号码中的每个字符的第二区域,然后根据模板识别第二区域中的字符。因为结合了身份证的结构特点,确定身份证号码的所在的区域更加准确快速,从而提高了识别身份证号码的准确率。

对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全应用实施例、或结合应用和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1