基于人工神经网络的身份证快速识别方法及其装置与流程

文档序号:12468616阅读:392来源:国知局

本发明属于光学字符识别技术领域,具体涉及一种基于人工神经网络的身份证快速识别方法及其装置。



背景技术:

随着社会大力发展移动互联网,特别是google于2007年推出的android手机平台,很多应用移植到手机端,手机不仅仅成为人们常用的通讯工具,更是现代重要生活助手,为人们工作、生活带来便捷和快乐。身份证是每个成年公民都拥有的,用来标识个人身份的最重要的管理工具,已经运用到社会生活的方方面面,身份证的信息获取具有重要的作用。

目前,身份证号码的录入大多采用人工录入,不但耗时,效率低,并且容易因为人工输入原因产生错误录入,造成不必要的损失;而通过手机摄像头拍照快速录入身份证号码能方便得获取中国公民的身份信息,其中关键技术是光学字符识别(OCR)。

光学字符识别(OCR)国外很早就开始研究,国内从80年代也开始研究,是近年来的热门研究方向,其实现算法也比较多,比如模板匹配、支持向量机(SVM)和人工神经网络(ANN);其中,人工神经网络是“artificial neural network”实际上就是存在于人脑的生物神经网络,在向生物神经网络学习时,先要充分的了解和研究生物神经网络的结构和功能特点以及构造机理,然后学习和实现所需要的智能功能。



技术实现要素:

有鉴于此,本发明的主要目的在于提供一种基于人工神经网络的身份证快速识别方法及其装置,

为达到上述目的,本发明的技术方案是这样实现的:

本发明实施例提供一种基于人工神经网络的身份证快速识别方法,该方法为:移动终端将采集的身份证图像转换为灰度图像,对所述转换的灰度图像进行裁剪获得身份证号码区,并且对该身份证号码区进行阈值处理和数学形态学闭运算形成联通域,通过身份证定位确定所述联通域内存在身份证号码后,对所述联通域进行字符识别和输出。

上述方案中,该方法还包括通过身份证定位确定所述联通域内不存在身份证号码时,结束流程停止识别。

上述方案中,所述移动终端将采集的身份证图像转换为灰度图像,具体为:将拍摄的身份证图像按长宽比例缩小图像,并且图像长度小于600像素,之后,将彩色图像转换成灰度图像。

上述方案中,该方法还包括收集字符样本,读取每个字符样本的特征信息并进行计算将结果写入XML文件,将每个字符样本和对应的特征信息构建字符样本库;所述字符样本库分为11大类,每个大类包含100个字符样本。

上述方案中,所述对所述联通域进行字符识别和输出,具体为:识别联通域分割为18个字符图像,之后分别确定每个字符图像的三个特征值,对所述三个特征值进行识别结果预测,将预测结果与字符样本库进行对比,最后,将相似度最大的分类作为识别结果输出。

上述方案中,所述通过身份证定位确定所述联通域内存在身份证号码,具体为:所述移动终端通过一矩形框定位号码区域,实时检测号码所形成的连通域是否在矩形定位框内,当所述号码区域在矩形定位框内时执行后续流程,否则重新采集图像。

本发明实施例还提供一种基于人工神经网络的身份证快速识别装置,该装置包括:图像转换单元、定位单元、识别单元;

所述图像转换单元,用于将采集的身份证图像转换为灰度图像,对所述转换的灰度图像进行裁剪获得身份证号码区,并且对该身份证号码区进行阈值处理和数学形态学闭运算形成联通域;

所述定位单元,用于确定所述联通域内是否存在身份证号码;

所述识别单元,用于在确定所述联通域内存在身份证号码时,对所述联通域进行字符识别和输出。

上述方案中,所述图像转换单元,具体用于将拍摄的身份证图像按长宽比例缩小图像,并且图像长度小于600像素,之后,将彩色图像转换成灰度图像。

上述方案中,所述识别单元,还用于收集字符样本,读取每个字符样本的特征信息并进行计算将结果写入XML文件,将每个字符样本和对应的特征信息构建字符样本库;所述字符样本库分为11大类,每个大类包含100个字符样本。

上述方案中,所述识别单元,具体用于识别联通域分割为18个字符图像,之后分别确定每个字符图像的三个特征值,对所述三个特征值进行识别结果预测,将预测结果与字符样本库进行对比,相似度最大的分类作为识别结果输出。

与现有技术相比,本发明实施例提供一种基于人工神经网络的身份证快速识别方法,移动终端将采集的身份证图像转换为灰度图像,对所述转换的灰度图像进行裁剪获得身份证号码区,并且对该身份证号码区进行阈值处理和数学形态学闭运算形成联通域,通过身份证定位确定所述联通域内存在身份证号码时,对所述联通域进行字符识别和输出;这样,通过对裁剪的黑白图像进行识别,大幅度提升了识别速度,识别过程平均耗时500毫秒,识别准确率99%,能够满足手机端用户对身份证信息提取需求。

附图说明

图1为本发明实施例提供一种基于人工神经网络的身份证快速识别方法的流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明实施例提供一种基于人工神经网络的身份证快速识别方法,如图1所示,该方法通过以下步骤实现:

步骤101:移动终端将采集的身份证图像转换为灰度图像。

具体地,将拍摄的身份证图像按长宽比例缩小图像,并且图像长度小于600像素,之后,将彩色图像转换成灰度图像。

步骤102:对所述转换的灰度图像进行裁剪获得身份证号码区,并且对该身份证号码区进行阈值处理和数学形态学闭运算形成联通域。

具体地,对灰度图像进行阈值处理时,通过统计灰度值确定一个阈值,使得该阈值能够将前景和背景尽可能的分开,也就是身份证图像中字符与其他部分尽量区分开;通过统计计算得灰度图的平均值为M,任取一灰度值t,将图像分成A和B,对应就是前景和背景色;这两部分的平均值为MA和MB,A部分的像素占总像素比例为PA,B部分里的像素占总像素的比例为PB,这两类之间的方差定义为:ICV=α*PA*(MA-M)2+β*PB*(MB-M)2,最佳的阈值t就是使得ICV最大的,其中α和β为修正值,前景与背景比例相差太大时做适当修正,通过实验这里α=1.2,β=0.8。

步骤103:通过身份证定位确定所述联通域内存在身份证号码后,对所述联通域进行字符识别和输出。

具体地,预先定义身份证号码区域模板,内容包括宽高比例,最大区域面积和最小区域面积,区域内阈值分割后单元数为18,若满足身份证号码区域模板则认为是号码区域即确定所述联通域内存在身份证号码,否则返回第一步。

在进行字符识别之前,收集字符样本,读取每个字符样本的特征信息并进行计算将结果写入XML文件,将每个字符样本和对应的特征信息构建字符样本库;所述字符样本库分为11大类,每个大类包含100个字符样本。

身份证号码由0、1、2、3、4、5、6、7、8、9、X字符组成;前17位只能是数字,最后一位为校验位,是前面17位通过计算得出的校验值,值在0-10之间,符号‘X’代表10,故所述11大类具体为0-10。

识别联通域分割为18个字符图像,之后分别确定每个字符图像的三个特征值,对所述三个特征值进行识别结果预测,将预测结果与字符样本库进行对比,最后,将相似度最大的分类作为识别结果输出。

所述三个特征值具体为:1)字符图像在4*2划分区域里,确定每个区域的字符数量所占的比例,根据该比例与字符样本库中每个分类的比例对比,相似度最接近的即为该分类对应的字符;

2)所述字符图像在水平(垂直)方向上投影,确定每列(行)的字符像素总数,根据该字符像素总数与字符样本库中每个分类的字符像素总数对比,相似度最接近的即为该分类对应的字符;

3)所述字符图像的欧拉数,所述欧拉数描述了区域的联通性,是全局的特征参数,公式:E=C-H,E为区域的欧拉数,C为区域的联通区域数,H为区域的空洞数,比如字符‘X’的E=1-0=1,字符‘9’的E=1-1=0,

假如1)、2)的特征值无法分辨时,就采用3)特征来区分;该特征描述了图像的拓扑关系不受图像畸变或边缘噪声的影响。

所述通过身份证定位确定所述联通域内存在身份证号码,具体为:所述移动终端通过一矩形框定位号码区域,实时检测号码所形成的连通域是否在矩形定位框内,当所述号码区域在矩形定位框内时执行后续流程,否则重新采集图像,这样方便采集到适合识别的身份证图像。

本发明实施例还提供一种基于人工神经网络的身份证快速识别装置,该装置包括:图像转换单元、定位单元、识别单元;

所述图像转换单元用于将采集的身份证图像转换为灰度图像,对所述转换的灰度图像进行裁剪获得身份证号码区,并且对该身份证号码区进行阈值处理和数学形态学闭运算形成联通域;

所述定位单元用于确定所述联通域内是否存在身份证号码,具体用于通过一矩形框定位号码区域,实时检测号码所形成的连通域是否在矩形定位框内,当所述号码区域在矩形定位框内时执行后续流程,否则重新采集图像,这样方便采集到适合识别的身份证图像;

所述识别单元用于在确定所述联通域内存在身份证号码时,对所述联通域进行字符识别和输出。

所述图像转换单元具体用于将拍摄的身份证图像按长宽比例缩小图像,并且图像长度小于600像素,之后,将彩色图像转换成灰度图像。

所述识别单元还用于收集字符样本,读取每个字符样本的特征信息并进行计算将结果写入XML文件,将每个字符样本和对应的特征信息构建字符样本库;所述字符样本库分为11大类,每个大类包含100个字符样本。

所述识别单元具体用于识别联通域分割为18个字符图像,之后分别确定每个字符图像的三个特征值,对所述三个特征值进行识别结果预测,将预测结果与字符样本库进行对比,相似度最大的分类作为识别结果输出。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1