基于卷积神经网络的身份证照片分类方法与流程

文档序号:12825629阅读:1220来源:国知局
基于卷积神经网络的身份证照片分类方法与流程

本发明涉及一种基于卷积神经网络的身份证照片分类方法,属于模式识别技术领域。



背景技术:

身份证是用于证明持有人身份的唯一证件,在办理特定事务时一般都需要出示身份证或是身份证复印件作为身份证明,各种机构,如银行、营业厅、考试系统等都装备了身份证识别系统,用于识别身份证的真伪,识别方法一般是先提前身份证原件或身份证照片上的特征信息,然后将提取出的特征信息与已知的特征数据库中对应的特征信息比对,若匹配则验证通过,否则验证不通过,这种方法较为耗时,且识别的准确率不高。



技术实现要素:

鉴于上述原因,本发明的目的在于提供一种基于卷积神经网络的身份证照片分类方法,利用多样性的样本图片对卷积神经网络进行有针对性的训练、调整,能够达到较高的照片分类准确率。

为实现上述目的,本发明采用以下技术方案:

一种基于卷积神经网络的身份证照片分类方法,包括:

s1:获取多样性的身份证照片样本集,并划分为训练样本集、验证样本集和测试样本集;

s2:建立卷积神经网络;

s3:对训练样本集中的样本图片进行预处理;

s4:将预处理后的图片作为训练数据输入该卷积神经网络,进行有监督的学习,得到训练后的卷积神经网络的各层的参数;

s5:利用训练后的卷积神经网络的各层的参数,初始化与步骤s2中所述卷积神经网络结构相同的卷积神经网络,得到具有身份证照片分类功能的图像识别网络。

所述多样性的身份证照片样本集包括身份证原件照片、身份证复印件照片、经软件处理过的身份证照片、手机相机获取的手机上显示的身份证原件照片的照片、手机相机获取的计算机显示屏上显示的身份证原件照片的照片。

所述步骤s2中的卷积神经网络包括五个卷积层、三个下采样层、三个全 连接层、及softmax分类器,其中,

第一卷积层滤波器的大小为11×11像素,步长为4个像素,特征图为96个,第一下采样层滤波器的大小为3×3像素,步长为2个像素;第二卷积层滤波器的大小为5×5像素,特征图为256个,第二下采样层滤波器的大小为3×3像素,步长为2个像素;第三卷积层滤波器的大小为3×3像素,特征图为384个;第四卷积层滤波器的大小为3×3像素,特征图为384个;第五卷积层滤波器的大小为3×3像素,特征图为256个,第三下采样层滤波器的大小为3×3像素,步长为2个像素;全连接层及softmax分类器使用dropout层降低连接数,softmax分类器输出五种类型的目标:身份证原件照片,身份证复印件照片、经软件处理过的身份证照片、手机相机获取的手机上显示的身份证原件照片的照片、手机相机获取的计算机显示屏上显示的身份证原件照片的照片。

所述步骤s3中,对训练样本集中的样本图片进行预处理包括:减去每个像素点对应的平均值,进行水平镜像处理,进行裁剪处理。

本发明的优点是:

1、利用多样性的样本图片,对卷积神经网络进行有针对性的训练、调整,能够达到较高的分类准确率;

2、采用机器自学习的方法,避免了人工干预,使卷积神经网络能学习到每一类身份证照片的完整的特征,卷积神经网络的泛化能力和适应性强。

附图说明

图1是本发明的卷积神经网络的结构示意图。

图2是本发明的方法流程图。

具体实施方式

如图1、2所示,本发明公开的基于卷积神经网络的身份证照片分类方法,包括以下步骤:

s1:获取样本集,并将样本集划分为训练样本集、验证样本集和测试样本集;

采集大量的身份证原件照片、身份证复印件照片、经软件(如,photoshop)处理过的身份证照片、手机相机获取的手机上显示的身份证原件照片的照片、手机相机获取的计算机显示屏上显示的身份证原件照片的照片;

将上述所有照片缩放到256×256像素大小的图片作为样本图片,对所有样本图片于每个像素点进行平均值计算,并在所有样本图片中添加标签,例如,在身份证原件图片中添加0,在手机相机获取的计算机显示屏上显示的身份证 原件照片的图片中添加1,在手机相机获取的手机上显示的身份证原件照片的图片中添加2,在身份证复印件图片中添加3,在软件处理过的身份证图片中添加4;

将所有样本图片划分成训练样本集(占总样本的85%)、验证样本集(占总样本的10%)和测试样本集(占总样本的5%)。

s2:建立卷积神经网络;

如图1所示,本发明建立的卷积神经网络包括五个卷积层、三个下采样层、三个全连接层、及softmax分类器。其中,第一卷积层滤波器的大小为11×11像素,步长为4个像素,特征图为96个,第一下采样层滤波器的大小为3×3像素,步长为2个像素;第二卷积层滤波器的大小为5×5像素,特征图为256个,第二下采样层滤波器的大小为3×3像素,步长为2个像素;第三卷积层滤波器的大小为3×3像素,特征图为384个;第四卷积层滤波器的大小为3×3像素,特征图为384个;第五卷积层滤波器的大小为3×3像素,特征图为256个,第三下采样层滤波器的大小为3×3像素,步长为2个像素;全连接层及softmax分类器使用dropout层降低连接数,dropout的比例均为0.5,softmax分类器输出五种类型的目标:身份证原件照片,身份证复印件照片、经软件处理过的身份证照片、手机相机获取的手机上显示的身份证原件照片的照片、手机相机获取的计算机显示屏上显示的身份证原件照片的照片。

s3:对训练样本集中的样本图片进行预处理;

对样本图片进行预处理包括:减去每个像素点对应的平均值,进行水平镜像处理,进行裁剪(随机裁剪)处理得到分辨率为227×227像素的图片。

s4:将训练样本集中预处理后的样本图片作为训练数据输入卷积神经网络,进行带标签的有监督的学习,得到训练后的卷积神经网络的各层的参数;

训练过程中,采用随机梯度下降法调整卷积神经网络中各层的参数,每一次迭代完成后计算卷积神经网络在训练样本集上的loss值,以及卷积神经网络在验证样本集上的分类准确率,loss值的计算方式为最小均方误差算法,即根据卷积神经网络的输出对输入的误差计算,根据卷积神经网络在验证样本集上的准确率和loss值,调整卷积神经网络的学习率,确保卷积神经网络在训练样本集上收敛并在验证样本集上达到较高的分类准确率,当卷积神经网络收敛后(准确率达到设定的阈值且loss值不再下降),保存卷积神经网络中各层的参数。

s5:利用训练后的卷积神经网络的各层的参数,初始化同样结构的卷积神 经网络,得到具有身份证照片分类功能的图像识别网络。

后续即可利用该图像识别网络对测试样本集进行测试、分类。

于一具体实施例中,使用的训练样本集大小为17000张身份证照片,验证样本集的大小为2000张身份证照片,测试样本集的大小为1000张身份证照片,测试前,先对测试样本集中的样本图片进行预处理,然后输入图像识别网络,最终该图像识别网络在测试样本集上的分类准确率达到了92%,由于样本中的身份证照片具有多样性(包括身份证原件照片、身份证复印件照片、软件处理过的身份证照片、手机相机获取的手机上显示的身份证原件照片的照片、手机相机获取的计算机显示屏上显示的身份证原件照片的照片),因而身份证照片的分类准确率较高。

以上所述是本发明的较佳实施例及其所运用的技术原理,对于本领域的技术人员来说,在不背离本发明的精神和范围的情况下,任何基于本发明技术方案基础上的等效变换、简单替换等显而易见的改变,均属于本发明保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1