一种融合HOG和LBPH特征的身份证复印件检测方法与流程

文档序号:15145483发布日期:2018-08-10 20:23阅读:314来源:国知局

本发明涉及模式识别技术领域,尤其涉及一种融合hog和lbph特征的身份证复印件检测方法。



背景技术:

随着科学技术与经济的发展,政府企事业单位的工作量越来越多、办公活动的范围越来越大与市场化对办公速度的要求与准确率越来越高,市场上可用的身份证复印件检测软件却比较少。大部分关于身份证复印件检测的手续仍然是完全基于人工,这造成了大量时间、人力与物力的浪费,人为因素对结果的影响较大。传统的身份证复印件检测软件大多是仅使用单一特征进行检测,检测的准确率较低。这两种检测方法都有着明显的不足。政府企事业单位急需一款能够自动、快速并且准确的检测与身份证复印件相关的手续是否正确的办公自动化软件,使得政府企事业单位可以花费更少的人力、物力与时间,却可以快速并准确的对身份证复印件进行检测。在办理与金融行业相关业务的时候,都需要提供身份证复印件。例如,借记卡业务、证券开户业务、金融保险业务等。随着科学经济的发展以及越来越多的人对经济管理的更加重视,很多金融行业的业务人员的工作量剧增,必须定期检测身份证复印件。

传统处理方法都是选择单一特征进行检测,并且市场上关于身份证复印件检测方法较少,基本上仍然完全依靠人工检测的情况。



技术实现要素:

针对传统的人工检测身份证复印件或仅根据单一特征进行身份证复印件检测,检测效率和检测准确率都不高的问题,本发明提供一种融合hog和lbph特征的身份证复印件检测方法,首先进行hog目标检测、然后利用lbph和svm技术再次检测分类可以准确快速判断身份证复印件操作是否正确,提高检测效率与检测准确率。

为实现上述目的,本发明的技术方案是:一种融合hog和lbph特征的身份证复印件检测方法,包括以下步骤:

步骤s1:选取大量身份证和非身份证图片作为训练样本集的正、负样本,对训练样本集中的每张图片进行尺度归一化;

步骤s2:提取尺度归一化后的训练样本的hog特征,基于hog特征训练svm,得到第一分类器;

步骤s3:提取尺度归一化后的训练样本的lbph特征,基于lbph特征训练svm,得到第二分类器;

步骤s4:对身份证复印件测试图像进行预处理;

步骤s5:利用第一分类器对预处理后的测试图像进行目标检测;

步骤s6:计算步骤s5的目标检测结果的lbp特征,根据得到的lbp特征生成lbph特征;

步骤s7:利用第二分类器根据步骤s6生成的lbph特征进行判断,保留判断结果为真的目标,得到测试图像中的身份证复印件。

进一步地,所述步骤s2中提取尺度归一化后的训练样本的hog特征的方法具体为:

标准化gamma空间和颜色空间并计算训练样本每一个像素的梯度,及利用如下式子:

h(s,t)=h(s,t)gamma

gs(s,t)=h(s+1,t)-h(s-1,t)gt(s,t)=h(s,t+1)-h(s,t-1)

其中,s表示训练样本图像上的横坐标,t表示训练样本图像上的纵坐标,gs(s,t)表示像素点(s,t)处的水平方向梯度,gt(s,t)表示像素点(s,t)处的垂直方向梯度,g(s,t)表示像素点(s,t)处的梯度幅度值,α(s,t)表示像素点(s,t)处的梯度方向,参数gamma=0.5,h(s,t)表示像素点(s,t)处的像素值;

将训练样本分割成细胞单元格,再为每个单元格构建梯度方向的直方图,接着把单元格组合成块,并且块内需要归一化梯度直方图,最后生成训练样本的hog特征向量。

进一步地,所述步骤s2中基于hog特征训练svm,得到第一分类器的方法具体包括:

使用线性核函数,及利用如下式子:

其中,xε表示样本ε的hog特征向量,xl表示样本l的hog特征向量,κ表示核函数,表示xε的转置,将训练结果保存到xml文件中;

从得到的xml文件中读取数组alpha、数组supportvector和浮点数rho,首先把alpha与supportvector相乘,获得一个行向量,再将该向量前面乘以-1,然后在该行向量的最后添加浮点数rho,得到第一分类器。

进一步地,所述步骤s3中提取尺度归一化后的训练样本的lbph特征的方法具体为:

计算训练样本的lbp特征,将图像lbp分成多个编码图像,利用如下式子计算每个编码图像的像素值:

dxn=-radius*sin(2.0*π*n/neighbors)dyn=radius*cos(2.0*π*n/neighbors),

其中,x表示图像上的横坐标,y表示图像上的纵坐标,radius表示采样半径,neighbors表示邻域大小,参数n是整数,dxn表示像素点(x,y)的第n邻域对应像素偏移横坐标,dyn表示像素点(x,y)的第n邻域对应像素偏移纵坐标,gray(x,y)表示像素点(x,y)处的灰度值,gray(x,y)n表示像素点(x,y)的第n邻域的灰度值,lbp(x,y)表示像素点(x,y)处的编码值,lbp(x,y)n表示像素点(x,y)的第n邻域的编码值,w表示lbp编码图像每个区域的宽,h表示lbp编码图像每个区域的高;生成训练样本的lbph特征,利用如下式子获取各个格子的宽度以及高度:

其中,gridx表示宽度方向格子数,gridy表示高度方向格子数,lbpi表示lbp编码图像中第i个编码图像区域,cols表示列数,rows表示行数,lbpi.cols表示lbp编码图中第i个编码图像区域的列数,lbpi.rows表示lbp编码图中第i个编码图像区域的行数,gradw表示格子的宽度,gradh表示格子的高度,依照行序统计各个格子中直方图每个值的高度,并按照顺序把结果存储到对应直方图矩阵的每一行;接着对直方图高度归一化;再将行作为主序把对应的直方图矩阵转变成1行m*2neighbors列的向量矩阵,m表示区域的总个数;最后连接局部直方图就得到了整个训练样本的直方图。

进一步地,所述步骤s4具体包括:

步骤s41:输入身份证复印件测试图像;

步骤s42:测试图像尺度归一化,利用双线性内插值算法,使用如下式子:

f(λ+u,j+v)=(1-u)(1-v)f(λ,j)+(1-u)vf(λ,j+1)+u(1-v)f(λ+1,j)+uvf(λ+1,j+1)其中,λ表示测试图像上横坐标,j表示测试图像上纵坐标,λ和j均为整数,u和v均为大于等于0小于1的小数,f(λ,j)表示测试图像上像素点(λ,j)处的像素值;

步骤s43:将测试图像转换为灰度图,使用如下公式:

gray(λ,j)=[red(λ,j)+green(λ,j)+blue(λ,j)]/3

其中,red(λ,j)表示像素点(λ,j)处的红色通道值,green(λ,j)表示像素点(λ,j)处的绿色通道值,blue(λ,j)表示像素点(λ,j)处的蓝色通道值,gray(λ,j)表示灰度图中像素点(λ,j)处的灰度值;

步骤s44:进行高斯滤波平滑,利用如下式子:

其中,σ表示高斯函数的方差,gauss(λ,j)表示经过高斯滤波处理后测试图像上像素点(λ,j)处的像素值。

进一步地,所述步骤s5具体包括:

步骤s51:读取第一分类器,并对测试图像做目标检测;

步骤s52:去除检测结果中具有内外包含关系的区域,利用如下公式:

(recte&rectψ)==recte

其中,recte表示矩形框e,rectψ表示矩形框ψ,如果上式判断为真则表示矩形框e与矩形框ψ是内外包含的关系,保留大的区域;

步骤s53:判断检测结果是否相交,利用如下式子:

xc1=max(xa1,xb1)yc1=max(ya1,yb1)xc2=min(xa2,xb2)yc2=min(ya2,yb2)xc1<=xc2yc1<=yc2

其中,xa1表示矩形框a的左上角的横坐标,ya1表示矩形框a的左上角的纵坐标,xa2表示矩形框a的右下角的横坐标,ya2表示矩形框a的右下角的纵坐标,xb1表示矩形框b的左上角的横坐标,yb1表示矩形框b的左上角的纵坐标,xb2表示矩形框b的右下角的横坐标,yb2表示矩形框b的右下角的纵坐标,xc1表示矩形框a和矩形框b的左上角横坐标的最大值,yc1表示矩形框a和矩形框b的左上角纵坐标的最大值,xc2表示矩形框a和矩形框b的右下角横坐标的最小值,yc2表示矩形框a和矩形框b的右下角纵坐标的最小值,如果上式判断为真则表示矩形a与矩形b是相交的关系;

步骤s54:对检测结果中相交的区域进行融合,如果矩形框相交,求出相交面积,如果相交面积大于阈值,则对两个矩形框进行融合,使用如下式子:

xd1=min(xg1,xr1)yd1=min(yg1,yr1)xd2=max(xg2,xr2)yd2=max(yg2,yr2)

其中,xd1表示融合后矩形框左上角的横坐标,yd1表示融合后矩形框左上角的纵坐标,xd2表示融合后矩形框右下角的横坐标,yd2表示融合后矩形框右下角的纵坐标,xg1表示矩形框g左上角的横坐标,yg1表示矩形框g左上角的纵坐标,xg2表示矩形框g右下角的横坐标,yg2表示矩形框g右下角的纵坐标,xr1表示矩形框r左上角的横坐标,yr1表示矩形框r左上角的纵坐标,xr2表示矩形框r右下角的横坐标,yr2表示矩形框r右下角的纵坐标。

与现有技术相比,本发明具有有益效果:本发明首先基于hog特征训练svm,并且保存第一分类器;然后基于lbph特征训练svm得到第二分类器,接着通过第一分类器初步确定身份证;最后将初步确定的目标交给第二分类器进行再次检测分类,确定最终的目标。本发明可以自动快速的检测,并且hog特征与lbph的相结合能够准确的检测出身份证,提高了检测的准确率,不需要人工检测,节约了时间与精力,避免了人为操作上的失误。

附图说明

图1是本发明一种融合hog和lbph特征的身份证复印件检测方法的流程示意图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

如图1所示,一种融合hog和lbph特征的身份证复印件检测方法,包括以下步骤:

步骤s1:选取大量身份证和非身份证图片作为训练样本集的正、负样本,对训练样本集中的每张图片进行尺度归一化;

步骤s2:提取尺度归一化后的训练样本的hog特征,基于hog特征训练svm,得到第一分类器;

提取尺度归一化后的训练样本的hog特征的方法具体为:

标准化gamma空间和颜色空间并计算训练样本每一个像素的梯度,及利用如下式子:

h(s,t)=h(s,t)gamma

gs(s,t)=h(s+1,t)-h(s-1,t)gt(s,t)=h(s,t+1)-h(s,t-1)

其中,s表示训练样本图像上的横坐标,t表示训练样本图像上的纵坐标,gs(s,t)表示像素点(s,t)处的水平方向梯度,gt(s,t)表示像素点(s,t)处的垂直方向梯度,g(s,t)表示像素点(s,t)处的梯度幅度值,α(s,t)表示像素点(s,t)处的梯度方向,参数gamma=0.5,h(s,t)表示像素点(s,t)处的像素值;

将训练样本分割成细胞单元格,再为每个单元格构建梯度方向的直方图,接着把单元格组合成块,并且块内需要归一化梯度直方图,最后生成训练样本的hog特征向量。

基于hog特征训练svm,得到第一分类器的方法具体包括:

使用线性核函数,及利用如下式子:

其中,xε表示样本ε的hog特征向量,xl表示样本l的hog特征向量,κ表示核函数,表示xε的转置,将训练结果保存到xml文件中;

从得到的xml文件中读取数组alpha、数组supportvector和浮点数rho,首先把alpha与supportvector相乘,获得一个行向量,再将该向量前面乘以-1,然后在该行向量的最后添加浮点数rho,得到第一分类器。

步骤s3:提取尺度归一化后的训练样本的lbph特征,基于lbph特征训练svm,得到第二分类器;

提取尺度归一化后的训练样本的lbph特征的方法具体为:

计算训练样本的lbp特征,将图像lbp分成多个编码图像,利用如下式子计算每个编码图像的像素值:

dxn=-radius*sin(2.0*π*n/neighbors)dyn=radius*cos(2.0*π*n/neighbors),

其中,x表示图像上的横坐标,y表示图像上的纵坐标,radius表示采样半径,neighbors表示邻域大小,参数n是整数,dxn表示像素点(x,y)的第n邻域对应像素偏移横坐标,dyn表示像素点(x,y)的第n邻域对应像素偏移纵坐标,gray(x,y)表示像素点(x,y)处的灰度值,gray(x,y)n表示像素点(x,y)的第n邻域的灰度值,lbp(x,y)表示像素点(x,y)处的编码值,lbp(x,y)n表示像素点(x,y)的第n邻域的编码值,w表示lbp编码图像每个区域的宽,h表示lbp编码图像每个区域的高;

生成训练样本的lbph特征,利用如下式子获取各个格子的宽度以及高度:

其中,gridx表示宽度方向格子数,gridy表示高度方向格子数,lbpi表示lbp编码图像中第i个编码图像区域,cols表示列数,rows表示行数,lbpi.cols表示lbp编码图中第i个编码图像区域的列数,lbpi.rows表示lbp编码图中第i个编码图像区域的行数,gradw表示格子的宽度,gradh表示格子的高度,依照行序统计各个格子中直方图每个值的高度,并按照顺序把结果存储到对应直方图矩阵的每一行;接着对直方图高度归一化,也就是全部的直方图高度除以gradw*gradh;

再将行作为主序把对应的直方图矩阵转变成1行m*2neighbors列的向量矩阵,m表示区域的总个数;最后连接局部直方图就得到了整个训练样本的直方图。

基于lbph特征训练svm。使用线性核函数,利用如下式子:

其中,xε表示样本ε的lbph特征向量,xl表示样本l的lbph特征向量,κ表示核函数,表示xε的转置,训练得到第二分类器。

步骤s4:对身份证复印件测试图像进行预处理;

具体包括:

步骤s41:输入身份证复印件测试图像;

步骤s42:测试图像尺度归一化,利用双线性内插值算法,使用如下式子:

f(λ+u,j+v)=(1-u)(1-v)f(λ,j)+(1-u)vf(λ,j+1)+u(1-v)f(λ+1,j)+uvf(λ+1,j+1)其中,λ表示测试图像上横坐标,j表示测试图像上纵坐标,λ和j均为整数,u和v均为大于等于0小于1的小数,f(λ,j)表示测试图像上像素点(λ,j)处的像素值;

步骤s43:将测试图像转换为灰度图,使用如下公式:

gray(λ,j)=[red(λ,j)+green(λ,j)+blue(λ,j)]/3

其中,red(λ,j)表示像素点(λ,j)处的红色通道值,green(λ,j)表示像素点(λ,j)处的绿色通道值,blue(λ,j)表示像素点(λ,j)处的蓝色通道值,gray(λ,j)表示灰度图中像素点(λ,j)处的灰度值;

步骤s44:进行高斯滤波平滑,利用如下式子:

其中,σ表示高斯函数的方差,gauss(λ,j)表示经过高斯滤波处理后测试图像上像素点(λ,j)处的像素值。

步骤s5:利用第一分类器对预处理后的测试图像进行目标检测;

具体包括:

步骤s51:读取第一分类器,并对测试图像做目标检测;

步骤s52:去除检测结果中具有内外包含关系的区域,利用如下公式:

(recte&rectψ)==recte

其中,recte表示矩形框e,rectψ表示矩形框ψ,如果上式判断为真则表示矩形框e与矩形框ψ是内外包含的关系,保留大的区域;

步骤s53:判断检测结果是否相交,利用如下式子:

xc1=max(xa1,xb1)yc1=max(ya1,yb1)xc2=min(xa2,xb2)yc2=min(ya2,yb2)xc1<=xc2yc1<=yc2

其中,xa1表示矩形框a的左上角的横坐标,ya1表示矩形框a的左上角的纵坐标,xa2表示矩形框a的右下角的横坐标,ya2表示矩形框a的右下角的纵坐标,xb1表示矩形框b的左上角的横坐标,yb1表示矩形框b的左上角的纵坐标,xb2表示矩形框b的右下角的横坐标,yb2表示矩形框b的右下角的纵坐标,xc1表示矩形框a和矩形框b的左上角横坐标的最大值,yc1表示矩形框a和矩形框b的左上角纵坐标的最大值,xc2表示矩形框a和矩形框b的右下角横坐标的最小值,yc2表示矩形框a和矩形框b的右下角纵坐标的最小值,如果上式判断为真则表示矩形a与矩形b是相交的关系;

步骤s54:对检测结果中相交的区域进行融合,如果矩形框相交,求出相交面积,如果相交面积大于阈值,则对两个矩形框进行融合,使用如下式子:

xd1=min(xg1,xr1)yd1=min(yg1,yr1)xd2=max(xg2,xr2)yd2=max(yg2,yr2)

其中,xd1表示融合后矩形框左上角的横坐标,yd1表示融合后矩形框左上角的纵坐标,xd2表示融合后矩形框右下角的横坐标,yd2表示融合后矩形框右下角的纵坐标,xg1表示矩形框g左上角的横坐标,yg1表示矩形框g左上角的纵坐标,xg2表示矩形框g右下角的横坐标,yg2表示矩形框g右下角的纵坐标,xr1表示矩形框r左上角的横坐标,yr1表示矩形框r左上角的纵坐标,xr2表示矩形框r右下角的横坐标,yr2表示矩形框r右下角的纵坐标。

步骤s6:计算步骤s5的目标检测结果的lbp特征,根据得到的lbp特征生成lbph特征;

步骤s7:利用第二分类器根据步骤s6生成的lbph特征进行判断,保留判断结果为真的目标,得到测试图像中的身份证复印件。

以上是本发明的较佳实施例,凡依本发明技术方案所作的改变,所产生的功能作用未超出本发明技术方案的范围时,均属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1