离线手写签名鉴别方法及系统与流程

文档序号:12468332阅读:667来源:国知局
离线手写签名鉴别方法及系统与流程

本发明涉及计算机模式识别领域,尤其涉及一种离线手写签名鉴别方法及系统。



背景技术:

随着信息技术的快速发展,人们生活水平日渐提高的过程中安全问题受到前所未有的挑战,实时准确的进行个人身份鉴别非常重要。传统的身份鉴别基于密码、IC卡等方式,有各种缺点,比如密码可能被窃取遗忘,IC卡可能遗失被盗等。人们急需一种可靠和方便易用的个人身份鉴别技术来克服传统方法中的不足。而基于手写签名的身份鉴别方式可以从根本上解决上述缺点。

签名鉴别技术与其他生物测定技术相比,具有足够的动态信息、难模仿、区分性较高、尊重隐私权和信息获取高效性等优势,在签名特征的可搜集性、人体伤害可接受程度和鲁棒性方面都是非常突出的,有广阔的应用前景和应用价值。因此,对签名进行有效、可靠、快速的鉴别具有重要的社会价值和实用意义。

签名鉴别又分为在线和离线,在线签名提供了更多的动态信息,且这种信息不易模仿,所以比离线要容易鉴定一些。目前在线签名系统的交叉错误率已降到1%以下,国外也已有实用产品面世。离线签名验证则是书写者在普通纸张上书写完签名之后,再利用照相机、扫描仪等光学成像设备提取书写者的签名。离线签名鉴别对于设备环境的要求较之在线方式宽松许多,如果较大程度的提高其验证正确率,将会比在线方式有更大的应用前景。



技术实现要素:

本发明要解决的技术问题在于针对现有技术中离线手写签名鉴别不稳定的缺陷,提供一种稳定有效的离线手写签名鉴别方法及系统。

本发明解决其技术问题所采用的技术方案是:

提供一种离线手写签名鉴别方法,包括以下步骤:

S1、对离线签名样本库中的离线签名样本进行预处理;

S2、对预处理后的签名图像进行多个特征的提取,包括矩特征、局部二值模式特征、灰度共生矩阵特征和脉冲耦合神经网络特征;

S3、对提取的离线签名样本的多个特征进行训练,得到训练后的标准样本库;

S4、获取待测签名,并对待测签名进行预处理,得到待测签名的多个特征;

S5、将待测签名的多个特征与标准样本库中离线签名样本的对应特征进行匹配,识别出待测签名是真实签名还是伪造签名。

本发明所述的方法中,步骤S3具体为:

选择离线签名样本库中的任意一个离线签名样本作为测试样本,其他作为训练样本,并计算训练样本特征向量的均值,以及训练样本的特征向量之间的距离,得到距离的均值方差;

计算该测试样本与训练样本的特征向量的均值距离,比对训练样本距离的均值方差,计算测试样本与训练样本的相似程度,若相似度大于预设阈值则为真实签名,否则为伪造签名,得到训练后的标准样本库;

统计该标准样本库中的错误拒绝率和错误接受率。

本发明所述的方法中,步骤S3具体为:建立对应离线签名样本的不同特征的分类器,并进行训练,得到符合鉴别率的分类器;

步骤S5具体为:将待测签名的多个特征通过对应的分类器进行识别,并根据不同分类器的输出结果判断待测签名是否为真实签名。

本发明所述的方法中,步骤S3具体为:建立对应离线签名样本的不同特征的分类器,并按真伪样本对相应的特征向量进行标注,随机选取离线签名样本库的部分样本的特征向量进行训练,其余部分样本作为测试样本,并对测试样本的预测结果进行统计,得到鉴别的正确率。

本发明所述的方法中,步骤S1中的预处理包括二值化、剪切边界、大小归一化、倾斜矫正和缩距;

二值化具体为:以最佳阈值将图像的灰度直方图分割成两部分,使两部分之间的方差取最大值;

剪切边界具体为:对签名图像进行水平和垂直投影,根据投影直方图对边界进行剪切,得到去除边界的签名图像;

大小归一化具体为:通过填充上下边界使签名位于图片中部,再将图片按比例缩放;

倾斜矫正具体为:将签名图像的像素点作为特征点,利用图中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为签名的倾斜方向;

缩距具体为:对签名图像作垂直方向的投影,得到投影直方图;统计投影直方图中最低处的个数,及其间的距离,根据最低区域的距离判断其是否为签名图像的空白区域,若是则剪切这段空白区域,得到缩距后的签名图。

本发明所述的方法中,对不同的预处理过程提取不同的特征,具体为:对剪切边界的灰度图像提取脉冲耦合神经网络特征,对归一化的灰度图像提取纹理特征包括局部二值模式特征和灰度共生矩阵特征,对归一化的二值图像提取低阶矩特征。

本发明还提供了一种离线手写签名鉴别系统,包括:

离线签名样本库采集模块,用于采集离线签名样本;

样本库预处理模块,用于对离线签名样本库中的离线签名样本进行预处理,并对预处理后的签名图像进行多个特征的提取,包括矩特征、局部二值模式特征、灰度共生矩阵特征和脉冲耦合神经网络特征;

样本库训练模块,用于对提取的离线签名样本的多个特征进行训练,得到训练后的标准样本库;

待测签名处理模块,用于获取待测签名,并对待测签名进行预处理,得到待测签名的多个特征;

签名识别模块,用于将待测签名的多个特征与标准样本库中离线签名样本的对应特征进行匹配,识别出待测签名是真实签名还是伪造签名。

本发明所述的系统中,所述样本库训练模块具体用于选择离线签名样本库中的任意一个离线签名样本作为测试样本,其他作为训练样本,并计算训练样本特征向量的均值,以及训练样本的特征向量之间的距离,得到距离的均值方差;

该样本库训练模块还用于计算该测试样本与训练样本的特征向量的均值的距离,比对训练样本距离的均值方差,计算测试样本与训练样本的相似程度,若相似度大于预设阈值则为真实签名,否则为伪造签名,得到训练后的标准样本库;统计该标准样本库中的错误拒绝率和错误接受率。

本发明所述的系统中,所述样本库训练模块具体用于建立对应离线签名样本的不同特征的分类器,并进行训练,得到符合鉴别率的分类器;

所述签名识别模块具体用于将待测签名的多个特征通过对应的分类器进行识别,并根据不同分类器的输出结果判断待测签名是否为真实签名。

本发明所述的系统中,所述样本库预处理模块具体用于对样本库中样本进行二值化、剪切边界、大小归一化、倾斜矫正和缩距处理;

二值化具体为:以最佳阈值将图像的灰度直方图分割成两部分,使两部分之间的方差取最大值;

剪切边界具体为:对签名图像进行水平和垂直投影,根据投影直方图对边界进行剪切,得到去除边界的签名图像;

大小归一化具体为:通过填充上下边界使签名位于图片中部,再将图片按比例缩放;

倾斜矫正具体为:将签名图像的像素点作为特征点,利用图中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为签名的倾斜方向;

缩距具体为:对签名图像作垂直方向的投影,得到投影直方图;统计投影直方图中最低处的个数,及其间的距离,根据最低区域的距离判断其是否为签名图像的空白区域,若是则剪切这段空白区域,得到缩距后的签名图。

本发明产生的有益效果是:本发明通过对签名进行预处理,消除了一些不必要的外界因素的影响,并根据不同的预处理结果提取多个特征,包括矩特征、局部二值模式特征、灰度共生矩阵特征和脉冲耦合神经网络特征,特征的提取考虑到了形状、纹理和伪动态特征;通过这些特征的匹配就可以有效对离线待测签名进行较准确的鉴别。

本发明进一步使用了简单的统计分类器对各种鉴别方法的鉴别效果进行了统计,还可使用分类器对签名图像进行鉴别效果的统计。通过实验发现,这些方法能够实现稳定的有效的离线手写签名鉴别。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1是本发明实施例离线手写签名鉴别方法的流程图;

图2离线手写签名鉴别流程框图;

图3a为边界剪切后的签名图;

图3b为大小归一化后的签名图;

图4a-4c为投影法切分缩距过程中的签名图;

图5为签名鉴别系统结构框图;

图6为局部二值模式特征提取示意图;

图7为灰度共生矩阵特征提取示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明实施例的用于离线手写签名的鉴别方法,如图1所示,包括以下步骤:

S1、对离线签名样本库中的离线签名样本进行预处理;预处理的主要目的是去除干扰信息,而且为特征提取做好准备;主要可使用平滑去噪、大小位置归一化、二值化以及剪切边界、还有分割、投影法缩距、倾斜校正等方法进行预处理。离线签名样本都是使用笔写在打印纸上的签名,然后通过扫描仪进行灰度扫描输入电脑,但是目前没有比较好的离线手写签名库,自己采集数据工作量太大。本发明实施例选用的是2011年的离线签名竞赛签名库,10个签名者,200个真实签名和200个伪造签名,通过评估得到了对应的鉴别准确率。

S2、对预处理后的签名图像进行特征提取,因为手写签名随意性较大且易受环境等因素的影响,单方面的特征不能准确的表示签名者的书写风格,需从多方面来综合考虑保证提取的特征可区分性强、可靠性高、独立性好并特征维数不能过大,本发明为了准确有效的表示签名者特征,分别提取了签名的形状、纹理和伪动态特征,采用不同特征综合描述的方法。形状特征包括矩特征,矩特征可以描述签名外形、字位倾斜、重心偏移等整体结构特征;纹理特征包括局部二值模式与灰度共生矩阵,纹理简单来说可以直观反映签名图像的视觉特征,通过像素及其周围空间邻域的灰度分布来描述签名图像;基于耦合神经网络的伪动态特征提取则可以通过灰度变换间接表示签名者书写签名时的压力等动态信息的变化,而且耦合神经网络的模型与视觉神经成像相似,能更好的表示签名的一些伪动态信息。本发明选用这些不同的特征提取方法能更完整准确的表示签名者书写风格。S3、对提取的离线签名样本的多个特征进行训练,得到训练后的标准样本库;

S4、获取待测签名,并对待测签名进行预处理,预处理过程与步骤S1中提到的预处理相同,然后进行特征提取,提取的特征与步骤S2中提到的特征提取相同,得到待测签名的多个特征;

S5、将待测签名的多个特征与标准样本库中离线签名样本的对应特征进行匹配,识别出待测签名是真实签名还是伪造签名。

步骤S1中,对离线签名样本库中的离线签名样本进行预处理,包括二值化、大小归一化和倾斜校正、投影法缩距等,提取图像的相关特征,包括矩、街区距离变换也是一种鉴别方法,对一个二值化后签名图中黑点计算它到另一个签名图中最近黑点间的距离,以最近距离之和作为两个签名间的距离,是一种常用的鉴别算法。局部二局模式(Local Binary Pattern,LBP)、灰度共生矩阵(Gray Level Co-occurrence Matrix,GLCM)和脉冲耦合神经网络(PCNN-Pulse Coupled Neural Network,PCNN)特征等,可使用加权欧氏距离作为特征距离度量。

具体地:

1)二值化用到的是OTSU算法,其基本原理是以最佳阈值将图像的灰度直方图分割成两部分,使两部分之间的方差取最大值,即分离性最大。

2)剪切边界用到的是投影法,对签名图像进行水平和垂直投影,根据投影直方图对边界进行剪切,得到去除边界的签名图像;

3)大小归一化用到的是填充上下边界使签名位于图片中部,再将图片按比例缩放;

4)倾斜矫正用到的是最小二乘法,将签名图像的像素点作为特征点,利用图中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为签名的倾斜方向;

5)投影法缩距主要用于字与字间有明显距离的签名,对签名图像作垂直方向的投影,判断投影直方图中值最小的区域是否该被剪切。

本发明的一个较佳实施例中,大小归一化具体步骤为:

先将签名图像的四边界确定,将边界以外的所有空白处剪切掉;

判断剪切后图像的长宽比,若果宽度大于长度,则在签名图像的上下边界填充相同宽度的空白,使签名位于填充后正方形图片的中部;

假设填充后正方形大小为N*N,规范后要达到的大小为m*m,则将正方形按m/64的尺度因子进行缩放,得到归一化后的签名图像,如图3b所示。

投影法缩距具体步骤为:

对签名图像作垂直方向的投影,得到投影直方图,如图4a所示;

统计投影直方图中最低处的个数,及其间的距离;

根据最低区域的距离判断其是否为签名图像的空白区域,若是则剪切这段空白区域,得到缩距后的签名图,如图4b和4c所示。

对预处理后的签名图像进行多个特征的提取,具体为:对大小归一化的二值化图像进行距特征提取,对剪切边界的二值化图像进行耦合脉冲神经网络特征提取,对大小归一化的灰度图像进行灰度共生矩阵和局部二值模式特征提取;

其中,矩特征主要是描述字符形状和物理意义,提取长宽比、字位方向、拉长度、伸展度、水平偏度、垂直偏度、水平伸展均衡度和垂直伸展均衡度等八个特征组成矩特征向量。

局部二值模式特征主要描述图像局部纹理特征,可采用LBP特征谱的统计直方图作为特征向量;可计算等价模式的LBP变换的图谱,统计LBP图谱中每个像素值出现的次数直方图,作为特征向量。

灰度共生矩阵特征描述的是具有某种空间位置关系的两个像素的联合分布,可看成两个像素灰度对的联合直方图,对大小归一化的灰度图像进行GLCM特征提取,将图像先进行四个方向的GLCM变换,再分别提取四个矩阵的能量、相关、熵、对比度,作为GLCM特征向量;提取的四个方向的能量、对比度、相关和熵等十六个特征组成特征向量。

脉冲耦合神经网络特征,主要反映图像的纹理信息。PCNN模型对暗像素的细节反应更敏感,多次迭代的结果正好反映了图像的纹理信息,以及所包含的一些伪动态信息,对签名的灰度图像进行PCNN迭代运算,计算每次迭代后输出矩阵的熵值,将其每次迭代的输出矩阵的熵作为特征值,迭代30次,得到30维的熵时间序列作为PCNN特征向量。

本发明的一个较佳实施例中,特征提取具体通过变换将高维特征空间映射到低维特征空间,然后再去除冗余的和不相关的特征来进一步降低维数。得到特征维数较低的特征向量后,计算之间的距离,估算其相似度,再用阈值法判断其真伪,或者直接用分类器对其进行训练和预测,然后统计实验结果,包括矩特征提取子模块、局部二值模式特征提取子模块、灰度共生矩阵特征提取子模块和脉冲耦合神经网络特征提取子模块

本发明的一个较佳实施例中,通过以下方式进行特征提取:

矩特征提取:对于一个大小为M*N的数字图像,(p+q)阶几何矩定义如式:

签名图像的重心可以由零阶和一阶几何矩得到,以重心为坐标原点就得到中心矩,中心矩是反映对应区域中灰度相对于灰度重心是如何分布的度量。二阶矩可以求出图像中黑点坐标的方差,得到水平方向上和垂直方向上的伸展度,相应就可以计算出长宽比、字位方向、拉长度、伸展度、水平偏度、垂直偏度、水平伸展均衡度和垂直伸展均衡度等八个特征,作为矩特征向量;

局部二值模式特征提取具体步骤如下:

首先将归一化的灰度图像划分为3*3的小区域;

对于每个小区域中的像素,将相邻的8个像素的灰度值与其进行比较,若周围像素值大于中心像素值,则该像素点的位置被标记为1,否则为0。这样,3*3邻域内的8个点经比较可产生8位二进制数,即得到该窗口中心像素点的LBP值如图6所示;

过多的二值模式对于纹理的提取、分类及信息的存取都是不利的,应该考虑等价模式的LBP,当某个LBP所对应的循环二进制数从0到1或从1到0最多有两次跳变时,该LBP所对应的二进制就称为一个等价模式类,可以将一般模式的LBP变换为等价模式的LBP;

然后计算每个小区域的直方图,即每个数字出现的频率;然后对该直方图进行归一化处理。

最后将得到的每个区域的统计直方图进行连接成为一个特征向量,也就是整幅图的LBP纹理特征向量;

灰度共生矩阵特征提取:灰度共生矩阵能反映出图像的灰度关于方向、相邻间隔、变化幅度的综合信息,是分析图像的局部模式和排列规则的基础,设f(x,y)为一幅二维数字图象,其大小为M×N,灰度级别为Ng,则满足一定空间关系的灰度共生矩阵为P(i,j)=#{(x1,y1),(x2,y2)∈M×N|f(x1,y1)=i,f(x2,y2)=j}

其中#(x)表示集合x中的元素个数,显然P为Ng*Ng的矩阵,若(x1,y1)与(x2,y2)间距离为d,两者与坐标横轴的夹角为θ,则可以得到各种间距及角度的灰度共生矩阵P(i,j,d,θ)。

在本发明中先将图像灰度级量化为8级,距离d取1,角度分别0、45、90、135度,对签名图像进行4个方向的GLCM变换,GLCM变换的示意图如图7所示,为了能更直观地以共生矩阵描述纹理状况,从共生矩阵导出一些反映矩阵状况的参数,比如能量、相关、对比度、熵,四个方向的共生矩阵分别计算这四种参数,作为GLCM特征向量;

脉冲耦合神经网络特征提取:采用PCNN的熵时间序列对签名图像进行特征提取。设置具体的模型参数,用签名灰度图像的象素值作为神经元的外部激励,通过PCNN模型进行迭代运算,每次迭代后的得到输出矩阵,然后按照香农公式熵的计算,得到熵值作为该图像的特征向量。

步骤S5中进行特征匹配,可以采用以下几种方法,第一种方法是加权欧氏距离,通过计算特征向量之间的距离,用阈值法对签名鉴别效果进行评估,第二种方法是使用支持向量机分类器,直接对签名的特征向量进行训练然后预测最后统计预测结果,评估对应的鉴别率,第三种方法是使用BP神经网络分类器,直接对签名的特征向量进行训练然后预测最后统计预测结果,评估对应的鉴别率。

加权欧氏距离:需要训练足够的样本,得到对应的大致阈值。系统首先采用签名进行训练,得到一个模板值。当签名需要鉴别时,直接计算其特征向量与模板值之间的加权欧氏距离值。采用大量签名进行训练并确定一个阀值,当等测样本距离值大于阀值时,则判为假;否则为真。距离计算公式如下:

其中dist为待测样本的距离值,Fi为待测样本的特征值,μi为训练样本某特征的均值,σi为标准差,n为特征数。

如果实验中没有大量样本,阈值法只能对每种签名鉴别方法的鉴别效果作大致的评估。

支持向量机分类器:为特征空间上的间隔最大的线性分类器,学习策略是使间隔最大化,解决签名鉴别的二分类问题。系统首先对所有样本进行预处理和特征提取,再对提取的特征进行真伪标注并存储,在所有样本的特征向量空间中选取部分样本特征作为训练集,其余部分作为测试集,最后统计测试样本通过分类器预测的结果的准确性来实现签名鉴别。当然支持向量的最主要的设计是核函数的参数设计,可以通过实验调整核函数的参数,达到最佳的鉴别效果。

BP神经网络分类器:将标注好真伪的签名图像的特征向量先归一化,然后选取一部分数据作为训练,其余数据作为测试数据,然后统计鉴别正确率。BP神经网络分类器的使用与支持向量机类似,都要对特征向量进行真伪的标准,选取部分样本作为训练样本,要对所有样本特征向量进行归一化,然后测试预测,统计鉴别正确率。BP神经网络分类器重要的是神经网络的设计,输入层隐含层和输出层的设计之类,这个主要借鉴相关专家大量实验的统计值来设定的。

实验结果表明本发明的签名鉴别方法,可以进行离线签名鉴别而且鉴别结果客观、稳定。为改进鉴别效果,本发明的一个实施例提出了将签名图像分块,选择重要性较高的部分进行融合再判别。

签名图像分块采用的是简单的均匀分块法,将归一化后签名图像分为4*4部分,统计签名的宽高,按比例切分。

离线手写签名鉴别系统结构图如图5所示,对已有的签名样本进行预处理,大致包括二值化、剪切边界和大小归一化,得到归一化的二值图像、归一化的灰度图像和剪切边界后的灰度图像,针对不同的预处理过程提取不同的特征,剪切边界的灰度图像提取PCNN特征,归一化的灰度图像提取纹理特征包括LBP和GLCM,归一化的二值图像提取低阶距特征。特征提取得到特征向量之后进行分类鉴别,分别用到了支持向量机分类器、BP神经网络分类器、简单的统计分类器。

本发明实施例离线手写签名鉴别系统,包括:

离线签名样本库采集模块,用于采集离线签名样本;

样本库预处理模块,用于对离线签名样本库中的离线签名样本进行预处理,并对预处理后的签名图像进行多个特征的提取,包括矩特征、局部二值模式特征、灰度共生矩阵特征和脉冲耦合神经网络特征;

样本库训练模块,用于对提取的离线签名样本的多个特征进行训练,得到训练后的标准样本库;

待测签名处理模块,用于获取待测签名,并对待测签名进行预处理,得到待测签名的多个特征;

签名识别模块,用于将待测签名的多个特征与标准样本库中离线签名样本的对应特征进行匹配,识别出待测签名是真实签名还是伪造签名。

样本库训练模块具体用于选择离线签名样本库中的任意一个离线签名样本作为测试样本,其他作为训练样本,并计算训练样本特征向量的均值,以及训练样本的特征向量之间的距离,得到距离的均值方差;

该样本库训练模块还用于计算该测试样本与训练样本的特征向量的均值的距离,比对训练样本距离的均值方差,计算测试样本与训练样本的相似程度,若相似度大于预设阈值则为真实签名,否则为伪造签名,得到训练后的标准样本库;统计该标准样本库中的错误拒绝率和错误接受率。

样本库训练模块具体用于建立对应离线签名样本的不同特征的分类器,并进行训练,得到符合鉴别率的分类器;

签名识别模块具体用于将待测签名的多个特征通过对应的分类器进行识别,并根据不同分类器的输出结果判断待测签名是否为真实签名。

样本库预处理模块具体用于对样本库中样本进行二值化、剪切边界、大小归一化、倾斜矫正和缩距处理;

二值化具体为:以最佳阈值将图像的灰度直方图分割成两部分,使两部分之间的方差取最大值;

剪切边界具体为:对签名图像进行水平和垂直投影,根据投影直方图对边界进行剪切,得到去除边界的签名图像;

大小归一化具体为:通过填充上下边界使签名位于图片中部,再将图片按比例缩放;

倾斜矫正具体为:将签名图像的像素点作为特征点,利用图中特征点与基线的关系,将特征点用最小二乘法拟合出基线的方向,即为签名的倾斜方向;

缩距具体为:对签名图像作垂直方向的投影,得到投影直方图;统计投影直方图中最低处的个数,及其间的距离,根据最低区域的距离判断其是否为签名图像的空白区域,若是则剪切这段空白区域,得到缩距后的签名图。

综上,本发明在预处理时,对签名进行了剪切边界和大小归一化,消除了一些不必要的外界因素的影响;特征提取时,针对归一化的二值图像提取了低阶矩特征,也就是形状特征,对归一化灰度图像提取了灰度共生矩阵特征,对剪切边界的灰度图像提取了局部二值模式特征和脉冲耦合神经网络特征,特征提取考虑到了形状、纹理和伪动态特征;匹配时,使用了简单的统计分类器对各种鉴别方法的鉴别效果进行了统计,还使用了比较经典的支持向量机和BP神经网络分类器对签名图像进行鉴别效果的统计。通过实验可以发现,这些方法能够实现稳定的有效的离线手写签名鉴别。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1