利用笔迹轮廓特征来进行笔迹鉴别的方法及系统与流程

文档序号:11432669阅读:343来源:国知局
利用笔迹轮廓特征来进行笔迹鉴别的方法及系统与流程

本发明涉及图像识别,尤其涉及一种利用笔迹轮廓特征来进行笔迹鉴别的方法及系统。



背景技术:

生物特征识别技术是利用指纹、笔迹和声音等一些习惯性的生物特征来鉴别一个人真实身份的一种技术。具体一点来说,生物特征识别技术就是通过生物传感器采集人体固有的生理特征和行为特征数据,利用计算机技术和生物统计学原理对采集的特征数据进行处理、分类,达到对个人身份鉴别的目的。

笔迹是众多生物特征的一种,在较长的一段时间里书写人的笔迹是稳定的,不同书写人的笔迹特点不一样,具有不同的书写特征,并且笔迹的采集要比指纹和虹膜等容易,需要的采集设备便宜简单,作为生物识别特征的一种,目前已经得到广泛的应用。相对于指纹、虹膜等生物识别技术,笔迹鉴别技术有着更为广阔的市场和应用场景,除了在公检法等专业的笔迹鉴别领域发挥着重要作用,在商业市场的应用也得到了更加迅猛的发展,如金融、高等教育自学考试、办公自动化和电商等领域的相关应用场景。笔迹鉴别在不同的领域发挥着重要的作用,很多领域都对笔迹鉴别的应用有不同的需求。

笔迹鉴别又分为在线和离线,在线签名提供了更多的动态信息,且这种信息不易模仿,所以比离线要容易鉴定一些。目前在线签名系统的交叉错误率已降到1%以下,国外也已有实用产品面世。离线笔迹鉴别则是书写者在普通纸张上书写完之后,再利用照像机、扫描仪等光学成像设备提取书写者的笔迹。离线笔迹鉴别对于设备环境的要求较之在线方式宽松许多,如果能较大程度的提高其鉴别正确率,将会比在线方式有更大的应用前景。



技术实现要素:

本发明的发明目的,在于提供一种利用笔迹轮廓特征来进行笔迹鉴别的方法来提高评估离线笔迹鉴别的鉴别性能。

为达上述目的,本发明提供了利用笔迹轮廓特征来进行笔迹鉴别的方法,包括以下步骤:

获取待测签名图像并进行预处理,具体包括对待测签名图像二值化处理,并对二值化处理后的图像进行轮廓提取,得到笔迹轮廓;

提取笔迹轮廓的特征信息,包括基本链码特征、一阶差分链码特征、二阶差分链码特征、微分链码特征、方向链码特征,局部基本链码特征、局部一阶差分链码特征和局部二阶差分链码特征;

将各个特征向量与预设训练模板库中的所有样本笔迹的特征向量的均值进行距离计算,将计算出的所有距离值进行大小排序,最小距离者为待测签名的书写者。

接上述技术方案,轮廓提取具体为将二值化后的笔迹图像的内部点掏空,对于图像中某一笔迹点,若其8个相邻点的灰度值都是0,则该点就是笔迹内部点,将其灰度值置为255,否则灰度值不变。

接上述技术方案,其中:

所述基本链码特征提取时,具体将图像轮廓用8方向链码进行表示,每个轮廓点对应一个方向值,统计每个方向值的个数所占百分比;

所述一阶差分链码特征提取时,具体将上述基本链码进行差分转化为一阶差分链码,则每个轮廓点的方向值会发生变化,统计每个方向值的个数所占百分比;

所述二阶差分链码特征提取时,具体将上述一阶差分链码进行差分转化为二阶差分链码,则每个轮廓点的方向值会发生变化,统计每个方向值的个数所占百分比;

所述微分链码特征提取时,具体统计当前轮廓点方向值和下个轮廓点方向值发生了改变的链码对数,并将每个链码对个数所占百分比组合成48维特征向量;

所述方向链码特征提取时,具体统计当前轮廓点方向值和它的上个轮廓点方向值以及它的下个轮廓点方向值之间发生了改变的链码对数,并将每个链码对个数所占百分比组合成288维特征向量;

所述局部基本链码特征提取时,具体统计在每个n×n的局部方格中每个基本链码方向值的个数所占百分比;

所述局部一阶差分链码特征提取时,具体统计在每个n×n的局部方格中每个一阶差分链码方向值的个数所占百分比;

所述局部二阶差分链码特征提取时,具体统计在每个n×n的局部方格中每个二阶差分链码方向值的个数所占百分比。

接上述技术方案,具体通过距离分类器进行距离计算,距离分类器包括欧氏距离分类器、卡方距离分类器和曼哈顿距离分类器。

本发明还提供了一种利用笔迹轮廓特征来进行笔迹鉴别的系统,包括:

待测签名获取模块,用于获取待测签名图像;

预处理模块,用于对获取的待测签名图像进行预处理,具体包括对待测签名图像二值化处理,并对二值化处理后的图像进行轮廓提取,得到笔迹轮廓;

特征提取模块,用于提取笔迹轮廓的特征信息,包括基本链码特征、一阶差分链码特征、二阶差分链码特征、微分链码特征、方向链码特征,局部基本链码特征、局部一阶差分链码特征和局部二阶差分链码特征;

距离计算模块,用于将各个特征向量与预设训练模板库中的所有样本笔迹的特征向量的均值进行距离计算;

匹配模块,用于将计算出的所有距离值进行大小排序,最小距离者为待测签名的书写者。

接上述技术方案,所述预处理模块在进行轮廓提取时,具体用于将二值化后的笔迹图像的内部点掏空,对于图像中某一笔迹点,若其8个相邻点的灰度值都是0,则该点就是笔迹内部点,将其灰度值置为255,否则灰度值不变。

接上述技术方案,所述特征提取模块具体包括:

基本链码特征提取子模块:将图像轮廓用8方向链码进行表示,则每个轮廓点会对应有一个方向值,该模块统计了每个方向值的个数所占百分比;

一阶差分链码特征提取子模块:将上述基本链码进行差分转化为一阶差分链码,则每个轮廓点的方向值会发生变化,该模块统计了每个方向值的个数所占百分比;

二阶差分链码特征提取子模块:将上述一阶差分链码进行差分转化为二阶差分链码,则每个轮廓点的方向值会发生变化,该模块统计了每个方向值的个数所占百分比;

微分链码特征提取子模块:该模块统计了当前轮廓点方向值和下个轮廓点方向值发生了改变的链码对数,并将每个链码对个数所占百分比组合成48维特征向量;

方向链码特征提取子模块:该模块统计了当前轮廓点方向值和它的上个轮廓点方向值以及它的下个轮廓点方向值之间发生了改变的链码对数,并将每个链码对个数所占百分比组合成288维特征向量;

局部基本链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个基本链码方向值的个数所占百分比;

局部一阶差分链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个一阶差分链码方向值的个数所占百分比;

局部二阶差分链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个二阶差分链码方向值的个数所占百分比。

接上述技术方案,所述距离计算模块具体通过距离分类器进行距离计算,距离分类器包括欧氏距离分类器、卡方距离分类器和曼哈顿距离分类器。

本发明产生的有益效果是:本发明提取了手写笔迹的轮廓特征,能更好的利用了笔迹的边缘方向信息,对反映出书写者的书写风格有明显的效果。从硬件开销来看,本发明中需要用到的硬件设备主要是个人计算机,不会增加额外的硬件开销;从软件开发来看,本发明中用到了轮廓特征提取和各种距离匹配算法,优选出最佳距离度量方式,能达到很好的笔迹鉴别效果。本发明最大的特色是将这两种技术完美结合,解决现有的离线笔迹鉴别系统中存在的一些弊端。

附图说明

下面将结合附图及实施例对本发明作进一步说明,附图中:

图1为本发明实施例离线笔迹鉴别方法流程图;

图2为本发明实施例离线笔迹鉴别系统流程图;

图3为本发明实施例笔迹图像预处理模块框图;

图4为本发明实施例笔迹图像预处理后结果图;

图5为本发明实施例笔迹图像特征提取结果图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

本发明实施例的利用笔迹轮廓特征来进行笔迹鉴别的方法,如图1所示,包括以下步骤:

s1、获取待测笔迹图像;

s2、对获取的待测笔迹图像进行预处理,具体包括对待测签名图像二值化处理,并对二值化处理后的图像进行轮廓提取,得到笔迹轮廓;

s3、提取笔迹轮廓的特征信息,包括基本链码特征、一阶差分链码特征、二阶差分链码特征、微分链码特征、方向链码特征,局部基本链码特征、局部一阶差分链码特征和局部二阶差分链码特征;

s4、将待测笔迹的特征向量通过距离分类器进行分类鉴别。

其中步骤s2中轮廓提取具体为将二值化后的笔迹图像的内部点掏空,对于图像中某一笔迹点,若其8个相邻点的灰度值都是0,则该点就是笔迹内部点,将其灰度值置为255,否则灰度值不变。

步骤s3中,基本链码特征提取时,具体将图像轮廓用8方向链码进行表示,8方向定义为水平向右的方向值为1,顺时针依次为2、3、4、5、6、7、8,在对笔迹轮廓图像进行编码时,首先找到图像上最左方且最上方的轮廓像素点并将其记为p,其方向值标注为9,在这里数字9不代表某个方向,仅仅只是作为起始点的标记,接着顺时针搜索点p的八邻域,将找到的第一个未被标注的轮廓像素点记为q,并停止搜索,此时q点的方向值由向量决定。q点的方向值标注完成后,则将q点标记为p,作为新的起始点,再次搜索其八邻域,步骤同上,直到某一点八邻域内不存在未被标注的轮廓像素点了为止,此时向右搜索,找到下一个未被标注的轮廓像素点作为起始点并重复以上步骤。当笔迹轮廓图像上所有像素点均标注有自己的方向值后,找到图像上所有方向值被标注为9的轮廓像素点,将这些像素点设为点q,其相邻的前一个轮廓像素点设为点p,此时同之前标注步骤一样,q点的方向值由向量决定。当所有方向值被标注为9的轮廓像素点都按此步骤重新标注后,就完成了对笔迹轮廓像素点的编码。此时每个轮廓点对应一个方向值,统计每个方向值的个数所占百分比,它在一定程度上能体现出笔迹书写者的书写习惯。

一阶差分链码特征提取时,具体将上述基本链码进行差分转化为一阶差分链码,则每个轮廓点的方向值会发生变化,统计每个方向值的个数所占百分比,当用链码来表示目标的边界时,旋转会使其发生变化,而一阶差分链码则可以解决这个问题。

二阶差分链码特征提取时,具体将上述一阶差分链码进行差分转化为二阶差分链码,则每个轮廓点的方向值会发生变化,统计每个方向值的个数所占百分比,它能够反映笔迹图像轮廓的角度变化。

微分链码特征提取时,具体统计当前轮廓点方向值和下个轮廓点方向值发生了改变的链码对数,并将每个链码对个数所占百分比组合成48维特征向量,它能够体现出笔迹中的细节变化。

方向链码特征提取时,具体统计当前轮廓点方向值和它的上个轮廓点方向值以及它的下个轮廓点方向值之间发生了改变的链码对数,并将每个链码对个数所占百分比组合成288维特征向量,该特征向量的每一维都代表了一组相邻三个链码出现的概率。

局部基本链码特征提取时,具体统计在每个n×n的局部方格中每个基本链码方向值的个数所占百分比,它相当于基本链码特征基于局部网格窗口的一个变形,能够体现笔迹的局部特征信息。

局部一阶差分链码特征提取时,具体统计在每个n×n的局部方格中每个一阶差分链码方向值的个数所占百分比,它相当于一阶差分链码特征基于局部网格窗口的一个变形,能够体现笔迹的局部特征信息。

局部二阶差分链码特征提取时,具体统计在每个n×n的局部方格中每个二阶差分链码方向值的个数所占百分比,它相当于二阶差分链码特征基于局部网格窗口的一个变形,能够体现笔迹的局部特征信息。

步骤s4中,具体通过距离分类器进行分类,距离分类器包括欧氏距离分类器、卡方距离分类器和曼哈顿距离分类器。

本发明的笔迹图像采集:由于本发明主要着力于离线手写中文笔迹的特征提取与鉴别,因此没有采用数据库来管理图像或提取的特征,而是直接采用图像文件保存笔迹图像的方法,直接打开对应的笔迹图像文件夹。

二值化和轮廓提取为预处理部分,为特征提取做准备工作。

本发明实施例二值化用到的是otsu算法,其基本原理是以最佳阈值将图像的灰度直方图分割成两部分,使两部分之间的方差取最大值,即分离性最大。

轮廓提取就是获取图像的外部轮廓,在二值化后的图像中,设背景像素点灰度值为255,笔迹点灰度值为0。对于图像中某一笔迹点,若它的8个相邻点的灰度值都是0,则该点就是笔迹内部点,将其灰度值置为255,否则灰度值不变。二值化后的笔迹图像轮廓提取其实就是将笔迹中的内部点掏空。

本发明实施例利用笔迹轮廓特征来进行笔迹鉴别的系统,包括:

待测笔迹获取模块,用于获取待测笔迹图像;

预处理模块,用于对获取的待测笔迹图像进行预处理,具体包括对待测笔迹名图像二值化处理,并对二值化处理后的图像进行轮廓提取,得到笔迹轮廓;

特征提取模块,用于提取笔迹轮廓的特征信息,包括基本链码特征、一阶差分链码特征、二阶差分链码特征、微分链码特征、方向链码特征,局部基本链码特征、局部一阶差分链码特征和局部二阶差分链码特征;

分类鉴别模块,用于对待测笔迹进行分类鉴别,具体通过距离分类器进行分类,距离分类器包括欧氏距离分类器、卡方距离分类器和曼哈顿距离分类器。

特征提取模块中包括基本链码特征提取子模块、一阶差分链码特征提取子模块、二阶差分链码特征提取子模块、微分链码特征提取子模块、方向链码特征提取子模块、局部基本链码特征提取子模块、局部一阶差分链码特征提取子模块和局部二阶差分链码特征提取子模块。

基本链码特征提取子模块:将图像轮廓用8方向链码进行表示,8方向定义为水平向右的方向值为1,顺时针依次为2、3、4、5、6、7、8,在对笔迹轮廓图像进行编码时,首先找到图像上最左方且最上方的轮廓像素点并将其记为p,其方向值标注为9,在这里数字9不代表某个方向,仅仅只是作为起始点的标记,接着顺时针搜索点p的八邻域,将找到的第一个未被标注的轮廓像素点记为q,并停止搜索,此时q点的方向值由向量决定。q点的方向值标注完成后,则将q点标记为p,作为新的起始点,再次搜索其八邻域,步骤同上,直到某一点八邻域内不存在未被标注的轮廓像素点了为止,此时向右搜索,找到下一个未被标注的轮廓像素点作为起始点并重复以上步骤。当笔迹轮廓图像上所有像素点均标注有自己的方向值后,找到图像上所有方向值被标注为9的轮廓像素点,将这些像素点设为点q,其相邻的前一个轮廓像素点设为点p,此时同之前标注步骤一样,q点的方向值由向量决定。当所有方向值被标注为9的轮廓像素点都按此步骤重新标注后,就完成了对笔迹轮廓像素点的编码。则每个轮廓点会对应有一个方向值,该模块统计了每个方向值的个数所占百分比;

一阶差分链码特征提取子模块:将上述基本链码进行差分转化为一阶差分链码,则每个轮廓点的方向值会发生变化,该模块统计了每个方向值的个数所占百分比;

二阶差分链码特征提取子模块:将上述一阶差分链码进行差分转化为二阶差分链码,则每个轮廓点的方向值会发生变化,该模块统计了每个方向值的个数所占百分比;

微分链码特征提取子模块:该模块统计了当前轮廓点方向值和下个轮廓点方向值发生了改变的链码对数,并将每个链码对个数所占百分比组合成48维特征向量;

方向链码特征提取子模块:该模块统计了当前轮廓点方向值和它的上个轮廓点方向值以及它的下个轮廓点方向值之间发生了改变的链码对数,并将每个链码对个数所占百分比组合成288维特征向量;

局部基本链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个基本链码方向值的个数所占百分比;

局部一阶差分链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个一阶差分链码方向值的个数所占百分比;

局部二阶差分链码特征提取子模块:该模块统计了在每个n×n的局部方格中每个二阶差分链码方向值的个数所占百分比;

分类鉴别模块包括的分类器有欧氏距离分类器、卡方距离分类器和曼哈顿距离分类器。

欧氏距离分类器:采用欧式距离来计算测试样本的特征向量与训练样本的特征向量之间的距离。系统首先采用笔迹图像进行训练,得到一个模板值。当笔迹需要鉴别时,直接计算其特征向量与模板之间的欧氏距离值。距离越小说明相似度越高,则将最小距离判定为书写者。距离计算公式如下:

其中dist为待测样本的距离值,fi为待测样本的特征值,ti为训练样本某特征的均值,n为特征数。

卡方距离分类器:采用卡方距离来计算测试样本的特征向量与训练样本的特征向量之间的距离。原理及操作过程与上述欧式距离分类器相同。距离计算公式如下:

其中dist为待测样本的距离值,fi为待测样本的特征值,ti为训练样本某特征的均值,n为特征数。

曼哈顿距离分类器:采用曼哈顿距离来计算测试样本的特征向量与训练样本的特征向量之间的距离。原理及操作过程与上述欧式距离分类器相同。距离计算公式如下:

其中dist为待测样本的距离值,fi为待测样本的特征值,ti为训练样本某特征的均值,n为特征数。

本发明在笔迹鉴别的过程中,采用书写者的离线笔迹图像,对图像进行预处理,提取预处理后的图像轮廓,并在其轮廓基础上提取出全局和局部的边缘方向特征,利用距离分类器对其进行分类鉴别;在训练过程中,训练数据为所有书写者的笔迹图像,训练得到每个书写者笔迹图像的特征向量均值;在鉴别过程中,同样,将笔迹图像预处理后提取其轮廓特征,再将该特征向量通过距离分类器与训练模板库中的特征向量均值进行匹配实现分类鉴别,距离越小,说明相似度越高,反之,距离越大说明相似度越低,从而判断出书写者的身份。

本发明提取了手写笔迹的轮廓特征,能更好的利用了笔迹的边缘方向信息,对反映出书写者的书写风格有明显的效果;本发明系统简单、方便易操作、安全性高。从硬件开销来看,本发明中需要用到的硬件设备主要是个人计算机,不会增加额外的硬件开销;从软件开发来看,本发明中用到了轮廓特征提取和各种距离匹配算法,优选出最佳距离度量方式,能达到很好的笔迹鉴别效果。本发明最大的特色是将这两种技术完美结合,解决现有的离线笔迹鉴别系统中存在的一些弊端。

离线笔迹鉴别系统由待测笔迹获取模块、预处理模块、特征提取模块和分类鉴别模块组成,由图2的系统流程图可知,先要将笔迹样本进行预处理,再对预处理后的笔迹图像进行轮廓和特征提取,得到训练模板,通过对待测样本的特征提取之后,通过距离分类器与训练模板库中的特征向量均值进行匹配实现分类鉴别,距离越小,则认为向量之间的相似度越高,系统根据该距离排序判定最小距离者为该笔迹的书写者,最后统计鉴别结果,得到系统的大致性能。

离线笔迹样本都是使用笔写在打印纸上的笔迹,然后通过扫描仪进行灰度扫描输入电脑,由于自己采集数据工作量太大,于是本实验选用的哈尔滨工业大学人工智能研究室发布的hit-mw库(哈尔滨工业大学多人手写库)。

预处理模块是对笔迹样本进行预处理,将笔迹图像规格化为特征提取所需要的形态,为特征提取做好准备,预处理模块框图如图3所示,其具体步骤包括二值化和轮廓提取,预处理后的笔迹图像如图4所示。

特征提取模块通过对图像轮廓图进行8方向编码,使每个轮廓点都对应着8方向中的一个方向值,进而在其基础上提取一系列边缘方向特征,特征提取结果如图5所示。得到特征向量后计算待测笔迹与笔迹样本之间的距离,按照其相似度来鉴别出笔迹书写者,或者直接用分类器对其进行训练和预测,然后统计实验结果,包括基本链码特征提取子模块、一阶差分链码特征提取子模块、二阶差分链码特征提取子模块、微分链码特征提取子模块、方向链码特征提取子模块、局部基本链码特征提取子模块、局部一阶差分链码特征提取子模块和局部二阶差分链码特征提取子模块。

应当理解的是,对本领域普通技术人员来说,可以根据上述说明加以改进或变换,而所有这些改进和变换都应属于本发明所附权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1