基于极限学习机的扫描证书图像识别方法

文档序号:9397197阅读:380来源:国知局
基于极限学习机的扫描证书图像识别方法
【技术领域】
[0001] 本发明涉及图像识别领域,尤其是一种扫描证书图像识别方法。
【背景技术】
[0002] 最近几年来,图像检索是一个非常受欢迎的话题,其检索对象包括海里游的,在天 空中飞翔的及地上走的。图像分类是图像检索的一个预处理过程,可以有效提高图像检索 的准确性。尽管已有针对不同种类图像数据集的众多图像分类检索系统,但是扫描证书图 像分类检索方面则关注较少,而这些扫描证书图像往往是申请奖励或公司拓展的重要辅助 材料。为了保证这类证书图像的合法利用,避免同张证书被多次利用,在特殊的扫描证书 数据集里的扫描图像查重对于某些检索系统是非常重要的,这有点类似于文件的相似性检 查。目前适用于比较流行的基于内容的图像分类检索系统的图像特征有颜色、纹理、形状以 及空间位置关系,但扫描证书图像质量低,种类繁多,版面形式多样,既包含具有特定意义 的图像标志,同时又包含对于获奖情况的简明扼要描述,因此,仅仅利用现有算法要实现从 海量图像库中查找是否存在与待测证书相似的图像文件是有困难的。因此,我们就得具体 分析扫描图像的特征,选取能更好地表述证书图像特点的特征。如何借助计算机技术快速 准确对附件证明材料一扫描图像一进行相似性检测是国家科学技术奖励评审迫切需要解 决的问题。
[0003] 人工神经网络,简称神经网络,是从动物神经系统得到启发而提出的一套数学模 型,通常被用来对输入和输出之间复杂的非线性关系进行建模,具有学习和识别的能力,被 广泛应用到计算机科学以及相关领域。神经网络可以表示为一组互相连接的神经元,神经 元是神经网络的最小单位,大多数情况下神经元可以根据外界信息的刺激而改变自身,使 得整个神经系统具有自适应性。神经元的数学模型如图1所示,X1... Xn是输入向量X e Rn的各个分量^1... Wn是神经元各个突触的权值,被称为输入权重,所有突触的权值向量用 W e Rn表示;b为偏置;y为神经元输出。
[0004] 神经元模型的数学表达式是y = g(W ·Χ+?3),g为神经元的激励函数。单隐层反馈 神经网络包括获得外界信息的输入层、与外界信息没有联系的隐藏层和可以向外界反馈信 息的输出层。在标准的单隐藏层反馈神经网络中,一般的输入层和输出层的激励函数均设 为g (X) = X的线性函数,因此输出层第k个神经元的响应可以表示为:
[0005] y[k] = [g(Wi ?x+b1)g(w2 *x+b2). . . g(wL *x+bL)] · β k+b2[k], k = I, . . . , m (I. I), 其中W1G Rn,i = 1,. . .,L表示隐藏层第i个神经元的输入权重,简称输入权重,β kG k =1,. . .,m表示输出层第k个神经元的输入权重,简称输出权重。整个单隐藏层反馈神经 元可由如下等式紧凑表示:
[0006] y = h(x) β+b, (I. 2),y e Rm是神经网络输出层所有神经元的响应,简称输出向 量;
[0007] h(x) = [gW · x+t^gW · x+b2). . . g(wL · x+bj]是神经网络隐藏层所有神经元 对输入向量X的响应,简称隐藏层响应向量;/?=[允夂..AiJ1是神经网络所有输出权重排 列而成的矩阵,简称输出权重矩阵也为隐藏层第i个神经元的偏置,bse Rm为整个输出层 偏置所排列成的向量;T表示矩阵的转置操作。
[0008] 从公式(1. 2)可以看出神经网络实际上是建立了一个映射函数f:x - y,把本来抽 象的映射函数f用具体的式(1. 2)表示,理论上来说,神经网络可以通过改变神经元的输入 权重来表示任意一个映射函数f。
[0009] 在神经网络学习过程,我们希望根据训练样本集{^匕找到在函数空间F中使 损失函数C最小的函数F,其中,X e Rn称为样本的特征(Feature),X e Rm称为样本 的标签(Label)。损失函数表示数学模型F(X)与真实标签t的测度,常用的基于欧氏距离 的损失函数(L2)可用如下等式表示:C = E[ I I f (x)-t I |2],(X,t) e D (I. 3),E表示期望, D表示样本空间,I I · I I2表示矩阵的2范数运算。
[0010] 在实际情况中,我们只能获得样本空间D的一部分样本,因此在实际应用中,用
公式 代替公式(1.3)。将公式(1.2)代入公式(1.4)得到公 (T.4)' 式(1. 4)的紧凑形式:+ A α_5)其中,T是训练样本的标签t]排列 而成的矩阵,每一行表示一个训练样本标签;H是训练样本的特征在隐藏层的响应h(X]), 0表示克罗内克积运算,lNe 1^表示所有元素为一的列向量;因此神经网络的学习过程 可用如下数学语言描述:在训练样本集上,求出使损失函数C最小的w],b,,β
和1^,学习过程可用等式 , 、其中,
(1,6 :),
[0011] 反向传播算法的提出使单隐藏层神经网络的性能和应用都有质的飞跃,但是误差 反向传播算法也存在不少缺点,一是误差反向传播算法每次迭代需要更新Wplv β和bs, 需要更新的元素个数为nX (L+1)+LX (m+1),这是一笔不小的开支;二是误差反向传播算 法中间用到的链式求导法则使得误差往前传递逐层减小,仅仅适用单隐藏层神经网络,当 神经网络层数很大时,很容易使整个系统陷入局部最优。

【发明内容】

[0012] 本发明提供一种基于极限学习机的扫描证书图像识别方法,为证书的相似性检索 提供一种快速、有效的预处理方法,显著提高证书图像检索的准确率。
[0013] 为实现上述目的,本发明的技术方案如下:
[0014] 一种基于极限学习机的扫描证书图像分类方法,包括如下步骤:
[0015] A :输入扫描证书图像数据样本库,进行预处理;
[0016] B :对经过预处理的证书图像利用Hough变换进行圆章定位,得到圆章外接矩形区 域,提取圆章区域的HSV颜色特征向量及图像的长宽比向量作为特征数据;
[0017] C :利用扫描证书图像样本库特征数据训练极限学习机;
[0018] D :输入待分类图像经过A,B步骤处理,利用经过训练的极限学习机完成图像分 类。
[0019] 优选地,步骤A中预处理是利用现有噪声滤除和倾斜校正方法进行预处理。
[0020] 优选地,步骤B具体操作步骤如下:
[0021] Bl利用现有圆章定位的方法,对定位得到的圆章所在的外接矩形进行分割提取, 得到圆章区域;
[0022] B2将色度H、饱和度S及亮度V三个分量分别非均匀量化为8份、4份和4份:
[0024] 这样圆章区域的HSV空间被分成XH+Xs+Xvf区间,X H、XS、XV分别是H、S及V的量化 级数,于是得到一个十六维的颜色特征向量,加上扫描图像图片长宽比,最终提取一个十七 维特征向量;
[0025] B3对所有特征值提取一位数的整数,选取的十七维特征用Xk。,Xkl. .. Xkl6表示,取 值范围为[0,9]之间的整数。
[0026] 优选地,步骤C具体操作步骤如下:
[0027] Cl根据神经网络基本模型及极限学习机的特点,随机生成输入权重W1与偏置b y i = 1··· L ;
[0028] C2根据公另
计算训练样本的特征在隐藏层的响应H,其中
[0029] h (X) = [g (W1 · x+bD g (W2 · x+b2)…g (?γ · x+bj) ],g 为神经元的激励函数;
[0030] C3根据公式W = H1T计算输出权重矩阵β,其中H+= (ΗτΗ+λΙ) 1HUSN或者 H+= H τ(ΗΗΤ+λ I) \ L彡N,H+是隐藏层响应矩阵H的Moore-Penrose增广逆,在H tH或HHt的对角线上添加一个小的正数λ以使得整个系统更加稳定;
[0031] 当/;/计算完毕时,一个单隐藏层反馈神经网络就完成了。
[0032] 优选地,步骤D具体操作步骤如下:
[0033] Dl待分类图像经过A,B步骤处理;
[0034] D2待分类图像的特征数据作为测试数据输入极限学习机,极限学习机输出分类结 果,对于一个类型未知的测试样本X,通过单隐藏层反馈神经网络推测它的类型,它的类型 可以用下式推测:/,(Y) = A(X)/;?,h(x) = [G(WDbliX)-G(Wl^buX)]是神经网络隐藏层关 于X的响应。
[0035] 本发明的有益效果是:本发明将待分类图像的圆章 HSV特征向量作为输入值,得 到证书图像最可能的类别。根据图像分类经验及实践证明,极限学习机具有速度快,泛化能 力强,分类准确率高的特点。
【附图说明】
[0036] 图1为现有神经元模型图。
[0037] 图2为本发明实施例基于极限学习机的扫描证书图像分类方法流程图。
【具体实施方式】
[0038] 下面结合附图及实例,对本发明做进一步说明。
[0039] 极限学习机从单隐藏层的神经网络发展而
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1