基于稀疏变换的手写体数字识别方法

文档序号:8528482阅读:277来源:国知局
基于稀疏变换的手写体数字识别方法
【技术领域】
[0001] 本发明属于模式识别技术领域,具体涉及一种基于稀疏变换的手写体数字识别方 法。
【背景技术】
[0002] 随着信息网络的推广,有大量的数据要输入计算机网络。而且在现代的信息社会, 方方面面都要与数字打交道。手写数字识别作为模式识别的一个重要分支,在邮政、税务、 交通、金融等行业的实践活动中有着及其广泛的应用,不仅如此,手写体数字识别在一些大 规模数据统计,如行业年检、人口普查等需要耗费大量人力和物力的领域也可以进行应用。
[0003] 对识别或分类来说,数据表示需要突出显著特征,而实际中,数字采样过程会造成 数据信息的冗余,给分析带来很大不便,因此需要简化信号表示。自然信号或图像普遍具有 稀疏性,近年来基于稀疏模型的信号表示方法在许多信号和图像的处理与表示中均取得了 很好的效果,因此这里利用稀疏变换可以简化信号的特点,将稀疏模型与识别技术相结合, 得到基于稀疏变换的识别方法。

【发明内容】

[0004] 本发明的目的是提供一种基于稀疏变换的手写体数字识别方法,解决了现有技术 中存在的数字采用过程造成的数据信息冗余的问题。
[0005] 本发明所采用的技术方案是,一种基于稀疏变换的手写体数字识别方法,具体按 照以下步骤实施:
[0006] 步骤1、读入训练数据,然后对读入的数据进行预处理,并且初始化参数Ai、入2、 入 3、C、Y、Q;
[0007] 步骤2、基于步骤1中的训练数据,经过目标函数训练得到变换矩阵W;
[0008] 步骤3、将步骤2得到的变换矩阵W与待测数据y'相乘,得到待测数据y'的稀疏 表示系数x';
[0009] 步骤4、将步骤3中得到的稀疏表示系数x'分别与第i类的类标签qi,i= 1,...,C进行比较,并分别计算欧式距离;依据最近邻原理,待测数据y'归入到与其欧式 距离最小的类标签所属的类中,完成手写数字的识别。
[0010] 本发明的特点还在于,
[0011] 步骤1中对读入数据的预处理及参数初始化,具体步骤为:
[0012]将读入的大小为SXN的二维数字图像训练数据转化为SNX1的一维向量,并将转 化后的训练数据按列排放成矩阵形式,训练数据中属于同一类的数据排放在一起,训练数 据构成矩阵Y= [Yi,Y2,. . .YJ,其中Yi表示第i类的所有数据,i= 1,2,. . .C;
[0013]样本类别数C= 10;
[0014] Q= 为类标签矩阵,表示训练数据的类别信息;其中% =
[qp? ? ?,qj,i= 1,? ? ?,C,Qi的列数和Yi的列数相等;
[0015] h、人2、入3均初始化为常量。
[0016] 类标签矩阵Q的形式如下:
[0017] 类标签矩阵Q中每列的非零元素个数与I;大小相同,类标签矩阵Q的列数与训练 数据总个数相同,类标签矩阵Q的行数要大于或等于训练数据维数;
[0018] 其中I;表示稀疏度,即向量x中非零元素的最大个数。
[0019] 步骤2中目标函数为:
【主权项】
1. 一种基于稀疏变换的手写体数字识别方法,其特征在于,具体按照w下步骤实施: 步骤1、读入训练数据,然后对读入的数据进行预处理,并且初始化参数A1、A2、人3、C、 Y、Q; 步骤2、基于步骤1中的训练数据,经过目标函数训练得到变换矩阵W; 步骤3、将步骤2得到的变换矩阵W与待测数据y'相乘,得到待测数据y'的稀疏表示 系数X'; 步骤4、将步骤3中得到的稀疏表示系数X'分别与第i类的类标签q。i= 1,. . .,C进 行比较,并分别计算欧式距离;依据最近邻原理,待测数据y'归入到与其欧式距离最小的 类标签所属的类中,完成手写数字的识别。
2. 根据权利要求1所述的一种基于稀疏变换的手写体数字识别方法,其特征在于,所 述步骤1中对读入数据的预处理及参数初始化,具体步骤为: 将读入的大小为SXN的二维数字图像训练数据转化为SNX1的一维向量,并将转化后 的训练数据按列排放成矩阵形式,训练数据中属于同一类的数据排放在一起,训练数据构 成矩阵¥=化,¥2,...¥。],其中¥1表示第1类的所有数据,1 = 1,2,...(:; 样本类别数C= 10 ; Q=阳1,92,...Qc]为类标签矩阵,表示训练数据的类别信息;其中Qi= [q。...,qJ,i=1,. . .,C,Qi的列数和Yi的列数相等; 入1、A2、A3均初始化为常量。
3. 根据权利要求2所述的所述的一种基于稀疏变换的手写体数字识别方法,其特征在 于,所述类标签矩阵Q的形式如下: 类标签矩阵Q中每列的非零元素个数与T。大小相同,类标签矩阵Q的列数与训练数据 总个数相同,类标签矩阵Q的行数要大于或等于训练数据维数; 其中T。表示稀疏度,即向量X中非零元素的最大个数。
4. 根据权利要求3所述的一种基于稀疏变换的手写体数字识别方法,其特征在于,所 述步骤2中目标函数为:
5. t.IIXIIT。 其中,W= [W。*2, . . .WJT表示变换矩阵;X=技。. . .Xc]表示所有训练数据的稀疏 系数矩阵,其中Xi表示第i类训练数据的稀疏系数矩阵,i= 1,2,. . .C,向量X表示矩阵X 中任意一列; 所述步骤2中训练得到变换矩阵W的具体步骤为: 步骤2. 1、将变换矩阵W初始化为MXSN的随机矩阵; 步骤2. 2、将变换矩阵W视为已知量,固定变换矩阵W的值,更新稀疏系数X: 去掉式(1)中不含稀疏系数X的项,式(1)简化为如下形式:
Xi的解为保留^每列中绝对值最大的T。个元素,其它元素置为0,满足目标函数中稀疏 系数X每列的稀疏度为T。,从而满足Xi的稀疏性,得到稀疏系数X; 步骤2. 3、将步骤2. 2中得到的稀疏系数X视为已知量,固定稀疏系数X的值,更新变换 矩阵W; 去掉式(1)中不含变换矩阵W的项,式(1)简化为如下形式:
分别对变换矩阵W的第m行依次进行更新,m= 1,2. ..M,可得下式:
其中r表示稀疏系数X的第m行, 式(5)对Wm求导,令导数为零可得:
Wm间迭代更新直至收敛,m= 1,2. . .M,得到变换矩阵W; 步骤2. 4、将步骤2. 3得到的变换矩阵W视为已知量,转到步骤2. 2,直至稀疏系数X、变 换矩阵W均收敛,迭代更新结束,得到收敛的变换矩阵W即为步骤2中经过目标训练得到的 变换矩阵W。
【专利摘要】本发明公开了一种基于稀疏变换的手写体数字识别方法,首先对读入的训练数据进行预处理,其次将预处理后的训练数据经过目标函数训练得到变换矩阵W,再次待测数据经过稀疏变换得到稀疏表示系数x′,最后基于最近邻准则,将待测数据的稀疏表示系数x′与各类类标签进行比较,找出与待测样本最相似的类标签,并将待测样本归为该类标签所属的类中,完成手写数字的识别。本发明基于稀疏变换的手写体数字识别方法,待测数据经过稀疏变换后具有稀疏性,计算简便,提高了运行效率。
【IPC分类】G06K9-68
【公开号】CN104850870
【申请号】CN201510230301
【发明人】梁军利, 叶欣, 贾薇, 李敏, 范文, 于国阳, 柯婷
【申请人】西安理工大学
【公开日】2015年8月19日
【申请日】2015年5月7日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1