一种手写体数字识别方法及装置的制作方法

文档序号:6402610阅读:208来源:国知局
专利名称:一种手写体数字识别方法及装置的制作方法
技术领域
本申请涉及计算机应用技术领域,特别涉及一种手写体数字识别方法及装置。
背景技术
手写体数字识别技术在实际生活中越来越收到重视,手写体数字识别技术是指:对于目标图像中的图像数据进行获取之后,依据获取的图像数据识别出目标图像中与目标数字相同的数字。由于获取到的图像数据均为高维空间数据,因此,在进行目标数字识别之前,首先对其空间进行降维处理。例如,现有的手写体数字识别方案中,通常采用基于最小二乘算法的局部稀疏线性嵌入降维方法对高维图像数据对应的向量数据进行降维,进而对降维后的向量数据采用K近邻方法进行分类,得到降维后的与目标数字相对应的数字图像。但上述方案中,由于最小二乘方法的计算解均不为0,无法达到有效的稀疏效果,且具有不稳定性,使得降维后的向量数据进行K近邻方法分类时的分类效果较差,进而使得最终识别出的数字图像不准确。

发明内容
本申请所要解决的技术问题是提供一种手写体数字识别方法及装置,用以解决现有数字识别方案中无法达到有效的稀疏效果且不具有不稳定性,使得数字识别的准确率较低的技术问题。本申请提供了一种手写体数字识别方法,包括:获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;`对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。上述方法,优选的,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括: 获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集合。上述方法,优选的:所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括:对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。上述方法,优选的,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括:依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。上述方法,优选的 ,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括:依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。本申请还提供了一种手写体数字识别装置,包括:图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合;向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。上述装置,优选的,所述向量数据降维单元包括:近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数;加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量;降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。上述装置,优选的:
所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签;其中,所述向量数据转换单元包括:第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合;第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合;向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。上述装置,优选的,所述数字图像识别单元包括:降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合;数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。上述装置,优选的,所述装置还包括:数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标 ,将所述数字图像显示于显示设备上。由上述方案可知,本申请提供的一种手写体数字识别方法及装置,通过利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对高维的目标图像对应的向量数据进行降维操作,得到降维向量数据,进而对降维向量数据集合进行识别,得到目标图像中的与目标数字相对应的数字图像。相对于现有采用最小二乘方法的降维方案中,由于正交匹配追踪算法得到的计算解并非全部为0,因此,使得本申请得到的计算解能够明显体现出局部稀疏性,且基于正交匹配追踪算法的计算解具有稳定性,使得降维后的向量数据进行后续分类识别时效果明显好于最小二乘方法,进而使得最终识别出的数字图像准确率较高。


为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本申请提供的一种手写体数字识别方法实施例一的流程图;图2为本申请实施例一的另一部分流程图;图3为本申请提供的一种手写体数字识别装置实施例二的结构示意图;图4为本申请实施例二的部分结构示意图;图5为本申提供的一种手写体数字识别装置实施例三的部分结构示意图;图6为本申请提供的一种手写体数字识别装置实施例四的部分结构示意图7为本申请提供的一种手写体数字识别装置实施例五的结构示意图。
具体实施例方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。随着科技的发展,手写体数字识别是文字识别中的一个重要研究课题,在实际生活中有深远的应用需求,一直得到广泛的重视。近年来随着计算机技术和数字图像处理技术的飞速发展,数字识别在电子商务、机器自动输入等场合已经获得成功的实际应用,例如,对手写体的邮政编码的扫描识别等应用。对于手写体数字识别,目前已经发展了很多种方法,典型的方法有基于K近邻分类(KNN)的方法、基于神经网络的算法、基于笔划特征的算法、基于遗传算法、基于小波变换算法、基于傅立叶变换算法、基于支持向量机算法和基于模板匹配算法等等。手写体数字识变体极多,对各类字体的数字识别特别是脱机手写数字识别仍然处于在发展阶段,识别效果仍然不够理想。因此,研究简单高效的手写数字识别依然是一个重要的研究方向。目前,常用的手写体数字识别方 法为K近邻分类,它是一种简单直观的识别方法,思想简单并且分类效果好,在类别分类的时候,影响分类的结果只与少量的最相似样本相关,所以,K近邻分类算法可以有效的避免样本分布不平衡带来的影响。但是K近邻分类需要全部样本,计算工作量较大,而且手写体数字是高维数据,如果直接对其识别,不仅时间计算复杂度大,而且不便于可视化观察分析。因而,常将手写体数字进行降维后再识别。能够降维且将数据可视化的方法较多,目前流形学习是非常引人瞩目一类方法,包括局部线性嵌入(LLE)、等距映射(Isomap)、拉普拉斯特征映射(Laplacian Eigenmap)等。局部线性嵌入方法是一种无参数、非迭代的算法,易实现,并且无需求解全局最小值,计算量较小。常用的局部线性嵌入方法中采用了最小二乘方法求解数据的局部线性表示系数。但是最小二乘方法的解是不稳定且不稀疏,所以容易导致降维后数据的分类效果不好。参考图1,其示出了本申请提供的一种手写体数字识别方法实施例一的流程图,所述方法可以包括以下步骤:步骤101:获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据。其中,所述待识别的目标数字包括O至9之间的任意一个或任意组合的数字,如I,或7和3,或8和9等。本申请要实现的目的,即为在目标图像中的高维图像数据中识别出上述目标数字中的各个数字,得到数字图像。例如,所述目标图像中,m和η分别表示所述目标图像的行像素数值和列像素数值,N为所述目标图像中所有图像数据的总个数,所述图像数据集合可以用{IJ表示,其中,i>=l,且 i〈=N。步骤102:对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合。例如,对所述图像数据集合{IJ中每个图像数据Ii进行向量转换,得到每个所述图像数据对应的向量数据Xi,所有所述向量数据Xi组成所述图像数据集合的向量数据集合,所述向量数据集合X = 中包括N个向量数据。其中,每个所述向量数据Xi可以通过对所述图像数据Ii行进行拉伸获得。步骤103:利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合。其中,参考图2,其示出了本申请实施例一的另一部分流程图,所述步骤103可以通过以下各个步骤实现:步骤201:获取所述向量数据集合中的每个向量数据的K近邻点集。其中,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数。例如,每个所述向量数据Xi的K近邻点集
权利要求
1.一种手写体数字识别方法,其特征在于,包括: 获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据; 对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合; 利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合; 依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
2.根据权利要求1所述的方法,其特征在于,所述利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合,包括: 获取所述向量数据集合中的每个向量数据的K近邻点集,每个所述K近邻点集中包括K个近邻向量数据,每个所述近邻向量数据与其所属向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数; 利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量; 利用局部稀疏线性嵌入降维方法对所述加权系数向量进行计算得到降维向量数据集口 O
3.根据权利要求2所述的方法,其特征在于: 所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签; 其中,对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合,包括: 对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合; 并对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合; 所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据 口 O
4.根据权利要求3所述的方法,其特征在于,所述依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像,包括: 依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合; 对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中与所述目标数字相对应的数字图像。
5.根据权利要求1至4任意一项所述的方法,其特征在于,在所述识别得到所述目标图像中与所述目标数字相对应的数字图像之后,所述方法还包括: 依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
6.一种手写体数字识别装置,其特征在于,包括: 图像数据获取单元,用于获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据; 向量数据转换单元,用于对所述图像数据集合中的每个所述图像数据进行向量转换,得到每个所述图像数据对应的向量数据,每个所述向量数据组成向量数据集合; 向量数据降维单元,用于利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合; 数字图像识别单元,用于依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。
7.根据权利要求6所述的装置,其特征在于,所述向量数据降维单元包括: 近邻点集获取子单元,用于获取所述向量数据集合中的每个向量数据的K近邻点集,所述K近邻点集中包 括K个近邻向量数据,每个所述近邻向量数据与所述向量数据在空间位置上相邻,K大于或等于1,且K小于所述向量数据集合中向量数据的总数; 加权系数计算子单元,用于利用正交匹配追踪算法对每个所述K近邻点集进行计算,得到所述向量数据集合的加权系数向量; 降维向量计算子单元,用于利用局部稀疏线性嵌入降维方法对所述加权系统树向量进行计算得到降维向量数据集合。
8.根据权利要求7所述的装置,其特征在于: 所述图像数据集合包括测试图像数据集合和训练图像数据集合,所述训练图像数据集合中的每个图像数据设置有与所述目标数字相对应的标签; 其中,所述向量数据转换单元包括: 第一向量转换子单元,用于对所述图像数据集合的测试图像数据集合中每个测试图像数据进行向量转换,得到每个所述测试图像数据对应的测试向量数据,组成测试向量数据集合; 第二向量转换子单元,用于对所述图像数据集合的训练图像数据集合中每个训练图像数据进行向量转换,得到每个所述训练图像数据对应的训练向量数据,组成训练向量数据集合; 向量数据组成子单元,用于将所述测试向量数据集合与所述训练向量数据集合组成所述图像数据集合的向量数据集合。
9.根据权利要求8所述的装置,其特征在于,所述数字图像识别单元包括: 降维向量提取子单元,用于依据所述降维向量数据集合中设置有所述标签的降维向量数据为降维训练向量数据的规则,提取所述降维向量数据集合中的降维测试向量数据集合; 数字图像分类子单元,用于对所述降维测试向量数据集合采用K近邻分类方法进行分类,识别得到所述目标图像中所述目标数字相对应的数字图像。
10.根据权利要求6至9任意一项所述的装置,其特征在于,所述装置还包括: 数字图像显示单元,用于在所述数字图像识别单元识别得到数字图像之后,依据所述数字图像的可视化坐标,将所述数字图像显示于显示设备上。
全文摘要
本申请公开了一种手写体数字识别方法及装置,所述方法包括获取待识别的目标数字和目标图像中的图像数据集合,所述图像数据集合中包括至少一个图像数据;对所述图像数据集合中的每个图像数据进行向量转换,得到每个所述图像数据对应的向量数据,所有所述向量数据组成向量数据集合;利用基于正交匹配追踪算法的局部稀疏线性嵌入降维方法对所述向量数据集合进行降维操作,得到降维向量数据集合;依据所述降维向量数据集合,识别得到所述目标图像中与所述目标数字相对应的数字图像。通过本申请实施例中正交匹配追踪算法得到的计算解并非全部为0,相对于现有技术能够明显体现出局部稀疏性,且具有稳定性,进而使得最终识别出的数字图像准确率较高。
文档编号G06K9/20GK103235947SQ20131015241
公开日2013年8月7日 申请日期2013年4月27日 优先权日2013年4月27日
发明者张莉, 冷亦琴, 王邦军, 何书萍, 包兴, 杨季文, 李凡长 申请人:苏州大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1