一种图像识别方法及装置的制作方法

文档序号：6380954阅读：291来源：国知局

专利名称：一种图像识别方法及装置的制作方法
技术领域：
本发明涉及图像信息处理技术领域，特别涉及图像识别方法及装置。
背景技术：
现在的图像识别系统越来越广泛的应用，比如人脸识别、指纹识别，静脉识别，手写字体识别，印刷字体识别和车辆字符识别系统等，这些图像识别系统主要是将待识别图像通过一定的识别运算后，得到一定的信息比如图像中所表示的字符等。例如，车辆牌照识别系统在交通系统中有着不可替代的作用，主要是把摄像头采集到车牌图像输入到车辆牌照识别系统后，该车辆牌照识别系统可以通过图像处理和分析，分割出车牌字符，最后对分割出来的字符进行模式识别，得到该车牌图像所表示的车牌号码，比如“粤B12345”，这样给交通系统的自动管理提供了极大的方便。车辆牌照识别系统包括车牌检测，歪斜校正，边界确定，字符切分和字符识别等功能，其中，车牌字符识别是识别车牌号码过程中的重要部分。目前，图像识别方法主要包括模板匹配，神经网络(Artificial NeuralNetwork, ANN),隐马尔可夫模型(Hidden Markov Model, HMM)，支持向量机(SupportVector Machine, SVM)和降维等方法,其中有些方法可以提高识别速度但是损失了识别准确度，有些方法提高了识别准确度但是损失了识别速度。

发明内容
本发明实施例提供图像识别方法及装置，在提高识别速度的同时提高了识别准确度。本发明实施例提供一种图像识别方法，包括用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本，所述s为大于I的自然数；用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型；根据所述选出的前s类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算，得到所述待识别图像所包含的信息。本发明实施例提供一种图像识别装置，包括样本选取单元，用于利用第一图像识别方法，在已知类别的训练样本中选出与待识别图像最相近的前S类训练样本，所述s为大于I的自然数；模型确定单元，用于用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型；识别单元，用于根据所述选出的前s类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算，得到所述待识别图像所包含的信息。在本发明实施例的图像识别方法中，图像识别系统对待识别图像进行粗分类，即利用第一图像识别方法，在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本；然后再根据粗分类结果进行精确分类，即用第二图像识别方法对已知类别的训练样本进行训练得到最终识别模型，并根据选出的前S类训练样本，将待识别图像在所述最终识别模型中进行识别运算，得到待识别图像所包含的信息。本发明实施例中结合了两种图像识别的方法，这样可以采用识别速度较高的第一图像识别方法对待识别图像进行粗分类，然后采用准确度较高的第二图像识别方法对待识别图像进行精确分类时可以提高图像识别准确度，而由于在精确分类时是将待识别图像与粗分类后确定的几种类别的训练样本进行比较，而不是与全部类别的训练样本进行比较，这样可以提高精确分类的速度。可见，本发明实施例的方法可以在提高识别速度的同时提高了识别准确度。

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。图1是本发明实施例提供的一种图像识别方法的流程图；图2是本发明实施例中在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本的方法流程图；图3是本发明具体的实施例提供的车辆牌照识别系统中两种机器学习方法的流程图；图4是本发明具体的实施例提供的车牌字符识别方法的流程图；图5是本发明实施例提供的一种图像识别装置的结构示意图；图6是本发明实施例提供的另一种图像识别装置的结构示意图。
具体实施例方式下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。本发明实施例提供一种图像识别方法，主要是图像识别系统将待识别图像经过一定的识别运算得到待识别图像中的一些信息比如字符等信息的方法，对于车辆牌照识别系统来说主要是从车牌图像中识别出车牌字符等，流程图如图1所示，包括步骤101，用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本，这里s为大于I的自然数，这里第一图像识别方法可以是降维的图像识别方法等。本发明实施例中对于图像的识别是先通过降维的图像识别方法对待识别图像进行粗分类，具体地，可以通过大量前期收集的试验样本作为训练样本集，在训练样本集中可以包括多种类别的训练样本，先经过训练得到训练样本的协方差矩阵的特征值矩阵和特征向量矩阵，其中协方差矩阵可以表示训练样本的不同维度之间的协方差即两个随机变量关系的统计量，协方差越大，说明两个变量关系越大，且协方差矩阵的特征值越大，说明对应的元素区分度越大；然后将特征值较大的特征向量组成的特征向量矩阵作为投影矩阵；最后将训练样本和待识别图像通过投影矩阵分别投影到最佳投影空间，即可将训练样本和待识别图像分别降到低维空间，从而可以在低维空间中比较训练样本与待识别图像，得到本步骤中最相近的前S类训练样本。具体参见图2所示，可以通过如下的步骤来实现A :利用降维方法对已知类别的训练样本进行训练得到表示元素区分度的矩阵，这里已知类别的训练样本是指每个类别的字符对应的图像样本，例如对于汉字来说，共有31个类别，而字母有24个类别,数字0-9和字母A-Z (除I和0)共有34个类别等,其中每个类别都可以有多种图像样本，用来与待识别图像进行比较。在得到表示元素区分度的矩阵时，图像识别系统具体可以采用线性降维和/或非线性降维相结合的方法，其中线性降维方法包括主成分分析(Principal ComponentAnalysis, PCA)法、线性鉴别分析(Linear Discriminant Analysis, LDA)法、独立成分分析(Independent Component Analysis, ICA)法、二维主成分分析(2DPCA)法和二维线性鉴别分析(2DLDA)法等，而非线性降维方法包括核主成分分析(KPCA)法、核线性鉴别分析(KLDA)法和核独立成分分析(KICA)法等。且图像识别系统在对已知类型的训练样本进行训练时，具体是对已知类型的训练样本进行特征提取，其中上述PCA法主要是提取出训练样本中最主要的元素和结构，去除噪音和冗余后，将原有的复杂数据降维，而2DPCA法与PCA法类似，不同的是2DPCA法不需要将训练样本的图像数据展开成一维向量，直接利用图像的二维信息产生协方差矩阵，大大节约了训练过程；LDA法主要针对线性可分的情况，具体地确定一个线性转换矩阵即一组投影方向，使训练样本在该投影方向投影的类内散布矩阵最小(即每一类的训练样本尽可能多的聚在一起)，而类间散布矩阵最大(即不同类别的训练样本最大程度分开)，2DLDA法与LDA法的关系类似于2DPCA法与PCA法的关系，这里不在赘述；ICA法主要是将训练样本进行某种线性分解，使其分解成统计独立的成分，这样各个成分之间是相互独立的；KPCA法，KLDA法，KICA法是三种基于核的方法，主要是通过核函数将线性不可分的训练样本映射到线性可分的高维空间中，这样，训练样本在高维空间中是线性可分的；然后再利用相应的PCA法、LDA法、ICA法等方法在高维线性空间的训练样本进行特征提取。B :基于上述步骤A中得到的表示元素区分度的矩阵，选择特征值大于预置特征值所对应的特征向量组成投影矩阵，这里的特征值是步骤A中得到的表示元素区分度的矩阵的特征值，且每个特征值对应一个特征向量，本发明实施例中，需要在上述元素区分度的矩阵对应的所有特征值中选择部分特征值。C :将待识别图像和已知类型的训练样本分别根据上述投影矩阵投影到最佳投影空间(即一个低维空间)，分别得到待识别图像在最佳投影空间的特征向量及各类别样本的最佳分类特征矩阵，这里投影过程具体是将待识别图像对应的向量与投影矩阵相乘得到待识别图像在最佳投影空间的特征向量，且将已知的各个类别的训练样本分别与投影矩阵相乘得到相应类别样本在最佳投影空间的特征向量即最佳分类特征矩阵。D :计算待识别图像在最佳投影空间的特征向量分别与各类别样本的最佳分类特征矩阵的欧式距离，欧式距离越小，则说明待识别图像与已知类别的训练样本越相近，在各类别样本分别对应的欧式距离中选取较小的前S个欧式距离所对应的训练样本的类别，即为与待识别图像最相近的前S类训练样本。步骤102，用第二图像识别方法对已知类别的训练样本进行训练得到最终识别模型，即对已知类别的训练样本进行特征提取得到这里第二图像识别方法是与第一图像识别方法不同的方法，可以包括SVM法，HM法或ANN等方法，从而可以分别得到的最终识别模型为SVM模型，HMM模型或ANN模型。这里最终识别模型中可以包括训练样本中图像特征的信息，比如支撑向量和特征个数等各种数据。其中，对于SVM方法来说，进行SVM训练的过程即为对训练样本进行特征提取，并寻找最佳分类线或最佳分类面的过程，对于两类线性可分的图像，SVM训练即为寻找最佳分类线的过程，使得通过该最佳分类线不仅可以将两类分开，而且使得分类间隔较大，可以实现最佳的分类效果；对于两类线性不可分的图像，可以找到一种满足Mercer条件核函数，该核函数即对应某一变换空间中的内积，则对已知的低维特征空间中的训练样本可以通过核函数进行内积，变换到高维的线性空间，使得训练样本在高维的线性空间中线性可分,此时最佳分类线对应最佳分类面，因此SVM训练的过程即为找到最佳分类面的过程。对于HM法或ANN法的训练过程在此不进行赘述。步骤103，根据步骤101中选出的前s类训练样本，将待识别图像在最终识别模型中进行识别运算，得到所述待识别图像所包含的信息，即利用最终识别模型将待识别图像与上述前s类训练样本进行逐一对比，而得到与待识别图像最接近的一个训练样本，而不用与全部类别的训练样本进行对比，提高识别速度。具体地，可以将待识别图像相应地在SVM模型，HMM模型或ANN模型中识别运算。在通过步骤101的粗分类之后，图像识别系统就可以确定与待识别图像最相近的几个类别的训练样本，然后通过本步骤进行精确分类，即可精确地识别出该待识别图像中所包含的信息。需要说明的是，上述步骤101与步骤102之间没有绝对的顺序关系，可以同时执行也可以顺序执行，图1中所示的只是其中一种具体的实现方案。其上述第一图像识别方法和第二图像识别方法也可以有其它的组合方式，可以是用户根据实际需要选择的，一般情况下，在粗分类时可以选取识别速度较快的图像识别方法，而在精确分类时可以采用识别准确度较高的图像识别方法，这样就可以兼顾到识别准确度和识别速度。可见，在本发明实施例的图像识别方法中，图像识别系统对待识别图像进行粗分类，即利用第一图像识别方法，在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本；然后再根据粗分类结果进行精确分类，即用第二图像识别方法对已知类别的训练样本进行训练得到最终识别模型，并根据选出的前s类训练样本，将待识别图像在所述最终识别模型中进行识别运算，得到待识别图像所包含的信息。本发明实施例中结合了两种图像识别的方法，这样可以采用识别速度较高的第一图像识别方法对待识别图像进行粗分类，然后采用准确度较高的第二图像识别方法对待识别图像进行精确分类时可以提高图像识别准确度，而由于在精确分类时是将待识别图像与粗分类后确定的几种类别的训练样本进行比较，而不是与全部类别的训练样本进行比较，这样可以提高精确分类的速度。可见，本发明实施例的方法可以在提高识别速度的同时提高了识别准确度。需要说明的是，上述步骤101到103是采用一种已知类别的训练样本对待识别图像进行识别，而在实际应用过程中，有些实际获取的图像往往包含多种信息，比如汉字、数字或字母等字符，这就需要分别采用不同的已知类别的训练样本来识别。比如对于包含汉字的图像部分，需要采用汉字的31类训练样本来识别，而对于包含数字的图像部分，需要采用数字的10类训练样本来识别。为了更进一步地提高识别速度且提高识别准确度，图像识别系统可以在执行上述步骤101之前，可以先获取图像，并对获取的图像进行分割，分割成多个待识别图像，每个待识别图像中可以包含不同种类的信息，比如包含汉字、数字或字母等；然后对多个识别图像采用不同和/或相同的已知类型的训练样本，进行上述步骤101到103，即选出前s类型训练样本，得到最终识别模型及在最终识别模型中进行识别运算的步骤。具体地，对于车牌字符的识别来说，由于每个车牌的第一个字符是汉字表示省份，第二个字符是英文字母表示发牌机关，第三到第七个字符是由字符和数字组成。这样可以先将获取的车牌图像分割成七个待识别图像，第一个待识别图像采用汉字的31类训练样本来识别，第二个待识别图像采用字母的24类训练样本来识别，第三到第七个待识别图像分别都采用数字0-9和字母A-Z (除I和0)的34类训练样本来识别。上述对实际图像需要进行分割后才进行识别的方法只是适用于某些图像识别系统中，比如车辆牌照识别系统，手写字体识别系统和印刷字体识别系统，而对于有些识别系统比如人脸识别或指纹识别系统中，获取的图像是一个整体的不能分割，则不需要对获取的图像进行分割而直接将该获取的图像作为待识别图像进行识别。在具体实际应用例中，对于一个类别的一个训练样本来说，可以表示为mXn的二维图像矩阵，且通过各行的首尾相连将其转换成一维向量，长度为D = mXn ;用N1,N2,......，队分别表示每个类别的训练样本的数目，其中N为训练样本的总数，L表示类别
的数量，而第c类别的训练样本集合表示为Ie则所有类别的训练样
,
本集可表示为
权利要求
1.一种图像识别方法，其特征在于，包括用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前S类训练样本，所述S为大于I的自然数；用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型；根据所述选出的前S类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算，得到所述待识别图像所包含的信息。
2.如权利要求I所述的方法，其特征在于，所述用第一图像识别方法在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本，具体包括利用降维方法对所述已知类别的训练样本进行训练得到表示元素区分度的矩阵；基于所述表示元素区分度的矩阵，选择特征值大于预置特征值所对应的特征向量组成投影矩阵；将所述待识别图像和已知类型的训练样本通过所述投影矩阵分别投影到所述最佳投影空间，并分别得到待识别图像在所述最佳投影空间的特征向量及各类别样本的最佳分类特征矩阵；计算所述待识别图像在所述最佳投影空间的特征向量分别与各个类别样本的最佳分类特征矩阵的欧式距离，并选取较小的前s个欧式距离所对应的训练样本的类别。
3.如权利要求2所述的方法，其特征在于，所述降维方法包括线性降维法和/或非线性降维法的结合；所述线性降维法包括主成分分析PCA法、线性鉴别分析LDA法、独立成分分析ICA法、二维主成分分析2DPCA法或二维线性鉴别分析2DLDA法；所述非线性降维法包括核主成分分析KPCA法、核线性鉴别分析KLDA法或核独立成分分析KICA法。
4.如权利要求I至3任一项所述的方法，其特征在于，所述用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型具体包括对所述已知类别的训练样本进行支持向量机SVM的训练得到SVM模型；根据所述选出的前s类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算具体包括将所述待识别图像在所述SVM模型中按照所述前s类训练样本进行识别运算；或，所述用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型具体包括对所述已知类别的训练样本进行隐马尔科夫模型HMM的训练得到HMM模型；根据所述选出的前s类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算具体包括将所述待识别图像在所述HMM模型中按照所述前s类训练样本进行识别运算；或，所述用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型具体包括对所述已知类别的训练样本进行神经网络ANN的训练得到ANN模型；根据所述选出的前s类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算具体包括将所述待识别图像在所述ANN模型中按照所述前s类训练样本进行识别运算。
5.如权利要求I至3任一项所述方法，其特征在于，所述在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本之前还包括获取图像，并将获取的图像进行分割成多个待识别图像，并对所述多个待识别图像采用不同和/或相同的已知类型的训练样本，进行上述选出前s类训练样本，得到最终识别模型及在最终识别模型中进行识别运算的步骤。
6.一种图像识别装置，其特征在于，包括样本选取单元，用于利用第一图像识别方法，在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本，所述s为大于I的自然数；模型确定单元，用于用第二图像识别方法对所述已知类别的训练样本进行训练得到最终识别模型；识别单元，用于根据所述选出的前S类训练样本，将所述待识别图像在所述最终识别模型中进行识别运算，得到所述待识别图像所包含的信息。
7.如权利要求6所述的装置，其特征在于，所述样本选取单元具体包括训练单元，用于利用降维方法对所述已知类别的训练样本进行训练得到表示元素区分度的矩阵；投影矩阵确定单元，用于基于所述表示元素区分度的矩阵，选择特征值大于预置特征值所对应的特征向量组成投影矩阵；投影单元，用于将所述待识别图像和已知类型的训练样本通过所述投影矩阵分别投影到所述最佳投影空间，并分别得到待识别图像在所述最佳投影空间的特征向量及各类别样本的最佳分类特征矩阵；计算选取单元，用于计算所述待识别图像在所述最佳投影空间的特征向量分别与各个类别样本的最佳分类特征矩阵的欧式距离，并选取较小的前s个欧式距离所对应的训练样本的类别。
8.如权利要求6或7所述的装置，其特征在于，还包括图像分割单元，用于获取图像，并将获取的图像进行分割成多个待识别图像；所述样本选取单元，模型确定单元和识别单元，分别用于对所述多个待识别图像采用不同和/或相同的已知类型的训练样本，进行所述选出前s类型训练样本，得到最终识别模型及在最终识别模型中进行识别运算的步骤。
全文摘要
本发明实施例公开了图像识别方法及装置，应用于图像信息处理技术领域。在本发明实施例的图像识别方法中，结合了两种图像识别的方法，这样可以采用识别速度较高的第一图像识别方法对待识别图像进行粗分类，利用第一图像识别方法，在已知类别的训练样本中选出与待识别图像最相近的前s类训练样本；然后采用准确度较高的第二图像识别方法对待识别图像进行精确分类时可以提高图像识别准确度，将待识别图像在所述最终识别模型中进行识别，而由于在精确分类时是将待识别图像与粗分类后确定的几种类别的训练样本进行比较，而不是与全部类别的训练样本进行比较，这样可以提高精确分类的速度，这样可以在提高识别速度的同时提高了识别准确度。
文档编号G06K9/66GK102982349SQ20121044739
公开日2013年3月20日申请日期2012年11月9日优先权日2012年11月9日
发明者唐健, 陶昆, 吴伟华, 廖振生申请人:深圳市捷顺科技实业股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：唐健;陶昆;吴伟华;廖振生
技术所有人：深圳市捷顺科技实业股份有限公司
我是此专利的发明人

上一篇：用于具有触摸屏的移动终端的数据输入方法和装置的制作方法
上一篇：一种屏幕解锁方法、装置及终端的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。