图像分类方法、计算机存储介质及图像分类装置与流程

文档序号:17665033发布日期:2019-05-15 22:38阅读:112来源:国知局

本发明涉及计算机的图像处理技术领域,尤其涉及图像分类方法、计算机存储介质及图像分类装置。



背景技术:

基于稀疏表示分类法(src)的图像分类方法能够对待分类的样品图像中的噪声等干扰因素具有很好的鲁棒性,且能够有效模拟生物视觉感知特性,因此该类方法在图像处理和模式识别领域得到广泛应用。现有技术中,仅基于稀疏表示分类的常规图像分类方法往往存在分类精度不足的问题,尤其对于图像发生旋转、图像发生局部扭曲变形以及待识别的场景图像之间过于相似性等复杂情况时,仅基于稀疏表示分类的常规图像分类方法往往会出现分类错误。因此,有必要提出一种方案来提高图像分类的分类精度。



技术实现要素:

有鉴于此,本发明的目的在于提供图像分类方法、计算机存储介质及图像分类装置,来解决上述问题。

为了实现上述的目的,本发明采用了如下的技术方案:

本发明提供了一种图像分类方法,包括以n个训练样本图像构成同一类训练样本图像,对k类训练样本图像分别以预设尺度l和预设角度q进行多尺度分块旋转,以获得的所有旋转图像块作为训练集,构造k类稀疏表示字典;对输入的测试样本图像以预设尺度l进行多尺度分块,以获得的测试图像块转换为稀疏表示核函数空间中的测试向量y在对应预设尺度l下的分量,重构测试向量y;计算重构所述测试向量y的第i类稀疏表示字典的系数向量c的最稀疏解确定对应第i类稀疏表示字典的系数向量c的重构残差ri最小,以判断所述测试样本图像属于第i类图像。

优选地,对k类训练样本图像分别以预设尺度l和预设角度q进行多尺度分块旋转的方法包括:对每个训练样本图像分别根据不同的预设尺度l进行分块,对应每个训练样本图像获得个训练图像块;对每个训练图像块分别以预设角度q依序进行r次旋转,对应每个训练样本图像获得个旋转图像块,获得共个旋转图像块。

优选地,以获得的所有旋转图像块作为训练集构造k类稀疏表示字典的方法包括:将所述训练集中的旋转图像块分别转换为稀疏表示核函数空间中的向量;将所述向量根据对应的训练样本图像进行分类,以构造k类稀疏表示字典。

优选地,对输入的测试样本图像以预设尺度l进行多尺度分块的方法包括:对测试样本图像分别根据不同的预设尺度l进行分块,对应获得个测试图像块。

优选地,确定对应第i类稀疏表示字典的系数向量c的重构残差ri最小,以判断所述测试样本图像属于第i类图像的方法包括:计算系数向量c对应各个类别稀疏表示字典的重构残差rl;确定各个重构残差rl中的最小重构残差minrl对应第s类稀疏表示字典的系数向量c;确定存在对应的预设尺度l使最小重构残差minrl小于预设残差阈值。

优选地,计算所述重构残差rl的方法包括:计算预设尺度l下分块获得的测试图像块对应的局部重构残差r’l;对所有测试图像块对应的局部重构残差r’l进行求和并除以22l,以计算出所述重构残差rl。

优选地,构造图像类别空间f、所述训练集中第i类图像的第j张图片xij映射到所述图像类别空间f中的位置向量hi,图像差异空间g以及所述训练集中第i类图像的第j张图片xij映射到所述图像差异空间g中的位置向量wij,以获得空间矩阵以及系数向量矩阵根据所述空间矩阵b以及所述系数向量矩阵zij,以公式(i)计算重构所述测试向量y的第i类稀疏表示字典的系数向量c的最稀疏解其中,μ为所述训练集中训练样本图像对应向量的模的平均值,λ为所述系数向量c的l1范数的权值,bk为所述空间矩阵b中的第k个元素,zk为所述系数向量矩阵zij中的第k个元素。

优选地,以公式(ii)计算对应第i类稀疏表示字典的系数向量c的重构残差ri:ri=zitk(bi,bj)n×nzi-2k(bi,xij-μ)n×ltzi;其中,zi为第i类图像对应的系数向量矩阵,t为矩阵转置运算,k为核函数,bi为所述空间矩阵b中的第i个元素,bj为所述空间矩阵b中的第j个元素,k(bi,bj)n×n为以bi和bj为元素构成的n行n列的核矩阵,k(bi,xij-μ)n×l为以bi和xij-μ为元素构成的n行l列的核矩阵。

本发明还提供了一种计算机存储介质,所述计算机存储介质上存储有图像分类程序,所述图像分类程序用于被处理器执行以实现如上所述的图像分类方法。

本发明还提供了一种图像分类装置,所述图像分类装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像分类程序,所述画面分类程序用于被所述处理器执行以实现如上所述的图像分类方法。

本发明提供的图像分类方法、计算机存储介质及图像分类装置,结合了多尺度分块旋转扩展稀疏表示字典以及概率线性判别分析分类法,相比于现有技术中仅基于稀疏表示分类的常规图像分类方法,能有效地提高图像分类精度,可以精确地对处于图像发生旋转、图像发生局部扭曲变形以及待识别的场景图像之间过于相似性等复杂情况下的图像进行分类。

附图说明

图1是本发明实施例1提供的图像分类方法的流程图;

图2是在所述测试样本图像对应的灰度图中选取(2n+1)(2m+1)个像素构成的窗口示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明的具体实施方式进行详细说明。这些优选实施方式的示例在附图中进行了例示。附图中所示和根据附图描述的本发明的实施方式仅仅是示例性的,并且本发明并不限于这些实施方式。

在此,还需要说明的是,为了避免因不必要的细节而模糊了本发明,在附图中仅仅示出了与根据本发明的方案密切相关的结构和/或处理步骤,而省略了关系不大的其他细节。

实施例1

参阅图1所示,本发明实施例提供了一种图像分类方法,所述图像分类方法包括:

训练阶段:

s1、以n个训练样本图像构成同一类训练样本图像,对k类训练样本图像分别以预设尺度l和预设角度q进行多尺度分块旋转,以获得的所有旋转图像块作为训练集,构造k类稀疏表示字典。

测试阶段:

s2、对输入的测试样本图像以预设尺度l进行多尺度分块,以获得的测试图像块转换为稀疏表示核函数空间中的测试向量y在对应预设尺度l下的分量,重构测试向量y。

s3、计算重构所述测试向量y的第i类稀疏表示字典的系数向量c的最稀疏解确定对应第i类稀疏表示字典的系数向量c的重构残差ri最小,以判断所述测试样本图像属于第i类图像。

本发明实施例通过多尺度分块旋转扩展构建的稀疏表示字典中,以不同的预设尺度下的同一类图像作为一类稀疏表示字典中不同层的原子,最高稀疏表示层与训练样本图像的尺度相同,对应每一层尺度的稀疏表示字典将包含大量通过分块及旋转扩展的该尺度图像生成的原子。针对图像中由于存在柔性的易变形物体等原因而造成图像发生局部扭曲变形或者旋转等情况,由于旋转扩展后的小尺寸分块具有更多种排列组合方式,其重构能力更强,任意旋转角度的测试图像、柔性物体以及多物体的排列组合都可以用训练集进行稀疏表示,从而被识别。因此,本发明实施例提供的图像分类方法能通过构建具有足够完备度的稀疏表示字典来获得更高的识别精度。而且,基于上述稀疏表示字典,计算出将测试样本图像重构为对应类别稀疏表示字典中的测试向量的最稀疏解后,通过概率线性判别分析分类方法计算该最稀疏解对应的重构残差,确定以该最稀疏解对应的稀疏表示字典对测试样本图像进行重构的重构残差最小,进一步核实测试样本图像属于该类图像。

具体地,在训练阶段,所述步骤s1中,对k类训练样本图像分别以预设尺度l和预设角度q进行多尺度分块旋转的方法包括:

多尺度分块:对每个训练样本图像分别根据不同的预设尺度l进行分块,对应每个训练样本图像获得个训练图像块;即多尺度分块过程中,在每个尺度下通过构造网格将训练样本图像分为22l个训练图像块,整合每个训练样本图像在所有尺度下的训练图像块,获得共个训练图像块。

旋转扩展:对每个训练图像块分别以预设角度q依序进行r次旋转,对应每个训练样本图像获得个旋转图像块,获得共个旋转图像块。

进一步地,所述步骤s1中,以获得的所有旋转图像块作为训练集构造k类稀疏表示字典的方法包括:

将所述训练集中的旋转图像块分别转换为稀疏表示核函数空间中的向量;

将所述向量根据对应的训练样本图像进行分类,以构造k类稀疏表示字典。

在测试阶段,所述步骤s2中,对输入的测试样本图像以预设尺度l进行多尺度分块的方法包括:对测试样本图像分别根据不同的预设尺度l进行分块,对应获得个测试图像块。

通过设定所述训练样本图像的分辨率为w×h,将共k类的训练样本图像对应转换为稀疏表示核函数空间中的列向量v,其中v∈rd,即列向量属于d维欧氏空间中的元素,d=w×h,第i类训练样本图像对应的稀疏表示字典表示为di=[vi,1,…,vi,n]∈rd×n。当将每幅上述测试样本图像转换为稀疏表示核函数空间中的测试向量y时,在不同预设尺度l下的测试图像块对应作为测试向量y的分量,而该测试向量y可由第i类稀疏表示字典di和其对应系数向量c进行重构,所述测试向量y可表达为:y=di·c。

由于在实际应用过程中,所述测试向量y会受到噪音信号的影响而无法完美地完成重构,因此,所述测试向量y的重构表达式中需要引入重构残差rl作为松弛条件,故实际上所述测试向量y应表达为:y=di·c+rl。在该表达式中,所述测试向量y作为已知量,而稀疏表示字典d虽为已知量,却是欠定的,其没有唯一的解。故所述步骤s3中,本实施例根据有限等距性质条件,以求出通过最少的原子数来描述测试样本图像的系数向量c的最稀疏解其计算式为:

其中,限定||vi||2=1,代表了最稀疏解为测试向量y的真实值与通过稀疏表示字典所求得的重构值的差进行平方,λ为所述系数向量c的l1范数的权值,λ的数值越大则系数向量c的稀疏度增大,即以l1范数代替l0范数。若根据上式计算获得的系数向量c∈rn足够稀疏,即最稀疏解位于用户预设的期望数值范围内,则可以认为其包含有效的分类信息,但本实施例还需要利用概率线性判别分析分类方法来确定最稀疏解对应的稀疏表示字典对测试样本图像进行重构的重构残差最小,以避免因为图像之间的相似性而使分类结果出现误差。

具体地,构造图像类别空间f、所述训练集中第i类图像的第j张图片xij映射到所述图像类别空间f中的位置向量hi,图像差异空间g以及所述训练集中第i类图像的第j张图片xij映射到所述图像差异空间g中的位置向量wij,则所述训练集中第i类图像的第j张图片xij可表示为:

xij=μ+fhi+gwij+εij;

其中,μ+fhi只与图像类别有关,与图像具体的图片无关,该项描述了图像类别之间的差异;gwij+εij表示同一图像的不用图片,描述图像内部的差异。μ是全体训练数据的平均值;图像类别空间f包含了可以用来表示各种图像类别的基底;位置向量hi可以看作是一种图像的类别或者图像在类别空间中的位置;图像差异空间g可以看做是误差空间,其包含了可以用来表示同一图像不同变化的基底;位置向量wij图像表示在该空间的位置;εij为残留噪声项,该项呈零均高斯分布,方差为∑。

再通过构建空间矩阵以及系数向量矩阵根据所述空间矩阵b以及所述系数向量矩阵zij,所述训练集中第i类图像的第j张图片xij可表示为:

xij=μ+b·zij+εij;

由y=xij-μ,能将上述系数向量c的最稀疏解的计算式变形为以下公式(i)来计算重构所述测试向量y的第i类稀疏表示字典的系数向量c的最稀疏解

其中,μ为所述训练集中训练样本图像对应向量的平均值,λ为所述系数向量c的l1范数的权值,bk为所述空间矩阵b中的第k个元素,zk为所述系数向量矩阵zij中的第k个元素。利用上述公式(i)来计算系数向量c的最稀疏解的条件为目标函数的梯度符合独立坐标利普希茨连续条件,而在训练阶段已确认其可满足该条件。即可使用概率线性判别分析分类方法确认测试样品图像的分类,由得到以下公式(ii),以公式(ii)计算对应第i类稀疏表示字典的系数向量c的重构残差ri:

ri=zitk(bi,bj)n×nzi-2k(bi,xij-μ)n×ltzi;

其中,zi为第i类图像对应的系数向量矩阵,t为矩阵转置运算,k为核函数,bi为所述空间矩阵b中的第i个元素,bj为所述空间矩阵b中的第j个元素,即k(bi,bj)n×n为以bi和bj为元素构成的n行n列的核矩阵,k(bi,xij-μ)n×l为以bi和xij-μ为元素构成的n行l列的核矩阵。

具体地,确定对应第i类稀疏表示字典的系数向量c的重构残差ri最小,以判断所述测试样本图像属于第i类图像的方法包括:

计算系数向量c对应各个类别稀疏表示字典的重构残差rl

确定各个重构残差rl中的最小重构残差minrl对应第s类稀疏表示字典的系数向量c;

确定存在对应的预设尺度l使最小重构残差minrl小于预设残差阈值。

进一步地,计算所述重构残差rl的方法包括:

计算预设尺度l下分块获得的测试图像块对应的局部重构残差r’l

对所有测试图像块对应的局部重构残差进行求和并除以22l,以计算出所述重构残差rl

即上述重构残差rl的计算式为

示例性地,当按照预设尺度l={0,1,2}对测试样本图像进行分块,得到测试向量y={y0,y1,y2},首先确定最大的尺度l=0下系数向量c对应各个类别稀疏表示字典的重构残差rl,此时由于图像未分块,为原图尺度,尺度l=0下的所述重构残差为r0,若尺度l=0下确定对应第i类稀疏表示字典的最小重构残差minr0小于预设阈值,则可确认测试样品图像属于第i类图像,否则,需要在更小的尺度下再次进行确认。即依次在尺度l=1和l=2下确定对应第i类稀疏表示字典的最小重构残差minr1和minr2是否小于预设残差阈值,而当尺度l≠0时,由于直接利用基于上述公式(ii)计算获得的重构残差是当前尺度l下分块获得的测试图像块对应的局部重构残差,整幅测试样品图像的重构残差为当前尺度l下所有局部重构残差的平均值,故需要如上所述,对所有测试图像块对应的局部重构残差进行求和并除以22l。若所有预设尺度l下的最小重构残差minrl均不小于预设残差阈值,则认为系统无法识别该测试样品图像。

在本实施例中,所述测试样本图像为执行上述图像分类方法步骤前经过图像预处理的图像,参考图2所示,所述图像预处理的方法包括:

将所述测试样本图像转换为灰度图;示例性地,基于以rgb通道分量于灰度图中的占比进行计算的经典公式,像素的灰度值:gray=(r*299+g*587+b*114+500)/1000,将所述训练样本图像和所述测试样本图像分别转换为灰度图,并且再对获得的灰度图进行适度的裁剪,使灰度图更容易识别。

设所述测试样本图像的分辨率为m×n,计算出所述测试样本图像对应的灰度图中,在(2n+1)(2m+1)个像素构成的窗口内部的灰度平均值;

本实施例中,灰度图的中心处像素的上下方向各有m行像素而其左右方向各有n列像素,则所述窗口内的灰度平均值mi′j′的计算式为:

其中,i’为所述像素的横坐标,j’为所述像素的纵坐标,所述像素的坐标(i’,j’)为所述窗口的中心,k’为所述窗口的左右边界处的横坐标,l’为所述窗口的上下边界处的纵坐标。

根据所述测试样本图像对应在所述窗口内部的灰度平均值,计算出所述测试样本图像对应在所述窗口内部的灰度均方差;

所述窗口内的灰度均方差vij的计算式为:

根据所述测试样本图像对应在所述窗口内部的灰度均方差,计算所述测试样本图像去除加性噪音后的像素的灰度值以对测试样本图像进行去噪前的灰度值进行替换。

所述去除加性噪音后的像素的灰度值xi’j’的计算式为:

xi’,j’=(1-k’)mi’j’+k’xi’j’;

其中,系数σ为预设锐化参数值,由用户自行设定,xi’j’为输入的测试样本图像的原灰度值。

进一步地,所述图像预处理的方法还包括:将所述测试样本图像中的像素分别与索贝尔算子的横向矩阵dx和纵向矩阵dy作卷积,计算出所述测试样本图像中的像素经过锐化后的灰度值g(i’,j’)以对测试样本图像进行锐化前的灰度值进行替换,所述像素经过锐化后的灰度值g(i’,j’)的计算式为:

其中,i’为所述像素的横坐标,j’为所述像素的纵坐标,

经过上述图像预处理之后,减弱了所述测试样本图像受到噪音信号的影响,并且凭借对所述测试样本图像的锐化处理,使得所述测试样本图像的边缘轮廓更清晰,更容易被检测到,提高了对所述测试样本图像的识别率,提高了图像分类的效率。

本实施例为验证上述图像分类方法有利于提高图像识别率进行了以下实验,基于实验计算机参数:2.2ghz四核cpu、内存为4gb,选择实现算法的软件为matlab2010a,利用上述结合多尺度分块旋转扩展稀疏表示字典(msbre)以及概率线性判别分析分类法(pldasrc)的图像分类方法,与经典稀疏分类法(src)、核函数稀疏分类法(ksrc)、稀疏编码空间金字塔匹配法(scspm)以及基于不变矩和支持向量机的识别法(husvm),支持向量机使用径向基核函数这四种不同的图像分类方法来对不同训练集进行分类识别,获得以下表1所示的不同方法在各种训练集大小下的识别率。其中,对原数据集的图像进行预处理,转变为128×128像素的灰度图后,再随机选取图像中的5%,10%、20%、40%比例的图片作为训练集,其余部分作为测试集,最大分块尺度1选取层数为2,旋转扩展倍数选取10倍。对每个训练集各个大小比例下做优选为10次的测试,取其结果的平均值作为算法在该训练集大小下的识别率。

表1不同图像分类方法在各种训练集大小下识别率

根据表1所示的实验结果,经典稀疏分类法和核函数稀疏分类法的识别率明显低于其它图像分类方法,这是因为训练测试集的线性组合无法有效表示测试图像。而本实施例提供的图像分类方法通过多尺度分块旋转扩展能使得其稀疏表示字典足够完备,实际对残缺及遮挡等图像识别都有一定鲁棒性,所以取得了较好的结果。而对于比例较小的小样本训练集,本实施例提供的图像分类方法以外其它三种方法的识别率都较低,而本方法能保持至少87%以上的识别率,仅在训练集小到只占原数据集5%时才有小幅下降,证明了本方法对小样本情况也具有较好的鲁棒性。

实施例2

本发明还提供了一种计算机存储介质,所述计算机存储介质上存储有图像分类程序,所述图像分类程序用于被处理器执行以实现如实施例1所述的图像分类方法。

实施例3

本发明还提供了一种图像分类装置,所述图像分类装置包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的图像分类程序,所述画面分类程序用于被所述处理器执行以实现如实施例1所述的图像分类方法。所述处理器在一些实施例中可以但不限于是计算机的中央处理器、控制器、微控制器、微处理器、或其他数据处理芯片等。

综上所述,本发明实施例提供的图像分类方法、计算机存储介质及图像分类装置,基于稀疏表示分类法,通过在训练阶段对原训练集中的训练样本图像进行多尺度分块旋转扩展,以获得的新训练集构造稀疏表示字典,大幅提高了稀疏表示字典中原子数目,从而使图像分类精度获得提高,尤其是针对图像中的物体易变形等原因而造成的图像发生局部扭曲变形或者旋转的情况,其具有较好的鲁棒性,能精确地对这类图像进行识别;而在测试阶段,基于上述稀疏表示字典,采用了概率线性判别分析分类的方法对测试图像进行分类,利用测试样本图像对应的测试向量中的最小重构残差来确定测试图像所属类别,能进一步提高分类精度,尤其是针对相似度较高的场景图像之间的分类。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述仅是本申请的具体实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1