一种基于稀疏表示的超市商品图像识别方法与流程

文档序号:14941205发布日期:2018-07-13 20:51阅读:166来源:国知局

本发明涉及计算机视觉与智能识别技术领域,特别是一种基于稀疏表示的超市商品图像识别方法。



背景技术:

随着计算机及相关技术的迅猛发展,人工智能技术已经慢慢地渗透到人们的生活当中,无人超市作为智慧城市概念的一个热点,为人们提供便利,但无人超市在经营过程中存在一个难以避免的问题,就是因一些消费者的不自觉行为而导致超市的损失;随着机器视觉技术和图像处理技术的极大发展,开发一种新颖有效的基于图像处理的商品图像识别系统是解决无人超市盗损问题和自动结账的有效方式,商品图像识别系统利用图像分析算法对输入图像进行分析,分辨其所属的商品种类并清算消费者所消费的账单,这样既能达到自动识别商品并结账的功能,也能解决商品被盗损的问题。



技术实现要素:

为解决上述问题,本发明的目的在于提供一种基于稀疏表示的超市商品图像识别方法,可以对超市内的商品进行较为精确的识别。

本发明解决其问题所采用的技术方案是:

一种基于稀疏表示的超市商品图像识别方法,包括以下步骤:

a、采集商品的图像数据,并分成训练集和测试集,分别对训练集和测试集的各个图像数据进行分割、合并以及提取处理,得到训练集和测试集中各个商品完整的食物区域;

b、选取训练集和测试集中对应的食物区域的关键点;

c、对每一个关键点进行特征提取后得到每一个关键点的局部描述符;

d、根据训练集的关键点的局部描述符,采用稀疏字典训练方法对图像数据进行学习得到一个过完备的稀疏字典;

e、利用学习到的稀疏字典对训练集以及测试集的每一个图像数据的关键点的局部描述符进行稀疏表示,并计算得到训练集的全局特征描述符以及测试集的全局特征描述符;

f、利用svm分类方法对图像数据的类标和训练集的全局特征描述符进行训练得到svm分类器;

g、svm分类器根据测试集的全局特征描述符对商品进行识别。

进一步,所述步骤a中分别对训练集和测试集的各个图像数据进行分割处理,采用基于slic的超像素分割方法对图像数据进行分割并得到小图像块。分成多个小图像块便于分析出相似度高的小图像块。

进一步,所述步骤a中分别对训练集和测试集的各个图像数据进行合并处理,利用区域合并的方法对相似度高的小图像块进行合并。将相似度高的小图像块合并后,合并的图像块还会存在一些多余的边缘区域。

进一步,所述步骤a中分别对训练集和测试集的各个图像数据进行提取处理,其具体步骤为:采用亮度、颜色和纹理作为合并图像块的特征,利用特征空间进行全局对比度计算后生成对应的亮度显著图、颜色显著图以及纹理显著图,取上述三种显著图的平均值作为合并图像块的显著图,提取合并图像块显著图的显著性部分并得到完整的食物区域。通过基于显著性检测的图像分割算法将合并图像块之中完整的食物区域分割出来,以免多余的边缘区域影响后续的训练过程。

进一步,所述步骤b中选取训练集和测试集中对应的食物区域的关键点,采用surf算法分别对训练集和测试集的食物区域进行关键点的检测,将检测到的点作为训练集和测试集的食物区域的关键点。

进一步,所述步骤c中对每一个关键点进行特征提取后得到每一个关键点的局部描述符,具体步骤为:对以关键点为中心的16*16个像素点的邻域内提取其rgb颜色空间的颜色直方图特征和surf纹理特征作为每一个关键点的局部描述符。

进一步,所述步骤e中利用学习到的稀疏字典对训练集以及测试集的每一个图像数据的关键点的局部描述符进行稀疏表示,其中,稀疏字典采用正交匹配追踪算法对局部描述符进行稀疏表示。

进一步,所述步骤e中计算得到训练集的全局特征描述符以及测试集的全局特征描述符,具体步骤为:在得到训练集和测试集的所有稀疏表示的局部描述符后,通过对稀疏的局部描述符的特征向量进行叠加得到图像的全局特征描述符。

本发明的有益效果是:本发明采用的一种基于稀疏表示的超市商品图像识别方法,先采集商品的图像数据,并分成训练集和测试集,训练集用于对稀疏字典以及svm分类器进行训练,测试集用于进行最终的识别,根据训练集的关键点的局部描述符,采用稀疏字典训练方法对图像数据进行学习,可得到一个过完备的稀疏字典,然后根据稀疏字典对训练集的关键点的局部描述符进行稀疏表示并进行计算后得到训练集的全局特征描述符,利用svm分类方法对图像数据的类标和训练集的全局特征描述符进行训练得到svm分类器,同时利用稀疏字典对测试集的关键点的局部描述符进行稀疏表示并进行计算后得到测试集的全局特征描述符,将测试集的全局特征描述符输入到svm分类器即可完成对商品的识别,本发明的识别方法对超市商品的识别精度较高。

附图说明

下面结合附图和实例对本发明作进一步说明。

图1是本发明一种基于稀疏表示的超市商品图像识别方法的流程图;

图2是本发明一种基于稀疏表示的超市商品图像识别方法的识别框架图。

具体实施方式

参照图1-图2,本发明的一种基于稀疏表示的超市商品图像识别方法,具体来说包括两个步骤:训练以及测试,所以在对超市商品图像进行采集后,将超市商品图像数据分成训练集和测试集,分别对训练集和测试集的图像数据进行处理以后可以得到训练集和测试集的局部描述符,然后根据训练集的局部描述符训练一个稀疏字典,利用训练完成的稀疏字典对训练集的局部描述符以及测试集的局部描述符进行稀疏表示,对稀疏表示后的训练集的局部描述符以及测试集的局部描述符分别进行计算可得到训练集的全局特征描述符以及测试集的全局特征描述符,利用svm分类方法对图像数据的类标和训练集的全局特征描述符进行训练得到svm分类器,svm分类器即可对测试集的全局特征描述符进行识别从而完成对商品的识别过程。

由于图像在拍摄过程中会受到光照变化的影响,在图像处理过程中对图像作归一化的处理能减少图像受光照变化对于食物色彩的影响。

在训练和测试两个过程中,均会对训练集和测试集的图像数据进行局部描述符的获取,两个图像集的局部描述符的获取步骤相同,具体步骤为:首先采用采用基于简单的线性迭代聚类(simplelineariterativeclustering,slic)超像素分割方法对图像数据进行分割得到很多小图像块,再利用区域合并的方法对相似度高的小图像块进行合并,完成区域合并后,采用基于显著性检测的图像分割算法,将食物区域完整的分割出来。

在分割出食物区域后,进行关键点的检测,由于超市商品的包装变化多样,所以直接使用surf算法对食物区域进行关键点检测,选取最强的100个关键点作为该图像的关键点;若图像检测出来的关键点不足100个,则将能检测的所有的关键点作为该图像的关键点。

对以关键点为中心的16*16个像素点的邻域内提取其rgb颜色空间的颜色直方图特征(共48维)和surf纹理特征(128维)作为每一个关键点的局部描述符,其中对于颜色特征的表达,本发明分别在四种常用的颜色空间提取了颜色直方图,此四种颜色空间直方图分别为rgb颜色直方图、ycbcr颜色直方图、lab颜色直方图以及色度颜色直方图;对于纹理特征的描述,本发明采用了surf算法对特征点的邻域进行纹理特征的描述,首先对分割后的图像进行等密度采样选取关键点,将以关键点为中心的16*16个像素点的邻域分成4*4的小区域,接着对每个小区域的点计算其haar小波在水平方向的响应dx和垂直方向的响应dy,最后对区域中所有的点的haar小波响应并求和得到一个4维向量(∑dx,∑dy,∑|dx|,∑|dy|),为了能更准确的描述关键点的纹理特征,在求和步骤本发明在进行dy、|dy|求和过程中分别考虑了dx>0和dx≤0的情况,这样计算得到的surf特征为128维。

进行上述处理后可得到训练集的关键点的局部描述符以及测试集的关键点的局部描述符。

根据训练集的关键点的局部描述符采用稀疏字典训练方法对训练集图像进行学习可得到一个过完备的稀疏字典,然后稀疏字典分别对训练集的关键点的局部描述符以及测试集的关键点的局部描述符进行稀疏表示,并对稀疏表示后的局部描述符进行计算可得到训练集的全局特征描述符和测试集的全局特征描述符,训练集的全局特征描述符用于后续的svm分类器的训练,训练好的svm分类器可以对测试集的全局特征描述符进行识别从而完成商品的识别。

全局特征描述符的计算是通过对稀疏的局部描述符的特征向量直接进行叠加而得的。

稀疏表示模型可表示为:

假设给定一个字典d=[d1,d2,...,dk](d∈rn×k),信号y∈rn能够被稀疏表示为字典d中原子的线性组合,需要满足条件是信号的重建误差ε最小,其公式可以表示为y≈dx,满足||y-dx||2<ε,其中x是信号y的稀疏表示系数;学习字典过程中,依据最小均方误差原则,不断通过稀疏编码和字典更新迭代得到一个过完备字典。即对于需要学习的字典,给定训练数据则根据以下公式求解:其中x为稀疏矩阵,并且每个信号的稀疏表示系数非零值的个数不超过t0。

得到过完备字典后,采用正交匹配追踪算法(orthogonalmatchingpursuit,omp)对局部特征进行稀疏表示,得到稀疏局部特征,其特点是该特征向量的大部分元素为零,只有极少数的非零值。

在获取到训练集的全局特征描述符以及测试集的全局特征描述符之后,利用svm分类方法对图像数据的类标和训练集的全局特征描述符进行训练得到svm分类器,然后便可以通过svm分类器对测试集的全局特征描述符进行识别从而完成对商品的识别。

支持向量机((supportvectormachine,svm)是一种传统的分类方法,其基本思路是根据数据不同的类别标记,根据结构风险最小化原则对这些不同的类别找到一个最大分类分割界限,将这些类别划分到不同区域;对于二维数据而言,该线性分类器的界限是一条直线,而本发明中面对的超市商品属于高维数据而言,此时我们寻找的线性分类器的界限则是一个超平面;本发明中该超平面可以用分类函数来定义:f(x)=wtx+b,当f(x)=0时,x位于超平面上,而其他情况则代表商品属于对应的类别;设对空间内任意一点y,定义该点在超平面的垂直投影点为y0,w是垂直于超平面的向量,d是点y与超平面之间的距离,满足关系而点y0在超平面上,则带入超平面可导出从上式可以看出,支持向量机的目的是找出能够使得间隔最大化的分界面,其实质是寻求最优解,这使得该问题可以使用拉格朗日函数来进行优化,从而帮助训练svm完成对目标数据的分类。

本发明对超市商品进行试验识别,其中所选取的商品类别为11类,包括2664张超市商品图像数据,平均每一类商品的图像有240张,测试集共有972张图像,平均每一类商品有88张图像,本方法对11中超市商品的识别结果如下表所示:

从上表可以看出,本发明的方法对超市商品的识别较为精准,基本上都能准确的识别出商品的类别。

本发明的方法在对商品图像数据进行分割、合并以及提取处理时,采用了多种算法,具体如下:

进行分割时,采用了基于slic的超像素分割方法,超像素是指由一系列位置相邻的并且特征相似的像素点组成的小区域,这些小区域都能保存比较完整的图像的边界信息;与传统的图像分割方法相比,本发明实现的超像素分割算法通过引入约束条件,使得分割出的子区域能够更加紧凑;相对于像素级的图像处理方法,通过对超像素进行操作能使数据处理的运算量大大地降低,并且超像素的轮廓保持完整紧凑,能有效地提取目标区域的边界;本发明使用slic的超像素算法实现图像的超像素分割,思路为对每一个像素点,在lab颜色模型的颜色特征及其坐标组合一个5维特征向量,对该5维特征向量构造距离度量标准,再对图像像素进行局部聚类,具体实施过程为:

1.将图像从rgb颜色模型转换到lab颜色模型,对每个像素点提取器(l,a,b)值和(x,y)坐标组合成一个5维向量v[l,a,b,x,y];

2.初始化聚类中心:以自定义的超像素个数为基础,将种子点均匀分步到图像中,对于一张具备n个像素点的图像,首先将其与分割为k个尺寸一样的超像素,大小为n/k,则可以将相邻种子点之间的距离用近似表示;

3.在种子点的n*n邻域内重新选择种子点,计算种子点所在邻域的各像素点梯度值,统计分析其中的最小值,并把种子点移动到最小值对应的像素点位置;

4.对每个像素点分配类标签,即将slic的搜索范围限制为2s*2s;

5.颜色距离和空间距离的度量:对于每个像素点,分别计算它与种子点的距离,距离的计算方法如下:

其中dc代表颜色距离,ds代表空间距离,最终的距离度量:

其中ns表示类内最大空间距离,定义为适用于每个聚类,ns为最大颜色距离,由于每个像素点都会与多个种子点计算距离,因此该算法是将距离最小所对应的种子点认为是该像素点的聚类中心。

6.迭代优化,重复上述步骤3至5直到收敛。

对小图像块进行合并时,采用区域合并的方法,具体过程为:

1.确定邻接区域:对图像中的所有超像素进行遍历,找出每个超像素的所有邻接超像素。一般采用区域邻接图(rag)来表示区域间的相邻关系,区域由在rag的节点集合表示:n={n1,n2,...,nm},节点ni表示在图像中的区域ri;

2.对每个超像素区域ri,从区域邻接矩阵确定所有和ri邻接的区域rj;

3.计算ri与rj之间的相似性度量sij:分别计算每个区域归一化的rgb三通道颜色直方图,得到向量hi=[hri;hgi;hbi]和hj=[hrj;hgj;hbj],计算该区域ri与所有邻接区域rj的颜色直方图的欧式距离sij;

4.合并相似超像素,若sij小于阈值t,则将这两块超像素合并。

对合并后的区域进行提取处理时,采用的是基于显著性检测的图像分割算法,图像的显著性检测就是将图像中最引人注意的区域或目标检测出来,这就要采用具体的量化指标凸显出其感兴趣像素或者区域,通常选用显著值作为该量化指标,显著值越大表示该像素或区域越显著;相反,该像素或区域越不显著,也就是不重要的部分,而一个像素或者区域显不显著取决于与之相邻的像素或区域,即需要通过与周围像素的差异来体现,将这种差异称为对比度。

对比度衡量的是一个物体或者区域与相邻区域的区别程度,具有高对比度的物体更能引起人们的关注,这种对比度的计算在显著性检测算法中运用比较多,可以用来计算对比度的特征特别多,如颜色特征、纹理特征、亮度特征、频率特征等。

本发明采用亮度、颜色和纹理作为超像素块的特征,利用特征空间进行全局对比度计算,并将其作为相应特征空间的显著值:

首先是基于亮度特征的对比度:亮度特征作为图像最基础的特征,很好的反应了图像的明亮程度,用亮度特征计算对比度的表达式为:

其中n表示超像素块个数,ii表示超像素块i的亮度值,在此基础上,考虑超像素块的空间位置对对比度也有较大影响,距离越远,对当前计算的像素点影响越小,将空间位置作为参数,给每个像素块进行加权操作,以体现空间距离的影响,空间距离加权后的对比度计算公式为:

其中σ依经验取值100,pi表示超像素块i所在的位置。

第二个是基于颜色特征的对比度:颜色特征是衡量像素点之间区别的有力特征,我们在lab颜色空间中对颜色特征计算全局对比度,计算公式为:

其中l,a,b分别代表lab颜色空间中的三通道分量。

最后是基于纹理特征的对比度:图像中纹理越密集的区域越能引起人们的注意,一般的提取纹理特征方式为采用滤波器提取,最具有代表性的方法为gabor滤波,它可以从不同的尺度和角度对图像提取纹理特征,二维gabor滤波器的数学表达式为:

其中x'=xcosθ+ysinθ,y'=-xsinθ+ycosθ,λ表示滤波器的波长,θ表示滤波器的方向,表示相位,σ表示滤波器的标准差,γ表示gabor滤波器的长宽比;本发明中采用四种gabor滤波器对图像进行滤波,方向分别对应0,45,90,135,波长λ=14,相位长宽比γ=0.5。

得到以亮度特征、颜色特征和纹理特征计算的全局对比度后,将它们分别作为每个超像素块对应于特征空间的显著值,生成相应的显著图,即通过以上计算得到亮度特征、颜色特征与纹理特征的显著图,将以上三种特征图取平均得到该图像的显著图:

其中smi,smcolor,smtexture分别代表亮度、颜色与纹理特征图,利用得到的图像显著图提取显著性部分,完成对图像的分割。

本发明的一种基于稀疏表示的超市商品图像识别方法,通过对超市商品的图像数据进行采集,进过计算以及分析后得到一个过完备的稀疏字典和svm分类器,通过稀疏字典对处理过的测试集的图像数据的局部描述符进行稀疏处理并计算得到全局特征描述符,然后通过svm分类器对测试集的全局特征描述符进行识别即可完成对商品的识别,本发明的方法对超市商品的识别较为精确,可以分辨其所属的商品种类并清算消费者所消费的账单,这样既能达到自动识别商品并结账的功能,也能解决商品被盗损的问题。

以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1