一种获取模糊不变图像的特征描述子的方法与流程

文档序号:17387915发布日期:2019-04-13 00:17阅读:396来源:国知局
一种获取模糊不变图像的特征描述子的方法与流程

本发明属于数字图像识别技术领域,更具体地,涉及一种获取模糊不变图像的特征描述子的方法。



背景技术:

图像采集过程中,环境的干扰、相机本身的虚晃或者失焦容易造成图像模糊,这给诸如人脸识别的、纹理分类和目标检测等图像识别任务带来了现实性的挑战。

针对模糊图像识别的问题,现有技术包括以下有两种解决方案;一种是先对图像进行去模糊,然后利用传统的描述子(如LBP、SIFT和HOG等)来进行目标识别,这种方法适用于已知模糊函数的情况,利用非盲反卷积的方式进行图像的去模糊;另一种是直接对图像抽取具有模糊不变性的特征进行识别,而LPQ(Local Phase Quantization)则是其中的代表,利用图像的相位信息,对其进行去相关和量化后投射到一个八维空间,从而在整个图像上构建一个直方图,抽取一个对于中心对称模糊具有不变性的特征描述子。

上述方法存在以下缺陷,对于第一种方法,通常情况下模糊函数是未知的,因此去模糊处理的时间开销很大,对应此方法下PSF(Point Spread Function)估计的最优化问题的难点是图像模糊类型的选择;第二种方法中的LPQ在面临复杂的视觉识别任务时不能很好的平衡效率与精度;现有技术通过将LPQ与FV(Fisher Vector)结合,将LPQ特征进行编码形成一个更高维度的描述子来表征图像来提升LPQ的综合性能,但维度的提高不仅增加了实验开销,为了防止模型过拟合还增加了对训练样本的需求。



技术实现要素:

针对现有技术的以上缺陷或改进需求,本发明提供了一种获取模糊不变图像的特征描述子的方法,其目的在于通过对局部图块细分进行密集采样后得到的LPQ+进行FV编码来获得更高维度的模糊图像特征描述,以提高模糊图像识别精度和识别效率。

为实现上述目的,按照本发明的一个方面,提供了一种获取模糊不变图像的特征描述子的方法,包括以下步骤:

(1)对源图像数据集里的样本进行模糊处理,并对模糊处理后的图像进行灰度化处理;

(2)采用滑动窗口对灰度化处理获得的图像进行密集采样,获得多个局部图像块,并将各局部图像块划分为多个单元图块;

(3)对各单元图块抽取LPQ+,然后将抽取到的多组LPQ+进行合并获得局部图块的特征描述子;

其中,LPQ+是基于LPQ的特征描述子,通过直接针对相位而非LPQ中描述的实部虚部(实质为STFT系数)进行量化获得LPQ+;

(4)对所有的局部图块的特征描述子接续进行Fisher Vector编码处理、幂正则化和正则化处理,获得模糊图像的特征描述子。

优选地,上述获取模糊不变图像的特征描述子的方法,其步骤(4)之后还包括识别的步骤:

(5)根据训练数据集和对应特征描述子,采用一对一的多类分类策略训练线性的支撑向量机分类器;分类器的输出结果即为识别结果。

优选地,上述获取模糊不变图像的特征描述子的方法,其步骤(2)包括如下子步骤:

(2-1)采用固定尺寸、步长的滑动窗口对灰度化处理获得的图像进行密集采样,获得K组局部图像块;

(2-2)将局部图像块划分为多个小单元,用于保存局部图块的空间结构信息。

优选地,上述获取模糊不变图像的特征描述子的方法,其步骤(3)包括如下子步骤:

(3-1)采用STFT(Short Term Fourier Transform),以中心像素周围M×M大小的邻域为计算范围,对单元图块中的每个像素提取相位信息;

其中,(x,y)、(u,v)分别指模糊图像和对应傅立叶变换域中的坐标;g(x,y)是指模糊图像,G(u,v)为其对应的傅立叶变换形式;Nx和Ny指像素点(x,y)的邻域范围。

采取四个低频点,u1=(a,0),u2=(0,a),u3=(a,a),u4=(a,-a),并对其进行STFT,获得四个相位值∠G(u1),∠G(u2),∠G(u3),∠G(u4);其中,a为常数;

(3-2)按对相位值进行划分,获得I个不同的角度区域,将上述四个相位值归入对应角度区域并按照下述投票值进行量化,

其中,α是可调参数,是指∠G(uj)在对应的角度区域i下获得的投票值;其中,j=1,2,3,4;

(3-3)将四个相位值的量化值的分布表示成四个直方图并将直方图合并得到LPQ+;

(3-4)将同一图块的不同单元块的LPQ+合并,获得局部图块的特征描述子。

优选地,上述获取模糊不变图像的特征描述子的方法,其步骤(4)包括如下子步骤:

(4-1)将抽取的K个局部图块特征描述子记为X={xk,k=1,2,…,K};

(4-2)用N元的混合高斯模型uλ(x)来模拟X的生成过程,该模型记为

其中,参数λ={ωl,μl,σl,l=1,…,N},ωl,μl和σl分别是指高斯函数ul的混合权重、平均向量和标准差;参数λ依据EM准则(期望最大准则)在由大量训练集生成的局部特征描述子上进行估计;

(4-3)将高斯模型uλ(x)分别对μl和σl求偏导,获得两个梯度向量:

其中,γk(l)表示特征xk由第l个高斯函数生成的概率;

(4-4)将所有的N个高斯函数对应梯度向量进行合并,得到Fisher Vector编码

(4-5)对的每一个维度m进行如下幂正则化(power normalization,处理:

(4-6)对上述幂正则化后的进行正则化处理,得到模糊图像特征的描述子:

总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:

(1)本发明提供的获取模糊不变图像的特征描述子的方法,基于LPQ,但直接对相位而非LPQ中描述的实部和虚部(实质上为STFT系数)进行量化获得LPQ+;由于LPQ实质上只采用了STFT系数的符号信息而忽略了具体数值,而LPQ+为了弥补对具体的相位值进行量化,可更好地发挥LPQ的判别性;同时由于LPQ+特征维数比LPQ更低,因此具有提高处理效率的效果;

(2)本发明提供的获取模糊不变图像的特征描述子的方法,对局部特征描述采用Fisher Vector编码,将低维的特征描述投影至高维特征空间,结合线性支撑向量机分类器极大的提高了描述子的描述性能和模糊图像的识别精度;

由此,本发明提供了一种识别精度、速度更高的获取模糊不变图像的特征描述子的方法。

附图说明

图1是本发明实施例提供的获取模糊不变图像的特征描述子的方法的流程示意图;

图2为本发明实施例中抽取特征描述子LPQ+的流程示意图;

图3为本发明实施例中密集抽取LPQ+得到局部特征描述子的流程示意图;

图4为本发明实施例中采用Fisher Vector对局部图块描述子进行编码形成图像特征描述子的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

本发明提供了一种模糊不变的图像特征描述,其流程如图1所示,包括模糊图像的获取,对图像进行密集采样,抽取LPQ+,采用Fisher Vector进行编码,训练支撑向量机线性分类器,获得识别结果;以下结合实施例来具体阐述本发明提供的获取模糊不变图像的特征描述子的方法,具体步骤如下:

步骤1,获取模糊图像样本,包括如下子步骤:

(1-1)获取源图像数据集;在本实施例中采用五组不同种类的数据集:15类别的Yale人脸数据集,10类别的KTH纹理数据集,21类别的土地使用场景数据集,6类别的HUST云数据集以及17类的Oxford Flower数据集;

(1-2)获取模糊图像;在实施例中采用三种图像模糊方式:高斯模糊、运动模糊和圆形模糊;具体地,针对高斯模糊,邻域窗口的尺寸设置为3×3,标准差分别设置为1、2、3;针对运动模糊,相机的线性运动参数分别设置为8、9;针对圆形模糊,半径分别设置为2、3;

(1-3)将所有的彩色图像根据下式进行灰度化:

K=0.2989×R+0.5870×G+0.1140×B;

其中,K是灰度图像,R,G,B为彩色图像的三个通道。

步骤2,对图像进行密集采样,包括如下子步骤:

(2-1)采用尺寸为16×16,横向步长和纵向步长均为8的滑动窗口对灰度化处理获得的图像进行密集采样,获得局部图像块;

(2-2)将获取的局部图像块划分为4个单元图块,用于保存局部图块的空间结构信息。

步骤3,对不同单元的图块抽取LPQ+,然后进行合并为局部图块的特征描述子;其中,局部图块特征描述子的抽取以及密集采样的流程图分别如图2和图3所示;具体步骤如下:

(3-1)采用STFT(Short Term Fourier Transform)对单元中的每个像素提取相位信息;STFT的计算范围为中心像素周围13×13大小的邻域:

其中,(x,y)、(u,v)分别指模糊图像和对应傅立叶变换域中的坐标;g(x,y)是指模糊图像,G(u,v)为其对应的傅立叶变换形式;Nx和Ny指像素点(x,y)的邻域范围。

采取四个低频点,u1=(a,0),u2=(0,a),u3=(a,a),u4=(a,-a),其中参数并对其进行STFT处理,得到四个相位值∠G(u1),∠G(u2),∠G(u3),∠G(u4);

(3-2)按照将相位值划分8个不同的角度区域;将上述四个相位值归入对应角度区域并按照下述投票值进行量化,

是指∠G(uj)在对应的角度区域i下获得的投票值;其中,j=1,2,3,4;

(3-3)将四个相位的量化值的分布表示成四个直方图并将直方图合并得到LPQ+;

步骤4,对局部图块的特征描述子进行Fisher Vector编码处理、幂正则化和正则化处理,获得模糊图像的特征描述子;实施例中,Fisher Vector的实现基于VLFeat,其流程如图4,包括如下子步骤:

(4-1)将抽取的K个局部图块特征描述子记为X={xk,k=1,2,…,K};

(4-2)用50元的混合高斯模型uλ(x)来模拟X的生成过程,

其中,参数λ={ωl,μl,σl,l=1,…,50},ωl,μl和σl分别表示为高斯函数ul的混合权重、平均向量和标准差;参数λ依据EM准则,在由大量训练集生成的局部特征描述子上进行估计;

(4-3)将高斯模型uλ(x)分别对μl和σl求偏导,得到两个梯度向量:

其中,γk(l)表示特征xk由第l个高斯函数生成的概率;

(4-4)将所有的50个高斯函数对应梯度向量进行合并,得到Fisher Vector编码

(4-5)对上述的每一个维度m进行如下幂正则化处理,其中,幂指数0.5:

(4-5)对幂正则化后的进行正则化处理,得到模糊图像特征的描述子

步骤5,根据训练数据集和对应特征描述子,采用一对一的多类分类策略训练线性的支撑向量机分类器;在本实施例中采取开源的LIBSVM来训练和建立支撑向量机分类器;分类器的输出结果即最后的识别结果。

本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1