基于多线索归一化非负稀疏编码器的图像快速特征表示方法

文档序号:9471930阅读:358来源:国知局
基于多线索归一化非负稀疏编码器的图像快速特征表示方法
【技术领域】:
[0001] 本发明设及计算机视觉图像处理技术领域,具体设及一种基于多线索归一化非负 稀疏编码器的图像快速特征表示方法。
【背景技术】:
[0002] 生物学研究表明,哺乳动物的初级视皮层对外界刺激的响应满足稀疏性,即只有 少数的神经元被激活,相应的编码应该为稀疏编码。稀疏编码,通俗地说,就是将一个信号 表示为一组基的组合,而且要求只需要少数的几个基就可W将信号重构出来。稀疏编码已 经广泛应用到计算机视觉、图像信号处理等领域,例如,信号重构、信号去噪、图像特征提 取、W及分类等应用。
[0003] 传统的稀疏编码方法是基于最小均方误差意义下的重构,也就是使得重构误差尽 可能小,同时,尽可能使得相应的编码系数稀疏化。由于稀疏编码之后的过程通常是最大池 化(maxpooling)。运使得负数编码系数直接被忽略,造成了信息泄漏。在传统的稀疏编 码基础之上,添加非负约束,引入了非负稀疏编码。在非负稀疏编码基础之上,进一步添加 平移不变形约束,得到所谓的归一化非负稀疏编码。一方面使得稀疏编码系数的解释性得 到加强,另一方面自动地使得传统的稀疏约束参数消失,避免了繁杂的参数调节过程。归一 化非负稀疏编码的精确求解复杂度较高,不适合大规模的图像应用。通过使用自编码器模 型,学习得到归一化非负稀疏编码的编码器,从而在编码过程中避免了迭代求解的过程,因 此求解归一化非负稀疏编码只需要计算矩阵与矩阵乘法,W及一些非线性激活函数操作, 从而大大增加了编码速度。
[0004] 稀疏编码的基本理论模型: 阳00引 乂E腺4'记作N个D维的局部特征,友e吸。xM表示含有M个基元的码书,Ce肢'"xy 表示对应的编码系数。并且X中第i个局部特征表示为Xi,其对应的编码系数为Ci。传统 的稀疏编码模型目标在于优化W下的目标函数:
[0006]
[0007] 其中入为L1范数的稀疏约束参数,通过调节A,可W达到控制Ci稀疏程度的目 的。
[0008] 非负稀疏编码模型的目标函数在此基础之上,对于编码系数额外添加了非负约 束:
[0009]
[0010] 其中Ci(j)表示向量Ci的第j个分量。W上两种编码方式,都需要手工调节入, 来达到控制稀疏度的目的。在非负稀疏编码的基础上,我们进一步添加平移不变性约束,来 达到归一化非负稀疏编码:
[0011]
阳012] 其中1为元素全部为1的M维列向量,Ci(j)为向量Ci的第j个分量。由于非负 约束和平移不变性约束的联合作用,使得Ci的L1范数变成常数1,因此最后一项可W省略 掉,从来达到了自适应的控制稀疏度的目的。尽管归一化非负稀疏编码的目标函数中没有 显示的稀疏约束(L1范数正则项),但是根据带约束凸优化的边界条件,归一化非负稀疏编 码的结果通常都是稀疏的。
[0013] 如图1所示,图1分析了稀疏编码,局部限定性编码,归一化非负稀疏编码的编码 方案示意图。稀疏编码的结果趋向于局部性,但是并不严格地是局部性结果;局部限定性编 码挑选几个临近的码字去重构输入局部特征;尽管归一化非负稀疏编码的目标函数里面没 有显式的局部约束,事实上,它在目标函数里面从另一个角度隐含了局部约束。局部限定性 编码强制重构局部特征在输入局部特征的局部子空间中,因为它选择的基都是非常接近输 入局部特征的。而归一化非负稀疏编码仅仅允许重构局部特征存在于由所选择的基扩展成 的单纯形(simplex)之中。

【发明内容】

[0014] 本发明的目的在于针对现有技术的不足,提供了一种基于多线索归一化非负稀疏 编码器的图像快速特征表示方法,用于改进单线索归一化非负稀疏编码的特征表达能力, 同时不增加任何计算复杂度。
[0015] 为达到上述目的,本发明采用如下技术方案予W实现的:
[0016] 基于多线索归一化非负稀疏编码器的图像快速特征表示方法,包括W下步骤:
[0017] 1)对待处理的图像数据集中所有图像分别稠密地提取SIFT特征和颜色矩特征或 者HOG特征和颜色矩特征; 阳01引 2)对待处理的图像数据集中所有图像提取完SIFT特征后,随机地选取5万至50 万的SIFT特征和颜色矩特征,分别求解出待处理的图像数据集的SIFT特征码书和颜色矩 特征码书;
[0019] 3)建立基于多线索归一化非负稀疏编码编码器的松弛模型;
[0020] 4)利用步骤2)中求解得到的码书,按照步骤3)中建立的基于多线索归一化非负 稀疏编码编码器的松弛模型,求解松弛模型的参数,得到基于多线索归一化非负稀疏编码 编码器;
[0021] 5)利用求解得到的基于多线索归一化非负稀疏编码编码器,对所有的SIFT特征 进行编码;
[0022] 6)对图像数据集中每张图像的编码进行空间金字塔最大池化方法整合,得到每张 图像的特征向量。
[002引本发明进一步的改进在于,步骤2)中,WK-均值聚类的方法分别求解出待处理的 图像数据集的SIFT特征码书和颜色矩特征码书。
[0024] 本发明进一步的改进在于,步骤3)中,基于多线索归一化非负稀疏编码编码器的 松弛模型目标函数如下: 阳0巧]
[0026] 其中,Xi,分别表示其中第i个SIFT特征和颜色矩特征,及巨龄气P€妒'"表示 对应于两种局部特征的含有M个基元的码书,山Dy分别表示SIFT特征和颜色矩特征的维 度,Z为引入的松弛变量矩阵,维度为MXN,Zi为对应于第i个局部特征的M维松弛变量向 量,fe(?)为编码器的表达式,0为编码器的参数,包括Wl,W2,bl,b2,e,丫分别为控制松 弛变量的稀疏度和编码器输出与松弛变量的逼近度的超参数;
[0027] 使用两层神经网络模型来表示编码器fe( ?),即
[0028] f0(X)=softmax(W2(sigmoid(WiX+bi)+b2))
[0029]其中,Wi,bi分别为两层神经网络模型中第一层的权重系数和偏置系数;W2,b2分别 为两层神经网络模型中第二层的权重系数和偏置系数,X为两层神经网络模型的输入SIFT 特征。
[0030] 本发明进一步的改进在于,步骤4)中,采用交替优化的策略求解参数0,z,具体 方法如下:
[0031] 401)固定参数0,求解参数Z,公式如下:
[0032]
[0033] 使用梯度下降法对上述公式进行优化;
[0034] 402)固定参数Z,求解参数0,公式如下:
[0035]
[0036] 使用梯度下降法对上述公式进行优化;
[0037]403)交互迭代步骤401)和402),直至收敛;最终求得多线索归一化非负稀疏编码 的编码器fe(X)。
[0038] 本发明进一步的改进在于,步骤5)中,利用求解得到的基于多线索归一化非负稀 疏编码编码器fe(X),对输入图像的所有SIFT特征进行编码。
[0039] 相对于现有技术,本发明具有如下的优点:
[0040] 本发明使用自编码器模型,通过在编码器参数学习阶段,输入多种类型局部特征 进行训练,期望得到的归一化非负稀疏编码的编码系数,能够同时"记忆"多种特征信息,进 而能够进一步提升图像的特征表达能力;在图像编码阶段,在某些类型的局部特征不可获 得的前提下(例如灰度图不能够得到颜色矩特征),通过仅仅提取一种局部特征(SIFT)便 可得到接近于输入多种特征(SIFT和颜色矩特征)的特征表示。同时相较于单线索的归一 化非负稀疏编码来说,编码过程完全一致,不增加任何计算量。使用本发明的多线索归一化 非负稀疏编码器能够快速地获得判别力较强的图像特征表示。
[0041]具体来说,本发明在单线索归一化非负稀疏编码的基础上,提出了多线索归一化 非负稀疏编码模型,使得图像的最终特征表达能力进一步增强。并且,推导证明了多线索归 一化非负稀疏编码器的优化与单线索完全等价。本发明使用松弛自编码器模型,优化求解 多线索归一化非负稀疏编码器参数。本发明使用学习得到的多线索非负稀疏编码器,在图 像编码阶段,只需提取一种输入特征直接计算多线索非负稀疏编码系数,避免了迭代求解 的繁琐过程,从而大大提升了编码速度。本发明通过在训练阶段输入多种特征,使得编码器 能够学习"记忆"得到多种特征信息,在编码阶段,当图像的某些信息缺失时,多线索编码器 能够自动计算出多种信息的共享编码系数,在一定程度上能够弥补运种信息的缺失。
【附图说明】:
[0042] 图1(a)至(C)分别为稀疏编码、局部限定性编码及归一化非负稀疏编码的编码示 意图。
[0043] 图2为空间金字塔最大池化示意图。
[0044] 图3为本发明基于多线索归一化非负稀疏编码器的图像快速特征表示方法的流 程图。
[0045] 图4为学习编码器参数的自编码器网络示意图;其中,图4(a)为自编码器网络结 构示意图,图4(b)为某个输入的SIFT特征编解码过程示例。
[0046] 图5为多线索归一化非负稀疏编码器的参数优化网络结构示意图。
【具体实施方式】:
[0047]W下结合附图对本发明作进一步的详细说明。
[0048] 本发明在优化归一化非负稀疏编码器的过程当中,通过提供多种输入局部特征, 使得编码器参数能够学习"记忆"到多种特征信息(即多线索),在编码阶段对输入图像进 行特征编码时,仅需输入一种特征便能部分地得出多种特征的联合编码系数,与单一线索 模式相比(训练编码器参数时,仅有一种输入
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1