一种图像分类中通用的判别性稀疏编码字典学习方法与流程

文档序号:12597385阅读:来源:国知局

技术特征:

1.一种图像分类中通用的判别性稀疏编码字典学习方法,其特征在于,包括以下步骤:

(1)设计一种图像分类中通用的判别性稀疏编码字典学习方法,它独立于分类器学习,并对各种“字典”求解算法具有普适性:

假设“字典”U=[U+,U-],即字典U分为U+和U-两部分,其中U+为正类字典,U-为负类字典。判别性“字典”的特点是“字典”中的“基”与类别相关联,即U+中的“基”总是倾向表达正类特征,而U-中的“基”总是倾向表达负类特征;因而,可依据正类样本的特征集X+和负类样本的特征集X-的重构误差对U+和U-分别进行学习;若V=(vij)为稀疏表示系数矩阵,其中i=1,...,k,j=1,...,n,k和n分别是字典U中“基”的个数和局部特征的个数,要使稀疏表达的重构误差最小,可通过优化如下目标函数来分别更新U+和U-

<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msup> <mi>U</mi> <mo>+</mo> </msup> </munder> <mo>|</mo> <mo>|</mo> <msup> <mi>X</mi> <mo>+</mo> </msup> <mo>-</mo> <msup> <mi>U</mi> <mo>+</mo> </msup> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>+</mo> </msup> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <msubsup> <mi>u</mi> <mi>m</mi> <mo>+</mo> </msubsup> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>&le;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msup> <mi>U</mi> <mo>-</mo> </msup> </munder> <mo>|</mo> <mo>|</mo> <msup> <mi>X</mi> <mo>-</mo> </msup> <mo>-</mo> <msup> <mi>U</mi> <mo>-</mo> </msup> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>-</mo> </msup> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <msubsup> <mi>u</mi> <mi>m</mi> <mo>-</mo> </msubsup> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>&le;</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

公式(1)和(2)中的优化问题可通过共轭梯度法、Lagrange对偶法或K-SVD算法求解,得到U=[U+,U-];而其中的是V的子矩阵,分别与“字典”U+和U-相对应和匹配,通过步骤(2)求得,抽取子矩阵应满足分类表征“损失”小的基本原则,即类间差异性大,而表征损失小;

(2)求解稀疏表示系数矩阵V中的关键行向量作为公式(1)和(2)中的

1)将V分解为V=[V+,V-],分别是特征集X+和X-对应的稀疏表示系数矩阵,则可计算:

<mrow> <mi>a</mi> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <msubsup> <mi>a</mi> <mn>1</mn> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mn>1</mn> <mo>-</mo> </msubsup> <mo>,</mo> <msubsup> <mi>a</mi> <mn>2</mn> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mn>2</mn> <mo>-</mo> </msubsup> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mo>-</mo> </msubsup> <mo>&rsqb;</mo> </mrow> <mi>T</mi> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

其中,它们分别表示字典U中第i个“基”被用来表征正类和负类特征的使用“频率”;显然,值越大表示第i个“基”更倾向于表达正类特征,对应的稀疏表示系数项在正类特征的表征中占更大的权重,应被选择到中,反之,则更倾向于表达负类特征,对应的稀疏表示系数项在负类特征的表征中占更大的权重,应被选择到

2)按照各个“基”对应的元素ai值由大到小的顺序重新排列“基”,则前部分更倾向于表达正类特征,而后部分更倾向于表达负类特征,而按此顺序重新排列对应V的各行,得到矩阵

3)对进行分割,令

<mrow> <mover> <mi>V</mi> <mo>~</mo> </mover> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mrow> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>+</mo> </msup> <mo>,</mo> <msup> <mover> <mi>V</mi> <mo>&CenterDot;&CenterDot;&CenterDot;</mo> </mover> <mo>-</mo> </msup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mover> <mi>V</mi> <mo>&CenterDot;&CenterDot;&CenterDot;</mo> </mover> <mo>+</mo> </msup> <mo>,</mo> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>-</mo> </msup> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

对于固定大小的特征集X+和X-,对的列分割位置总是不变的,即的列宽度大小分别和X+,X-保持一致。而在不同的行位置分割,可得到不同的因而,需要查找最优分割行,方法是:在列分割位置不变的前提下,针对不同的分割行位置,将公式(4)中的对角矩阵置换为0矩阵,得到矩阵然后计算中正负特征稀疏表示系数间的类间距或Fisher判别准则函数值,以及将置换为0矩阵后正负特征的表征损失或重构误差来确定最优分割行。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1