一种图像分类中通用的判别性稀疏编码字典学习方法与流程

文档序号：12597385阅读：来源：国知局

技术特征：

1.一种图像分类中通用的判别性稀疏编码字典学习方法，其特征在于，包括以下步骤：

(1)设计一种图像分类中通用的判别性稀疏编码字典学习方法，它独立于分类器学习，并对各种“字典”求解算法具有普适性：

假设“字典”U＝[U⁺,U^-]，即字典U分为U⁺和U^-两部分，其中U⁺为正类字典，U^-为负类字典。判别性“字典”的特点是“字典”中的“基”与类别相关联，即U⁺中的“基”总是倾向表达正类特征，而U^-中的“基”总是倾向表达负类特征；因而，可依据正类样本的特征集X⁺和负类样本的特征集X^-的重构误差对U⁺和U^-分别进行学习；若V＝(v_ij)为稀疏表示系数矩阵，其中i＝1,...,k，j＝1,...,n，k和n分别是字典U中“基”的个数和局部特征的个数，要使稀疏表达的重构误差最小，可通过优化如下目标函数来分别更新U⁺和U^-：

$<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msup> <mi>U</mi> <mo>+</mo> </msup> </munder> <mo>|</mo> <mo>|</mo> <msup> <mi>X</mi> <mo>+</mo> </msup> <mo>-</mo> <msup> <mi>U</mi> <mo>+</mo> </msup> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>+</mo> </msup> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <msubsup> <mi>u</mi> <mi>m</mi> <mo>+</mo> </msubsup> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>≤</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

$<mrow> <mtable> <mtr> <mtd> <mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <msup> <mi>U</mi> <mo>-</mo> </msup> </munder> <mo>|</mo> <mo>|</mo> <msup> <mi>X</mi> <mo>-</mo> </msup> <mo>-</mo> <msup> <mi>U</mi> <mo>-</mo> </msup> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>-</mo> </msup> <mo>|</mo> <msubsup> <mo>|</mo> <mi>F</mi> <mn>2</mn> </msubsup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>s</mi> <mo>.</mo> <mi>t</mi> <mo>.</mo> </mrow> </mtd> <mtd> <mrow> <mo>|</mo> <mo>|</mo> <msubsup> <mi>u</mi> <mi>m</mi> <mo>-</mo> </msubsup> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>≤</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>$

公式(1)和(2)中的优化问题可通过共轭梯度法、Lagrange对偶法或K-SVD算法求解，得到U＝[U⁺,U^-]；而其中的是V的子矩阵，分别与“字典”U⁺和U^-相对应和匹配，通过步骤(2)求得，抽取子矩阵和应满足分类表征“损失”小的基本原则，即类间差异性大，而表征损失小；

(2)求解稀疏表示系数矩阵V中的关键行向量作为公式(1)和(2)中的和

1)将V分解为V＝[V⁺,V^-]，和分别是特征集X⁺和X^-对应的稀疏表示系数矩阵，则可计算：

$<mrow> <mi>a</mi> <mo>=</mo> <msup> <mrow> <mo>[</mo> <msubsup> <mi>a</mi> <mn>1</mn> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mn>1</mn> <mo>-</mo> </msubsup> <mo>,</mo> <msubsup> <mi>a</mi> <mn>2</mn> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mn>2</mn> <mo>-</mo> </msubsup> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mo>+</mo> </msubsup> <mo>-</mo> <msubsup> <mi>a</mi> <mi>k</mi> <mo>-</mo> </msubsup> <mo>]</mo> </mrow> <mi>T</mi> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>$

其中，它们分别表示字典U中第i个“基”被用来表征正类和负类特征的使用“频率”；显然，值越大表示第i个“基”更倾向于表达正类特征，对应的稀疏表示系数项在正类特征的表征中占更大的权重，应被选择到中，反之，则更倾向于表达负类特征，对应的稀疏表示系数项在负类特征的表征中占更大的权重，应被选择到

2)按照各个“基”对应的元素a_i值由大到小的顺序重新排列“基”，则前部分更倾向于表达正类特征，而后部分更倾向于表达负类特征，而按此顺序重新排列对应V的各行，得到矩阵

3)对进行分割，令

$<mrow> <mover> <mi>V</mi> <mo>~</mo> </mover> <mo>=</mo> <mfenced open = "[" close = "]"> <mtable> <mtr> <mtd> <mrow> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>+</mo> </msup> <mo>,</mo> <msup> <mover> <mi>V</mi> <mo>···</mo> </mover> <mo>-</mo> </msup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msup> <mover> <mi>V</mi> <mo>···</mo> </mover> <mo>+</mo> </msup> <mo>,</mo> <msup> <mover> <mi>V</mi> <mo>&OverBar;</mo> </mover> <mo>-</mo> </msup> </mrow> </mtd> </mtr> </mtable> </mfenced> <mo>,</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>$

对于固定大小的特征集X⁺和X^-，对的列分割位置总是不变的，即的列宽度大小分别和X⁺，X^-保持一致。而在不同的行位置分割，可得到不同的和因而，需要查找最优分割行，方法是：在列分割位置不变的前提下，针对不同的分割行位置，将公式(4)中的对角矩阵和置换为0矩阵，得到矩阵然后计算中正负特征稀疏表示系数间的类间距或Fisher判别准则函数值，以及将和置换为0矩阵后正负特征的表征损失或重构误差来确定最优分割行。

完整全部详细技术资料下载

当前第2页1 2 3