一种基于非监督特征学习的高分辨率图像场景分类方法与流程

文档序号:12471138阅读:来源:国知局

技术特征:

1.一种基于非监督特征学习的高分辨率图像场景分类方法,其特征在于,包含以下步骤:

步骤1,显著度检测,利用图像中不同位置的图像块局部和全局相似度来计算图像的显著度,实现方式如下,

对于不同的图像块,首先定义一个图像块相似函数(1),

<mrow> <mi>d</mi> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>,</mo> <msup> <mi>x</mi> <mi>j</mi> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msub> <mi>d</mi> <mrow> <mi>c</mi> <mi>o</mi> <mi>l</mi> <mi>o</mi> <mi>r</mi> </mrow> </msub> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>,</mo> <msup> <mi>x</mi> <mi>j</mi> </msup> <mo>)</mo> </mrow> </mrow> <mrow> <mn>1</mn> <mo>+</mo> <mi>c</mi> <mo>&CenterDot;</mo> <msub> <mi>d</mi> <mrow> <mi>p</mi> <mi>o</mi> <mi>s</mi> <mi>i</mi> <mi>t</mi> <mi>i</mi> <mi>o</mi> <mi>n</mi> </mrow> </msub> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>,</mo> <msup> <mi>x</mi> <mi>j</mi> </msup> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>

其中dcolor为图像块在CIELab颜色空间的欧氏距离,dposition为图像块在图像位置空间的欧氏距离,xi,xj是任意位置的图像块,c是常数,选取与对应图像块xi最相似的K个图像块xk,其中k=1,2,…K,利用公式(2)来最终计算图像块所在位置的显著度,

<mrow> <msup> <mi>S</mi> <mi>i</mi> </msup> <mo>=</mo> <mn>1</mn> <mo>-</mo> <mi>exp</mi> <mo>{</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mi>K</mi> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mi>d</mi> <mrow> <mo>(</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>,</mo> <msup> <mi>x</mi> <mi>k</mi> </msup> <mo>)</mo> </mrow> <mo>}</mo> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>2</mn> <mo>)</mo> </mrow> </mrow>

其中,Si指图像块xi的显著度;

步骤2,显著图像块采样,根据步骤1所述的显著度检测获取图像中图像块的显著度信息,随机的从图像中选取预设固定大小的图像块;

步骤3,利用特征稀疏性目标函数和最小重构残差目标函数学习图像块特征表达,根据目标优化公式(5)同时优化目标特征的稀疏性和最小重构残差,

<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>,</mo> <mi>Z</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>m</mi> </msubsup> <mo>|</mo> <mo>|</mo> <msup> <mi>x</mi> <mi>i</mi> </msup> <mo>-</mo> <msup> <mi>z</mi> <mi>i</mi> </msup> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mi>&lambda;</mi> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>W</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>3</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>K</mi> <mi>L</mi> <mrow> <mo>(</mo> <mi>&rho;</mi> <mo>|</mo> <mo>|</mo> <mover> <mi>&rho;</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>=</mo> <mi>&rho;</mi> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mi>&rho;</mi> <mover> <mi>&rho;</mi> <mo>^</mo> </mover> </mfrac> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>&rho;</mi> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mrow> <mn>1</mn> <mo>-</mo> <mi>&rho;</mi> </mrow> <mrow> <mn>1</mn> <mo>-</mo> <mover> <mi>&rho;</mi> <mo>^</mo> </mover> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>4</mn> <mo>)</mo> </mrow> </mrow>

<mrow> <mi>Y</mi> <mo>=</mo> <mi>J</mi> <mrow> <mo>(</mo> <mi>X</mi> <mo>,</mo> <mi>Z</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>&beta;</mi> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>K</mi> </munderover> <mi>K</mi> <mi>L</mi> <mrow> <mo>(</mo> <mi>&rho;</mi> <mo>|</mo> <mo>|</mo> <mover> <mi>&rho;</mi> <mo>^</mo> </mover> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>5</mn> <mo>)</mo> </mrow> </mrow>

其中J(X,Z)是原始图像与经过解码后图像的残差和权值大小,其中X表示原始图像块,Z表示重构的图像块,i表示图像块编号,m表示图像块的数目,zi为图像块xi的重构结果,W表示目标函数的权值,是要学习到的特征提取算子,λ是约束项权值;是神经元的稀疏度,ρ是目标特征稀疏度,是当前特征稀疏度,β是稀疏度的权值;Y为总体误差函数;

步骤4,通过数据增强和随机丢弃进一步增强步骤3学习到的图像块特征表达;

步骤5,求解和更新特征算子,根据步骤3所述的目标优化公式(5),利用随机梯度下降法求解和更新特征算子;

步骤6,判断迭代是否达到最大训练次数,若达到最大训练次数则转至步骤7;否则转至步骤5;

步骤7,利用特征算子对图像进行卷积神经网络操作提取图像特征;

步骤8,利用支持向量机进行场景识别。

2.如权利要求1所述的一种基于非监督特征学习的高分辨率图像场景分类方法,其特征在于:步骤4所述的数据增强通过对图像进行随机旋转平移实现,所述随机丢弃通过在网络训练过程中,随机的屏蔽部分神经元实现。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1