基于自适应特征和离散余弦变换的视觉显著性检测方法与流程

文档序号：12124083阅读：来源：国知局

技术特征：

1.一种基于自适应特征和离散余弦变换的视觉显著性检测方法，其特征在于，其步骤如下：

步骤一：自适应特征提取：

步骤1：预处理：

1)图像缩放：

对大小为k×g的原始图像进行等比例缩放，缩放比例为a，缩放后的图像大小为ak×ag，其中，k、g均是非负整数，0<a<1，ak＝round(k×a)，ag＝round(k×g)，round(·)代表四舍五入运算；

2)图像分块：

从图像的左上角到右下角的顺次采用b×b的滑动窗口截取b×b的图像块，任意图像块都与水平和垂直方向的相邻图像块之间有50％的区域重叠，与±45°方向的相邻图像块之间有25％的区域重叠；将所有截取的图像块转换成列向量，并按照截取的次序组合成一个图像块向量矩阵，标记为X＝[x₁,x₂,...x_N]∈C^m×N；

其中，C代表自然数集合，x_i,i∈[1,N]代表第i个图像块对应的列向量，N是图像块的个数，m是x_i,i∈[1,N]的维数，m＝b×b×c，c为图像通道数，b≥4，且b为偶数；

步骤2：特征提取：

1)滤波器模板组的学习：

将图像块矢量矩阵X作为训练样本集，则滤波器模板组T可通过求解如下目标函数最小化问题得到：

$<mrow> <munder> <mrow> <mi>m</mi> <mi>i</mi> <mi>n</mi> </mrow> <mrow> <msub> <mi>α</mi> <mi>i</mi> </msub> <mo>&Element;</mo> <msup> <mi>R</mi> <mi>n</mi> </msup> </mrow> </munder> <mfrac> <mn>1</mn> <mi>N</mi> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <msub> <mi>x</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>Tα</mi> <mi>i</mi> </msub> <mo>|</mo> <msubsup> <mo>|</mo> <mn>2</mn> <mn>2</mn> </msubsup> <mo>+</mo> <mi>λ</mi> <mo>|</mo> <mo>|</mo> <msub> <mi>α</mi> <mi>i</mi> </msub> <mo>|</mo> <msub> <mo>|</mo> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>)</mo> </mrow> </mrow>$

其中，T＝[t₁,t₂,...t_n]∈R^m×n，R代表实数集合；n代表滤波器模板组T中基向量的个数；α_i是计算过程中的一个中间变量，初值通过随机数设定；||·||₁和||·||₂分别代表1范数和2范数运算，λ是一个用于平衡误差和稀疏性的折衷参数；

2)获取特征矩阵：

对任意一个图像块x_i通过计算图像块向量x_i和滤波器模板组T中各个基向量的卷积得到图像块x_i的特征向量f_i：

f_i＝x_i**T (2)

其中，**代表卷积运算，f_i∈Rⁿ；所有图像块对应的特征向量组成图像的特征矩阵：F＝[f₁,f₂...,f_N]；

步骤3：子特征自适应处理：

将特征矩阵F进行转置得到转置矩阵F'：

F'＝F^T＝[f₁,f₂...,f_N]^T＝[f′₁,f′₂,…f′_n]∈R^N×n (3)

其中，f'_j,j∈[1,n]为特征矩阵F的第j个子特征向量；

计算每个子特征向量f'_j的1范数可得矩阵Z：

Z＝[z₁，z₂,…z_n]＝[||f′₁||₁,||f′₂||₁,…||f′_n||₁]∈R^1×n (4)

对矩阵Z进行1范数的单位化处理可得矩阵P：

P＝[p₁，p₂…p_n]＝Z/||Z||₁∈R^1×n (5)；

定义阈值函数TH(p_j),j∈[1,n]为：

$<mrow> <mi>T</mi> <mi>H</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>k</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mmultiscripts> <mi>I</mi> <mprescripts/> <mrow> <mi>k</mi> <mo>&NotEqual;</mo> <mi>j</mi> </mrow> <none/> </mmultiscripts> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>k</mi> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mfrac> <mrow> <mi>I</mi> <mrow> <mo>(</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </mrow> <msub> <mi>p</mi> <mi>j</mi> </msub> </mfrac> <mo>-</mo> <msub> <mi>p</mi> <mi>j</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>6</mn> <mo>)</mo> </mrow> </mrow>$

其中，I(p_j)＝p_jlog p_j；

对于矩阵P中的任意一个向量p_j,j∈[1,n]，若TH(p_j)>0，则保留p_j不变，若TH(p_j)≤0，则令p_j＝0；处理后的矩阵P标记为矩阵P'，将矩阵P'进行1范数归一化处理得到矩阵A：

A＝[a₁，a₂,…a_n]＝P'/||P'||₁∈R^1×n (7)；

可得输入图像的自适应特征矩阵F_a：

其中，af_i为第i个图像块x_i的自适应特征向量，A^T∈Rⁿ代表矩阵A的转置，代表矩阵之间的点对点相乘运算；

步骤4：获取像素级自适应特征矩阵

由于在图像分块时相邻图像块之间有区域重叠，同一像素点会被多个图像块所包含，单个像素的自适应特征通过计算所有包含该像素的图像块的自适应特征的均值得出：

$<mrow> <msub> <mi>af</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> </msub> <mo>=</mo> <mfrac> <mn>1</mn> <mi>l</mi> </mfrac> <msubsup> <mi>Σ</mi> <mrow> <mi>q</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>l</mi> </msubsup> <msub> <mi>af</mi> <mi>q</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>9</mn> <mo>)</mo> </mrow> </mrow>$

其中，af_(x,y)∈Rⁿ代表坐标为(x,y)的像素点的自适应特征向量；l代表所有包含像素点(x,y)的图像块的个数；af_q,q∈[1,l]代表第q个包含像素点(x,y)的图像块的自适应特征；

将所有像素点的自适应特征向量组合在一起可以得到整幅图像的像素级自适应特征矩阵F_ap；由于缩放后的图像大小为ak×ag，每个像素点的自适应特征向量是n维的列向量，因此F_ap是大小为ak×ag×n的三维矩阵；

步骤二：基于自适应特征的离散余弦变换：

像素级自适应特征矩阵F_ap可拆分出n个ak×ag的二维矩阵，可视为n个分辨率ak×ag的特征图像的组合，标记第j个特征图像为Y_j∈R^ak×ag，j∈[1,n]，对特征图像Y_j进行离散余弦变换得到余弦图像Y_jc∈R^ak×ag，j∈[1,n]：

Y_jc＝COS(Y_j) (10)

其中，COS(·)代表离散余弦变换；

获取余弦图像Y_jc的符号图像Y_jf∈R^ak×ag，j∈[1,n]：

Y_jf＝FLAG(Y_jc) (11)

其中，FLAG(·)代表取符号操作；

对符号图像Y_jf进行离散余弦反变换得到余弦反图像S_j∈R^ak×ag，j∈[1,n]：

S_j＝ICOS(Y_jf) (12)

其中，ICOS(·)代表离散余弦反变换；

对所有余弦反图像S_j∈R^ak×ag，j∈[1,n]进行求和：

$<mrow> <mi>S</mi> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msub> <mi>S</mi> <mi>j</mi> </msub> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>13</mn> <mo>)</mo> </mrow> </mrow>$

其中，S为初始的视觉显著性图像，分辨率为ak×ag；

步骤三：获取视觉显著性检测结果：

步骤1：亮度值平方：

对初始的视觉显著性图像S的亮度值进行平方：

其中，代表两个矩阵的点对点相乘运算，S'∈R^ak×al是亮度值平方后的图像；

步骤2：高斯模糊：

对亮度值平方后的图像S'进行高斯模糊得到模糊后的图像S_gm∈R^ak×ag：

S_gm＝S'**gm (15)

其中，gm代表高斯模板；

将模糊后的图像S_gm缩放输入图像的原始尺寸k×g，并将所有像素点的灰度值进行四舍五入取整，得到最终的视觉显著性图像SM∈C^k×g，SM为输入图像的视觉显著性检测结果。

2.根据权利要求1所述的基于自适应特征和离散余弦变换的视觉显著性检测方法，其特征在于，所述高斯模板使用的高斯核标准差σ为图像宽度的0.03倍，即：σ＝0.03ak；高斯模板为正方形，其边长d约为标准差的3倍，即：d≈3σ，近似的原则为：选取最接近的奇数。

3.根据权利要求1所述的基于自适应特征和离散余弦变换的视觉显著性检测方法，其特征在于，所述缩放比例为a＝0.14，图像块x_i的大小为8×8，滤波器模板组T中基向量的个数n＝300，图像块之间的重叠率为50％。

完整全部详细技术资料下载

当前第2页1 2 3