一种基于深度学习的模糊图像检测方法与流程

文档序号：11920553阅读：来源：国知局

技术特征：

1.一种基于深度学习的模糊图像检测方法，它包含以下步骤：

步骤1：任意选取摄像头采集的N₁+N₂幅同类数字图像其中既包含模糊图像也包含清晰图像，代表第t幅大小为M×N的图像；

步骤2：对步骤1中得到的N₁+N₂幅数字图像根据其模糊与否进行人工标定，若第t幅图像为模糊图像，则令其对应的标定变量y_t＝1，否则y_t＝-1；

步骤3：对于每一幅输入数字图像I_t，I_t(m，n)表示其中任意一像素点的灰度值，(m，n)为该像素点的坐标位置，进行I_t与算子(-1)^m+n的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心，得到

步骤4：对每一变换后的图像进行二维离散傅里叶变换，

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>F</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>Σ</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <munderover> <mo>Σ</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <msup> <mi>I</mi> <mo>′</mo> </msup> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mn>2</mn> <mi>π</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>u</mi> <mi>m</mi> </mrow> <mi>M</mi> </mfrac> <mo>+</mo> <mfrac> <mrow> <mi>v</mi> <mi>n</mi> </mrow> <mi>N</mi> </mfrac> <mo>)</mo> </mrow> </mrow> </msup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>u</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> <mtd> <mrow> <mi>v</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>$

其中F_t(u，v)表示I′_t的二维离散傅里叶变换，u，v为傅里叶变换后的空间坐标，进而得到总体频谱图|F_t|；

步骤5：将频谱图|F_t|做下采样，下采样的比例根据图像大小决定，下采样后频谱图的宽度和高度都不超过50个点，向量化下采样后频谱图得到向量h_t；

步骤6：计算每一图像的倒谱

其中代表反傅里叶反变换，|F_t(u，v)|为第t幅图像傅里叶变换F_t(u，v)的模，倒谱具体表达式为：

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>C</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mi>M</mi> <mi>N</mi> </mrow> </mfrac> <msubsup> <mi>Σ</mi> <mrow> <mi>u</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <msubsup> <mi>Σ</mi> <mrow> <mi>v</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mi>log</mi> <mo>|</mo> <msub> <mi>F</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>u</mi> <mo>,</mo> <mi>v</mi> </mrow> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>e</mi> <mrow> <mi>j</mi> <mn>2</mn> <mi>π</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <mrow> <mi>u</mi> <mi>m</mi> </mrow> <mi>M</mi> </mfrac> <mo>+</mo> <mfrac> <mrow> <mi>v</mi> <mi>n</mi> </mrow> <mi>N</mi> </mfrac> </mrow> <mo>)</mo> </mrow> </mrow> </msup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> <mtd> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>$

步骤7：将倒谱图C_t做下采样，下采样的比例根据图像大小决定，下采样后倒谱图的宽度和高度都不超过50个点，向量化下采样倒谱图得到向量s_t；

步骤8：对于每一图像由频谱向量h_t和倒谱向量s_t构成模糊特征x_t＝[h_t；s_t]；

步骤9：设计深度分类网络，为已有图像的模糊特征和对应是否清晰的标签，定义目标函数为

$<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mi>θ</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>N</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>N</mi> <mn>2</mn> </msub> </mrow> </mfrac> <munderover> <mo>Σ</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>N</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>N</mi> <mn>2</mn> </msub> </mrow> </munderover> <mo>{</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mi>log</mi> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>y</mi> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mo>}</mo> <mo>+</mo> <mfrac> <mi>λ</mi> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>θ</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>$

其中θ是网络参数，λ是控制约束项强弱的因子，y(x_t)为样本x_t属于模糊图像的概率p(y_t＝+1|x_t，θ)，对应的表达式为：

$<mrow> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <msup> <mi>w</mi> <mi>T</mi> </msup> <msubsup> <mi>h</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>$

为深度网络最后一个隐层的节点构成的向量，s_L为最后一隐层节点的数目，w为最后一层的参数向量，L为网络隐层总的层数；网络往前每一层的节点单元由上一层的节点单元和网络参数决定

$<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mi>i</mi> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <mi>σ</mi> <mrow> <mo>(</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mn>2</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>...</mo> <mo>+</mo> <msubsup> <mi>w</mi> <mrow> <msub> <mi>is</mi> <mi>l</mi> </msub> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <msub> <mi>ts</mi> <mi>l</mi> </msub> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msubsup> <mi>b</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>s</mi> <mrow> <mi>l</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>L</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>$

表示第l层的第j个单元的响应值，j＝1，...，s_l，表示第l+1层的第i个单元的输入，和表示连接深度神经网络第l层的所有s_l个单元和第l+1层的第i个单元之间的参数；具体来讲，表示连接第l层的第j个单元和第l+1层第i个单元之间的参数，为与第l+1层的隐单元i相关的偏差项，s_l+1为第l+1层隐单元的数目，输入层为x_t；因此网络参数

步骤10：利用后向传播算法计算求解目标函数J(θ)关于参数θ的梯度得到

步骤11：根据步骤10中得到的梯度利用梯度下降法对步骤9中的目标函数进行优化，求取目标函数取最小值时候的对应参数θ，利用由此参数确定的神经网络判断新图像是否模糊。

完整全部详细技术资料下载

当前第2页1 2 3