一种基于深度学习的模糊图像检测方法与流程

文档序号:11920553阅读:来源:国知局

技术特征:

1.一种基于深度学习的模糊图像检测方法,它包含以下步骤:

步骤1:任意选取摄像头采集的N1+N2幅同类数字图像其中既包含模糊图像也包含清晰图像,代表第t幅大小为M×N的图像;

步骤2:对步骤1中得到的N1+N2幅数字图像根据其模糊与否进行人工标定,若第t幅图像为模糊图像,则令其对应的标定变量yt=1,否则yt=-1;

步骤3:对于每一幅输入数字图像It,It(m,n)表示其中任意一像素点的灰度值,(m,n)为该像素点的坐标位置,进行It与算子(-1)m+n的相乘运算以保证傅里叶变换之后的零频部分位于频谱图像的中心,得到

步骤4:对每一变换后的图像进行二维离散傅里叶变换,

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>F</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <munderover> <mo>&Sigma;</mo> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </munderover> <msub> <msup> <mi>I</mi> <mo>&prime;</mo> </msup> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mi>m</mi> <mo>,</mo> <mi>n</mi> <mo>)</mo> </mrow> <msup> <mi>e</mi> <mrow> <mo>-</mo> <mi>j</mi> <mn>2</mn> <mi>&pi;</mi> <mrow> <mo>(</mo> <mfrac> <mrow> <mi>u</mi> <mi>m</mi> </mrow> <mi>M</mi> </mfrac> <mo>+</mo> <mfrac> <mrow> <mi>v</mi> <mi>n</mi> </mrow> <mi>N</mi> </mfrac> <mo>)</mo> </mrow> </mrow> </msup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>u</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> <mtd> <mrow> <mi>v</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>

其中Ft(u,v)表示I′t的二维离散傅里叶变换,u,v为傅里叶变换后的空间坐标,进而得到总体频谱图|Ft|;

步骤5:将频谱图|Ft|做下采样,下采样的比例根据图像大小决定,下采样后频谱图的宽度和高度都不超过50个点,向量化下采样后频谱图得到向量ht

步骤6:计算每一图像的倒谱

其中代表反傅里叶反变换,|Ft(u,v)|为第t幅图像傅里叶变换Ft(u,v)的模,倒谱具体表达式为:

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>C</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>m</mi> <mo>,</mo> <mi>n</mi> </mrow> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mi>M</mi> <mi>N</mi> </mrow> </mfrac> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>u</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>M</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <msubsup> <mi>&Sigma;</mi> <mrow> <mi>v</mi> <mo>=</mo> <mn>0</mn> </mrow> <mrow> <mi>N</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mi>log</mi> <mo>|</mo> <msub> <mi>F</mi> <mi>t</mi> </msub> <mrow> <mo>(</mo> <mrow> <mi>u</mi> <mo>,</mo> <mi>v</mi> </mrow> <mo>)</mo> </mrow> <mo>|</mo> <msup> <mi>e</mi> <mrow> <mi>j</mi> <mn>2</mn> <mi>&pi;</mi> <mrow> <mo>(</mo> <mrow> <mfrac> <mrow> <mi>u</mi> <mi>m</mi> </mrow> <mi>M</mi> </mfrac> <mo>+</mo> <mfrac> <mrow> <mi>v</mi> <mi>n</mi> </mrow> <mi>N</mi> </mfrac> </mrow> <mo>)</mo> </mrow> </mrow> </msup> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>m</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>M</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> <mtd> <mrow> <mi>n</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mn>1</mn> <mo>,</mo> <mn>...</mn> <mo>,</mo> <mi>N</mi> <mo>-</mo> <mn>1</mn> <mo>;</mo> </mrow> </mtd> </mtr> </mtable> </mfenced>

步骤7:将倒谱图Ct做下采样,下采样的比例根据图像大小决定,下采样后倒谱图的宽度和高度都不超过50个点,向量化下采样倒谱图得到向量st

步骤8:对于每一图像由频谱向量ht和倒谱向量st构成模糊特征xt=[ht;st];

步骤9:设计深度分类网络,为已有图像的模糊特征和对应是否清晰的标签,定义目标函数为

<mrow> <mi>J</mi> <mrow> <mo>(</mo> <mi>&theta;</mi> <mo>)</mo> </mrow> <mo>=</mo> <mo>-</mo> <mfrac> <mn>1</mn> <mrow> <msub> <mi>N</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>N</mi> <mn>2</mn> </msub> </mrow> </mfrac> <munderover> <mo>&Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <msub> <mi>N</mi> <mn>1</mn> </msub> <mo>+</mo> <msub> <mi>N</mi> <mn>2</mn> </msub> </mrow> </munderover> <mo>{</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mi>log</mi> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <msub> <mi>y</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mrow> <mo>(</mo> <mn>1</mn> <mo>-</mo> <mi>y</mi> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> <mo>)</mo> </mrow> <mo>}</mo> <mo>+</mo> <mfrac> <mi>&lambda;</mi> <mn>2</mn> </mfrac> <mo>|</mo> <mo>|</mo> <mi>&theta;</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>

其中θ是网络参数,λ是控制约束项强弱的因子,y(xt)为样本xt属于模糊图像的概率p(yt=+1|xt,θ),对应的表达式为:

<mrow> <mi>y</mi> <mrow> <mo>(</mo> <msub> <mi>x</mi> <mi>t</mi> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mrow> <mn>1</mn> <mo>+</mo> <mi>exp</mi> <mrow> <mo>(</mo> <msup> <mi>w</mi> <mi>T</mi> </msup> <msubsup> <mi>h</mi> <mi>t</mi> <mrow> <mo>(</mo> <mi>L</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

为深度网络最后一个隐层的节点构成的向量,sL为最后一隐层节点的数目,w为最后一层的参数向量,L为网络隐层总的层数;网络往前每一层的节点单元由上一层的节点单元和网络参数决定

<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mi>i</mi> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <mo>=</mo> <mi>&sigma;</mi> <mrow> <mo>(</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mn>1</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mn>1</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msubsup> <mi>w</mi> <mrow> <mi>i</mi> <mn>2</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <mi>t</mi> <mn>2</mn> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>...</mo> <mo>+</mo> <msubsup> <mi>w</mi> <mrow> <msub> <mi>is</mi> <mi>l</mi> </msub> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>+</mo> <mn>1</mn> <mo>)</mo> </mrow> </msubsup> <msubsup> <mi>h</mi> <mrow> <msub> <mi>ts</mi> <mi>l</mi> </msub> </mrow> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>+</mo> <msubsup> <mi>b</mi> <mi>i</mi> <mrow> <mo>(</mo> <mi>l</mi> <mo>)</mo> </mrow> </msubsup> <mo>)</mo> </mrow> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <msub> <mi>s</mi> <mrow> <mi>l</mi> <mo>+</mo> <mn>1</mn> </mrow> </msub> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>l</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> <mo>...</mo> <mo>,</mo> <mi>L</mi> <mo>-</mo> <mn>1</mn> </mrow> </mtd> </mtr> </mtable> </mfenced>

表示第l层的第j个单元的响应值,j=1,...,sl表示第l+1层的第i个单元的输入,表示连接深度神经网络第l层的所有sl个单元和第l+1层的第i个单元之间的参数;具体来讲,表示连接第l层的第j个单元和第l+1层第i个单元之间的参数,为与第l+1层的隐单元i相关的偏差项,sl+1为第l+1层隐单元的数目,输入层为xt;因此网络参数

步骤10:利用后向传播算法计算求解目标函数J(θ)关于参数θ的梯度得到

步骤11:根据步骤10中得到的梯度利用梯度下降法对步骤9中的目标函数进行优化,求取目标函数取最小值时候的对应参数θ,利用由此参数确定的神经网络判断新图像是否模糊。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1