基于深度卷积神经网络的无价值图像去除方法

文档序号:6625159阅读:691来源:国知局
基于深度卷积神经网络的无价值图像去除方法
【专利摘要】本发明涉及一种基于深度卷积神经网络的无价值图像去除方法,首先对图像样本集合白化预处理后,利用稀疏自编码器进行预训练,得到深度卷积网络参数的初始化结果;其次,构建多层深度卷积神经网络,逐层优化网络参数;最后实现多分类的softmax模型对多类问题进行分类,实现无价值图像的去除。由于稀疏自编码器自动学习图像特征,因而提高了本发明的分类正确率。在稀疏自编码器自动学习图像特征的基础之上,构建多层深度卷积神经网络,逐层优化网络参数,每层学习后的特征都是前一层特征的组合结果,训练多分类的softmax模型对图像进行判定,实现无价值图像的去除。
【专利说明】基于深度卷积神经网络的无价值图像去除方法

【技术领域】
[0001]本发明涉及航拍图像处理方法,具体涉及为一种基于深度卷积神经网络的无价值图像去除方法。

【背景技术】
[0002]自动、准确地从航拍视频中检测到有价值的目标,去除无价值图像,具有非常重要的意义。现有的无价值图像去除方法主要有:基于统计分析的分类方法和人工神经网络的方法。文献“From Local Similarity to Global Coding ;An Applicat1n to ImageClassificat1n, CVPR,2013, p2794_2801”提出了一种将局部特性与全局结构信息相结合图像分类算法,以此来去除无价值图像。此方法采用手工选择局部特征的类型,同时构建所有数据在此类特征上的编码字典;对原始图像进行金字塔分解,在每一层金字塔对应的图像利用编码字典进行编码和池化;将各层的池化结果连接后输入到线性分类器进行判决,从而实现无价值图像的去除。但是,在手工选择局部特征类型的阶段,必须指定局部特征,不能完整地表达图像所包含的信息,具有局限性且抗噪性差。


【发明内容】

[0003]要解决的技术问题
[0004]为了避免现有的无价值图像去除方法大多易受特征提取的影响,且局部特征所包含的图像信息具有局限性,分类正确率低,本发明提出一种基于深度卷积神经网络的无价值图像去除方法。
[0005]技术方案
[0006]一种基于深度卷积神经网络的无价值图像去除方法,其特征在于步骤如下:
[0007]步骤1:对图像样本进行归一化后合并为矩阵patches,行数为row, row = mXn,m, η为归一化的大小,列数为样本数量k,对矩阵patches进行零均值化处理:
[0008]

【权利要求】
1.一种基于深度卷积神经网络的无价值图像去除方法,其特征在于步骤如下: 步骤1:对图像样本进行归一化后合并为矩阵patches,行数为row, row = mXn,m, η为归一化的大小,列数为样本数量k,对矩阵patches进行零均值化处理:
图像样本与均值矩阵相减存入patches,计算协方差矩阵sigma:
对协方差矩阵进行SVD分解得到U,S,V矩阵,计算ZCA白化矩阵:
其中,diag()表示构造协方差矩阵的对角矩阵,sqrt表示求均方根,eplison为正则化参数,将patches与ZCA相乘得到白化预处理后的图像数据,作为稀疏自编码器的输入;步骤2:计算稀疏自编码器的损失函数:
其中,X为图像样本的输入特征,I为输出值,Vb(X)是输入为X时的假设输出,是连接第I层j单元和第1+1层i单元的权值参数,是第1+1层i的偏置项,S1是第I层的单元数目,Ii1是网络中的层数,λ是权重衰减稀疏,P为稀疏值,&为隐藏单元i的平均激活度,β是稀疏值惩罚项的权重; 对损失函数求偏导数,加入稀疏性的第I层第i个神经元节点的误差表达式为:
/(O是激活函数f (ζ) =tanh(z)的求导,#是第I层i单元所有输入的加权和;采用拟牛顿法中的BFGS优化出Jsparee (W,b)最小时的W和b,输出W和b作为多层深度卷积神经网络中卷积层的权重和偏置的初始化值; 步骤3:构建包含C1卷积层、S2降采样层、C3卷积层、S4降采样层和softmax分类层的多层深度卷积神经网络,输入图像在C1卷积层上进行卷积后产生特征映射图,然后特征映射图通过S2降采样层对像素进行求和、加权值、加偏置,之后再通过C3卷积层进行卷积和S4降采样层进行像素求和、加权值、加偏置,最终将得到的像素值光栅化连接成一个向量输入到softmax分类层; 所述的卷积使用的公式:
Mj表示选择的输入映射图的集合,表示W的第I层第i个神经元节点到第1+1层第j个节点的权值,€表示b的第I层到第1+1层第j个节点的偏置,4是第I层的输出特征图的第j个分量; 所述的降采样层使用的公式:
down(.)表示一个降采样函数,/4为乘性偏置,€为加性偏置;步骤4:利用softmax分类层的假设函数
对特征向量X中的每一个类别j估算出概率值P (y = j IX),输出一个K维的向量表示这K个估计的概率值:
其中,Q1, θ2,...,θκ是训练模型参数,y(i) e {1,2,...,K},
表示对概率分布进行归一化; 计算特征向量X为类别j的概率:
添加一个权重衰减项来修改代价函数:
η为特征向量X的维度,1{.}为示性函数,对代价函数求导得:
用梯度下降法最小化J( Θ )实现softmax分类模型,去除无价值图像。
2.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的eplison取0.1。
3.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的λ取值为0.003。
4.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的P取值为0.035。
5.根据权利要求1所述的基于深度卷积神经网络的无价值图像去除方法,其特征在于所述的β取值为5。
【文档编号】G06K9/62GK104200224SQ201410431220
【公开日】2014年12月10日 申请日期:2014年8月28日 优先权日:2014年8月28日
【发明者】张艳宁, 杨涛, 屈冰欣 申请人:西北工业大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1