基于非下采样Contourlet变换和卷积神经网络的图像分类方法与流程

文档序号：14474727阅读：1429来源：国知局

本发明涉及图像分类领域，具体地说是一种基于非下采样contourlet变换和卷积神经网络的图像分类方法。

背景技术：

图像分类是根据图像目标或者场景，在图像反映出来的不同特征对图像进行识别和分类，其目的是使得计算机能识别已知一副图像的所属分类，从而进一步对图像进行理解。基于卷积神经网络的图像分类技术由于其较高的识别效果，受到研究者的高度重视。

卷积神经网络的主要目标是学习分级的图像特征，所谓分级，指的是特征从底层的像素输入到高层的复杂函数映射。通常情况下，为了得到充分的分级特征，需要通过增加隐层数和神经元个数来增加卷积神经网络模型的学习能力，这就导致神经网络要学习的参数非常多，较多的参数会导致整个网络的训练时间变得很长，严重影响参数的调节。另外，过多的训练样本亦会导致模型的过拟合现象。因此，在进行网络学习前，如何提取图像特征是制约和提高分类系统性能的关键点。

技术实现要素：

本发明是为了解决现有技术所存在的上述技术问题，提供一种基于非下采样contourlet变换和卷积神经网络的图像分类方法。

本发明的技术解决方案是：一种基于非下采样contourlet变换和卷积神经网络的图像分类方法，其特征在于按照如下步骤进行：

步骤1：将自然图像分解为rgb三种不同的通道，分别对每个通道中的图像进行非下采样contourlet变换：

（1）

其中，表示近似的rgb通道图像；为每个通道的contourlet系数；为对应的变换矩阵；和分别为contourlet变换的分解层数和方向子带的个数。

步骤2：利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样contourlet变换中每个系数的特征描述子，其中均值池化过程如下：

（2）

其中，表示某个rgb通道；为每个rgb通道中待池化区域的索引项；和分别表示源图像和池化区域的大小；采用最大池化方法对上述系数进行处理：

（3）

得到最终的特征描述子，形成卷积神经网络中待输入的维映射图。

步骤3：利用卷积神经网络对上述特征描述子进行学习，其中每一层的具体描述如下：

步骤3.1：卷积层：采用大小为、步长为、特征图为的卷积核，对应的输出结果为：

（4）

其中，为多维的滤波器组，对应的核权值和偏差分别为和；

步骤3.2：池化层：采用均值-最大池化相混合的方法对上述卷积结果进行下采样：

（5）

（6）

步骤3.3：正则化：进一步地，采用如下修正线性单元激活函和局部响应正则化以增加网络模型的非线性：

（7）

（8）

本专利设置、；

步骤3.4：全连接层：将学到的特征映射到样本标记空间，即将前层的结果转化为卷积核为的卷积。

步骤3.5：分类层：利用softmax激活函数进行预测，将图像分为4或者5类。

本发明利用非下采样contourlet变换对rgb图像进行处理，首先捕捉到图像的平移或旋转等刚性变换，获得rgb图像的变换域特征描述；然后在此基础上构建卷积神经网络的分类模型，对rgb图像进行分类。本发明不仅可以避免大量参数的学习过程，还可以简化后续网络参数的学习。

与现有技术相比，本发明具有以下优点：

第一.结合了rgb通道的非下采样contourlet变换，由于contourlet变换的紧凑表达能力，所提模型的分类性能得到提升，同时也大幅度的降低了模型的训练时间。考虑到contourlet变换的不变和稳定能力，可以消除图像中的平移或者旋转变化，从而简化卷积神经网络的学习。第二.为了获取自然图像中较复杂的未知信息，在变换系数之上构建深度学习网络，可以实现从复杂图像中学习捕捉contourlet变换无法描述的其它复杂信息。

附图说明

图1为本发明实施例进行图像分类的结构信息示意图。

图2为本发明实施例在试验过程中所使用的图像数据库。

图3为本发明实施例在进行food-101数据库试验中的卷积层结果。

图4为本发明实施例在进行food-101和sun数据库中的boxplot分类结果示意图。

图5为本发明实施例在进行food-101和sun数据库中的运行时间统计结果示意图。

图6为本发明实施例在进行food-101和sun数据库中不同的图像数量对分类准确率的统计结果示意图。

具体实施方式

本发明的基于非下采样contourlet变换和卷积神经网络的图像分类方法，按照如下步骤进行；

步骤1：将自然图像分解为rgb三种不同的通道，分别对每个通道中的图像进行非下采样contourlet变换：

（1）

其中，表示近似的rgb通道图像；为每个通道的contourlet系数；为对应的变换矩阵；和分别为contourlet变换的分解层数和方向子带的个数。

步骤2：利用类似于卷积神经网络中均值-最大池化方法计算基于非下采样contourlet变换中每个系数的特征描述子，其中均值池化过程如下：

（2）

其中，表示某个rgb通道；为每个rgb通道中待池化区域的索引项；和分别表示源图像和池化区域的大小；采用最大池化方法对上述系数进行处理：

（3）

得到最终的特征描述子，形成卷积神经网络中待输入的维映射图

。

步骤3：利用卷积神经网络对上述特征描述子进行学习，其中每一层的具体描述如下：

步骤3.1：卷积层：采用大小为、步长为、特征图为的卷积核，这也是卷积层中最重要的设计环节，对应的输出结果为：

（4）

其中，为多维的滤波器组，对应的核权值和偏差分别为和；

步骤3.2：池化层：采用均值-最大池化相混合的方法对上述卷积结果进行下采样：

（5）

（6）

步骤3.3：正则化：进一步地，采用如下修正线性单元激活函和局部响应正则化以增加网络模型的非线性：

（7）

（8）

本专利设置、；

步骤3.4：全连接层：将学到的特征映射到样本标记空间，即将前层的结果转化为卷积核为的卷积。

步骤3.5：分类层：利用softmax激活函数进行预测，将图像分为4或者5类。

图1为本发明实施例进行图像分类的结构信息示意图。

图2为本发明实施例在试验过程中所使用的图像数据库，（a）是sun数据库，（b）是food-101数据库。

图3为本发明实施例在进行food-101数据库试验中的卷积层结果，图3

中(a)原测试图像的卷积层，(b)基于contourlet变换后图像的卷积层。

图4为本发明实施例在进行food-101和sun数据库中的boxplot分类结果示意图，图4中(a)不同尺度，(b)不同分解层。

图5为本发明实施例在进行food-101和sun数据库中的运行时间统计结果示意图，图5中（a）不同分解尺度下的运行时间，(b)不同方法的运行时间。

图6为本发明实施例在进行food-101和sun数据库中不同的图像数量对分类准确率的统计结果示意图。

结果表明：本发明不仅可以避免大量参数的学习过程，还可以简化后续网络参数的学习。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：方玲玲;王相海
技术所有人：辽宁师范大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。