一种基于优化卷积架构的图像目标识别方法

文档序号:6638502阅读:215来源:国知局
一种基于优化卷积架构的图像目标识别方法
【专利摘要】本发明公开了一种基于优化卷积架构的图像目标识别方法,该方法首先对输入图像进行采集和增强处理形成样本;然后基于优化的卷积架构对样本进行训练;最后用训练后的卷积架构对图像目标进行分类识别。其中,卷积架构的优化包括:ReLU激活函数;局部响应归一化;卷积区重叠合并;神经元连接Drop-out技术;启发式学习。与现有技术相比,本发明能够扩充带标签样本,支持较多对象分类并获得较快的训练收敛速度和较高的图像目标识别率,并具备更高的鲁棒性。
【专利说明】一种基于优化卷积架构的图像目标识别方法

【技术领域】
[0001] 本发明属于图像分析识别【技术领域】,具体涉及一种基于优化卷积架构的图像目标 识别方法。

【背景技术】
[0002] 目前,模式识别作为机器学习中的热门研宄领域,随着计算机网络图像数据的海 量出现越来越受到重视。为了有效管理图像数据并更好的为用户服务,图像目标的自动识 别变得尤为重要。
[0003] 传统的图形识别方法如SVM(Support Vector Machine,支持向量机)、Boosting主 要是通过提取图像的特征再进行分类识别。卷积神经网络则是一种基于监督的深度学习模 型,实质是模拟人脑机制构建具有多隐层的学习网络,其"感受野"和权值共享的网络结构 降低了模型复杂度,并对平移、缩放、倾斜等变形具有高度不变性。以图像直接作为网络输 入,卷积神经网络通过逐层特征变换来学习更抽象的特征表达以达到分类识别的目的。
[0004] Yann LeCun提出卷积神经网络是一种基于监督的深度学习模型,实质是模拟人脑 机制构建具有多隐层的学习网络,其"感受野"和权值共享的网络结构降低了模型复杂度, 并对平移、缩放、倾斜等变形具有高度不变性。具体而言,卷积神经网络包括卷积层、采样 层、全连接层和输出层。其中,卷积层以图像直接作为网络输入,通过与不同的卷积滤波器 卷积得到多个特征图。特征图经降采样操作降低维数并通过激活函数得到采样层。采样层 输出直接作为下一卷积层的输入,这一卷积、采样操作可重复多次。全连接层以最高卷积层 的特征为输入并映射为向量输出。输出层则是一个C-类的softmax分类器。
[0005] 卷积神经网络应用于手写数字开始,基于卷积神经网络的图像分类技术已经应用 于车型、人脸等识别任务上,并在训练收敛速度和识别率取得了较好的效果。尽管如此,目 前卷积神经网络在模式识别中的应用还存在以下缺陷:
[0006] 第一,尽管当前图像数据海量,但由于基于监督的学习方式其训练数据需要带标 签,使当前卷积神经网络应用的分类对象较少且受限于训练库。
[0007] 第二,在对较多图像类别进行识别时,卷积神经网络规模相应增大,其待训练参数 大幅增长,容易出现过拟合现象。
[0008] 第三,卷积神经网络对新的对象识别任务的可移植性不强,即在面对未知复杂的 图像识别对象时,训练收敛速度和目标识别率上很难以让用户满意。


【发明内容】

[0009] 针对现有技术所存在的上述技术问题,本发明提供了一种基于优化卷积架构的图 像目标识别方法,能够扩充带标签样本,支持较多对象分类并获得较快的训练收敛速度和 较高的图像目标识别率。
[0010] 一种基于优化卷积架构的图像目标识别方法,包括如下步骤:
[0011] (1)对输入的样本图像进行图像增强处理;
[0012] (2)利用处理后得到的样本图像对卷积神经网络进行优化训练;
[0013] (3)输入目标图像至训练好的卷积神经网络中,以对该目标图像进行分类识别。 [0014] 所述的样本图像来自目前图像识别领域最大且语义学上分类最全的训练库 ImageNet0
[0015] 所述的步骤(1)中对样本图像进行图像增强处理的具体过程如下:
[0016] I. 1图像平移和翻转:在样本图像四周和中心分别提取固定大小的图像块并做水 平翻转,以得到扩增10倍的图像训练集;
[0017] 1. 2图像的RGB颜色通道强度变更:对于每一样本图像,在对图像RGB像素值做 PCA处理后,通过以下算式将像素各通道主成份倍乘对应标准高斯随机量化的特征值,将结 果添加到原始的RGB通道分量上,以改变像素的颜色强度:
[0018] Ixy - [R xy, Gxy, Bxy] + [PR, PG, PB] [ a R λ R,a G λ G, a B 入 B]
[0019] 其中:Ixy为任一像素变更后的颜色强度,Rxy、G xy、Bxy对应为该像素变更前对应红 色、绿色、蓝色三个通道上的颜色强度值,PjP λ κ分别为颜色强度值Rxy对应的3X3协方 差矩阵的特征向量和特征值,Pe和λ e分别为颜色强度值Gxy对应的3X3协方差矩阵的特 征向量和特征值,PjP λ B分别为颜色强度值Bxy对应的3X3协方差矩阵的特征向量和特 征值,aK、a e、αΒ均为标准正太分布下产生的随机变量值。
[0020] 所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,通过卷积滤波器对 输入进行卷积操作提取特征时,为使卷积架构充分利用同一特征核映射图邻近神经元的信 息,采取减少降采样步进的方式,使降采样区域部分重叠的方法进行卷积。
[0021] 所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,特征图在降采样处 理后,对图像中神经元输出采用ReLU(修正线性单元)作为建模激活函数,函数的具体表达 如下:
[0022] f (X) = max (0, X)
[0023] 其中:x为函数的输入,f(x)表示为神经元输出。
[0024] 所述的步骤(2)在对卷积神经网络架构进行优化训练过程中,在卷积层根据以下 算式对卷积滤波器输出得到的多个特征图进行归一化处理:
[0025]

【权利要求】
1. 一种基于优化卷积架构的图像目标识别方法,包括如下步骤: (1) 对输入的样本图像进行图像增强处理; (2) 利用处理后得到的样本图像对卷积神经网络进行优化训练; (3) 输入目标图像至训练好的卷积神经网络中,以对该目标图像进行分类识别。
2. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的样本图像来自目前 图像识别领域最大且语义学上分类最全的训练库ImageNet。
3. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(1)中对样本 图像进行图像增强处理的具体过程如下: 1. 1图像平移和翻转:在样本图像四周和中心分别提取固定大小的图像块并做水平翻 转,以得到扩增10倍的图像训练集; 1. 2图像的RGB颜色通道强度变更:对于每一样本图像,在对图像RGB像素值做PCA处 理后,通过以下算式将像素各通道主成份倍乘对应标准高斯随机量化的特征值,将结果添 加到原始的RGB通道分量上,以改变像素的颜色强度: T Ixy = [Rxy,GXy,BXy] + [PR, PG, PB][a.R XR, OCg Xg, αΒ XB]T 其中:Ixy为任一像素变更后的颜色强度,R xy、Gxy、Bxy对应为该像素变更前对应红色、绿 色、蓝色三个通道上的颜色强度值,匕和λ κ分别为颜色强度值Rxy对应的3X3协方差矩阵 的特征向量和特征值,Pe和λ e分别为颜色强度值G xy对应的3 X 3协方差矩阵的特征向量和 特征值,PjP λ B分别为颜色强度值Bxy对应的3X3协方差矩阵的特征向量和特征值,a κ、 a e、a Β均为标准正态分布下产生的随机变量值。
4. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积 神经网络架构进行优化训练过程中,通过卷积滤波器对输入进行卷积操作提取特征时,为 使卷积架构充分利用同一特征核映射图邻近神经元的信息,采取减少降采样步进的方式, 使降采样区域部分重叠的方法进行卷积。
5. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷 积神经网络架构进行优化训练过程中,特征图在降采样处理后,对图像中神经元输出采用 ReLU(修正线性单元)作为建模激活函数,函数的具体表达如下: f (X) = max (0, X) 其中:x为函数的输入,f(x)表示为神经元输出。
6. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积 神经网络架构进行优化训练过程中,在卷积层根据以下算式对卷积滤波器输出得到的多个 特征图进行归一化处理:
其中:aJP (寸应为第i个和第j个核函数在特征图任一像素位置的神经元响应,b i 对应为Bi归一化后的神经元响应,N为卷积层的核函数总数,k、η、α、β均为由验证集决 定的参数。
7. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积 神经网络架构进行优化训练过程中,对于神经元采用Drop-out技术,将隐层神经元输出以 50%的概率设为零,被丢弃神经元不再参与前向传递和后向传播。
8. 根据权利要求1所述的图像目标识别方法,其特征在于:所述的步骤(2)在对卷积 神经网络架构进行优化训练过程中,采取启发式算法更新学习速率。
【文档编号】G06N3/02GK104517122SQ201410767043
【公开日】2015年4月15日 申请日期:2014年12月12日 优先权日:2014年12月12日
【发明者】王雪姣, 王梁昊, 李东晓, 张明 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1