基于卷积神经网络的快速目标检测方法_2

文档序号：8259598阅读：来源：国知局

其中％表示所选择输入特征图的索引；1表示当前层的索引；i和j分别表示输入和输出特征图索引；〇表示段索引；f表示激活函数，这里使用线性校正单元函数f(x)= max(X，0) ;*表示卷积操作；最大池化层写成公式二的形式：
其中，m和n分别表不当前层的像素索引；s表不下米样核的大小；p和q分别表不前一层的像素索引，并且满足P=s*(m-l)+k+l,q=s*(n-l)+k+l，其中0 <k<s;分号用于选择对应的列和行；为了使得获得的特征具有鲁邦的性质，把局部对比归一化层引入分段处理的环节中，该层写成公式三的形式：
其中，r表示制定的邻近竞争特征图的数目，N表示当前层总共的特征图数目，k，a，0 是一些超参数，在训练过程中指定合适的浮点数值，当CNN模型训练好后，根据以上三个公式，获取判别完备特征为后续的基于平滑窗扫描提供支撑； D) 把卷积神经网络的全连接看成一个线性分类器，直接基于判别完备特征图做检测，采用可能近似学习框架来估计线性分类器在判别完备特征上的泛化误差R[ ?]，然后根据组合模型和所期望泛化误差H[?]计算所需要训练模型数目q;
E) 将q个模型中得每一个训练模型分别在待检测图像上执行前馈操作，每一个模型获取〇组全连接前的判别完备特征图，然后用最近邻插值算法对每组判别完备特征图缩放，得到n*o组判别完备特征图，q个模型共计n*o*q组判别完备特征图，然后在每组判别完备特征图上直接用线性分类器执行密集平滑窗分类工作得到n*o*q组响应图，其中线性分类器和判别完备图的点积操作转成卷积操作； F) 对n*o*q中的每〇组响应图采用非极大值得到n*q组响应图，然后对n*q响应图中的每n个响应图执行非极大值抑制得到q组具有真实尺度的响应图，把q组响应图执行与运算得到一个具有真实尺度的最终响应图，计算最终响应图中的每一个联通区域的质心： G) 把质心和真实尺度映射到原待检测图中，根据每一个质心位置和尺度值画出对应的矩形框，完成目标检测。
2. 如权利要求1所述基于卷积神经网络的快速目标检测方法，其特征在于在步骤A) 中，所述准备训练样本集包括以下子步骤： A1)从训练图像提取给定目标框的图像块，然后缩放到固定大小尺寸作为正样本，每一个给定目标框的图像块作为一个样本，得到队个图像块，即&个样本Xpi= 1，……N; A2)对于负样本的图像的获取，一般在正样本图像块周围抽取与其没有很大重叠的、任意大小的图像块缩放到固定尺寸作为负样本\，负样本共计抽取&负样本，i= 1，……N; A3)N=N〇+N1〇
3. 如权利要求1所述基于卷积神经网络的快速目标检测方法，其特征在于在步骤B) 中，所述利用m批样本进行卷积神经网络训练包括以下子步骤： Bl)N个样本在分批的时候需要随机的打散顺序，然后分成m批样本； B2)卷积神经网络包含卷积层、最大池化层和局部对比归一化层三个成分，前两个成分是必需成分，第三个成分是根据任何可选的成分，卷积的激活函数选用非线性校正单元，通过任意组合这三种成分得到针对不同目标检测的网络结构； B3)设置网络结构中所需要的滤波器数目和特征图数目、滤波器大小、下采样核的大小、每层的学习率以及局部对比归一化所需要的超参数； B4)在卷积神经网络训练的过程中，采用冲量和随机扔掉训练技巧； B5)根据验证曲线判断何时停止训练； B6)从已训练好的模型中提取参数W。
4. 如权利要求1所述基于卷积神经网络的快速目标检测方法，其特征在于在步骤C) 中，所述采用扩展图的方式解决卷积神经网络中最大池化丢失信息的问题包括以下子步骤： C1)把步骤B)中提取的W用于待检测图像的前馈操作过程中，对于每一个特征图遇到max-pooling丢失判别信息的情况时，针对下采样核的大小K中每一个偏移都作为一个新的起点偏移，然后平铺满下采样核至整个待检测图像，每一个起点偏移都得到一个扩展图，当前下采样层会生成2K个扩展图，所有特征图使用同一个偏移得到的扩展图称为一段，下采样后会生成2K段的特征图，整个网络中若有p层下采样层，则得到〇 = (2K)P段的特征图； C2)下采样后续的卷积操作，需要对每段采用相同的卷积操作； C3)局部对比归一化层需要对每段采用相同的局部对比归一化操作； C4)在对待测试图像执行到前馈操作的过程中，全连接层前一层得到的（21?广段的特征图称为判别完备特征图。
5.如权利要求1所述基于卷积神经网络的快速目标检测方法，其特征在于在步骤D) 中，所述直接基于判别完备特征图做检测包括以下子步骤： D1)将步骤C)中⑵广段的特征图全部使用最近邻插值算法n次，得到n*(2K)p段的判别完备特征图； D2)在每段判别完备特征图上用线性分类器与其做卷积得到n*(2K)p的响应图； D3)把n*(2K)%^响应图全部缩放到同一尺寸并记录缩放比，用非极大值抑制算法得到最终响应图和对应最大响应图的缩放比。
【专利摘要】基于卷积神经网络的快速目标检测方法，涉及计算机视觉技术。首先利用训练集训练出卷积神经网络参数，然后利用扩展图的方式解决最大池化丢失特征的问题并生成判别完备特征图；把卷积神经网络的全连接权重看成线性分类器，采用可能近似学习框架来估计线性分类器在判别完备特征上的泛华误差；根据泛华误差和所期望泛化误差阈值来估算所需线性分类器个数，最后在判别完备特征图上用线性分类器于平滑窗的方式完成目标检测。显著提高检测效率和目标检测精度。
【IPC分类】G06K9-62
【公开号】CN104573731
【申请号】CN201510061852
【发明人】王菡子, 郭冠军, 严严
【申请人】厦门大学
【公开日】2015年4月29日
【申请日】2015年2月6日

完整全部详细技术资料下载

当前第2页1 2