一种基于深度学习的车辆品牌型号精细识别方法与系统与流程

文档序号：12124164阅读：来源：国知局

技术特征：

1.一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：包括以下步骤：

获取原始车辆图像；

对原始车辆图像进行空间金字塔划分，将原始车辆图像划分为三个层次共21个图像块，所述三个层次中图像块的数量分别是1、4以及16个；

采用改进的卷积神经网络对划分后的各个图像块进行特征提取，得到各个图像块的特征向量，所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层；

根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量；

将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。

2.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X，所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y，其中，s3是卷积层输入二维特征图的数量，s1×s2是卷积层输入二维特征图的大小，t3是卷积层输出的二维特征图的数量，t1×t2是卷积层输出的二维特征图的大小，输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到，所述卷积层输出与输入的关系表达式为：式中，x_i是卷积层第i个输入二维特征图，y_j是卷积层第j个输出的二维特征图，代表卷积操作，k_ij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数，k_ij由卷积神经网络训练得到，f(·)是激活函数，激活函数f(v)的表达式为：f(v)＝max(0,v)。

3.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述平均池化层的计算公式为：

$<mrow> <msub> <mi>y</mi> <mrow> <mi>c</mi> <mo>,</mo> <mi>d</mi> <mo>,</mo> <mi>e</mi> </mrow> </msub> <mo>=</mo> <munder> <mo>Σ</mo> <mrow> <mi>p</mi> <mo>,</mo> <mi>q</mi> </mrow> </munder> <msub> <mi>α</mi> <mrow> <mi>p</mi> <mo>,</mo> <mi>q</mi> </mrow> </msub> <msub> <mi>b</mi> <mrow> <mi>c</mi> <mo>+</mo> <mi>p</mi> <mo>,</mo> <mi>d</mi> <mo>+</mo> <mi>q</mi> <mo>,</mo> <mi>e</mi> </mrow> </msub> <mo>,</mo> </mrow>$

其中，y_c,d,e表示平均池化层第e个输出特征图中坐标为c，d的像素值，b_{c+p，d+q，e}表示平均池化层第e个输入特征图中坐标为(c+p),(d+q)的像素值，α_p,q是一个大小为f1×f2且值为1/(f1×f2)的平均池化层滤波器，f1和f2均为7，p和q的取值范围分别为和所述平均池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到；

所述最大池化层的计算公式为：

y_g,h,k＝max(b_{g-p′,h-q′,k},b_{g-p′+1,h-q′+1,k},...,b_{g+p′,h+q′,k})，其中，y_g,h,k表示最大池化层第k个输出特征图中坐标为g，h的像素值，b_{g-p′,h-q′,k}表示最大池化层第k个输入特征图中坐标为(g-p′)，(h-q′)的像素值，b_{g+p′,h+q′,k}表示最大池化层第k个输入特征图中坐标为(g+p′)，(h+q′)的像素值，f11和f22分别为最大池化层滤波器的两个设定大小参数，所述最大池化层的输入特征图和输出特征图由各个图像块的像素点进行卷积运算得到。

4.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述架构层先分别通过3个1×1卷积模板和1个3×3最大池化模板一分为四，然后分别与1、3×3卷积模板、5×5卷积模板和1×1卷积模板进行卷积运算，最后再将这四个卷积运算的结果进行堆叠。

5.根据权利要求1所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量这一步骤，其包括：

根据每个图像块的特征向量计算每个图像块的最终表达向量，所述每个子区域的最终表达向量计算公式为：

F_t＝W_t*U_t，

其中，U_t为第t个图像块的特征向量，F_t为第t个图像块的最终表达向量，W_t为第t个图像块的权重，t＝1，2，…，21；所述图像块的编号t的编号规则为：第一个层次的1个图像块编号t＝1，第二个层次的4个图像块的编号t按自左向右以及自上而下的顺序依次为2,3,4,5；第三个层次的16个图像块的编号t按自左向右以及自上而下的顺序依次为6,7,…，21；

把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。

6.根据权利要求5所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述21个图像块的权重集合W的表达式为：

W＝{w|w＝W_t}＝{3,1,1,3,3,1,1,1,1,1,1,1,1,3,3,3,3,3,3,3,3}。

7.根据权利要求1-6任一项所述的一种基于深度学习的车辆品牌型号精细识别方法，其特征在于：所述多类线性支持向量机分类器的参数采用one-vs-rest的方法训练得到。

8.一种基于深度学习的车辆品牌型号精细识别系统，其特征在于：包括：

获取模块，用于获取原始车辆图像；

空间金字塔划分模块，用于对原始车辆图像进行空间金字塔划分，将原始车辆图像划分为三个层次共21个图像块，所述三个层次中图像块的数量分别是1、4以及16个；

特征提取模块，用于采用改进的卷积神经网络对划分后的各个图像块进行特征提取，得到各个图像块的特征向量，所述改进的卷积神经网络包括卷积层、最大池化层、架构层和平均池化层；

最终表达向量获取模块，用于根据各个图像块的特征向量采用权值空间金字塔的方法得到车辆图像的最终表达向量；

识别模块，用于将车辆图像的最终表达向量送入预先训练好的一个多类线性支持向量机分类器中进行车辆品牌型号识别。

9.根据权利要求8所述的一种基于深度学习的车辆品牌型号精细识别系统，其特征在于：所述卷积层的输入为一个s1×s2×s3大小的三维矩阵X，所述卷积层的输出为一个t1×t2×t3大小的三维矩阵Y，其中，s3是卷积层输入二维特征图的数量，s1×s2是卷积层输入二维特征图的大小，t3是卷积层输出的二维特征图的数量，t1×t2是卷积层输出的二维特征图的大小，输入二维特征图和输出的二维特征图由各个图像块的像素点进行卷积运算得到，所述卷积层输出与输入的关系表达式为：式中，x_i是卷积层第i个输入二维特征图，y_j是卷积层第j个输出的二维特征图，代表卷积操作，k_ij表示第j个输出的二维特征图对应第i个输入二维特征图的二维卷积核参数，k_ij由卷积神经网络训练得到，f(·)是激活函数，激活函数f(v)的表达式为：f(v)＝max(0,v)。

10.根据权利要求8或9所述的一种基于深度学习的车辆品牌型号精细识别系统，其特征在于：所述最终表达向量获取模块包括：

计算单元，用于根据每个图像块的特征向量计算每个图像块的最终表达向量，所述每个子区域的最终表达向量计算公式为：

F_t＝W_t*U_t，

连接单元，用于把每个图像块的最终表达向量按顺序连接起来组成车辆图像的最终表达向量。

完整全部详细技术资料下载

当前第2页1 2 3