基于卷积神经网络的车型识别方法及装置与流程

文档序号：12468437阅读：来源：国知局

技术特征：

1.基于卷积神经网络的车型识别方法，其特征在于，该方法包括：

第一步骤，选取已标签车型的样本图像，对卷积神经网络进行训练，获取训练好的车型识别模型；

第二步骤，采集或者输入彩色场景视频图像；

第三步骤，采用加权平均法对每帧彩色场景图像进行灰度化处理，获取每帧灰度场景图像；

第四步骤，采用均值漂移背景更新背景法更新背景图像，计算每帧灰度场景图像与背景图像的差分图像，对差分图像进行中值滤波、连通区域标记、连通区域筛选处理，获取每帧灰度场景图像的感兴趣区域图像；以及

第五步骤，采用训练好的车型识别模型对每帧灰度场景图像的感兴趣区域图像进行分类识别，输出识别结果。

2.如权利要求1所述的方法，其特征在于，所述第一步骤包括：

样本选取步骤，选取LINum1个已标记MNum种车型的灰度图像作为样本图像，选取LINum2个已标记非车辆的灰度图像作为负样本图像；

初步训练步骤，利用卷积神经网络对正样本图像和负样本图像进行训练，获得初步训练车型分类模型；

二次训练步骤，选取TINum个测试图像，根据初步训练车型分类模型对测试图像进行反复训练，直至车型分类模型收敛；

模型输出步骤，将收敛的车型分类模型作为车型识别模型并输出。

3.如权利要求2所述的方法，其特征在于，所述初步训练步骤中卷积神经网络包括：

输入层，输入宽度为Width、高度为Height的灰度图像；

第一层卷积层，输出Th_CK1个卷积核，卷积核的大小为CKSi1*CKSi1、步长为1；

第一层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第二层卷积层，输出Th_CK2个卷积核，卷积核的大小为CKSi2*CKSi2、步长为1；

第二层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第三层卷积层，输出Th_CK3个卷积核，卷积核的大小为CKSi3*CKSi3、步长为1；

第三层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第四层卷积层，输出Th_CK4个卷积核，卷积核的大小为CKSi4*CKSi4、步长为1；

第四层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第五层卷积层，输出Th_CK5个卷积核，卷积核的大小为CKSi5*CKSi5、步长为1；

第一层全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

第二层全连接层，输出MNum+1个神经元，即MNum种车型类别和1种非车辆类别。

4.如权利要求2所述的方法，其特征在于，所述二次训练步骤包括：

训练特征提取步骤，根据初步训练车型分类模型，提取TINum个灰度测试图像的特征；

训练分类判定步骤，计算测试图像的特征与每种车型类别特征的相似度Simi_k，k表示第k种车型类别，k∈{1，2，…，MNum，MNum+1}，选取Simi_k值最大的车型类别作为候选车型类别；

反复训练步骤，计算判定结果与真实结果的误差，利用反向传播算法来训练车型分类模型，重复训练特征提取步骤和训练分类判定步骤，直至车型分类模型收敛。

5.如权利要求2～4所述的方法，所述MNum∈[3，30]，LINum1≥4000，LINum2≥2000，TINum≥1000，Width∈[64,256]，Height∈[64,256]，Th_CK1∈[16,32]，CKSi1为3或者5，KSi∈[2,4]，Th_CK2∈[16,32]，CKSi2为3或者5，Th_CK3∈[32,64]，CKSi3为3或者5，Th_CK4∈[32,64]，CKSi4为3或者5，Th_CK5∈[64,128]，CKSi5为3或者5，Th_Neur∈[100,10000]。

6.如权利要求1所述的方法，所述第三步骤中加权平均法包括：统计第i帧彩色场景图像内像素点(x,y)的红色分量值R_i(x,y)、绿色分量值G_i(x,y)、蓝色分量值B_i(x,y)，根据加权公式f_i(x,y)＝0.114×R_i(x,y)+0.587×G_i(x,y)+0.299×B_i(x,y)，获取第i帧场景图像内像素点(x,y)的加权灰度值f_i(x,y)。

7.如权利要求1所述的方法，其特征在于，所述第四步骤包括：

均值漂移背景更新步骤，计算第i帧灰度场景图像的背景图像B_i(x,y)＝(1-α)×B_i-1(x,y)+α×f_i-1(x,y)，其中B₀(x,y)＝f₀(x,y)；

差分图像计算步骤，计算第i帧灰度场景图像f_i(x,y)与背景图像B_i(x,y)的差分图像；

中值滤波处理步骤，分别采用中值滤波算法对每帧灰度场景图像的差分图像进行处理，获取每帧灰度场景图像的前景图像；

连通区域标记步骤，采用连通区域标记法对每帧灰度场景图像的前景图像进行标记，获取每帧灰度场景图像内的连通区域；

连通区域筛选步骤，统计每帧灰度场景图像内的每个连通区域内前景点的数量，若连通区域内前景点的数量大于标记阈值MT，则将该连通区域设为感兴趣区域，否则将该连通区域内的前景点全设为背景点；

感兴趣区域图像提取步骤，根据每帧灰度场景图像内感兴趣区域的位置，提取该帧灰度场景图像中相应位置内的图像作为感兴趣区域图像。

8.如权利要求7所述的方法，所述α∈[0.02,0.04]，MT∈[40,100]。

9.如权利要求1所述的方法，其特征在于，所述第五步骤包括：

识别特征提取步骤，利用车型识别模型分别提取感兴趣区域图像的特征；

识别分类判定步骤，计算提取的感兴趣区域图像特征与每一种车型类别特征的相似度Simi_k，k表示第k种类别，k∈{1，2，…，MNum，MNum+1}，选取Simi_k值最大的类别作为车型类别。

10.基于卷积神经网络的车型识别装置，其特征在于，该装置包括：

车型识别模型训练模块，用于选取已标签车型的样本图像，对卷积神经网络进行训练，获取训练好的车型识别模型；

彩色场景视频图像获取模块，用于采集或者输入彩色场景视频图像；

场景灰度图像获取模块，用于采用加权平均法对每帧彩色场景图像进行灰度化处理，获取每帧灰度场景图像；

感兴趣区域图像提取模块，用于采用均值漂移背景更新背景法更新背景图像，计算每帧灰度场景图像与背景图像的差分图像，对差分图像进行中值滤波、连通区域标记、连通区域筛选处理，获取每帧灰度场景图像的感兴趣区域图像；以及感兴趣区域图像分类识别模块，用于采用训练好的车型识别模型对每帧灰度场景图像的感兴趣区域图像进行分类识别，输出识别结果。

11.如权利要求10所述的装置，其特征在于，所述车型识别模型训练模块包括：样本选取模块，用于选取LINum1个已标记MNum种车型的灰度图像作为样本图像，选取LINum2个已标记非车辆的灰度图像作为负样本图像；

初步训练模块，用于利用卷积神经网络对正样本图像和负样本图像进行训练，获得初步训练车型分类模型；

二次训练模块，用于选取TINum个测试图像，根据初步训练车型分类模型对测试图像进行反复训练，直至车型分类模型收敛；

模型输出模块，用于将收敛的车型分类模型作为车型识别模型并输出。

12.如权利要求11所述的装置，其特征在于，所述初步训练模块中卷积神经网络包括：

输入层，输入宽度为Width、高度为Height的灰度图像；

第一层卷积层，输出Th_CK1个卷积核，卷积核的大小为CKSi1*CKSi1、步长为1；

第一层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第二层卷积层，输出Th_CK2个卷积核，卷积核的大小为CKSi2*CKSi2、步长为1；

第二层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第三层卷积层，输出Th_CK3个卷积核，卷积核的大小为CKSi3*CKSi3、步长为1；

第三层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第四层卷积层，输出Th_CK4个卷积核，卷积核的大小为CKSi4*CKSi4、步长为1；

第四层池化层，采用最大池化法输出KSi*KSi、步长为2的核；

第五层卷积层，输出Th_CK5个卷积核，卷积核的大小为CKSi5*CKSi5、步长为1；

第一层全连接层，采用ReLU作为激活函数，输出Th_Neur个神经元；

第二层全连接层，输出MNum+1个神经元，即MNum种车型类别和1种非车辆类别。

13.如权利要求11所述的装置，其特征在于，所述二次训练模块包括：

训练特征提取模块，用于根据初步训练车型分类模型，提取TINum个灰度测试图像的特征；

训练分类判定模块，用于计算测试图像的特征与每种车型类别特征的相似度Simi_k，k表示第k种车型类别，k∈{1，2，…，MNum，MNum+1}，选取Simi_k值最大的车型类别作为候选车型类别；

反复训练模块，用于计算判定结果与真实结果的误差，利用反向传播算法来训练车型分类模型，重复训练特征提取模块和训练分类判定模块，直至车型分类模型收敛。

14.如权利要求11～13所述的装置，所述MNum∈[3,30]，LINum1≥4000，LINum2≥2000，TINum≥1000，Width∈[64,256]，Height∈[64,256]，Th_CK1∈[16,32]，CKSi1为3或者5，KSi∈[2,4]，Th_CK2∈[16,32]，CKSi2为3或者5，Th_CK3∈[32,64]，CKSi3为3或者5，Th_CK4∈[32,64]，CKSi4为3或者5，Th_CK5∈[64,128]，CKSi5为3或者5，Th_Neur∈[100,10000]。

15.如权利要求10所述的装置，所述场景灰度图像获取模块中加权平均法包括：统计第i帧彩色场景图像内像素点(x,y)的红色分量值R_i(x,y)、绿色分量值G_i(x,y)、蓝色分量值B_i(x，y)，根据加权公式f_i(x，y)＝0.114*R_i(x，y)+0.587×G_i(x，y)+0.299×B_i(x，y)，获取第i帧场景图像内像素点(x,y)的加权灰度值f_i(x,y)。

16.如权利要求10所述的装置，其特征在于，所述感兴趣区域图像提取模块包括：

均值漂移背景更新模块，用于计算第i帧灰度场景图像的背景图像B_i(x,y)＝(1-α)×B_i-1(x,y)+α×f_i-1(x,y)，其中B₀(x,y)＝f₀(x,y)；

差分图像计算模块，用于计算第i帧灰度场景图像f_i(x,y)与背景图像B_i(x,y)的差分图像；

中值滤波处理模块，用于分别采用中值滤波算法对每帧灰度场景图像的差分图像进行处理，获取每帧灰度场景图像的前景图像；

连通区域标记模块，用于采用连通区域标记法对每帧灰度场景图像的前景图像进行标记，获取每帧灰度场景图像内的连通区域；

连通区域筛选模块，用于统计每帧灰度场景图像内的每个连通区域内前景点的数量，若连通区域内前景点的数量大于标记阈值MT，则将该连通区域设为感兴趣区域，否则将该连通区域内的前景点全设为背景点；

感兴趣区域图像提取模块，用于根据每帧灰度场景图像内感兴趣区域的位置，提取该帧灰度场景图像中相应位置内的图像作为感兴趣区域图像。

17.如权利要求16所述的装置，其特征在于，所述α∈[0.02,0.04]，MT∈[40,100]。

18.如权利要求10所述的装置，其特征在于，所述感兴趣区域图像分类识别模块包括：

识别特征提取模块，用于利用车型识别模型分别提取感兴趣区域图像的特征；识别分类判定模块，用于计算提取的感兴趣区域图像特征与每一种车型类别特征的相似度Simi_k，k表示第k种类别，k∈{1，2，…，MNum，MNum+1}，选取Simi_k值最大的类别作为车型类别。

完整全部详细技术资料下载

当前第2页1 2 3