一种基于卷积神经网络的车款识别方法及装置的制造方法

文档序号:10656072阅读:379来源:国知局
一种基于卷积神经网络的车款识别方法及装置的制造方法
【专利摘要】本发明提供了一种基于卷积神经网络的车款识别方法,该方法包括:选取标签车款的车脸灰度图像为样本,采用卷积神经网络对样本进行反复训练,获取训练好的车款识别模型;采集场景的视频图像;从场景的视频图像中获取车脸区域;利用训练好的车款识别模型对车脸区域进行识别,输出车款识别结果。与现有技术相比,本发明的车款识别方法的识别准确率较高。
【专利说明】
-种基于卷积神经网络的车款识别方法及装置
技术领域
[0001] 本发明设及图像处理、视频监控W及安防,特别设及车款识别方法及装置。
【背景技术】
[0002] 随着经济技术的发展,机动车辆的与日俱增,传统的人工管理方式越来越无法满 足实际的需要。与此同时,随着科技的发展,智能交通管理系统正日益成熟,渐渐取代传统 的人工管理方式。车款识别技术是实现智能交通管理的一个分支,能够用于电子警察监控, 对肇事、嫌疑、被盗车辆进行智能识别,因此近年来得到极大地关注。
[0003] 公开号为CN104408431A的中国发明专利申请公开了一种交通监控下的车款识别 方法,该方法包括:W车牌位置为基准,获取候补矩形区域;分析候补区域直方图,识别是车 头还是车尾;定位车头中的进气孔或车尾中的车灯;获取每一像素点的边缘方向,计算边缘 直方图描述子;根据边缘直方图描述子匹配数据库,获取对应的车款类型。公开号为 CN105279476A的中国发明专利申请公开了一种基于多特征的车脸识别方法与装置,采用 Adaboost和SVM定位车辆位置,根据车辆的水平边缘特征,进行车脸精确定位,将定位到的 车脸送入分类模块,分类模块的特征提取方法采用册G特征提取和LBP特征提取相结合,分 类器采用线性SVM的一对多分类器进行分类,该发明可W针对目前常见的1000多种车型进 行识别。然而,由于上述发明是根据人工选取的特征进行车款识别,因此车款识别的准确率 较低。
[0004] 综上所述,目前迫切需要提出一种识别准确率高的车款识别方法及装置。

【发明内容】

[0005] 有鉴于此,本发明的主要目的在于实现车款识别,且识别准确率高。
[0006] 为达到上述目的,按照本发明的第一个方面,提供了一种基于卷积神经网络的车 款识别方法,该方法包括:
[0007] 第一步骤,选取标签车款的车脸灰度图像为样本,采用卷积神经网络对样本进行 反复训练,获取训练好的车款识别模型;
[000引第二步骤,采集场景的视频图像;
[0009] 第=步骤,从场景的视频图像中获取车脸区域;
[0010] 第四步骤,利用训练好的车款识别模型对车脸区域进行识别,输出车款识别结果。
[0011] 所述第一步骤进一步包括:
[0012] 样本选取步骤,选取Th_Re个标签车款的车脸灰度图像作为样本图像;
[001引初步训练步骤,利用卷积神经网络对样本图像进行特征训练,获得初步训练的模 型;
[0014] 二次训练步骤,选取Th_Test个测试图像,根据初步训练的模型对测试图像进行反 复训练,直至模型收敛;
[0015] 模型输出步骤,将收敛的模型作为训练好的车款识别模型并输出。
[0016] 所述初步训练步骤S12中卷积神经网络包括:输入层、Th_Con个卷积层、Th_Pool个 池化层、Th_Full个全连接层。其中,每层卷积层包括Th_CK个卷积核,卷积核的大小为CKSi* CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全 连接层输出的神经元的数量CNum即为车款的类别数。
[0017] 进一步地,所述卷积神经网络包括:
[001引输入层,输入Th_Wi化h*Th_Height的图像;
[0019] 第一层卷积层Cl,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1;
[0020] 第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0021] 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi巧CKSi2、步长为1;
[0022] 第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0023] 第=层卷积层巧,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1;
[0024] 全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元;
[0025] 全连接层F2,输出CNum个神经元,即CNum个车款类别。
[0026] 所述第一层池化层S2和第二层池化层S4中的最大池化法可W替换为平均池化法。
[0027] 所述全连接层Fl中ReLU可W替换为sigmoid函数或者化nh函数作为激活函数。
[0028] 所述二次训练步骤进一步包括:
[0029] 训练特征提取步骤,根据初步训练的模型提取测试图像的特征;
[0030] 训练分类判定步骤,计算该特征与每一车款类别特征的相似度Simik,k表示第k个 类别,k = {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别;
[0031] 反复训练步骤,计算判定结果与真实结果的误差,利用反向传播算法来训练模型, 重复训练特征提取步骤和训练分类判定步骤,直至该模型收敛。
[0032] 所述第四步骤进一步包括:
[0033] 识别特征提取步骤,利用训练好的车款识别模型提取车脸区域的特征;
[0034] 识别分类判定步骤,计算该特征与每一车款类别特征的相似度Simik,k表示第k个 类别,k={l,2,…,CNumK选取Simik值最大的车款类别作为候选车款类别并输出结果。
[0035] 按照本发明的另一个方面,提供了一种基于卷积神经网络的车款识别装置,该装 置包括:
[0036] 车款识别模型获取模块,用于选取标签车款的车脸灰度图像为样本,采用卷积神 经网络对样本进行反复训练,获取训练好的车款识别模型.
[0037] 场景视频图像获取模块,用于采集场景的视频图像;
[0038] 车脸区域获取模块,用于从场景的视频图像中获取车脸区域;
[0039] 车款识别模块,用于利用训练好的车款识别模型对车脸区域进行识别,输出车款 识别结果。
[0040] 所述车款识别模型获取模块进一步包括:
[0041] 样本选取模块,用于选取Th_Re个标签车款的车脸灰度图像作为样本图像;
[0042] 初步训练模块,用于利用卷积神经网络对样本图像进行特征训练,获得初步训练 的模型;
[0043] 二次训练模块,用于选取化_Test个测试图像,根据初步训练的模型对测试图像进 行反复训练,直至模型收敛;
[0044] 模型输出模块,用于将收敛的模型作为训练好的车款识别模型并输出。
[0045] 所述初步训练模块中卷积神经网络包括:输入层、Th_Con个卷积层、Th_Poo 1个池 化层、Th_Full个全连接层。其中,每层卷积层包括化_CK个卷积核,卷积核的大小为CKSi* CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全 连接层输出的神经元的数量CNum即为车款的类别数。
[0046] 进一步地,所述卷积神经网络包括:
[0047] 输入层,输入Th_Wi化h*Th_Height的图像;
[004引第一层卷积层Cl,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1;
[0049] 第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0050] 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi巧CKSi2、步长为1; [0051 ]第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0052] 第=层卷积层巧,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1;
[0053] 全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元;
[0054] 全连接层F2,输出CNum个神经元,即CNum个车款类别。
[0055] 所述第一层池化层S2和第二层池化层S4中的最大池化法可W替换为平均池化法。
[0056] 所述全连接层Fl中ReLU可W替换为sigmoid函数或者化nh函数作为激活函数。
[0057] 所述二次训练模块进一步包括:
[0058] 训练特征提取模块,用于根据初步训练的模型提取测试图像的特征;
[0059] 训练分类判定模块,用于计算该特征与每一车款类别特征的相似度Simik, k表示 第k个类别,k = {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别;
[0060] 反复训练模块,用于计算判定结果与真实结果的误差,利用反向传播算法来训练 模型,重复训练特征提取模块和训练分类判定模块,直至该模型收敛。
[0061 ]所述车款识别模块进一步包括:
[0062]识别特征提取模块,用于利用训练好的车款识别模型提取车脸区域的特征;
[0063 ]识别分类判定模块,用于计算该特征与每一车款类别特征的相似度S i m i k,k表示 第k个类别,k= {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别并输出结 果。
[0064] 与现有的车款识别技术相比,本发明的基于卷积神经网络的车款识别方法及装置 由于采用卷积神经网络,可W自动地学习车款的特征,因此车款识别准确率较高。
【附图说明】
[0065] 图1示出了按照本发明的基于卷积神经网络的车款识别方法的流程图。
[0066] 图2示出了按照本发明的第一步骤Sl的流程图。
[0067] 图3示出了按照本发明的基于卷积神经网络的车款识别装置的框架图。
[0068] 图4示出了按照本发明的车款识别模型获取模块1的框架图。
【具体实施方式】
[0069] 为使贵审查员能进一步了解本发明的结构、特征及其他目的,现结合所附较佳实 施例详细说明如下,所说明的较佳实施例仅用于说明本发明的技术方案,并非限定本发明。
[0070] 图I给出了按照本发明的基于卷积神经网络的车款识别方法的流程图。如图I所 示,按照本发明的基于卷积神经网络的车款识别方法包括:
[0071] 第一步骤SI,选取标签车款的车脸灰度图像为样本,采用卷积神经网络对样本进 行反复训练,获取训练好的车款识别模型;
[0072] 第二步骤S2,采集场景的视频图像;
[0073] 第=步骤S3,从场景的视频图像中获取车脸区域;
[0074] 第四步骤S4,利用训练好的车款识别模型对车脸区域进行识别,输出车款识别结 果。
[0075] 图2给出了按照本发明的第一步骤Sl的流程图。如图2所示,所述第一步骤Sl进一 步包括:
[0076] 样本选取步骤Sll,选取Th_Re个标签车款的车脸灰度图像作为样本图像;
[0077] 初步训练步骤S12,利用卷积神经网络对样本图像进行特征训练,获得初步训练的 模型;
[0078] 二次训练步骤S13,选取化_Test个测试图像,根据初步训练的模型对测试图像进 行反复训练,直至模型收敛;
[0079] 模型输出步骤S14,将收敛的模型作为训练好的车款识别模型并输出。
[0080] 所述样本选取步骤Sll中标签车款包括标签W下信息:车所属的品牌、品牌下所属 的车款、车的年代。所述Th_Re > 4000。优选地,Th_Re > 16000。
[0081] 所述初步训练步骤S12中卷积神经网络包括:输入层、Th_Con个卷积层、Th_Pool个 池化层、Th_Full个全连接层。其中,每层卷积层包括Th_CK个卷积核,卷积核的大小为CKSi* CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全 连接层输出的神经元的数量CNum即为车款的类别数。
[0082] 其中,所述化_(:〇11 G [ 2,8 ],化_口〇〇 1 G [ 2,8 ]。化_尸1111 G [ 1,3 ]。化_0( G [ Th_CKmin, Th-CKmax] ,Th-CKminG [6,16] ,Th-CKmaxG [30,512] oCKSi G [3,7]且为奇数,KSi G [2,4]。 CNumG[50,4000]。
[0083] 进一步地,所述卷积神经网络包括:
[0084] 输入层,输入Th_Wi化h*Th_Height的图像;
[0085] 第一层卷积层Cl,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1;
[0086] 第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0087] 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi巧CKSi2、步长为1; [008引第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0089] 第=层卷积层巧,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1;
[0090] 全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元;
[0091 ]全连接层F2,输出CNum个神经元,即CNum个车款类别。
[0092] 其中,Th_Width和化_Height分别为输入图像的宽度和高度,Th_WidthG [26, 110] Jh-Hei 曲 tG[18,46]。化_0(1£ [6,20LCKSilG [3,5]且为奇数。KSiG [2,4]。化_0(2 £[10,40]。0(512£[3,5]且为奇数。化_0(3£[10,40]。0(513£[3,5]且为奇数。化_化11'£ [160,10000] oCNumG [ 100,3000]。
[0093] 优选地,Th_Width设为62,化_胎1旨^设为30。化_〇(1设为16,〇(511设为3,1(51设为 2,化_(:1(2设为32,CKSi2设为3,化_(:1(3设为32,CKSi3设为3。化_化肥设为256 dCNuhi设为 2000 O
[0094]所述第一层池化层S2和第二层池化层S4中的最大池化法可W替换为平均池化法。 [00巧]所述全连接层Fl中ReLU全称为Rectified Linear化its,中文译为修正线性单 元,可 W 参考文南犬"Tamin 邑 the ReLU with Parallel Dither in a Deep Neural Network.AJR Simpson.Computer Science,2015"。
[0096] 所述全连接层Fl中ReLU可W替换为sigmoid函数或者化nh函数作为激活函数。
[0097] 所述二次训练步骤Sl 3进一步包括:
[0098] 训练特征提取步骤S131,根据初步训练的模型提取测试图像的特征;
[0099] 训练分类判定步骤Sl 32,计算该特征与每一车款类别特征的相似度Simik,k表示 第k个类别,k = {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别;
[0100] 反复训练步骤S133,计算判定结果与真实结果的误差,利用反向传播算法来训练 模型,重复训练特征提取步骤S131和训练分类判定步骤S132,直至该模型收敛。
[0101] 其中,Th_Test>1000。优选地,Th_Test>4000。反向传播算法通过现有的技术实 现。
[0102] 所述第=步骤S3可W通过现有的车脸定位算法或者车辆检测算法实现,输出的车 脸区域为灰度的车脸区域。
[0103] 优选地,所述第=步骤S3进一步包括:
[0104] 车牌区域定位步骤S31,根据车牌定位算法获取场景图像中的车牌区域;
[0105] 车脸区域边界获取步骤S32,根据车牌区域获取车牌区域的左边边界x = pl、右边 边界x = p;r、上边边界y = pt、下边边界y = pb,则车脸区域的左边边界为
上边边界 Wr为车牌 区域的宽度,W和H分别为场景图像的宽度和高度;
[0106] 车脸区域获取步骤S33,根据车脸区域的左边边界、右边边界、上边边界、下边边 界,确定矩形区域,该矩形区域即为车脸区域,并对车脸区域进行灰度化处理,获取灰度的 车脸区域。
[0107] 所述车牌区域定位步骤S31中车牌定位算法为现有的车牌定位算法。例如,"基于 边缘颜色对的车牌定位新方法.李文举,梁德群,张旗,樊蠢.《计算机学报》,2004,27(2): 204-20沪。
[010引所述入IG [1.1,1.4],入2G [1.1,1.4],入3G [1.2,1.6] ,MG [0.3,0.8]。优选地,入 1 选为1.2,A2选为1.2,A3选为1.3,M选为0.5。
[0109] 所述第四步骤S4进一步包括:
[0110] 识别特征提取步骤S41,利用训练好的车款识别模型提取车脸区域的特征;
[0111] 识别分类判定步骤S42,计算该特征与每一车款类别特征的相似度Simik,k表示第 k个类别,k={l,2,…,CNumK选取Simik值最大的车款类别作为候选车款类别并输出结果。
[0112] 图3给出了按照本发明的基于卷积神经网络的车款识别装置的框架图。如图3所 示,按照本发明的基于卷积神经网络的车款识别装置包括:
[0113] 车款识别模型获取模块1,用于选取标签车款的车脸灰度图像为样本,采用卷积神 经网络对样本进行反复训练,获取训练好的车款识别模型.
[0114] 场景视频图像获取模块2,用于采集场景的视频图像;
[0115] 车脸区域获取模块3,用于从场景的视频图像中获取车脸区域;
[0116] 车款识别模块4,用于利用训练好的车款识别模型对车脸区域进行识别,输出车款 识别结果。
[0117] 图4给出了按照本发明的车款识别模型获取模块1的框架图。如图4所示,所述车款 识别模型获取模块1进一步包括:
[0118] 样本选取模块11,用于选取Th_Re个标签车款的车脸灰度图像作为样本图像;
[0119] 初步训练模块12,用于利用卷积神经网络对样本图像进行特征训练,获得初步训 练的模型;
[0120] 二次训练模块13,用于选取Th_Test个测试图像,根据初步训练的模型对测试图像 进行反复训练,直至模型收敛;
[0121] 模型输出模块14,用于将收敛的模型作为训练好的车款识别模型并输出。
[0122] 所述样本选取模块11中标签车款包括标签W下信息:车所属的品牌、品牌下所属 的车款、车的年代。所述Th_Re > 4000。优选地,Th_Re > 16000。
[0123] 所述初步训练模块12中卷积神经网络包括:输入层、Th_Con个卷积层、Th_Pool个 池化层、Th_Full个全连接层。其中,每层卷积层包括Th_CK个卷积核,卷积核的大小为CKSi* CKSi、步长为1。每层池化层的核的大小为KSi*KSi、步长为KSi。所述全连接层的最后一层全 连接层输出的神经元的数量CNum即为车款的类别数。
[0124] 其中,所述化_(:〇11 G [ 2,8 ],化_口〇〇 1 G [ 2,8 ]。化_尸1111 G [ 1,3 ]。Th-CK G [ Th-CKmin, Th-CKmax] ,Th-CKminG [6,16] ,Th-CKmaxG [30,512] oCKSi G [3,7]且为奇数,KSi G [2,4]。 CNumG[50,4000]。
[01巧]进一步地,所述卷积神经网络包括:
[01%] 输入层,输入Th_Wi化h*Th_Height的图像;
[0127]第一层卷积层Cl,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1; [01 %]第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0129] 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi巧CKSi2、步长为1;
[0130] 第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核;
[0131] 第=层卷积层巧,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1; [01创全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元;
[0133] 全连接层F2,输出CNum个神经元,即CNum个车款类别。
[0134] 其中,Th_Width和化_Height分别为输入图像的宽度和高度,Th_WidthG [26, 110] Jh-Hei 曲 tG[18,46]。化_0(1£ [6,20LCKSilG [3,5]且为奇数。KSiG [2,4]。化_0(2 £[10,40]。0(512£[3,5]且为奇数。化_0(3£[10,40]。0(513£[3,5]且为奇数。化_化11'£ [160,10000] oCNumG [ 100,3000]。
[0135] 优选地,Th_Width设为62,化_胎1旨^设为30。化_〇(1设为16,〇(511设为3,1(51设为 2,化_(:1(2设为32,CKSi2设为3,化_(:1(3设为32,CKSi3设为3。化_化肥设为256 dCNuhi设为 2000 O
[0136] 所述第一层池化层S2和第二层池化层S4中的最大池化法可W替换为平均池化法。
[0137] 所述全连接层Fl中ReLU全称为Rectified Linear化its,中文译为修正线性单 元,可 W 参考文南犬"Tamin 邑 the ReLU with Parallel Dither in a Deep Neural Network.AJR Simpson.Computer Science,2015"。
[0138] 所述全连接层Fl中ReLU可W替换为sigmoid函数或者化nh函数作为激活函数。
[0139] 所述二次训练模块13进一步包括:
[0140] 训练特征提取模块131,用于根据初步训练的模型提取测试图像的特征;
[0141] 训练分类判定模块132,用于计算该特征与每一车款类别特征的相似度Simik, k表 示第k个类别,k = {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别;
[0142] 反复训练模块133,用于计算判定结果与真实结果的误差,利用反向传播算法来训 练模型,重复训练特征提取模块131和训练分类判定模块132,直至该模型收敛。
[0143] 其中,Th_Test>1000。优选地,Th_Test>4000。反向传播算法通过现有的技术实 现。
[0144] 所述车脸区域获取模块3可W通过现有的车脸定位算法或者车辆检测算法实现, 输出的车脸区域为灰度的车脸区域。
[0145] 优选地,所述车脸区域获取模块3进一步包括:
[0146] 车牌区域定位模块31,用于根据车牌定位算法获取场景图像中的车牌区域;
[0147] 车脸区域边界获取模块32,用于根据车牌区域获取车牌区域的左边边界x = pl、右 边边界x = p;r、上边边界y = pt、下边边界y = pb,则车脸区域的左边边界为
t边边界为 Wr为车牌 区域的宽度,W和H分别为场景图像的宽度和高度;
[0148] 车脸区域获取模块33,用于根据车脸区域的左边边界、右边边界、上边边界、下边 边界,确定矩形区域,该矩形区域即为车脸区域,并对车脸区域进行灰度化处理,获取灰度 的车脸区域。
[0149] 所述车牌区域定位模块31中车牌定位算法为现有的车牌定位算法。例如,"基于边 缘颜色对的车牌定位新方法.李文举,梁德群,张旗,樊蠢.《计算机学报》,2004,27(2) :204- 20沪。
[0150] 所述人IG [1.1,1.4],人2G [1.1,1.4],人3G [1.2,1.6] ,MG [0.3,0.8]。优选地,入1 选为1.2,A2选为1.2,A3选为1.3,M选为0.5。
[0151 ]所述车款识别模块4进一步包括:
[0152] 识别特征提取模块41,用于利用训练好的车款识别模型提取车脸区域的特征;
[0153] 识别分类判定模块42,用于计算该特征与每一车款类别特征的相似度Simik,k表 示第k个类别,k={l,2,…,CNumK选取Simik值最大的类别作为候选车款类别并输出结果。
[0154] 与现有的车款识别技术相比,本发明的基于卷积神经网络的车款识别方法及装置 由于采用卷积神经网络,可W自动地学习车款的特征,因此车款识别准确率较高。
[0155] W上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围,应当 理解,本发明并不限于运里所描述的实现方案,运些实现方案描述的目的在于帮助本领域 中的技术人员实践本发明。任何本领域中的技术人员很容易在不脱离本发明精神和范围的 情况下进行进一步的改进和完善,因此本发明只受到本发明权利要求的内容和范围的限 审IJ,其意图涵盖所有包括在由所附权利要求所限定的本发明精神和范围内的备选方案和等 同方案。
【主权项】
1. 一种基于卷积神经网络的车款识别方法,其特征在于,该方法包括: 第一步骤,选取标签车款的车脸灰度图像为样本,采用卷积神经网络对样本进行反复 训练,获取训练好的车款识别模型; 第二步骤,采集场景的视频图像; 第三步骤,从场景的视频图像中获取车脸区域; 第四步骤,利用训练好的车款识别模型对车脸区域进行识别,输出车款识别结果。2. 如权利要求1所述的方法,其特征在于,所述第一步骤进一步包括: 样本选取步骤,选取Th_Re个标签车款的车脸灰度图像作为样本图像; 初步训练步骤,利用卷积神经网络对样本图像进行特征训练,获得初步训练的模型; 二次训练步骤,选取Th_Test个测试图像,根据初步训练的模型对测试图像进行反复训 练,直至模型收敛; 模型输出步骤,将收敛的模型作为训练好的车款识别模型并输出; 其中,所述标签车款包括标签以下信息:车所属的品牌、品牌下所属的车款、车的年代; 所述 Th_Re 彡 4000,Th_Tes t 彡 1000 。3. 如权利要求2所述的方法,其特征在于,所述卷积神经网络包括:输入层、Th_Con个卷 积层、Th_Pool个池化层、Th_Ful 1个全连接层; 其中,每层卷积层包括Th_CK个卷积核,卷积核的大小为CKSi*CKSi、步长为1;每层池化 层的核的大小为KSi*KSi、步长为KSi;所述全连接层的最后一层全连接层输出的神经元的 数量CNum即为车款的类别数; 所述Th_Con e [ 2,8 ],Th_P。。I e [ 2,8 ],Th_Fu11 e [ 1,3 ],Th_CK e [ Th_CIWn,Th_CK腹], 111_0(*£[6,16],111_0(麗£[30,512],0(51£[3,7]且为奇数,1(51£[2,4],。灿111£[50, 4000] 〇4. 如权利要求3所述的方法,其特征在于,所述卷积神经网络进一步包括: 输入层,输入Th_Wi dth*Th_He i ght的图像; 第一层卷积层C1,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1; 第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核; 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi2*CKSi2、步长为1; 第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核; 第三层卷积层C5,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1; 全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元; 全连接层F2,输出CNum个神经元,即CNum个车款类别; 其中,Th_Width和ThJfeight分别为输入图像的宽度和高度,Th_Widthe [26,110],Th_ 此181^£[18,46],111_〇(1£[6,20],〇(511£[3,5]且为奇数,1(51£[2,4] ;111_〇(2£[10, 40],0(512£[3,5]且为奇数,111_0(3£[1〇,40],0(513£[3,5]且为奇数,111_此证£[160, 10000],CNume[ 100,3000] 〇5. 如权利要求4所述的方法,所述第一层池化层S2和第二层池化层S4中的最大池化法 替换为平均池化法。6. 如权利要求4所述的方法,所述全连接层Fl中ReLU替换为sigmoid函数或者tanh函数 作为激活函数。7. 如权利要求2所述的方法,其特征在于,所述二次训练步骤进一步包括: 训练特征提取步骤,根据初步训练的模型提取测试图像的特征; 训练分类判定步骤,计算该特征与每一车款类别特征的相似度Simik,k表示第k个类别, k= {1,2, M^CNumh选取Simik值最大的车款类别作为候选车款类别;反复训练步骤,计算 判定结果与真实结果的误差,利用反向传播算法来训练模型,重复训练特征提取步骤和训 练分类判定步骤,直至该模型收敛。8. 如权利要求1所述的方法,其特征在于,所述第三步骤进一步包括: 车牌区域定位步骤,根据车牌定位算法获取场景图像中的车牌区域; 车脸区域边界获取步骤,根据车牌区域获取车牌区域的左边边界X = Pl、右边边 界x = pr、上边边界y = pt、下边边界y = pb,则车脸区域的左边边界为匕边边界为 ,Wr为车牌 区域的宽度,W和H分别为场景图像的宽度和高度; 车脸区域获取步骤,根据车脸区域的左边边界、右边边界、上边边界、下边边界,确定矩 形区域,该矩形区域即为车脸区域,并对车脸区域进行灰度化处理,获取灰度的车脸区域; 其中,所述入1£ [1 ·1,1·4],λ2ε [1 ·1,1·4],λ3ε [1·2,1·6],λ4ε [0.3,0.8]。9. 如权利要求1所述的方法,其特征在于,所述第四步骤进一步包括: 识别特征提取步骤,利用训练好的车款识别模型提取车脸区域的特征; 识别分类判定步骤,计算该特征与每一车款类别特征的相似度Simik,k表示第k个类别, k={l,2, H^CNumh选取Simik值最大的车款类别作为候选车款类别并输出结果。10. -种基于卷积神经网络的车款识别装置,其特征在于,该装置包括: 车款识别模型获取模块,用于选取标签车款的车脸灰度图像为样本,采用卷积神经网 络对样本进行反复训练,获取训练好的车款识别模型; 场景视频图像获取模块,用于采集场景的视频图像; 车脸区域获取模块,用于从场景的视频图像中获取车脸区域; 车款识别模块,用于利用训练好的车款识别模型对车脸区域进行识别,输出车款识别 结果。11. 如权利要求10所述的装置,其特征在于,所述车款识别模型获取模块进一步包括: 样本选取模块,用于选取Th_Re个标签车款的车脸灰度图像作为样本图像; 初步训练模块,用于利用卷积神经网络对样本图像进行特征训练,获得初步训练的模 型; 二次训练模块,用于选取Th_Test个测试图像,根据初步训练的模型对测试图像进行反 复训练,直至模型收敛; 模型输出模块,用于将收敛的模型作为训练好的车款识别模型并输出; 其中,所述标签车款包括标签以下信息:车所属的品牌、品牌下所属的车款、车的年代; 所述 Th_Re 彡 4000,Th_Tes t 彡 1000。12. 如权利要求11所述的装置,其特征在于,所述卷积神经网络包括:输入层、Th_Con个 卷积层、Th_Pool个池化层、Th_Ful 1个全连接层; 其中,每层卷积层包括Th_CK个卷积核,卷积核的大小为CKSi*CKSi、步长为1;每层池化 层的核的大小为KSi*KSi、步长为KSi;所述全连接层的最后一层全连接层输出的神经元的 数量CNum即为车款的类别数; 所述Th_Con e [ 2,8 ],Th_P。。I e [ 2,8 ],Th_Fu11 e [ 1,3 ],Th_CK e [ Th_CIWn,Th_CK腹], 111_0(*£[6,16],111_0(麗£[30,512],0(51£[3,7]且为奇数,1(51£[2,4],。灿111£[50, 4000] 〇13. 如权利要求12所述的装置,其特征在于,所述卷积神经网络进一步包括:输入层,输 入 Th_Wi d th*Th_He i gh t 的图像; 第一层卷积层C1,输出Th_CKl个卷积核,卷积核的大小为CKSil*CKSil、步长为1; 第一层池化层S2,采用最大池化法输出KSi*KSi、步长为KSi的核; 第二层卷积层C3,输出Th_CK2个卷积核,卷积核的大小为CKSi2*CKSi2、步长为1; 第二层池化层S4,采用最大池化法输出KSi*KSi、步长为KSi的核; 第三层卷积层C5,输出Th_CK3个卷积核,卷积核的大小为CKSi3*CKSi3、步长为1; 全连接层Fl,采用ReLU作为激活函数,输出Th_Neur个神经元; 全连接层F2,输出CNum个神经元,即CNum个车款类别; 其中,Th_Width和ThJfeight分别为输入图像的宽度和高度,Th_Widthe [26,110],Th_ 此181^£[18,46],111_〇(1£[6,20],〇(511£[3,5]且为奇数,1(51£[2,4] ;111_〇(2£[10, 40],0(512£[3,5]且为奇数,111_0(3£[1〇,40],0(513£[3,5]且为奇数,111_此证£[160, 10000],CNume[ 100,3000] 〇14. 如权利要求13所述的装置,其特征在于,所述第一层池化层S2和第二层池化层S4中 的最大池化法替换为平均池化法。15. 如权利要求13所述的装置,其特征在于,所述全连接层Fl中ReLU替换为sigmoid函 数或者tanh函数作为激活函数。16. 如权利要求11所述的装置,其特征在于,所述二次训练模块进一步包括:训练特征 提取模块,用于根据初步训练的模型提取测试图像的特征; 训练分类判定模块,用于计算该特征与每一车款类别特征的相似度Simik,k表示第k个 类别,k = {1,2,…,CNum},选取Simik值最大的车款类别作为候选车款类别; 反复训练模块,用于计算判定结果与真实结果的误差,利用反向传播算法来训练模型, 重复训练特征提取模块和训练分类判定模块,直至该模型收敛。17. 如权利要求10所述的装置,其特征在于,所述车脸区域获取模块进一步包括: 车牌区域定位模块,用于根据车牌定位算法获取场景图像中的车牌区域; 车脸区域边界获取模块,用于根据车牌区域获取车牌区域的左边边界X = Pl、右 边边界x = pr、上边边界y = pt、下边边界y = pb,则车脸区域的左边边界为7 ,右边边界为 ,上边边界为Wr为车牌区 域的宽度,W和H分别为场景图像的宽度和高度; 车脸区域获取模块,用于根据车脸区域的左边边界、右边边界、上边边界、下边边界,确 定矩形区域,该矩形区域即为车脸区域,并对车脸区域进行灰度化处理,获取灰度的车脸区 域; 其中,所述入1£ [1 ·1,1·4],λ2ε [1 ·1,1·4],λ3ε [1·2,1·6],λ4ε [0.3,0.8]。18.如权利要求10所述的装置,其特征在于,所述车款识别模块进一步包括:识别特征 提取模块,用于利用训练好的车款识别模型提取车脸区域的特征; 识别分类判定模块,用于计算该特征与每一车款类别特征的相似度Simik,k表示第k个 类别,k={l,2, ···,CNum},选取Simik值最大的车款类别作为候选车款类别并输出结果。
【文档编号】G06K9/62GK106022285SQ201610368032
【公开日】2016年10月12日
【申请日】2016年5月30日
【发明人】李志国
【申请人】北京智芯原动科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1