车辆信息识别方法及装置与流程

文档序号:12721144阅读:201来源:国知局
车辆信息识别方法及装置与流程

本公开涉及信息识别技术领域,具体地,涉及一种车辆信息识别方法及装置。



背景技术:

随着现代化经济的高速发展,车辆的数量和种类日益增加,交通监管面临巨大挑战。由于车辆外观复杂多样,受到背景、光照、视角等因素影响,对车辆信息的识别存在很大的难度,准确性难以保证。

相关技术中,基于机器学习进行车辆识别时,主要是利用分类器对车辆信息进行单一化目标的识别,例如,仅对车辆的车型进行识别,或者通过学习识别车辆与非车辆的判定边界或验证生成的车辆候选区域等。

因此,相关技术中的车辆信息识别,具有车辆参数识别单一化的问题。



技术实现要素:

为克服相关技术中存在的问题,本公开提供一种车辆信息识别方法及装置。

第一方面,本公开提供一种车辆信息识别方法,包括:

获取训练样本集,所述训练样本集中包括预设个数的训练样本,每个训练样本包括:车辆的图像数据、车辆的车型标签和车辆的车身颜色标签;

根据所述训练样本集和预设优化目标,对深度卷积神经网络进行训练,所述预设优化目标为车型对应的损失函数和车身颜色对应的损失函数的加权和最小化或收敛;

当训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息;

获取包括待识别车辆的目标图像数据;

将所述目标图像数据输入通过所述参数信息构建的深度卷积神经网络中,对所述待识别车辆的车型和车身颜色进行识别。

在一个实施例中,所述车型对应的损失函数为:所述车身颜色对应的损失函数为:

所述车型对应的损失函数和车身颜色对应的损失函数的加权和为:E=λm×Em+(1-λm)×Ec

其中,Em是车型对应的损失函数,Ec是车身颜色对应的损失函数,E所述加权和,zj是深度卷积神经网络的全连接层向量j的输出向量,zi是训练样本i的车辆的车型标签和车身颜色标签向量,m是所述训练样本集的车型类别数,c是所述训练样本集的颜色类别数,λm是权重,N是所述训练样本集中的训练样本的数量。

在一个实施例中,所述深度卷积神经网络包括:

第一输入层、第二输入层、标签分割层、卷积层、池化层、全连接层、第一输出层和第二输出层;

所述对深度卷积神经网络进行训练,以及当训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息的步骤包括:

将每个训练样本的车辆的图像数据通过所述第一输入层输入至所述卷积层;

所述第一输入层输入的车辆的图像数据,经过所述卷积层、所述池化层和所述全连接层的逐级变换后,传送至所述第一输出层和所述第二输出层;

将每个训练样本的车辆的车型标签数据和车辆的车身颜色标签数据通过所述第二输入层输入至所述标签分割层;

在所述标签分割层,对所述第二输入层输入的标签数据进行分割;

根据训练样本的车辆的车型标签、第一输出层的输出结果、训练样本的车辆的车身颜色标签和第二输出层的输出结果,调整所述卷积层、所述池化层和所述全连接层的权值和偏置,使得训练结果满足所述预设优化目标;

当训练结果满足所述预设优化目标时,分别获取所述卷积层、所述池化层和所述全连接层的权重和偏置;

将所述卷积层、所述池化层和所述全连接层的权重和偏置作为所述参数信息进行保存。

在一个实施例中,所述参数信息还包括:

所述卷积层的个数、每个卷积层的卷积核大小、所述池化层的个数、每个池化层的大小、所述全连接层的个数以及每个全连接层的大小。

在一个实施例中,所述当训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息的步骤之后还包括:

获取测试样本集,所述测试样本集中包括待测试车辆的车辆图像数据;

将测试样本集中的待测试车辆图像数据输入通过所述参数信息构建的深度卷积神经网络中,识别所述待测试车辆的车型和车身颜色;

当所述待测试车辆的车型和车身颜色的识别结果不满足预设条件时,根据所述训练样本集和预设优化目标,对深度卷积神经网络重新进行训练,以更新所述参数信息。

在一个实施例中,所述获取包括待识别车辆的目标图像数据的步骤包括:

从图像采集装置获取包括所述待识别车辆的目标图像;

对所述目标图像进行预处理,确定识别区域,所述识别区域为所述目标图像中包括所述待识别车辆的车尾图像或车辆正面图像的区域;

将所述识别区域转换为所述目标图像数据。

第二方面,提供一种车辆信息识别装置,包括:

训练样本集获取模块,被配置为获取训练样本集,所述训练样本集中包括预设个数的训练样本,每个训练样本包括:车辆的图像数据、车辆的车型标签和车辆的车身颜色标签;

训练模块,被配置为根据所述训练样本集和预设优化目标,对深度卷积神经网络进行训练,所述预设优化目标为车型对应的损失函数和车身颜色对应的损失函数的加权和最小化或收敛;

参数信息保存模块,被配置为在训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息;

目标图像数据获取模块,被配置为获取包括待识别车辆的目标图像数据;

第一识别模块,被配置为将所述目标图像数据输入通过所述参数信息构建的深度卷积神经网络中,对所述待识别车辆的车型和车身颜色进行识别。

在一个实施例中,所述车型对应的损失函数为:所述车身颜色对应的损失函数为:

所述车型对应的损失函数和车身颜色对应的损失函数的加权和为:E=λm×Em+(1-λm)×Ec

其中,Em是车型对应的损失函数,Ec是车身颜色对应的损失函数,E所述加权和,zj是深度卷积神经网络的全连接层向量j的输出向量,zi是训练样本i的车辆的车型标签和车身颜色标签向量,m是所述训练样本集的车型类别数,c是所述训练样本集的颜色类别数,λm是权重,N是所述训练样本集中的训练样本的数量。

在一个实施例中,所述装置还包括:

测试样本集获取模块,被配置为获取测试样本集,所述测试样本集中包括待测试车辆的车辆图像数据;

第二识别模块,被配置为将测试样本集中的待测试车辆图像数据输入通过所述参数信息构建的深度卷积神经网络中,识别所述待测试车辆的车型和车身颜色;

更新模块,被配置为当所述待测试车辆的车型和车身颜色的识别结果不满足预设条件时,根据所述训练样本集和预设优化目标,对深度卷积神经网络重新进行训练,以更新所述参数信息。

在一个实施例中,所述目标图像数据获取模块包括:

图像获取子模块,被配置为从图像采集装置获取包括所述待识别车辆的目标图像;

识别区域确定子模块,被配置为对所述目标图像进行预处理,确定识别区域,所述识别区域为所述目标图像中包括所述待识别车辆的车尾图像或车辆正面图像的区域;

转换子模块,被配置为将所述识别区域转换为所述目标图像数据。

第三方面,提供一种车辆信息识别装置,包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器,被配置为获取训练样本集,所述训练样本集中包括预设个数的训练样本,每个训练样本包括:车辆的图像数据、车辆的车型标签和车辆的车身颜色标签;

根据所述训练样本集和预设优化目标,对深度卷积神经网络进行训练,所述预设优化目标为车型对应的损失函数和车身颜色对应的损失函数的加权和最小化或收敛;

当训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息;

获取包括待识别车辆的目标图像数据;

将所述目标图像数据输入通过所述参数信息构建的深度卷积神经网络中,对所述待识别车辆的车型和车身颜色进行识别。

本公开实施例提供的技术方案至少可以包括以下有益效果:可同时进行车型和车身颜色两个目标的识别,识别准确率高;使用一个深度卷积神经网络对两种属性进行分类,在提高识别率的同时提高了识别效率,节省了运行时间与运行内存。

本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。

附图说明

附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:

图1是本公开一实施例的车辆信息识别系统的框图;

图2是本公开一实施例的车辆信息识别方法的流程示意图;

图3是本公开一实施例的深度卷积神经网络的结构示意图;

图4是本公开一实施例的深度卷积神经网络的训练流程示意图;

图5是本公开一实施例对深度卷积神经网络进行测试的流程示意图;

图6是本公开一实施例的车型和车身颜色识别示意图;

图7是本公开一实施例的对待识别车辆进行车型和车身颜色进行识别的识别效果图;

图8是本公开另一实施例的对待识别车辆进行车型和车身颜色进行识别的识别效果图;

图9是本公开一实施例提供的一种车辆信息识别装置的框图;

图10是根据一示例性实施例示出的一种用于车辆信息识别方法的装置的框图。

具体实施方式

以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。

参见图1,为本公开一实施例的车辆信息识别系统的框图,该系统100包括:图像采集装置100和车辆信息识别装置101。在本公开的实施例中,车辆信息包括:车辆的车型和车身颜色。

在本公开的实施例中,图像采集装置100用于对车辆图像进行采集。图像采集装置100可为设置在十字路口、卡口或特定采集位置的摄像头、相机等。由此,图像采集装置100可采集包括车辆的车辆图像。

图像采集装置100采集的车辆图像可为车辆的车尾图像,车辆的正面图像或车辆的侧面图像。

图像采集装置100采集的车辆图像可通过无线网络或有线连接等方式传输给车辆信息识别装置101。车辆信息识别装置101可以以各种形式来实施,例如,电子设备。

车辆信息识别装置101,用于对图像采集装置采集的车辆图像进行车辆信息识别,以得到车辆图像中所包括车辆的车型和车身颜色。在本公开的一实施例中,车辆信息识别装置101利用基于多任务学习的深度卷积神经网络进行车辆信息识别,获得车辆的车型和车身颜色。

在本公开的实施例中,为了提高车辆信息识别的准确率和效率,对图像采集装置100采集到的车辆图像进行预处理,预处理包括:对车辆图像进行识别区域确定。

在本公开的一实施例中,将图像采集装置100采集到的车辆图像转换到RGB颜色空间。而若图像采集装置100采集的车辆图像为RGB颜色空间的图像,则可不进行转换。

由于图像采集装置100采集到的车辆图像,受到环境的影响,会包括噪声信息,例如,一幅车辆图像中包括了多个车辆的车尾图像,或包括了非车辆物体。因此,为了提高车型和车身颜色识别的精度及准确率,对车辆图像进行定位,确定识别区域,该识别区域为“感兴趣区域”。

在一个实施例中,可对车辆图像中包括的车牌进行识别,以车牌为基准定位车辆图像中的识别区域。在一个实施例中,识别区域为包括车辆的车尾图像或车辆正面图像的区域。在实际中,车辆的前号牌安装在车辆前段的中间或者偏右,车辆的后号牌安装在车辆后段的中间或者偏左,由此,识别出车辆后,根据车牌在图像中的位置,按照比例扩大得到有效的待识别区域,提高识别准确率和识别效率。

这里需要说明的是,识别区域定位的精度越高,可相应的减小车辆图像的背景信息,获取车辆特征时的干扰因素越少,后续车型识别的准确率和精度就会越高。

在本公开的实施例中,将预处理后的车辆图像归一化为同样大小,防止数据中存在较大数值的数据造成数值较小的数据对于训练效果减弱甚至无效化。在一个实施例中,预处理后的车辆图像被转换为112×112像素的图像数据。

应理解,本公开后续实施例中的训练阶段、测试阶段和识别阶段所采用的车辆图像均是通过上述的预处理后得到的图像数据。

参见图2,为本公开一实施例的车辆信息识别方法的流程示意图。该车辆信息识别方法包括:

在步骤201中,获取训练样本集,训练样本集中包括预设个数的训练样本,每个训练样本包括:车辆的图像数据、车辆的车型标签和车辆的车身颜色标签。

在步骤202中,根据训练样本集和预设优化目标,对深度卷积神经网络进行训练,预设优化目标为车型对应的损失函数和车身颜色对应的损失函数的加权和最小化或收敛。

在步骤203中,当训练结果满足预设优化目标时,保存深度卷积神经网络的参数信息。

在步骤204中,获取包括待识别车辆的目标图像数据。

在步骤205中,将目标图像数据输入通过参数信息构建的深度卷积神经网络中,对待识别车辆的车型和车身颜色进行识别。

上述步骤201至步骤203为深度卷积神经网络的训练阶段,步骤204和步骤205为识别阶段。

参见图3为本公开一实施例的深度卷积神经网络的结构示意图。

本公开实施例的深度卷积神经网络包括:输入层、标签分割层、卷积层、池化层、全连接层和输出层。

其中,输入层输入车辆图像数据和标签数据。标签分割层,用于对车辆图像数据的多标签进行分割。在本公开的实施例中,车辆的标签包括:车型和车身颜色。其中,车型包括m类车型,车身颜色包括c种车身颜色。

在本公开的一实施例中,针对每一车辆,通过对包括车辆的车辆图像进行车辆号牌识别,获得车辆的号牌信息。而后,根据车辆的号牌信息到相应的数据库(例如,存储有车辆注册、变更等信息的数据库)中进行查询,获取该号牌信息所对应的车辆的车型和颜色,由此,对该车辆所在的车辆图像进行标签的标注,使得训练样本集由带标签的车辆图像构成。

应理解,车辆的号牌信息的识别可通过车牌定位算法、车牌字符分割算法和光学字符识别算法等步骤获得,或通过其它图像处理方法获得。

本公开实施例,可同时对车型和车身颜色进行识别,车辆的车型标签和车辆的车身颜色标签,以及车辆的图像数据分别通过不同的输入层输入。标签分割层通过多标签分割,将输入的标签数据进行区分,然后输入到下一层,即输入到卷积层。

卷积层:卷积网络中,车辆图像数据的局部感受野对应于图像数据的一个局部子区域。连接这个局部子区域的权重可以用于提取图像中的一些特征,比如颜色、有向边、角等。用于提取这些特征的一组权值,叫做卷积核。卷积核在图像上不同区域移动的操作,为卷积同一个卷积核在图像的不同区域提取的特征值组成该卷积核的一个特征映射。

通过卷积运算,可以使原图像数据的特征增强,并且降低噪声。卷积过程的形式表示如式(1)所示。

其中,f(·)是卷积层的激活函数;代表第l卷积层的第j个神经元向量;是当前层的输入神经元;k是卷积核;Mj代表选择的输入特征图的集合;b是偏置;上标l表示卷积层层数索引号,下标i、j表示第l或l-1层的神经元索引号。

池化层:池化层利用图像局部相关性的原理,对图像数据进行子采样,减少数据处理量同时保留有用信息。池化层位于卷积层后,在卷积层的特征映射上,在一个固定大小的区域上采样(例如,最大值采样和均值采样等)一个点,作为下一层的输入。通过池化层可降低特征的维度,保留特征点的大体位置。

池化操作的形式如式(2)所示。

其中,g(·)是池化层的激活函数;pool(·)是池化函数,表示对前一层图像的一个n×n的区域求和;β是权值,b是偏置,每一个输出的特征图都对应一个权值和偏置;上标l表示隐含层层数索引号,下标i、j表示第l或l-1层的神经元索引号。应理解,在一些实施例中,池化层也可不需要激活函数,且权值β可为1,偏置b可为0,由此,只需要通过池化函数进行采样。

全连接层:全连接层与池化层连接,将池化层得到的所有的神经元分别连接到该全连接层的每个神经元。全连接层的每个输出单元和所有的输入单元连接。全连接层的每一个输出都可以看成前一层的每一个结点乘以一个权重系数W,最后加上一个偏置值b得到。

全连接层也需要一个激活函数,例如,可选择Relu函数作为激活函数。全连接层的输出特征向量,是将得到的特征图排列为一条列向量得到的。

输出层:在本公开的一实施例中,输出层采用softmax形式。对于训练样本,用假设函数对每一个类别估算出其相对应的概率值,也就是估算训练样本中的车辆图像中的车辆被划分为每一种分类结果的可能概率。softmax的假设函数输出的是一个K维列向量,每一个维度的数就代表那个类别出现的概率。

在本公开的实施例中,车型和车身颜色的分别有相应的softmax层,分别得到车型和车身颜色的分类结果。

在本公开的一实施例中,由于深度卷积神经网络是多任务学习,将两个任务的损失函数进行结合作为预设优化目标,如式(3)至式(5)为本公开一实施例的损失函数。

E=λm×Em+(1-λm)×Ec (3)

其中,E是车型对应的损失函数和车身颜色对应的损失函数的加权和,即整个网络的总损失,Em是车型对应的损失函数,Ec是车身颜色对应的损失函数,zj是深度卷积神经网络的全连接层向量j的输出向量,zi是训练样本i的车辆的车型标签和车身颜色标签向量,m是训练样本集的车型类别数,c是训练样本集的颜色类别数,λm是权重,N是训练样本集中的训练样本的数量。

在一个实施例中,权重λm可设置为0.5。

在一个实施例中,m为1000,c为9,即对1000类车型和9种车身颜色进行训练,使得训练后的深度卷积神经网络,可对1000类车型和9种车身颜色进行识别。

在本公开的一实施例中,记录训练样本中每一车辆图像数据所对应的损失函数,并根据训练样本中的所有车辆图像的损失函数,获取到整个网络的损失函数,提高准确性。

本公开实施例中,通过一个深度卷积神经网络进行车型和车身颜色的识别,由于不同的车辆的颜色是不相同的,识别车身颜色的时候,可以帮助识别车型,例如,对于车型为A的车辆,其包括黑色,白色和红色,则在识别车型的时候,可将其它颜色排除,提高识别准确性和提高效率。

本公开实施例,采用深度卷积神经网络进行车型和车身颜色的识别。深度卷积神经网络通过组合低层特征形成更加抽象的高层表示、属性类别或特征,自动地学习得到层次化的特征表示,可增强分类器的鲁棒性,提高识别效率和准确率。

深度卷积神经网络的训练样本集包括(输入向量,理想输出向量)的向量对。在本公开的实施例中,通过图像采集装置采集并经预处理后的车辆图像数据为输入向量,理想输出量即为车辆图像数据所对应的车辆的车型标签和车辆的车身颜色标签。

在对深度卷积神经网络进行训练之前,针对车型和车身颜色两个任务的识别,确定深度卷积神经网络的输入层数、卷积层数、池化层数、全连接层数、输出层数以及损失函数,以实现多标签图像的输入和多类结果的输出。

在本公开的一实施例中,将输入层设置为两层,即第一输入层和第二输入层;卷积层设置为四层;池化层设置为四层;全连接层设置为两层;输出层设置为两层,即第一输出层和第二输出层;损失函数如式(3)至(5)所示。应理解,卷积层的层数和池化层的层数,还可设置为其它的值,例如,三层、五层等,本公开对此不作限制。卷积层的层数和池化层的层数变化后,训练得到深度卷积神经网络的权值和偏置将不相同。

参见图4,为本公开一实施例的深度卷积神经网络的训练流程示意图。

在步骤401中,将每个训练样本的车辆的图像数据通过第一输入层输入至卷积层。

第一输入层输入的车辆的图像数据,经过所述卷积层、所述池化层和所述全连接层的逐级变换后,传送至所述第一输出层和所述第二输出层。

在步骤402中,将每个训练样本的车辆的车型标签和车辆的车身颜色标签通过第二输入层输入至标签分割层。

在步骤403中,在标签分割层,对第二输入层输入的标签数据进行分割。

在步骤404中,根据训练样本的车辆的车型标签、第一输出层的输出结果、训练样本的车辆的车身颜色标签和第二输出层的输出结果,调整卷积层、池化层和全连接层的权值和偏置,使得训练结果满足预设优化目标;

在步骤405中,当训练结果满足预设的优化目标时,分别获取卷积层、池化层和全连接层的权重和偏置;

在步骤406中,将卷积层、池化层和全连接层的权重和偏置作为参数信息进行保存。

对卷积神经网络进行训练时,在向前传播阶段,将训练样本集中带标签的车辆的图像数据的样本(X,Yp),将X输入网络,计算相应的实际输出Op。其中,X为车辆图像数据,Yp为车辆的图像数据对应的标签。

在此阶段,车辆图像数据从输入层经过逐级的变换,传送到输出层,得到最后的输出结果Op

在卷积神经网络训练的向后传播阶段,根据实际输出Op与相应的理想输出Yp,调整卷积层、池化层和全连接层的权值和偏置,使得实际输出满足预设的优化目标。

在本公开的一实施例中,根据式(3)所示的损失函数设定优化目标,例如,可将优化目标设置为损失函数的取值最小化或收敛,当卷积神经网络的实际输出值与期望输出值的误差基本已经最小化或收敛即终止卷积神经网络训练,并保存深度卷积神经网络的参数信息。参数信息包括:卷积层对应的权值和偏置,池化层对应的权值和偏置,全连接层对应的权值和偏置,卷积层的个数,每个卷积层的卷积核大小,池化层的个数,每个池化层的大小,全连接层的个数,每个全连接层的大小以及各层所采用的激活函数。

参见图5,本公开一实施例中,为保证深度卷积神经网络的识别性能,对训练好的深度卷积神经网络进行测试。

在步骤501中,获取测试样本集,测试样本集中包括待测试车辆的车辆图像数据。

待测试车辆的车辆图像数据可为图像采集装置100采集,并按照上述的预处理进行处理后的车辆图像数据。

在步骤502中,将测试样本集中的待测试车辆图像数据输入通过参数信息构建的深度卷积神经网络中,识别待测试车辆的车型和车身颜色。

在步骤503中,当待测试车辆的车型和车身颜色的识别结果不满足预设条件时,根据训练样本集和预设优化目标,对深度卷积神经网络重新进行训练,以更新参数信息。

车型和车身颜色的识别结果包括:车型所属的类别,车身颜色所属的类别,车型所属类别对应的概率,以及车身颜色所属类别对应的概率。根据识别结果可确定训练好的深度卷积神经网络的性能。

在本公开的一实施例中,当训练好的深度卷积神经网络的性能满足预设条件时,确定可用该训练好的深度卷积神经网络进行车型和车身颜色识别。若训练好的深度卷积神经网络的性能不满足预设条件,则重新进行训练,并更新深度卷积神经网络的参数信息。

由上所述,深度卷积神经网络经训练和测试后,可用于对待识别车辆的车型和车身颜色进行识别。

在本公开的一实施例中,测试好的深度卷积神经网络包括:2个输入层,1个标签分割层,4个卷积层,4个池化层,2个全连接层和2个输出层。每一层提取的特征图,先与卷积核进行卷积后,再进行池化降维操作;而后,输入下一层。

在一个实施例中,由输入层输入的图像为112×112像素;第1卷积层的特征图个数为48个,卷积核大小为7×7像素,第1池化层的大小为2×2的最大池化;第2卷积层的特征图个数为96个,卷积核大小为3×3像素,第2池化层的大小为2×2的最大池化;第3卷积层的特征图个数为128个,卷积核大小为3×3像素,第3池化层的大小为2×2的最大池化;第4卷积层的特征图个数为256个,卷积核大小为3×3像素,第4池化层的大小为2×2的最大池化;两个全连接层的大小分别是1024维和4096维;两个输出层的输出分别为m类车型对应的概率和c类车身颜色对应的概率。

根据输出的m类车型对应的概率和c类颜色对应的概率,可得到车辆的车型和车身颜色。在一个实施例中,将m类车型中概率最大的车型作为待识别车辆的车型,将c车身颜色中概率最大的车身颜色作为待识别车辆的车身颜色。

参见图6、图7和图8,为本公开一实施例的对待识别车辆进行车型和车身颜色进行识别的识别效果图。将车辆图像输入深度卷积神经网络后,可分别识别出车型和车身颜色。图7中,根据图像采集装置100所采集的包括待识别车辆的图像,识别出该待识别车辆的车型为“现代伊兰特”,对应的概率为95%;车身颜色为“白色”,对应的概率为92%。图8中,根据图像采集装置100所采集的包括待识别车辆的图像,识别出该待识别车辆的车型为“宝马5系”,对应的概率为93%;车身颜色为“灰色”,对应的概率为89%。

由此,本公开实施例通过深度卷积神经网络可同时进行车型和车身颜色两个目标的识别,识别准确率高;通过组合低层特征形成更加抽象的高层表示、属性类别或特征,自动地学习得到层次化的特征表示,增强了分类器的鲁棒性;同时多任务学习利用任务之间的相关性互相促进,联合提高车型和车身颜色两种属性的分类识别率;使用一个深度卷积神经网络对两种属性进行分类,在提高识别率的同时提高了识别效率,节省了运行时间与运行内存。另一方面,本公开实施例的车型和车身颜色识别方法,通过一个深度卷积神经网络进行两个任务的识别,减少内存占用,提高性能。

参见图9,为本公开实施例提供的一种车辆信息识别装置的框图。该车辆信息识别装置900包括:

训练样本集获取模块901,被配置为获取训练样本集,所述训练样本集中包括预设个数的训练样本,每个训练样本包括:车辆的图像数据、车辆的车型标签和车辆的车身颜色标签;

训练模块902,被配置为根据所述训练样本集和预设优化目标,对深度卷积神经网络进行训练,所述预设优化目标为车型对应的损失函数和车身颜色对应的损失函数的加权和最小化或收敛;

参数信息保存模块903,被配置为在训练结果满足所述预设优化目标时,保存所述深度卷积神经网络的参数信息;

目标图像数据获取模块904,被配置为获取包括待识别车辆的目标图像数据;

第一识别模块905,被配置为将所述目标图像数据输入通过所述参数信息构建的深度卷积神经网络中,对所述待识别车辆的车型和车身颜色进行识别。

在一个实施例中,所述车型对应的损失函数为:所述车身颜色对应的损失函数为:

所述车型对应的损失函数和车身颜色对应的损失函数的加权和为:E=λm×Em+(1-λm)×Ec

其中,Em是车型对应的损失函数,Ec是车身颜色对应的损失函数,E所述加权和,zj是深度卷积神经网络的全连接层向量j的输出向量,zi是训练样本i的车辆的车型标签和车身颜色标签向量,m是所述训练样本集的车型类别数,c是所述训练样本集的颜色类别数,λm是权重,N是所述训练样本集中的训练样本的数量。

在一个实施例中,所述装置还包括:

测试样本集获取模块906,被配置为获取测试样本集,所述测试样本集中包括待测试车辆的车辆图像数据;

第二识别模块907,被配置为将测试样本集中的待测试车辆图像数据输入通过所述参数信息构建的深度卷积神经网络中,识别所述待测试车辆的车型和车身颜色;

更新模块908,被配置为当所述待测试车辆的车型和车身颜色的识别结果不满足预设条件时,根据所述训练样本集和预设优化目标,对深度卷积神经网络重新进训练,以更新所述参数信息。

在一个实施例中,所述目标图像数据获取模块904包括:

图像获取子模块,被配置为从图像采集装置获取包括所述待识别车辆的目标图像;

识别区域确定子模块,被配置为对所述目标图像进行预处理,确定识别区域,所述识别区域为所述目标图像中包括所述待识别车辆的车尾图像或车辆正面图像的区域;

转换子模块,被配置为将所述识别区域转换为所述目标图像数据。

关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图10是根据一示例性实施例示出的一种用于车辆信息识别方法的装置1000的框图,该装置1000可以是电子设备。如图所示,该装置1000可以包括:处理器1001,存储器1002,多媒体组件1003,输入/输出(I/O)接口1004,以及通信组件1005。

其中,处理器1001用于控制该装置1000的整体操作,以完成上述的车辆信息识别方法中的全部或部分步骤。存储器1002用于存储操作系统,各种类型的数据以支持在该装置1000的操作,这些数据的例如可以包括用于在该装置1000上操作的任何应用程序或方法的指令,以及应用程序相关的数据。该存储器1002可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,例如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read-Only Memory,简称EPROM),可编程只读存储器(Programmable Read-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。

多媒体组件1003可以包括屏幕和音频组件。其中屏幕例如可以是触摸屏,音频组件用于输出和/或输入音频信号。例如,音频组件可以包括一个麦克风,麦克风用于接收外部音频信号。所接收的音频信号可以被进一步存储在存储器1002或通过通信组件1005发送。音频组件还包括至少一个扬声器,用于输出音频信号。I/O接口1004为处理器1001和其他接口模块之间提供接口,上述其他接口模块可以是键盘,鼠标,按钮等。这些按钮可以是虚拟按钮或者实体按钮。通信组件1005用于该装置1000与其他设备之间进行有线或无线通信。无线通信,例如Wi-Fi,蓝牙,近场通信(Near Field Communication,简称NFC),2G、3G或4G,或它们中的一种或几种的组合,因此相应的该通信组件1005可以包括:Wi-Fi模块,蓝牙模块,NFC模块。

在一示例性实施例中,装置1000可以被一个或多个应用专用集成电路(Application Specific Integrated Circuit,简称ASIC)、数字信号处理器(Digital Signal Processor,简称DSP)、数字信号处理设备(Digital Signal Processing Device,简称DSPD)、可编程逻辑器件(Programmable Logic Device,简称PLD)、现场可编程门阵列(Field Programmable Gate Array,简称FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述的车辆信息识别方法。

在另一示例性实施例中,还提供了一种计算机程序产品,所述计算机程序产品包含能够由可编程的装置执行的计算机程序,所述计算机程序具有当由所述可编程的装置执行时用于执行上述的车辆信息识别方法的代码部分。

在另一示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器1002,上述指令可由装置1000的处理器1001执行以完成上述的车辆信息识别方法。示例地,该非临时性计算机可读存储介质可以是ROM、随机存取存储器(Random Access Memory,简称RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

流程图中或在本发明本公开的实施例中以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明本公开实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明本公开的实施例所述技术领域的技术人员所理解。

本领域技术人员在考虑说明书及实践本发明本公开后,将容易想到本发明本公开的其它实施方案。本申请旨在涵盖本发明本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明本公开的一般性原理并包括本发明本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本发明本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本发明本公开的范围仅由所附的权利要求来限制。

以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。

另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。

此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1