一种车辆年款的筛选方法、设备、存储介质与流程

文档序号:32205703发布日期:2022-11-16 04:34阅读:33来源:国知局
一种车辆年款的筛选方法、设备、存储介质与流程

1.本技术涉及技术领域,具体涉及一种车辆年款的筛选方法、设备、存储介质。


背景技术:

2.对车辆进行结构化分析,需要从抓拍的车辆图像中筛选出不同年份的款式,以更新至年款识别模型。在现有文献中,存在通过聚类方法筛选新类别的方法,在标记集上监督训练特征提取模型,再从未标记数据集上提取特征执行聚类,筛选新类别,但这种方案减弱了标记类和未标记类之间的强语义相似性。
3.在现有技术中同时存在训练单个网络实现新类筛选的方法,对未标记的图像做2次不同增强,生成2个视图,把其中一个视图的预测值当做另一个视图的伪标签,实现分类网络训练。这种方法适用区分各种类别数据,但对于车辆年款筛选任务,年款类别数量大,计算难度较大,识别准确率有待提高。


技术实现要素:

4.为了解决上述的问题,本技术的实施例中提供了一种车辆年款的筛选方法、设备、存储介质,结合车辆特有属性预测未标记车辆图像的伪标签,提高车辆年款新类筛选的准确率。
5.为此,本技术的一个方面,提供一种车辆年款的筛选方法,本方法包括以下步骤:
6.获取车辆属性,根据车辆属性计算车辆属性损失函数;
7.获取已标记年款数据,计算所述已标记年款数据的特征;
8.根据所述年款分支特征生成年款伪标签,计算年款分支的损失函数;
9.根据所述车辆属性函数与所述年款分支的损失函数,构建基于深度神经网络的车辆年款识别模型;
10.获取待识别车辆图像,通过所述车辆年款识别模型,对车辆图像进行年款筛选。
11.进一步地,所述计算所述已标记年款数据的特征,具体为,
12.获取训练数据,所述训练数据为事先生成的伪标签;将所述训练数据通过第一图像增强模块与第二图像增强模块得到第一训练视图与第二训练视图,将所述第一训练视图与第二训练视图输入至主干网络,得到第一年款特征与第二年款特征。
13.进一步地,所述步骤s3中,根据所述年款分支特征生成年款伪标签,计算年款分支的损失函数,具体为,
14.获取第一训练视图与第二训练视图,将所述第一训练视图与第二训练视图通过迭代sinkhorn-knopp算法计算生成第一伪标签与第二伪标签;
15.根据所述第一伪标签与第二伪标签,计算年款分支的损失函数。
16.进一步地,所述年款分支的损失函数包括第一视图训练损失函数与第二训练视图损失函数,所述第一视图损失函数与所述第一伪标签相关,所述第二视图损失函数与所述第二伪标签相关。
17.进一步地,所述深度神经网络的损失函数为车辆属性损失函数、年款分支的损失函数之和。
18.进一步地,所述车辆属性包括车辆朝向、车型、品牌;所述根据车辆属性计算车辆属性损失函数,具体为,
19.获取训练数据,所述训练数据为已标记年款、车辆朝向、车型、品牌的数据集;
20.依次将已标记年款、车辆朝向、车型、品牌的数据集通过图像增强模块,得到视图,输入主干网络中,得到特征;
21.将特征输入至全连接层,计算已标记年款、车辆朝向、车型、品牌的损失函数。
22.进一步地,所述第一年款特征f
1m
为:
23.f
1m
=m(z1)
24.其中z1为特征,z1=b(d
a1
),d
a1
为第一训练视图。
25.进一步地,所述第一训练视图损失函数的计算公式为:
[0026][0027]
其中,为第一伪标签,k为特征的类别,,为为第一年款特征中第i维的特征;且其中t为常数,为第二年款特征中第i维的特征;
[0028]
第二训练视图损失函数的计算公式为:
[0029][0030]
本技术的另一方面,提供一种设备,其包括多个处理器、存储器及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上任一所述的一种车辆年款的筛选方法。
[0031]
本技术的另一方面,提供一种存储介质,其上存储有计算机程序,所述计算机程序被执行时实现如上任一所述一种车辆年款的筛选方法法。
[0032]
如上所述,本技术提供一种车辆年款的筛选方法、设备、存储介质,采用单个网络筛选,结合车辆属性及车辆属性损失函数、年款特征及年款特征损失函数构建基于深度神经网络的车辆识别模型,通过上述车辆识别模型进行年款新类筛选,减少了大量人工筛选成本,简化筛选流程,使得车辆年款新类筛选准确率高。
[0033]
五、本发明的应用范围。
[0034]
提供上述发明内容以简化形式介绍一些概念,这些概念将在下面的具体实施方式中进一步详细描述。上述发明内容既不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。本技术所要求保护的主题不限于解决背景技术中指出的任何或所有缺点的实施方式。
附图说明
[0035]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本技术的实施例,并与说明书一起用于解释本技术的原理。为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技
术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。这些附图和文字描述并不是为了通过任何方式限制本技术构思的范围,而是通过参考特定实施例为本领域技术人员说明本技术的概念。
[0036]
图1为本技术所提供实施例的流程示意图;
[0037]
图2为本技术所提供深度神经网络框图。
具体实施方式
[0038]
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本技术相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本技术的一些方面相一致的装置和方法的例子。
[0039]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素,此外,本技术不同实施例中具有同样命名的部件、特征、要素可能具有相同含义,也可能具有不同含义,其具体含义需以其在该具体实施例中的解释或者进一步结合该具体实施例中上下文进行确定。
[0040]
应当理解,尽管在本文可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本文范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语"如果"可以被解释成为"在
……
时"或"当
……
时"或"响应于确定"。再者,如同在本文中所使用的,单数形式“一”、“一个”和“该”旨在也包括复数形式,除非上下文中有相反的指示。应当进一步理解,术语“包含”、“包括”表明存在所述的特征、步骤、操作、元件、组件、项目、种类、和/或组,但不排除一个或多个其他特征、步骤、操作、元件、组件、项目、种类、和/或组的存在、出现或添加。本技术使用的术语“或”、“和/或”、“包括以下至少一个”等可被解释为包括性的,或意味着任一个或任何组合。仅当元件、功能、步骤或操作的组合在某些方式下内在地互相排斥时,才会出现该定义的例外。
[0041]
应该理解的是,虽然本技术实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
[0042]
取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在
……
时”或“当
……
时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。
[0043]
应当理解,此处所描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
[0044]
请参阅图1、2,本技术提供了一种车辆年款的筛选方法,结合车辆特有属性预测未标记车辆图像的伪标签,提高车辆年款新类筛选的准确率。
[0045]
具体的,本方法包括以下步骤:
[0046]
步骤s1、获取车辆属性,根据车辆属性计算车辆属性损失函数。
[0047]
车辆属性包括车辆朝向、车型、品牌,车型是指车辆类型,如轿车、suv、mpv等车型。车辆朝向是指车头指向的方向,品牌为车辆所属的系列。识别车辆属性,辅助车辆识别模型的分类,提高识别车辆年款的准确率。所述根据车辆属性计算车辆属性损失函数需要分别计算车辆朝向的损失函数、车型的损失函数与品牌的损失函数。
[0048]
首先获取训练数据d,所述训练数据为已标记年款、车辆朝向、车型、品牌的数据集。
[0049]
将训练数据d,即依次将已标记年款、车辆朝向、车型、品牌的数据集通过augment图像增强模块,得到视图da,输入主干网络backone中,并标记为b,得到特征z,如公式(1)所示:
[0050]
z=b(da)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0051]
将特征z输入至全连接,计算已标记年款、车辆朝向、车型、品牌的损失函数。
[0052]
具体的,以品牌为例,将特征z输入至得到fb,如公式(2)所示:
[0053]
fb=b(z)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0054]
将车辆的品牌标记为数据bln,类别为n,通过以下式子计算交叉熵crossentropyloss:
[0055][0056]
进而得到品牌的损失函数,标记为lb,如公式(3)所示:
[0057]
lb=crossentropyloss(fb,lb)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(3)
[0058]
同理,通过上述方式计算车辆朝向的损失函数ld,车型的损失函数l
t

[0059]
步骤s2、获取已标记年款数据,计算所述已标记年款数据的特征。
[0060]
年款数据为事先获取的车辆年款数据,并标注在车辆图像中。将已经标记的年款数据作为训练数据d,且训练数据d中包含k类。值得注意的是,在本技术中,在本训练过程中,训练数据为生成的伪标签,不使用真实标签。事先生成的伪标签包含生成的车辆年款数据,种类及数量分布齐全且平均,更有利于训练本车辆年款筛选模型。
[0061]
将训练数据d通过augment1第一图像增强模块,得到第一训练视图d
a1
,输入主干网络backone中,得到特征z1,如公式(4)所示:
[0062]
z1=b(d
a1
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(4)
[0063]
将特征z1输入至年款全连接层(model unlabeled head),类别为k,则得到第一年款特征f
1m
,如公式(5)所示:
[0064]f1m
=m(z1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(5)
[0065]
同理,将训练数据d通过augment2第二图像增强模块,得到第二训练视图d
a2
,通过主干网络backone与年款全连接层,得到第二年款特征
[0066]
步骤s3、通过根据所述年款分支特征生成年款伪标签,计算年款分支的损失函数。
[0067]
所述年款分支的损失函数包括第一训练视图损失函数与第二训练视图损失函数,因此获取上述步骤得到的第一训练视图与第二训练视图,将第一训练视图与第二训练视图通过迭代sinkhorn-knopp算法计算生成第一伪标签与第二伪标签;第一训练视图d
a1
的伪标签由经过sinkhorn-knopp模块计算,标记为
[0068]
第一伪标签的计算公式如公式(6)、(7)所示:
[0069][0070][0071]
为第一伪标签,t为常数,为第二年款特征中第i维的特征,由上述公式可知,第一伪标签由第二年款特征生成,标记为与第一年款特征f
1m
相关,将第一训练视图d
a1
的损失函数标记为l
a1
,其计算公式如公式(8)所示:
[0072][0073]
视图d
a2
的伪标签由f
1m
经过sinkhorn-knopp模块计算,标记为计算方法同视图d
a1
。第二训练视图d
a2
的损失函数标记为l
a2
,计算公式如(9)所示:
[0074][0075]
步骤s4、根据所述车辆属性函数与所述年款分支的损失函数,构建基于深度神经网络的车辆年款识别模型;
[0076]
如图2所示,为本车辆年款识别模型的深度神经网络框图。如图所示,所述深度神经网络的损失函数为车辆属性损失函数、年款分支的损失函数之和,如公式(10)所示:
[0077]
l=l
a1
+l
a2
+lb+ld+l
t
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(10)
[0078]
步骤s5、获取待识别车辆图像,通过所述车辆年款识别模型,对车辆图像进行年款筛选。
[0079]
将待识别年款的车辆通过上述车辆年款识别模型,由车辆识别模型结合车辆朝向、品牌、车型等特征,对车辆进行年款筛选,输出车辆的年款新类。
[0080]
本技术提供一种车辆年款的筛选方法,采用单个网络筛选,结合车辆属性及车辆属性损失函数、年款特征及年款特征损失函数构建基于深度神经网络的车辆识别模型,通过上述车辆识别模型进行年款新类筛选,减少了大量人工筛选成本,简化筛选流程,使得车辆年款筛选新类准确率高。
[0081]
基于相同的发明构思,另外,本发明还提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现前述一种智能家居设备批量设置的方法的步骤。
[0082]
其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可议介质包含的内容可以根据司法管
辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0083]
本发明可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、机顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
[0084]
上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
[0085]
在本技术中,对于相同或相似的术语概念、技术方案和/或应用场景描述,一般只在第一次出现时进行详细描述,后面再重复出现时,为了简洁,一般未再重复阐述,在理解本技术技术方案等内容时,对于在后未详细描述的相同或相似的术语概念、技术方案和/或应用场景描述等,可以参考其之前的相关详细描述。
[0086]
在本技术中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0087]
本技术技术方案的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本技术记载的范围。
[0088]
以上仅为本技术的优选实施例,并非因此限制本技术的专利范围,凡是利用本技术说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本技术的专利保护范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1