一种目标物体穿戴识别方法、装置、电子设备和存储介质与流程

文档序号:31053780发布日期:2022-08-06 09:57阅读:84来源:国知局
一种目标物体穿戴识别方法、装置、电子设备和存储介质与流程

1.本技术涉及图像处理技术领域,尤其涉及一种目标物体穿戴识别方法、装置、电子设备和存储介质。


背景技术:

2.随着智能化技术的普及,各行各业对于人体穿戴合规的需求逐渐增强,以手套穿戴为例,卫生行业特定场所要求穿戴防护手套,电力行业要求作业时佩戴绝缘手套,消防行业要求作业时佩戴消防手套等。通过规范相关人员的服饰穿戴行为,能够有效减少因违规穿戴导致的生产、操作事故。
3.相关技术中,主要是通过深度学习模型对视频图像进行目标检测,以判断视频图像中的人员是否穿戴目标物体的,但是上述方式在面对新场景时,受鲁棒性、泛化性的影响,对于人员是否穿戴目标物体的识别准确率较低,以目标物体为手套为例,当视频图像中的手部区域与训练集中的手部区域差异较大时,则容易错误判断视频图像中的人员是否穿戴手套。
4.因此,如何提高识别目标对象是否穿戴目标物体的准确率是目前亟待解决的问题。


技术实现要素:

5.本技术实施例提供一种目标物体穿戴识别方法、装置、电子设备和存储介质,用以提高识别目标对象是否穿戴目标物体的准确率。
6.本技术实施例提供的一种目标物体穿戴识别方法,包括:
7.对待识别图像进行目标检测,获得包含目标对象的目标区域图像;
8.对所述目标区域图像中的目标对象进行特征提取,获得目标对象特征;
9.确定辅助特征与所述目标对象特征之间的相似度;所述辅助特征至少基于对第一类样本图像中的样本对象进行特征提取获得,所述第一类样本图像包括n类别子样本图像,所述子样本图像的类别是基于所述子样本图像中的样本对象是否穿戴所述目标物体确定的,所述n为正整数;
10.基于所述相似度,确定所述目标对象是否穿戴所述目标物体。
11.在一种可选的实施方式中,所述n为大于1的整数;所述辅助特征包括:与所述n类别子样本图像中各类别子样本图像各自对应的子辅助特征,所述子辅助特征基于对对应的类别子样本图像中的样本对象进行特征提取获得;
12.所述确定辅助特征与所述目标对象特征之间的相似度,包括:
13.确定所述目标对象特征和所述各类别子样本图像各自对应的子辅助特征的子相似度;
14.所述基于所述相似度,确定所述目标对象是否穿戴所述目标物体,包括:
15.基于确定的各个子相似度,确定所述目标对象是否穿戴所述目标物体。
16.在一种可选的实施方式中,所述子辅助特征基于对至少两个目标样本图像中的样本对象进行特征提取获得,所述目标样本图像是所述子辅助特征对应的类别子样本图像中的样本图像。
17.在一种可选的实施方式中,所述n类别子样本图像包括第一表征图像和第二表征图像中的至少一种;
18.所述第一表征图像中的样本对象穿戴所述目标物体;
19.所述第二表征图像中的样本对象未穿戴所述目标物体。
20.在一种可选的实施方式中,所述对所述目标区域中的目标对象进行特征提取,获得目标对象特征,包括:
21.将所述目标区域图像输入已训练的特征提取模型,通过所述特征提取模型对所述目标区域图像中的目标对象进行特征提取,获得所述目标对象特征。
22.在一种可选的实施方式中,所述特征提取模型是基于第一训练样本数据集训练得到的,所述第一训练样本数据集至少包括所述第一类样本图像;
23.所述第一训练样本数据集还包括第二类样本图像,所述第二类样本图像为:表征所述样本对象穿戴不同样式的所述目标物体的样本图像。
24.在一种可选的实施方式中,通过下列方式获取所述第一训练样本数据集:
25.将初始样本图像和对应的分割图像输入已训练的风格迁移模型的编码层进行编码,获得所述初始样本图像的内容特征和所述分割图像的分割特征,所述分割图像是通过对所述初始样本图像进行像素分离获得的包含样本对象的前景区域图像;
26.将所述内容特征和所述分割特征输入所述风格迁移模型的特征融合层进行特征融合,获得第一融合特征;
27.将所述第一融合特征,以及目标迁移图像输入所述风格迁移模型的风格迁移层进行风格迁移,获得与所述目标迁移图像具有相同穿戴风格的第一训练样本数据。
28.在一种可选的实施方式中,所述穿戴风格包括穿戴状态风格和穿戴样式风格中的至少一种;
29.若所述风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则所述目标迁移图像为:表征所述样本对象针对所述目标物体为目标穿戴状态风格的参考图像,所述第一训练样本数据包括所述第一类样本图像,所述穿戴状态风格用于表征所述样本对象穿戴所述目标物体的状态;
30.若所述风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则所述目标迁移图像为:表征所述样本对象穿戴目标样式风格的所述目标物体的参考图像,所述第一训练样本数据包括所述第二类样本图像,所述穿戴样式风格用于表征所述样本对象穿戴所述目标物体的样式。
31.在一种可选的实施方式中,通过以下方式获得所述已训练的风格迁移模型:
32.根据第二训练样本数据集对待训练的风格迁移模型进行循环迭代训练,输出所述已训练的风格迁移模型,所述第二训练样本数据集中的每个第二训练样本数据包括对应的真实类别,在一次循环迭代过程中,执行以下操作:
33.对第二训练样本数据的第二融合特征进行特征展平,获得目标维度的第二融合特征;
34.基于所述风格迁移模型的特征映射层对所述目标维度的第二融合特征进行特征映射,获得所述第二训练样本数据的预测类别;
35.采用基于所述第二训练样本数据的预测类别和真实类别之间的差异构建的类别损失函数,对所述待训练的风格迁移模型进行参数调整。
36.在一种可选的实施方式中,若所述风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则所述预测类别和所述真实类别为:表征所述样本对象是否穿戴所述目标物体的穿戴类别;若所述风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则所述预测类别和所述真实类别为:表征所述样本对象穿戴所述目标物体的样式类别。
37.在一种可选的实施方式中,通过以下方式获得与所述n类别子样本图像中各类别子样本图像各自对应的子辅助特征:
38.对每个类别子样本图像,分别执行以下操作:
39.对于一个类别子样本图像,将所述一个类别子样本图像中的至少两个目标样本图像输入已训练的特征提取模型,获得所述至少两个目标样本图像各自对应的目标样本对象特征;
40.基于各目标样本对象特征之间的相似度,将所述各目标样本对象特征划分为预设数量的特征集合;
41.分别确定各特征集合中的各目标样本对象特征的平均特征,将获得的至少一个平均特征作为所述一个类别子样本图像对应的子辅助特征。
42.在一种可选的实施方式中,所述特征提取模型是通过以下方式训练得到的:
43.根据所述第一训练样本数据集对待训练的特征提取模型进行循环迭代训练,输出所述已训练的特征提取模型;其中,在一次循环迭代过程中,执行以下操作:
44.将选取的至少两个第一训练样本数据输入所述待训练的特征提取模型,获得所述至少两个第一训练样本数据各自对应的第一训练样本对象特征;
45.采用基于各第一训练样本对象特征之间的相似度构建的相似度损失函数,对所述待训练的特征提取模型进行参数调整。
46.在一种可选的实施方式中,所述相似度损失函数是通过以下方式构建的:
47.针对一个样本对象特征,分别执行以下操作:将所述一个样本对象特征分别与各样本对象特征进行组合,获得至少一个特征组,每个特征组包括两个样本对象特征;
48.分别获得各特征组中的两个样本对象特征之间的预测相似度,并基于各预测相似度与真实相似度之间的差距,构建相似度损失函数,其中,每个特征组的真实相似度是基于包含的两个样本对象特征各自对应的样本数据的类别标签确定的。
49.本技术实施例提供的一种目标物体穿戴识别装置,包括:
50.检测单元,用于对待识别图像进行目标检测,获得包含目标对象的目标区域图像;
51.提取单元,用于对所述目标区域图像中的目标对象进行特征提取,获得目标对象特征;
52.获取单元,用于确定辅助特征与所述目标对象特征之间的相似度,所述辅助特征至少基于对第一类样本图像中的样本对象进行特征提取获得,所述第一类样本图像包括n类别子样本图像,所述子样本图像的类别是基于所述子样本图像中的样本对象是否穿戴所述目标物体确定的,所述n为正整数;
53.确定单元,用于基于所述相似度,确定所述目标对象是否穿戴所述目标物体。
54.可选的,所述n为大于1的整数;所述辅助特征包括:与所述n类别子样本图像中各类别子样本图像各自对应的子辅助特征,所述子辅助特征基于对对应的类别子样本图像中的样本对象进行特征提取获得;
55.所述确定辅助特征与所述目标对象特征之间的相似度,包括:
56.确定所述目标对象特征和所述各类别子样本图像各自对应的子辅助特征的子相似度;
57.所述基于所述相似度,确定所述目标对象是否穿戴所述目标物体,包括:
58.基于确定的各个子相似度,确定所述目标对象是否穿戴所述目标物体。
59.可选的,所述子辅助特征基于对至少两个目标样本图像中的样本对象进行特征提取获得,所述目标样本图像是所述子辅助特征对应的类别子样本图像中的样本图像。
60.可选的,所述n类别子样本图像包括第一表征图像和第二表征图像中的至少一种;
61.所述第一表征图像中的样本对象穿戴所述目标物体;
62.所述第二表征图像中的样本对象未穿戴所述目标物体。
63.可选的,所述提取单元具体用于:
64.将所述目标区域图像输入已训练的特征提取模型,通过所述特征提取模型对所述目标区域图像中的目标对象进行特征提取,获得所述目标对象特征。
65.可选的,所述特征提取模型是基于第一训练样本数据集训练得到的,所述第一训练样本数据集至少包括所述第一类样本图像;
66.所述第一训练样本数据集还包括第二类样本图像,所述第二类样本图像为:表征所述样本对象穿戴不同样式的所述目标物体的样本图像。
67.可选的,通过下列方式获取所述第一训练样本数据集:
68.将初始样本图像和对应的分割图像输入已训练的风格迁移模型的编码层进行编码,获得所述初始样本图像的内容特征和所述分割图像的分割特征,所述分割图像是通过对所述初始样本图像进行像素分离获得的包含样本对象的前景区域图像;
69.将所述内容特征和所述分割特征输入所述风格迁移模型的特征融合层进行特征融合,获得第一融合特征;
70.将所述第一融合特征,以及目标迁移图像输入所述风格迁移模型的风格迁移层进行风格迁移,获得与所述目标迁移图像具有相同穿戴风格的第一训练样本数据。
71.可选的,所述穿戴风格包括穿戴状态风格和穿戴样式风格中的至少一种;
72.若所述风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则所述目标迁移图像为:表征所述样本对象针对所述目标物体为目标穿戴状态风格的参考图像,所述第一训练样本数据包括所述第一类样本图像,所述穿戴状态风格用于表征所述样本对象穿戴所述目标物体的状态;
73.若所述风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则所述目标迁移图像为:表征所述样本对象穿戴目标样式风格的所述目标物体的参考图像,所述第一训练样本数据包括所述第二类样本图像,所述穿戴样式风格用于表征所述样本对象穿戴所述目标物体的样式。
74.可选的,通过以下方式获得所述已训练的风格迁移模型:
75.根据第二训练样本数据集对待训练的风格迁移模型进行循环迭代训练,输出所述已训练的风格迁移模型,所述第二训练样本数据集中的每个第二训练样本数据包括对应的真实类别,在一次循环迭代过程中,执行以下操作:
76.对第二训练样本数据的第二融合特征进行特征展平,获得目标维度的第二融合特征;
77.基于所述风格迁移模型的特征映射层对所述目标维度的第二融合特征进行特征映射,获得所述第二训练样本数据的预测类别;
78.采用基于所述第二训练样本数据的预测类别和真实类别之间的差异构建的类别损失函数,对所述待训练的风格迁移模型进行参数调整。
79.可选的,若所述风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则所述预测类别和所述真实类别为:表征所述样本对象是否穿戴所述目标物体的穿戴类别;若所述风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则所述预测类别和所述真实类别为:表征所述样本对象穿戴所述目标物体的样式类别。
80.可选的,通过以下方式获得与所述n类别子样本图像中各类别子样本图像各自对应的子辅助特征:
81.对每个类别子样本图像,分别执行以下操作:
82.对于一个类别子样本图像,将所述一个类别子样本图像中的至少两个目标样本图像输入已训练的特征提取模型,获得所述至少两个目标样本图像各自对应的目标样本对象特征;
83.基于各目标样本对象特征之间的相似度,将所述各目标样本对象特征划分为预设数量的特征集合;
84.分别确定各特征集合中的各目标样本对象特征的平均特征,将获得的至少一个平均特征作为所述一个类别子样本图像对应的子辅助特征。
85.可选的,所述特征提取模型是通过以下方式训练得到的:
86.根据所述第一训练样本数据集对待训练的特征提取模型进行循环迭代训练,输出所述已训练的特征提取模型;其中,在一次循环迭代过程中,执行以下操作:
87.将选取的至少两个第一训练样本数据输入所述待训练的特征提取模型,获得所述至少两个第一训练样本数据各自对应的第一训练样本对象特征;
88.采用基于各第一训练样本对象特征之间的相似度构建的相似度损失函数,对所述待训练的特征提取模型进行参数调整。
89.可选的,所述相似度损失函数是通过以下方式构建的:
90.针对一个样本对象特征,分别执行以下操作:将所述一个样本对象特征分别与各样本对象特征进行组合,获得至少一个特征组,每个特征组包括两个样本对象特征;
91.分别获得各特征组中的两个样本对象特征之间的预测相似度,并基于各预测相似度与真实相似度之间的差距,构建相似度损失函数,其中,每个特征组的真实相似度是基于包含的两个样本对象特征各自对应的样本数据的类别标签确定的。
92.本技术实施例提供的一种电子设备,包括处理器和存储器,其中,所述存储器存储有计算机程序,当所述计算机程序被所述处理器执行时,使得所述处理器执行上述任意一种目标物体穿戴识别方法的步骤。
93.本技术实施例提供一种计算机可读存储介质,其包括计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行上述任意一种目标物体穿戴识别方法的步骤。
94.本技术实施例提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序存储在计算机可读存储介质中;当电子设备的处理器从计算机可读存储介质读取所述计算机程序时,所述处理器执行所述计算机程序,使得所述电子设备执行上述任意一种目标物体穿戴识别方法的步骤。
95.本技术有益效果如下:
96.本技术实施例提供的目标物体穿戴识别方法、装置、电子设备和存储介质,由于本技术通过对待识别图像进行目标检测,获得包含目标对象的目标区域图像,滤除了待识别图像中的无关区域图像,减少无关特征的干扰,进而,对目标区域图像中的目标对象进行特征提取,获得目标对象特征,然后,确定辅助特征与目标对象特征之间的相似度,其中,辅助特征是通过对能够表征样本对象是否穿戴目标物体的样本图像进行特征提取获得的,基于相似度,确定目标对象是否穿戴目标物体,能够适应不同场景下对目标对象是否穿戴目标物体进行识别,提高识别目标对象是否穿戴目标物体的准确率。
97.本技术的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本技术而了解。本技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
98.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
99.图1为本技术实施例中的一种应用场景的一个可选的示意图;
100.图2为本技术实施例中的一种目标物体穿戴识别方法的实施流程图;
101.图3为本技术实施例中的一种风格迁移模型的结构示意图;
102.图4为本技术实施例中的一种风格迁移模型的训练流程示意图;
103.图5为本技术实施例中的一种特征提取模型的训练流程示意图;
104.图6为本技术实施例中的一种目标物体穿戴识别方法的流程示意图;
105.图7为本技术实施例中的一种目标物体穿戴识别装置的结构示意图;
106.图8为应用本技术实施例的一种电子设备的一个硬件组成结构示意图;
107.图9为应用本技术实施例的另一种电子设备的一个硬件组成结构示意图。
具体实施方式
108.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例中的附图,对本技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术技术方案的一部分实施例,而不是全部的实施例。基于本技术文件中记载的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术技术方案保护的范围。
109.下面对本技术实施例中涉及的部分概念进行介绍。
110.风格迁移模型:用于基于目标迁移图像对初始样本图像进行风格迁移,获得目标样本图像,在本技术实施例中,可以分别训练两个独立的风格迁移模型:一个风格迁移模型用于进行样本对象穿戴目标物体和样本对象未穿戴目标物体之间的风格迁移,例如,将样本对象穿戴目标物体的图像迁移为样本对象未穿戴目标物体的图像;另一个风格迁移模型用于进行样本对象穿戴不同样式的目标物体之间的风格迁移,例如,将样本对象穿戴白色目标物体的图像迁移为样本对象穿戴黑色目标物体的图像。
111.初始样本图像:指需要通过风格迁移模型进行风格迁移的样本图像,初始样本图像可以是样本对象穿戴目标物体的图像,也可以是样本对象未穿戴目标物体的图像,还可以是样本对象穿戴不同样式的目标物体的图像,通过对初始样本图像进行风格迁移,能够有效扩充第一训练样本数据集。
112.目标迁移图像:指为初始样本图像提供风格迁移的目标的图像,例如,初始样本图像为样本对象穿戴目标物体的图像,目标迁移图像为样本对象未穿戴目标物体的图像,则通过风格迁移将初始样本图像转化为样本对象未穿戴目标物体的图像。
113.第一训练样本数据集:用于对待训练的特征提取模型进行循环迭代训练,以及基于已训练的特征提取模型对第一训练样本数据进行特征提取获得辅助特征集合,第一训练样本数据集是通过风格迁移模型对初始样本图像进行扩充后获得的。
114.第二训练样本数据集:用于对待训练的风格迁移模型进行循环迭代训练,获得已训练的风格迁移模型。
115.辅助特征集合:包括至少一个辅助特征,通过比较目标对象特征与辅助特征之间的相似度,能够确定目标对象是否穿戴目标物体。
116.以下结合说明书附图对本技术的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本技术,并不用于限定本技术,并且在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
117.如图1所示,其为本技术实施例的应用场景示意图。该应用场景图中包括两个终端设备110和一个服务器120。
118.在本技术实施例中,终端设备110包括但不限于手机、平板电脑、笔记本电脑、台式电脑、电子书阅读器、智能语音交互设备、智能家电、车载终端等设备;终端设备上可以安装有目标物体穿戴识别相关的客户端,该客户端可以是软件(例如浏览器、视频软件等),也可以是网页、小程序等,服务器120则是与软件或是网页、小程序等相对应的后台服务器,或者是专门用于进行目标物体穿戴识别的服务器,本技术不做具体限定。服务器120可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn(content delivery network,内容分发网络)、以及大数据和人工智能平台等基础云计算服务的云服务器。
119.需要说明的是,本技术实施例中的目标物体穿戴识别方法可以由电子设备执行,该电子设备可以为服务器120或者终端设备110,即,该方法可以由服务器120或者终端设备110单独执行,也可以由服务器120和终端设备110共同执行。比如由服务器120和终端设备110共同执行时,终端设备110将待识别图像发送给服务器120,服务器120对待识别图像进行目标检测,获得包含目标对象的目标区域图像,并对目标区域图像中的目标对象进行特
征提取,获得目标对象特征,然后确定辅助特征与目标对象特征之间的相似度,基于相似度,确定目标对象是否穿戴目标物体,将包含目标对象是否穿戴目标物体的信息发送给终端设备110,以使终端设备110根据信息确定目标对象是否穿戴目标物体。
120.在一种可选的实施方式中,终端设备110与服务器120之间可以通过通信网络进行通信。
121.在一种可选的实施方式中,通信网络是有线网络或无线网络。
122.需要说明的是,图1所示只是举例说明,实际上终端设备和服务器的数量不受限制,在本技术实施例中不做具体限定。
123.本技术实施例中,当服务器的数量为多个时,多个服务器可组成为一区块链,而服务器为区块链上的节点;如本技术实施例所公开的终端设备110方法,其中所涉及的辅助特征可保存于区块链上。
124.此外,本技术实施例可应用于各种场景,不仅包括目标物体穿戴识别场景,还包括但不限于云技术、人工智能、智慧交通、辅助驾驶等场景。
125.下面结合上述描述的应用场景,参考附图来描述本技术示例性实施方式提供的目标物体穿戴识别方法,需要注意的是,上述应用场景仅是为了便于理解本技术的精神和原理而示出,本技术的实施方式在此方面不受任何限制。
126.参阅图2所示,为本技术实施例提供的一种目标物体穿戴识别方法的实施流程图,以执行主体为服务器为例,该方法的具体实施流程包括如下步骤s21-s24:
127.s21:服务器对待识别图像进行目标检测,获得包含目标对象的目标区域图像;
128.具体地,对待识别图像进行目标检测,目标对象可以是人体部位,例如手部、头部和足部等部位,检测到目标对象之后,目标区域可以是包含目标对象的最小矩形、圆形,也可以是预设长度和宽度的区域等,本技术在此不做具体限定。
129.其中,在本技术实施例中可以基于yolo检测模型对待识别图像进行目标检测,也可以基于ssd(single shot multibox detector,多分类单杆检测器)、fasterrcnn(更快速的区域循环神经网络)、googlenet(谷歌网络)、resnet(deep residual network,深度残差网络)、densenet(densely connected convolutional networks,密集连接的卷积网络)等深度学习网络检测模型进行目标检测,本技术在此不做具体限定。
130.s22:服务器对目标区域图像中的目标对象进行特征提取,获得目标对象特征;
131.s23:服务器确定辅助特征与目标对象特征之间的相似度;
132.其中,辅助特征至少是基于对第一类样本图像中的样本对象进行特征提取获得的,第一类样本图像包括n类别子样本图像,子样本图像的类别是基于子样本图像中的样本对象是否穿戴目标物体确定的,并且n为正整数。例如,第一类样本图像包括的一个类别的子样本图像为样本对象穿戴目标物体的样本图像,则通过对第一类样本图像进行特征提取,能够获得样本对象穿戴目标物体的特征表示,即辅助特征。具体的,辅助特征和目标对象特征可以是向量的形式,则计算辅助特征与目标对象特征之间余弦相似度。
133.s24:服务器基于相似度,确定目标对象是否穿戴目标物体。
134.其中,基于辅助特征与目标对象特征之间的相似度,能够确定目标对象是否穿戴目标物体,例如,可以通过设置相似度阈值,若辅助特征与目标对象特征之间的相似度高于相似度阈值,则确定目标对象穿戴目标物体;也可以是辅助特征包括辅助特征1和辅助特征
2,目标对象特征分别与辅助特征1和辅助特征2计算相似度,获得相似度1和相似度2,若相似度1大于相似度2,则确定目标对象穿戴目标物体。需要说明的是,上述列举了两种方式用以说明确定目标对象的穿戴信息的过程,实际上也可以是其他确定目标对象的穿戴信息的方式,本技术在此不做具体限定。
135.在本技术实施例中,通过对待识别图像进行目标检测,获得包含目标对象的目标区域图像,滤除了待识别图像中的无关区域图像,减少无关特征的干扰,进而,对目标区域图像中的目标对象进行特征提取,获得目标对象特征,然后,确定辅助特征与目标对象特征之间的相似度,其中,辅助特征是通过对能够表征样本对象是否穿戴目标物体的样本图像进行特征提取获得的,基于相似度,确定目标对象是否穿戴目标物体,能够适应不同场景下对目标对象是否穿戴目标物体进行识别,提高识别目标对象是否穿戴目标物体的准确率。
136.在一种可选的实施方式中,通过以下方式实施步骤s22:
137.首先,将目标区域图像输入已训练的特征提取模型,然后,通过特征提取模型对目标区域图像中的目标对象进行特征提取,获得目标对象特征。
138.在一种可选的实施方式中,特征提取模型是基于第一训练样本数据集训练得到的,第一训练样本数据集至少包括第一类样本图像,还可包括第二类样本图像,第二类样本图像为:表征样本对象穿戴不同样式的目标物体的样本图像,其中,不同样式可以是指目标对象的颜色不同,例如红、白、黑、蓝等,也可以是指材质不同,例如塑料、毛线和棉麻等材质,例如,当目标对象为手部,目标物体为手套时,第一类样本图像包括样本对象戴手套的图像和样本对象不戴手套的图像,第二类样本图像包括样本对象戴不同颜色的手套的图像。特征提取模型可以是simclrv2(视觉表征对比学习框架)模型,也可以是mocov2模型等其他可用于提取特征的模型,在此不做具体限定。
139.在本技术实施例中,由于第一训练样本数据集可以包括样本对象穿戴目标对象的图像和未穿戴目标物体的图像,也可以包括样本对象穿戴不同样式的目标物体的图像,还可以同时包括以上图像,训练数据丰富,因此通过第一训练样本数据集训练出的特征提取模型能够更加准确的提取目标对象特征。
140.下面以目标对象为手部,目标物体为手套介绍本技术中的目标物体穿戴识别方法。
141.在一种可选的实施方式中,通过下列步骤获取第一训练样本数据集:
142.步骤1:将初始样本图像和对应的分割图像输入已训练的风格迁移模型的编码层进行编码,获得初始样本图像的内容特征和分割图像的分割特征;
143.步骤2:将内容特征和分割特征输入风格迁移模型的特征融合层进行特征融合,获得第一融合特征;
144.步骤3:将第一融合特征,以及目标迁移图像输入风格迁移模型的风格迁移层进行风格迁移,获得与目标迁移图像具有相同穿戴风格的第一训练样本数据。
145.其中,分割图像是通过对初始样本图像进行像素分离获得的包含样本对象的前景区域图像,以样本对象为手部为例,分割图像则是表示初始样本图像中手部的位置,也可以是手部区域的掩码,即需要进行风格迁移的目标位置。通过风格迁移模型获得的第一训练样本数据与目标迁移图像具有相同的穿戴风格,例如,初始样本图像为手部1未穿戴手套的图像,目标迁移图像为手部2未穿戴手套,则输出的第一训练样本数据为手部1穿戴手套的
图像。
146.在一种可选的实施方式中,穿戴风格包括穿戴状态风格和穿戴样式风格中的至少一种;
147.若风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则目标迁移图像为:表征样本对象针对目标物体为目标穿戴状态风格的参考图像,第一训练样本数据包括第一类样本图像;
148.若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则目标迁移图像为:表征样本对象穿戴目标样式风格的目标物体的参考图像,第一训练样本数据包括第二类样本图像,穿戴样式风格用于表征样本对象穿戴目标物体的样式。
149.其中,穿戴状态风格用于表征样本对象穿戴目标物体的状态,若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则目标迁移图像可以是样本对象穿戴手套的图像,也可以是样本对象未穿戴手套的图像;穿戴样式风格用于表征样本对象穿戴目标物体的样式,若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,以样式为颜色为例,则目标迁移图像可以是样本对象穿戴黑色目标物体的图像,也可以是样本对象穿戴蓝色目标物体的图像。
150.在本技术实施例中,通过训练两个独立风格迁移模型,一个模型能够将戴手套图像的风格迁移到不戴手套图像上(即戴与不戴手套数据互相转换模型),另一个模型能够将戴手套图像风格互相迁移(即戴手套数据相互转换模型),由于在实际应用中不戴手套的图像往往多于戴手套的图像,并且不戴手套的图像的丰富性更强,使用以上方法进行训练样本数据集扩充时,能够解决手部多姿态影响,并且通过戴不同样式的手套图像之间风格互相迁移,也能够极大丰富训练样本数据集中的手套类型。
151.在一种可选的实施方式中,通过以下方式获得已训练的风格迁移模型,参阅图3,其为本技术实施例中的一种风格迁移模型的结构示意图:
152.根据第二训练样本数据集对待训练的风格迁移模型进行循环迭代训练,输出已训练的风格迁移模型,在一次循环迭代过程中的实施流程如图4所示,包括以下步骤:
153.s41:服务器对第二训练样本数据的第二融合特征进行特征展平,获得目标维度的第二融合特征;
154.s42:服务器基于风格迁移模型的特征映射层对目标维度的第二融合特征进行特征映射,获得第二训练样本数据的预测类别;
155.s43:服务器采用基于第二训练样本数据的预测类别和真实类别之间的差异构建的类别损失函数,对待训练的风格迁移模型进行参数调整。
156.其中,第二训练样本数据集中的每个第二训练样本数据包括对应的真实类别,在步骤s1之前,通过风格迁移模型的编码层获得第二训练样本数据的内容特征和分割特征,并通过特征融合层对内容特征和分割特征进行特征融合,获得第二融合特征。
157.具体地,风格迁移模型是基于妆容迁移模型(symmetric semantic-aware transformer,ssat)获得的,风格迁移模型具有迁移手套风格能力,与原始的ssat不同之处在于,在本技术中使用的手套数据是分为戴手套和不戴手套两个明确语义类别的,因此可以在ssat网络中的特征融合(即ff)模块后通过全连接层进行特征映射,转换成语义特征即戴与不戴手套进行额外的监督训练,从形式来看,即特征映射后输出一个语义特征的值,1
或0。
158.具体地,如图3所示,实线流程为原始ssat基本结构,虚线流程为特征映射操作,将ff模块输出的融合特征进行参数为[batch_size,-1]的reshape(重塑)操作进行展平,其中batch_size表示批次,将融合特征展平为1维特征,然后输入到特征映射模块,其具体形式为输入维度与展平后的融合特征维度相同,输出维度为[batch_size,2]的全连接网络,即输出语义特征的维度为2,这样就从形式上类似二分类的监督学习,然后通过softmax(归一化)损失函数进行优化。监督学习的监督信息就是当前图片的戴(1)与不戴(0)手套标注信息形成无监督与监督学习相结合的形式。
[0159]
原始ssat训练属于无监督学习,基本上沿用了gan网络的训练思想,本技术增加的额外语义信息监督属于监督学习,这样操作能够生效的原因是,在潜在空间中的戴手套与不戴手套特征是分开的,使用戴与不戴手套信息进行监督,能够指导融合后的特征在自己的特征空间更加内聚,从而在对称语义对应特征传递(sscft)模块中的注意力机制能够更加凸显不同语义的特征,进而能够在对应位置实现戴手套与不戴手套的转换。
[0160]
在本技术实施例中,通过风格迁移模型对初始样本图像进行数据扩充,获得的第一训练样本数据集具有更多手部姿态的样本数据,能够解决手部多姿态影响,并且手套之间风格互相迁移,也能够极大丰富数据集中的手套类型。
[0161]
在一种可选的实施方式中,若风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则预测类别和真实类别为:表征样本对象是否穿戴目标物体的穿戴类别;若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则预测类别和真实类别为:表征样本对象穿戴目标物体的样式类别。
[0162]
其中,若风格迁移模型为戴与不戴手套数据互相转换模型,可以是预测类别是样本对象戴手套,真实类别是样本对象戴手套,也可以是预测类别是样本对象戴手套,真实类别是样本对象不戴手套,在此不一一列举;若风格迁移模型为戴手套数据相互转换模型,则可以是预测类别是样本对象戴黑色手套,真实类别是样本对象戴黑色手套,也可以是其他形式,在此不一一列举。
[0163]
当训练戴与不戴手套数据互相转换模型时,戴与不戴手套两种监督信息(即真实类别)可以用0和1表示,而训练戴手套数据相互转换模型时,以不同样式为不同颜色为例,将相应的监督信息改成手套颜色具体类别即可,例如手套颜色为红、白、蓝、黑、橙,则监督信息可以分别用0、1、2、3、4表示,以不同样式为不同手部姿态为例,则相应的监督信息为手部姿态类别,例如,手部姿态包括手部握拳和手部张开,手部握拳和手部张开的监督信息分别设置为0和1。
[0164]
在本技术实施例中,使用风格迁移技术(ssat方法)进行数据集扩充,一方面可以将戴手套风格迁移到不戴手套数据上,例如,初始情况下,拥有手部握拳的戴手套图像和手部张开的不戴手套图像,则通过风格迁移模型则可以获得手部握拳的不戴手套图像和手部张开的戴手套图像,解决手部姿态多样性问题;另一方面可以将不同类型的手套互相迁移风格,例如,将手部握拳戴黑色手套图像和手部张开戴白色手套图像进行风格迁移,能够获得手部握拳戴白色手套图像和手部张开戴黑色手套图像,用来解决手套颜色、类型多样性问题。能够有效提升手套整体识别性能。
[0165]
在一种可选的实施方式中,n为大于1的整数;辅助特征包括:与n类别子样本图像
中各类别子样本图像各自对应的子辅助特征,子辅助特征基于对对应的类别子样本图像中的样本对象进行特征提取获得;通过以下方式获得辅助特征和目标对象特征之间的相似度,并确定目标对象是否穿戴目标物体:
[0166]
首先,确定目标对象特征和各类别子样本图像各自对应的子辅助特征的子相似度;然后,基于确定的各个子相似度,确定目标对象是否穿戴目标物体。
[0167]
具体地,以n为2为例,2个类别的子样本图像分别是样本对象穿戴目标物体的图像和样本对象未穿戴目标物体的图像,例如,目标对象特征与样本对象穿戴目标物体的子辅助特征之间的子相似度为0.8,目标对象特征与样本对象未穿戴目标物体的子辅助特征之间的子相似度为0.1,则确定目标对象穿戴目标物体。
[0168]
在一种可选的实施方式中,子辅助特征基于对至少两个目标样本图像中的样本对象进行特征提取获得,目标样本图像是子辅助特征对应的类别子样本图像中的样本图像。
[0169]
例如,子样本图像的类别为样本对象穿戴目标物体,则目标样本图像为样本对象穿戴目标物体的图像,通过对目标样本图像中的样本对象进行特征提取,获得的子辅助特征则能够表示样本对象穿戴目标物体的特征。
[0170]
在一种可选的实施方式中,n类别子样本图像包括第一表征图像和第二表征图像中的至少一种;第一表征图像中的样本对象穿戴目标物体,第二表征图像中的样本对象未穿戴目标物体。
[0171]
具体地,第一表征图像可以为样本对象戴手套的图像,第二表征图像为样本对象不戴手套的图像。
[0172]
在一种可选的实施方式中,通过以下方式获得与n类别子样本图像中各类别子样本图像各自对应的子辅助特征:
[0173]
对每个类别子样本图像,分别执行以下操作:
[0174]
对于一个类别子样本图像,将一个类别子样本图像中的至少两个目标样本图像输入已训练的特征提取模型,获得至少两个目标样本图像各自对应的目标样本对象特征;基于各目标样本对象特征之间的相似度,将各目标样本对象特征划分为预设数量的特征集合;分别确定各特征集合中的各目标样本对象特征的平均特征,将获得的至少一个平均特征作为一个类别子样本图像对应的子辅助特征。
[0175]
具体地,预设数量可以为一个预设数量,也可以为其他数量的预设数量,例如,预设数量为1,则将各目标样本对象特征划分为1个特征集合,若预设数量为1和2,则先将目标样本对象特征划分为1个特征集合,再将目标样本对象特征划分为2个特征集合,其他预设数量划分的特征集合以此类推。
[0176]
例如,对于一个类别子样本图像,获取到的目标对象特征可以使用两次独立的k-means聚类算法,质心数k第一次取1,则得到此类别子样本图像对应的1个特征集合,质心数k第二次取6,得到6个特征集合,分别对获得的7个特征集合中包括的目标对象特征取平均特征,将获得的7个平均特征作为此类别子样本图像对应的子辅助特征,相应的,其他类别的子样本对象各自对应的子辅助特征的获取方式同上述实施例,在此不做赘述。
[0177]
在本技术实施例中,通过上述方式获得子辅助特征,相比较使用原始全部特征集,此方式能够大大减少进行特征匹配时的复杂计算,相比较使用原始特征集的平均特征进行匹配,此方式有助于减少平均特征带来的偶然性,从而提升整体相似度匹配时的准确度。
7与目标对象特征之间的相似度,获得第二相似度1-7,并将第二相似度1-7的均值作为第二平均相似度。若第一平均相似度不小于第二平均相似度,则确定目标对象穿戴目标物体,若第一平均相似度小于第二平均相似度,则确定目标对象未穿戴目标物体。
[0190]
例如,目标对象特征与戴手套聚簇特征(g1,g6)计算平均相似度,记为α,目标对象特征与不戴手套聚簇特征(g1,g6)计算平均相似度,记为β,α-β得到相对平均相似度。当相对平均相似度大于等于0时,认为当前手部区域特征与戴手套特征更相似,因此判定为戴手套结果,输出是(1),反之,判定为不戴手套结果,输出否(0)。
[0191]
在本技术实施例中,通过分别将戴手套图像输入特征提取模型获得戴手套辅助特征,将不戴手套图像输入特征提取模型获得不戴手套辅助特征,并根据目标对象特征与哪种辅助特征之间的相似度更高,确定目标对象是否穿戴手套,能够减少平均特征带来的偶然性,提高识别准确度。使用相对平均相似度进行是否戴手套判定输出,避免手动设置阈值的偶然性,从而提升整体的检测性能。
[0192]
在一种可选的实施方式中,特征提取模型是通过以下方式训练得到的:
[0193]
根据第一训练样本数据集对待训练的特征提取模型进行循环迭代训练,输出已训练的特征提取模型;其中,在一次循环迭代过程中,执行如图5所示的实施流程,包括以下步骤:
[0194]
s51:服务器将选取的至少两个第一训练样本数据输入待训练的特征提取模型,获得至少两个第一训练样本数据各自对应的第一训练样本对象特征;
[0195]
s52:服务器采用基于各第一训练样本对象特征之间的相似度构建的相似度损失函数,对待训练的特征提取模型进行参数调整。
[0196]
具体地,与原始自监督训练方式不同之处在于,本方案在对每一批次(batch)的样本进行处理时,不再将同一图像及其数据增强后的配对图像作为当前批次中唯一的正样本对,而是直接根据图像的标签中的戴与不戴手套标注信息,将同一批次中具有相同标签的样本配合余弦相似度损失函数进行优化。
[0197]
在本技术实施例中,通过自监督学习的训练方式获得的特征提取模型,能够将相似的特征拉近,并且将不相似的特征拉远,这样就能够使得网络将戴手套数据特征形成一类聚簇,不戴手套数据形成另一类聚簇,并且将对训练数据集进行特征提取得到的特征保存下来,形成辅助特征。
[0198]
在一种可选的实施方式中,相似度损失函数是通过以下方式构建的:
[0199]
针对一个样本对象特征,分别执行以下操作:将一个样本对象特征分别与各样本对象特征进行组合,获得至少一个特征组,每个特征组包括两个样本对象特征;
[0200]
分别获得各特征组中的两个样本对象特征之间的预测相似度,并基于各预测相似度与真实相似度之间的差距,构建相似度损失函数,其中,每个特征组的真实相似度是基于包含的两个样本对象特征各自对应的样本数据的类别标签确定的。
[0201]
例如,输入的样本批次大小n,即对于样本[b1,b2,b3

bn],特征提取模型输出的特征为[f1,f2

fn],fn与bn相对应,其中fn的维度为n,通过[f1,f2

fn]
t
·
[f1,f2

fn],计算得到n*n的余弦相似度矩阵fc:
[0202][0203]
其中,
·
表示内积,t表示矩阵转置,矩阵中的每一个元素都是特征提取后的代表两个样本对象特征的n维向量点成后的相似度值,矩阵中每个元素的值在训练阶段相当于网络(即特征提取模型)的预测的值,这个值在网络没有训练好也即没有收敛之前是不准确的,需要利用监督信息对它进行优化。类比经典cnn分类网络,网络最后的输出层也是一个当前图片的类别值,但是这个值需要网络训练好之后才能准确预测图片的类别,而我们用标注的标签作为监督信息就是在优化网络让它输出的这个值更准确。
[0204]
余弦相似度矩阵中各元素对应位置的监督信息根据样本标签是否一致赋值为1(一致)或0(不一致)。这里生成相对应的监督信息矩阵也有简便算法。假设此批次样本[b1,b2,b3

bn]对应的标注信息为戴手套(1)不戴手套(0),即标注信息矩阵为[1,0,1

1],记为l,那么fc对应的监督信息应该具有此类特性,即对于fc中的每一个元素的下标所在的l中的两个位置,如果同为1或同为0,则监督信息为1,否则监督信息为0。因此可以在生成监督矩阵时,先将l中元素0替换成-1,然后进行l
t
·
l得到监督信息矩阵,再把其中的-1替换成0即可。
[0205]
余弦相似度矩阵中的每个元素表示各特征组中的两个样本对象特征之间的预测相似度,在获得监督信息矩阵后,即获得了每个特征组的真实相似度,根据各预测相似度与真实相似度之间的差距,构建相似度损失函数,并进行模型参数调整。
[0206]
在本技术实施例中,考虑大多数标记信息基本沿用0,1,2

自然数累加标记,并且本技术恰好有两类0,1标注信息,通过上述方式获得每个特征组的真实相似度,无需通过遍历判断两个标注是否一致,提高了相似度损失的计算效率。使用自监督学习技术进行手部区域特征提取,能够有效避免因监督学习导致的对训练场景的过拟合,从而增强手套识别的鲁棒性。
[0207]
参阅图6,其为本技术实施例中的一种目标物体穿戴识别方法的流程示意图,包括以下步骤:
[0208]
s61:输入待识别图像;
[0209]
s62:检测待识别图像中是否包含手部,若是,执行步骤s63,否则执行步骤s61;
[0210]
s63:对包含手部的目标区域图像进行特征提取,获得手部特征;
[0211]
s64:分别计算手部特征与戴手套辅助特征之间的第一平均相似度,以及手部特征与不戴手套辅助特征之间的第二平均相似度;
[0212]
s65:判断第一平均相似度是否小于第二平均相似度,若是,执行步骤s66,否则执行步骤s61;
[0213]
s66:待识别图像中手部不戴手套;
[0214]
s67:发出警报。
[0215]
在本技术实施例中,实现了一种针对手套作业合规的检测方案,该方案通过妆容风格迁移进行手部数据集增强以及自监督学习方式进行手部特征提取,分析并报警不合规事件,使用妆容风格迁移根据不戴手套数据进行戴手套数据的多姿态数据增强以及使用戴手套数据进行多类别、多颜色数据增强,使用自监督学习方式进行特征提取并根据已经存
储的辅助特征数据计算出平均相似度,根据相对平均相似度自适应得出是否戴手套判断结果。
[0216]
基于相同的发明构思,本技术实施例还提供一种目标物体穿戴识别装置。
[0217]
如图7所示,其为目标物体穿戴识别装置700的结构示意图,可以包括:
[0218]
检测单元701,用于对待识别图像进行目标检测,获得包含目标对象的目标区域图像;
[0219]
提取单元702,用于对目标区域图像中的目标对象进行特征提取,获得目标对象特征;
[0220]
获取单元703,用于确定辅助特征与目标对象特征之间的相似度,辅助特征至少基于对第一类样本图像中的样本对象进行特征提取获得,第一类样本图像包括n类别子样本图像,子样本图像的类别是基于子样本图像中的样本对象是否穿戴目标物体确定的,n为正整数;
[0221]
确定单元704,用于基于相似度,确定目标对象是否穿戴目标物体。
[0222]
可选的,n为大于1的整数;辅助特征包括:与n类别子样本图像中各类别子样本图像各自对应的子辅助特征,子辅助特征基于对对应的类别子样本图像中的样本对象进行特征提取获得;
[0223]
所述获取单元703具体用于:
[0224]
确定目标对象特征和各类别子样本图像各自对应的子辅助特征的子相似度;
[0225]
所述确定单元704具体用于:
[0226]
基于确定的各个子相似度,确定目标对象是否穿戴目标物体。
[0227]
可选的,子辅助特征基于对至少两个目标样本图像中的样本对象进行特征提取获得,目标样本图像是子辅助特征对应的类别子样本图像中的样本图像。
[0228]
可选的,n类别子样本图像包括第一表征图像和第二表征图像中的至少一种;
[0229]
第一表征图像中的样本对象穿戴目标物体;
[0230]
第二表征图像中的样本对象未穿戴目标物体。
[0231]
可选的,提取单元702具体用于:
[0232]
将目标区域图像输入已训练的特征提取模型,通过特征提取模型对目标区域图像中的目标对象进行特征提取,获得目标对象特征。
[0233]
可选的,特征提取模型是基于第一训练样本数据集训练得到的,第一训练样本数据集至少包括第一类样本图像;
[0234]
第一训练样本数据集还包括第二类样本图像,第二类样本图像为:表征样本对象穿戴不同样式的目标物体的样本图像。
[0235]
可选的,通过下列方式获取第一训练样本数据集:
[0236]
将初始样本图像和对应的分割图像输入已训练的风格迁移模型的编码层进行编码,获得初始样本图像的内容特征和分割图像的分割特征,分割图像是通过对初始样本图像进行像素分离获得的包含样本对象的前景区域图像;
[0237]
将内容特征和分割特征输入风格迁移模型的特征融合层进行特征融合,获得第一融合特征;
[0238]
将第一融合特征,以及目标迁移图像输入风格迁移模型的风格迁移层进行风格迁
移,获得与目标迁移图像具有相同穿戴风格的第一训练样本数据。
[0239]
可选的,穿戴风格包括穿戴状态风格和穿戴样式风格中的至少一种;
[0240]
若风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则目标迁移图像为:表征样本对象针对目标物体为目标穿戴状态风格的参考图像,第一训练样本数据包括第一类样本图像,穿戴状态风格用于表征样本对象穿戴目标物体的状态;
[0241]
若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则目标迁移图像为:表征样本对象穿戴目标样式风格的目标物体的参考图像,第一训练样本数据包括第二类样本图像,穿戴样式风格用于表征样本对象穿戴目标物体的样式。
[0242]
可选的,通过以下方式获得已训练的风格迁移模型:
[0243]
根据第二训练样本数据集对待训练的风格迁移模型进行循环迭代训练,输出已训练的风格迁移模型,第二训练样本数据集中的每个第二训练样本数据包括对应的真实类别,在一次循环迭代过程中,执行以下操作:
[0244]
对第二训练样本数据的第二融合特征进行特征展平,获得目标维度的第二融合特征;
[0245]
基于风格迁移模型的特征映射层对目标维度的第二融合特征进行特征映射,获得第二训练样本数据的预测类别;
[0246]
采用基于第二训练样本数据的预测类别和真实类别之间的差异构建的类别损失函数,对待训练的风格迁移模型进行参数调整。
[0247]
可选的,若风格迁移模型为用于进行穿戴状态风格迁移的风格迁移模型,则预测类别和真实类别为:表征样本对象是否穿戴目标物体的穿戴类别;若风格迁移模型为用于进行穿戴样式风格迁移的风格迁移模型,则预测类别和真实类别为:表征样本对象穿戴目标物体的样式类别。
[0248]
可选的,通过以下方式获得与所述n类别子样本图像中各类别子样本图像各自对应的子辅助特征:
[0249]
对每个类别子样本图像,分别执行以下操作:
[0250]
对于一个类别子样本图像,将所述一个类别子样本图像中的至少两个目标样本图像输入已训练的特征提取模型,获得所述至少两个目标样本图像各自对应的目标样本对象特征;
[0251]
基于各目标样本对象特征之间的相似度,将所述各目标样本对象特征划分为预设数量的特征集合;
[0252]
分别确定各特征集合中的各目标样本对象特征的平均特征,将获得的至少一个平均特征作为所述一个类别子样本图像对应的子辅助特征。
[0253]
可选的,特征提取模型是通过以下方式训练得到的:
[0254]
根据第一训练样本数据集对待训练的特征提取模型进行循环迭代训练,输出已训练的特征提取模型;其中,在一次循环迭代过程中,执行以下操作:
[0255]
将选取的至少两个第一训练样本数据输入待训练的特征提取模型,获得至少两个第一训练样本数据各自对应的第一训练样本对象特征;
[0256]
采用基于各第一训练样本对象特征之间的相似度构建的相似度损失函数,对待训练的特征提取模型进行参数调整。
[0257]
可选的,相似度损失函数是通过以下方式构建的:
[0258]
针对一个样本对象特征,分别执行以下操作:将一个样本对象特征分别与各样本对象特征进行组合,获得至少一个特征组,每个特征组包括两个样本对象特征;
[0259]
分别获得各特征组中的两个样本对象特征之间的预测相似度,并基于各预测相似度与真实相似度之间的差距,构建相似度损失函数,其中,每个特征组的真实相似度是基于包含的两个样本对象特征各自对应的样本数据的类别标签确定的。
[0260]
为了描述的方便,以上各部分按照功能划分为各模块(或单元)分别描述。当然,在实施本技术时可以把各模块(或单元)的功能在同一个或多个软件或硬件中实现。
[0261]
所属技术领域的技术人员能够理解,本技术的各个方面可以实现为系统、方法或程序产品。因此,本技术的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。
[0262]
与上述方法实施例基于同一发明构思,本技术实施例中还提供了一种电子设备。在一种实施例中,该电子设备可以是服务器,如图1所示的服务器120。在该实施例中,电子设备的结构可以如图8所示,包括存储器801,通讯模块803以及一个或多个处理器802。
[0263]
存储器801,用于存储处理器802执行的计算机程序。存储器801可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统,以及运行即时通讯功能所需的程序等;存储数据区可存储各种即时通讯信息和操作指令集等。
[0264]
存储器801可以是易失性存储器(volatile memory),例如随机存取存储器(random-access memory,ram);存储器801也可以是非易失性存储器(non-volatile memory),例如只读存储器,快闪存储器(flash memory),硬盘(hard disk drive,hdd)或固态硬盘(solid-state drive,ssd);或者存储器801是能够用于携带或存储具有指令或数据结构形式的期望的计算机程序并能够由计算机存取的任何其他介质,但不限于此。存储器801可以是上述存储器的组合。
[0265]
处理器802,可以包括一个或多个中央处理单元(central processing unit,cpu)或者为数字处理单元等等。处理器802,用于调用存储器801中存储的计算机程序时实现上述目标物体穿戴识别方法。
[0266]
通讯模块803用于与终端设备和其他服务器进行通信。
[0267]
本技术实施例中不限定上述存储器801、通讯模块803和处理器802之间的具体连接介质。本技术实施例在图8中以存储器801和处理器802之间通过总线804连接,总线804在图8中以粗线描述,其它部件之间的连接方式,仅是进行示意性说明,并不引以为限。总线804可以分为地址总线、数据总线、控制总线等。为便于描述,图8中仅用一条粗线描述,但并不描述仅有一根总线或一种类型的总线。
[0268]
存储器801中存储有计算机存储介质,计算机存储介质中存储有计算机可执行指令,计算机可执行指令用于实现本技术实施例的目标物体穿戴识别方法。处理器802用于执行上述的目标物体穿戴识别方法,如图2所示。
[0269]
在另一种实施例中,电子设备也可以是其他电子设备,如图1所示的终端设备110。在该实施例中,电子设备的结构可以如图9所示,包括:通信组件910、存储器920、显示单元930、摄像头940、传感器950、音频电路960、蓝牙模块970、处理器980等部件。
[0270]
通信组件910用于与服务器进行通信。在一些实施例中,可以包括电路无线保真(wireless fidelity,wifi)模块,wifi模块属于短距离无线传输技术,电子设备通过wifi模块可以帮助用户收发信息。
[0271]
存储器920可用于存储软件程序及数据。处理器980通过运行存储在存储器920的软件程序或数据,从而执行终端设备110的各种功能以及数据处理。存储器920可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。存储器920存储有使得终端设备110能运行的操作系统。本技术中存储器920可以存储操作系统及各种应用程序,还可以存储执行本技术实施例目标物体穿戴识别方法的计算机程序。
[0272]
显示单元930还可用于显示由用户输入的信息或提供给用户的信息以及终端设备110的各种菜单的图形用户界面(graphical user interface,gui)。具体地,显示单元930可以包括设置在终端设备110正面的显示屏932。其中,显示屏932可以采用液晶显示器、发光二极管等形式来配置。显示单元930可以用于显示本技术实施例中的目标物体穿戴识别用户界面等。
[0273]
显示单元930还可用于接收输入的数字或字符信息,产生与终端设备110的用户设置以及功能控制有关的信号输入,具体地,显示单元930可以包括设置在终端设备110正面的触摸屏931,可收集用户在其上或附近的触摸操作,例如点击按钮,拖动滚动框等。
[0274]
其中,触摸屏931可以覆盖在显示屏932之上,也可以将触摸屏931与显示屏932集成而实现终端设备110的输入和输出功能,集成后可以简称触摸显示屏。本技术中显示单元930可以显示应用程序以及对应的操作步骤。
[0275]
摄像头940可用于捕获静态图像,用户可以将摄像头940拍摄的图像通过应用发布评论。摄像头940可以是一个,也可以是多个。物体通过镜头生成光学图像投射到感光元件。感光元件可以是电荷耦合器件(charge coupled device,ccd)或互补金属氧化物半导体(complementary metal-oxide-semiconductor,cmos)光电晶体管。感光元件把光信号转换成电信号,之后将电信号传递给处理器980转换成数字图像信号。
[0276]
终端设备还可以包括至少一种传感器950,比如加速度传感器951、距离传感器952、指纹传感器953、温度传感器954。终端设备还可配置有陀螺仪、气压计、湿度计、温度计、红外线传感器、光传感器、运动传感器等其他传感器。
[0277]
音频电路960、扬声器961、传声器962可提供用户与终端设备110之间的音频接口。音频电路960可将接收到的音频数据转换后的电信号,传输到扬声器961,由扬声器961转换为声音信号输出。终端设备110还可配置音量按钮,用于调节声音信号的音量。另一方面,传声器962将收集的声音信号转换为电信号,由音频电路960接收后转换为音频数据,再将音频数据输出至通信组件910以发送给比如另一终端设备110,或者将音频数据输出至存储器920以便进一步处理。
[0278]
蓝牙模块970用于通过蓝牙协议来与其他具有蓝牙模块的蓝牙设备进行信息交互。例如,终端设备可以通过蓝牙模块970与同样具备蓝牙模块的可穿戴电子设备(例如智能手表)建立蓝牙连接,从而进行数据交互。
[0279]
处理器980是终端设备的控制中心,利用各种接口和线路连接整个终端的各个部分,通过运行或执行存储在存储器920内的软件程序,以及调用存储在存储器920内的数据,
执行终端设备的各种功能和处理数据。在一些实施例中,处理器980可包括一个或多个处理单元;处理器980还可以集成应用处理器和基带处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,基带处理器主要处理无线通信。可以理解的是,上述基带处理器也可以不集成到处理器980中。本技术中处理器980可以运行操作系统、应用程序、用户界面显示及触控响应,以及本技术实施例的目标物体穿戴识别方法。另外,处理器980与显示单元930耦接。
[0280]
在一些可能的实施方式中,本技术提供的目标物体穿戴识别方法的各个方面还可以实现为一种程序产品的形式,其包括计算机程序,当程序产品在电子设备上运行时,计算机程序用于使电子设备执行本说明书上述描述的根据本技术各种示例性实施方式的目标物体穿戴识别方法中的步骤,例如,电子设备可以执行如图2中所示的步骤。
[0281]
程序产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。
[0282]
本技术的实施方式的程序产品可以采用便携式紧凑盘只读存储器(cd-rom)并包括计算机程序,并可以在电子设备上运行。然而,本技术的程序产品不限于此,在本文件中,可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被命令执行系统、装置或者器件使用或者与其结合使用。
[0283]
可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读信号介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由命令执行系统、装置或者器件使用或者与其结合使用的程序。
[0284]
可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于无线、有线、光缆、rf等等,或者上述的任意合适的组合。
[0285]
可以以一种或多种程序设计语言的任意组合来编写用于执行本技术操作的计算机程序,程序设计语言包括面向对象的程序设计语言—诸如java、c++等,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。计算机程序可以完全地在用户电子设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户电子设备上部分在远程电子设备上执行、或者完全在远程电子设备或服务器上执行。在涉及远程电子设备的情形中,远程电子设备可以通过任意种类的网络包括局域网(lan)或广域网(wan)连接到用户电子设备,或者,可以连接到外部电子设备(例如利用因特网服务提供商来通过因特网连接)。
[0286]
应当注意,尽管在上文详细描述中提及了装置的若干单元或子单元,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多单元的特征和功能可以在一个单元中具体化。反之,上文描述的一个单元的特征和功能可以进一步划分为由多个单元来具体化。
[0287]
此外,尽管在附图中以特定顺序描述了本技术方法的操作,但是,这并非要求或者暗示必须按照该特定顺序来执行这些操作,或是必须执行全部所示的操作才能实现期望的结果。附加地或备选地,可以省略某些步骤,将多个步骤合并为一个步骤执行,和/或将一个步骤分解为多个步骤执行。
[0288]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用计算机程序的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0289]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序命令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序命令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的命令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0290]
这些计算机程序命令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的命令产生包括命令装置的制造品,该命令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0291]
这些计算机程序命令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的命令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0292]
尽管已描述了本技术的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本技术范围的所有变更和修改。
[0293]
显然,本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样,倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内,则本技术也意图包含这些改动和变型在内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1