一种穿戴目标物的检测方法、装置、设备及介质与流程

文档序号：30832079发布日期：2022-07-22 21:58阅读：109来源：国知局

1.本技术涉及安防监控技术领域，具体涉及一种穿戴目标物的检测方法、装置、设备及介质。

背景技术：

2.随着智能化技术的普及，各行各业对工作人员的穿戴行为都有着严格的要求，例如厨房的工作人员被要求穿戴厨师帽、卫生手套等，车间的作业人员被要求穿戴车间帽、安全手套等。通过规范工作人员的穿戴行为，能够有效提升厨房卫生质量、车间安全生产质量等，从而提升各个行业的服务质量，提升企业的核心竞争力。因此，如何准确地检测特定场所中的人员是否穿戴头饰、手套等目标物至关重要。
3.目前主要是通过训练好的单一模型对特定场所采集的图像进行检测，判断该图像中的人员是否穿戴目标物。然而面对复杂场景的干扰，单一的检测模型通常会出现误报，其得到的穿戴目标物的检测结果不准确。

技术实现要素：

4.本技术实施例提供一种穿戴目标物的检测方法、装置、设备及介质，用于提高穿戴目标物的检测结果的准确性。
5.第一方面，本技术提供一种穿戴目标物的检测方法，包括：
6.获取包括待检测对象的目标部位的第一图像；
7.将所述第一图像输入第一模型得到第一结果，所述第一结果表征所述目标部位是否穿戴目标物；所述第一模型是通过第一样本集训练获得的，所述第一样本集包括针对历史对象的目标部位是否穿戴目标物进行标记的图像；
8.响应于所述第一结果表征所述目标部位未穿戴目标物，将所述第一图像输入第二模型和第三模型得到第二结果和第三结果；其中，所述第二结果表征所述第一图像中目标物的属性类别，所述第三结果表征所述第一图像是否为难例图像，所述难例图像中目标物的属性类别为第一属性类别；所述第二模型是通过第二样本集训练获得的，所述第二样本集包括针对不同属性类别的目标物进行标记的图像；所述第三模型是通过第三样本集训练获得的，所述第三样本集包括针对样本图像是否为难例图像进行标记的图像；
9.基于所述第二结果和所述第三结果，确定所述第一图像中所述目标部位是否穿戴目标物。
10.在一种可能的实施例中，基于所述第二结果和所述第三结果，确定所述第一图像中所述目标部位是否穿戴目标物，包括：
11.响应于所述第二结果表征所述第一图像中目标物的属性类别为第二属性类别，且所述第三结果表征所述第一图像不是难例图像，则确定所述第一图像中所述目标部位未穿戴目标物。
12.在一种可能的实施例中，所述不同属性类别包括所述目标物的颜色为目标颜色的
第一属性类别、所述目标部位未穿戴所述目标物的第二属性类别、所述目标物的颜色为非目标颜色的第三属性类别。
13.在一种可能的实施例中，所述目标物为头饰，所述目标颜色为黑色、白色或灰色中的任意一种。
14.在一种可能的实施例中，获取包括待检测对象的目标部位的第一图像，包括：
15.采集目标环境中所述待检测对象的目标图像；
16.若确定所述目标图像中存在目标部位，则基于预设的第一矩形框从所述目标图像中截取出所述目标部位的图像，作为所述第一图像。
17.在一种可能的实施例中，响应于所述第一结果表征所述目标部位未穿戴目标物，将所述第一图像输入第二模型和第三模型得到第二结果和第三结果，包括：
18.对所述第一矩形框进行n次边界抖动，根据所述第一矩形框在所述目标图像中的位置信息，获得n个第二矩形框在所述目标图像中的位置信息；其中，n为大于或等于3的奇数，每次边界抖动表示对所述第一矩形框的四个边界分别进行外扩或内缩；
19.根据所述n个第二矩形框在所述目标图像中的位置信息，从所述目标图像中截取出n个第二图像；
20.将每个第二图像输入第二模型和第三模型，得到每个第二图像对应的第二结果和第三结果。
21.在一种可能的实施例中，基于所述第二结果和所述第三结果，确定所述第一图像中所述目标部位是否穿戴目标物，包括：
22.若对应的第二结果表征所述第一图像中目标物的属性类别为第二属性类别，且对应的第三结果表征所述第一图像不是难例图像的第二图像的数量大于或等于预设值，则确定所述第一图像中所述目标部位已穿戴目标物；其中，所述预设值与所述n的值成正比。
23.在一种可能的实施例中，所述第一模型为多任务网络的第一分支，所述第二模型为所述多任务网络的第二分支，所述第三模型为所述多任务网络的第三分支，所述多任务网络还包括骨干模块；
24.将所述第一图像输入第一模型得到第一结果，包括：
25.将所述第一图像输入所述骨干模块，获得所述第一图像的图像特征；
26.将所述图像特征输入所述第一分支，获得第一结果；
27.响应于所述第一结果表征所述目标部位未穿戴目标物，将所述第一图像输入第二模型和第三模型得到第二结果和第三结果，包括：
28.响应于所述第一结果表征所述目标部位未穿戴目标物，将所述图像特征输入所述第二分支得到第二结果，将所述图像特征输入所述第三分支得到第三结果。
29.第二方面，本技术提供一种穿戴目标物的检测装置，包括：
30.获取模块，用于获取包括待检测对象的目标部位的第一图像；
31.获得模块，用于将所述第一图像输入第一模型得到第一结果，所述第一结果表征所述目标部位是否穿戴目标物；所述第一模型是通过第一样本集训练获得的，所述第一样本集包括针对历史对象的目标部位是否穿戴目标物进行标记的图像；
32.所述获得模块，还用于响应于所述第一结果表征所述目标部位未穿戴目标物，将所述第一图像输入第二模型和第三模型得到第二结果和第三结果；其中，所述第二结果表
征所述第一图像中目标物的属性类别，所述第三结果表征所述第一图像是否为难例图像，所述难例图像中目标物的属性类别为第一属性类别；所述第二模型是通过第二样本集训练获得的，所述第二样本集包括针对不同属性类别的目标物进行标记的图像；所述第三模型是通过第三样本集训练获得的，所述第三样本集包括针对样本图像是否为难例图像进行标记的图像；
33.确定模块，用于基于所述第二结果和所述第三结果，确定所述第一图像中所述目标部位是否穿戴目标物。
34.在一种可能的实施例中，所述确定模块具体用于：
35.响应于所述第二结果表征所述第一图像中目标物的属性类别为第二属性类别，且所述第三结果表征所述第一图像不是难例图像，则确定所述第一图像中所述目标部位未穿戴目标物。
36.在一种可能的实施例中，所述不同属性类别包括所述目标物的颜色为目标颜色的第一属性类别、所述目标部位未穿戴所述目标物的第二属性类别、所述目标物的颜色为非目标颜色的第三属性类别。
37.在一种可能的实施例中，所述目标物为头饰，所述目标颜色为黑色、白色或灰色中的任意一种。
38.在一种可能的实施例中，所述获取模块具体用于：
39.采集目标环境中所述待检测对象的目标图像；
40.若确定所述目标图像中存在目标部位，则基于预设的第一矩形框从所述目标图像中截取出所述目标部位的图像，作为所述第一图像。
41.在一种可能的实施例中，所述获得模块具体用于：
42.对所述第一矩形框进行n次边界抖动，根据所述第一矩形框在所述目标图像中的位置信息，获得n个第二矩形框在所述目标图像中的位置信息；其中，n为大于或等于3的奇数，每次边界抖动表示对所述第一矩形框的四个边界分别进行外扩或内缩；
43.根据所述n个第二矩形框在所述目标图像中的位置信息，从所述目标图像中截取出n个第二图像；
44.将每个第二图像输入第二模型和第三模型，得到每个第二图像对应的第二结果和第三结果。
45.在一种可能的实施例中，所述确定模块具体用于：
46.若对应的第二结果表征所述第一图像中目标物的属性类别为第二属性类别，且对应的第三结果表征所述第一图像不是难例图像的第二图像的数量大于或等于预设值，则确定所述第一图像中所述目标部位已穿戴目标物；其中，所述预设值与所述n的值成正比。
47.在一种可能的实施例中，所述第一模型为多任务网络的第一分支，所述第二模型为所述多任务网络的第二分支，所述第三模型为所述多任务网络的第三分支，所述多任务网络还包括骨干模块；
48.所述获得模块具体用于：
49.将所述第一图像输入所述骨干模块，获得所述第一图像的图像特征；
50.将所述图像特征输入所述第一分支，获得第一结果；
51.响应于所述第一结果表征所述目标部位未穿戴目标物，将所述图像特征输入所述
第二分支得到第二结果，将所述图像特征输入所述第三分支得到第三结果。
52.第三方面，本技术提供一种穿戴目标物的检测设备，包括：
53.存储器，用于存储程序指令；
54.处理器，用于调用所述存储器中存储的程序指令，按照获得的程序指令执行第一方面中任一项所述的方法。
55.第四方面，本技术提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序包括程序指令，所述程序指令当被计算机执行时，使所述计算机执行第一方面中任一项所述的方法。
56.在本技术实施例中，将包括目标部位的第一图像输入第一模型，第一模型是通过针对历史对象的目标部位是否穿戴目标物进行标记的图像训练获得的，若第一模型获输出的第一结果表征目标部位未穿戴目标物，将第一图像分别输入第二模型和第三模型，对第一结果进行进一步验证，基于第二模型输出的第二结果和第三模型输出的第三结果，确定第一图像中目标部位是否穿戴目标物。本技术实施例中第一模型、第二模型和第三模型是通过不同的样本集训练得到的，结合三个不同模型输出的结果，可以更加准确地确定出第一图像中的目标部位是否穿戴头饰，提高检测是否穿戴目标物的准确性。
附图说明
57.为了更清楚地说明本技术实施例或相关技术中的技术方案，下面将对实施例或相关技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本技术实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图。
58.图1为本技术实施例提供的一种穿戴目标物的检测方法的应用场景示意图；
59.图2为本技术实施例提供的一种穿戴目标物的检测方法的流程示意图一；
60.图3为本技术实施例提供的一种多任务网络的结构图；
61.图4为本技术实施例提供的一种穿戴目标物的检测方法的流程示意图二；
62.图5为本技术实施例提供的一种穿戴目标物的检测装置的结构图；
63.图6为本技术实施例提供的一种穿戴目标物的检测设备的结构图。
具体实施方式
64.为使本发明的目的、技术方案和优点更加清楚明白，下面将结合本发明实施例中的附图，对本技术实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本技术一部分实施例，而不是全部的实施例。基于本技术中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本技术保护的范围。在不冲突的情况下，本技术中的实施例及实施例中的特征可以相互任意组合。并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以按不同于此处的顺序执行所示出或描述的步骤。
65.本技术的说明书和权利要求书及上述附图中的术语“第一”和“第二”是用于区别不同对象，而非用于描述特定顺序。此外，术语“包括”以及它们任何变形，意图在于覆盖不排他的保护。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已
列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
66.本技术实施例中，“多个”可以表示至少两个，例如可以是两个、三个或者更多个，本技术实施例不做限制。
67.为了提高穿戴目标物的检测结果的准确性，本技术实施例提供一种穿戴目标物的检测方法，该方法可以由穿戴目标物的检测设备执行。为简化描述，下文中将穿戴目标物的检测设备简称为检测设备。检测设备可以通过终端或服务器实现，终端例如移动终端、固定终端或便携式终端，例如移动手机、多媒体计算机、多媒体平板、台式计算机、笔记本计算机、平板计算机、带有拍摄功能的设备等。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、cdn、以及大数据和人工智能平台等基础云计算服务的云服务器，但并不局限于此。
68.下面对本技术实施例的技术方案能够适用的应用场景做一些简单介绍，需要说明的是，以下介绍的应用场景仅用于说明本技术实施例而非限定。在具体实施过程中，可以根据实际需要灵活地应用本技术实施例提供的技术方案。
69.请参照图1，为本技术实施例提供的一种穿戴目标物的检测方法的应用场景示意图，该应用场景示意图包括第一图像110和检测设备120，第一图像110可以是检测设备120自身采集的，例如检测设备120为具有摄像功能的设备，第一图像110也可以是其他摄像设备采集之后发送给检测设备120的。
70.具体来说，检测设备120获得第一图像110之后，对该第一图像110进行检测，确定该第一图像110中的待检测对象是否穿戴目标物。其中，具体如何进行穿戴目标物的检测过程将在下文进行详细介绍。
71.作为一种实施例，本技术实施例中的目标物可以是头饰、手套、铭牌、员工证等，头饰可以是头巾、帽子等，待检测对象可以是人或动物，本技术对此不作限定。例如，检测工人是否穿戴安全帽，保证工人安全，或者检测宠物是否穿戴铭牌，避免宠物走丢等。
72.本技术实施例提供的穿戴目标物的检测方法可以应用在多个场景，下面进行示例介绍。
73.第一种场景：特定场所的入口。
74.在厨房或者车间等特定场所的入口设置闸机口，闸机口安装有监控摄像头，每个员工经过闸机口时，监控摄像头会拍摄员工的图像，根据该图像检测该员工是否穿戴目标物，只有穿戴了目标物的员工才能成功通过闸机口。
75.第二种场景：特定场所的内部。
76.考虑到员工进入厨房或车间等特定场所之后，也可能因为各种原因取下目标物，因此在厨房或者车间等特定场所的内部安装监控摄像头，监控摄像头可以随时抓拍该场所内的员工的图像，并根据该图像检测员工是否穿戴目标物，从而及时上报没有穿戴目标物的员工情况。
77.如上介绍了应用场景，下面结合图1所示的应用场景，以图1中的检测设备120执行穿戴目标物的检测方法为例进行介绍。请参照图2，为本技术实施例提供的一种穿戴目标物的检测方法的流程示意图一。
78.s201、获取包括待检测对象的目标部位的第一图像。
79.具体的，检测设备可以采集目标环境中待检测对象的目标图像，目标环境是指任意需要检测是否穿戴目标物的场所，例如厨房、车间等。该目标图像可以是其他摄像设备拍摄之后发送给检测设备的，例如其他摄像设备例如为厨房、车间等地方的监控摄像头。该目标图像也可以是检测设备自身拍摄获得的，例如检测设备为具有摄像功能的设备。
80.考虑到角度问题可能导致采集的目标图像不完整，检测设备采集目标图像之后，可以采用faster-rcnn、yolo等目标检测算法，来检测该目标图像中是否存在目标部位。待检测对象的含义请参照前文论述的内容，此处不再赘述。本技术实施例中的目标部位可以是头部、手部等，具体的，目标部位可以是完整的头部或手部，例如颈部以上的部位、胳膊以下的部位，目标部位也可以是不完整的头部或手部，例如鼻子或眼睛以上的部位、手腕以下的部位。应当说明的是，若目标部位为头部，则目标物可以是头饰，若目标部位为手部，则目标物可以是手套。
81.进一步，检测设备检测目标图像中是否存在目标部位之后，根据不同的检测结果，其处理过程不同，下面分别进行介绍。
82.第一种检测结果，目标图像中不存在目标部位。
83.如果目标图像不存目标部位，则无法进一步检测目标部位是否穿戴目标物，换言之，该目标图像是无效的。因此，检测设备可以将该目标图像删除，重新采集目标环境中待检测对象的目标图像。
84.第二种检测结果，目标图像中存在目标部位。
85.若检测设备确定该目标图像存在目标部位，可以直接将该目标图像作为第一图像，也可以基于预设的第一矩形框从该目标图像中截取出目标部位的图像，作为第一图像。具体的，检测设备通过目标检测算法确定该目标图像中存在目标部位之后，可以输出目标部位在目标图像中的位置信息，即第一矩形框在目标图像中的位置信息，从该目标图像中提取该第一矩形框的位置信息对应区域的像素值，从而获得第一图像。
86.本技术实施例中，删除了多余图像特征，后续可以仅对目标部位所在区域的图像进行检测，可以提高图像的检测效率。
87.考虑光线、距离等原因可能导致拍摄的目标图像模糊，因此，在一种可能的实施例中，检测设备获取目标环境的目标图像之后，可以检测该目标图像的分辨率，若确定该目标图像的分辨率小于预设分辨率，可以删除该目标图像，重新采集目标环境中待检测对象的目标图像。
88.s202、将第一图像输入第一模型得到第一结果。
89.具体的，检测设备获得第一图像之后，可以将第一图像输入第一模型，获得第一结果。第一结果用于表征目标部位是否穿戴目标物，第一模型是通过第一样本集训练获得的，第一样本集包括针对历史对象的目标部位是否穿戴目标物进行标记的图像，历史对象是指训练样本图像中的人或动物，第一样本集具体包括：标记为目标部位未穿戴目标物的图像、以及标记为目标部位已穿戴目标物的图像。
90.第一模型可以是各种分类模型，本技术对此不作限定。第一模型中的模型参数的取值是其他设备训练获得并发送给检测设备的，或者是直接由检测设备训练得到。下面对检测设备训练第一模型的过程进行示例介绍。
91.检测设备可以将第一样本集中的任一样本图像作为第一模型的输入，第一模型输出的目标类别与该样本图像的实际类别之间的误差作为第一模型的反馈数据，通过反馈数据，不断调整模型参数的取值。经过大量的样本图像的训练，不断的更新第一模型的模型参数，使第一模型确定出的目标类别与样本图像的实际类别之间的误差在预设范围内，从而获得第一模型的模型参数。
92.s203、响应于第一结果表征目标部位未穿戴目标物，将第一图像输入第二模型和第三模型得到第二结果和第三结果。
93.检测设备获得第一结果之后，若第一结果表征目标部位已穿戴目标物，则不执行后续处理，则不执行s204。考虑到第一模型的检测结果可能有误，为了避免产生误报，响应于第一结果表征目标部位未穿戴目标物，检测设备将第一图像输入第二模型和第三模型，对第一结果进行进一步验证。
94.具体的，检测设备将第一图像输入第二模型得到第二结果。第二结果表征第一图像中目标物的属性类别，第二模型是通过第二样本集训练获得的，第二样本集包括针对不同属性类别的目标物进行标记的图像，不同属性类别包括目标物的颜色为目标颜色的第一属性类别、目标部位未穿戴目标物的第二属性类别、目标物的颜色为非目标颜色的第三属性类别。目标颜色指的是各种不好检测的颜色，目标颜色可以为黑色、白色或灰色中的任意一种。因此，第二样本集具体包括：标记为第一属性类别的图像、标记为第二属性类别的图像、标记为第三属性类别的图像。第二模型的训练过程与第一模型的训练过程类似，请参照前文论述的内容，此处不再赘述。
95.检测设备在将第一图像输入第二模型的同时，也将第一图像输入第三模型得到第三结果。第三结果表征第一图像是否为难例图像，难例图像中目标物的属性类别为第一属性类别，第三模型是通过第三样本集训练获得的，第三样本集包括针对样本图像是否为难例图像进行标记的图像，具体包括：标记为难例的图像、以及标记为非难例的图像。第三模型的训练过程也与第一模型的训练过程类似，请参照前文论述的内容，此处不再赘述。
96.作为一种实施例，第一模型、第二模型、第三模型可以是独立的三个模型，是分别训练并获得的。
97.或者，考虑到单独训练三个模型对网络资源的消耗较大，在一种可能的实施例中，第一模型、第二模型、第三模型分别是多任务网络的三个分支，三个分支即三个模型是通过多任务网络一同训练获得的，只是在实际部署的时候根据所使用的位置不同决定裁减掉哪些分支。
98.应当说明的是，对于一张训练样本图像来说，不强制要求其同时具有三个分支的维度，只需要将其不具有的维度标记为-1。当需要对某个分支的效果进行单独优化时，针对只具有一个维度的样本图像，可以增加该样本图像的维度来提升训练效果，不需要新增样本图像，以减少网络资源消耗。另外，三个分支共享backbone模块，它们共有的特征有助于backbone模块的收敛，且，额外的第二分支和第三分支有助于加强网络对目标物的整体识别能力，可以显式地给网络进行局部注意力指导，突出它们的不同特征，即告知网络应该从哪些方面区分穿戴目标颜色的目标物的特征与未穿戴目标物的特征，能够让网络对已穿戴目标物和未穿戴目标物的特征差异学习更加充分，从而提升分类效果。
99.作为一种实施例，第一模型为多任务网络的第一分支，第二模型为多任务网络的
第二分支，第三模型为多任务网络的第三分支，多任务网络还包括骨干(backbone)模块。其中，backbone模块符合卷积神经网络的基本结构，包括但不限于卷积层、非线性层、池化层等，例如inception、残差网络(resnet)、稠密连接网络(densnet)等。backbone模块主要用于特征提取。其中涉及到多任务网络实现s202和s203的过程，下面进行介绍。
100.检测设备将第一图像输入骨干模块，对第一图像进行特征提取，获得第一图像的图像特征，将该图像特征输入第一分支，获得第一结果。响应于第一结果表征目标部位未穿戴目标物，将该图像特征输入第二分支得到第二结果，将该图像特征输入第三分支得到第三结果。
101.请参照图3，为本技术实施例提供的一种多任务网络的结构图。多任务网络包括第一分支301、第二分支302、第三分支303、以及骨干(backbone)模块304。第二分支302和第三分支303的虚线箭头表示第二分支302和第三分支303可能不存在，也就是说，多任务网络实际上使用过程中，可能不需要使用第二分支302和第三分支303，例如第一分支301输出的第一结果表征目标部位已穿戴目标物，则不执行第二分支302和第三分支303。
102.考虑到目标检测算法的检测结果可能不准确，导致第一矩形框可能有偏差，例如第一矩形框中没有目标物的部分，因此，在一种可能的实施例中，对第一矩形框进行调整，根据调整后得到的第二矩形框，重新从目标图像中截取第二图像，输入第二模型和第三模型进行验证。具体的步骤如s1.1-s1.3。
103.s1.1、对第一矩形框进行n次边界抖动，根据第一矩形框在目标图像中的位置信息，获得n个第二矩形框在目标图像中的位置信息。
104.其中，n为大于或等于3的奇数，主要考虑到3次抖动已经能消除绝大部分偏差，且抖动次数较多反而会增加耗时，因此n一般取3。每次边界抖动表示对第一矩形框的四个边界分别进行外扩或内缩。换言之，第一矩形框包括上下左右四个边界，第一矩形框每次进行边界抖动时，四个边界中的每个边界都会独立进行抖动，即每个边界都会进行外扩或内缩。左边界和右边界的抖动范围是以第一矩形框的宽度为参考依据的，上边界和下边界的抖动范围是以第一矩形框的高度为参考依据的。
105.例如第一矩形框的宽度为w，高度为h，左边界和右边界的抖动范围为(-0.1w，+0.1w)，上边界和下边界的抖动范围为(-0.1h，+0.1h)，
“‑”
表示内缩，“+”表示外扩。考虑到穿戴目标物的矩形框的上边距通常比未穿戴目标物的矩形框的上边距要高，因此，上边界的抖动范围可以比下边界的抖动范围大，具体例如为上边界的抖动范围为(-0.1h，+0.2h)，下边界的抖动范围为(-0.1h，+0.1h)。
106.应当说明的是，n个第二矩形框中可能存在与第一矩形框尺寸相同、位置信息不同的第二矩形框，例如第一矩形框的上边界外扩了0.1h，下边界内缩了0.1h，左边界外扩了0.1w，右边界内缩了0.1w，相当于将第一矩形框向上和向左平移后得到第二矩形框。
107.s1.2、根据n个第二矩形框在目标图像中的位置信息，从目标图像中截取出n个第二图像。
108.具体的，检测设备获得n个第二矩形框的位置信息之后，可以基于每个第二矩形框的位置信息，从目标图像中提取每个第二矩形框的位置信息对应区域的像素值，从而获得n个第二图像。
109.s1.3、将每个第二图像输入第二模型和第三模型，得到每个第二图像对应的第二
结果和第三结果。
110.具体的，检测设备获得n个第二图像之后，可以将每个第二图像输入第二模型，获得每个第二图像对应的第二结果，以及将每个第二图像输入第三模型，获得每个第二图像对应的第三结果。其中，第二模型和第三模型的含义和训练过程请参照前文论述的内容，此处不再赘述。
111.在本技术实施例中，对第一矩形框进行了多次边界抖动，可以消除第一矩形框的偏差问题，且，对多个第二图像均进行了验证，多次验证可以进一步提高穿戴目标物的检测结果的准确性。且考虑到在穿戴合规场景中大部工作人员都是合规的，即穿戴目标物的人员占所有人员的大部分，在第一结果表征目标部位未穿戴目标物时，才进行边界抖动，若第一结果表征目标部位已穿戴目标物时，不会进行后续处理，也不会进行边界抖动，这样能够节省资源消耗。
112.s204、基于第二结果和第三结果，确定第一图像中目标部位是否穿戴目标物。
113.检测设备根据是否对第一图像对应的第一矩形框进行边界抖动，验证第一结果的方式不同，下面分情况进行介绍。
114.第一种情况，检测设备没有对第一图像对应的第一矩形框进行边界抖动，响应于第一结果表征目标部位未穿戴目标物，直接将第一图像输入第二模型和第三模型，获得第一图像对应的第二结果和第三结果。
115.针对第一种情况，响应于第二结果表征第一图像中目标物的属性类别为第二属性类别，且第三结果表征第一图像不是难例图像，则确定第一图像中目标部位未穿戴目标物。根据第二结果和第三结果的其他情况均可确定第一图像中目标部位未穿戴目标物，下面介绍其他情况包括的5种情况。
116.情况1、第二结果表征第一图像中目标物的属性类别为第一属性类别，且第三结果表征第一图像是难例图像。
117.情况2、第二结果表征第一图像中目标物的属性类别为第二属性类别，且第三结果表征第一图像是难例图像。
118.情况3、第二结果表征第一图像中目标物的属性类别为第三属性类别，且第三结果表征第一图像是难例图像。
119.情况4、第二结果表征第一图像中目标物的属性类别为第一属性类别，且第三结果表征第一图像不是难例图像。
120.情况5、第二结果表征第一图像中目标物的属性类别为第三属性类别，且第三结果表征第一图像不是难例图像。
121.第二种情况、检测设备对第一图像对应的第一矩形框进行了n次边界抖动，获得n个第二图像之后，每个第二图像输入第二模型和第三模型，获得每个第二图像对应的第二结果和第三结果。
122.针对第二种情况，检测设备获得n个第二图像对应的第二结果和第三结果，可以进行累计投票，若累计投票结果满足预设规则，则确定第一图像中目标部位已穿戴目标物。
123.具体的，若对应的第二结果表征第一图像中目标物的属性类别为第二属性类别，且对应的第三结果表征第一图像不是难例图像的第二图像的数量大于或等于预设值，则确定第一图像中目标部位已穿戴目标物。若该数量小于预设值，则确定第一图像中目标部位
未穿戴目标物。其中，预设值与n的值成正比，换言之，预设值与多个第二图像的总数量成正比，例如预设值为β*n，β的取值范围可以是[0.6，0.75]。
[0124]
应当说明的是，为了保证检测结果的准确性，预设值可以为多个第二图像的总数量即n，换言之，响应于每个第二结果的表征第一图像中目标物的属性类别为第二属性类别，且每个第三结果表征第一图像不是难例图像，则确定第一图像中目标部位已穿戴目标物。
[0125]
作为一种实施例，检测设备在确定第一图像中目标部位未穿戴目标物之后，可以显示报警信息，报警信息用于指示该第一图像中目标部位未穿戴目标物，报警信息可以是语音、文字、图像等。以目标物是帽子为例，检测设备可以语音播报“有人未穿戴帽子，请注意！”，或者检测设备具有显示屏，在显示屏上显示“有人未穿戴帽子，请注意！”的文字信息，以及在显示屏上显示第一图像，或者检测设备可以播放特殊的铃声，进行穿戴不合规的报警。
[0126]
作为一种实施例，检测设备在第一图像中目标部位未穿戴目标物之后，可以确定该第一图像中待检测对象的身份信息，显示报警信息和待检测对象的身份信息。身份信息用于唯一标识待检测对象，例如待检测对象的名字、待检测对象的编号等。报警信息的含义请参照前文论述的内容，此处不再赘述。
[0127]
具体的，检测设备预先建立了一个身份库，该身份库包括多个待检测对象的脸部图像以及每个脸部图像对应的身份信息。检测设备提取该第一图像中待检测对象的脸部特征，将该脸部特征与身份库中各脸部图像的特征进行逐一匹配，若存在匹配成功的目标脸部图像，从身份库中获取该目标脸部图像对应的身份信息。
[0128]
以目标物是帽子为例，检测设备确定第一图像对应的待检测对象是xxx，可以语音播报“xxx未穿戴帽子，请注意！”，或者检测设备具有显示屏，在显示屏上滚动播放“xxx未穿戴帽子，请注意！”的文字信息，以及在显示屏上显示该第一图像，或者检测设备将“xxx未穿戴帽子”的文字信息和第一图像发送给管理人员的终端。
[0129]
为了更清楚地说明穿戴目标物的检测方法，请参照图4，为本技术实施例提供的一种穿戴目标物的检测方法的流程示意图二，下面结合图4对穿戴目标物的检测方法进行详细介绍。
[0130]
流程开始，首先执行s401，即获取第一图像。
[0131]
s401、获取第一图像。
[0132]
检测设备获取第一图像的方式、以及第一图像的含义请参照前文论述的内容，此处不再赘述。
[0133]
s402、检测是否存在目标部位。
[0134]
检测设备检测第一图像中是否存在目标部位，若存在，则执行s403，即检测目标部位是否穿戴目标物，若不存在，则继续执行s401，即重新获取第一图像。其中如何检测目标部位、以及目标部位的含义请参照前文论述的内容，此处不再赘述。
[0135]
s403、检测目标部位是否穿戴目标物。
[0136]
检测设备可以将第一图像输入第一模型得到第一结果，若第一结果表征目标部位已穿戴目标物，则流程结束，若第一结果表征目标部位未穿戴目标物，则执行s404，即边界抖动。其中第一模型的训练方式请参照前文论述的内容，此处不再赘述。
[0137]
s404、边界抖动。
[0138]
检测设备对第一图像对应的第一矩形框进行多次边界抖动，获得多个第二图像。其中第一矩形框的含义、边界抖动的含义、以及如何获得第二图像的过程请参照前文论述的内容，此处不再赘述。
[0139]
s405、检测目标物的属性类别。
[0140]
检测设备将每个第二图像输入第二模型得到第二结果，根据第二结果获得目标物的属性类别。其中第二模型的训练方式请参照前文论述的内容，此处不再赘述。
[0141]
s406、检测是否为难例图像。
[0142]
检测设备将每个第二图像输入第三模型得到第三结果，根据第三结果获得每个第二图像是否为难例图像。其中第三模型的训练方式请参照前文论述的内容，此处不再赘述。
[0143]
s407、累计投票。
[0144]
检测设备根据多个第二图像对应的第二结果和第三结果进行累计投票，具体的投票方式请参照前文论述的内容，此处不再赘述。
[0145]
s408、显示报警信息。
[0146]
若投票结果满足预设规则，则检测设备显示报警信息。其中报警信息的含义、以及显示报警信息的方式请参照前文论述的内容，此处不再赘述。
[0147]
执行s408之后，则流程结束。
[0148]
基于同一发明构思，本技术还提供一种穿戴目标物的检测装置，请参照图5，该装置包括：
[0149]
获取模块501，用于获取包括待检测对象的目标部位的第一图像；
[0150]
获得模块502，用于将第一图像输入第一模型得到第一结果，第一结果表征目标部位是否穿戴目标物；第一模型是通过第一样本集训练获得的，第一样本集包括针对历史对象的目标部位是否穿戴目标物进行标记的图像；
[0151]
获得模块502，还用于响应于第一结果表征目标部位未穿戴目标物，将第一图像输入第二模型和第三模型得到第二结果和第三结果；其中，第二结果表征第一图像中目标物的属性类别，第三结果表征第一图像是否为难例图像，难例图像中目标物的属性类别为第一属性类别；第二模型是通过第二样本集训练获得的，第二样本集包括针对不同属性类别的目标物进行标记的图像；第三模型是通过第三样本集训练获得的，第三样本集包括针对样本图像是否为难例图像进行标记的图像；
[0152]
确定模块503，用于基于第二结果和第三结果，确定第一图像中目标部位是否穿戴目标物。
[0153]
在一种可能的实施例中，确定模块503具体用于：
[0154]
响应于第二结果表征第一图像中目标物的属性类别为第二属性类别，且第三结果表征第一图像不是难例图像，则确定第一图像中目标部位未穿戴目标物。
[0155]
在一种可能的实施例中，不同属性类别包括目标物的颜色为目标颜色的第一属性类别、目标部位未穿戴目标物的第二属性类别、目标物的颜色为非目标颜色的第三属性类别。
[0156]
在一种可能的实施例中，目标物为头饰，目标颜色为黑色、白色或灰色中的任意一种。
[0157]
在一种可能的实施例中，获取模块501具体用于：
[0158]
采集目标环境中待检测对象的目标图像；
[0159]
若确定目标图像中存在目标部位，则基于预设的第一矩形框从目标图像中截取出目标部位的图像，作为第一图像。
[0160]
在一种可能的实施例中，获得模块502具体用于：
[0161]
对第一矩形框进行n次边界抖动，根据第一矩形框在目标图像中的位置信息，获得n个第二矩形框在目标图像中的位置信息；其中，n为大于或等于3的奇数，每次边界抖动表示对第一矩形框的四个边界分别进行外扩或内缩；
[0162]
根据n个第二矩形框在目标图像中的位置信息，从目标图像中截取出n个第二图像；
[0163]
将每个第二图像输入第二模型和第三模型，得到每个第二图像对应的第二结果和第三结果。
[0164]
在一种可能的实施例中，确定模块503具体用于：
[0165]
若对应的第二结果表征第一图像中目标物的属性类别为第二属性类别，且对应的第三结果表征第一图像不是难例图像的第二图像的数量大于或等于预设值，则确定第一图像中目标部位已穿戴目标物；其中，预设值与n的值成正比。
[0166]
在一种可能的实施例中，第一模型为多任务网络的第一分支，第二模型为多任务网络的第二分支，第三模型为多任务网络的第三分支，多任务网络还包括骨干模块；
[0167]
获得模块502具体用于：
[0168]
将第一图像输入骨干模块，获得第一图像的图像特征；
[0169]
将图像特征输入第一分支，获得第一结果；
[0170]
响应于第一结果表征目标部位未穿戴目标物，将图像特征输入第二分支得到第二结果，将图像特征输入第三分支得到第三结果。
[0171]
作为一种实施例，图5论述的装置可以用于执行图2和图4所示的实施例中所述的穿戴目标物的检测方法，因此，对于该装置的各功能模块所能够实现的功能等可参考图2和图4所示的实施例的描述，此处不再赘述。
[0172]
应当注意，尽管在上文详细描述中提及了装置的若干模块或子模块，但是这种划分仅仅是示例性的并非强制性的。实际上，根据本发明的实施方式，上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之，上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
[0173]
基于同一发明构思，本技术实施例还提供了一种穿戴目标物的检测设备，该设备相当于前文论述的检测设备，请参照图6，该设备包括：
[0174]
至少一个处理器601，以及与至少一个处理器601连接的存储器602，本技术实施例中不限定处理器601与存储器602之间的具体连接介质，图6中是以处理器601和存储器602之间通过总线600连接为例。总线600在图6中以粗线表示，其它部件之间的连接方式，仅是进行示意性说明，并不引以为限。总线600可以分为地址总线、数据总线、控制总线等，为便于表示，图6中仅用一条粗线表示，但并不表示仅有一根总线或一种类型的总线。或者，处理器601也可以称为控制器，对于名称不做限制。
[0175]
在本技术实施例中，存储器602存储有可被至少一个处理器601执行的指令，至少
一个处理器601通过执行存储器602存储的指令，可以执行图2所述任一的穿戴目标物的检测方法。处理器601还可以实现图4所示的装置中各个模块的功能。
[0176]
其中，处理器601是该装置的控制中心，可以利用各种接口和线路连接整个该控制设备的各个部分，通过运行或执行存储在存储器602内的指令以及调用存储在存储器602内的数据，该装置的各种功能和处理数据，从而对该装置进行整体监控。
[0177]
在一种可能的设计中，处理器601可包括一个或多个处理单元，处理器601可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器601中。在一些实施例中，处理器601和存储器602可以在同一芯片上实现，在一些实施例中，它们也可以在独立的芯片上分别实现。
[0178]
处理器601可以是通用处理器，例如中央处理器(cpu)、数字信号处理器、专用集成电路、现场可编程门阵列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件，可以实现或者执行本技术实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者任何常规的处理器等。结合本技术实施例所公开的穿戴目标物的检测方法的步骤可以直接体现为硬件处理器执行完成，或者用处理器中的硬件及软件模块组合执行完成。
[0179]
存储器602作为一种非易失性计算机可读存储介质，可用于存储非易失性软件程序、非易失性计算机可执行程序以及模块。存储器602可以包括至少一种类型的存储介质，例如可以包括闪存、硬盘、多媒体卡、卡型存储器、随机访问存储器(random access memory，ram)、静态随机访问存储器(static random access memory，sram)、可编程只读存储器(programmable read only memory，prom)、只读存储器(read only memory，rom)、带电可擦除可编程只读存储器(electrically erasable programmable read-only memory，eeprom)、磁性存储器、磁盘、光盘等。存储器602是能够用于携带或存储具有指令或数据结构形式的期望的程序代码并能够由计算机存取的任何其他介质，但不限于此。本技术实施例中的存储器602还可以是电路或者其它任意能够实现存储功能的装置，用于存储程序指令和/或数据。
[0180]
通过对处理器601进行设计编程，可以将前述实施例中介绍的穿戴目标物的检测方法所对应的代码固化到芯片内，从而使芯片在运行时能够执行图2和图4所示的穿戴目标物的检测方法的步骤。如何对处理器601进行设计编程为本领域技术人员所公知的技术，这里不再赘述。
[0181]
基于同一发明构思，本技术实施例提供一种计算机可读存储介质，计算机可读存储介质存储有计算机程序，计算机程序包括程序指令，程序指令当被计算机执行时，使计算机执行如前文论述任一的穿戴目标物的检测方法。由于上述计算机可读存储介质解决问题的原理与穿戴目标物的检测方法相似，因此上述计算机可读存储介质的实施可以参见方法的实施，重复之处不再赘述。
[0182]
本领域内的技术人员应明白，本技术的实施例可提供为方法、系统、或计算机程序产品。因此，本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产
品的形式。
[0183]
本技术是参照根据本技术的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0184]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0185]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0186]
显然，本领域的技术人员可以对本技术进行各种改动和变型而不脱离本技术的精神和范围。这样，倘若本技术的这些修改和变型属于本技术权利要求及其等同技术的范围之内，则本技术也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张兴明郑雷
技术所有人：浙江大华技术股份有限公司
我是此专利的发明人

上一篇：叶片进/排气边精密电解修型工具及方法
上一篇：一种应用于小麦播种机的玉米秸秆分流引导装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。