一种安全护具识别模型的构建方法及设备

文档序号:37212389发布日期:2024-03-05 14:56阅读:16来源:国知局
一种安全护具识别模型的构建方法及设备

本发明涉及深度学习中的目标检测领域,具体地,涉及一种安全护具识别模型的构建方法及设备。


背景技术:

1、智慧工业园区可以通过利用物联网、大数据、人工智能等信息技术,对传统工业园区进行智能化升级和管理,它是促进工业转型,以提高生产效率、资源利用效率和环境可持续性的一种工业发展模式。而佩戴安全护具——安全帽和反光衣可以保护工人头部和身体免受坠落物、碰撞或其他潜在伤害的影响,在复杂的建筑工地上,施工人员缺乏安全意识,经常因各种原因不遵守佩戴安全帽的规定,这种行为不仅对工人的人身安全构成威胁,而且对施工场地的监管工作产生负面影响。因此,当前迫切需要寻找一种更有效的方法来监测和确保工人规范佩戴安全护具。

2、基于深度学习技术的目标检测算法主要分为单阶段(one-stage)检测算法和两阶段(two-stage)检测算法,其中,单阶段检测算法包含目前流行的yolo(you only lookonce)系列算法和ssd(single shot multibox detector)高效特征提取和多尺度检测技术算法,它们能够实现实时目标检测,并拥有较好的精确度。而两阶段检测算法需要对物体先经过候选框定位,再对定位的内容进行分类,典型的代表有rcnn、spp-net、fast r-cnn、faster r-cnn、mask r-cnn、cascade r-cnn等,相比单阶段检测算法,两阶段检测算法的优势在于准确率高,但实时性较差,难以适应实时要求高的场景。因此,单检测算法便成为了主流,它将两阶段检测算法需要分步进行的候选框生成、预测、分类等等操作同时进行,进而使算法的检测速度达到实时检测的标准。而yolov5则是对yolo系列算法的进一步优化,作为一种先进的目标检测算法,以其出色的性能和高效的实时处理而备受瞩目,取得了更高的精度和更快的速度,为安全帽和反光衣检测提供了一种理想的解决方案。


技术实现思路

1、为解决现有技术安全护具识别存在实时性较差的技术问题,本发明提供了一种安全护具识别模型的构建方法及设备,本发明采用的技术方案是:

2、本发明第一方面提供了一种安全护具识别模型的构建方法,包括以下步骤:

3、s1:构建初始数据集;

4、s2:对所述数据集进行增强处理,得到增强数据集;其中,所述增强处理包括高斯噪声处理、图像明暗度处理、图像旋转处理、图像裁剪处理、图像平移处理、mosaic增强处理以及生成对抗网络的图像数据增强处理;

5、s3:对yolov5进行优化处理,得到初始模型;

6、s4:利用所述增强数据集对所述初始模型进行训练,得到最终模型。

7、作为一种优选方案,在步骤s2中,所述高斯噪声处理具体为:

8、将高斯噪声加入到所述增强数据集的每张安全护具图像中,并改变不同的信噪比以增加图像的数据量,对应的表达式为:

9、s(o)=s(i)+n(θ)

10、其中,s(o)为处理后图像,s(i)为原始图像,n(θ)为噪声,θ为噪声参数。

11、作为一种优选方案,在步骤s2中,所述图像明暗度处理的方法具体为:

12、利用随机函数于预设的数值范围内生成随机数,以预设值为分界线,大于预设值则调暗,小于预设值则调亮,将所述增强数据集的每张安全护具图像进行亮度值变换,对应的表达式为:

13、s(o)=f(s(i))

14、其中,s(o)为处理后图像,s(i)为原始图像,f(·)为亮度变化函数。

15、作为一种优选方案,在步骤s2中,所述mosaic增强处理的方法具体为:

16、首先在所述增强数据集中随机抽取4张安全护具图像,分别对每张安全护具图像进行翻转处理、缩放处理、改变亮度处理以及改变饱和度处理,再对经过处理的4张安全护具图像以自由裁剪、自由放缩、自由排列的方式进行粘贴,形成一张新的安全护具图像,对应的表达式为:

17、s(o)=m(s(i))

18、其中,m(·)为mosaic增强变化函数,s(o)为处理后图像,s(i)为原始图像。

19、作为一种优选方案,在步骤s2中,所述生成对抗网络的图像数据增强处理具体为:

20、通过gan生成具有不同尺度角度以及失真模糊的图像;

21、所述gan在训练生成器时的损失函数vg(g,d)为:

22、

23、其中,g表示生成映射函数,d表示判别映射函数,z表示随机噪声,pz表示随机噪声z的分布,表示g(z)的期望;

24、所述gan在训练判别器d时的损失函数vd(g,d)为:

25、

26、其中,pd表示真实数据x的分布,表示x的期望,g表示生成映射函数,d表示判别映射函数,z表示随机噪声,pz表示随机噪声z的分布,表示g(z)的期望。

27、作为一种优选方案,在步骤s3中,所述yolov5包括input输入层、backbone网络层、neck层、prediction预测结果输出层,所述优化处理具体方法包括:

28、在所述backbone网络层中引入eca通道注意力机制;

29、对特征金字塔fpn结构进行改进和扩展;

30、在yolov5的骨干网络中引入解耦头。

31、作为一种优选方案,在步骤s3中,在所述backbone网络层中引入eca通道注意力机制的具体操作包括:

32、所述eca通道注意力机制将通道和空间注意力机制相结合,将卷积层由5*5conv替换;对每个通道的特征图进行全局平均池化得到通道的全局描述,对于输入的每个通道,使用一个一维卷积核对其进行卷积操作,然后使用一个sigmoid函数将卷积结果转换为0到1之间的注意力权重;以下是所述eca通道注意力机制通过大小为k的一维卷积为每个通道生成权值ω的公式:

33、ω=σ(c1dk(y))

34、其中,c1d表示一维卷积,y表示通道,σ表示sigmoid激活函数;

35、通道维数和卷积核大小之间的映射关系如下:

36、c=φ(k)≈exp(γ×k-b)

37、其中,c表示通道维数,k表示卷积核大小,参数γ和b是eca通道注意力机制中的超参数;

38、然后,给定通道维数c,自适应确定卷积核大小k:

39、

40、表示通道维数,k表示卷积核大小,参数γ和b是eca通道注意力机制中的超参数。

41、作为一种优选方案,在步骤s3中,对特征金字塔fpn结构进行改进和扩展的具体操作包括:

42、将所述特征金字塔fpn结构替换为加权双向特征金字塔网络结构,通过双向连接和逐层迭代的方式,进行多层次多尺寸的融合,所述加权双向特征金字塔网络结构进行特征融合的计算公式具体为:

43、fout=ω1f1+ω2f2+ω3f3+...+ωnfn

44、其中,f表示层特征,ω表示该层特征权重,fout表示特征融合后的输出特征。

45、作为一种优选方案,在步骤s3中,在yolov5的骨干网络中引入解耦头的具体操作包括:

46、首先对解耦头进行1x1的降维操作,从yolox中复制解耦头的网络结构,然后将解耦头网络结构嵌入到所述yolov5的骨干网络中,其中,所述解耦头的网络结构包括耦卷积层、分类层以及回归头。

47、本发明第二方面提供了一种计算机设备,包括存储介质、处理器以及储存在所述存储介质中并可被所述处理器执行的计算机程序,所述计算机程序被处理器执行时实现前述的一种安全护具识别模型的构建方法的步骤。

48、相较于现有技术,本发明所具有的有益效果是:

49、本发明通过引入多种图像数据增强技术以扩展数据集的特征数据,显著增加检测数据集的准确性和多样性;通过选定yolov5网络作为基准网络,并对yolov5进行优化处理,实现了在大幅提升目标检测的精度和鲁棒性的同时,有效地减少了计算。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1