本技术方案是计算机技术在安监场景中的应用技术,具体是一种适用于安监的神经网络及其构建方法。
背景技术:
传统工地管理面临建筑工地环境复杂、从业人员管理难、事故多发且调查取证难、项目安全管理难等问题。随着手机使用的普及,工地工人进行作业时使用手机,会增加安全事故发生的可能性。而依靠人员监督难以起到实时的监督作用,如果采用事后监控视频进行检查,也需要大量的人力和时间成本,而且对预防安全事故来说,其效果远不如即时发现、即时处理。
神经网络在图像识别方面具有独特优势,较多用于智能识别现场图像。但是,对于人体以及人体的附着物的特定动作及位置的识别还存在不足。
技术实现要素:
为了解决上述技术问题,本技术方案提出一种适于工地现场人员异常行为判别的目标检测网络构建方法。所述目标检测网络是多等级多分支目标检测网络,它是由三级网络构成,分别为:
第一级网络:在不同的分支上分别实现对人脸和人体位置的精准检测;
第二级网络:在第一级网络的基础上,基于人体区域进行特定目标的精准检测;
第三级网络:对人脸区域、人体区域与目标区域的相对位置的拓扑关系建模得到拓扑关系模型,用以来精准判别人员异常行为;
所述目标检测网络的构建步骤包括:
步骤1、搭建tensorflow深度学习框架,其中第一级检测网络模型的配置利用fasterr-cnn算法完成,用于检测人脸及人体目标;
步骤2、第二级检测网络模型采用alexnet网络进行特征提取;alexnet网络包括5个卷积层和3个全连接层,分别基于人脸和人体进行多目标检测;
步骤3、第三级网络采用空间金字塔池化层;构建拓扑关系模型,根据目标分布组合及上下文语义,在不同分辨率下将图像划分为多个scales的bins,然后计算落入每个bins中属于不同分类的个数,并将这些区域进行局部链接构成视觉直方图表征图像;
步骤4、采用随机梯度下降法对目标检测网络进行训练;
步骤5、利用softmax损失函数对目标检测网络进行优化;
步骤6、对目标检测网络进行训练,得到检测模型。
所述步骤3中,所述拓扑关系模型为:对人脸、人体与相应目标区域的相对位置的拓扑关系建模:
将二维空间划分为九个部分,以目标对象与各方向区域的相交情况为元素构成方向关系矩阵来描述对象空间的方向关系,使空间方向符号化;关系矩阵分为:
a、粗略方向关系矩阵,元素值是0或1,表示参考对象的各方向区域是否与目标对象相交,相交为1,否则为0;
b、精确方向关系矩阵,元素值是各方向区域与目标对象的相交面积的百分比;
精确方向关系矩阵采用面积比例作为描述信息,从数量上对定性方向关系作进一步区分;在相同方向区域内,无论目标对象所占空间范围和位置有何差异,只要面积比例相同均被认为空间方向关系相同。
本方法可以用于工地现场的人员异常行为判别,具体步骤可以包括:
1)在工地现场部署摄像机,用于采集人员图像信息;获取摄像机视频信流,并截取单帧图片;
2)统计感兴趣目标在图像中的分布尺寸,确定输入图像的尺寸;
3)按照步骤2)中确定的尺寸,改变输入图像大小(采用resize函数,常见的插值算法有:最近邻、双线性、双三次、基于像素区域关系以及兰索斯插值算法)得到标准数;标准数据中包含有标注各行人的人脸的与人体的位置的位置框信息;
4)建立目标检测网络,包括:第一级网络:在不同的分支上分别实现对人脸和人体位置的精准检测;第二级网络:在第一级网络的基础上,基于人体区域进行特定目标的精准检测;第三级网络:对人脸区域、人体区域与目标区域的相对位置的拓扑关系建模得到拓扑关系模型,用以来精准判别人员异常行为;
采用第一级网络对待识别视频中图像进行人脸与人体的共同检测,获取准确的人脸位置与人体位置;第一级网络输入视频图像,经过第一级网络的检测,输出人脸与人体目标的位置信息;
基于人脸区域,由第二级网络获取安全帽、手机等目标的精准位置;第二级网络输入第一级网络检测出的人脸位置信息,经过第二级网络对人脸区域进行安全帽、手机目标的检测,输出目标信息;
基于人体区域,由第二级网络获取安全服、手机等目标的精准位置;第二级网络的输入第一级网络检测出的人体位置信息,经过第二级网络对人体区域进行安全帽、手机目标的检测,输出目标信息;
5)基于拓扑关系模型,筛选最优目标分布组合,过滤不合理的目标分布;
6)由第三级网络采用空间金字塔模型,根据目标分布组合及上下文语义,在不同分辨率下将图像划分成多个子区域,并将这些区域进行局部链接构成视觉直方图表征图像;
第二级网络输出的目标信息,输入至第三级网络中;第三级网络根据目标分布组合及上下文语义,在不同分辨率下将图像划分成多个子区域,并将这些区域进行局部链接构成视觉直方图表征图像;
层次化的上下文融合隐式的引入空间信息;
推断异常行为是否发生,判断标准为:若人脸与手机有相交则异常,人脸与安全帽相交则正常;人体与手机、安全服相交正常,与安全帽相交异常;
7)输出异常行为实时检测结果。
本发明采用神经网络技术,构建了适于工地现场人员异常行为判别的目标检测网络。本方法可以用于工地现场的人员异常行为判别,最终,结合物联网、机器学习及区块链技术达到提升工地管理智能化、透明化程度的效果,解决工地管理难度大的问题。
附图说明
图1为本方法应用例的智慧工地人员异常行为实时检测方法流程图;
图2是方向关系矩阵模型图(拓扑关系模型);
具体实施方式
下面结合附图与本发明的应用实施例对本技术方案进一步说明:
本具体实施方式中,采用本目标检测网络对工地人员异常行为进行实时检测,步骤如图1所示。
在实施监测之前,首先采用本方法建立监测网络,本监测网络是多等级多分支目标检测网络,它主要由三级网络组成;
第一级网络在不同的分支上分别实现对人脸和人体位置的精准检测;
在第一级网络的基础上,第二级网络基于人脸区域进行安全帽、手机等目标的精准检测,基于人体区域进行安全服、手机等特定目标的精准检测;
第三级网络对人脸区域、人体区域与目标区域的相对位置的拓扑关系建模,实现对正确穿戴安全帽/安全服、是否打手机等异常行为的精准判别。
所述多等级多分支目标检测网络的构建步骤包括:
步骤1、搭建tensorflow深度学习框架,其中第一级检测网络模型的配置利用fasterr-cnn算法完成,用于检测人脸及人体目标;
步骤2、第二级检测网络模型采用alexnet网络进行特征提取;所述alexnet网络包括5个卷积层和3个全连接层;分别基于人脸和人体进行多目标检测;
步骤3、第三级网络即空间金字塔,构建拓扑模型,根据目标分布组合及上下文语义,在不同分辨率下将图像划分为多个scales的bins,然后计算落入每个bins中属于不同分类的个数,并将这些区域进行局部链接构成视觉直方图表征图像。
步骤4、采用随机梯度下降法对所述多等级多分支网络进行训练;
步骤5、利用softmax损失函数对所述多等级多分支网络进行优化;
步骤6、对所述多等级多分支网络进行训练,得到检测模型。
参考图1,本方法应用于智慧工地人员异常行为实时检测时候,基于本目标检测网络,步骤为:
步骤s1:获取摄像机视频信流,并截取单帧图片;
步骤s2:统计感兴趣目标在图像中的分布尺寸,确定输入图像的尺寸;
步骤s3:对人脸、人体与特定目标等区域的相对位置的拓扑关系建模(如图2);
将二维空间划分为九个部分,以目标对象与各方向区域的相交情况为元素构成方向关系矩阵来描述对象空间的方向关系,使空间方向符号化。关系矩阵分为:
a、粗略方向关系矩阵,元素值是0或1,表示参考对象的各方向区域是否与目标对象相交(相交为1,否则为0),如公式(3-1)所示;
b、精确方向关系矩阵,元素值是各方向区域与目标对象的相交面积的百分比,如公式(3-2)所示。精确方向关系矩阵采用面积比例作为描述信息,可以从数量上对定性方向关系作进一步区分;在相同方向区域内,无论目标对象所占空间范围和位置有何差异,只要面积比例相同均被认为空间方向关系相同。
通过人脸/人体与相对区域目标的方向关系与角度关系,判断该位置信息与相交关系。
以人脸为例:设oa内目标为人脸,若安全帽在人脸上方30°~150°范围并与人脸部分相交,则为佩戴安全帽,判为正常;
手机若在oa内的人脸左右出现,并与人脸相交,则为打电话行为,判为异常;
安全帽在安全服之上;
式中,a与b表示为检测的目标分布组合。
步骤s4:按照步骤2)中确定的尺寸要求,resize输入图像;标准数据中包含有标注各行人的人脸的与人体的位置的位置框信息。
步骤s5:由第一级网络即基于共同识别模型对待识别视频中图像进行人脸与人体的共同检测,以输出实时的结构化信息;获取准确的人脸位置与人体位置;
步骤s6:基于人脸区域,由第二级目标检测网络获取安全帽、手机等目标的精准位置;
步骤s7:基于人体区域,由第二级目标检测网络获取安全服、手机等目标的精准位置;
步骤s8:基于步骤3)中建立的拓扑关系模型,由第三级网络即空间金字塔模型,根据目标分布组合及上下文语义,在不同分辨率下将图像划分成多个子区域,并将这些区域进行局部链接构成视觉直方图表征图像。层次化的上下文融合隐式的引入空间信息。精准的推断异常行为是否发生;
若人脸与手机有相交则异常,人脸与安全帽相交则正常;
人体与手机、安全服相交正常,与安全帽相交异常。
步骤s9:输出异常行为实时检测结果。