一种落水人员的识别方法和识别系统与流程

文档序号:30785213发布日期:2022-07-16 07:42阅读:584来源:国知局
一种落水人员的识别方法和识别系统与流程

1.本技术属于目标识别技术领域,尤其涉及一种落水人员的识别方法和识别系统。


背景技术:

2.随着全球经济一体化的发展,海洋成为世界各国交通运输、发展贸易的一条纽带,然而,水上事故的频繁发生,对于人民的生命、财产都是巨大的威胁。水上事故发生后,能否有效迅速地找到搜救落水并实施救助,对于减少生命和财产损失具有重要意义。
3.目前,现有的人工智能识别网络用于水面环境中的落水人员的识别,但是由于自然环境的影响,往往在识别落水人员时存在一定的误检,从而影响了救援。那么,如何提高在水面环境检测下的落水人员的识别率是目前亟需解决的问题。


技术实现要素:

4.本技术实施例提供了一种落水人员的识别方法和识别系统,通过从多个方位对目标物体进行综合识别,解决了在水面环境检测下落水人员识别不准确的问题,提高了落水人员识别的准确度。
5.第一方面,本技术实施例提供了一种落水人员的识别方法,该方法包括:获取多个分布式节点处的多个原始图像,其中,该原始图像包括水域中的目标物体;确定目标物体在原始图像中的第一目标位置;确定在第一目标位置处的目标物体的第一建议置信度,第一建议置信度用于指示目标物体为落水人员的概率;基于第一建议置信度确定目标物体是否为落水人员。
6.第一方面提供的方法,通过获取水域周围多个不同方位处的多个原始图像,确定每个原始图像中的目标物体在原始图像中的目标位置,从而计算目标位置出的目标物体的第一建议置信度,最终利用多个方位的第一建议置信度判断目标物体是否为落水人员,该方法可以提高落水人员识别的准确度。
7.可以理解的,该方法还包括:基于第一原始图像中的目标位置,利用光流法的目标跟踪方法预测目标物体在第一原始图像的下一帧图像中的位置,第一原始图像为多个原始图像中的任意一个图像;基于目标物体在第一原始图像的下一帧图像中的位置,确定第一原始图像的下一帧图像,在该种实现方式中,可以利用光流法的目标跟踪方法判断目标物体在水域中的运动轨迹,从而保证了下一帧拍摄到的图像中的目标物体的精准度。
8.可以理解的,该方法还包括:确定目标物体在原始图像中的第二目标位置,该第二目标位置通过中心节点确定;确定在第二目标位置处的目标物体的第二建议置信度,该第二建议置信度通过中心节点确定,第二建议置信度用于指示目标物体为落水人员的概率;基于第一建议置信度和第二建议置信度确定目标物体是否为落水人员,其中,第一建议置信度根据多个分布式节点确定,确定目标物体是否为落水人员根据中心节点确定。在该种实现方式中,对目标物体的目标位置和建议置信度进行再次审核,然后基于每个节点处得到的建议置信度和二次审核后的建议置信度确定目标物体是否为落水人员进一步提高了
识别的准确性。
9.可以理解的,基于第一建议置信度确定目标物体是否为落水人员,包括:根据第一建议置信度计算第一平均建议置信度;基于第一平均建议置信度和预设置信度阈值判断目标物体是否为落水人员。在该种实现方式中,根据每个节点处的原始图像对应的第一建议置信度计算得到的平均建议置信度和预设只能读阈值对比,可以更加精准的判断目标物体是否为落水人员。
10.可以理解的,基于第一建议置信度和第二建议置信度确定目标物体是否为落水人员,包括:根据第一建议置信度和第二建议置信度计算第二平均置信度;基于第二平均置信度和预设置信度阈值确定目标物体是否为落水人员。在该种实现方式中,将第一建议置信度和第二建议置信度结合,综合得到第二平均置信度,该第二平均置信度为两次审核后的结果,相比于第一平均置信度更加精确,然后将第二平均置信度和预设置信度阈值进行对比得到更为精确的判断结果。
11.可以理解的,根据第一建议置信度和第二建议置信度计算第二平均置信度,包括:根据第一建议置信度和第二建议置信度对应的判决权重,对第一置信度和第二置信度进行加权判断,计算第二平均置信度。在该种实现方式中,可以根据计算力的不同,对第一建议置信度和第二建议置信度赋予不同的判决权重值,最终得到的第二平均置信度的结果更加可靠。
12.第二方面,提供了一种通信装置,该通信装置包括用于执行以上第一方面或者第一方面的任意一方面可能的实现方式中的各个步骤的单元。
13.第三方面,提供了一种通信装置,该通信装置包括至少一个处理器和存储器,该至少一个处理器用于执行以上第一方面或第一方面的任意可能的实现方式中的方法。
14.第四方面,提供了一种通信装置,该通信装置包括至少一个处理器和接口电路,该至少一个处理器用于执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法。
15.第五方面,提供了一种落水人员的识别系统,该落水人员的识别系统包括中心处理器、位于多个节点处的多个云台摄像头和多个子处理器,多个云台摄像头位于水域周围,该系统用于执行以上第一方面或者第一方面中的任意一方面可能的实现方式中的方法。
16.第六方面,提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序在被处理器执行时,用于执行第一方面或第一方面的任意可能的实现方式中的方法。
17.第七方面,提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,当该计算机程序被执行时,用于执行第一方面或第一方面的任意可能的实现方式中的方法。
18.第八方面,提供了一种芯片或者集成电路,该芯片或者集成电路包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有该芯片或者集成电路的设备执行第一方面或第一方面的任意可能的实现方式中的方法。
19.可以理解的是,上述第二方面至第八方面的有益效果可以参见上述第一方面中的相关描述,在此不再赘述。
20.本技术实施例与现有技术相比存在的有益效果是:
21.本技术提供的落水人员的识别方法,通过获取水域周围多个不同方位处的多个原始图像,确定每个原始图像中的目标物体在原始图像中的目标位置,从而计算目标位置出的目标物体的第一建议置信度,最终利用多个方位的第一建议置信度判断目标物体是否为落水人员,该方法可以提高落水人员识别的准确度。
附图说明
22.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
23.图1是本技术实施例提供的落水人员的识别系统的示意图;
24.图2是本技术实施例提供的落水人员的识别系统框架示意图;
25.图3是本技术实施例提供的一种落水人员的识别方法的示意性流程图;
26.图4是本技术实施例提供的目标检测方法的示意性流程图;
27.图5是本技术实施例提供的目标跟踪方法的示意性流程图;
28.图6是本技术实施例提供的落水人员的识别装置的示意性框图;
29.图7是本技术实施例提供的落水人员的识别设备的示意性框图。
具体实施方式
30.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
31.首先,在介绍本技术提供的方法和系统之前,需要对下文中即将提及的部分术语进行说明。当本技术提及术语“第一”或者“第二”等序数词时,除非根据上下文其确实表达顺序之意,否则应当理解为仅仅是起区分之用。
32.术语“示例性的”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性的”或者“例如”的任何实施例或设计方案不应被解释为比其他实施或设计方案更优选或更具优势。确切而言,使用“示例性的”或者“例如”等词旨在以具体方式呈现相关概念。
33.除非另有说明,本文中“/”一般表示前后关联对象是一种“或”的关系,例如,a/b可以表示a或b。术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,在本技术的描述中,“多个”是指两个或两个以上。
34.海难事故发生后,能否有效迅速地找到搜救目标并实施救助,对于减少生命和财产损失具有重要意义。由于搜救目标易于受到风、浪、流等因素的综合影响而不断漂移,特别是海难事故往往发生在恶劣气象条件下,使得确定搜救目标的位置存在很大困难,因此,如何准确地确定包含搜救目标的搜救区域成为搜救过程中的重要环节之一。
35.近几年,水上机器人搜救成为海上救援的重要方式之一,水上机器人搜救相对于
人工搜救来说有着安全性,高效性等特点。水上机器人通过位于头部的摄像头拍摄面前海域环境的图片信息,然后将待搜救人员工作服等表面特征作为识别信息从图片信息的中完成搜救目标的识别和定位。
36.但是,现有的水上机器人在搜救过程中受海上环境、拍摄距离、拍摄角度等因素的影响,导致待搜救人员识别的准确性和速度不佳,生成的待搜救人员的位置信息存在误差,并且,现有的利用人工智能识别网络在搜救人员的同时,往往由于自然环境的影响存在着更多的误检。例如,雾天时水天分界线非常地模糊,强光在水面上反光常被误认为障碍物,水面上的波纹和泡沫被误认为障碍物等,此外水面在不同的时间会产生不同的纹理,例如,泡沫,倒影以及波浪都会让同一片水面在不同的时间和光线条件下产生不同的外观。上述客观因素极大的影响了海上救援的效率。
37.针对上述问题,目前相关的应对方式为通过人工智能识别后进行人工干预,例如,在神经网络识别结果的基础上进行二次人工判别审核,但是该种应对方式会带来较高的人力、物力的成本。
38.因此,如何有效的在水面环境检测下对落水人员进行准确识别是目前需要关注的问题。
39.有鉴于此,本技术提供了一种落水人员的识别方法,通过在落水区域的不同方位分别安装摄像头,然后采集不同方位处的含有目标物体的原始图像,基于原始图像确定每个原始图像中目标物体所在的位置,然后基于目标物体所在的位置确定该目标物体为落水人员的建议置信度,最后基于不同方位处的目标建议置信度判断目标物体是否为落水人员,本技术提供的方法可以从不同的方位对目标物体进行判断,从而提高落水人员识别的准确度。
40.下面结合具体的例子来说明本技术提供的落水人员的识别方法使用的落水人员的识别系统。
41.图1示出了本技术实施例提供的落水人员的识别系统示意图,如图1所示的,该系统包括:中心处理器120和位于多个节点处的摄像头和子处理器,示例性的,图1在节点1处包括摄像头1和处理器1,在节点2处包括摄像头2和处理器2,在节点3处包括摄像头3和处理器3,节点n处包括摄像头n和处理器n。并且,该多个摄像头分别安装于水域周围,以节点1为例,摄像头1用于对落水区域的目标物体进行图像采集,然后将采集到的图像发送给处理器1,处理器1用于根据接收到的图像对落水人员进行精确识别得到第一建议置信度,其余节点得到第一建议置信度的方式和节点1一致,然后各个处理器将建议置信度发送给中心处理器120,然后中心处理器120可以根据第一建议置信度确定是否有人员落水。
42.当然,中心处理器也可以对落水人员进行再次识别得到第二建议置信度,然后中心处理器根据第一建议置信度和第二建议置信度综合判断是否有人员落水。
43.作为一种可能的实现方式,本技术提供的摄像机110可以为云台摄像机。
44.云台摄像机是视频监控领域的一种支持调整拍摄方向并进行镜头变倍的摄像机,具体可以是球机或可外接云台的摄像机。
45.云台摄像机的主要优势在于其支持垂直方向上下、水平方向左右调整拍摄方向以沿光轴方向的镜头变倍,从而可以使用户全方位地观察四周的物体,其视野不受相机安装位置、安装角度及镜头视角的限制。
46.本技术实施例提供的云台摄像机包括了用于获取云台摄像机的镜头朝向的电子罗盘、用于获取云台摄像机的位置信息的gps芯片和处理器。
47.图2示出了本技术实施例提供的落水人员的识别系统框架示意图,如图2所示的,该落水人员的识别系统包括多个节点和决策中心,每个节点处包括了目标检测模块和目标跟踪模块,该目标检测模块用于对每个节点处的输入图像的目标物体进行识别,目标跟踪模块用于对每个节点处识别到的目标物体的位置进行跟踪,最终将每个节点处识别到的目标物体的结果输入至决策中心中,决策中心对输入结果进行综合判断,从而确定该目标物体是否为落水人员。
48.上述对本技术实施例提供的落水人员的识别系统进行了具体介绍,下面结合场景对使用该系统的方法进行介绍。
49.在一种可能的应用场景中,在公园散步时,人们可能会选择沿着湖边行走,在人们沿着湖边行走的过程中可能会存在隐患,例如,在沿着湖边行走时,人们可能会嬉戏打闹或者离湖边很近,此时这种行为可能会使人存在掉入湖中的危险,那么想要获取是否在嬉戏打闹时掉入湖中,可以使用本技术提供的落水人员的识别方法。
50.在另一种可能的场景中,对于一些游泳爱好者来说,除了在游泳馆锻炼,为了尝试新的挑战,他们可能会选择一些户外的湖泊或者河流,在不了解湖泊河流的水深分布的情况下,就很容易出现溺水的意外,那么想要获取游泳者是否在游泳锻炼时发生溺水事件,可以使用本技术提供的落水人员的识别方法。
51.下面,结合图1和图2所示的落水人员的识别系统对本技术提供的落水人员的识别方法进行示例性说明。下面以一个节点处的处理过程为例对本技术实施例提供的落水人员的识别过程进行示例性说明。图3示出了本技术实施例提供的一种落水人员的识别方法的示意性流程图。如图3所示的,该目标检测方法包括:s310至360。
52.s310、获取不同节点处的摄像头拍摄的多个原始图像,每个原始图像包括水域中的目标物体。
53.在本技术实施中,首先获取通过多个节点处的摄像头拍摄到的多个原始图像,该多个原始图像分别对应目标物体的不同角度和不同方位。
54.应理解,由于水面的特殊性,在不同的角度,采集的视频图片的光学表现具有一定的区别性,如强光下,处于一个方位采集到的图像有可能严重失真,但是处于另一个方位所采集的图像信息可能会采集到真实的场景信息等。因此,采集目标物体的不同角度和不同方位的原始图像,可以保证目标物体识别结果的准确性。
55.可选的,作为一种可能的实现方式,该原始图像是通过本技术实施例提供的摄像头采集到的。示例性的,可以是利用云台摄像机拍摄的。
56.作为另一种可能的实现方式,该原始图像是其他设备将采集好的原始图像发送给了本技术实施例提供的识别系统中,然后利用本技术实施例提供的识别系统对该原始图像进行进一步的识别和检测。
57.换句话说,救生系统接收到的原始图像一方面可以是通过识别系统中具备的摄像头采集到的,另一方面也可以是接收到其他设备采集好的原始图像,本技术对原始图像的来源不做限定,可根据具体情况设定。
58.s320、确定每个原始图像中的目标物体在原始图像中的第一目标位置以及在该目
标位置处的目标物体的第一建议置信度。
59.在本技术实施例中,为了得到目标物体的准确识别结果,可以基于获取到的多个原始图像,对原始图像中的目标物体进行初步的识别并且给出第一建议置信度,该第一建议置信度用于指示目标物体为落水人员的概率。
60.可选的,作为一种可能的实现方式,在本技术实施例中可以利用卷积神经网络(convolutional neural networks,cnn)模型对原始图像进行识别。下面以一个节点处的目标检测模型为例对本技术实施例提供的目标检测方法进行具体介绍。图4示出了本技术实施例提供的目标检测方法的示意性流程图。如图4所示的,该方法包括:s3201-s3205。
61.s3201、根据原始图像确定原始图像的多个尺度特征图。
62.在本技术实施例中,为了检测大小不同的多种尺寸的目标,该目标检测模型主干主要分为四组下采样特征提取网络,每组各由2层卷积核叠加构成。将该原始图像输入至目标检测模型的四组下采样特征提取网络中进行目标物体的特征提取时,除过第一层外,每经过一组特征提取组,其输出的尺寸缩小一半,经过多个四组下采样特征网络之后,可得到不同尺度特征图,从而获取多尺度特征。
63.需要说明的是,每张待输入的原始图像都具有通道、宽、高三个维度的值,即c
×w×
h,其中通道代表红、绿、蓝三个通道上的颜色值,宽为图像的宽度,高为图像的高度。
64.例如,以原始图像的尺寸大小为3
×
512
×
512为例,3代表红、绿、蓝三个通道,512
×
512为图像的宽度和高度。则尺寸为3
×
512
×
512的原始图像经过目标检测模型主干后得到512
×
512、256
×
256、128
×
128、64
×
64四组尺度特征图。
65.s3202、确定每个尺度特征图中不同位置分别对应的权重。
66.由于原始图像中各个位置的特征具有不同的权重信息,因此,基于每个尺度特征图中的不同位置也具有不同的权重信息。
67.可选的,作为一种可能的实现方式,在目标神经网络模型中添加了注意力机制可以获得每个尺度特征图中的不同位置的权重信息。
68.可以理解的是,注意力机制主要的两大作用为决定需要关注输入的哪部分;分配有限的信息处理资源给重要的部分。
69.在本技术实施例中,将多尺度特征图输入至注意力机制中,通过在模型的激活层使用激活函数进行激活得到不同尺度特征图中的不同位置相对于目标物体位置的权重信息。
70.示例性的,该激活函数为sigmod激活函数。
71.s3203、基于每个尺度特征图对应的权重和每个尺度特征图,确定每个尺度特征图对应的特征。
72.可选的,作为一种可能的实现方式,在本技术实施例中,将每个尺度特征图得到的多个权重值与该尺度特征图相乘,每张图上的相应位置会计算得到不同的权重。
73.s3204、将n个尺度特征图分别对应的特征进行融合,预测目标物体对应的多个检测框,一个检测框用于表示目标物体的一个位置。
74.可选的,作为一种可能的实现方式,在本技术实施例中,在目标检测模型中包含全连接层,使用该全连接层对四个特征图分别计算,得到多个三维数组,然后将四组特征进行融合,即对该多个三维数组进行加权求和,得到最终的特征信息,但是进行融合后一个目标
物体处会出现多个检测框标注的情况,需要说明的是该多个检测框处都有相对应的建议置信度。
75.s3205、根据目标物体对应的检测框确定目标物体的位置。
76.在本技术实施例中为了对冗余的检测框进行删除,最终保留一个目标物体的检测框,在该目标检测模型里面设置了覆盖率计算,具体的,可以利用如下公式计算覆盖率,
[0077][0078]
其中,cover表示两个检测框的重叠率,a和b分别表示不同检测框的面积;当两个检测框的重叠率大于或者等于预设第一阈值时,确定唯一检测框,唯一检测框为面积为a的检测框或者面积为b的检测框,唯一检测框为目标物体对应的检测框。通过该种方式将对于的检测框去掉,并且保留的检测框上含有目标物体的建议置信度。
[0079]
需要说明的是,该预设第一阈值可以根据具体情况设定,本技术实施例不做限定。
[0080]
基于上述步骤s3201-s3205可以对一个节点处的目标物体进行初步识别并且给出第一建议置信度。那么,其他节点的目标检测模型对目标物体进行识别的过程也可参考上述步骤s3201-s3205。
[0081]
s330、基于第一原始图像中的第一目标位置,利用光流法的目标跟踪方法预测目标物体在第一原始图像的下一帧图像中的位置。
[0082]
在本技术实施例中,为了对目标物体进行精确识别,可以基于上述步骤s320可以得到每个节点处目标物体的位置,对目标物体的位置进行跟踪。
[0083]
可选的,作为一种可能的实现方式,本技术实施例可以基于光流法实现对目标物体的目标跟踪。下面以一个节点处的目标物体的跟踪为例对本技术实施例提供的基于光流法的目标跟踪方法进行具体介绍。图5示出了本技术实施例提供的目标跟踪方法的示意性流程图。如图5所示的,该方法包括:s3301-s3303。
[0084]
s3301、在原始图像的上一帧图像中提取第一目标特征点。
[0085]
在本技术实施例中,首先对连续的落水视频图像的帧序列进行处理,针对每一帧图像检测到落水目标,如果某一帧出现了前景目标,那么找到该目标中具有代表性的特征点。
[0086]
其中,第一目标特征点是指原始图像的上一个目标图像中的与目标相关的特征点,例如,人体的某一个特征点。
[0087]
具体地,在上一帧目标图像的目标跟踪框内,提取易于跟踪的特征点。
[0088]
更进一步,具体地,可以采用提取网格节点的方式,也可以计算每个像素点的跟踪性能,再从中选取一些易于跟踪的点,并保证各点之间有一定的距离。
[0089]
在本技术实施例中,若该原始图像为人脸图像,则目标特征点可以为人脸的特征点。
[0090]
s3302、基于光流法获取目标特征点在原始图像中对应的第二目标特征点。
[0091]
具体地,当获取到原始图像的上一个原始图像中的第一目标特征点后,可以基于该第一目标特征点计算光流,并利用光流信息,即可得到第一目标特征点在该原始图像中的第二目标特征点。
[0092]
需要说明的是,光流法是指当观察者和场景目标之间有相对运动时,图像亮度模式的表现运动。
[0093]
s3303、基于第二目标特征点确定目标物体在原始图像的下一帧图像中的位置。
[0094]
具体地,计算每个特征点在上一帧与当前帧中位置的差值,按差值的大小进行排序,取中间的差值作为特征点移动的距离。计算上一帧中每个特征点之间的距离,同时计算当前帧中每个特征点之间的距离,显然两帧中由特征点距离构成的矩阵的维度是一致的,然后将每个特征点移动一定的距离后形成的位置为目标物体在原始图像的下一帧图像中的位置。
[0095]
s340、基于目标物体在第一原始图像的下一帧图像中的位置,调节第一节点处的摄像头的拍摄角度,第一节点处的摄像头用于拍摄第一原始图像。
[0096]
可选的,作为一种可能的实现方式,可以通过控制云台控制中心提高目标物体跟踪的稳定性。
[0097]
具体的,通过云台控制模块实时接收视频目标跟踪结果,该目标跟踪结果包括目标物体的位置信息,该目标的位置信息包括目标物体的经纬度,然后根据目标物体的位置信息、获取云台摄像机的位置信息,电子罗盘获取该云台摄像机的位置信息、镜头朝向和目标物体的位置信息从而确定目标物体的目标拍摄角度,并将云台摄像机的拍摄角度调整至目的拍摄角度以拍摄该目标物体。根据目标跟踪结果计算目标脱靶量,然后控制云台转动使得目标物体始终保持在视野中心范围。
[0098]
进一步的,可以计算目标跟踪框占全图的比例,通过预设的比例阈值对云台摄像机进行变倍控制,保证了目标呈现合适的大小,进而保证了后续帧识别跟踪的稳定性。
[0099]
s350、第一节点处的摄像头利用调节后的拍摄角度拍摄第一原始图像的下一帧图像。
[0100]
基于步骤s340可以保证采集的目标物体始终处于视野范围内,那么,对于原始图像的下一帧图像进行采集时就可以利用调节后的拍摄角度拍摄原始图像的下一帧图像,这样就会保证采集到的目标物体始终保持在视野中心范围,提高了步骤s320中图像识别的准确度。
[0101]
s360、基于每个原始图像对应的第一建议置信度确定目标物体是否为落水人员。
[0102]
在本技术实施例中,根据上述步骤s320中确定的每个原始图像对应的建议置信度综合判断目标物体是否为落水人员。
[0103]
具体的,本技术可以对步骤s320中得到的建议置信度进行加权平均,然后利用预设置信阈值判断加权平均后的置信度是否大于预设置信阈值,当加权平均后的置信度阈值大于或者等于预设置信阈值,则表示该目标物体为落水人员。当加权平均后的置信度阈值小于预设置信阈值,则表示该目标物体不是落水人员。
[0104]
可选的,作为一种可能的实现方式,在本技术实施例中,为了得到更为准确的识别结果,可以采用大型神经网络模型对采集到的多个原始图像中的目标物体进行再次识别,得到多个第二建议置信度,然后根据第一建议置信度和第二建议置信度共同确定目标物体是否为落水人员。
[0105]
应理解,步骤s360中提及的第二建议置信度的获取方法可以参考步骤s320中的目标识别方法以及s330中目标跟踪方法的描述,在此不再赘述。
[0106]
还应理解,本技术实施例采用的大型神经网络模型可选择深层的图像识别网络和行为识别网络组成的级联网络,这样可以保证在服务器计算能力充足的前提下可获得更高的识别准确率。
[0107]
进一步的,为了得到准确的识别结果,本技术实施例可以根据步骤s320中得到的第一建议置信度和步骤s360中得到的第二建议置信度进行加权平均,然后利用预设置信阈值判断加权平均后的置信度是否大于预设置信阈值,当加权平均后的置信度阈值大于或者等于预设置信阈值,则表示该目标物体为落水人员。当加权平均后的置信度阈值小于预设置信阈值,则表示该目标物体不是落水人员。
[0108]
作为一种可能的实现方式,当采用大型神经网络模型可选择深层的图像识别网络和行为识别网络组成的级联网络得到第二建议置信度,则可以给第二建议置信度赋予更高的判决权重,然后再将第二建议置信度和第一建议置信度进行加权平均得到第二平均置信度,最后利用第二平均置信度和预设置信阈值进行对比,进一步确定目标物体是否为落水人员。
[0109]
需要说明的是,该预设置信度阈值可以根据具体情况设定,本技术实施例不做限定。
[0110]
最后,当目标物体不是落水人员时,则本技术实施例提供的落水人员的识别系统中的摄像头恢复换扫模式继续换扫监控。
[0111]
结合图1-图5对本技术实施例提供的落水人员的识别方法进行了具体的介绍,下面对本技术实施例提供的落水人员的识别装置和落水人员的识别设备进行具体介绍。
[0112]
图6是本技术实施例提供的落水人员的识别装置的示意图。包括的各单元用于执行图3-图5对应的实施例中的各步骤,具体请参阅图3-图5各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图6,落水人员的识别装置600包括:
[0113]
图像获取模块601,该图像获取模块601用于分别获取不同节点处的摄像头拍摄的多个原始图像。
[0114]
目标识别模块602,该目标识别模块602用于确定每个原始图像中目标物体在原始图像中的目标位置;确定每个原始图像中目标位置处的目标物体的建议置信度。
[0115]
目标跟踪模块603,该目标跟踪模块603用于基于第一原始图像中的目标位置,利用光流法的目标跟踪方法预测目标物体在第一原始图像的下一帧图像中的位置;基于目标物体在第一原始图像的下一帧图像中的位置,调节第一节点处的摄像头的拍摄角度。
[0116]
决策中心模块604,该决策中心模块604用于基于每个原始图像对应的建议置信度确定目标物体是否为落水人员。
[0117]
目标识别模块602还用于利用cnn目标检测模型,确定每个原始图像中目标物体在原始图像中的目标位置。
[0118]
具体的,目标识别模块602用于根据原始图像确定原始图像的多个尺度特征图;确定每个尺度特征图中不同位置分别对应的权重;基于每个尺度特征图对应的权重和每个尺度特征图,确定每个尺度特征图对应的特征;将n个尺度特征图分别对应的特征进行融合,预测目标物体对应的多个检测框,一个检测框用于表示目标物体的一个位置;根据目标物体对应的检测框确定目标物体的位置。
[0119]
决策中心模块604还用于根据目标物体在第一原始图像的下一帧图像中的位置和云台摄像机的位置信息,确定第一节点处的云台摄像机的拍摄角度。
[0120]
决策中心模块604还用于据每个原始图像对应的建议置信度计算平均建议置信度;基于平均建议置信度和预设置信度阈值判断目标物体是否为落水人员。
[0121]
图7是本技术实施例提供的落水人员的识别设备的示意图。如图7所示,该实施例提供的落水人员的识别设备700包括:处理器710、存储器720以及存储在所述存储器720中并可在所述处理器710上运行的计算机程序730。处理器710执行所述计算机程序730时实现上述各个落水人员的识别方法实施例中的步骤,例如图3所示的步骤310至360。或者,所述处理器710执行所述计算机程序730时实现上述各装置实施例中各模块/单元的功能,例如图6所示模块701-704的功能。
[0122]
示例性的,所述计算机程序730可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器720中,并由处理器710执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序730在所述落水人员的识别设备700中的执行过程。
[0123]
所述落水人员的识别设备700可以是桌上型计算机、笔记本、掌上电脑及云端服务器或者上位机等计算设备。所述落水人员的识别设备可包括,但不仅限于,处理器710、存储器720。本领域技术人员可以理解,图7仅仅是落水人员的识别设备的示例,并不构成对落水人员的识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述落水人员的识别设备还可以包括输入输出设备、网络接入设备、总线等。
[0124]
所称处理器710可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现成可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0125]
所述存储器720可以是所述落水人员的识别设备700的内部存储单元,例如落水人员的识别设备700的硬盘或内存。所述存储器720也可以是所述落水人员的识别设备700的外部存储设备,例如所述落水人员的识别设备700上配备的插接式硬盘,存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述存储器720还可以既包括所述落水人员的识别设备700的内部存储单元也包括外部存储设备。所述存储器720用于存储所述计算机程序以及所述落水人员的识别设备所需的其他程序和数据。所述存储器720还可以用于暂时地存储已经输出或者将要输出的数据。
[0126]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
[0127]
本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述落水人员的识别方法。
[0128]
本技术实施例提供了一种计算机程序产品,当计算机程序产品在落水人员的识别设备上运行时,使得落水人员的识别设备执行时实现可实现上述落水人员的识别方法。
[0129]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0130]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0131]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
[0132]
在本技术所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0133]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0134]
另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0135]
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0136]
以上所述实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1