游泳场景下的人物识别方法及系统与流程

文档序号:33329462发布日期:2023-03-04 00:08阅读:67来源:国知局
游泳场景下的人物识别方法及系统与流程

1.本发明涉及人物检测识别领域,尤其涉及一种游泳场景下的人物识别方法及系统。


背景技术:

2.人物识别是人工智能技术研究的最主要的热点之一,应用于自动驾驶、安防等各个领域。
3.目前游泳场景下的的人物识别,存在不能有效准确识别人物的问题。原因如下:一、现有的游泳场景识别算法都是适用于常规场景下的,对于游泳场景下的人物识别应用缺乏针对性。例如,常规场景下,人物形态基本都是直立的,人物的穿着打扮差异化明显,基本都有自己的特征,而在游泳场景下,人物形态基本都是水平的,人物穿着都是泳衣泳帽泳镜,没有明显的差异。二、游泳场景下的人物识别,因其特殊复杂环境,存在大量识别干扰因素。游泳场景下,水面对灯光的反射折射、波浪对人体的遮挡等,都会干扰算法对人物的识别,造成误识别,现有技术缺乏排除上述干扰因素造成误差的技术手段。
4.因此,本发明提出了一种新型游泳场景下的人物识别方法及系统,以有效准确识别目标人物。


技术实现要素:

5.本发明提出了一种新型游泳场景下的人物识别方法及系统,以有效准确识别目标人物。
6.为了实现上述目的,本发明所述的游泳场景下的人物识别方法,包括以下步骤:
7.s1:使用预先训练的人物识别算法模型对游泳场景视频数据流执行人物检测,获得含有人物识别矩形目标框的游泳场景视频数据流,所述游泳场景视频数据流包括若干帧图像;
8.s2:通过特征提取算法提取所述若干帧图像里人物识别目标的人物特征信息;
9.s3:在所述若干帧图像里,选取当前帧图像中的一个人物识别目标,确定所述人物识别目标所在的当前帧图像在预设时间内输入的相邻连续帧图像,并统计所述相邻连续帧图像的数量;
10.s4:根据预设时间和预设速度计算s3选取的所述人物识别目标在像素坐标系上运动的最大空间范围;
11.s5:在每一所述相邻连续帧图像的所述最大空间范围里,查找矩形目标框内符合相应所述人物特征信息的第一个人物识别目标,记为匹配人物识别目标,并统计匹配人物识别目标的数量;
12.s6:在人物识别目标的所述匹配人物识别目标数量和所述相邻连续帧图像数量的比小于第一阈值时,将所述人物识别目标记为偶发性误识别人物目标,在偶发性误识别人物目标所在帧图像里,去除所述偶发性误识别人物目标的矩形目标框,否则予以保留;
13.s7:重复执行所述步骤s3至所述步骤s6,输出去除所述偶发性误识别人物目标的矩形目标框的游泳场景视频数据流。
14.所述游泳场景下的人物识别方法的有益效果在于:使用预先训练的人物识别算法模型进行人物检测,然后根据人物识别目标是否在预设时间和预设速度内运动的所述最大空间范围内连续地出现在预设时间输入的相邻帧图像中,以判断是否为偶发性误识别人物目标,并且对偶发性误识别人物目标去除误识别,可以有效提高人物准确识别率。
15.可选地,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像之后,预设时间内输入的相邻连续帧图像。其有益效果在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入起始端,所在帧图像之前不存在或者存在不足数量的帧图像输入,选取在人物识别目标所在帧图像之前,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,则使人物识别目标的偶发性识别目标判定缺乏可行性或者有效性;若随机选取的人物识别目标所在帧图像处于人物首次成像的帧图像之中,则所在帧图像之前的帧图像不存在所述人物识别目标,选取在人物识别目标所在帧图像之前,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,使人物识别目标的偶发性识别判定缺乏可靠性。在所在帧图像之后,选取输入时间为预设时间内的相邻连续帧图像,人物识别目标的偶发性识别判定则可以更合理、可信,使准确去除偶发性误识别人物目标则更有保障。
16.可选地,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像。其有益效果在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入中端,所在帧图像前后存在足够数量的帧图像输入。在所在帧图像前面与后面,选取输入时间各为一半预设时间的相邻连续帧图像,则可以得到更加充分、全面的帧图像数据,作为人物目标的偶发性识别标判定依据,使偶发性误识别人物目标去除更准确可靠。
17.可选地,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像之前,预设时间内输入的相邻连续帧图像。其有益效果在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入末端,则在所在帧图像之后不存在或者存在数量不足的帧图像输入,选取在人物识别目标所在帧图像之后,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,则使人物识别目标的偶发性识别判定缺乏可行性和有效性;若随机选取的人物识别目标所在帧图像处于人物最后一次成像的帧图像之中,则所在帧图像之后的帧图像不存在所述人物识别目标,选取在人物识别目标所在帧图像之后,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,使人物识别目标的偶发性识别判定缺乏可靠性。在所在帧图像之前,选取输入时间为预设时间的相邻连续帧图像,人物识别目标的偶发性识别判定结果则可以更合理可信,使偶发性误识别人物目标去除则更有保障。
18.可选地,所述根据预设时间和预设速度计算s3选取的所述人物识别目标在像素坐标系上运动的最大空间范围,包括:根据人物识别目标的矩形目标框,计算人物的中心坐标;以人物的中心坐标为圆心,半径为预设时间和预设速度的积,计算出人物在世界坐标系
中的最大圆形活动区域;将世界坐标系中的圆形活动区域转换成图像像素坐标系中相应形状的最大空间范围。其有益效果在于:通过计算机估算出,游泳场景下的人物识别目标在预设时间和预设速度内,游泳运动所在的最大空间范围,只在这个最大空间范围里的人物识别目标进行特征匹配,则可以减少特征匹配搜索的范围,避免在最大空间范围外造成误识别和增加无效运算量。
19.可选地,所述将世界坐标系中的圆形活动区域转换成图像像素坐标系中相应形状的最大空间范围,包括:将世界坐标系中圆形活动区域坐标点通过刚体变换转换为相机坐标系坐标点,然后将相机坐标系坐标点通过透视投影变换转换成图像坐标系坐标点,最后将图像坐标系坐标点通过坐标单位换算转换为像素坐标系坐标点,图像中所述像素坐标系坐标点构成的范围即为所述圆形活动区域在图像中的最大空间范围。
20.可选地,所述预设时间为2-4秒。其有益效果在于:若时间预设短,则会导致选取到的相邻连续帧图像数量过少,缺乏论证力;若时间预设过长,会使运算负荷加重,影响处理效率;故需要根据相邻帧图像的合理数量需求对预设时间选取一个合理范围。
21.可选地,所述预设时间为3秒。
22.可选地,所述预设速度为1.5-2.5米/秒。其有益效果在于:若预设速度低于游泳场景下人物正常的最大游泳运动速度,则会一定概率地将正确识别人物目标当做误识别排除;若预设速度高于游泳场景下人物正常的最大游泳运动速度,则会增加特征匹配搜索的范围,造成一定概率的误识别,也增加无效运算量

故需要根据游泳场景下人物游泳运动速度的正常范围对预设速度选取一个合理范围。
23.可选地,所述预设速度为2米/秒。
24.可选地,所述第一阈值为20%-30%。其有益效果在于:若第一阈值过大,则会一定概率地将正确识别人物目标当做偶发性误识别人物目标排除;若第一阈值过小,则会一定概率地将偶发性错误识别人物目标当做正确人物识别目标,使排除不够精确;故需要根据实际去除误识别效果对第一阈值选取一个合理范围。
25.可选地,所述第一阈值为25%。
26.在完成所述步骤s1之前还需要完成对人物识别算法的训练步骤。
27.可选地,所述对人物识别算法的训练步骤,包括:
28.选择一个标准算法模型;
29.收集游泳图像素材进行标注,形成游泳场景人物识别算法训练数据集;
30.利用游泳场景人物识别算法训练数据集对标准人物识别算法模型进行迁移训练,得到人物识别算法模型。
31.其有益效果在于:目前常规的人物识别算法,是应用于通常环境的识别,对于环境特殊、干扰性强、可区别性差的游泳场景进行识别,缺乏针对性,识别效果差,故利用游泳场景数据集对标准算法模型进行训练,获得改进的人物识别算法模型,则可以可提高游泳场景下人物识别针对性、准确性。
32.可选地,所述游泳场景图像素材包括人物数量大于零的游泳图像素材和人物数量等于零的游泳图像素材,所述人物数量等于零的游泳图像素材数量占所述人物数量大于零的游泳图像素材数量的5%~10%。其有益效果在于:游泳场景图像素材包含一定数量的背景图像,图像中无人存在游泳,则可以减少实际位置上没有人物目标,但被误识别为该位置
有人物目标的误报。
33.可选地,所述对人物识别算法的训练步骤,还包括:在发现新的特殊游泳场景时,将所述特殊游泳场景图像素材进行标注处理后,加入到游泳场景人物识别算法训练数据集,然后利用新的游泳场景人物识别算法训练数据集对人物识别算法模型进行训练。其有益效果在于:在制作游泳素材训练数据集时,不可能把所有场景的覆盖到,若某些特殊场景由于未被训练数据集覆盖,特殊场景中又固定存在着类似人物的对象和因人物识别算法模型自身性能不完备无法识别出的真实人物目标,人物识别算法模型会有规律经常性地将固定存在着的类似人物的对象错误识别为人物目标或者将真实人物目标无法识别出,其中,将固定存在着的类似人物的对象错误识别为人物的误识别人物目标,是非偶发性误识别人物目标。将新发现的特殊场景图像补充到训练数据集中重新对人物识别算法模型进行针对性地训练,则可以降低非偶发性的误识别、提高识别准确性。
34.可选地,所述游泳场景监控区域为不同游泳馆、不同游泳池、不同摄像头、不同时间、不同灯光的游泳场景监控区域中的一种。
35.可选地,所述视频数据流为实时视频流、下载视频流中的一种。
36.本发明通过一种游泳场景下的人物识别系统,被配置为执行上述任一项所述游泳场景下的人物识别方法,所述系统包括执行上述任意一种可能的设计的方法的模块/单元。这些模块/单元可以通过硬件实现,也可以通过硬件执行相应的软件实现。其有益效果可以参见上述任一项所述游泳场景下的人物识别方法的描述。
附图说明
37.图1为本发明一些实施例中游泳场景下的人物识别方法的流程图;
38.图2为本发明一些实施例中第一帧图像示意图;
39.图3为本发明一些实施例第二帧图像示意图;
40.图4为本发明一些实施例第三帧图像示意图;
41.图5为本发明一些实施例第四帧图像示意图;
42.图6为本发明一些实施例第五帧图像示意图;
43.图7为本发明一些实施例中人物类目标进行标注的示意图;
44.图8为现有技术游泳场景下人物识别效果示意图;
45.图9为本发明一些实施例中游泳场景下人物识别效果示意图;
46.图10为本发明一些实施例中游泳场景下的人物识别系统的结构框图。
具体实施方式
47.下面结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述。其中,在本技术实施例的描述中,以下实施例中所使用的术语只是为了描述特定实施例的目的,而并非旨在作为对本技术的限制。在本技术以下各实施例中,“至少一个”、“一个或多个”是指一个或两个以上(包含两个)。术语“和/或”,用于描述关联对象的关联关系,表示可以存在三种关系;例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b的情况,其中a、b可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。
48.在本说明书中描述的参考“一个实施例”或“一些实施例”等意味着在本技术的一
个或多个实施例中包括结合该实施例描述的特定特征、结构或特点。由此,在本说明书中的不同之处出现的语句“在一个实施例中”、“在一些实施例中”、“在其他一些实施例中”、“在另外一些实施例中”等不是必然都参考相同的实施例,而是意味着“一个或多个但不是所有的实施例”,除非是以其他方式另外特别强调。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。术语“连接”包括直接连接和间接连接,除非另外说明。“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。
49.在本技术实施例中,“示例性地”或者“例如”等词用于表示作例子、例证或说明。本技术实施例中被描述为“示例性地”或者“例如”的任何实施例或设计方案不应被解释为比其它实施例或设计方案更优选或更具优势。确切而言,使用“示例性地”或者“例如”等词旨在以具体方式呈现相关概念。
50.另外,为了更好地说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。
51.本发明提供了一种游泳场景下的人物识别方法,如图1所示,包括以下步骤:
52.s1:使用预先训练的人物识别算法模型对游泳场景视频数据流执行人物检测,获得含有人物识别矩形目标框的游泳场景视频数据流,所述游泳场景视频数据流包括若干帧图像。
53.本实施例中,游泳场景视频数据流可以从对游泳馆进行实时监控的视频数据中获取。例如,可以为营业的游泳馆加装摄像头进行监控,以获取游泳场景下对游泳池的实时监控视频数据流。也可以从游泳馆的监控视频中下载获得游泳场景视频数据流。
54.s2:通过特征提取算法提取所述若干帧图像里人物识别目标的人物特征信息。
55.在本实施例获得游泳场景视频数据流之后,可以使用reid特征提取算法提取实时监控视频数据流中,若干帧图像里人物识别目标的人物特征,人物特征包括但不限于肤色、长相、体型、服饰。
56.s3:在所述若干帧图像里,选取当前帧图像中的一个人物识别目标,确定所述人物识别目标所在当前帧图像在预设时间内输入的相邻连续帧图像,并统计所述相邻连续帧图像的数量。
57.在本实施例获得人物识别目标的人物特征信息之后,本实施例中预设时间的具体数值可以根据实际需要进行设置,例如,若期望得到100帧相邻连续帧图像,对游泳池进行监控的摄像机帧率为25帧/秒,则预设时间的具体数值为4s,可以设置为4。随机选取当前帧图像中的一个人物识别目标,在人物识别目标所在帧图像处,选取与所述所在帧图像相邻且连续4秒时间内输入的100帧图像,所述100帧图像即为所述人物识别目标所在帧图像在预设时间内的相邻连续帧图像。结合图示说明:将人物识别目标所在帧图像,记为第一帧图像;图2为本发明一些实施例中第一帧图像示意图,如图2所示,第一帧图像含有人物识别目标

、人物识别目标

、人物识别目标

。将人物识别目标所在帧图像之前输入的第一帧图像,记为第二帧图像;图3为本发明一些实施例中第二帧图像示意图,如图3所示,第二帧图像里含有人物识别目标

、人物识别目标

、人物识别目标

、非人物识别目标

、非人物识别目标

。将人物识别目标所在帧图像之前输入的第二帧图像,记为第三帧图像;图4为
本发明一些实施例中第三帧图像示意图,如图4所示,第三帧图像里含有人物识别目标

、人物识别目标

、人物识别目标

、非人物识别目标

。将人物识别目标所在帧图像之后输入的第一帧图像,记为第四帧图像;图5为本发明一些实施例中第四帧图像示意图,如图5所示,第四帧图像里含有人物识别目标

、人物识别目标

、人物识别目标

、非人物识别目标

、非人物识别目标

。将人物识别目标所在帧图像之后输入的第二帧图像,记为第五帧图像;图6为本发明一些实施例中第五帧图像示意图,如图6所示,第五帧图像里含有人物识别目标

、人物识别目标

、人物识别目标

、非人物识别目标

;则连续输入的第三帧图像、第二帧图像、第四帧图像、第五帧图像,即为第一帧图像的相邻连续帧图像。
58.s4:根据预设时间和预设速度计算s3选取的所述人物识别目标在像素坐标系上运动的最大空间范围。
59.在本实施例获得所述相邻连续帧图像的数量之后,可以根据游泳场景下的可能最大游泳运动速度确定一预设速度,然后利用计算机估算出人物识别目标在预设时间和预设速度内出现在图像像素坐标系的最大空间范围,例如,可以根据人物识别目标的运动方向、预设时间、预设速度、运动环境,估算出不同形状、不同大小的最大空间范围。本步骤中,确定出人物目标出现在相邻连续帧图像中的最大空间范围,只在这个最大空间范围里的人物识别目标进行特征匹配,则可以减少特征匹配搜索的范围,避免在最大空间范围外造成误识别和增加无效运算量。
60.s5:在每一所述相邻连续帧图像的所述最大空间范围里,查找矩形目标框内符合相应所述人物特征信息的第一个人物识别目标,记为匹配人物识别目标,并统计匹配人物识别目标的数量。
61.具体地,在本实施例获取到最大空间范围之后,从s2抽取的若干人物特征信息中,得到s3选取的所述人物识别目标的人物特征信息,记为第一特征信息,从s2抽取的若干人物特征信息中,得到相邻连续帧图像中最大空间范围内所有人物识别目标的人物特征信息,记为第二特征信息;当第二特征与第一特征相似度大于第二阈值时,把第二特征相应的人物识别目标记为所述人物识别目标的匹配人物识别目标。在s4选取的每一帧相邻连续图像的最大空间范围里,只匹配出第一个匹配人物识别目标,其余人物识别目标不继续匹配,匹配出的匹配人物识别目标的相邻连续帧图像,匹配人物识别目标数量记为1个,若没有一个人物识别目标可以匹配成功,则该相邻连续帧图像的匹配人物识别目标数量记为0个。
62.s6:在人物识别目标的所述匹配人物识别目标数量和所述相邻连续帧图像数量的比小于第一阈值时,将所述人物识别目标记为偶发性误识别人物目标,在偶发性误识别人物目标所在帧图像里,去除所述偶发性误识别人物目标的矩形目标框,否则予以保留。
63.在本实施例获取到匹配人物识别目标后,可以根据识别效果,预先设定一第一阈值,然后选取匹配人物识别目标数量和所述相邻连续帧图像数量的比小于第一阈值的人物识别目标,通过编写的代码去除所述人物识别目标的矩形目标框。
64.s7:重复执行所述步骤s3至所述步骤s6,输出去除所述偶发性误识别人物目标的矩形目标框的游泳场景视频数据流。
65.本实施例发明的游泳场景下的人物识别方法,本发明使用预先训练的人物识别算法模型进行人物检测,然后基于游泳场景下人物识别目标的运动规律及成像规律,根据人物识别目标是否在预设时间和预设速度内运动的所述最大空间范围里连续出现在预设时
间的相邻帧图像中,以判断是否为偶发性误识别人物目标,并且对偶发性误识别人物目标去除误识别,可以有效提高人物准确识别率。
66.本发明的偶发性误识别人物目标定义为:由于游泳场景的不确定因素干扰,造成对某一对象偶然性、无规律性地错误识别为人物的人物识别目标。
67.在一些可能的实施例中,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像之后,预设时间内输入的相邻连续帧图像。其优点在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入起始端,所在帧图像之前不存在或者存在不足数量的帧图像输入,选取在人物识别目标所在帧图像之前,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,则使人物识别目标的偶发性识别目标判定缺乏可行性或者有效性;若随机选取的人物识别目标所在帧图像处于人物首次成像的帧图像之中,则所在帧图像之前的帧图像不存在所述人物识别目标,选取在人物识别目标所在帧图像之前,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,使人物识别目标的偶发性识别判定缺乏可靠性。在所在帧图像之后,选取输入时间为预设时间内的相邻连续帧图像,人物识别目标的偶发性识别判定则可以更合理、可信,使准确去除偶发性误识别人物目标则更有保障。
68.在一些可能的实施例中,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像。其优点在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入中端,所在帧图像前后存在足够数量的帧图像输入。在所在帧图像前面与后面,选取输入时间各为一半预设时间的相邻连续帧图像,则可以得到更加充分、全面的帧图像数据,作为人物目标的偶发性识别标判定依据,使偶发性误识别人物目标去除更准确可靠。
69.在一些可能的实施例中,s3中所述相邻连续帧图像,包括:以若干帧图像输入的前后顺序为方向,在所述人物识别目标所在帧图像之前,预设时间内输入的相邻连续帧图像。其优点在于:若随机选取的人物识别目标所在帧图像处于若干帧图像的输入末端,则在所在帧图像之后不存在或者存在数量不足的帧图像输入,选取在人物识别目标所在帧图像之后,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,则使人物识别目标的偶发性识别判定缺乏可行性和有效性;若随机选取的人物识别目标所在帧图像处于人物最后一次成像的帧图像之中,则所在帧图像之后的帧图像不存在所述人物识别目标,选取在人物识别目标所在帧图像之后,预设时间输入的相邻连续帧图像或者在人物识别目标所在帧图像前面与后面,各为一半预设时间输入的相邻连续帧图像,使人物识别目标的偶发性识别判定缺乏可靠性。在所在帧图像之前,选取输入时间为预设时间的相邻连续帧图像,人物识别目标的偶发性识别判定结果则可以更合理可信,使偶发性误识别人物目标去除则更有保障。
70.在一些可能的实施例中,所述根据预设时间和预设速度计算s3选取的所述人物识别目标在像素坐标系上运动的最大空间范围,包括:根据人物识别目标的矩形目标框,计算人物的中心坐标;以人物的中心坐标为圆心,半径为预设时间和预设速度的积,计算出人物在世界坐标系中的最大圆形活动区域;将世界坐标系中的圆形活动区域转换成图像像素坐标系中相应形状的最大空间范围。在本实施中:通过计算机估算出,游泳场景下的人物识别
目标在预设时间和预设速度内,游泳运动所在的所述最大空间范围,只在这个所述最大空间范围里的人物识别目标进行特征匹配,则可以减少特征匹配搜索的范围,避免在所述最大空间范围外造成误识别和增加无效运算量。
71.进一步地,在一些可能的实施例中,所述将世界坐标系中的圆形活动区域转换成图像像素坐标系中相应形状的最大空间范围,包括:将世界坐标系中圆形活动区域坐标点通过刚体变换转换为相机坐标系坐标点,然后将相机坐标系坐标点通过透视投影变换转换成图像坐标系坐标点,最后将图像坐标系坐标点通过坐标单位换算转换为像素坐标系坐标点,图像中所述像素坐标系坐标点构成的范围即为所述圆形活动区域在图像中的最大空间范围。本实施例中,以当前人物识别目标框的中心位置为圆心,预设时间和预设速度的积为半径,通过计算机计算出在预设时间内游泳运动的所述最大空间范围,是计算机进行简单高效运算的方式之一。
72.在一些可能的实施例中,所述将世界坐标系中的圆形活动区域转换成图像像素坐标系中相应形状的所述最大空间范围,具体包括:
73.从现实世界中的游泳场景到摄像头输出图像中的游泳场景,坐标变换需要使用四个坐标系,分别为像素平面坐标系(u,v)、图像平面坐标系(x,y)、相机坐标系(xc,yc,zc)和世界坐标系(x,y,z)。
74.公式

为通过数学方法将世界坐标系(x,y,z)转换为像素平面坐标系(u,v)的总公式。
[0075][0076]
其中,真实世界中的人物,坐标为(x、y、z),zc是沿相机主光轴方向真人离相机的距离,f为相机的焦距。等价于刚性变换矩阵其中,r是一个3
×
3的旋转矩阵,t为3
×
1的平移矩阵,矩阵元素(t
x
,ty,tz)是相机在世界坐标系中的位置,矩阵元素r是根据相机偏转角度计算出来的9个系数,当相机角度确定,则每个系数都可以计算确定。
[0077]
特别说明地,世界坐标系中人的坐标是米为单位,先转换成相机坐标系,再转换成图像坐标系,这时图像坐标系中人的坐标单位还是米。但是计算机中图像是以像素为单位衡量的,因为在计算机中图像是由一个个像素点组成的。因此我们需要将以米为单位的图像坐标系坐标换算成以像素为单位的像素坐标系坐标。dx是指图片中像素在水平方向的单位物理尺寸,dy是指图片中像素在垂直方向的单位物理尺寸。以一个100像素
×
50像素的图片为例,图片对应的真实物体尺寸为10米
×
8米,那么dx=10米/100像素=0.1米/像素,dy=8米/50像素=0.16米/像素。(u,v)就是图片中人的坐标。(u0,v0)是图片的中心位置,以前述100像素
×
50像素的图片为例,则u0=50,v0=25。
[0078]
通过公式

转换世界坐标系中的圆形活动区域坐标获得的图像中的像素坐标范围即为圆形活动区域在图像中相应形状的最大空间范围。
[0079]
在一些可能的实施例中,所述预设时间为3秒。
[0080]
还一些可能的实施例中,所述预设时间为2秒。
[0081]
在又一些可能的实施例中,所述预设时间为4秒。
[0082]
在一些可能的实施例中,所述预设速度为1.5米/秒。
[0083]
还一些可能的实施例中,所述预设速度为2米/秒。
[0084]
在又一些可能的实施例中,所述预设速度为2.5米/秒。
[0085]
在一些可能的实施例中,所述第一阈值为20%。
[0086]
还一些可能的实施例中,所述第一阈值为25%。
[0087]
在又一些可能的实施例中,所述第一阈值为30%。
[0088]
在完成所述步骤s1之前还需要完成对人物识别算法的训练步骤。目前的人物识别算法都是基于常规场景下的素材进行训练的,直接应用于环境特殊的游泳场景,算法缺乏针对性,识别效果差,在本实施例中,可以克服现有游泳场景下人物识别算法缺乏针对性,识别效果差的问题。
[0089]
在一些可能的实施例中,所述对人物识别算法的训练步骤,包括:
[0090]
选择一个标准算法模型;
[0091]
收集游泳图像素材进行标注,形成游泳场景人物识别算法训练数据集;
[0092]
利用游泳场景人物识别算法训练数据集对标准人物识别算法模型进行迁移训练,得到人物识别算法模型。
[0093]
在一些可能的实施例中,所述对人物识别算法的训练步骤,包括以下步骤:
[0094]
步骤1:选择一个yolov5m6标准算法模型。
[0095]
步骤2:收集若干不同游泳环境下的视频素材。视频素材包括但不限于不同场馆、不同灯光、不同摄像头、不同时间、不同人物的视频素材,还包括无人游泳的空场情况视频素材,所述视频素材含有若干图像素材。若干图像素材包括数量大于1500张的图像素材,其中人物类识别目标数量大于10000个,也包括人物数量大于零的游泳图像素材和人物数量等于零的游泳图像素材,其中所述人物数量等于零的游泳图像素材数量占所述人物数量大于零的游泳图像素材的5%~10%。例如,选取3000张不同场馆、不同灯光、不同摄像头、不同时间、不同人物的游泳场景图像素材,其中人物数量等于零的游泳图像素材数量为300张,3000张图像素材中含有12000个人物目标。
[0096]
步骤3:抽取视频素材关键帧图像,利用图片标注工具对图像的所有人物类目标进行准确标注获得游泳场景人物识别算法训练数据集。训练数据集中包括训练集和校验集两类图片,训练集用于训练模型,校验集用于检验训练后的模型效果。例如,图7为本发明一些实施例中为人物类目标进行标注的示意图,如图7所示,需要将游泳池内的人物目标

、人物目标

、人物目标

、人物目标

、人物目标

用矩形目标框进行准确标注为0-person,但非人物目标

则不需要进行标识。
[0097]
步骤4:基于yolov5m6标准人物识别算法模型,使用制作好的人物识别算法数据集进行迁移训练,得到人物识别算法模型。例如,在有gpu的服务器上,指定yolov5m6标准人物识别算法模型和训练集进行训练,使用训练好的新的算法模型对验证集中的素材进行验
证,验证效果达不到预期目标的话,会采用训练集继续进行训练,直到满足预期要求,即可得到人物识别算法模型。
[0098]
在一些可能的实施例中,所述游泳场景图像素材包括人物数量大于零的游泳图像素材和人物数量等于零的游泳图像素材,所述人物数量等于零的游泳图像素材数量占所述人物数量大于零的游泳图像素材数量的5%。
[0099]
还一些可能的实施例中,所述游泳场景图像素材包括人物数量大于零的游泳图像素材和人物数量等于零的游泳图像素材,所述人物数量等于零的游泳图像素材数量占所述人物数量大于零的游泳图像素材数量的8%。
[0100]
在又一些可能的实施例中,所述游泳场景图像素材包括人物数量大于零的游泳图像素材和人物数量等于零的游泳图像素材,所述人物数量等于零的游泳图像素材数量占所述人物数量大于零的游泳图像素材数量的10%。
[0101]
在一些可能的实施例中,所述标准算法模型为yolov5n6、yolov5s6、yolov5m6、yolov5l6、yolov5x6模型中的一种。
[0102]
在一些可能的实施例中,所述对人物识别算法的训练步骤,还包括:在发现新的特殊游泳场景时,将所述特殊游泳场景图像素材进行标注处理后,加入到游泳场景人物识别算法训练数据集,然后利用新的游泳场景人物识别算法训练数据集对人物识别算法模型进行训练。在本实施例中:在制作游泳素材训练数据集时,不可能把所有场景的覆盖到,若某些特殊场景由于未被训练数据集覆盖,特殊场景中又固定存在着类似人物的对象和因人物识别算法模型自身性能无法识别出的真实人物目标,人物识别算法模型会有规律经常性地将固定存在着的类似人物的对象错误识别为人物目标或者将真实人物目标无法识别出,其中,将固定存在着的类似人物的对象错误识别为人物的误识别人物目标,是非偶发性误识别人物目标。将新发现的特殊场景图像补充到训练数据集中重新对人物识别算法模型进行针对性地训练,则可以降低非偶发性的误识别、提高识别准确性。
[0103]
进一步地,获取游泳馆内游泳池的实时监控视频数据,使用未经游泳场景视频素材训练的yolov5m6算法对实时监控视频数据进行人物目标识别,得到带有人物识别目标矩形目标框的第一新视频数据流。选取第一新视频数据流中一图像,记为:现有技术游泳场景下人物识别效果示意图。图8为现有技术游泳场景下人物识别效果示意图,由图8可知,识别结果为正确识别出人物目标

、人物目标

、人物目标

,未识别出人物目标

,错误识别非人物目标

。其中,非人物目标

为游泳池底黑色水影,因水的影响,偶然性地被当成人物而误识别为人物目标,即为偶发性误识别人物目标。说明不能完全识别出游泳场景下视频数据流中的所有人物目标,而且会对偶发性非人物目标存在错误识别。相对应地,同时获取所述游泳馆内游泳池的实时监控视频数据,使用本发明游泳场景下的人物识别方法对实时监控视频数据进行人物目标识别,得到带有人物识别目标矩形目标框的第二新视频数据流。在第二新视频数据流中,选取与图8处于同一时刻的图像,记为:为本发明游泳场景下人物识别效果示意图。图9为本发明一些实施例中游泳场景下人物识别效果示意图,由图9可知,识别结果为正确识别出人物目标

、人物目标

、人物目标

,人物目标

,未识别出偶发性非人物目标

。说明本发明游泳场景下的人物识别方法能够有效地将泳池底部偶发性误识别人物目标消除,能准确、有效地识别出游泳场景下的全部真实人物目标,提高准确识别率。
[0104]
图10为本发明一些实施例中游泳场景下的人物识别系统的结构框图。所述人物识别系统被配置为执行所述游泳场景下人物识别的方法,如图10所示,所述人物识别系统包括:获取模块101、检测模块102、偶发性误识别判定模块103、消除偶发性误识别模块104、输出模块105;所述获取模块101用于获取游泳场景下监控区域的视频数据流,并从所述视频数据流中获取帧图像;所述检测模块102用于对所述帧图像执行人物检测和特征提取,获得带有矩形目标框的人物识别目标及其人物特征信息;所述偶发性误识别判定模块103用于对所述帧图像中的人物识别目标执行偶发性误识别判定;所述消除偶发性误识别模块104用于根据人物识别目标的所述偶发性误识别判定结果进行误识别消除;所述输出模块105用于输出去除所述偶发性误识别人物目标的矩形目标框的游泳场景视频数据流。
[0105]
在一些可能的实施例中,所述检测模块102包括:标注单元、训练单元、检测单元、提取单元;所述标注单元用于对游泳图片中的人物目标进行标注,制作数据集;所述训练单元用于对人物识别算法使用游泳视频素材进行训练,获得人物识别算法模型;所述检测单元用于对所述帧图像执行人物检测,获得带有矩形目标框的人物识别目标;所述提取单元用于对检测出的人物识别目标进行特征提取,获得人物识别目标的特征信息;所述偶发性误识别判定模块103包括:设置单元、检测单元、匹配单元;所述设置单元用于设置第一阈值、第二阈值、预设时间、预设速度;所述检测单元用于对所述帧图像中人物识别目标执行相邻连续帧图像数量统计和所述匹配人物识别目标数量的统计;所述匹配单元用于将所述匹配人物识别目标数量和相应相邻连续帧图像数量的比与第一阈值比对,获得比值小于第一阈值的人物识别目标,将其确定为偶发性误识别人物目标;所述消除偶发性误识别模块104用于对所述偶发性误识别人物目标消除误识别;若人物识别目标匹配为偶发性误识别人物目标,则所述消除偶发性误识别模块对所述偶发性误识别人物目标的矩形目标框执行消除处理。
[0106]
具体地,如图8所示,在现有技术游泳场景下人物识别效果示意图中,含有人物检测模块102识别出的人物目标

、人物目标

、人物目标

,未识别出人物目标

,错误识别非人物目标

。其中,非人物目标

为游泳池底黑色水影,因水的影响,偶然性地被当成人物而误识别为人物目标,即为偶发性误识别人物目标。如图9所示,在本发明游泳场景下人物识别效果示意图中,偶发性误识别判定模块103将非人物目标

判定为偶发性误识别人物目标后,消除偶发性误识别模块104将非人物目标

的矩形目标框去除,然后输出模块用于输出去除所述偶发性误识别人物目标的矩形目标框的游泳场景视频数据流。
[0107]
以上所述,仅为本技术实施例的具体实施方式,但本技术实施例的保护范围并不局限于此,任何在本技术实施例揭露的技术范围内的变化或替换,都应涵盖在本技术实施例的保护范围之内。因此,本技术实施例的保护范围应以所述的权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1