一种人脸检测方法及装置、存储介质及电子设备与流程

文档序号:29426090发布日期:2022-03-26 15:08阅读:110来源:国知局
一种人脸检测方法及装置、存储介质及电子设备与流程

1.本发明涉及数据处理技术领域,特别涉及一种人脸检测方法及装置、存储介质及电子设备。


背景技术:

2.随着视频行业的发展,人们对于视频内容的延伸需求越来越突出,近年来,人工智能与深度学习技术飞速发展,计算机视觉领域的人脸识别技术发展日趋成熟,引入该技术到视频内容理解上可以有效的满足用户的需求,实现在不影响用户观看视频的前提下就能获取视频延伸信息,从而节省用户检索时间。
3.在对视频中的人脸进行检测的过程中,通常会采用人脸识别算法对视频帧进行识别,然而,现有的人脸识别算法存在一定的误检和漏检,尤其是侧脸、遮挡等条件下,人脸识别精度低。


技术实现要素:

4.本发明所要解决的技术问题是提供一种人脸检测方法,能够提高人脸检测结果的准确性。
5.本发明还提供了一种人脸检测装置,用以保证上述方法在实际中的实现及应用。
6.一种人脸检测方法,包括:获取待检测视频;将所述待检测视频划分为多个视频片段;对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧;对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。
7.上述的方法,可选的,还包括:在所述视频帧的人脸识别结果表征所述视频帧存在新的目标人脸的情况下,根据所述人脸识别结果中的所述新的目标人脸的位置信息初始化所述新的目标人脸的追踪器,并利用所述追踪器对所述新的目标人脸进行反向追踪和/或正向追踪,直至满足所述追踪条件,得到所述新的目标人脸在各个新的目标视频帧的追踪结果;所述新的目标视频帧为所述视频片段中已追踪到所述新的目标人脸的视频帧,所述反向追踪指的是按视频时间由
后至先的顺序对所述视频段中所述视频帧之前的各个待追踪视频帧进行追踪,所述正向追踪指的是按视频时间由先至后的顺序对所述视频段中所述视频帧之后的各个待追踪视频帧进行追踪。
8.上述的方法,可选的,还包括:对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧不存在目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,将所述追踪结果确定为所述视频帧的人脸检测结果。
9.上述的方法,可选的,还包括:对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在目标人脸,且所述视频帧不存在所述目标人脸的追踪结果的情况下,将所述人脸识别结果确定为所述视频帧的人脸检测结果。
10.上述的方法,可选的,所述将所述待检测视频划分为多个视频片段,包括:确定出所述待检测视频中相邻的视频帧之间的画面变动幅度;根据所述待检测视频中相邻的视频帧之间的画面变动幅度,对所述待检测视频进行划分,得到多个视频片段;其中,对于相邻的两个视频片段中的第一视频片段和第二视频片段,所述第一视频片段的结束帧与所述第二视频片段的起始帧之间的画面变动幅度大于预设的变动幅度阈值,所述第一视频片段为所述第二视频片段的前一视频片段。
11.上述的方法,可选的,所述根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果,包括:确定所述视频帧的人脸识别结果中的所述目标人脸的人脸识别框与所述视频帧的追踪结果中的所述目标人脸的人脸追踪框之间的交并比;在所述交并比大于预设的交并比阈值的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果;在所述交并比小于或等于所述交并比阈值的情况下,将所述视频帧的人脸识别结果中的置信度与所述视频帧的追踪结果中的置信度进行对比;在所述视频帧的人脸识别结果中的置信度大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的人脸识别结果确定为所述视频帧的人脸检测结果;在所述视频帧的人脸识别结果中的置信度不大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果。
12.上述的方法,可选的,在确定出视频帧的人脸检测结果之后,还包括:根据各个所述人脸检测结果所属的视频帧的视频时间确定出所述目标人脸在所述待检测视频中出现的时间信息;向预设的前端输出所述目标人脸在所述待检测视频中出现的时间信息。
13.一种人脸检测装置,包括:获取单元,用于获取待检测视频;划分单元,用于将所述待检测视频划分为多个视频片段;执行单元,用于对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况
下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,直至满足预设的追踪条件,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧;确定单元,用于对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。
14.一种存储介质,所述存储介质包括存储指令,其中,在所述指令运行时控制所述存储介质所在的设备执行如上述的人脸检测方法。
15.一种电子设备,包括存储器,以及一个或者一个以上的指令,其中一个或一个以上指令存储于存储器中,且经配置以由一个或者一个以上处理器执行如上述的人脸检测方法。
16.基于上述本发明实施提供的一种人脸检测方法及装置、存储介质及电子设备,该方法包括:获取待检测视频;将所述待检测视频划分为多个视频片段;对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧;对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。应用本发明实施例提供的方法,通过联合人脸识别结果和追踪结果来确定出人脸检测结果,有效的提高了人脸检测的精度。
附图说明
17.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
18.图1为本发明提供的一种人脸检测方法的方法流程图;图2为本发明提供的一种将待检测视频划分为多个视频片段的过程的流程图;图3为本发明提供的一种根据人脸识别结果以及追踪结果确定人脸检测结果的过程流程图;图4为本发明提供的一种人脸检测装置的结构示意图;图5为本发明提供的一种电子设备的结构示意图。
具体实施方式
19.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.在本技术中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
21.本发明实施例提供了一种人脸检测方法,该方法可以应用于电子设备,所述方法的方法流程图如图1所示,具体包括:s101:获取待检测视频。
22.在本实施例中,可以在接收到检测指令的情况下,获取待检测视频,待检测视频可以为预先下载的视频,视频中可以包含一个或多个人物对象的画面。
23.s102:将所述待检测视频划分为多个视频片段。
24.在本实施例中,视频片段可以指的是镜头片段,每个视频片段可以包含多个视频帧,每个视频片段的结束帧与该视频片段的下一视频片段的起始帧之间的画面变动幅度大于预设的画面变动幅度阈值。
25.可选的,对于每个视频片段,该视频片段的部分或全部视频帧可以包含人物对象的人脸信息。
26.s103:对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧。
27.在本实施例中,每个视频帧均具有其对应的视频时间,即,视频帧在视频播放过程中出现的时间。
28.可选的,对视频帧进行人脸识别的过程可以为:确定视频帧中是否存在人脸,在视频帧存在人脸的情况下,提取视频帧中的人脸特征,将视频帧中的人脸特征与预设的目标人脸库中的各个目标人脸的人脸特征进行比对,若视频帧中的人脸特征与目标人脸库中的其中一个目标人脸特征之间的欧氏距离小于预设的距离阈值,且与目标人脸库中其余的人脸特征之间的欧氏距离不小于该距离阈值,则确定视频帧的人脸识别结果表征视频帧中存在目标人脸,否则,确定视频帧的人脸识别结果表征视频帧中不存在目标人脸,该目标人脸为目标人脸库中与视频帧的人脸特征的欧氏距离小于距离阈值的目标人脸特征所属的目标人物对象的人脸。
29.可选的,目标人脸库中包含多个目标人物对象的人脸特征,具体可以采用scrfd算法对目标人物的图片进行人脸检测,使用arcface算法对检测到的人脸进行特征提取,将提
取到的人脸特征存到目标人脸库中。
30.可选的,可以利用追踪器对目标人脸进行正向追踪和/或反向追踪,直至满足预设的追踪条件,得到所述目标人脸在各个目标视频帧的追踪结果;追踪器可以是siamrpn算法追踪器,追踪条件可以是追踪得分小于预设的追踪得分阈值,或者到达终止追踪帧,其中,反向追踪的终止追踪帧为视频片段的起始帧,正向追踪的终止追踪帧为视频片段的结束帧,追踪得分依据siamrpn算法计算得到的,具体可以是追踪结果中的置信度,即追踪得分越高,视频帧的追踪结果的人脸追踪框的可信程度越高,目标人脸的位置信息可以为人脸识别结果中的人脸识别框的位置。
31.在一些实施例中,目标人脸可以为首次识别到的第一目标人物对象的人脸,在一个视频帧存在多个首次出现的第一目标人物对象的目标人脸的情况下,可以为每个目标人脸分别初始化一个追踪器。
32.s104:对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。
33.在本实施例中,可以将人脸识别结果和追踪结果中的一种确定为视频帧的人脸检测结果。
34.可选的,人脸识别结果可以包含人脸识别框、目标人脸所属目标人物对象的标识和人脸识别框的置信度等其中至少一种,追踪结果可以包含人脸追踪框、目标人脸所属目标任务对象的标识和人脸追踪框的置信度等其中至少一种。
35.应用本发明实施例提供的方法,通过联合人脸识别结果和追踪结果来确定出人脸检测结果,有效的提高了人脸检测的精度。
36.在本发明提供的一实施例中,基于上述的实施过程,可选的,还包括:在所述视频帧的人脸识别结果表征所述视频帧存在新的目标人脸的情况下,根据所述人脸识别结果中的所述新的目标人脸的位置信息初始化所述新的目标人脸的追踪器,并利用所述追踪器对所述新的目标人脸进行反向追踪和/或正向追踪,直至满足所述追踪条件,得到所述新的目标人脸在各个新的目标视频帧的追踪结果;所述新的目标视频帧为所述视频片段中已追踪到所述新的目标人脸的视频帧,所述反向追踪指的是按视频时间由后至先的顺序对所述视频段中所述视频帧之前的待追踪视频帧进行追踪,所述正向追踪指的是按视频时间由先至后的顺序对所述视频段中所述视频帧之后的待追踪视频帧进行追踪。
37.在本实施例中,待追踪视频帧可以为视频片段中除该视频帧以外的视频帧。
38.可选的,目标人脸所属的目标人物对象与新的目标人脸所属的目标人物对象不同,新的目标人脸可以是第二目标人物对象的人脸。
39.本发明实施例采用集成多个单目标追踪器的方式实现对多目标的追踪,可以根据视频内容自动调整追踪器个数,保证追踪效果的同时有效减少不必要的计算量。
40.在本发明提供的一实施例中,基于上述的实施过程,可选的,还包括:对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧不存在目标人脸,且所述视频帧存在所述目标人脸的追踪结果的
情况下,将所述追踪结果确定为所述视频帧的人脸检测结果。
41.在本发明提供的一实施例中,基于上述的实施过程,可选的,还包括:对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在目标人脸,且所述视频帧不存在所述目标人脸的追踪结果的情况下,将所述人脸识别结果确定为所述视频帧的人脸检测结果。
42.在本发明提供的一实施例中,基于上述的实施过程,可选的,所述将所述待检测视频划分为多个视频片段的过程,如图2所示,具体包括:s201:确定出所述待检测视频中相邻的视频帧之间的画面变动幅度。
43.在本实施例中,相邻两个视频帧之间的画面变动幅度指的是,两个视频帧画面全部像素的差值。
44.s202:根据所述待检测视频中相邻的视频帧之间的画面变动幅度,对所述待检测视频进行划分,得到多个视频片段;其中,对于相邻的两个视频片段中的第一视频片段和第二视频片段,所述第一视频片段的结束帧与所述第二视频片段的起始帧之间的画面变动幅度大于预设的变动幅度阈值,所述第一视频片段为所述第二视频片段的前一视频片段。
45.在本实施例中,若待检测视频中存在相邻的两个视频帧之间的画面变动幅度大于变动幅度阈值,则对这两个视频帧进行切分,即,将这两个视频帧划分到不同的视频片段中,变动幅度阈值可以依据实际需求进行设定。
46.应用本发明实施例提供的方法,通过对视频的分割可以在有效去除不同视频片段间视频帧干扰的同时,保持同一视频片段内结果的连贯性。
47.在本发明提供的一实施例中,基于上述的实施过程,可选的,所述根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果的过程,如图3所示,可以包括:s301:确定所述视频帧的人脸识别结果中的所述目标人脸的人脸识别框与所述视频帧的追踪结果中的所述目标人脸的人脸追踪框之间的交并比。
48.在本实施例中,比较人脸识别框与人脸追踪框之间的交并比iou,交并比指的是两个方框的交集与并集的比值,反映的是两个方框的重合程度。
49.s302:在所述交并比大于预设的交并比阈值的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果。
50.s303:在所述交并比小于或等于所述交并比阈值的情况下,将所述视频帧的人脸识别结果中的置信度与所述视频帧的追踪结果中的置信度进行对比。
51.在本实施例中,人脸识别结果中的置信度可以表示人脸识别框的可信程度,可以由人脸识别算法计算得到;追踪结果中的置信度可以表示人脸追踪框的可信程度,可以由追踪算法计算得到。
52.s304:在所述视频帧的人脸识别结果中的置信度大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的人脸识别结果确定为所述视频帧的人脸检测结果。
53.s305:在所述视频帧的人脸识别结果中的置信度不大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果。
54.在本发明提供的一实施例中,基于上述的实施过程,可选的,在确定出视频帧的人脸检测结果之后,还包括:
根据各个所述人脸检测结果所属的视频帧的视频时间确定出所述目标人脸在所述待检测视频中出现的时间信息;向预设的前端输出所述目标人脸在所述待检测视频中出现的时间信息。
55.本发明实施例提供的人脸检测方法可以应用在多种领域之中,例如,可以用于视频平台中的视频明星识别,能够方便用户得知视频中出现的明星。
56.人脸识别算法存在一定的误检和漏检,尤其是侧脸、遮挡等条件下,人脸识别精度大打折扣,加入目标追踪算法可以很大程度上补充人脸识别漏检的情况。目标追踪算法本身不具有识别功能,只是对前后帧的相似区域做特征匹配,具有一定的盲目性,随着时间序列的增加容易出现误检,人脸识别算法可以根据视频内容适时地为追踪算法更新追踪目标,从而降低追踪的误检。人脸识别为追踪提供目标,追踪为识别提供补充,二者的有机结合可以有效识别出电视剧、电影等各种场景下的明星身份,快速准确地满足用户的查询需求。下面以视频中的明星人脸的检测为例进行说明:步骤一,制作目标人脸库。
57.可选的,收集平台明星信息,对明星库中的图片使用scrfd算法进行人脸检测,使用arcface算法对检测到的人脸提取特征,特征入库。
58.步骤二,视频下载与镜头分割。
59.在本实施例中,可以下载待检测视频,根据前后帧画面变动幅度大小将视频分为若干镜头,记录各个镜头的起止帧。
60.其中,画面变化幅度指的是前后帧画面全部像素的差值,然后将画面变动幅度大小与阈值进行比较,从而切分视频。
61.步骤三,明星识别与追踪。
62.在本实施例中,可以从镜头起始帧开始逐帧检测人脸并和明星人脸库比对,把识别成功的明星信息添加到追踪集,使用明星人脸框位置信息初始化追踪器,采用siamrpn算法进行正向人脸追踪,记录追踪结果;当识别到新的明星时,将新的明星信息添加到追踪集,开始反向人脸追踪;反向追踪结束后,使用更新后的追踪集继续正向追踪。追踪算法得分小于一定的追踪得分阈值时会自动停止对该目标的追踪,若得分一直高于追踪得分阈值,则分别以镜头的起始帧和结束帧作为反向追踪和正向追踪的停止条件。切换镜头时,清空追踪集,重复以上过程。
63.具体的,追踪器首先需要一个初始感兴趣区域,然后对该区域提取特征做追踪,初始化追踪器指的就是把人脸识别算法检测到的人脸框位置信息赋给追踪器的感兴趣区域,追踪结果包括追踪到的人脸框位置以及该位置的追踪得分,追踪算法得分是由追踪算法直接输出的,含义是该追踪框的置信度。
64.可以看出,对于每一个镜头都是相互独立的检测追踪过程,且每个明星的追踪器是相互独立的,追踪结果互不干扰。明星人脸特征比对算法采用的是欧氏距离算法,当同时满足以下条件时,认为明星识别成功:(1)检出人脸特征与明星库中该明星特征的目标欧氏距离小于欧氏距离阈值;(2)检出人脸特征与其他待检测明星特征的欧氏距离均大于该目标欧氏距离。
65.人脸识别算法对正脸的识别能力强,追踪算法可以对检测到的正脸进行前后追踪,从而把正脸以外情况下的人脸结果囊括进来。检测结果和追踪结果的整合策略,可以有
效应对画面中各种复杂情况,如人物交错、遮挡等。
66.步骤四,结果整合。
67.在本实施例中,当前帧只有人脸识别结果时就以人脸识别结果做作为最终的人脸检测结果,当前帧只有追踪结果时就以追踪结果作为最终的人脸检测结果。人脸识别结果和追踪结果同时存在时,判断人脸识别结果和追踪结果中的人脸框区域关系,当交并比iou小于阈值时,取人脸识别算法和追踪算法得分高的作为最终的人脸检测结果;当交并比iou大于阈值时,以人脸识别结果为最终的人脸检测结果结果。由于追踪算法具有盲目性和渐变性,当人脸框出现交错时,追踪结果往往是不准的。最终将各帧明星信息转换为各明星出现的时间段数据,输出给前端。
68.具体的,对于追踪到的若干人脸框,计算两两之间的交并比(iou),iou较小时,说明追踪框之间重合程度小,追踪结果是准确的,此时取检测结果和追踪结果得分高的为最终结果;当iou较大时,说明追踪框之间存在重合程度较大的情况,此时追踪结果往往是不准确的。
69.人脸检测算法检测能力都有上限,实际应用场景中的诸如侧脸、遮挡情况下,人脸检测往往不能很好地发挥作用,本发明通过联合目标追踪算法,可以大幅突破这一界限,使人脸技术能够更好的应用在视频明星识别任务中。现有的多目标追踪算法,如sort、deepsort等,都使用了卡尔曼滤波和匈牙利算法,算法计算量大。本发明采用集成多个单目标追踪器的方式实现对多目标的追踪,可以根据视频内容自动调整追踪器个数,保证追踪效果的同时有效减少不必要的计算量。
70.与图1所述的方法相对应,本发明实施例还提供了一种人脸检测装置,用于对图1中方法的具体实现,本发明实施例提供的人脸检测装置可以应用于电子设备中,其结构示意图如图4所示,具体包括:获取单元401,用于获取待检测视频;划分单元402,用于将所述待检测视频划分为多个视频片段;执行单元403,用于对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,直至满足预设的追踪条件,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧;确定单元404,用于对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。
71.在本发明提供的一实施例中,基于上述的方案,可选的,所述人脸检测装置,还包括:第一处理单元;所述第一处理单元,用于在所述视频帧的人脸识别结果表征所述视频帧存在新的目标人脸的情况下,根据所述人脸识别结果中的所述新的目标人脸的位置信息初始化所述
新的目标人脸的追踪器,并利用所述追踪器对所述新的目标人脸进行反向追踪和/或正向追踪,直至满足所述追踪条件,得到所述新的目标人脸在各个新的目标视频帧的追踪结果;所述新的目标视频帧为所述视频片段中已追踪到所述新的目标人脸的视频帧,所述反向追踪指的是按视频时间由后至先的顺序对所述视频段中所述视频帧之前的各个待追踪视频帧进行追踪,所述正向追踪指的是按视频时间由先至后的顺序对所述视频段中所述视频帧之后的各个待追踪视频帧进行追踪。
72.在本发明提供的一实施例中,基于上述的方案,可选的,所述人脸检测装置,还包括:第二处理单元,所述第二处理单元,用于对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧不存在目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,将所述追踪结果确定为所述视频帧的人脸检测结果。
73.在本发明提供的一实施例中,基于上述的方案,可选的,所述人脸检测装置,还包括:第三处理单元,所述第三处理单元,用于对于每个执行检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在目标人脸,且所述视频帧不存在所述目标人脸的追踪结果的情况下,将所述人脸识别结果确定为所述视频帧的人脸检测结果。
74.在本发明提供的一实施例中,基于上述的方案,可选的,所述划分单元403,包括:第一确定子单元,用于确定出所述待检测视频中相邻的视频帧之间的画面变动幅度;划分子单元,用于根据所述待检测视频中相邻的视频帧之间的画面变动幅度,对所述待检测视频进行划分,得到多个视频片段;其中,对于相邻的两个视频片段中的第一视频片段和第二视频片段,所述第一视频片段的结束帧与所述第二视频片段的起始帧之间的画面变动幅度大于预设的变动幅度阈值,所述第一视频片段为所述第二视频片段的前一视频片段。
75.在本发明提供的一实施例中,基于上述的方案,可选的,所述确定单元404,包括:第二确定子单元,用于确定所述视频帧的人脸识别结果中的所述目标人脸的人脸识别框与所述视频帧的追踪结果中的所述目标人脸的人脸追踪框之间的交并比;第三确定子单元,用于在所述交并比大于预设的交并比阈值的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果;对比子单元,用于在所述交并比小于或等于所述交并比阈值的情况下,将所述视频帧的人脸识别结果中的置信度与所述视频帧的追踪结果中的置信度进行对比;第四确定子单元,用于在所述视频帧的人脸识别结果中的置信度大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的人脸识别结果确定为所述视频帧的人脸检测结果;第五确定子单元,用于在所述视频帧的人脸识别结果中的置信度不大于所述视频帧的追踪结果中的置信度的情况下,将所述视频帧的追踪结果确定为所述视频帧的人脸检测结果。
76.在本发明提供的一实施例中,基于上述的方案,可选的,所述人脸检测装置,还包
括:第四处理单元,用于根据各个所述人脸检测结果所属的视频帧的视频时间确定出所述目标人脸在所述待检测视频中出现的时间信息;输出单元,用于向预设的前端输出所述目标人脸在所述待检测视频中出现的时间信息。
77.上述本发明实施例公开的人脸检测装置中的各个单元和模块具体的原理和执行过程,与上述本发明实施例公开的人脸检测方法相同,可参见上述本发明实施例提供的人脸检测方法中相应的部分,这里不再进行赘述。
78.本发明实施例还提供了一种存储介质,所述存储介质包括存储的指令,其中,在所述指令运行时控制所述存储介质所在的设备执行上述人脸检测方法。
79.本发明实施例还提供了一种电子设备,其结构示意图如图5所示,具体包括存储器501,以及一个或者一个以上的指令502,其中一个或者一个以上指令502存储于存储器501中,且经配置以由一个或者一个以上处理器503执行所述一个或者一个以上指令502进行以下操作:获取待检测视频;将所述待检测视频划分为多个视频片段;对每个所述视频片段执行检测操作;所述检测操作包括:按视频时间由先到后的顺序对所述视频片段的每一视频帧进行人脸识别,并在所述视频帧的人脸识别结果表征所述视频帧中存在的目标人脸,且当前不存在所述目标人脸的追踪结果的情况下,根据所述人脸识别结果中的所述目标人脸的位置信息初始化所述目标人脸的追踪器,并利用所述追踪器对所述目标人脸进行追踪,直至满足预设的追踪条件,得到所述目标人脸在各个目标视频帧的追踪结果;所述目标视频帧为所述视频片段中已追踪到所述目标人脸的视频帧;对于每个执行所述检测操作后的所述视频片段中的每一视频帧,在所述视频帧的人脸识别结果表征所述视频帧存在所述目标人脸,且所述视频帧存在所述目标人脸的追踪结果的情况下,根据所述视频帧的人脸识别结果以及追踪结果确定所述视频帧的人脸检测结果。
80.需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
81.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
82.为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本发明时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
83.通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。
84.以上对本发明所提供的一种人脸检测方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1