人脸跟踪方法和人脸跟踪装置与流程

文档序号:15518681发布日期:2018-09-25 18:54阅读:150来源:国知局

本发明涉及人机交互领域,具体涉及一种人脸跟踪方法和人脸跟踪装置。



背景技术:

近年来,随着计算机科学在人机交互领域的快速发展,作为人脸信息处理中的一项关键技术,人脸跟踪技术在模式识别与计算机视觉领域受到普遍重视。人脸跟踪技术利用人脸在视频帧中所具有的特征,来实现人脸在不同视频帧中的定位,进而实现人脸跟踪。目前的人脸跟踪方法依靠生理特征(例如,肤色、人脸轮廓等)进行跟踪,但目前的人脸跟踪方法无法适应环境变化,从而在当环境因素发生变化时,跟踪结果的准确度降低。例如,在利用肤色进行人脸跟踪时,将灰度高于阈值的区域作为人脸区域。而当环境因素发生变化时,图像中的像素灰度发生改变,那么,按照环境变化前的跟踪方法所获得的结果会发生偏差。



技术实现要素:

本发明旨在至少解决现有技术中存在的技术问题之一,提出了一种自适应环境的人脸跟踪方法和人脸跟踪装置,以在环境变化时仍然能够准确地进行人脸跟踪。

为了解决上述技术问题之一,本发明提供一种人脸跟踪方法,包括至少一个跟踪周期,每个跟踪周期包括依次对多帧待跟踪画面中的每帧待跟踪画面进行的人脸跟踪步骤,每个跟踪周期中的多帧待跟踪画面为包括同一人脸的多帧画面,该人脸跟踪步骤包括:

获取当前帧待跟踪画面中的初始人脸图像;

根据颜色参数当前的标准范围以及所述初始人脸图像中各像素的颜色参数的实际值,对所述初始人脸图像进行二值化,以得到二值化人脸图像;

获取所述二值化人脸图像中的预设器官的位置;

根据获得的预设器官的位置和初始人脸图像的位置获取最终人脸图像的位置;

且在每个跟踪周期中,除最后一帧外的每帧待跟踪画面的人脸追踪步骤在获得最终人脸图像的位置之后,还包括:

根据当前帧待跟踪画面中的初始人脸图像各像素的颜色参数的实际值,对颜色参数当前的标准范围进行更新。

优选地,所述预设器官的位置为:满足预设器官特征的区域的位置。

优选地,所述颜色参数包括色相、饱和度和明度;

根据当前帧待跟踪画面中的初始人脸图像各像素的颜色参数的实际值,对颜色参数当前的标准范围进行更新,包括:将当前帧待跟踪画面中的初始人脸图像作为待处理的图像,并利用预设的标准范围计算方法对当前帧待跟踪画面中的初始人脸图像进行图像处理,以获得色相的标准范围、饱和度的标准范围和明度的标准范围;其中,所述预设的标准范围计算方法包括:

预先设置多组参考范围,每组参考范围均包括色相的参考范围、饱和度的参考范围和明度的参考范围,其中,不同组中的明度的参考范围互不相同;

对于每一组参考范围,均根据该组参考范围对待处理的图像进行二值化;其中,对待处理的图像进行二值化时,若像素的色相、饱和度和明度的实际值同时位于相对应的参考范围内,则将所述像素的灰度设置为255,否则,将所述像素的灰度设置为0;

对于每个二值化后的图像,判断该图像中是否存在满足所述预设器官特征的区域,若存在,则记录当前的一组参考范围;

在记录的多组参考范围中,分别对色相的多个参考范围、饱和度的多个参考范围和明度的多个参考范围进行平均,以获得与待处理图像对应的色相的标准范围、饱和度的标准范围和明度的标准范围。

优选地,在每组参考范围中,色相的参考范围均为0~180,饱和度的参考范围均为20~255,明度的参考范围均为v~255;其中,v为大于等于零且小于255的整数,并且,不同组的参考范围中,v的取值互不相同。

优选地,从第1组参考范围到最后一组参考范围,v的取值以预定步长递增。

优选地,预定步长为10。

优选地,所述预设器官包括嘴巴,所述满足预设器官特征的区域为:位置连续的多个灰度为0的像素点的矩形包围盒所在区域,且该矩形包围盒沿人脸宽度方向的尺寸大于该矩形包围盒沿人脸长度方向的尺寸的3倍。

优选地,每个跟踪周期还包括在第一帧待跟踪画面的人脸跟踪步骤之前进行的人脸检测步骤,该人脸检测步骤包括:

获取待检测画面中的初始人脸图像,所述待检测画面为所述待跟踪画面之前且与待跟踪画面包括同一人脸的画面;

将待检测画面中的初始人脸图像作为待处理的图像,并利用所述预设的标准范围计算方法对待检测画面中的初始人脸图像进行图像处理,以获得颜色参数初始的标准范围,该颜色参数初始的标准范围用于对第一帧待跟踪画面中的初始人脸图像进行二值化。

优选地,所述待检测画面为rgb图像;

获取待检测画面中的初始人脸图像,包括:

获取待检测画面中初始人脸区域的图像;

对获得的图像进行预处理,以去除图像中的噪声;

将预处理后的图像由rgb图像转换为hsv图像。

优选地,所述待检测画面中初始人脸区域的图像通过haar特征检测的方法获得。

优选地,所述待跟踪画面为rgb图像,

获取当前帧待跟踪画面中的初始人脸图像,包括:

获取当前帧待跟踪画面中初始人脸区域的图像;

对获取到的图像进行预处理,以去除图像中的噪声;

将预处理后的图像由rgb图像转换为hsv图像。

优选地,当前帧待跟踪画面中初始人脸区域的图像利用camshift算法获得。

相应地,本发明还提供一种人脸跟踪装置,包括计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时实现上述人脸跟踪方法的步骤。

优选地,所述人脸跟踪装置还包括图像采集结构,用于连续采集人脸画面。

在本发明中,每次跟踪到人脸后,都会根据当前的初始人脸图像的颜色参数的实际值对所述颜色参数的标准范围进行更新,而由于初始人脸图像的颜色参数的实际值与环境因素有关,因此,颜色参数更新后的标准范围是与环境因素相适应的,从而使得器官的位置与环境因素相适应;并且,由于最终人脸图像的位置是由预设器官的位置和初始人脸图像的位置确定的,因此,所述跟踪方法可以适应环境来进行人脸跟踪,从而在环境变化时,仍然能够保证跟踪结果的准确性。

附图说明

附图是用来提供对本发明的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本发明,但并不构成对本发明的限制。在附图中:

图1是本发明实施例中提供的人脸跟踪方法的流程示意图;

图2是本发明实施例中利用颜色参数的多个参考范围对待处理图像进行二值化后得到的多个图像示意图。

具体实施方式

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

作为本发明的一方面,提供一种人脸跟踪方法,包括至少一个跟踪周期,每个跟踪周期包括依次对多帧待跟踪画面中的对每帧待跟踪画面进行的人脸跟踪步骤,每个跟踪周期中的多帧待跟踪画面为视频流中包括同一人脸的多帧画面。所述人脸跟踪步骤包括:

获取当前帧待跟踪画面中的初始人脸图像。其中,初始人脸图像可以为包括人脸及其附近区域(如,脖子)的图像,该初始人脸图像可以利用现有技术中的跟踪方法进行获取,例如,meanshift方法、camshift方法等。

根据颜色参数当前的标准范围以及初始人脸图像中个像素的颜色参数的实际值,对初始人脸图像进行二值化。其中,二值化过程即,将初始人脸图像中的像素灰度设置为0或255,具体地,当某像素的颜色参数的实际值处于所述颜色参数的标准范围内时,则将该像素的灰度设置为255,否则,将该像素的灰度设置为0。这里的颜色参数可以为灰度,或者为rgb值,或者为hsv值(色相、饱和度、明度)。需要说明的是,当颜色参数包括多种类别的参数时,二值化过程中,当像素的每一类别的参数实际值均位于相应的标准范围内时,才将该像素的灰度设置为255,若任意一个参数的实际值不在相应的标准范围内,则将该像素的灰度设置为0。以颜色参数包括hsv值为例,当其中一个像素的实际h值位于h的标准范围内、且该像素的实际s值位于s的标准范围内、且该像素的实际v值位于v的标准范围内时,将该像素的灰度设置为255;若任意一个参数的实际值不在相应的标准范围内,则将该像素的灰度设置为0。当然,二值化过程也可以为:当某像素的颜色参数的实际值处于颜色参数的标准范围内时,将该像素的灰度设置为0,否则设置为255。

获取二值化后的人脸图像中的预设器官的位置。

根据获得的预设器官的位置和初始人脸图像的位置获取最终人脸图像的位置。其中,所述预设器官可以包括眼睛、鼻子、嘴巴、眉毛中的任意一者或任意多者。

并且在每个跟踪周期中,除最后一帧外的每帧待跟踪画面的人脸追踪步骤在获得最终人脸图像的位置之后,还包括:根据当前帧待跟踪画面中的初始人脸图像的各像素的颜色参数的实际值,对颜色参数当前的标准范围进行更新。

在本发明中,每次跟踪到人脸后,都会根据当前的初始人脸图像的颜色参数的实际值对所述颜色参数的标准范围进行更新,而由于初始人脸图像的颜色参数的实际值与环境因素有关,因此,颜色参数更新后的标准范围是与环境因素相适应的,从而使得器官的位置与环境因素相适应;并且,由于最终人脸图像的位置是由预设器官的位置和初始人脸图像的位置确定的,因此,所述跟踪方法可以适应环境来进行人脸跟踪,从而在环境变化时,仍然能够保证跟踪结果的准确性。

其中,上文所述的“预设器官的位置”为满足预设器官特征的区域的位置。

下面结合图1对本发明的人脸跟踪方法进行具体介绍。所述人脸跟踪方法的每个跟踪周期均包括依次对多帧待跟踪画面中的每帧待跟踪画面进行的人脸跟踪步骤;另外,每个跟踪周期还包括在第一帧待跟踪画面的人脸跟踪步骤之前进行的人脸检测步骤。

其中,所述人脸检测步骤包括:

s11、获取待检测画面中的初始人脸图像。其中,所述待检测画面为所述待跟踪画面之前且与待跟踪画面包括同一人脸的画面,待检测画面可以为视频流中常用的rgb图像,待检测画面中的初始人脸图像可以为hsv(色相-饱和度-明度空间)图像。此时,该步骤s11可以包括以下s111~s113:

s111、获取待检测画面中的初始人脸区域的图像(该图像为rgb图像),为了提高检测准确度,待检测画面中的初始人脸区域的图像具体可以通过opencv中的haar特征检测的方法获得。

s112、对步骤s111中获得的图像进行预处理,以去除图像中的噪声。该步骤中的预处理具体可以包括高斯滤波处理等。

s113、将预处理后的图像由rgb图像转换为hsv图像。相较于rgb颜色空间而言,hsv空间对光照亮度变化更不敏感,因此,在人脸检测步骤以及后续的人脸跟踪步骤中,先将图像由rgb图像转换为hsv图像可以减少光照亮度对跟踪效果的影响。

步骤s11之后还包括:s12、将待检测画面中的初始人脸图像作为待处理的图像,并利用预设的标准范围计算方法对待检测画面中的初始人脸图像进行图像处理,以获得与待检测画面中的初始人脸图像对应的颜色参数的标准范围,即,颜色参数初始的标准范围,该颜色参数初始的标准范围用于在后续的跟踪步骤中对第一帧待跟踪画面中的初始人脸图像进行二值化。

其中,所述颜色参数包括色相、饱和度和明度,颜色参数的标准范围则包括:色相的标准范围、饱和度的标准范围和明度的标准范围;所述预设的颜色参数计算方法包括:

s01、预先设置多组参考范围,每组参考范围均包括色相的参考范围、饱和度的参考范围和明度的参考范围。其中,不同组中的明度的参考范围互不相同。具体地,在每组参考范围中,色相的参考范围均为0~180,饱和度的参考范围均为20~255,明度的参考范围均为v~255,其中,v为大于等于零且小于255的整数,并且,不同组的参考范围中,v的取值互不相同。进一步具体地,第一个组参考范围中,v为0;从第2组至最后一组参考范围,v的取值以预定步长递增,所述预定步长具体为10。

s02、对于每一组参考范围,均根据该组参考范围对待处理的图像进行二值化,从而得到多个二值化图像。其中,对待处理的图像进行二值化时,若像素的色相的实际值位于色相的参考范围内、且饱和度的实际值位于饱和度的参考范围内、且明度的实际值位于明度的参考范围内,则将所述像素的灰度设置为255,否则,将所述像素的灰度设置为0。

s03、对于每个二值化后的图像,判断该图像中是否存在满足所述预设器官特征的区域,若存在,则记录当前的一组参考范围。在本发明中,所述预设器官包括嘴巴,所述满足预设器官特征的区域为:位置连续的多个灰度为0的像素点的矩形包围盒所在区域,且该矩形包围盒(即图2的(c)图像和(d)图像中的虚线框)沿人脸宽度方向的尺寸大于该矩形包围盒沿人脸长度方向的尺寸的3倍。

s04、在记录的多组参考范围中,分别对色相的多个参考范围、饱和度的多个参考范围和明度的多个参考范围进行平均,以获得与待处理图像对应的色相的标准范围、饱和度的标准范围和明度的标准范围。其中,对某一参数的多个参考范围进行平均,即,取每个参考范围的最小值,并将多个最小值的平均值作为该参数的标准范围的最小值;取每个参考范围的最大值,并将多个最大值的平均值作为该参数的标准范围的最大值。由于多组参考范围中,色相的参考范围相同,饱和度的参考范围也相同,因此,与待处理图像对应的标准范围中,色相的标准范围即为上述0~180,饱和度的标准范围即为上述20~255,明度的标准范围则为v’~255,其中,v’为所记录的多个参考范围中的多个v值的平均,也即,多组参考范围中的v的最大值与最小值的平均。

可以理解的是,步骤s01中,从第一组参考范围开始,v值逐渐增大,那么利用多组参考范围对待处理图像进行二值化时,出现的情况通常是:当v增大至某个值(记为va)时,二值化的图像中开始出现满足预设器官特征的区域;而当v继续增大至另一值(记为vb)时,二值化的图像中最后一次存在满足预设器官特征的区域。在实际应用中,可以将(va+vb)/2~255作为明度的标准范围。例如,如图2中所示,(a)~(e)五副图像分别为v取值为v1~v5时,所对应的二值化图像,当v分别取v3和v4时,对应的图(c)和图(d)中存在满足预设器官特征的区域,则色相的标准范围为0~180,饱和度的标准范围为20~255,明度的标准范围为(v3+v4)/2~255。

人脸检测步骤之后对每帧待跟踪画面进行人脸跟踪步骤,该人脸跟踪步骤包括以下步骤s21~s25:

s21、获取当前帧待跟踪画面中的初始人脸图像。其中,每一帧待跟踪画面均为rgb图像,该步骤s21具体包括以下s211~s213:

s211、获取当前帧待跟踪画面中初始人脸区域的图像。具体可以通过opencv中的camshift算法进行获取,以提高计算速度。其中,所述camshift算法利用上一帧画面中的初始人脸图像以及该初始人脸图像的hsv各通道的直方图获取当前帧画面的初始人脸图像,需要说明的是,若当前帧为第一帧待跟踪画面,则其上一帧画面为所述待检测画面。

s212、对获取到的初始人脸区域的图像进行预处理,以去除图像中的噪声,从而减少噪声干扰,以利于进行人脸跟踪。该步骤中的预处理可以采用高斯滤波等方法。

s213、将预处理后的图像由rgb图像转换为hsv图像。

s22、根据颜色参数当前的标准范围对初始人脸图像进行二值化。应当理解的是,若当前的待跟踪图像为第一帧待跟踪图像,则颜色参数当前的标准范围则为上述s12所得到的标准范围;若当前的待跟踪图像为第一帧之后的待跟踪图像,则颜色参数当前的标准范围为对上一帧待跟踪画面执行步骤s25后所更新得到的标准范围。

s23、获取二值化后的人脸图像中的预设器官的位置,即,获取二值化后的人脸图像中,满足预设器官特征的区域的位置。所述预设器官包括嘴巴,如上文所述,所述满足预设器官特征的区域为:位置连续的多个灰度为0的像素点的矩形包围盒所在区域,且该矩形包围盒沿人脸宽度方向的尺寸大于该矩形包围盒沿人脸长度方向的尺寸的3倍。

s24、根据获得的预设器官的位置和初始人脸图像的位置获取最终人脸图像的位置。如上文所述,待跟踪画面中的初始人脸图像可以包括人脸及脖子,此时,步骤s24具体可以为:计算嘴巴位置与初始人脸图像下边缘之间的距离a,将靠近初始人脸图像下边缘的部分区域去除,从而获得最终人脸图像;其中,去除的区域沿人脸长度方向的尺寸在0.2a~0.3a之间。

除最后一帧外的每帧待跟踪画面的人脸跟踪步骤在s24之后,还包括:s25、根据当前帧待跟踪画面中的初始人脸图像的各像素的颜色参数的实际值,对颜色参数当前的标准范围进行更新。该步骤s25具体包括:将当前帧待跟踪画面中的初始人脸图像作为待处理的图像,并利用上述预设的标准范围计算方法(步骤s01~s04)对当前帧待跟踪画面中的初始人脸图像进行图像处理,以获得颜色参数更新后的标准范围。更新后的标准范围用于对下一帧待跟踪画面的初始人脸图像进行二值化。

最后一帧待跟踪画面的人脸追踪步骤的人脸跟踪步骤可以不包括上述s25。

需要说明的是,本发明以预设器官为嘴巴进行了说明,当然,所述预设器官也可以为其他器官,此时,满足预设器官特征的区域可以根据相应的器官特征进行具体设置。例如,预设器官为双眼,此时,满足器官特征的区域为,两个间隔设置的矩形包围盒分别所在的区域,每个矩形包围盒均是位置连续的多个灰度为0的像素点的包围盒,且每个矩形包围盒沿人脸宽度方向的尺寸为该矩形包围盒沿人脸长度方向的1~3倍。

另外需要说明的是,每个跟踪周期中待检测画面和待跟踪画面的数量并没有特别限定,不同跟踪周期的待检测画面数量不一定相同,不同跟踪周期的待跟踪画面的数量也不一定相同。具体在实际应用中,可以将某一帧画面作为待检测画面,并进行人脸检测过程,当步骤s11对待检测画面中的初始人脸图像的获取失败时,将下一帧作为待检测画面继续检测,直至检测到待检测画面中的初始人脸图像后,将之后的多帧画面作为待跟踪画面,并对每一帧待跟踪画面进行人脸跟踪步骤,以获取每帧待跟踪画面中的最终人脸图像;当步骤s21对当前帧待跟踪画面中的初始人脸图像获取失败时,进入下一跟踪周期。

作为本发明的另一方面,提供一种人脸跟踪装置,包括计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,该计算机程序被处理器执行时实现本发明提供的上述人脸跟踪方法的步骤。所述人脸跟踪装置还包括图像采集结构,用于连续采集人脸画面。所述人脸跟踪装置可以为手机、摄像机等具有拍照和数据处理功能的产品。

以上为对本发明提供的人脸跟踪方法和装置的介绍,可以看出,本发明在进行人脸跟踪时,首先对待检测画面进行人脸检测,之后对待跟踪画面进行人脸跟踪。其中,通过人脸检测可以得到与环境信息相适应的颜色参数的标准范围,并且,在获得每一帧待跟踪画面中的最终人脸图像后,均对颜色参数当前的标准范围进行了更新,使其与环境信息相匹配,而由于颜色参数的标准范围决定了预设器官的位置,进而决定了最终人脸图像的位置,因此,本发明的人脸跟踪方法可以自适应环境地进行人脸跟踪。另外,在对待检测画面进行人脸检测时,利用haar特征检测的方法得到待检测画面中的初始人脸图像,可以提高检测的准确性,从而使得后续的人脸跟踪步骤的跟踪结果更加准确;而在人脸跟踪步骤中,待跟踪画面中的初始人脸图像是利用meanshift等图像处理方法获得的,不需要进行机器学习或深度学习,从而提高了跟踪速度。

可以理解的是,以上实施方式仅仅是为了说明本发明的原理而采用的示例性实施方式,然而本发明并不局限于此。对于本领域内的普通技术人员而言,在不脱离本发明的精神和实质的情况下,可以做出各种变型和改进,这些变型和改进也视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1