图像处理方法和设备与流程

文档序号:21083830发布日期:2020-06-12 16:45阅读:167来源:国知局
图像处理方法和设备与流程

本申请基于并要求于2018年12月4日提交到韩国知识产权局的第10-2018-0154351号韩国专利申请的优先权,所述韩国专利申请的公开通过整体引用包含于此。

与示例实施例一致的方法和设备涉及一种图像处理方法和设备。



背景技术:

基于相机的眼睛跟踪技术(例如,基于视点跟踪的自动立体或无眼镜三维(3d)超多视图(super-multiview,smv)显示等)用于各种领域。眼睛跟踪技术的性能的水平基于所使用的相机捕获的图像质量来确定。眼睛跟踪技术在一些条件下(例如,在具有背光或强烈阳光的环境下、在黑暗或低照明环境下,以及在剧烈变化的照明环境下(例如,当车辆在实际驾驶期间通过隧道时))可表现出恶化的操作稳定性。因此,需要一种可在增强现实(ar)3d平视显示器(hud)的实际使用期间(例如,在车辆驾驶期间),在各种照明条件下稳定地操作的眼睛跟踪方法。因为当用户佩戴眼镜时,用户的眼睛可受到由红外(ir)光源和强烈阳光引起的眼镜的镜片的反射的影响,因此,眼睛跟踪方法的稳定性和准确度可被降低。



技术实现要素:

一个或多个示例实施例可至少解决以上问题和/或缺点以及以上没有描述的其他缺点。此外,示例实施例不需要克服上述缺点,并且示例实施例可不克服上述的任何问题。

根据公开的一个方面,提供一种图像处理方法,包括:接收图像帧;检测图像帧中的用户的脸部区域;将多个预设特征点对准在包括在脸部区域中的多个特征部位;基于与所述多个特征部位的组合对应的第一区域,对对准的结果执行第一检查;基于与所述多个特征部位的单个特征部位对应的第二区域,对对准的结果执行第二检查;基于确定第一检查和第二检查中的至少一个的失败,重新检测脸部区域;以及基于确定第一检查和第二检查二者的成功,输出关于脸部区域的信息。

检测脸部区域的步骤可包括:当图像帧是初始图像帧时,检测包括在图像帧中的用户的脸部区域;以及当图像帧不是初始图像帧时,接收基于图像帧的多个先前图像帧之一检测的脸部区域。

对准的步骤可包括:将所述多个预设特征点对准在包括在脸部区域和脸部区域的周围区域中的所述多个特征部位。

对准的步骤可包括:基于脸部区域的图像信息移动所述多个预设特征点。

当图像帧是初始图像帧时,在被对准之前的所述多个预设特征点可对应于多个用户的特征部位的平均位置。

当图像帧不是初始图像帧时,在被对准之前的所述多个预设特征点可对应于基于先前图像帧对准的点。

所述多个特征部位的组合可包括用户的眼睛和鼻子,并且单个特征部位包括用户的眼睛。

执行第一检查的步骤可包括:基于第一区域的图像信息确定第一区域是否包括所述多个特征部位的组合。

执行第一检查的步骤可包括:基于第一区域的图像信息确定第一区域是否对应于与所述多个特征部位的组合对应的类别。

执行第二检查的步骤可包括:基于第二区域的图像信息确定第二区域是否对应于单个特征部位。

执行第二检查的步骤可包括:基于第二区域的图像信息确定第二区域是否对应于与单个特征部位对应的类别。

输出关于脸部区域的信息的步骤可包括:输出关于以下项中的至少一个的信息:包括在脸部区域中的瞳孔的位置、基于瞳孔的位置的视点和脸部区域中的面部表情。

所述图像处理方法还可包括:对重新检测的脸部区域重复地执行对准、第一检查和第二检查。

图像帧包括彩色图像帧和红外(ir)图像帧中的至少一个。

一种非暂时性计算机可读存储介质可存储指令,其中,所述指令能够由用于执行如上所述的图像处理方法的处理器来执行。

根据公开的另一方面,提供一种图像处理设备,包括:处理器,被配置为:检测图像帧中的用户的脸部区域,将多个预设特征点对准在包括在脸部区域中的多个特征部位,基于与所述多个特征部位的组合对应的第一区域,对对准的结果执行第一检查,基于与所述多个特征部位的单个特征部位对应的第二区域,对对准的结果执行第二检查,并且基于确定第一检查和第二检查中的至少一个的失败重新检测脸部区域;以及通信接口,被配置为:接收图像帧,并基于确定第一检查和第二检查二者的成功输出关于脸部区域的信息。

处理器还可被配置为:当图像帧是初始图像帧时,检测包括在图像帧中的用户的脸部区域;以及当图像帧不是初始图像帧时,接收基于图像帧的多个先前图像帧之一检测的脸部区域。

处理器还可被配置为:将所述多个预设特征点对准在包括在脸部区域和脸部区域的周围区域中的所述多个特征部位。

处理器还可被配置为:基于脸部区域的图像信息移动所述多个预设特征点。

当图像帧是初始图像帧时,在被对准之前的所述多个预设特征点对应于多个用户的特征部位的平均位置。

当图像帧不是初始图像帧时,在被对准之前的所述多个预设特征点对应于基于先前图像帧对准的点。

所述多个特征部位的组合可包括用户的眼睛和鼻子,并且单个特征部位包括用户的眼睛。

处理器还可被配置为:基于第一区域的图像信息确定第一区域是否包括所述多个特征部位的组合。

处理器还可被配置为:基于第一区域的图像信息确定第一区域是否对应于与所述多个特征部位的组合对应的类别。

处理器还可被配置为:基于第二区域的图像信息确定第二区域是否对应于单个特征部位。

处理器还可被配置为:基于第二区域的图像信息确定第二区域是否对应于与单个特征部位对应的类别。

通信接口还可被配置为:输出关于以下项中的至少一个的信息:包括在脸部区域中的瞳孔的位置、基于瞳孔的位置的视点和脸部区域中的面部表情。

处理器还可被配置为:对重新检测的脸部区域重复地执行对准、第一检查和第二检查。

图像帧可包括彩色图像帧和红外(ir)图像帧中的至少一个。

根据公开的另一方面,提供一种图像处理设备,包括:存储器,被配置为存储一个或多个指令;以及处理器,被配置为执行所述一个或多个指令以:检测图像帧中用户的脸部区域,确定第一区域中的多个特征部位的组合是否满足第一标准,确定所述多个特征部位中的一个或多个是否单独地满足第二标准,基于确定第一区域中的所述多个特征部位的组合不满足第一标准或者所述多个特征部位中的一个或多个不单独地满足第二标准,重新检测脸部区域;以及基于确定第一区域中的所述多个特征部位的组合满足第一标准并且所述多个特征部位中的一个或多个单独地满足第二标准,输出关于脸部区域的信息。

第一标准可对应于脸部的特征。

第二标准可对应于眼睛的特征。

根据公开的另一方面,提供一种图像处理方法,包括:检测图像帧中用户的脸部区域;确定第一区域中的多个特征部位的组合是否满足第一标准;确定所述多个特征部位中的一个或多个是否单独地满足第二标准;基于确定第一区域中的所述多个特征部位的组合不满足第一标准或者所述多个特征部位中的一个或多个不单独地满足第二标准,重新检测脸部区域;以及基于确定第一区域中的所述多个特征部位的组合满足第一标准并且所述多个特征部位中的一个或多个单独地满足第二标准,输出关于脸部区域的信息。

第一标准可对应于脸部的特征。

第二标准可对应于眼睛的特征。

附图说明

通过结合附图描述特定示例实施例,以上和/或其他方面将更清楚,其中:

图1是示出错误的眼睛跟踪的示例的示图;

图2是示出根据示例实施例的图像处理方法的流程图;

图3是示出根据另一示例实施例的图像处理方法的流程图;

图4是示出根据示例实施例的如何输出关于脸部区域的信息的示例的示图;

图5a和图5b是示出根据示例实施例的由第一检查器和第二检查器获得的结果的示例的示图;

图6是示出根据示例实施例的图像处理方法的示例的示图;

图7是示出根据示例实施例的图像处理设备的示图。

具体实施方式

现在将详细参照示例实施例,示例实施例的示例在附图中示出,其中,相同的参考标号始终表示相同的元件。

以下结构或功能性的描述是示例性的以仅描述示例实施例,并且示例实施例的范围不限于公开中提供的描述。本领域普通技术人员可对其进行各种改变和修改。

尽管使用“第一”或“第二”的术语来解释各种组件,但是组件不受限于这些术语。这些术语应该仅用于将一个组件与另一组件区分开来。例如,根据公开的示例实施例,在权利的范围内,“第一”组件可被称为“第二”组件,或者类似地,“第二”组件可被称为“第一”组件。

将理解,当组件被称为“连接到”另一组件时,该组件可直接连接或结合到另一组件,或者可存在中间组件。

如在此所使用的,除非上下文另外明确地指示,否则单数形式也意在包括复数形式。还应理解,当在本说明书中使用术语“包括”和/或“包含”时,表明存在叙述的特征、整体、步骤、操作、元件、组件或它们的组合,但不排除存在或添加一个或多个其他特征、整体、步骤、操作、元件、组件和/或它们的组。当诸如“……中的至少一个”的表述在一列元素之后时,修饰整列元素,而不是修饰列中的单个元素。例如,表述“a、b和c中的至少一个”应理解为:仅包括a、仅包括b、仅包括c、包括a和b二者、包括a和c二者、包括b和c二者、或者包括a、b和c全部。

除非在此另外定义,否则在此使用的所有术语(包括技术术语和科学术语)具有与本领域普通技术人员通常理解的含义相同的含义。除非在此另外定义,否则术语(诸如,在通用字典中定义的术语)将被解释为具有与相关领域的上下文含义相匹配的含义,并且将不被解释为理想化或过于形式化的意义。

将在下文中描述的示例实施例可适用于例如自动立体或无眼镜三维(3d)监视器、自动立体或无眼镜3d平板或智能电话、车辆3d平视显示器(hud)等,以使用红外(ir)相机跟踪用户的眼睛并输出被跟踪的眼睛的位置的坐标。例如,示例实施例可以以监视器的芯片中的软件算法、平板电脑或智能电话中的应用以及硬件眼睛跟踪设备的形式来配置。例如,示例实施例还可适用于自主驾驶车辆、智能车辆、智能电话、移动装置等。在下文中,将参照附图详细描述示例实施例,并且附图中相同的参考标号始终表示相同的元件。

图1是示出错误的眼睛跟踪的示例的示图。图1示出通过捕获用户的图像而获得的图像帧110、120和130,以及检测框125,其中,将从检测框125检测用户的眼睛区域和鼻子区域。

参照图1,在未能跟踪图像帧110中的用户的眼睛之后,眼睛跟踪器使用图像帧120中的检测框125来检测用户的眼睛区域和鼻子区域。例如,在如上所述使用检测框125来检测眼睛区域和鼻子区域时,当用户的脸部向右移动时,眼睛跟踪器可将与眼睛区域和鼻子区域对应的多个预设点对准在与向右移动的脸部对应的位置。然而,通过使用在与向右移动的脸部对应的位置对准的点来跟踪用户的眼睛,可对每个后续图像帧中的不正确位置连续地执行眼睛跟踪。也就是说,当眼睛跟踪器使用先前对准的点跟踪眼睛时,可在所有的后续图像帧中错误地执行眼睛跟踪。这是因为,尽管检测框125用于正确地检测用户的脸部区域,但是当用户的脸部再次移动如图像帧130中所示面对前方时,眼睛跟踪器可通过使用在与向右移动的脸部对应的位置对准的点连续地并错误地跟踪用户的眼睛。也就是说,普通型眼睛跟踪器可仅通过检查用户的脸部或执行脸部检查来跟踪用户的眼睛,因此,不会快速地响应跟踪中的潜在错误。

根据示例实施例,可通过每当多个点被对准以进行眼睛跟踪时检查正确的区域是否被跟踪并且当不正确的区域被跟踪时从图像帧再次检测脸部区域,来提高眼睛跟踪的准确度,同时解决如上所述连续地执行错误的眼睛跟踪的问题。

图2是示出根据示例实施例的图像处理方法的流程图。将在下文中描述的图像处理方法可由图像处理设备执行。参照图2,在操作210中,图像处理设备接收图像帧。例如,图像帧可以是彩色图像帧和ir图像帧。

在操作220中,图像处理设备获得包括在图像帧中的用户的脸部区域。例如,当在操作210中接收到的图像帧是由图像处理设备最初接收到的图像帧或初始图像帧时,图像处理设备可通过检测包括在初始图像帧中的用户的脸部区域来获得脸部区域。然而,当图像帧不是初始图像帧时,图像处理设备可接收基于图像帧的多个先前图像帧之一检测的脸部区域,从而获得脸部区域。

在操作230中,图像处理设备将多个预设点对准在包括在脸部区域中的多个特征部位。例如,多个预设点可以是指示主要脸部特征(例如,用户的眼睛和鼻子)的11个关键点。多个点(即,多个预设点)在所附图4、图5a、图5b和图6中被指示为点(●)或星号(*)。此外,多个特征部位可以是包括在图像帧的脸部区域中的一些部位或区域,并且除了眼睛和鼻子之外还包括例如嘴唇、眉毛、眼镜等。图像处理设备可将多个点对准在包括在脸部区域和脸部区域的周围区域中的多个特征部位。图像处理设备可基于脸部区域的图像信息移动多个点以对准在多个特征部位。

例如,图像处理设备可使用如下方法来从图像帧的脸部区域识别与用户的眼睛和鼻子对应的特征部位的位置:使用从初始形状学习的下降矢量将点与图像形状对准的监督下降法(sdm)、基于主成分分析(pca)对准点以分析形状和形状的主成分的基于主动形状模型(asm)的方法、基于主动外观模型(aam)的方法和基于约束的局部模型(clm)的方法。图像处理设备可将多个点移动到多个特征部位的识别的位置以将多个点对准在识别的部位。例如,当图像帧是初始图像帧时,在被对准之前的多个点可对应于多个用户的特征部位的平均位置。在这个示例中,在被对准之前的多个点中的每个可对应于多个用户的对应的特征部位的位置的坐标的平均值。然而,当图像帧不是初始图像帧时,在被对准之前的点可对应于基于先前图像帧对准的点。

在操作240中,图像处理设备基于与多个特征部位的组合对应的第一区域,对对准的结果执行第一检查。第一区域可包括例如眼睛、鼻子、嘴唇和眼镜等的区域。然而,第一区域不限于前述的示例。图像处理设备可基于第一区域的图像信息检查第一区域是否包括多个特征部位(例如,眼睛和鼻子)的组合。图像处理设备可基于第一区域的图像信息检查第一区域是否对应于与多个特征部位的组合对应的类别(class)。与特征部位的组合对应的类别可以是例如用户的脸部。图像处理设备可基于例如尺度不变特征变换(sift)特征,使用第一检查器检查第一区域是否对应于这样的脸部类别。例如,当与指示存储在训练图像数据库(db)中的每个脸部的眼睛和鼻子的关键点对应的11个点对准在训练图像帧的脸部区域时,第一检查器可以是使用从多个对准点中的每个提取的sift特征训练的分类器。第一检查器可基于图像帧的脸部区域的图像信息检查对准了多个点的脸部区域是否对应于实际脸部类别。第一检查器可以是例如支持向量机(svm)分类器。因为第一检查器被配置为首先检查脸部区域中的对准,所以第一检查器也可被称为脸部检查器。

可通过以下两个阶段获得sift特征。图像处理设备可从第一区域的图像数据的图像金字塔表示(imagepyramidrepresentation)的比例空间提取具有局部最大或局部最小图像亮度的候选特征点,并且对具有低对比范围(contrastrange)的特征点执行滤波并选择将用于图像匹配的特征点。图像处理设备可基于所选择的特征点的周围区域的梯度来获得定向分量,并且基于获得的定向分量重置感兴趣区域(roi),检测特征点的大小,并生成描述符。描述符可对应于sift特征。

在操作250中,图像处理设备基于与多个特征部位的单个特征部位对应的第二区域,对对准的结果执行第二检查。第二区域可包括例如眼睛、鼻子或眼镜的区域。然而,第二区域不限于前述的示例。图像处理设备可基于第二区域的图像信息检查第二区域是否对应于单个特征部位。图像处理设备可基于第二区域的图像信息检查第二区域是否对应于与单个特征部位对应的类别。例如,图像处理设备可基于第二区域的sift特征使用第二检查器检查第二区域是否对应于眼睛类别。例如,当与指示存储在训练图像db中的每只眼睛的关键点对应的三个点对准在训练图像帧的眼睛区域时,第二检查器可以是使用从多个对准点中的每个提取的sift特征训练的分类器。第二检查器可基于图像帧的眼睛区域的图像信息检查对准了多个点的眼睛区域是否对应于实际眼睛类别。第二检查器可以是例如svm分类器。因为第二检查器被配置为其次检查眼睛区域中的对准,所以第二检查器还可被称为眼睛检查器。

在操作260中,图像处理设备响应于第一检查和第二检查中的至少一个的失败而重新检测脸部区域。然后,图像处理设备可基于在操作260中重新检测的脸部区域重复地执行操作230、240和250。

在操作270中,图像处理设备响应于第一检查和第二检查的成功而输出关于脸部区域的信息。例如,图像处理设备可输出关于如下的信息:例如,包括在脸部区域中的瞳孔的位置、基于瞳孔的位置的视点、脸部区域中的面部表情等。图像处理设备可在操作270中明确地或隐含地输出关于脸部区域的信息。在此,关于脸部区域的信息的明确输出可包括:在显示器或屏幕上显示包括在脸部区域中的瞳孔的位置和/或脸部区域中的面部表情,和/或通过音频输出输出信息。关于脸部区域的信息的隐含输出可包括例如通过包括在脸部区域中的瞳孔的位置和基于瞳孔的位置的视点来调节将在hud上显示的图像,或者提供与脸部区域中的面部表情对应的服务。

图3是示出根据另一示例实施例的图像处理方法的流程图。将在下文中描述的图像处理方法可由图像处理设备执行。参照图3,在操作310中,图像处理设备从相机获得第n图像帧,其中,n可以是整数。图像帧可以是例如红色、绿色和蓝色(rgb)彩色图像帧或ir图像帧。

在操作320中,图像处理设备确定是否从先前的第n-1图像帧检测到眼睛和鼻子。在操作390中,响应于在操作320中做出的确定未检测到眼睛和鼻子,图像处理设备使用检测框来检测眼睛和鼻子。

在操作330中,响应于在操作320中做出的确定检测到眼睛和鼻子,图像处理设备将特征点对准在包括在检测框的周围区域中的多个特征部位(例如,眼睛和鼻子)。根据示例实施例,可存在构成特征点的11个点。11个点可包括例如每只眼睛的三个点、眼睛之间的一个点、鼻尖的一个点和嘴唇的三个点(或者鼻子的三个点)。

在操作340中,图像处理设备使用对准的特征点执行对与眼睛和鼻子的组合对应的脸部区域的对准的结果的第一检查。

在操作350中,图像处理设备确定是否在脸部区域中跟踪到眼睛和鼻子作为第一检查的结果。在操作390中,响应于在操作350做出的确定未跟踪到眼睛和鼻子,图像处理设备使用检测框来检测眼睛和鼻子。

通常,检测对象(例如,脸部区域)的速度可小于或等于20毫秒(ms),跟踪对象的速度可小于或等于3ms。因此,对象检测速度可明显慢于对象跟踪速度。根据示例实施例,可通过仅在对象跟踪失败时再次执行对象检测来提高图像处理速度,而一旦对象跟踪成功则不再执行对象检测。

在操作360中,响应于在操作350中做出的确定检测到眼睛和鼻子,图像处理设备使用对准的三个点执行对眼睛区域的对准的结果的第二检查。

在操作370中,图像处理设备确定是否检测到眼睛作为第二检查的结果。在操作390中,响应于在操作370中做出的确定未检测到眼睛,图像处理设备使用检测框检测眼睛和鼻子。

在操作380中,响应于在操作370中做出的确定检测到眼睛,图像处理设备输出眼睛的坐标或瞳孔的坐标。

图4是示出根据示例实施例的如何输出关于脸部区域的信息的示例的示图。参照图4,在操作410中,当图像处理设备从相机接收到图像帧时,图像处理设备使用用于检测包括眼睛和鼻子的区域的脸部区域的检测框405,从图像帧检测眼睛和鼻子。

在操作420中,图像处理设备在检测框405的周围区域内将多个点对准在眼睛和鼻子,其中,周围区域包括检测框405。

在操作430中,图像处理设备基于对准的点检查对准的结果。详细地讲,在操作433中,图像处理设备执行用于检查对准的点之中的与眼睛和鼻子对应的点是否对准在实际图像帧中的眼睛和鼻子的位置的第一检查。例如,图像处理设备可获得由脸部区域中的对准的点指示的形状。图像处理设备可执行用于使用与该形状对应的区域的周围区域的图像信息来确定多个点是否对准在脸部的第一检查。随后,在操作436中,图像处理设备执行用于检查对准的点之中的与眼睛对应的点是否对准在实际图像帧中的眼睛的位置的第二检查。

响应于在操作430中第一检查和第二检查中的任何一个的失败,图像处理设备在操作410中使用检测框405从后续的图像帧检测眼睛和鼻子。

响应于在操作430中第一检查和第二检查两者的成功,图像处理设备在操作440中从对准的点提取瞳孔的位置。

图5a和图5b是示出根据示例实施例的由第一检查器和第二检查器获得的结果的示例的示图。图5a示出将预设的11个点对准在包括在图像帧的脸部区域中的多个特征部位(例如,眼睛和鼻子)的结果。

如上所述,第一检查器或脸部检查器检查11个点是如图像510中所示对准在图像帧中的眼睛和鼻子,还是如图像520中所示尽管11个点对准在图像帧的脸部区域,但是未正确地对准在图像帧中的眼睛和鼻子。

图5b示出将预设的11个点之中的与眼睛对应的三个点对准在包括在图像帧中的单个特征部位(例如,眼睛)的结果。

如上所述,第二检查器或眼睛检查器确定三个点是如图像530中所示对准在图像帧的脸部区域中的眼睛,还是如图像540中所示尽管三个点被放置在图像帧中的眼睛区域,但是三个点未正确地对准在图像帧的脸部区域中的眼睛。

根据示例实施例,通过使用脸部检查器和眼睛检查器的这样的两步跟踪检查,可通过使用对准在图像帧的多个点提高脸部检测的准确度和眼睛对准的准确度,来提高整体眼睛跟踪的稳定性和准确度。

根据一个实施例,第一检查可包括确定第一区域中的多个特征部位的组合是否满足第一标准,第二检查可包括确定多个特征部位中的一个或多个是否单独满足第二标准。此外,基于确定第一区域中的多个特征部位的组合不满足第一标准,脸部可被重新检测。否则,基于确定第一区域中的多个特征部位的组合满足第一标准并且多个特征部位中的一个或多个单独满足第二标准,关于脸部区域的信息可被输出。

根据一个实施例,第一标准可以是多个特征点(即,11个点)是否对准在图像帧中的眼睛和鼻子。根据一个实施例,第二标准可以是多个特征点之中的一个或多个点(即,3个点)是否正确地对准在图像帧的脸部区域中的眼睛。根据一个实施例,第一标准可对应于脸部的特征,第二标准可对应于眼睛的特征。

图6是示出根据示例实施例的图像处理方法的示例的示图。参照图6,在操作610中,图像处理设备使用检测框从相机的每个图像帧检测包括眼睛和鼻子的用户的脸部区域。然后,除非对准和/或跟踪失败,否则图像处理设备执行跟踪而不执行另外的检测。

在操作630中,图像处理设备将多个预设点对准在包括在脸部区域中的眼睛和鼻子。响应于在操作640中确定操作630中的对准失败,图像处理设备在操作610中从新的图像帧检测包括眼睛和鼻子的用户的脸部区域。响应于操作630中的对准的成功,图像处理设备在操作650中执行两步跟踪检查。两步跟踪检查被如下地执行。

当在操作651中输入对准了11个点的脸部区域时,图像处理设备在操作652中提取对准的多个点的sift特征。

在操作653中,图像处理设备使用利用图像db中的成千上万个图像训练的svm分类器,基于在操作652中提取的sift特征来检查脸部对准和眼睛对准的结果。

在操作653中,图像处理设备使用上述脸部检查器对脸部执行第一跟踪检查。脸部检查器被配置为使用图像帧的脸部区域的图像信息来检查对准了多个点的脸部区域是否对应于实际脸部。

在操作653中,图像处理设备使用上述眼睛检查器对眼睛执行第二跟踪检查。眼睛检查器被配置为使用图像帧的眼睛区域的图像信息来检查对准了多个点的眼睛区域是否对应于实际眼睛。

如图6中的670所示,通过在操作653中执行的两步跟踪检查,图像处理设备可通过去除错位对准异常值来校正早期跟踪中的潜在错误。在操作654中,响应于两步跟踪检查中的至少一个的失败,图像处理设备在操作656中重新检测脸部区域。在操作655中,响应于两步跟踪检查的成功,图像处理设备保持对准。

图7是示出根示例实施例的图像处理设备的示图。参照图7,图像处理设备700包括传感器710、处理器730、存储器750、通信接口770和显示器790。传感器710、处理器730、存储器750、通信接口770和显示器790可通过通信总线705彼此通信。根据另一示例实施例,图像处理设备可不包括显示器790。然而,图像处理设备可被配置为与显示器通信。

传感器710可感测图像帧。传感器710可以是例如通过ir照射捕获输入图像的图像传感器、视觉传感器或ir相机。图像帧可以是例如用户的脸部的图像或车辆行驶的图像。

处理器730可获得包括在图像帧中的用户的脸部区域。处理器730可将多个预设点对准在包括在脸部区域中的多个特征部位。处理器730可基于与多个特征部位的组合对应的第一区域,对对准的结果执行第一检查。处理器730可基于与多个特征部位之中的单个特征部位对应的第二区域,对对准的结果执行第二检查。响应于第一检查和第二检查中的至少一个的失败,处理器730可重新检测脸部区域。

处理器730可执行上面参照图1至图6所述的至少一种方法,或与所述方法对应的算法。处理器730可执行程序并控制图像处理设备700。将由处理器730执行的程序的程序代码可被存储在存储器750中。处理器730可通过例如中央处理器(cpu)和图形处理器(gpu)来配置。

存储器750可存储图像帧、由处理器730获得的用户的脸部区域、关于脸部区域的信息等。存储器750可以是易失性存储器或非易失性存储器。

通信接口770可接收图像帧。响应于第一检查和第二检查的成功,通信接口770可输出关于脸部区域的信息。根据示例实施例,通信接口770可接收由图像处理设备700的外部源捕获的图像帧,或者从图像处理设备700的外部接收到的来自各种传感器的信息。

显示器790可显示处理器730的处理结果。例如,在图像处理设备700被嵌入在车辆中的情况下,显示器790可通过安装在车辆中的hud来配置。

在此描述的单元可使用硬件组件和软件组件来实现。例如,硬件组件可包括麦克风、放大器、带通滤波器、模数转换器、非暂时性计算机存储器和处理装置。处理装置可使用一个或多个通用计算机或专用计算机(诸如,例如,处理器、控制器和算术逻辑单元(alu)、数字信号处理器、微型计算机、现场可编程门阵列(fpga)、可编程逻辑单元(plu)、微处理器或者能够以限定的方式响应和执行指令的任何其他装置)来实现。处理装置可运行操作系统(os)以及在os上运行的一个或多个软件应用。响应于软件的执行,处理装置还可访问、存储、操作、处理和创建数据。为了简明的目的,处理装置的描述被用作单数,然而,本领域的技术人员将理解,处理装置可包括多个处理元件以及多种类型的处理元件。例如,处理装置可包括多个处理器或者处理器和控制器。此外,不同的处理配置是可行的,诸如并行处理器。

软件可包括计算机程序、代码段、指令或它们的一些组合,以独立地或共同地指导或配置处理装置按照期望的那样进行操作。软件和数据可被永久或临时地实现在任何类型的机器、组件、物理装备或虚拟装备、计算机存储介质或装置中,或者以能够将指令或数据提供到处理装置或者能够由处理装置解释的传播信号波来实现。软件还可分布在联网的计算机系统上,以使软件以分布式的方式被存储和执行。软件和数据可由一个或多个非暂时性计算机可读记录介质来存储。非暂时性计算机可读记录介质可包括可存储其后可由计算机系统或处理装置读取的数据的任何数据存储装置。

示例实施例包括包含用于实现可由计算机实现的各种操作的程序指令的非暂时性计算机可读介质。介质还可单独地包括程序指令、数据文件、数据结构、表格等,或与程序指令相结合地包括数据文件、数据结构、表格等。介质和程序指令可以是为了示例实施例的目的而专门设计和构造的程序指令,或者它们可以是公知的种类并且是计算机软件领域的技术人员可用的程序指令。非暂时性计算机可读介质的示例包括:磁介质(诸如,硬盘、软盘和磁带)、光学介质(诸如,cdrom盘)、磁光介质(诸如,光盘)、以及被专门配置为存储和执行程序指令的硬件装置(诸如,只读存储器(rom)和随机存取存储器(ram))。程序指令的示例包括机器代码(诸如,由编译器产生的代码)以及包含可由计算机使用解释器执行的高级代码的文件二者。描述的装置可被配置为用作一个或多个软件模块以便执行上述示例实施例的,反之亦然。

在此描述的示例仅在描述性意义上被考虑,而不是为了限制的目的。每个示例中的特征或方面的描述将被认为适用于其他示例中的类似特征或方面。如果描述的技术以不同的顺序被执行,和/或如果描述的系统、架构、装置或电路中的组件以不同的方式被组合和/或由其他组件或它们的等同物替换或补充,则可实现合适的结果。

虽然本公开包括特定示例,但是对于本领域普通技术人员来说将清楚的是,在不脱离权利要求及其等同物的精神和范围的情况下,可对这些示例进行形式和细节上的各种改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1