图像处理方法及装置、电子设备和存储介质与流程

文档序号:16671657发布日期:2019-01-18 23:37阅读:169来源:国知局
图像处理方法及装置、电子设备和存储介质与流程
本公开涉及计算机
技术领域
,尤其涉及一种图像处理方法及装置、电子设备和存储介质。
背景技术
:随着互联网技术的快速发展,计算机视觉技术已并被应用于各个领域,例如,可用于进行各类对象的分析任务(例如,进行人脸配准、人脸动作单元检测等对象分析等)。然而,相关技术中,对象分析任务结果的准确度还有待提高。技术实现要素:有鉴于此,本公开提出了一种图像处理技术方案。根据本公开的一方面,提供了一种图像处理方法,所述方法包括:获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;根据所述关键点特征,确定所述待处理图像中所述目标对象的关键点的定位结果;根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果。在一种可能的实现方式中,根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果,包括:根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征;根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果。这样,通过目标对象的特征信息以及所述定位结果,确定得到的动作单元的局部特征准确度高,从而使得根据所述局部特征以及所述关键点特征,确定得到的动作单元的目标检测结果具有较高准确度。在一种可能的实现方式中,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征,包括:对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息;对所述目标对象的特征信息进行关键点特征提取,得到所述目标对象的关键点特征。这样,能够较准确地得到目标对象的特征信息以及目标对象的关键点特征。在一种可能的实现方式中,根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征,包括:根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;对所述初始注意力特征图进行卷积处理,得到处理后的注意力特征图;根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征。这样,通过自适应注意力学习方式学习动作单元的注意力分布,并根据注意力分布结合特征信息,确定的动作单元的局部特征的准确度较高。在一种可能的实现方式中,根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征,包括:根据处理后的注意力特征图与所述目标对象的特征信息,得到注意力内容;对所述注意力内容进行特征提取处理,得到所述局部特征。这样,能够保证空间信息损失较少、模型参数简单,且提取的动作单元的局部特征更加准确,以提高运动单元的目标检测结果的检测精度。在一种可能的实现方式中,所述目标对象包括多个动作单元,其中,根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果,包括:对多个动作单元的局部特征进行融合处理,得到融合后的局部特征;根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果。这样,可以较好地保持提取到的空间特征,以提高目标检测结果的准确度。在一种可能的实现方式中,所述方法利用神经网络实现,其中,对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息,包括:将所述待处理图像输入所述神经网络的特征提取网络中进行特征提取,得到所述待处理图像中目标对象的特征信息。在一种可能的实现方式中,所述方法利用神经网络实现,所述神经网络根据待处理图像训练得到。通过待处理图像训练得到神经网络实现端到端的定位结果和目标检测结果的同步预测,提高了图像处理的准确度和智能化。在一种可能的实现方式中,根据所述待处理图像训练所述神经网络的步骤包括:将所述待处理图像分别输入所述神经网络中的特征提取网络以及关键点特征提取网络中进行处理,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;将所述关键点特征输入所述神经网络中的第一检测网络中进行处理,确定所述目标对象的关键点的定位结果;将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果;根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失;根据所述模型损失,调整所述神经网络的网络参数值。通过这种方式,可以训练得到能够准确地得到关键点的定位结果以及动作单元的目标检测结果的神经网络。在一种可能的实现方式中,将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果,包括:将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征;将所述局部特征以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述动作单元的目标检测结果。这样,能够较准确地获取到动作单元的局部特征,提高运动单元的目标检测结果的检测精度。在一种可能的实现方式中,将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征,包括:将所述定位结果输入所述神经网络中的初始注意力生成网络中进行处理,根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;将所述初始注意力特征图输入所述神经网络中的参考特征提取网络中进行卷积处理,得到处理后的注意力特征图;将所述处理后的注意力特征图以及所述目标对象的特征信息输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的运动单元的局部特征,其中,根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失,包括:根据所述定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息、所述初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定所述神经网络的模型损失。通过神经网络自适应注意力学习,得到的各动作单元的局部特征准确度较高,能够提高图像处理方法的鲁棒性以及动作单元的目标检测结果的准确性。在一种可能的实现方式中,所述特征提取网络包括至少一个卷积组,每个卷积组包括至少一个卷积层以及至少一个卷积子组,所述卷积子组包括多个卷积子层,各卷积子层包括不同数量的子区域,各卷积子层不同子区域的卷积核参数不同。这样,将卷积子层划分为多个子区域,能够更好地提取局部的特征。各卷积子层被划分为不同数量的子区域,便于提取不同尺寸的局部的特征,以适应不同大小的动作单元,能够提取到更精细、更全面的特征,以提高后续动作单元的目标检测结果的准确度。同时,这种残差结构能够降低训练过程中梯度弥散问题的出现概率,提高网络的稳定性和准确性。根据本公开的另一方面,提供了一种图像处理装置,所述装置包括:获取模块,用于获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;定位结果确定模块,用于根据所述关键点特征,确定所述待处理图像中所述目标对象的关键点的定位结果;目标检测结果确定模块,用于根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果。在一种可能的实现方式中,所述目标检测结果确定模块包括:第一确定子模块,用于根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征;第二确定子模块,用于根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果。在一种可能的实现方式中,所述获取模块包括:第一获取子模块,用于对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息;第二获取子模块,用于对所述目标对象的特征信息进行关键点特征提取,得到所述目标对象的关键点特征。在一种可能的实现方式中,所述第一确定子模块包括:第三确定子模块,用于根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;第三获取子模块,用于对所述初始注意力特征图进行卷积处理,得到处理后的注意力特征图;第四确定子模块,用于根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征。在一种可能的实现方式中,所述第四确定子模块包括:第四获取子模块,用于根据处理后的注意力特征图与所述目标对象的特征信息,得到注意力内容;第五获取子模块,用于对所述注意力内容进行特征提取处理,得到所述局部特征。在一种可能的实现方式中,所述目标对象包括多个动作单元,其中,所述第二确定子模块包括:第六获取子模块,用于对多个动作单元的局部特征进行融合处理,得到融合后的局部特征;第五确定子模块,用于根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果。在一种可能的实现方式中,所述装置利用神经网络实现,其中,所述第一获取子模块包括:第七获取子模块,用于将所述待处理图像输入所述神经网络的特征提取网络中进行特征提取,得到所述待处理图像中目标对象的特征信息。在一种可能的实现方式中,所述装置利用神经网络实现,所述神经网络根据待处理图像训练得到。在一种可能的实现方式中,所述装置包括:特征获取模块,用于将所述待处理图像分别输入所述神经网络中的特征提取网络以及关键点特征提取网络中进行处理,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;第一确定模块,用于将所述关键点特征输入所述神经网络中的第一检测网络中进行处理,确定所述目标对象的关键点的定位结果;第二确定模块,用于将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果;第三确定模块,用于根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失;参数调整模块,用于根据所述模型损失,调整所述神经网络的网络参数值。在一种可能的实现方式中,所述第二确定模块包括:第六确定子模块,用于将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征;第七确定子模块,用于将所述局部特征以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述动作单元的目标检测结果。在一种可能的实现方式中,所述第六确定子模块包括:第八确定子模块,用于将所述定位结果输入所述神经网络中的初始注意力生成网络中进行处理,根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;第八获取子模块,用于将所述初始注意力特征图输入所述神经网络中的参考特征提取网络中进行卷积处理,得到处理后的注意力特征图;第九确定子模块,用于将所述处理后的注意力特征图以及所述目标对象的特征信息输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的运动单元的局部特征,其中,所述第三确定模块包括:第十确定子模块,用于根据所述定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息、所述初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定所述神经网络的模型损失。在一种可能的实现方式中,所述特征提取网络包括至少一个卷积组,每个卷积组包括至少一个卷积层以及至少一个卷积子组,所述卷积子组包括多个卷积子层,各卷积子层包括不同数量的子区域,各卷积子层不同子区域的卷积核参数不同。根据本公开的另一方面,提供了一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为:执行上述图像处理方法。根据本公开的另一方面,提供了一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述图像处理方法。根据本公开实施例,通过结合目标对象的关键点的定位结果,确定目标对象的动作单元的目标检测结果,利用定位结果与目标检测结果之间的关联性,能够提高定位结果以及目标检测结果的准确度,从而提高对待处理图像中目标对象进行对象分析的准确度。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开。根据下面参考附图对示例性实施例的详细说明,本公开的其它特征及方面将变得清楚。附图说明此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。图1示出根据本公开实施例的图像处理方法的流程图。图2示出根据本公开实施例的图像处理方法的神经网络的示意图。图3示出根据本公开实施例的图像处理方法的卷积组的示意图。图4示出根据本公开实施例的图像处理方法的卷积组的示意图。图5示出根据本公开实施例的图像处理方法的应用场景的示意图。图6示出根据本公开实施例的图像处理方法的动作单元初始注意力特征图以及处理后的注意力特征图的示意图。图7示出根据本公开实施例的图像处理方法的应用场景的示意图。图8示出根据本公开实施例的图像处理方法中训练神经网络的流程图。图9示出根据本公开实施例的图像处理装置的框图。图10示出根据本公开实施例的图像处理装置的框图。图11示出根据本公开实施例的电子设备的框图。图12示出根据本公开实施例的电子设备的框图。具体实施方式以下将参考附图详细说明本公开的各种示例性实施例、特征和方面。附图中相同的附图标记表示功能相同或相似的元件。尽管在附图中示出了实施例的各种方面,但是除非特别指出,不必按比例绘制附图。在这里专用的词“示例性”意为“用作例子、实施例或说明性”。这里作为“示例性”所说明的任何实施例不必解释为优于或好于其它实施例。本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。另外,为了更好的说明本公开,在下文的具体实施方式中给出了众多的具体细节。本领域技术人员应当理解,没有某些具体细节,本公开同样可以实施。在一些实例中,对于本领域技术人员熟知的方法、手段、元件和电路未作详细描述,以便于凸显本公开的主旨。图1示出根据本公开实施例的图像处理方法的流程图。该方法可应用于电子设备中,该电子设备可以被提供为终端、服务器或其它形态的设备。其中,终端可以为用户设备(userequipment,ue)、移动设备、用户终端、蜂窝电话、无绳电话、个人数字处理(personaldigitalassistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等,本公开对此不作限制。在一些可能的实现方式中,该图像处理方法可通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图1所示,根据本公开实施例的图像处理方法包括:在步骤s101中,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;在步骤s102中,根据所述关键点特征,确定所述待处理图像中所述目标对象的关键点的定位结果;在步骤s103中,根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果。根据本公开实施例,通过结合目标对象的关键点的定位结果,确定目标对象的动作单元的目标检测结果,利用定位结果与目标检测结果之间的关联性,能够提高定位结果以及目标检测结果的准确度,从而提高对待处理图像中目标对象进行对象分析的准确度。其中,待处理图像可以为真实图像,例如,可以为原始图像或经过处理后的图像。目标对象可以为待处理图像中某一区域图像中的对象。举例来说,待处理图像可以是对原始图像进行截取处理后得到的图像,例如,按照一定规则截取目标对象所得到的图像。待处理图像也可以是包括目标对象的原始图像,本公开对此不作限制。关键点可以为目标对象上具有特殊意义的点,可用于定义目标对象的形状、外观等。例如,人脸的关键点可以是人脸上某些特定位置(例如,眼睛、眉毛等)的点,可用于定义人脸形状、表情外观等。动作单元(actionunit,au)可用于表示目标对象上的肌肉动作。例如,人脸动作单元可以表示某些人脸位置上的肌肉动作,可用于准确、客观的描述人脸表情。本公开对目标对象的关键点的数量和定义规则、动作单元的数量和定义规则等不作限制。在一种可能的实现方式中,待处理对象中的目标对象可包括任意类别的对象,例如,人脸、动物脸、物品等,本公开对此不作限制。以下为便于理解,以人脸作为目标对象,待处理图像为人脸图像进行说明。举例来说,可以按照一定规则截取原始图像,得到待处理图像。例如,可以通过人脸检测代码、人脸配准代码等多种方式检测原始图像中的人脸位置,确定人脸的多个特征点(关键点)。应理解,可以通过多种方式定位人脸的关键点,例如,可人工定位、人脸检测代码、人脸配准代码等,本公开对此不作限制。在一种可能的实现方式中,可以根据人脸的多个关键点(例如,左眼瞳孔、右眼瞳孔、鼻尖、左嘴角、右嘴角),通过相似变换(例如,旋转、平移、均匀缩放等),在不改变人脸形状和表情的条件下,截取原始图像得到待处理图像,待处理图像可为人脸图像。例如,可以通过图像旋转的方式,使得双眼瞳孔保持水平,并沿着这5个关键点形成的外接矩形框放大、裁剪得到目标尺寸(例如,l×l)的人脸图像(待处理图像)。如图1所示,在步骤s101中,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征。举例来说,可以对待处理图像(人脸图像)进行特征提取,得到共享特征。该共享特征可作为目标对象的特征信息。该共享特征还可用于确定目标对象的关键点特征,例如,对共享特征进行关键点特征提取,得到关键点特征。在一些可选的实施例中,也可以分别对待处理图像进行特征提取,得到待处理图像中目标对象的特征信息以及目标对象的关键点特征。举例来说,可以根据期望获取到的特征的类别,分别对待处理图像进行特征提取。例如,可以对待处理图像进行特征提取,获取目标对象的特征信息。可以对待处理图像进行关键点特征提取,得到关键点特征。本公开对获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征的方式不作限制。在一种可能的实现方式中,步骤s101可以包括:对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息;对所述目标对象的特征信息进行关键点特征提取,得到所述目标对象的关键点特征。举例来说,可以基于深度学习算法,例如,可以根据待处理图像训练得到神经网络。利用训练好的神经网络的特征提取网络可以对待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息(共享特征)。通过对目标对象的特征信息(共享特征)进行关键点特征提取,得到所述目标对象的关键点特征。这样,能够较快速地、准确地得到目标对象的特征信息以及目标对象的关键点特征。图2示出根据本公开实施例的图像处理方法的神经网络的示意图。在一种可能的实现方式中,如图2所示,所述神经网络包括特征提取网络,该特征提取网络可对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息(共享特征)。所述神经网络还可包括关键点特征提取网络,共享特征输入关键点特征提取网络进行特征提取,可得到目标对象的关键点特征。在一种可能的实现方式中,对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息的步骤,可以包括:将所述待处理图像输入所述神经网络的特征提取网络中进行特征提取,得到所述待处理图像中目标对象的特征信息。其中,特征提取网络可以为能够对待处理图像进行特征提取的任意网络结构,例如,特征提取网络可包括卷积层,通过对待处理图像进行卷积处理,得到特征信息。其中,特征提取网络包括的卷积层可以具有任意形式和结构。例如,特征提取网络可以包括至少一个卷积组,每个卷积组可以包括至少一个卷积层。每级卷积层可以包括一个或多个卷积子层等,本公开对此不作限制。在一种可能的实现方式中,所述特征提取网络包括至少一个卷积组,每个卷积组包括至少一个卷积层以及至少一个卷积子组,所述卷积子组包括多个卷积子层,各卷积子层包括不同数量的子区域,各卷积子层不同子区域的卷积核参数不同。举例来说,特征提取网络可以包括两个卷积组,例如,分别为mr1(l,l,c)以及mr2(l/2,l/2,2c),所述两个卷积组串联,用于对待处理图像进行特征提取。其中,c代表卷积子层的滤波器个数,也是滤波产生的特征图的通道数。其中,mr1可用于提取待处理图像较局部(例如,棱角、边缘等)特征。mr2可用于提取待处理图像较高层(例如,小块等)的特征。mr2通过较多滤波器,可以有效提升特征提取效果。每个卷积组后连接有一个最大池化层。最大池化层可用于对提取到的特征进行下采样,降低特征维度。各卷积层可被施加批量归一化和整流线性单元,特征提取网络输出待处理图像中目标对象的特征信息。图3示出根据本公开实施例的图像处理方法的卷积组的示意图。在一种可能的实现方式中,如图3所示,一个卷积组包括一个卷积层以及一个卷积子组,所述卷积子组包括四个卷积子层。四个卷积子层分别被均匀划分为不同数量的子区域,例如,分别被均匀划分为1×1、2×2、4×4以及8×8个子区域。每个子区域可共享一个卷积核,各卷积子层不同子区域的卷积核参数不同(例如,卷积核一些权重的取值不同)。举例来说,待处理图像输入到特征提取网络中,第一个卷积组的卷积层对待处理图像进行卷积处理,得到一些中间特征,该中间特征输入到卷积子组中,分别由四个卷积子层对中间特征进行卷积处理,四个卷积子层的输出结果进行叠加得到第一叠加特征(例如,图3所示c表示叠加得到第一叠加特征),第一叠加特征与中间特征进行元素级相加(例如,对应元素进行相加),得到经第一个卷积组进行卷积处理得到的特征信息。应理解,第一个卷积组进行卷积处理得到的特征信息经过第二个卷积组处理(例如,处理过程可同第一个卷积组),输出的为目标对象的特征信息。这样,将卷积子层划分为多个子区域,能够更好地提取局部的特征。各卷积子层被划分为不同数量的子区域,便于提取不同尺寸的局部的特征,以适应不同大小的动作单元,能够提取到更精细、更全面的特征,以提高后续动作单元的目标检测结果的准确度。同时,应理解,第一叠加特征与中间特征进行元素级相加可构成残差结构,能够降低训练过程中梯度弥散问题的出现概率,提高网络的稳定性和准确性。需要说明的是,一个卷积组可以包括多种形式,如前文所述,多个卷积子层可以为同一个层次(同一个卷积子组)上的具有多种尺寸(被划分的子区域的数量不同)的卷积子层。多个卷积子层还可以为不同层次上的具有多个尺寸的卷积子层。图4示出根据本公开实施例的图像处理方法的卷积组的示意图。在一种可能的实现方式中,如图4所示,卷积子组包括3个卷积子层,例如,分别为卷积子层1、卷积子层2以及卷积子层3。这3个卷积子层分别被均匀划分为2×2、4×4以及8×8个子区域(3个卷积子层具有多种尺寸)。如图4所示,这3个卷积子层为不同层次上的卷积子层。例如,第一个卷积层输出的中间特征,输入到卷积子层1中进行处理,卷积子层1输出的特征输入卷积子层2中进行处理,卷积子层2输出的特征输入卷积子层3中进行处理。将卷积子层1、卷积子层2以及卷积子层3的输出进行叠加,叠加得到的结果与该卷积组的其他卷积层的输出结果进行元素级相加。这样,卷积子组的分层结构能够有效扩大卷积核的感受野,利于提取更加全面的特征信息。只要能够对待处理图像进行特征提取即可,本公开对特征提取网络的结构、特征提取网络包括卷积组的数量、各卷积组的结构、各卷积子组的层次和结构、各卷积子层的数量、各卷积子层包括的子区域的数量和划分方式、各卷积子层不同子区域的卷积核参数等均不作限制。在一种可能的实现方式中,对所述目标对象的特征信息进行关键点特征提取,得到所述目标对象的关键点特征。举例来说,如图2所示,所述神经网络还可包括关键点特征提取网络,其中,关键点特征提取网络如前文所述的特征提取网络,可以为包括卷积层的任意网络结构,本公开对此不作限制。在一些可选的实施例中,关键点特征提取网络可以包括5个卷积层,例如,这5个卷积层串联,第5个卷积层后连接全局平均池化层,该全局平均池化层可对第5个卷积层输出的结果进行整个空间域的平均池化。举例来说,将目标对象的特征信息输入关键点特征提取网络中进行特征提取,分别经过5个卷积层进行卷积处理,第5个卷积层的输出结果进行全局平均池化,得到目标对象的关键点特征。这样,关键点特征提取网络的结构简单,且全局平均池化能够较好地保持待处理图像的空间特征。目标对象的关键点的定位结果以及目标对象的动作单元的目标检测结果与目标对象的空间特征紧密相关,这样提取到的目标对象的关键点特征能够提高关键点定位结果以及动作单元的目标检测结果的预测准确度。应理解,关键点特征提取网络还可以为其他网络结构,例如,还可以包括3个卷积组,3个卷积组串联,每个卷积组包括2个卷积层,每个卷积组后连接一个最大池化层等。只要能够提取目标对象的关键点特征即可,本公开对关键点特征提取网络的结构、关键点特征提取网络包括卷积组、卷积层的数量、各卷积组的结构、卷积层的结构、池化层的类别等均不作限制。如图1所示,在步骤s102中,根据所述关键点特征,确定所述待处理图像中所述目标对象的关键点的定位结果。举例来说,可以将获取到的目标对象的关键点特征输入到全连接层(例如,全连接层的维度为2×关键点的个数)中进行处理,得到目标对象的关键点的定位结果。例如,定位结果可以是关键点的横轴和纵轴坐标等,本公开对此不作限制。例如,如图2所示,得到定位结果。如图1所示,在步骤s103中,根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果。举例来说,可以将前文所述确定的关键点的定位结果作用于目标对象的特征信息,例如,可以根据关键点的定位结果,截取出目标对象的动作单元的感兴趣区域roi(regionofinterest)。并基于动作单元的roi以及关键点特征,确定所述目标对象的动作单元的目标检测结果等。本公开对根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果的方式不作限制。在一种可能的实现方式中,步骤s103可以包括:根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征;根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果。举例来说,如前文所述,可以根据所述目标对象的特征信息以及所述定位结果,确定动作单元roi。可以基于动作单元的roi,确定动作单元的局部特征。例如,对截取出的目标对象的动作单元roi进行特征提取,得到动作单元的局部特征。可以根据动作单元的局部特征以及关键点特征,确定动作单元的目标检测结果。这样,通过目标对象的特征信息以及所述定位结果,确定得到的动作单元的局部特征准确度高,从而使得根据所述局部特征以及所述关键点特征,确定得到的动作单元的目标检测结果具有较高准确度。本公开对根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征的方式、根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果的方式均不作限制。其中,目标对象的关键点可以包括一个或多个,动作单元也可以包括一个或多个。动作单元的roi可为同样注意力分布(例如,各像素注意力权重相同)的区域,也可以为不同注意力分布(例如,各像素注意力权重不完全相同)的区域。在目标对象的动作单元为多个时,各动作单元的roi可以为固定尺寸,也可以为不同尺寸(例如各动作单元roi形状不规则),本公开对此不作限制。在一种可能的实现方式中,根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征的步骤,可以包括:根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;对所述初始注意力特征图进行卷积处理,得到处理后的注意力特征图;根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征。举例来说,如图2所示,所述神经网络还包括初始注意力生成网络。所述初始注意力生成网络可以根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图。下面给出本公开实施例示例性的动作单元的中心点与目标对象的关键点的位置关系,如图表1所示:表1动作单元序号动作单元名称动作单元中心7眼睑收紧眼睛中心10上嘴唇上扬上唇中心12嘴角拉长嘴角14酒窝嘴角15嘴角压低嘴角现以动作单元12为例,如表1所示,该动作单元12的中心为嘴角。例如,关键点的定位结果中包括嘴角这一关键点的定位结果(例如,坐标)。可以根据确定的嘴角的坐标以及嘴角与动作单元12之间的位置关系,定义动作单元12的初始注意力特征图。在一些可选的实施例中,可以定义动作单元的注意力特征图的各元素初始化为0,并根据定位结果中的关键点的定位结果,确定动作单元的中心。根据动作单元的中心,可以定义该动作单元的roi。该动作单元的roi可包含两个对称的子区域,可以确定各动作单元的两个子区域内各元素的初始注意力权重,得到需要更新注意力权重的元素,并生成各动作单元的初始注意力特征图。其中,各动作单元的初始注意力特征图的大小可为:l/4×l/4×1。本公开对根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图的具体方式、初始注意力特征图的大小等不作限制。下面给出本公开实施例示例性的第i个动作单元的子区域内第k个元素的注意力权重的确定公式(1):在公式(1)中,vik表示第i个动作单元的子区域内第k个元素的注意力权重,dik表示该第k个元素到动作单元子区域中心的曼哈顿距离。ζ表示子区域的宽度与注意力特征图宽度的比值,ξ是一个系数,ξ≥0。nau表示动作单元的个数。i为变量,i的取值在1到nau之间,ζ以及ξ为预先设置好的超参数。其中,ζ可用于确定各动作单元的roi的尺寸,例如,根据ζ、动作单元子区域中心以及注意力特征图的宽度,可以确定各动作单元的roi的尺寸。需要说明的是,若某个元素,属于roi两个子区域的重叠部分,则可以根据公式(1)分别求得两个注意力权重,取两个注意力权重中较大的值作为该元素的注意力权重。可以定义动作单元的roi以外区域的元素的注意力权重为0。这样,可以得到具有不同注意力分布的初始注意力特征图。本公开对根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图的方式、初始注意力特征图的大小、注意力权重的确定方式、区域的宽度与注意力特征图的比值大小、ξ这一系数的取值等均不作限制。图5示出根据本公开实施例的图像处理方法的应用场景的示意图。在一种可能的实现方式中,如图5所示,目标对象(人脸)包括多个动作单元。根据确定的定位结果(例如,人脸多个关键点的坐标)以及动作单元的中心点与目标对象的关键点的位置关系,可以确定人脸的动作单元的初始注意力特征图,例如,如图5所示,确定多个动作单元的初始注意力特征图51。在一种可能的实现方式中,根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征的步骤,可以包括:对所述初始注意力特征图进行卷积处理,得到处理后的注意力特征图。举例来说,如图2所示,所述神经网络还包括参考特征提取网络,该参考特征提取网络可对初始注意力特征图进行注意力优化处理。例如,该参考特征提取网络可如前文所述的特征提取网络,为包括卷积层的任意网络结构。例如,可以包括如前文所述的一个卷积组(例如,图3所示的卷积组),其可对所述初始注意力特征图进行卷积处理,由一个滤波器(通道数)为1的卷积层输出处理后的注意力特征图。通过这种方式,卷积子组的多个卷积子层包括不同数量的子区域,可以在不同局部区域采用不同的注意力优化变换,且可适应不同大小的动作单元,提高处理后的注意力特征图的优化效果。参考特征提取网络还可以为其他形式,例如可以包括多个卷积层(例如,串联的3个卷积层)等,本公开对对所述初始注意力特征图进行卷积处理的方式、卷积层的结构和形式等不作限制。例如,如图5所示,对多个动作单元的初始注意力特征图51进行卷积处理,得到多个处理后的注意力特征图52。图6示出根据本公开实施例的图像处理方法的动作单元初始注意力特征图以及处理后的注意力特征图的示意图。在一种可能的实现方式中,如图6所示,第一行分别是6个动作单元的初始注意力特征图,第二行分别是这6个初始注意力特征图经过卷积处理得到的处理后的注意力特征图。如图6所示,各处理后的注意力特征图根据对应动作单元的位置自适应地调整roi的大小和注意力权重,每个动作单元的roi的形状不规律,而且其边界平滑地过渡到周围区域。在一种可能的实现方式中,根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征的步骤,可以包括:根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征。举例来说,如图2所示,所述神经网络可以包括局部特征提取网络,可以根据处理后的注意力特征图以及所述目标对象的特征信息输入局部特征提取网络,确定所述动作单元的局部特征。如前文所述,可能包括多个动作单元,可以根据各动作单元的处理后的注意力特征图及所述目标对象的特征信息,分别确定各动作单元的局部特征。这样,通过自适应注意力学习方式学习动作单元的注意力分布,并根据注意力分布结合特征信息,确定的动作单元的局部特征的准确度较高。本公开对根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征的方式不作限制。在一种可能的实现方式中,根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征的步骤,可以包括:根据处理后的注意力特征图与所述目标对象的特征信息,得到注意力内容;对所述注意力内容进行特征提取处理,得到所述局部特征。举例来说,可以将处理后的注意力特征图与所述目标对象的特征信息进行元素级相乘。例如,对应的元素相乘,得到注意力内容。可以对所述注意力内容进行特征提取处理,得到所述局部特征。例如,可以通过一个包括5个串联卷积层的特征提取结构对注意力内容进行特征提取处理,得到所述局部特征。例如,在包括多个动作单元时,分别得到各动作单元的局部特征。例如,如图5所示,分别根据各处理后的注意力特征图以及所述目标对象的特征信息(例如,可以是由特征提取网络提取得到的特征信息),确定多个动作单元的局部特征53。这样,能够保证空间信息损失较少、模型参数简单,且提取的动作单元的局部特征更加准确,以提高运动单元的目标检测结果的检测精度。本公开对对所述注意力内容进行特征提取处理,得到所述局部特征的方式不作限制。在一种可能的实现方式中,根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果。举例来说,如图2所示,可以结合动作单元的局部特征以及目标对象的关键点特征,确定所述动作单元的目标检测结果。本公开对根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果的方式不作限制。在一种可能的实现方式中,所述目标对象包括多个动作单元,根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果的步骤,可以包括:对多个动作单元的局部特征进行融合处理,得到融合后的局部特征;根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果。举例来说,可以将得到的多个动作单元的局部特征进行融合处理,例如,进行元素级相加(对应像素相加),得到融合后的局部特征。例如,如图5所示,将多个动作单元的局部特征进行元素级相加,得到融合后的局部特征54,该融合后的局部特征54可用于确定最终的目标检测结果。例如,可以根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果。例如,将述目标对象的关键点特征与融合后的局部特征进行元素级相加,并通过池化层进行全局平均池化,将池化层输出的结果输入维数为nau(为动作单元的个数)的全连接层中进行处理,得到多个动作单元的目标检测结果,例如,得到一个多标签的二分类结果。这样,可以较好地保持提取到的空间特征,以提高目标检测结果的准确度。本公开对融合处理的方式、局部特征的形式、目标检测结果的形式、根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果的方式等均不作限制。应理解,上述方法可以适用于使用训练好的神经网络确定目标检测结果的场景,也可以适用于训练神经网络的过程,本公开实施例对此不做限定。在一种可能的实现方式中,在使用训练好的神经网络确定目标检测结果之前,可包括根据待处理图像训练所述神经网络的步骤。图7示出根据本公开实施例的图像处理方法的应用场景的示意图。在一种可能的实现方式中,如图7所示,在根据待处理图像训练所述神经网络之前以及在通过训练好的神经网络确定目标检测结果之前,可进行数据预处理。现以在根据待处理图像训练所述神经网络之前进行数据预处理为例进行说明。举例来说,可以建立人脸动作单元数据库。例如,招聘20个男性和20个女性,每个人都在8个不同的任务中被诱导自发地产生不同的表情,由摄像头采集获得2d视频,每个视频经过筛选得到500帧,图片总数为40×8×500=160000张。对每张人脸图片标注多个动作单元(例如12个)。例如,人脸图片中出现该动作单元,则该动作单元的标注信息为1,若没有出现该动作单元,则该动作单元的标注信息为0。另外,对每张人脸图片进行人脸检测以及关键点定位,标注多个人脸关键点(例如,49个)。例如,标注该多个人脸关键点的横轴和纵轴坐标。可以对160000张图片进行处理,例如,如前文所述,先检测人脸位置,然后定位5个人脸关键点:左眼瞳孔、右眼瞳孔、鼻尖、左嘴角、右嘴角,进行旋转、平移、均匀缩放的人脸相似变换,在不改变人脸形状和表情的同时对人脸进行归一化,最后将人脸图像随机地水平翻转和裁剪为l×l,得到待处理图像,在此不再赘述。图8示出根据本公开实施例的图像处理方法中训练神经网络的流程图。在一种可能的实现方式中,如图8所示,根据所述待处理图像训练所述神经网络的步骤包括:在步骤s104中,将所述待处理图像分别输入所述神经网络中的特征提取网络以及关键点特征提取网络中进行处理,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;在步骤s105中,将所述关键点特征输入所述神经网络中的第一检测网络中进行处理,确定所述目标对象的关键点的定位结果;在步骤s106中,将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果;在步骤s107中,根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失;在步骤s108中,根据所述模型损失,调整所述神经网络的网络参数值。举例来说,可以将所述待处理图像分别输入所述神经网络中的特征提取网络以及关键点特征提取网络中进行处理,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征。例如,如图7所示,将待处理图像输入特征提取网络学习多尺度共享特征。该多尺度共享特征输入关键点特征提取网络学习人脸的关键点特征。可以将关键点特征输入所述神经网络中的第一检测网络中进行处理,确定所述目标对象的关键点的定位结果。例如,如图7所示,确定人脸的多个关键点的定位结果。可以将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果。在一种可能的实现方式中,步骤s106可以包括:将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征;将所述局部特征以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述动作单元的目标检测结果。举例来说,可以将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征,将所述局部特征以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述动作单元的目标检测结果。例如,如图7所示,根据动作单元的局部特征以及关键点特征,确定目标检测结果。这样,能够较准确地获取到动作单元的局部特征,提高运动单元的目标检测结果的检测精度。在一种可能的实现方式中,根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失。根据模型损失,调整所述神经网络的网络参数值。举例来说,可以根据定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息以及损失函数,确定所述神经网络的模型损失。本公开对损失函数的形式不作限制。可以根据模型损失,调整所述神经网络的网络参数值。例如,采用反向传播结合梯度下降算法等调整网络参数值。应当理解,可采用合适的方式调整神经网络的网络参数值,本公开对此不作限制。经过多次调整后,如果满足预先设定的训练条件,例如调整次数达到预先设定的训练次数阈值,或者模型损失小于或等于预先设定的损失阈值,则可以将当前的神经网络确定为最终的神经网络,从而完成了的神经网络的训练过程。应当理解,本领域技术人员可以根据实际情况设定训练条件以及损失阈值,本公开对此不作限制。通过这种方式,可以训练得到能够准确地得到关键点的定位结果以及动作单元的目标检测结果的神经网络。在一种可能的实现方式中,将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征的步骤,可以包括:将所述定位结果输入所述神经网络中的初始注意力生成网络中进行处理,根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;将所述初始注意力特征图输入所述神经网络中的参考特征提取网络中进行卷积处理,得到处理后的注意力特征图;将所述处理后的注意力特征图以及所述目标对象的特征信息输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的运动单元的局部特征。在一种可能的实现方式中,步骤s107可以包括:根据所述定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息、所述初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定所述神经网络的模型损失。举例来说,在训练神经网络的过程中,可确定各动作单元的初始注意力特征图,并对各动作单元的初始注意力特征图进行优化处理,辅助确定各运动单元的局部特征。例如,如图7所示,将所述人脸关键点的定位结果输入所述神经网络中的初始注意力生成网络中进行处理,确定所述人脸的动作单元的初始注意力特征图。对初始注意力特征图进行优化处理(例如,卷积处理),得到处理后的注意力特征图。根据处理后的注意力特征图以及所述目标对象的特征信息学习人脸运动单元的局部特征。通过神经网络自适应注意力学习,得到的各动作单元的局部特征准确度较高,以提高图像处理方法的鲁棒性以及动作单元的目标检测结果的准确性。在一种可能的实现方式中,可以根据所述定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息、所述初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定所述神经网络的模型损失。应理解,可以通过标注信息、检测结果确定神经网络的模型损失。在确定神经网络的模型损失的过程中,损失函数可以包括多种形式,本公开对此不作限制。下面给出本公开实施例示例性的根据定位结果以及定位结果的标注信息,确定损失的公式(2):在公式(2)中,ealign表示根据关键点定位结果以及定位结果的标注信息,确定的损失。y2j-1和y2j分别表示第j个点的标注信息(真实的x坐标和y坐标)。其中,j的取值在1到nalign之间,nalign表示关键点的个数。do为双眼的真实瞳距。和分别表示第j个点的定位结果(预测出的该点的x坐标和y坐标)。下面给出本公开实施例示例性的根据目标检测结果以及所述目标检测结果的标注信息,确定损失的公式(3):在公式(3)中,eau表示根据目标检测结果以及所述目标检测结果的标注信息,确定的损失。nau表示全连接层的维数,动作单元的个数。pi表示第i个动作单元出现的真实概率(目标检测结果的标注信息),出现为1而缺失则为0。表示预测概率(预测的该动作单元的目标检测结果)。权重wi是用于克服数据不均衡的问题。对于大多数动作单元检测数据库,不同动作单元出现的频率是不均衡的,而且动作单元之间并不相互独立,在训练神经网络之前建立人脸数据库时,可以保证各个动作单元的出现和损失频率基本一致,从而可以降低数据不均衡问题的出现概率,保证预测准确率。其中,可以对训练集进行统计处理,可以根据公式确定权重,其中,ri表示在训练集中第i个动作单元出现的频率。应理解,公式(3)为加权多标签sigmoid交叉熵损失函数,这样可以简化全连接层的维数,在简化结构的基础上保证了预测效果。另外,还可以通过其他类型的损失函数,根据目标检测结果以及所述目标检测结果的标注信息,确定损失。例如,还可以为加权多标签softmax损失等,本公开对此不作限制。下面给出本公开实施例示例性的根据初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定损失的公式(4):在公式(4)中,er表示根据初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定的损失,可衡量注意力特征图的初始值和优化后的值之间的sigmoid交叉熵。vik表示第i个注意力特征图的第k个元素的初始注意力权重值。表示第i个注意力特征图的第k个元素的处理后的注意力权重值,nelement是每个注意力特征图的元素个数。这样,可以降低处理后的注意力特征图与初始注意力特征图相差过大的概率。下面给出本公开实施例示例性的确定整体的模型损失的公式(5):e=eau+λ1ealign+λ2er(5)其中,e表示整体的模型损失,λ1和λ2是平衡重要性的系数,为预先设置的超参数。这样,可以在训练神经网络过程中,可以根据公式(2)、公式(3)、公式(4)以及公式(5),计算得到整体的模型损失,根据所述模型损失,调整所述神经网络的网络参数值,如前所述,在此不再赘述。通过这种方式,可以训练得到能够准确地得到关键点的定位结果以及动作单元的目标检测结果的神经网络。通过关键点定位与动作单元检测联合训练,利用两个任务间的关联性,可以促进提高两个任务的检测结果的准确度。通过自适应注意力学习,可以适应各类多样化、非刚性的动作单元的检测,提高动作单元的目标检测结果的准确性。应理解,根据本公开实施例得到的目标对象的关键点的定位结果以及目标对象的动作单元的目标检测结果可应用于各类对象分析任务中。例如,确定的人脸关键点的定位结果以及人脸动作单元的目标检测结果可用于进行人脸分析人物,可应用于人脸表情识别、人脸验证、安防等各个领域。本公开对目标检测结果以及定位结果的适用场景不作限制。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。图9示出根据本公开实施例的图像处理装置的框图。如图9所示,所述装置包括:获取模块201,用于获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;定位结果确定模块202,用于根据所述关键点特征,确定所述待处理图像中所述目标对象的关键点的定位结果;目标检测结果确定模块203,用于根据所述目标对象的特征信息、所述定位结果以及所述关键点特征,确定所述目标对象的动作单元的目标检测结果。在一种可能的实现方式中,所述目标检测结果确定模块203包括:第一确定子模块,用于根据所述目标对象的特征信息以及所述定位结果,确定所述目标对象的动作单元的局部特征;第二确定子模块,用于根据所述局部特征以及所述关键点特征,确定所述动作单元的目标检测结果。在一种可能的实现方式中,所述获取模块201包括:第一获取子模块,用于对所述待处理图像进行特征提取,得到所述待处理图像中目标对象的特征信息;第二获取子模块,用于对所述目标对象的特征信息进行关键点特征提取,得到所述目标对象的关键点特征。在一种可能的实现方式中,所述第一确定子模块包括:第三确定子模块,用于根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;第三获取子模块,用于对所述初始注意力特征图进行卷积处理,得到处理后的注意力特征图;第四确定子模块,用于根据处理后的注意力特征图以及所述目标对象的特征信息,确定所述动作单元的局部特征。在一种可能的实现方式中,所述第四确定子模块包括:第四获取子模块,用于根据处理后的注意力特征图与所述目标对象的特征信息,得到注意力内容;第五获取子模块,用于对所述注意力内容进行特征提取处理,得到所述局部特征。在一种可能的实现方式中,所述目标对象包括多个动作单元,其中,所述第二确定子模块包括:第六获取子模块,用于对多个动作单元的局部特征进行融合处理,得到融合后的局部特征;第五确定子模块,用于根据融合后的局部特征以及所述目标对象的关键点特征,确定所述多个动作单元的目标检测结果。在一种可能的实现方式中,所述装置利用神经网络实现,其中,所述第一获取子模块包括:第七获取子模块,用于将所述待处理图像输入所述神经网络的特征提取网络中进行特征提取,得到所述待处理图像中目标对象的特征信息。在一种可能的实现方式中,所述装置利用神经网络实现,所述神经网络根据待处理图像训练得到。图10示出根据本公开实施例的图像处理装置的框图。如图10所示,在一种可能的实现方式中,所述装置包括:特征获取模块204,用于将所述待处理图像分别输入所述神经网络中的特征提取网络以及关键点特征提取网络中进行处理,获取待处理图像中目标对象的特征信息以及所述目标对象的关键点特征;第一确定模块205,用于将所述关键点特征输入所述神经网络中的第一检测网络中进行处理,确定所述目标对象的关键点的定位结果;第二确定模块206,用于将所述目标对象的特征信息、所述定位结果以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述目标对象的动作单元的目标检测结果;第三确定模块207,用于根据所述定位结果、所述定位结果的标注信息、所述目标检测结果以及所述目标检测结果的标注信息,确定所述神经网络的模型损失;参数调整模块208,用于根据所述模型损失,调整所述神经网络的网络参数值。在一种可能的实现方式中,所述第二确定模块206包括:第六确定子模块,用于将所述目标对象的特征信息以及所述定位结果输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的动作单元的局部特征;第七确定子模块,用于将所述局部特征以及所述关键点特征输入所述神经网络中的第二检测网络中进行处理,确定所述动作单元的目标检测结果。在一种可能的实现方式中,所述第六确定子模块包括:第八确定子模块,用于将所述定位结果输入所述神经网络中的初始注意力生成网络中进行处理,根据所述定位结果以及动作单元的中心点与目标对象的关键点的位置关系,确定所述目标对象的动作单元的初始注意力特征图;第八获取子模块,用于将所述初始注意力特征图输入所述神经网络中的参考特征提取网络中进行卷积处理,得到处理后的注意力特征图;第九确定子模块,用于将所述处理后的注意力特征图以及所述目标对象的特征信息输入所述神经网络中的局部特征提取网络中进行处理,确定所述目标对象的运动单元的局部特征,其中,所述第三确定模块207包括:第十确定子模块,用于根据所述定位结果、所述定位结果的标注信息、所述目标检测结果、所述目标检测结果的标注信息、所述初始注意力特征图中各元素的初始注意力权重以及所述处理后的注意力特征图中各元素的注意力权重,确定所述神经网络的模型损失。在一种可能的实现方式中,所述特征提取网络包括至少一个卷积组,每个卷积组包括至少一个卷积层以及至少一个卷积子组,所述卷积子组包括多个卷积子层,各卷积子层包括不同数量的子区域,各卷积子层不同子区域的卷积核参数不同。在一些实施例中,本公开实施例提供的装置具有的功能或包含的模块可以用于执行上文方法实施例描述的方法,其具体实现可以参照上文方法实施例的描述,为了简洁,这里不再赘述本公开实施例还提出一种计算机可读存储介质,其上存储有计算机程序指令,所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。本公开实施例还提出一种电子设备,包括:处理器;用于存储处理器可执行指令的存储器;其中,所述处理器被配置为上述方法。图11示出根据本公开实施例的电子设备的框图。例如,电子设备800可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等终端。参照图11,电子设备800可以包括以下一个或多个组件:处理组件802,存储器804,电源组件806,多媒体组件808,音频组件810,输入/输出(i/o)的接口812,传感器组件814,以及通信组件816。处理组件802通常控制电子设备800的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件802可以包括一个或多个处理器820来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件802可以包括一个或多个模块,便于处理组件802和其他组件之间的交互。例如,处理组件802可以包括多媒体模块,以方便多媒体组件808和处理组件802之间的交互。存储器804被配置为存储各种类型的数据以支持在电子设备800的操作。这些数据的示例包括用于在电子设备800上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器804可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。电源组件806为电子设备800的各种组件提供电力。电源组件806可以包括电源管理系统,一个或多个电源,及其他与为电子设备800生成、管理和分配电力相关联的组件。多媒体组件808包括在所述电子设备800和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件808包括一个前置摄像头和/或后置摄像头。当电子设备800处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。音频组件810被配置为输出和/或输入音频信号。例如,音频组件810包括一个麦克风(mic),当电子设备800处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器804或经由通信组件816发送。在一些实施例中,音频组件810还包括一个扬声器,用于输出音频信号。i/o接口812为处理组件802和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。传感器组件814包括一个或多个传感器,用于为电子设备800提供各个方面的状态评估。例如,传感器组件814可以检测到电子设备800的打开/关闭状态,组件的相对定位,例如所述组件为电子设备800的显示器和小键盘,传感器组件814还可以检测电子设备800或电子设备800一个组件的位置改变,用户与电子设备800接触的存在或不存在,电子设备800方位或加速/减速和电子设备800的温度变化。传感器组件814可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件814还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件814还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。通信组件816被配置为便于电子设备800和其他设备之间有线或无线方式的通信。电子设备800可以接入基于通信标准的无线网络,如wifi,2g或3g,或它们的组合。在一个示例性实施例中,通信组件816经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件816还包括近场通信(nfc)模块,以促进短程通信。例如,在nfc模块可基于射频识别(rfid)技术,红外数据协会(irda)技术,超宽带(uwb)技术,蓝牙(bt)技术和其他技术来实现。在示例性实施例中,电子设备800可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器804,上述计算机程序指令可由电子设备800的处理器820执行以完成上述方法。图12示出根据本公开实施例的电子设备的框图。例如,电子设备1900可以被提供为一服务器。参照图12,电子设备1900包括处理组件1922,其进一步包括一个或多个处理器,以及由存储器1932所代表的存储器资源,用于存储可由处理组件1922的执行的指令,例如应用程序。存储器1932中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件1922被配置为执行指令,以执行上述方法。电子设备1900还可以包括一个电源组件1926被配置为执行电子设备1900的电源管理,一个有线或无线网络接口1950被配置为将电子设备1900连接到网络,和一个输入输出(i/o)接口1958。电子设备1900可以操作基于存储在存储器1932的操作系统,例如windowsservertm,macosxtm,unixtm,linuxtm,freebsdtm或类似。在示例性实施例中,还提供了一种非易失性计算机可读存储介质,例如包括计算机程序指令的存储器1932,上述计算机程序指令可由电子设备1900的处理组件1922执行以完成上述方法。本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本
技术领域
的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本
技术领域
的其它普通技术人员能理解本文披露的各实施例。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1