模型训练方法、人体识别方法、装置、设备及存储介质与流程

文档序号:16250346发布日期:2018-12-11 23:58阅读:143来源:国知局
模型训练方法、人体识别方法、装置、设备及存储介质与流程

本发明实施例涉及计算机技术领域,尤其涉及一种模型训练方法、人体识别方法、装置、设备及存储介质。

背景技术

现有技术中,通过拍摄设备拍摄的视频或图像中可能会包括人体,有时候需要确定图像中的人体区域或人体部位区域。

但是现有技术中,对图像中人体区域或人体部位区域的检测精度较低。



技术实现要素:

本发明实施例提供一种模型训练方法、人体识别方法、装置、设备及存储介质,以提高人体区域或人体部位区域的检测精度。

第一方面,本发明实施例提供一种模型训练方法,包括:

获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;

在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;

根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;

根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;

根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。

第二方面,本发明实施例提供一种人体识别方法,包括:

根据第一方面得到的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。

第三方面,本发明实施例提供一种模型训练装置,包括:

第一获取模块,用于获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;

第二获取模块,用于在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;

第一确定模块,用于根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;

第二确定模块,用于根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;

第三确定模块,用于根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。

第四方面,本发明实施例提供一种人体识别装置,包括:

人体识别模块,用于根据如第三方面所述的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。

第五方面,本发明实施例提供一种设备,包括:

存储器;

处理器;以及

计算机程序;

其中,所述计算机程序存储在所述存储器中,并被配置为由所述处理器执行以实现第一方面或第二方面所述的方法。

第六方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现第一方面或第二方面所述的方法。

本发明实施例提供的模型训练方法、人体识别方法、装置、设备及存储介质,通过对高层卷积层输出的特征图和低层卷积层输出的特征图进行融合,使得融合后得到的特征图不仅具有低层卷积层输出的特征,也有高层卷积层输出的特征,当低层卷积层采用融合后得到的特征图对样本图像中的人体区域或人体部位区域进行识别时,可提高人体区域或人体部位区域的检测精度。

附图说明

图1为本发明实施例提供的模型训练方法流程图;

图2为本发明另一实施例提供的深度神经网络模型的示意图;

图3为本发明另一实施例提供的模型训练方法流程图;

图4为本发明实施例提供的模型训练装置的结构示意图;

图5为本发明实施例提供的一种设备的结构示意图。

通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本发明提供的模型训练方法,旨在解决现有技术的如上技术问题。

下面以具体地实施例对本发明的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本发明的实施例进行描述。

图1为本发明实施例提供的模型训练方法流程图。本发明实施例针对现有技术的如上技术问题,提供了模型训练方法,该方法具体步骤如下:

步骤101、获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层。

在本实施例中,所述人体识别模型具体可以是深度神经网络模型。该深度神经网络模型可以运行在模型训练装置中,该模型训练装置可以是终端设备例如移动终端、计算机等,也可以是该终端设备的部件,另外,该模型训练装置还可以是服务器,或者是该服务器的部件。

具体的,如图2所示,该深度神经网络模型包括数据层20、多个第一卷积层例如第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25、第一卷积层26、以及第一损失层27;此处只是示意性说明,并不限定第一卷积层的个数,可以理解,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25、第一卷积层26只是该深度神经网络模型包括的所有卷积层中的几个。

在对该深度神经网络模型进行训练之前,需要获取用于训练该深度神经网络模型的样本图像,可选的,从预设的视频中获取多个图像,对该多个图像中的每个图像进行尺度缩放、角度旋转、色彩空间的扰动增强、区域抽取等处理中的至少一种处理,使得对每个图像进行前述至少一种处理后得到多个新的图像。在本实施例中,该多个图像和每个图像对应的多个新的图像构成本实施例中用于训练该深度神经网络模型的样本图像。

步骤102、在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图。

可以理解,用于训练该深度神经网络模型的样本图像在如图2所示的数据层20中。本实施例以其中一个样本图像为例,进行示意性说明。可以理解,该样本图像依次经过如图2所示的多个第一卷积层处理时,每个第一卷积层至少输出一个特征图,此处,将每个第一卷积层输出的特征图记为第一特征图。例如,第一卷积层21对该样本图像处理后得到特征图a,第一卷积层22对该样本图像处理后得到特征图b,第一卷积层23对该样本图像处理后得到特征图c,依次类推,第一卷积层26对该样本图像处理后得到特征图f。特征图a、特征图b、……特征图f均记为第一特征图。

步骤103、根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图。

在本实施例中,如图2所示,该深度神经网络模型包括多个第一卷积层,该多个第一卷积层中有部分卷积层可引出分支,例如,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25分别引出分支31、分支32、分支33、分支34、分支35;每个分支包括多个第二卷积层和至少一个第二损失层,如图2所示,每个分支可包括两个第二损失层和两个第二卷积层。此处只是示意性说明,并不限定该深度神经网络模型中可以引出分支的第一卷积层的个数和具体位置,也不限定每个分支可包括的第二损失层和第二卷积层的个数。可以理解,每个分支的结构可以不同,也可以部分相同,第一卷积层和第二卷积层可以相同,可以不同,此处是为了将分支里的卷积层和该深度神经网络模型中主干网络中的卷积层加以区分,所以将该深度神经网络模型中主干网络中的卷积层记为第一卷积层,将分支里的卷积层记为第二卷积层。此外,第一损失层和第二损失层可以相同,也可以不同。

可以理解,距离所述数据层越近的第一卷积层输出的特征图的大小越大,距离所述数据层越远的第一卷积层输出的特征图的大小越小,也就是说,特征图a、特征图b、……特征图f的大小逐渐减小。

在本实施例中,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25可引出分支,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25依次输出的特征图a、特征图b、特征图c、特征图d、特征图e的大小逐渐减小。本实施例中,可以对第一卷积层26的特征图f和第一卷积层25的特征图e进行融合得到第一卷积层25的第二特征图记为特征图e;对第一卷积层25的第二特征图即特征图e和第一卷积层24的特征图d进行融合得到第一卷积层24的第二特征图记为特征图d;根据第一卷积层24的第二特征图即特征图d和第一卷积层23的特征图c进行融合得到第一卷积层23的第二特征图记为特征图c;根据第一卷积层23的第二特征图即特征图c和第一卷积层22的特征图b进行融合得到第一卷积层22的第二特征图记为特征图b;根据第一卷积层22的第二特征图即特征图b和第一卷积层21的特征图a进行融合得到第一卷积层21的第二特征图记为特征图a。

步骤104、根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配。

可选的,所述分支包括多个第二损失层,所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的大小在同一预设范围内,且所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的长宽比不同。

具体的,根据第一卷积层21对应的第二特征图即特征图a,以及第一卷积层21引出的分支31中与第二损失层连接的第二卷积层对应的预设框,检测该样本图像中与该预设框匹配的人体区域或人体部位区域,分支31中的最后一个第二卷积层311可以输出一个检测结果,也可以输出两个不同的检测结果,如果第二卷积层311输出一个检测结果,则第二卷积层311与一个第二损失层连接,如果第二卷积层311输出两个不同的检测结果,则第二卷积层311与两个第二损失层分别连接。

具体的,由于第一卷积层21距离数据层20最近,第一卷积层21引出的分支31可以检测样本图像中较小的人体区域或人体部位区域,例如,第二卷积层311的预设框的大小为16*16,则分支31将检测该样本图像中与16*16匹配的人体区域或人体部位区域,此处的人体区域具体可以是完整的人体躯体的区域,此处的人体部位区域具体可以是手部区域、头部区域等。可以理解,在样本图像中,如果人体区域较小,则分支31可检测出人体区域,但是,通常情况下,图像中的人体区域较大,而人体部位区域较小,因此,分支31可以检测出的人体部位区域要比可以检测出的人体区域多。

另外,第二卷积层311输出两个不同的检测结果,则该第二卷积层311可对应两个不同的预设框,该两个不同的预设框的大小在同一个预设范围内,该预设范围例如为16*16到64*64,但是,该两个不同的预设框的长宽比可以不同,例如,第二卷积层311对应的一个预设框的长宽比为1:1,第二卷积层311对应的另一个预设框的长宽比为2:1,使得分支31可检测出两种人体区域或人体部位区域,即分支31可检测出大小在16*16到64*64范围内,且长宽比为1:1的人体区域或人体部位区域,以及大小在16*16到64*64范围内,且长宽比为2:1的人体区域或人体部位区域。

同理,根据第一卷积层22对应的第二特征图即特征图b,以及第一卷积层22引出的分支32中与第二损失层连接的第二卷积层对应的预设框,检测该样本图像中与该预设框匹配的人体区域或人体部位区域;依次类推,根据第一卷积层25对应的第二特征图即特征图e,以及第一卷积层25引出的分支35中与第二损失层连接的第二卷积层对应的预设框,检测该样本图像中与该预设框匹配的人体区域或人体部位区域。每个分支中最后一个第二卷积层即与第二损失层连接的第二卷积层可以有一个输出,也可以有多个输出,如果该分支中最后一个第二卷积层有多个输出,则该最后一个第二卷积层可以对应有多个预设框,该多个预设框的大小在同一个预设范围内,但是,该多个预设框的长宽比不同。

可选的,距离所述数据层越近的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越小;距离所述数据层越远的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越大。也就是说,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25分别引出的分支中与第二损失层连接的第二卷积层对应的预设框逐渐增大,第一卷积层21引出的分支31中与第二损失层连接的第二卷积层311对应的预设框最小,第一卷积层25引出的分支35中与第二损失层连接的第二卷积层351对应的预设框最大,使得第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25分别引出的分支可检测到的人体区域或人体部位区域越来越大。

可选的,距离所述数据层越近的第一卷积层引出的分支用于检测所述样本图像中越小的人体区域或人体部位区域;距离所述数据层越远的第一卷积层引出的分支用于检测所述样本图像中越大的人体区域或人体部位区域。

本实施例将距离数据层最近的卷积层记为底层卷积层,将距离数据层较远的卷积层记为高层卷积层。

例如,第一卷积层21离数据层20最近,第一卷积层21引出的分支31中最后一个第二卷积层对应的预设框较小,分支31可检测样本图像中较小的人体区域或人体部位区域,例如人手区域或较小的人体区域。第一卷积层25离数据层20最远,第一卷积层25对应的预设框较大,或者第一卷积层25对应的预设框在一个较大的预设范围内,第一卷积层25引出的分支35可检测该样本图像中较大的人体区域或人体部位区域,例如人体区域或者较大的头部区域,此处较大的头部区域是指,该样本图像中头部区域占据了较大的图像面积;也就是说,当样本图像中的人体部位区域较大时,该第一卷积层25引出的分支35可以检测出该较大的人体部位区域,但是,通常情况下,图像中的人体部位区域较小,而人体区域较大,因此,分支35可以检测出的人体区域要比可以检测出的人体部位区域多。同理,第二卷积层351也可以有一个输出或多个输出,如图2所示,第二卷积层351有两个输出,则第二卷积层351可对应两个不同的预设框,该两个不同的预设框的大小在同一个预设范围内,该预设范围例如为250*250到500*500,但是,该两个不同的预设框的长宽比可以不同。

步骤105、根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。

可选的,每个样本图像中可预先对人体区域或人体部位区域进行标注,例如,预先确定该样本图像中人体区域或人体部位区域的位置,当该深度神经网络模型在训练的过程中,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25分别引出的分支检测出样本图像中不同大小的人体区域或人体部位区域后,根据各个分支检测出的不同大小的人体区域或人体部位区域,以及样本图像中预先标注好的人体区域或人体部位区域的位置,可对该深度神经网络模型的参数进行更新迭代,直到该深度神经网络模型的参数趋于收敛或稳定,可认为该深度神经网络模型已被训练好。

当该深度神经网络模型的参数确定后即该深度神经网络模型被训练好之后,可通过该深度神经网络模型确定目标图像即待检测图像中的人体区域和人体部位区域,可以理解,该深度神经网络模型被训练的越精准,该深度神经网络模型对目标图像中的人体区域和人体部位区域的检测结果越精准。

此外,在本实施例或其他实施例中,不同的分支可以采用不同的结构,如图2所示的分支34,分支34包括两个第二损失层,每个第二损失层连接有一个第二卷积层,也就是说,分支34和其他分支一样都可以检测样本图像中两种不同长宽比的人体区域或人体部位区域,但是,分支34中两种不同的检测结果是由不同的第二卷积层分别输出的,而其他的分支中两种不同的检测结果是由同一个第二卷积层输出的,在本实施例中,分支34和其他分支的结构均是可以的。可选的,如图2所示,第二卷积层341对应的预设框与第二卷积层342对应的预设框在同一个预设范围内,且第二卷积层341对应的预设框的长宽比和第二卷积层342对应的预设框的长宽比不同。本发明实施例通过对高层卷积层输出的特征图和低层卷积层输出的特征图进行融合,使得融合后得到的特征图不仅具有低层卷积层输出的特征,也有高层卷积层输出的特征,当低层卷积层采用融合后得到的特征图对样本图像中的人体区域或人体部位区域进行识别时,可提高人体区域或人体部位区域的检测精度。

图3为本发明另一实施例提供的模型训练方法流程图。在上述实施例的基础上,所述根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图,具体包括如下步骤:

步骤301、根据所述第一卷积层的下一个第一卷积层输出的第一特征图,以及所述下一个第一卷积层之后的所有第一卷积层输出的第一特征图,确定所述下一个第一卷积层对应的第二特征图。

步骤302、根据所述第一卷积层输出的第一特征图,以及所述下一个第一卷积层对应的第二特征图,确定所述第一卷积层对应的第二特征图。

可以理解,第一卷积层21、第一卷积层22、第一卷积层23、第一卷积层24、第一卷积层25依次输出的特征图a、特征图b、特征图c、特征图d、特征图e的大小逐渐减小。本实施例中,可以对第一卷积层26的特征图f和第一卷积层25的特征图e进行融合得到卷积层25的第二特征图记为特征图e;对第一卷积层25的第二特征图即特征图e和第一卷积层24的特征图d进行融合得到第一卷积层24的第二特征图记为特征图d;根据第一卷积层24的第二特征图即特征图d和第一卷积层23的特征图c进行融合得到第一卷积层23的第二特征图记为特征图c;根据第一卷积层23的第二特征图即特征图c和第一卷积层22的特征图b进行融合得到第一卷积层22的第二特征图记为特征图b;根据第一卷积层22的第二特征图即特征图b和第一卷积层21的特征图a进行融合得到第一卷积层21的第二特征图记为特征图a。

可选的,所述根据所述第一卷积层输出的第一特征图,以及所述下一个第一卷积层对应的第二特征图,确定所述第一卷积层对应的第二特征图,包括:根据所述第一卷积层输出的第一特征图的大小,对所述下一个第一卷积层对应的第二特征图进行放大;将所述第一卷积层输出的第一特征图和放大后的所述下一个第一卷积层对应的第二特征图进行叠加得到所述第一卷积层对应的第二特征图。

例如,第一卷积层21输出的特征图a为250*250,第一卷积层22输出的特征图b为125*125,第一卷积层23输出的特征图c为64*64,第一卷积层24输出的特征图d为32*32,第一卷积层25输出的特征图e为16*16,第一卷积层26输出的特征图f为8*8;则将特征图f放大到16*16,将放大后的特征图f和特征图e叠加得到第一卷积层25的第二特征图记为特征图e,特征图e为16*16;进一步,将第一卷积层25的第二特征图即特征图e放大到32*32,将放大后的特征图e和特征图d叠加得到第一卷积层24的第二特征图记为特征图d,特征图d为32*32;进一步,将第一卷积层24的第二特征图即特征图d放大到64*64,将放大后的特征图d和特征图c叠加得到第一卷积层23的第二特征图记为特征图c,特征图c为64*64;进一步,将第一卷积层23的第二特征图即特征图c放大到125*125,将放大后的特征图c和特征图b叠加得到第一卷积层22的第二特征图记为特征图b,特征图b为125*125;进一步,将第一卷积层22的第二特征图即特征图b放大到250*250,将放大后的特征图b和特征图a叠加得到第一卷积层21的第二特征图记为特征图a,特征图a为250*250。也就是说,特征图a融合了特征图a、特征图b、特征图c、特征图d、特征图e、特征图f的特征,特征图b融合了特征图b、特征图c、特征图d、特征图e、特征图f的特征,特征图c融合了特征图c、特征图d、特征图e、特征图f的特征,依次类推,特征图e融合了特征图e、特征图f的特征。

本发明实施例通过深度神经网络模型对样本图像中不同大小的人体区域或人体部位区域同时进行识别,避免了对人体区域或人体不同部位区域分别建立模型,使得该深度神经网络模型可以对待检测的目标图像中的人体区域或人体部位区域同时进行识别,提高了人体区域或人体部位区域的识别效率。

另外,本发明实施例还提供一种人体识别方法。该方法具体包括:根据上述实施例所述的模型训练方法训练得到的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。

例如,该人体识别模型具体可以是深度神经网络模型。通过上述实施例所述的模型训练方法,可对该深度神经网络模型的参数不断的更新迭代,直到该深度神经网络模型的参数趋于收敛或稳定时,可认为该深度神经网络模型已被训练好。

在本实施例中,该深度神经网络模型可以是预先训练好的模型,当获取到待检测图像时,根据该深度神经网络模型即可对该待检测图像中的人体区域和/或人体部位区域进行识别。

可以理解,对人体识别模型进行训练的装置或设备,以及对待检测图像中的人体区域和/或人体部位区域进行识别的装置或设备,可以是相同的装置或设备,也可以是不同的装置或设备。

图4为本发明实施例提供的模型训练装置的结构示意图。本发明实施例提供的模型训练装置可以执行模型训练方法实施例提供的处理流程,如图4所示,模型训练装置40包括:第一获取模块41、第二获取模块42、第一确定模块43、第二确定模块44、第三确定模块45和第四确定模块46;其中,第一获取模块41用于获取用于训练人体识别模型的样本图像,所述人体识别模型包括数据层、多个第一卷积层、第一损失层,其中,所述多个第一卷积层中每个第一卷积层引出一个分支,所述分支包括多个第二卷积层和至少一个第二损失层;第二获取模块42用于在所述样本图像依次经过所述多个第一卷积层处理时,获取所述多个第一卷积层中每个第一卷积层输出的第一特征图;第一确定模块43用于根据所述每个第一卷积层输出的第一特征图,确定所述每个第一卷积层对应的第二特征图;第二确定模块44用于根据所述每个第一卷积层对应的第二特征图,以及所述每个第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框,检测所述样本图像中的人体区域或人体部位区域,其中,每个分支检测出的人体区域或人体部位区域与所述分支中与所述第二损失层连接的第二卷积层对应的预设框匹配;第三确定模块45用于根据检测出的所述样本图像中的人体区域或人体部位区域,以及所述样本图像中标注的人体区域或人体部位区域,确定所述人体识别模型的参数。

可选的,距离所述数据层越近的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越小;距离所述数据层越远的第一卷积层引出的分支中与所述第二损失层连接的第二卷积层对应的预设框越大。

可选的,距离所述数据层越近的第一卷积层引出的分支用于检测所述样本图像中越小的人体区域或人体部位区域;距离所述数据层越远的第一卷积层引出的分支用于检测所述样本图像中越大的人体区域或人体部位区域。

可选的,第一确定模块43具体用于:根据所述第一卷积层的下一个第一卷积层输出的第一特征图,以及所述下一个第一卷积层之后的所有第一卷积层输出的第一特征图,确定所述下一个第一卷积层对应的第二特征图;根据所述第一卷积层输出的第一特征图,以及所述下一个第一卷积层对应的第二特征图,确定所述第一卷积层对应的第二特征图。

可选的,第一确定模块43包括:放大单元431、叠加单元432;其中,放大单元431根据所述第一卷积层输出的第一特征图的大小,对所述下一个第一卷积层对应的第二特征图进行放大;叠加单元432用于将所述第一卷积层输出的第一特征图和放大后的所述下一个第一卷积层对应的第二特征图进行叠加得到所述第一卷积层对应的第二特征图。

可选的,所述分支包括多个第二损失层,所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的大小在同一预设范围内,且所述多个第二损失层中每个第二损失层连接的第二卷积层对应的预设框的长宽比不同。

图4所示实施例的模型训练装置可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

另外,本实施例还提供一种人体识别装置,该人体识别装置包括:人体识别模块,用于根据上述实施例所述的人体识别模型,对待检测图像中的人体区域和/或人体部位区域进行识别。可选的,该人体识别模型是根据上述实施例所述的模型训练方法训练得到的模型。

可以理解,模型训练装置和人体识别装置可以集成在同一个设备例如终端设备、服务器中,也可以分别部署在不同的设备中。

图5为本发明实施例提供的一种设备的结构示意图。该设备可以是终端设备,也可以是服务器。本发明实施例提供的设备可以执行模型训练方法和/或人体识别方法实施例提供的处理流程,如图5所示,设备50包括存储器51、处理器52、计算机程序和通讯接口53;其中,计算机程序存储在存储器51中,并被配置为由处理器52执行以上实施例所述的模型训练方法和/或人体识别方法。

图5所示实施例的设备可用于执行上述方法实施例的技术方案,其实现原理和技术效果类似,此处不再赘述。

另外,本实施例还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行以实现上述实施例所述的模型训练方法和/或人体识别方法。

在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域技术人员可以清楚地了解到,为描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。上述描述的装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1