获取识别模型的方法、装置、电子设备及存储介质与流程

文档序号:17589770发布日期:2019-05-03 21:40阅读:168来源:国知局
获取识别模型的方法、装置、电子设备及存储介质与流程

本公开涉及深度学习技术领域,尤其涉及一种获取识别模型的方法、装置、电子设备及存储介质。



背景技术:

随着人工智能的发展,深度学习技术的应用越来越广泛。尤其是在解决从图像中识别身份信息的问题时,通常根据图像识别模型对图像进行身份信息识别。因此,在进行图像识别之前通常需要进行模型训练来建立图像识别模型。例如,通过图像识别模型识别人脸图像中人脸对应的年龄之前,需要进行模型训练,建立人脸年龄识别模型。

相关技术中,在训练图像识别模型的过程中,将年龄切分成几个年龄段,确定多个样本图像在每个年龄段中的概率,基于该多个样本图像在每个年龄段中的概率,对图像识别模型进行训练。

上述相关技术中,在训练识别模型时,直接基于该多个样本图像在每个年龄段中的概率,进行模型训练,会造成模型训练不精确,从而导致训练得到的识别模型的精准度低。



技术实现要素:

本公开提供一种获取识别模型的方法、装置、电子设备及存储介质,可以克服在训练识别模型时,直接基于该多个样本图像在每个年龄段中的概率,进行模型训练,会造成模型训练不精确,从而导致训练得到的识别模型的精准度低的问题。

根据本公开实施例的第一方面,提供了一种获取识别模型的方法,所述方法包括:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定所述样本数据所属的第一身份类别;

根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,所述第一概率为所述样本数据属于所述第二身份类别的概率,所述第二身份类别为所述样本数据实际所属的身份类别;

根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型。

在一种可能的实现方式中,所述根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,包括:

确定所述第一身份类别与所述第二身份类别之间的判别误差;

根据所述判别误差,确定所述第一概率在模型训练过程中的权重,其中,所述判别误差与所述权重成正相关性。

在另一种可能的实现方式中,所述确定所述第一身份类别与所述第二身份类别之间的判别误差,包括:

确定所述第一身份类别的第一类别值和所述第二身份类别的第二类别值;

将所述第一类别值与所述第二类别值之间的差值作为所述第一身份类别与所述第二身份类别之间的判别误差。

在另一种可能的实现方式中,所述根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型后,所述方法还包括:

根据所述第二识别模型,对所述目标数据进行识别,得到所述目标数据对应的身份信息。

在另一种可能的实现方式中,所述根据所述第二识别模型,对所述目标数据进行识别,得到所述目标数据对应的身份信息,包括:

将所述目标数据输入至所述第二识别模型,输出所述目标数据分别属于每个指定身份类别的概率;

将所述目标数据分别属于每个指定身份类别的概率和所述每个指定身份类别对应的身份值进行加权求和,得到所述目标数据对应的身份值。

在另一种可能的实现方式中,所述目标数据为目标对象的图像或者目标对象的音频信号,所述身份值为所述目标对象的年龄。

在另一种可能的实现方式中,所述根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型,包括:

根据所述每个样本数据的第一概率和权重,确定每个指定身份类别的损失值;

根据所述每个指定身份类别的损失值,确定所述第一识别模型的损失值;

当所述损失值满足迭代停止条件时,将所述第一识别模型确定为所述第二识别模型;

当所述损失值不满足迭代停止条件时,更新所述第一识别模型,直到损失值满足迭代停止条件为止,将满足迭代停止条件的第一识别模型确定为所述第二识别模型。

在另一种可能的实现方式中,所述根据第一识别模型,确定所述样本数据所属的第一身份类别,包括:

将所述样本数据输入所述第一识别模型,输出所述样本数据分别属于每个指定身份类别的概率;

从所述样本数据分别属于每个指定身份类别的概率中,选择最大概率;

将所述最大概率对应的指定身份类别确定为所述样本数据所属的第一身份类别。

根据本公开实施例的第二方面,提供了一种获取识别模型的装置,所述装置包括:

第一确定模块,被配置为在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定所述样本数据所属的第一身份类别;

第二确定模块,被配置为根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,所述第一概率为所述样本数据属于所述第二身份类别的概率,所述第二身份类别为所述样本数据实际所属的身份类别;

训练模块,被配置为根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型。

在一种可能的实现方式中,所述第二确定模块,还被配置为确定所述第一身份类别与所述第二身份类别之间的判别误差;根据所述判别误差,确定所述第一概率在模型训练过程中的权重;其中,所述判别误差与所述权重成正相关性。

在另一种可能的实现方式中,所述第二确定模块,还被配置为确定所述第一身份类别的第一类别值和所述第二身份类别的第二类别值;将所述第一类别值与所述第二类别值之间的差值作为所述第一身份类别与所述第二身份类别之间的判别误差。

在另一种可能的实现方式中,所述装置还包括:

识别模块,被配置为根据所述第二识别模型,对所述目标数据进行识别,得到所述目标数据对应的身份信息。

在另一种可能的实现方式中,所述识别模块,还被配置为将所述目标数据输入至所述第二识别模型,输出所述目标数据分别属于每个指定身份类别的概率;将所述目标数据分别属于每个指定身份类别的概率和所述每个指定身份类别对应的身份值进行加权求和,得到所述目标数据对应的身份值。

在另一种可能的实现方式中,所述目标数据为目标对象的图像或者目标对象的音频信号,所述身份值为所述目标对象的年龄。

在另一种可能的实现方式中,所述训练模块,还被配置为根据所述每个样本数据的第一概率和权重,确定每个指定身份类别的损失值;根据所述每个指定身份类别的损失值,确定所述第一识别模型的损失值;当所述损失值满足迭代停止条件时,将所述第一识别模型确定为所述第二识别模型;当所述损失值不满足迭代停止条件时,更新所述第一识别模型,直到损失值满足迭代停止条件为止,将满足迭代停止条件的第一识别模型确定为所述第二识别模型。

在另一种可能的实现方式中,所述第一确定模块,还被配置为将所述样本数据输入所述第一识别模型,输出所述样本数据分别属于每个指定身份类别的概率;从所述样本数据分别属于每个指定身份类别的概率中,选择最大概率;将所述最大概率对应的指定身份类别确定为所述样本数据所属的第一身份类别。

根据本公开实施例的第三方面,提供一种电子设备,所述电子设备包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定所述样本数据所属的第一身份类别;

根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,所述第一概率为所述样本数据属于所述第二身份类别的概率,所述第二身份类别为所述样本数据实际所属的身份类别;

根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型。

根据本公开实施例的第四方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种获取识别模型的方法,所述方法包括:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定所述样本数据所属的第一身份类别;

根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,所述第一概率为所述样本数据属于所述第二身份类别的概率,所述第二身份类别为所述样本数据实际所属的身份类别;

根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型。

根据本公开实施例的第五方面,提供一种应用程序,当应用程序中的指令由电子设备的处理器执行时,使得电子设备能够执行所述一种获取识别模型的方法,所述方法包括:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定所述样本数据所属的第一身份类别;

根据所述样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,所述第一概率为所述样本数据属于所述第二身份类别的概率,所述第二身份类别为所述样本数据实际所属的身份类别;

根据所述样本数据的第一概率和所述权重,对所述第一识别模型进行迭代训练,得到第二识别模型。

本公开的实施例提供的技术方案可以包括以下有益效果:

在本公开实施例中,通过在模型训练的过程中,确定样本数据该的概率最大的第二身份类别,根据第二身份类别和样本数据实际所属的第一身份类别,确定在训练过程中样本数据被识别为实际所属的第一身份类别的第一概率所占的权重。通过对交叉熵损失函数进行改善,使用加权后的第一概率计算样本数据的损失值来进行模型训练,充分考虑了模型训练过程中类与类之间的相关性,从而提高了识别模型的精准度。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种获取识别模型的方法流程图。

图2是根据一示例性实施例示出的一种获取识别模型的方法流程图。

图3是根据一示例性实施例示出的一种获取识别模型的装置的框图。

图4是根据一示例性实施例示出的一种用于获取识别模型的电子设备的框图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种获取识别模型的方法流程图,如图1所示,该获取识别模型的方法包括:

在步骤s101中,在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定该样本数据所属的第一身份类别。

在步骤s102中,根据该样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,该第一概率为该样本数据属于该第二身份类别的概率,该第二身份类别为该样本数据实际所属的身份类别。

在步骤s103中,根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型。

在一种可能的实现方式中,该根据该样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,包括:

确定该第一身份类别与该第二身份类别之间的判别误差;

根据该判别误差,确定该第一概率在模型训练过程中的权重,其中,该判别误差与该权重成正相关性。

在另一种可能的实现方式中,该确定该第一身份类别与该第二身份类别之间的判别误差,包括:

确定该第一身份类别的第一类别值和该第二身份类别的第二类别值;

将该第一类别值与该第二类别值之间的差值作为该第一身份类别与该第二身份类别之间的判别误差。

在另一种可能的实现方式中,根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型后,该方法还包括:

根据该第二识别模型,对该目标数据进行识别,得到该目标数据对应的身份信息。

在另一种可能的实现方式中,该根据该第二识别模型,对该目标数据进行识别,得到该目标数据对应的身份信息,包括:

将该目标数据输入至该第二识别模型,输出该目标数据分别属于每个指定身份类别的概率;

将该目标数据分别属于每个指定身份类别的概率和该每个指定身份类别对应的身份值进行加权求和,得到该目标数据对应的身份值。

在另一种可能的实现方式中,该目标数据为目标对象的图像或者目标对象的音频信号,该身份值为该目标对象的年龄。

在另一种可能的实现方式中,该根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型,包括:

根据该每个样本数据的第一概率和权重,确定每个指定身份类别的损失值;

根据该每个指定身份类别的损失值,确定该第一识别模型的损失值;

当该损失值满足迭代停止条件时,将该第一识别模型确定为该第二识别模型;

当该损失值不满足迭代停止条件时,更新该第一识别模型,直到损失值满足迭代停止条件为止,将满足迭代停止条件的第一识别模型确定为该第二识别模型。

在另一种可能的实现方式中,该根据第一识别模型,确定该样本数据所属的第一身份类别,包括:

将该样本数据输入该第一识别模型,输出该样本数据分别属于每个指定身份类别的概率;

从该样本数据分别属于每个指定身份类别的概率中,选择最大概率;

将该最大概率对应的指定身份类别确定为该样本数据所属的第一身份类别。

在本公开实施例中,通过在模型训练的过程中,确定样本数据该的概率最大的第二身份类别,根据第二身份类别和样本数据实际所属的第一身份类别,确定在训练过程中样本数据被识别为实际所属的第一身份类别的第一概率所占的权重。通过对交叉熵损失函数进行改善,使用加权后的第一概率计算样本数据的损失值来进行模型训练,充分考虑了模型训练过程中类与类之间的相关性,从而提高了识别模型的精准度。

图2是根据一示例性实施例示出的一种获取识别模型的方法流程图,如图2所示,该获取识别模型的方法包括:

在步骤s201中,在训练识别模型的过程中,对于每个样本数据,电子设备根据第一识别模型,确定该样本数据所属的第一身份类别。

在本公开实施例中,电子设备基于第一识别模型和多个样本数据,训练第二识别模型;然后通过第二识别模型识别目标数据对应的身份信息。其中,第一识别模型可以为初始识别模型,也可以为迭代训练过程中的中间识别模型;并且,第一识别模型可以为vgg(visualgeometrygroupnetwork,视觉几何组网络)模型等基于深度学习的神经网络模型。身份信息可以为年龄、性别或者身高等,相应的,身份类别可以为年龄段、性别或者身高范围等。样本数据为已知身份类别的数据;例如,样本数据可以为样本图像或者样本音频信号。相应的,目标数据也可以为目标对象的图像或者目标对象的音频信号。目标对象可以为人或者动物等。

第一身份类别可以为将该样本数据输入该第一识别模型后样本数据输出的概率最大的指定身份类别。相应的,本步骤可以通过以下步骤(1)-(3)实现,包括:

(1)电子设备将该样本数据输入该第一识别模型,输出该样本数据分别属于每个指定身份类别的概率。

电子设备预先设置多个指定身份类别,第一识别模型用于识别输入的样本数据属于每个指定身份类别的概率。在本步骤中,电子设备将该样本数据输入第一识别模型,第一识别模型对该样本数据进行分类识别,第一识别模型输出样本数据被识别为每个指定身份类别的概率。

指定身份类别的数目可以根据身份信息进行设置并更改,在本公开实施例中,对指定身份类别的数目不作具体限定;例如,当身份信息为年龄时,指定身份类别的数目可以为10或者13等。当身份信息为性别时,指定身份类别的数目可以为2。当身份信息为身高时,指定身份类别的数目可以为10。

例如,当身份信息为年龄,多个指定身份类别为多个年龄段,多个年龄段的数量可以为13,多个年龄段分别为0~4,5~9,10~14,15~19,20~24,25~29,30~34,35~39,40~44,45~49,50~54,55~59,大于60。

当身份信息为性别,多个指定身份类别为性别,则多个指定身份类别的数量为2,分别为男和女。

当身份类别的信息为身高,多个指定身份类别为多个身高范围,多个身高范围的数量可以为10,多个身高范围分别为0~100cm,100~110cm,110~120cm,120~130cm,130~140cm,140~150cm,150~160cm,160~170cm,170~180cm,大于180cm。

需要说明的一点是,对于多个样本数据,每个样本数据都按照步骤(1)确定每个样本数据分别属于每个指定身份类别的概率。并且,多个样本数据需要覆盖多个指定身份类别;也即,多个样本数据中需要包括每个指定身份类别的样本数据,并且,对于每个指定身份类别进行样本均衡,保证两个指定身份类别的样本数据的数目相差在2倍以内。也即对于任一两个指定身份类别,其中,第一数量与第二数量之比不大于2,第一数量为一个指定身份类别的样本数据的数量,第二数量为另一个指定身份类别的样本数据的数量。

例如,当身份信息为年龄,多个指定身份类别为多个年龄段,多个年龄段的数量可以为13,多个年龄段分别为0~4,5~9,10~14,15~19,20~24,25~29,30~34,35~39,40~44,45~49,50~54,55~59,大于60。每一类中样本数量可以分别为50,55,60,65,70,75,80,75,70,65,60,55,50。

(2)电子设备从该样本数据分别属于每个指定身份类别的概率中,选择最大概率。

(3)电子设备将该最大概率对应的指定身份类别确定为该样本数据所属的第一身份类别。

在步骤s202中,电子设备确定该第一身份类别与该第二身份类别之间的判别误差。

其中,第二身份类别为该样本数据实际所属的指定身份类别;判别误差用于指示该样本数据被分类到第一身份类别的误差大小。在一种可能的实现方式中,电子设备可以存储每个身份类别之间的判别误差;在本步骤中,电子设备根据第一身份类别和第二身份类别,从已存储的每个身份类别的判别误差中确定第一身份类别与第二身份类别之间的判别误差。

在另一种可能的实现方式中,第一身份类别与第二身份类别之间的判别误差可以根据第一身份类别的第一类别值和该第二身份类别的第二类别值确定;相应的,本步骤可以通过以下步骤(1)-(2)实现,包括:

(1)电子设备确定该第一身份类别的第一类别值和该第二身份类别的第二类别值。

在一种可能的实现方式中,第一类别值可以为第一身份类别的第一类别序号,相应的,第二类别值可以为第二身份类别的第二类别序号。因此,本步骤可以为:电子设备确定第一身份类别的第一类别序号,将第一类别序号确定为第一类别值,确定第二身份类别的第二类别序号,将第二类别序号确定为第二类别值。

在电子设备确定该第一身份类别的第一类别值和该第二身份类别的第二类别值的步骤之前,需要对多个指定身份类别进行编号。其中,对指定身份类别进行编号的编号顺序可以是系统默认的也可以是用户自己定义的,也可以根据指定身份类别的内容进行编号。例如,当该指定身份类别为年龄段时,可以根据指定年龄段中年龄的大小从大到小对指定身份类别进行编号,也可以根据指定年龄段中年龄的大小从小到大对身份类别进行编号。

例如,当身份信息为年龄,多个指定身份类别为多个年龄段,多个年龄段的数量可以为13,多个年龄段分别为0~4,5~9,10~14,15~19,20~24,25~29,30~34,35~39,40~44,45~49,50~54,55~59,大于60。对该13个年龄段根据年龄从小到大进行标号,分别为1,2,3,4,5,6,7,8,9,10,11,12,13。第一身份类别为20~24,则第一类别序号为5,第二身份类别为30~34,则第二类别序号为7。

在另一中可能的实现方式中,第一类别值可以为第一身份类别的数值范围的均值,相应的,第二类别值可以为第二身份类别的数值范围的均值。因此,本步骤可以为:电子设备确定第一身份类别的数值范围的第一均值,将第一均值确定为第一类别值;确定第二身份类别的数值范围的第二均值,将第二均值确定为第二类别值。

例如,指定身份类别为年龄段,第一年龄段的数值范围为:0、1、2、3,则第一类别值为1.5;相应的,第二年龄段的数值范围为:4、5、6、7,则第二类别值为5.5。

(2)电子设备将该第一类别值与该第二类别值之间的差值作为该第一身份类别与该第二身份类别之间的判别误差。

第一类别值与第二类别值之间的差值越大,则第一身份类别与第二身份类别之间的判别误差越大,那么,该样本数据被识别为第一身份类别后误差越大。

例如,当身份信息为年龄,多个指定身份类别为多个年龄段,多个年龄段的数量可以为13,多个年龄段分别为0~4,5~9,10~14,15~19,20~24,25~29,30~34,35~39,40~44,45~49,50~54,55~59,大于60。对该13个年龄段根据年龄从小到大进行标号,分别为1,2,3,4,5,6,7,8,9,10,11,12,13。当第一身份类别为20~24,第二身份类别为30~34时,第一类别序号为5,第二类别序号为7。则第一判别误差为2。当第一身份类别为15~19,第二身份类别为30~34时,第一类别序号为4,第二类别序号为7。则第二判别误差为3。则该样本数据被识别为15~19的误差大于该样本数据被识别为20~24的误差。

在步骤s203中,电子设备根据该判别误差,确定该第一概率在模型训练过程中的权重。

其中,第一概率为该第一概率为该样本数据属于第二身份类别的概率。该判别误差与该权重成正相关性;电子设备可以根据该判别误差,以及判别误差与权重成正相关性的任一算法确定该第一概率在模型训练过程中的权重。例如,该任一算法可以为将判别误差与指定数值求和,该指定数值可以为1、1.1或者1.2等。当该指定数值为1时,电子设备根据该判别误差,通过以下公式一确定该第一概率在模型训练过程中的权重。

公式一:β=(t-j|+1)

其中,β为第一概率在模型训练过程中的权重,|t-j|为第一身份类别和第二身份类别的判别误差,t为第一身份类别,j为第二身份类别。

在本公开实施例中,由于第一身份类别与第二身份类别之间的差值越大,第一身份类别与第二身份类别之间的判别误差越大。通过判别误差给第一概率施加权重,使得第一身份类别与第二身份类别之间的差值越大,该第一概率在模型训练过程中的权重越大。对第一概率进行加权,通过加权后的第一概率计算该样本数据的损失值,当第二身份类别与第一身份类别相差越大,则样本数据被识别为属于第一身份类别的误差越大,该样本数据的损失值越大,进而训练过程中,第一识别模型继续迭代,提高了模型训练的精度,使得识别更加准确。其中,第一概率为样本数据属于该第二身份类别的概率,即第一概率为第一识别模型将样本数据正确识别为第二身份类别的概率。

在步骤s204中,电子设备根据该样本数据的第一概率和该权重,电子设备对该第一识别模型进行迭代训练,得到第二识别模型。

在一种可能的实现方式中,电子设备通过损失函数确定样本数据的损失值,当多个样本数据的损失值之和满足迭代停止条件时,停止迭代,得到第二识别模型。相应的,本过程可以通过以下步骤(1)-(4)实现,包括:

(1)电子设备根据每个样本数据的第一概率和权重,确定每个指定身份类别的损失值。

对于每个指定身份类别,电子设备确定被划分到该指定身份类别的多个第一样本数据;确定第一样本数据的第三数量,根据该第三数量、每个第一样本数据的第一概率和第一概率的权重,通过以下公式二,确定该指定身份类别的损失值。

公式二:

其中,lj为指定身份类别的损失值,n为第三数量,pi(j)为第i个第一样本数据被划分为第j类的第一概率,i为第一样本数据的序号;j为该指定身份类别。

需要说明的一点是,当第一身份类别与第二身份类别相同时,即t=j时,通过以下公式三,确定该指定身份类别的损失值。

公式三:

其中,lj为指定身份类别的损失值,n为第三数量,pi(j)为第i个第一样本数据被划分为第j类的第一概率,i为第一样本数据的序号;j为该指定身份类别。

(2)电子设备根据每个指定身份类别的损失值,电子设备确定该第一识别模型的损失值。

电子设备在步骤(1)中确定了每个指定身份类别的损失值,在本步骤中,电子设备可以将每个指定身份类别的样本损失值进行求和,得到该第一识别模型的损失值。电子设备确定该损失值是否满足迭代停止条件;当该损失值满足迭代停止条件时,执行步骤(3);当该损失值不满足迭代停止条件时,执行步骤(4)。

(3)当该损失值满足迭代停止条件时,电子设备将该第一识别模型确定为该第二识别模型,结束。

在一种可能的实现方式中,该迭代停止条件为第一识别模型的损失值是否小于预设损失值;相应的,当该损失值小于预设损失值时,电子设备确定该损失值满足迭代停止条件;当该损失值不小于预设损失值时,电子设备确定该损失值不满足迭代停止条件,执行步骤(4)。

在另一种可能的实现方式中,迭代停止条件为相邻两次的损失值之间的差值小于预设阈值;相应的,电子设备获取上一次迭代得到的第一识别模型的损失值,确定上一次迭代得到的损失值和本次迭代得到的损失值之间的差值,当该差值小于预设阈值时,确定该损失值满足迭代停止条件;当该差值不小于预设阈值时,电子设备确定该损失值不满足迭代停止条件,执行步骤(4)。

需要说明的一点是,当该损失值满足迭代停止条件时,也即模型训练完成,停止迭代训练,将该第一识别模型确认为第二识别模型。

(4)当该损失值不满足迭代停止条件时,电子设备更新该第一识别模型,直到损失值满足迭代停止条件为止,将满足迭代停止条件的第一识别模型确定为该第二识别模型。

当该损失值不满足迭代停止条件时,电子设备更新第一识别模型,根据多个样本数据和更新后的第一识别模型,进行迭代训练,直到满足迭代停止条件为止。

需要说明的一点是,上述步骤s201至s204中为训练得到第二识别模型的训练过程,该训练过程可以由电子设备完成也可以由服务器完成,本公开对执行训练过程的执行主体不作具体限定。当该训练过程为电子设备完成的时,电子设备存储完成训练后的第二识别模型,当对目标数据进行身份识别时,直接执行步骤205。当该训练过程为服务器完成的时,电子设备对目标数据进行身份识别之前,电子设备需要从服务器中获取该第二识别模型。其中,电子设备从服务器中获取该第二识别模型的过程可以为:

电子设备向服务器发送获取请求,该获取请求中携带电子设备的电子设备标识,并且该获取请求用于获取第二识别而模型;服务器接收电子设备发送的获取请求,根据获取请求中的电子设备标识向该电子设备发送该第二识别模型;电子设备接收该服务器发送的第二识别模型。

需要说明的另一点是,在对目标数据进行分类之前,电子设备仅需要训练一次或者从服务器中获取一次,后续不需要重复进行训练或者重复获取,直接通过该第二识别模型进行身份信息识别即可。

在步骤s205中,当对目标数据进行识别时,电子设备根据该第二识别模型,对目标数据进行识别,得到目标数据对应的身份信息。

目标数据可以为目标对象的图像或者目标对象的音频信号,身份信息可以为年龄、性别或者身高等。电子设备根据目标数据的属于每个指定身份类别的概率和每个指定身份对应的身份值确定该目标数据的类别,相应的,本过程可以通过以下步骤实现,包括:

(1)电子设备将该目标数据输入至该第二识别模型,输出该目标数据分别属于每个指定身份类别的概率。

当该目标数据为目标对象的图像,该身份信息为年龄时,电子设备将该目标对象的图像输入至该第二识别模型,输出该目标对象分别属于每个年龄段的概率。

(2)电子设备将该目标数据分别属于每个指定身份类别的概率和该每个指定身份类别对应的身份值进行加权求和,得到该目标数据对应的身份值。

电子设备将该目标数据分别属于每个指定身份类别的概率和该每个指定身份类别对应的身份值进行加权求和,得到第一数值,基于第一数值确定该目标数据对应的身份值。其中,当第一数值为整数时,电子设备直接将第一数值确定为该目标数据对应的身份值。当第一数值为非整数时,电子设备对第一数值进行上取整,得到该目标数据对应的身份值。

例如,当该目标数据为目标对象的图像,该身份信息为年龄时,电子设备通过以下公式四,将该目标对象分别属于每个年龄段的概率和每个年龄段对应的年龄值进行加权求和,得到该目标对象的年龄。

公式四:

其中,a为该目标对象的年龄,m为年龄段的第四数量,m为第m个年龄段的序号,pm为该目标对象被识别为第m个年龄段的概率,am为第m个年龄段对应的年龄值。

其中,每个指定身份类别对应的身份值可以为每个指定身份类别中数值范围中的最大值、最小值或平均值,本公开对每个指定身份类别对应的身份值不作具体限定。例如,该身份值可以为每个指定身份类别中内容的平均值,该指定身份类别可以为指定年龄段,相应的,第一个指定年龄段的数值范围为0、1、2、3,第二个指定年龄段的数值范围为4、5、6、7,并且该目标数据属于第一个年龄段的概率为0.4,该目标数据属于第二个年龄段的概率为0.6,则输出该目标数据对应的年龄为3.9,对该年龄上取整得,该目标对象的年龄为4。

当该目标数据为目标对象的图像,身份信息为年龄时,在另一种可能的实现方式中,电子设备根据目标对象所属的年龄段,确定该目标对象的年龄。相应的,本步骤可以为:电子设备将该目标对象的图像输入第二识别模型中,得到该目标对象属于每个指定年龄段的概率;从该目标对象属于每个指定年龄段的概率中选择最大概率,将该最大概率对应的年龄段作为该目标对象的年龄段,基于该年龄段,确定该目标对象的年龄。

其中,电子设备可以从该年龄段中随机选择一年龄作为该目标对象的年龄,也可以将该年龄段的最大年龄、最小年龄或者平均年龄作为该目标对象的年龄。

在本公开实施例中,通过在模型训练的过程中,确定样本数据该的概率最大的第二身份类别,根据第二身份类别和样本数据实际所属的第一身份类别,确定在训练过程中样本数据被识别为实际所属的第一身份类别的第一概率所占的权重。通过对交叉熵损失函数进行改善,使用加权后的第一概率计算样本数据的损失值来进行模型训练,充分考虑了模型训练过程中类与类之间的相关性,从而提高了识别模型的精准度。并且,通过该识别模型识别身份信息时,提高了身份信息识别的准确率。

图3是根据一示例性实施例示出的一种获取识别模型的装置的框图,如图3所示,该装置包括:

第一确定模块301,被配置为在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定该样本数据所属的第一身份类别。

第二确定模块302,被配置为根据该样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,该第一概率为该样本数据属于该第二身份类别的概率,该第二身份类别为该样本数据实际所属的身份类别。

训练模块303,被配置为根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型。

在一种可能的实现方式中,该第二确定模块302,还被配置为确定该第一身份类别与该第二身份类别之间的判别误差;根据该判别误差,确定该第一概率在模型训练过程中的权重;其中,该判别误差与该权重成正相关性。

在另一种可能的实现方式中,该第二确定模块302,还被配置为确定该第一身份类别的第一类别值和该第二身份类别的第二类别值;将该第一类别值与该第二类别值之间的差值作为该第一身份类别与该第二身份类别之间的判别误差。

在另一种可能的实现方式中,该装置还包括:

识别模块,被配置为根据该第二识别模型,对该目标数据进行识别,得到该目标数据对应的身份信息。

在另一种可能的实现方式中,该识别模块,还被配置为将该目标数据输入至该第二识别模型,输出该目标数据分别属于每个指定身份类别的概率;将该目标数据分别属于每个指定身份类别的概率和该每个指定身份类别对应的身份值进行加权求和,得到该目标数据对应的身份值。

在另一种可能的实现方式中,该目标数据为目标对象的图像或者目标对象的音频信号,该身份值为该目标对象的年龄。

在另一种可能的实现方式中,该训练模块303,还被配置为根据该每个样本数据的第一概率和权重,确定每个指定身份类别的损失值;根据该每个指定身份类别的损失值,确定该第一识别模型的损失值;当该损失值满足迭代停止条件时,将该第一识别模型确定为该第二识别模型;当该损失值不满足迭代停止条件时,更新该第一识别模型,直到损失值满足迭代停止条件为止,将满足迭代停止条件的第一识别模型确定为该第二识别模型。

在另一种可能的实现方式中,该第一确定模块301,还被配置为将该样本数据输入该第一识别模型,输出该样本数据分别属于每个指定身份类别的概率;从该样本数据分别属于每个指定身份类别的概率中,选择最大概率;将该最大概率对应的指定身份类别确定为该样本数据所属的第一身份类别。

关于上述实施例中获取识别模型的装置,其中各个模块执行操作的具体方式已经在有关该获取识别模型的方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在本公开实施例中,通过在模型训练的过程中,确定样本数据该的概率最大的第二身份类别,根据第二身份类别和样本数据实际所属的第一身份类别,确定在训练过程中样本数据被识别为实际所属的第一身份类别的第一概率所占的权重。通过对交叉熵损失函数进行改善,使用加权后的第一概率计算样本数据的损失值来进行模型训练,充分考虑了模型训练过程中类与类之间的相关性,从而提高了识别模型的精准度。

图4是根据一示例性实施例示出的一种用于获取识别模型的电子设备400的框图。例如,电子设备400可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理等。

参照图4,电子设备400可以包括以下一个或多个组件:处理组件402,存储器404,电力组件406,多媒体组件408,音频组件410,输入/输出(i/o)的接口412,传感器组件414,以及通信组件416。

处理组件402通常控制电子设备400的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件402可以包括一个或多个处理器820来执行指令,以完成上述获取识别模型的方法的全部或部分步骤。此外,处理组件402可以包括一个或多个模块,便于处理组件402和其他组件之间的交互。例如,处理组件402可以包括多媒体模块,以方便多媒体组件408和处理组件402之间的交互。

存储器404被配置为存储各种类型的数据以支持在设备400的操作。这些数据的示例包括用于在电子设备400上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器404可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。

电源组件406为电子设备400的各种组件提供电力。电源组件406可以包括电源管理系统,一个或多个电源,及其他与为电子设备400生成、管理和分配电力相关联的组件。

多媒体组件408包括在该电子设备400和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(lcd)和触摸面板(tp)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。该触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与该触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件408包括一个前置摄像头和/或后置摄像头。当设备400处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件410被配置为输出和/或输入音频信号。例如,音频组件410包括一个麦克风(mic),当电子设备400处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器404或经由通信组件416发送。在一些实施例中,音频组件410还包括一个扬声器,用于输出音频信号。

i/o接口412为处理组件402和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件414包括一个或多个传感器,用于为电子设备400提供各个方面的状态评估。例如,传感器组件414可以检测到设备400的打开/关闭状态,组件的相对定位,例如该组件为电子设备400的显示器和小键盘,传感器组件414还可以检测电子设备400或电子设备400一个组件的位置改变,用户与电子设备400接触的存在或不存在,电子设备400方位或加速/减速和电子设备400的温度变化。传感器组件414可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件414还可以包括光传感器,如cmos或ccd图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件414还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件416被配置为便于电子设备400和其他设备之间有线或无线方式的通信。电子设备400可以接入基于通信标准的无线网络,如wifi,运营商网络(如2g、3g、4g或5g),或它们的组合。在一个示例性实施例中,通信组件416经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,该通信组件416还包括近场通信(nfc)模块,以促进短程通信。

在示例性实施例中,电子设备400可以被一个或多个应用专用集成电路(asic)、数字信号处理器(dsp)、数字信号处理设备(dspd)、可编程逻辑器件(pld)、现场可编程门阵列(fpga)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述获取识别模型的方法。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器404,上述指令可由电子设备400的处理器420执行以完成上述获取识别模型的方法。例如,该非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行一种获取识别模型的方法,方法包括:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定该样本数据所属的第一身份类别;

根据该样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,该第一概率为该样本数据属于该第二身份类别的概率,该第二身份类别为该样本数据实际所属的身份类别;

根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型。

在示例性实施例中,还提供了一种应用程序,当应用程序中的指令由电子设备的处理器执行时,使得电子设备能够执行一种获取识别模型的方法,方法包括:

在训练识别模型的过程中,对于每个样本数据,根据第一识别模型,确定该样本数据所属的第一身份类别;

根据该样本数据所属的第一身份类别和第二身份类别,确定第一概率在模型训练过程中的权重,该第一概率为该样本数据属于该第二身份类别的概率,该第二身份类别为该样本数据实际所属的身份类别;

根据该样本数据的第一概率和该权重,对该第一识别模型进行迭代训练,得到第二识别模型。

本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1