一种模型训练、信息预测方法及装置与流程

文档序号:17374029发布日期:2019-04-12 23:06阅读:198来源:国知局
一种模型训练、信息预测方法及装置与流程

本申请涉及信息处理技术领域,特别是涉及一种模型训练、信息预测方法及装置。



背景技术:

近年来人工智能技术在各个领域得到了广泛的应用,应用过程中为了满足各个领域的需求需要进行特征点预测。例如,为了实现人脸角度矫正、人脸姿态分析等等,需要预测图像中人脸的特征点,也就是,人脸关键点。

以预测图像中人脸关键点为例,现有技术中通常采用基于卷积神经网络的人脸关键点预测模型进行人脸关键点预测。也就是,将需要预测人脸关键点的图像作为上述模型的输入信息,输入至上述模型,该模型对上述图像进行人脸关键点预测后,输出预测得到的人脸关键点。

然而现有技术中上述模型往往仅输出预测得到的人脸关键点,不输出预测得到的人脸关键点的置信度,使得用户难以了解到预测结果的可靠程度。



技术实现要素:

本申请实施例的目的在于提供一种模型训练、信息预测方法及装置,以在预测图像中特征点的同时预测特征点的置信度。具体技术方案如下:

第一方面,本申请实施例提供了一种模型训练方法,所述方法包括:

获得样本图像和所述样本图像中的基准特征点;

采用信息预测模型对所述样本图像进行特征点和置信度预测,得到所述样本图像中的预测特征点以及所述预测特征点的预测置信度confpredict,其中,所述信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,所述置信度输出项用于输出所述信息预测模型所预测出特征点的置信度;

计算所述预测特征点相对于所述基准特征点的第一损失losslandmark;

采用losslandmark估算所述基准特征点的基准置信度confgroudtruth;

计算confpredict相对于confgroudtruth的第二损失lossconfidence;

根据losslandmark和lossconfidence,计算采用信息预测模型对所述样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

根据losstotal调整所述信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的所述样本图像中特征点的置信度向confgroudtruth靠拢,实现对所述信息预测模型的训练。

第二方面,本申请实施例提供了一种信息预测方法,所述方法包括:

获得待预测图像;

采用上述第一方面所述的方法训练后的信息预测模型对所述待预测图像进行特征点和置信度预测,得到所述待预测图像中的特征点和所得到特征点的置信度。

第三方面,本申请实施例提供了一种模型训练装置,所述装置包括:

基准特征点获得模块,用于获得样本图像和所述样本图像中的基准特征点;

预测特征点获得模块,用于采用信息预测模型对所述样本图像进行特征点和置信度预测,得到所述样本图像中的预测特征点以及所述预测特征点的预测置信度confpredict,其中,所述信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,所述置信度输出项用于输出所述信息预测模型所预测出特征点的置信度;

第一损失计算模块,用于计算所述预测特征点相对于所述基准特征点的第一损失losslandmark;

置信度估算模块,用于采用losslandmark估算所述基准特征点的基准置信度confgroudtruth;

第二损失计算模块,用于计算confpredict相对于confgroudtruth的第二损失lossconfidence;

总损失计算模块,用于根据losslandmark和lossconfidence,计算采用信息预测模型对所述样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

模型训练模块,用于根据losstotal调整所述信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的所述样本图像中特征点的置信度向confgroudtruth靠拢,实现对所述信息预测模型的训练。

第四方面,本申请实施例提供了一种信息预测装置,所述装置包括:

图像获得模块,用于获得待预测图像;

信息预测模块,用于采用上述第三方面所述装置训练后的信息预测模型对所述待预测图像进行特征点和置信度预测,得到所述待预测图像中的特征点和所得到特征点的置信度。

第五方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述第一方面所述的方法步骤。

第六方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现上述第一方面所述的方法步骤。

第七方面,本申请实施例提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现上述第二方面所述的方法步骤。

第八方面,本申请实施例提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现上述第二方面所述的方法步骤。

由以上可见,本申请实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用本申请实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种模型训练方法的流程示意图;

图2a为本申请实施例提供的一种转换关系的示意图;

图2b为本申请实施例提供的另一种转换关系的示意图;

图3为本申请实施例提供的一种信息预测方法的流程示意图;

图4为本申请实施例提供的一种模型训练装置的结构示意图;

图5为本申请实施例提供的一种信息预测装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

由于现有技术中存在预测图像中特征点时,不能一并得到所预测出特征点的置信度的问题,为解决这一技术问题,本申请实施例提供了一种模型训练、信息预测方法及装置。

本申请的一个实施例中,提供了一种模型训练方法,该方法包括:

获得样本图像和样本图像中的基准特征点;

采用信息预测模型对样本图像进行特征点和置信度预测,得到样本图像中的预测特征点以及预测特征点的预测置信度confpredict,其中,信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,置信度输出项用于输出信息预测模型所预测出特征点的置信度;

计算预测特征点相对于基准特征点的第一损失losslandmark;

采用losslandmark估算基准特征点的基准置信度confgroudtruth;

计算confpredict相对于confgroudtruth的第二损失lossconfidence;

根据losslandmark和lossconfidence,计算采用信息预测模型对样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

根据losstotal调整信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的样本图像中特征点的置信度向confgroudtruth靠拢,实现对信息预测模型的训练。

由以上可见,本实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用本实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

下面先通过具体实施例对本申请实施例提供的模型训练方法进行说明。

图1为本申请实施例提供的一种模型训练方法的流程示意图,该方法包括:

s101:获得样本图像和样本图像中的基准特征点。

上述样本图像中的基准特征点可以理解为:样本图像中的特征点,这些特征点作为后续模型训练过程中所预测出特征点的基准点,为便于表述,本申请实施例中称为基准特征点。

在不同的应用场景下上述特征点的具体含义不同。例如,基于人脸的应用场景中,上述特征点可以为人脸关键点,如,表示人的五官的点等;基于人体的应用场景中,上述特征点可以为人体关键点,如,表示人的四肢的点等;基于车牌的应用场景中,上述特征点可以为车牌特征点,如,表示车牌的轮廓点等。

具体的,上述样本图像中的基准特征点可以是开发人员按照自己的理解标注出来的样本图像中表示图像特征的点。

s102:采用信息预测模型对样本图像进行特征点和置信度预测,得到样本图像中的预测特征点以及预测特征点的预测置信度confpredict。

其中,信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,置信度输出项用于输出信息预测模型所预测出特征点的置信度。

上述预测特征点可以理解为:采用信息预测模型对样本图像进行特征点预测所预测出的特征点,为便于表述,本申请实施例中称为预测特征点。

上述预测特征点的预测置信度confpredict是指:采用信息预测模型预测出的预测特征点的置信度,为便于表述,本申请实施例中称为预测置信度。

由于信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,而特征点预测模型是用于预测图像中特征点的模型,因此,上述信息预测模型也是能够预测图像中特征点的模型。另外,在特征点预测模型中增加置信度输出项后,则能够输出所预测出特征点的置信度,也就是信息预测模型能够预测置信度了。

上述特征点预测模型可以是基于神经网络的模型,所以上述信息预测模型也可以是基于神经网络的模型,例如,基于卷积神经网络的模型等等。

s103:计算预测特征点相对于基准特征点的第一损失losslandmark。

若采用信息预测模型对样本图像进行特征点预测所得预测特征点与基准特征点一致,则说明采用信息预测模型所预测的特征点较为准确,若两者不一致,则说明采用信息预测模型所预测的特征点不够准确,这种情况下,上述预测特征点相对于基准特征点存在损失,称之为第一损失,以losslandmark表示。

本申请的一个实施例中,计算预测特征点相对于基准特征点的第一损失losslandmark时,可以先计算每一预测特征点与该预测特征点对应的基准特征点之间的距离之和,然后根据预测特征点计算损失调整值,根据计算得到的和值与损失调整值,计算预测特征点相对于基准特征点的第一损失losslandmark。

本申请的一种实现方式中,上述每一预测特征点与该预测特征点对应的基准特征点之间的距离具体可以是预测特征点和基准特征点之间的欧氏距离。

本申请的另一种实现方式中,在上述特征点为人脸关键点的情况下,上述损失调整值包括:样本图像中人脸的眼间距和/或轮廓对角线长度。

本申请的再一种实现方式中,根据上述计算得到的和值和损失调整值,计算预测特征点相对于基准特征点的第一损失losslandmark时,可以用计算得到的和值除以上述损失调整值,得到的结果作为预测特征点相对于基准特征点的第一损失losslandmark。

例如,上述损失调整值为样本图像中人脸的眼间距时,losslandmark可以等于计算得到的和值除以上述眼间距。

由于各个样本图像的大小是不一样的、内容存在差异,所以计算得到的和值所属范围可能不同,且同一和值所表示的损失程度也可能有所差异,例如,样本图像1中人脸区域较大,样本图像2中人脸区域较小,假设,两样本图像对应的计算得到的和值相等,则样本图像1的损失程度较小,而样本图像2的损失程度较大。鉴于此,采用预测特征点计算损失调整值后,根据损失调整值和计算得到的和值一起计算losslandmark,可以将不同的样本图像对应的计算得到的和值同一至一个相同的判别标准下,减轻图像大小、内容等因素对losslandmark的影响。

s104:采用losslandmark估算基准特征点的基准置信度confgroudtruth。

由于置信度与特征点不同,特征点对应于图像中实实在在的点,而置信度在图像中并不存在直接对应的点,属于抽象概念,因此开发人员难以直接通过人工方式进行标注。基于此,本申请实施例中采用估算的方式获得基准特征点的置信度,也就是上述基准特征点的基准置信度。

鉴于上述情况,本申请的一个实施例中,采用losslandmark估算基准特征点的基准置信度confgroudtruth时,可以按照预设的第二转换关系,确定losslandmark对应的数值作为预测特征点的基准置信度confgroudtruth;

其中,上述预设的第二转换关系满足以下条件:

输入值的取值范围为[0,+∞),输出值的取值范围为(0,1];

输入值为0时,输出值为1;

输入值趋于+∞时,输出值趋于0;

输出值随输入值增加呈现单调递减的变化趋势。

由于上述第二转换关系满足的条件中输入值的取值范围为[0,+∞),输出值的取值范围为(0,1],在坐标系中用于表示上述第二转换关系的曲线只存在于坐标系中的第一象限。

当然,上述输出值的取值范围也可以扩大若干倍数,所扩大的若干倍数可以由开发人员根据具体情况确定,例如,扩大100倍,则输出值的取值范围为(0,100]等。相应的输入值为0时,输出值也扩大上述若干倍数,例如,扩大100时,输入值为0的情况下,输出值为100。

如图2a,示出了上述第二转换关系的一种示意图。

本申请的一种实现方式中,上述第二转换关系可以为:f(x)=2/(1+exp(βx))。

其中,f(x)表示上述第二转换关系,exp()表示以e为底的指数函数,β为预设的超参数。上述β的取值可以为2等,x表示输入值。

s105:计算confpredict相对于confgroudtruth的第二损失lossconfidence。

由于confgroudtruth表示的是采用信息预测模型对样本图像进行特征点预测所得到预测特征点的基准置信度,而confpredict表示的是预测置信度,若两者一致,则说明采用信息预测模型所预测的置信度较为准确,若不一致则说明采用信息预测模型所预测的置信度不够准确,也就是confpredict相对于confgroudtruth存在损失,称之为第二损失,以lossconfidence表示。

为防止图像大小、图像内容等因素导致confpredict所属范围存在差异,进而对计算得到的lossconfidence带来影响,本申请的一个实施例中,计算confpredict相对于confgroudtruth的第二损失lossconfidence时,可以先对confpredict进行归一化处理,获得归一化后的置信度confnomalized,再计算confnomalized相对于confgroudtruth的损失,作为第二损失lossconfidence。

具体的,对confpredict进行归一化处理,获得归一化后的置信度confnomalized时,可以根据预设的第一转换关系,对confpredict进行归一化处理,获得归一化后的置信度confnomalized;

其中,预设的第一转换关系满足以下条件:

输入值的取值范围为(-∞,+∞),输出值的取值范围为(0,1];

输入值为第一预设值时,输出值为1;

输入值趋于-∞或+∞时,输出值趋于0;

第一预设值左侧的各个输入值对应的输出值随着输入值减小呈现递减趋势,第二预设值右侧的各个输入值对应输出值随着输入值增加呈现递减趋势;

第一预设值左右两侧的输入值对应的输出值,沿输入值等于第一预设值所在直线呈对称分布。

当然,上述输出值的取值范围也可以扩大若干倍数,所扩大的若干倍数可以由开发人员根据具体情况确定,例如,扩大100倍,则输出值的取值范围为(0,100]等。相应的输入值为第一预设值时,输出值也扩大上述若干倍数,例如,扩大100时,输入值为第一预设值的情况下,输出值为100。

上述第一预设值可以根据实际应用情况进行设定。

如图2b,示出了上述第一转换关系的一种示意图。

本申请的一种实现方式中,上述第一转换关系可以为:n(x)=exp(-γ(x-x0)2)。

其中,n(x)表示上述第一转换关系,γ表示预设的超参数,例如,γ的取值可以为0.5等,x表示输入值,x0表示上述第一预设值,例如,x0的取值可以为0。

本申请的一个实施例中,计算confnomalized相对于confgroudtruth的损失时,可以根据预设的第三转换关系进行计算。具体的,上述第三转换关系可以为以欧氏距离表示的转换关系、以欧氏距离的平方表示的转换关系等等。也就是,将confnomalized与confgroudtruth之间的欧氏距离作为confnomalized相对于confgroudtruth的损失,或者将confnomalized与confgroudtruth之间欧氏距离的平方作为confnomalized相对于confgroudtruth的损失。

s106:根据losslandmark和lossconfidence,计算采用信息预测模型对样本图像进行特征点和置信度预测过程中产生的总损失losstotal。

根据losslandmark和lossconfidence计算上述losstotal时,可以为losslandmark和lossconfidence计算上述losstotal设置不同的加权系数,然后通过加权计算得到losstotal。

例如,losstotal=λ1*losslandmark+λ2*lossconfidence。

其中,λ1和λ2为加权系数,λ1的取值可以为1,λ2的取值可以为预设的超参数。本申请仅仅以此为例进行说明,并不对本申请构成限定。

s107:根据losstotal调整信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的样本图像中特征点的置信度向confgroudtruth靠拢,实现对信息预测模型的训练。

调整信息预测模型的网络参数时,可以包括调整信息预测模型中与置信度输出项相关的网络参数,还可以包括调整信息预测模型中与特征点输出项相关的网络参数。

信息预测模型中包含很多网络参数,其中,一部分网络参数会与置信度输出项相关,也就是一部分网络参数会影响置信度输出项的输出结果,这些参数被称之为与置信度输出项相关的网络参数。

一部分网络参数会与特征点预测相关,也就是一部分网络参数会影响特征点预测结果,从而影响特征点输出项的输出结果,这些参数被称之为与特征点输出项相关的网络参数。

在调整信息预测模型的网络参数时,可以按照梯度下降法进行迭代,实现网络参数的调整。

由以上可见,上述各个实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述各个实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

本申请的一个实施例中,参见图3提供了一种信息预测方法的流程示意图,该方法包括:

s301:获得待预测图像。

s302:采用上述信息预测模型对待预测图像进行特征点和置信度预测,得到待预测图像中的特征点和所得到特征点的置信度。

由于上述信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述信息预测模型对待预测图像进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与上述模型训练方法相对应,本申请实施例还提供了一种模型训练装置。

图4为本申请实施例提供的一种模型训练装置的结构示意图,该装置包括:

基准点获得模块401,用于获得样本图像和所述样本图像中的基准特征点;

预测点获得模块402,用于采用信息预测模型对所述样本图像进行特征点和置信度预测,得到所述样本图像中的预测特征点以及所述预测特征点的预测置信度confpredict,其中,所述信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,所述置信度输出项用于输出所述信息预测模型所预测出特征点的置信度;

第一损失计算模块403,用于计算所述预测特征点相对于所述基准特征点的第一损失losslandmark;

置信度估算模块404,用于采用losslandmark估算所述基准特征点的基准置信度confgroudtruth;

第二损失计算模块405,用于计算confpredict相对于confgroudtruth的第二损失lossconfidence;

总损失计算模块406,用于根据losslandmark和lossconfidence,计算采用信息预测模型对所述样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

模型训练模块407,用于根据losstotal调整所述信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的所述样本图像中特征点的置信度向confgroudtruth靠拢,实现对所述信息预测模型的训练。

本申请的一个实施例中,所述第一损失计算模块403可以包括:

距离计算单元,用于计算每一所述预测特征点与该预测特征点对应的基准特征点之间的距离之和;

调整值计算单元,用于根据所述预测特征点计算损失调整值;

第一损失计算单元,用于根据计算得到的和值与所述损失调整值,计算所述预测特征点相对于所述基准特征点的第一损失losslandmark。

本申请的一个实施例中,所述第一损失计算单元,具体用于将计算得到的和值除以所述损失调整值得到的结果确定为所述预测特征点相对于所述基准特征点的第一损失losslandmark。

本申请的一个实施例中,所述第二损失计算模块405可以包括:

归一化处理单元,用于对confpredict进行归一化处理,获得归一化后的置信度confnomalized;

第二损失计算单元,用于计算confnomalized相对于confgroudtruth的损失,作为第二损失lossconfidence。

本申请的一个实施例中,所述第二损失计算单元,具体用于计算confnomalized与confgroudtruth之间的欧氏距离或者计算confnomalized与confgroudtruth之间欧氏距离的平方,并将计算结果确定为confnomalized相对于confgroudtruth的损失,作为第二损失lossconfidence。

本申请的一个实施例中,所述归一化处理单元可以具体用于根据预设的第一转换关系,对confpredict进行归一化处理,获得归一化后的置信度confnomalized;

其中,所述预设的第一转换关系满足以下条件:

输入值的取值范围为(-∞,+∞),输出值的取值范围为(0,1];

输入值为第一预设值时,输出值为1;

输入值趋于-∞或+∞时,输出值趋于0;

所述第一预设值左侧的各个输入值对应的输出值随着输入值减小呈现递减趋势,所述第二预设值右侧的各个输入值对应输出值随着输入值增加呈现递减趋势;

所述第一预设值左右两侧的输入值对应的输出值,沿输入值等于第一预设值所在直线呈对称分布。

本申请的一个实施例中,所述置信度估算模块404可以具体用于按照预设的第二转换关系,确定losslandmark对应的数值作为所述预测特征点的基准置信度confgroudtruth;

其中,所述预设的第二转换关系满足以下条件:

输入值的取值范围为[0,+∞),输出值的取值范围为(0,1];

输入值为0时,输出值为1;

输入值趋于+∞时,输出值趋于0;

输出值随输入值增加呈现单调递减的变化趋势。

由以上可见,上述各个实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述各个实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与上述信息预测方法相对应,本申请实施例还提供了一种信息预测装置。

图5为本申请实施例提供的一种信息预测装置的结构示意图,该装置包括:

图像获得模块501,用于获得待预测图像;

信息预测模块502,用于采用上述信息预测模型对所述待预测图像进行特征点和置信度预测,得到所述待预测图像中的特征点和所得到特征点的置信度。

由于上述信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述信息预测模型对待预测图像进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与前述模型训练方法相对应,本申请实施例还提供了一种电子设备,包括:处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本申请实施例所述的模型训练方法步骤。

本申请的一个实施例中,提供了一种模型训练方法,包括:

获得样本图像和所述样本图像中的基准特征点;

采用信息预测模型对所述样本图像进行特征点和置信度预测,得到所述样本图像中的预测特征点以及所述预测特征点的置信度confpredict,其中,所述信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,所述置信度输出项用于输出所述信息预测模型所预测出特征点的置信度;

计算所述预测特征点相对于所述基准特征点的第一损失losslandmark;

采用losslandmark估算所述基准特征点的基准置信度confgroudtruth;

计算confpredict相对于confgroudtruth的第二损失lossconfidence;

根据losslandmark和lossconfidence,计算采用信息预测模型对所述样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

根据losstotal调整所述信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的所述样本图像中特征点的置信度向confgroudtruth靠拢,实现对所述信息预测模型的训练。

需要说明的是,上述处理器被机器可执行指令促使实现的模型训练方法的其他实施例,与前述方法实施例部分提及的实施例相同,这里不再赘述。

由以上可见,本实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用本实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与前述模型训练方法相对应,本申请实施例还提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的模型训练方法步骤。

本申请的一个实施例中,提供了一种模型训练方法,包括:

获得样本图像和所述样本图像中的基准特征点;

采用信息预测模型对所述样本图像进行特征点和置信度预测,得到所述样本图像中的预测特征点以及所述预测特征点的置信度confpredict,其中,所述信息预测模型为:在特征点预测模型中增加置信度输出项而得到的模型,所述置信度输出项用于输出所述信息预测模型所预测出特征点的置信度;

计算所述预测特征点相对于所述基准特征点的第一损失losslandmark;

采用losslandmark估算所述基准特征点的基准置信度confgroudtruth;

计算confpredict相对于confgroudtruth的第二损失lossconfidence;

根据losslandmark和lossconfidence,计算采用信息预测模型对所述样本图像进行特征点和置信度预测过程中产生的总损失losstotal;

根据losstotal调整所述信息预测模型的网络参数,使得调整参数后的信息预测模型预测出的所述样本图像中特征点的置信度向confgroudtruth靠拢,实现对所述信息预测模型的训练。

需要说明的是,上述机器可执行指令促使处理器实现的模型训练方法的其他实施例,与前述方法实施例部分提及的实施例相同,这里不再赘述。

由以上可见,本实施例提供的方案中,信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用本实施例提供的方案训练得到的模型进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与前述信息预测方法相对应,本申请实施例还提供了一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器被所述机器可执行指令促使:实现本申请实施例所述的信息预测方法步骤。

本申请的一个实施例中,提供了一种信息预测方法,包括:

获得待预测图像;

采用前述模型训练方法实施例中训练后的信息预测模型对所述待预测图像进行特征点和置信度预测,得到所述待预测图像中的特征点和所得到特征点的置信度。

由于上述信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述信息预测模型对待预测图像进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

与前述信息预测方法相对应,本申请实施例还提供了一种机器可读存储介质,存储有机器可执行指令,在被处理器调用和执行时,所述机器可执行指令促使所述处理器:实现本申请实施例所述的信息预测方法步骤。

本申请的一个实施例中,提供了一种信息预测方法,包括:

获得待预测图像;

采用前述模型训练方法实施例中训练后的信息预测模型对所述待预测图像进行特征点和置信度预测,得到所述待预测图像中的特征点和所得到特征点的置信度。

由于上述信息预测模型是在特征点预测模型中增加置信度输出项而得到的模型,所以信息预测模型能够实现对图像中特征点的预测,且能够实现对所预测出的特征点的置信度预测;除此之外,还采用上述预测出的置信度、预测出的特征点、样本图像中的基准特征点对信息预测模型进行训练,使得信息预测模型的置信度输出项输出的置信度向基准置信度靠拢,从而使得信息预测模型预测的置信度越来越准确。因此,应用上述信息预测模型对待预测图像进行信息预测时,在预测图像中特征点的同时预测特征点的置信度,使得用户能够了解到预测结果的可靠程度。

需要说明的是,上述机器可读存储介质可以包括随机存取存储器(randomaccessmemory,ram),也可以包括非易失性存储器(non-volatilememory,nvm),例如至少一个磁盘存储器。可选的,上述机器可读存储邂还可以是至少一个位于远离前述处理器的存储装置。

上述的处理器可以是通用处理器,包括中央处理器(centralprocessingunit,cpu)、网络处理器(networkprocessor,np)等;还可以是数字信号处理器(digitalsignalprocessing,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现场可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于装置、电子设备和机器可读存储介质实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的较佳实施例而已,并非用于限定本申请的保护范围。凡在本申请的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本申请的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1