目标任务训练方法及系统与流程

文档序号:14653896发布日期:2018-06-08 22:38阅读:423来源:国知局
目标任务训练方法及系统与流程

本发明涉及计算机应用技术领域,特别涉及一种目标任务训练方法及系统。



背景技术:

随着技术的发展,深度学习逐渐成为机器学习和计算机视觉领域的主流方法,广泛应用在图像分类、目标检测、人脸检测、人脸识别,以及声音识别和自然语言处理等诸多领域,效果相比传统方法都有很大的提升。

采用深度学习方法最直观的方式是,针对每个任务分别进行训练,训练工作量、训练时间和实际应用时的算法耗时,都与任务个数相关,增加训练周期。另外,任务与任务之间是相关的,单独训练不能有效的利用各个属性任务之间的关联。举例来说,比如,长头发和性别女生之间的关联,以及年龄和性别之间的独立性。但是,这依赖于实施者的经验和偏好,如果预先没有足够的相关经验,在任务数量多(比如40个任务)时,任务之间的组合空间会非常大,不可能去遍历尝试,来找到最优组合。因此,如果每个任务单独进行训练,在实际应用时,不但算法预测耗时和任务个数线性相关,而且也增加了训练时间和预处理的工作量。



技术实现要素:

本发明旨在至少解决上述技术问题之一。

为此,本发明的一个目的在于提出一种目标任务训练方法,该方法能够对多个任务进行分组实现联合训练,从而减少了训练和应用的工作量和算法耗时,提高了训练效果。

一种目标任务训练方法,包括以下步骤:

获取目标任务对应的判别阈值;

根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性;

利用所述样本准确性,确定所述目标任务与其他任务之间的关联性,其中,其他任务是除目标任务以外的待训练任务或已训练完成的任务;

根据所述关联性,对所述目标任务进行训练。

可选地,获取目标任务对应的判别阈值,包括:

获取目标任务中的多个属性样本;

计算目标任务中多个属性样本的预测偏差,及所述多个属性样本的预测偏差的平均值;

根据所述预测偏差的平均值,确定判别阈值。

可选地,获取目标任务的判别阈值,还包括:

对所述判别阈值进行修正,具体为:

mTH'=α×mTH+(1-α)×ref

其中,mTH’为修正后的判别阈值,mTH为修正前的所述判别阈值,ref为修正参考值,α为调整幅度。

可选地,所述预测偏差为所述属性样本的预测置信度和真实值的差值的绝对值,根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性,包括:

计算每个属性样本的正确率的概率值;

当所述概率值小于等于所述判别阈值时,所述样本准确性为正确;

当所述概率值大于所述判别阈值时,所述样本准确性为错误。

可选地,利用所述样本准确性,确定所述目标任务与其他任务之间的关联性,包括:

利用所述属性样本的样本准确性,对所述目标任务和其他任务进行分组;

针对分组后的所述目标任务和其他任务进行关联性分析;

根据所述关联性分析的结果,确定所述目标任务与其他任务之间的关联性。

可选地,根据所述关联性,对所述目标任务进行训练,包括:

根据所述关联性,将所述目标任务的属性样本的正确率的概率值,分别与其他任务属性样本的正确率的概率值进行比较;

根据比较结果,构建所述目标任务的分类器。

本发明的另一个目的在于提出一种目标任务训练系统。

为了实现上述目的,本发明第二方面的实施例提出了一种目标任务训练系统,包括:

获取模块,用于获取目标任务对应的判别阈值;

判别模块,用于根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性;

确定模块,用于利用所述样本准确性,确定所述目标任务与其他任务之间的关联性,其中,其他任务是除目标任务以外的待训练任务或已训练完成的任务;

训练模块,用于根据所述关联性,对所述目标任务进行训练。

可选地,所述获取模块,包括:

获取子模块,用于获取目标任务中的多个属性样本;

计算子模块,用于计算目标任务中多个属性样本的预测偏差,及所述多个属性样本的预测偏差的平均值;

确定子模块,用于根据所述预测偏差的平均值,确定判别阈值。

可选地,还包括:

修正模块,用于对所述判别阈值进行修正,具体为:

mTH'=α×mTH+(1-α)×ref

其中,mTH’为修正后的判别阈值,mTH为修正前的所述判别阈值,ref为修正参考值,α为调整幅度。

可选地,所述判别模块,用于所述预测偏差为所述属性样本的预测置信度和真实值的差值的绝对值,根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性,包括:

计算子模块,用于计算每个属性样本的正确率的概率值,当所述概率值小于等于所述判别阈值时,所述样本准确性为正确;当所述概率值大于所述判别阈值时,所述样本准确性为错误。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是根据本发明一个实施例的目标任务训练方法的流程图;

图2是根据本发明一个实施例的目标任务训练系统的结构框图。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性。

在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。

以下结合附图描述根据本发明实施例的目标任务训练方法及系统。

图1是根据本发明一个实施例的目标任务训练方法的流程图。如图1所示,该方法包括以下步骤:

步骤S1:获取目标任务对应的判别阈值。

其中,目标任务可以是针对人脸、人物行为、车辆行为或车体标识等图像识别过程中的识别任务,也可以是人物属性(性别、年龄、民族、表情、眼镜、长短发等)或各种类型的声音识别任务,对此本发明不做任何限制。

其中,可以同时获取多个目标任务,也可以将获取的多个目标任务设置为一个目标任务组,对此本发明统称为目标任务。进一步地可确定出每个目标任务所对应的判别阈值;通过获取目标任务对应判别阈值,分别计算目标任务中多个属性样本中每个属性样本的预测偏差;将该预测偏差的平均值作为目标任务对应的判别阈值。

具体地,获取目标任务对应的判别阈值可以通过下述方式实现:

首先,获取目标任务中的多个属性样本;然后,计算目标任务中多个属性样本的预测偏差,及所述多个属性样本的预测偏差的平均值;最后,根据所述预测偏差的平均值,确定目标任务的判别阈值。其中,目标任务的多个属性样本可以是目标任务的属性样本,例如,图像识别中的人脸属性(长脸、长发、表情等)、人物行为的中人物的具体属性(男性、女性、年龄、民族等)。

进一步地,对确定目标任务的判别阈值进行修正可以通过下述方式实现:

mTH'=α×mTH+(1-α)×ref

其中,mTH’为修正后的判别阈值,mTH为修正前的所述判别阈值,ref为修正参考值,α为调整幅度。

进一步地,目标任务中的多个属性样本中的每一个属性样本的预测偏差,可以通过每一个属性样本的预测置信度和真实值的差值的绝对值来得到;即,如果属性样本的预测偏差大于对应目标任务对应的判别阈值,则可以判断所述属性样本正确,否则,判断所述属性样本错误。

步骤S2:根据目标任务对应的判别阈值,确定目标任务中多个属性样本的样本准确性。

具体地,确定目标任务中多个属性样本的样本准确性可以进一步利用步骤S1中所提到的预测偏差和目标任务对应的判别阈值来确定多个属性样本的样本准确性。进一步地,可通过计算每个属性样本的正确率的概率值来确定目标任务中多个属性样本的样本准确性;即,当所述概率值小于等于所述判别阈值时,所述样本准确性为正确;当所述概率值大于所述判别阈值时,所述样本准确性为错误。

其中,预测偏差属性样本的预测置信度(0~1之间)和真实值(0或1)的差值的绝对值,则根据每个任务的判别阈值分别对相应任务中多个属性样本的样本准确性进行判别,进一步包括:如果属性样本的预测偏差大于对应任务的判别阈值,则判断属性样本的样本准确性为正确,否则,判断属性样本的样本准确性为错误。

具体地说,即将预测置信度(0~1之间)到属性样本的真实标签(0或1)差异的绝对值作为预测偏差;然后针对每个任务,在整个属性样本集上统计预测偏差的均值,作为区分预测结果是否正确的分界点,即该任务的判别阈值;然后,根据该判别阈值,判断在该属性上的每个属性样本是否判别正确,如果属性样本的预测偏差大于对应任务的判别阈值,则判断目标任务的属性样本的样本准确性为正确,否则,判断目标任务的属性样本的样本准确性为错误。

步骤S3:利用目标任务中多个属性样本的样本准确性,确定目标任务与其他任务之间的关联性。

其中,其他任务是除目标任务以外的待训练任务或已训练完成的任务。

具体地,可以利用目标任务的多个属性样本的样本准确性,对目标任务和其他任务进行分组;针对分组后的所述目标任务和其他任务进行关联性分析;根据所述关联性分析的结果,确定目标任务与其他任务之间的关联性。

进一步地,针对目标任务和其他任务进行关联性分析,可以采用确定目标任务的多个属性样本的样本准确性相同方式,得到其他任务的多个属性样本的样本准确性,然后,根据目标任务的多个属性样本的样本准确性,和其他任务的多个属性样本的样本准确性得到概率分布,通过该概率分布得到目标任务和其他任务进行关联性分析(具体应用可见下述举例分析)。

步骤S4:根据目标任务与其他任务之间的关联性,对目标任务进行训练。

具体而言,根据目标任务与其他任务之间的关联性,将所述目标任务的属性样本的正确率的概率值,分别与其他任务属性样本的正确率的概率值进行比较;根据比较结果,构建所述目标任务的分类器。

在本发明的一个实施例中,可以对目标任务进行分组,至少包括第一任务组和第二任务组,第一任务组对应的相关性高于预设值,第二任务组对应的相关性低于预设值。进而,分别对第一任务组合第二任务组进行训练,可以减少训练和应用的工作量和算法耗时,提高训练效果。

举例说明如下,例如有三个属性样本,性别标签的真实值和预测置信度分别是1(0.9)、0(0.15)、1(0.7);则预测偏差分别是0.1、0.15、0.3,平均偏差=(0.1+0.15+0.3)/3=0.183,作为判别阈值。因此统计属性样本的样本准确率时,三个属性样本的样本准确性的最终判别结果是:正确(0.1<0.183)、正确、错误(0.3>0.183)。采用上述同样的方法,可以得出另一个任务的判别结果,例如为:正确、错误、错误。则进一步得到这两个任务之间的相关性为2/3。(第一个属性样本同为正确,第三个属性样本同为错误)。然后,根据任务之间的相关性,将相关性高的放在同一组,将相关性低的放在不同组。最后再对分组后的得到的任务组,针对各个组进行训练,得到分类器,从而实现多个任务联合训练,减少了训练和应用的工作量和算法耗时,提高了训练效果。

在具体实施例中,如前所述,取预测偏差的平均值作为判别阈值,这种情况下属性样本的样本准确性被判断为正确的属性样本,占整体属性样本的样本准确性的百分之五十以上(如果独立分布),可以认为跟目标任务本身的难易程度无关;也就是说,体现不出来任务本身的难易程度。

因此,需要对判别阈值进行修正。如果任务简单,预测置信度更接近真实标签的偏差更小,任务的分类准确率更高。反之任务困难,预测偏差更大,任务的分类准确率低。如果任务简单,偏差平均值较小,那么把阈值抬高,让更多属性样本的样本准确性判断为正确;反之任务困难,偏差平均值较大,那么把阈值降低,让更多属性样本的样本准确性判断为错误。

基于此,在本发明的一个实施例中,在分别获取多个任务的判别阈值后,还包括:

对判别阈值进行修正,具体为:

mTH'=α×mTH+(1-α)×ref其中,mTH’为修正后的判别阈值,mTH为修正前的所述判别阈值,ref为修正参考值,α为调整幅度。更为具体地,例如,ref=0.5,作为判断任务难度适中的偏差平均值的参考,α=0.2为调整幅度。需要说明的是,ref和α的值均可调整,这样对于不同的任务,有更好的适应性,此处不再一一列举赘述。

综上,根据本发明实施例的目标任务训练方法,能够基于多个任务间的相关性对多个任务进行分组,进而对分组后的多任务组进行联合训练,从而减少了训练和应用的工作量和算法耗时,提高了训练效果。

本发明的进一步实施例还提出了一种目标任务训练系统。

图2是根据本发明一个实施例的目标任务训练系统的结构框图。如图2所示,该目标任务训练系统100包括:获取模块110、判别模块120、确定模块130、训练模块140。

其中,获取模块110用于获取目标任务对应的判别阈值。

进一步地,获取模块110还可以包括:获取子模块、计算子模块、确定子模块;其中,获取子模块,用于获取目标任务中的多个属性样本;计算子模块,用于计算目标任务中多个属性样本的预测偏差,及所述多个属性样本的预测偏差的平均值;确定子模块,用于根据所述预测偏差的平均值,确定判别阈值。

判别模块120用于根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性。

进一步地,所述判别模块,用于所述预测偏差为所述属性样本的预测置信度和真实值的差值的绝对值,根据所述判别阈值,确定所述目标任务中多个属性样本的样本准确性,包括:计算子模块;计算子模块用于计算每个属性样本的正确率的概率值,当所述概率值小于等于所述判别阈值时,所述样本准确性为正确;当所述概率值大于所述判别阈值时,所述样本准确性为错误。

其中,预测偏差为属性样本的预测置信度(0~1之间)和真实值(0或1)的差值的绝对值。基于此,判别模块120用于当属性样本的预测偏差大于对应任务的判别阈值时,判断属性样本正确,否则,判断属性样本错误。

具体地说,即将预测置信度(0~1之间)到属性样本真实标签(0或1)差异的绝对值作为预测偏差;然后针对每个任务,在整个属性样本集上统计预测偏差的均值,作为区分预测结果是否正确的分界点,即该任务的判别阈值;然后,根据该判别阈值,判断在该属性上的每个属性样本是否判别正确,如果属性样本的预测偏差大于对应任务的判别阈值,则判断属性样本正确,否则,判断属性样本错误。

确定模块130用于利用所述样本准确性,确定所述目标任务与其他任务之间的关联性,其中,其他任务是除目标任务以外的待训练任务或已训练完成的任务。

训练模块140用于根据所述关联性,对所述目标任务进行训练。

在本发明的一个实施例中,多个任务组至少包括第一任务组和第二任务组,第一任务组对应的相关性高于预设值,第二任务组对应的相关性低于预设值。进而,分别对第一任务组合第二任务组进行训练,可以减少训练和应用的工作量和算法耗时,提高训练效果。

举例说明如下,例如有三个属性样本,性别标签的真实值和预测置信度分别是1(0.9)、0(0.15)、1(0.7);则预测偏差分别是0.1、0.15、0.3,平均偏差=(0.1+0.15+0.3)/3=0.183,作为判别阈值。因此统计属性样本准确率时,三个属性样本的最终判别结果是:正确(0.1<0.183)、正确、错误(0.3>0.183)。采用上述同样的方法,可以得出另一个任务的判别结果,例如为:正确、错误、错误。则进一步得到这两个任务之间的相关性为2/3。(第一个属性样本同为正确,第三个属性样本同为错误)。然后,根据任务之间的相关性,将相关性高的放在同一组,将相关性低的放在不同组。最后再对分组后的得到的任务组,针对各个组进行训练,得到分类器,从而实现多个任务联合训练,减少了训练和应用的工作量和算法耗时,提高了训练效果。

在具体实施例中,如前所述,取预测偏差的平均值作为判别阈值,这种情况下属性样本被判断为正确的占属性样本总是大致一半(如果独立分布),可以认为跟目标任务本身的难易程度无关;也就是说,体现不出来任务本身的难易程度。

因此,需要对判别阈值进行修正。如果任务简单,预测置信度更接近真实标签的偏差更小,任务的分类准确率更高。反之任务困难,预测偏差更大,任务的分类准确率低。如果任务简单,偏差平均值较小,那么把阈值抬高,让更多属性样本的样本准确性判断为正确;反之任务困难,偏差平均值较大,那么把阈值降低,让更多属性样本的样本准确性判断为错误。

基于此,在本发明的一个实施例中,该系统100例如还包括修正模块。修正模块用于对判别阈值进行修正,具体为:

mTH'=α×mTH+(1-α)×ref

其中,mTH’为修正后的判别阈值,mTH为修正前的所述判别阈值,ref为修正参考值,α为调整幅度。

进一步举例,例如,ref=0.5,作为判断任务难度适中的偏差平均值的参考,α=0.2为调整幅度。需要说明的是,ref和α的值均可调整,这样对于不同的任务,有更好的适应性,此处不再一一列举赘述。

需要说明的是,本发明实施例的目标任务训练系统的具体实现方式与本发明实施例的目标任务训练方法的具体实现方式类似,具体请参见方法部分的描述,为了减少冗余,此处不再赘述。

根据本发明实施例的目标任务训练系统,能够基于多个任务间的相关性对多个任务进行分组,进而对分组后的多任务组进行联合训练,从而减少了训练和应用的工作量和算法耗时,提高了训练效果。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同限定。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1