本发明涉及,并且更具体地,涉及一种基于模型特征确定样本输入顺序的方法及系统。
背景技术:
1、现有技术中,针对有偏样本集的建模,得到的模型准确度不高,训练的效率低,计算量大,且得到的模型准确度不高。
技术实现思路
1、针对上述问题,本发明提出了一种基于模型特征确定样本输入顺序的方法,包括:
2、获取待训练的目标模型,确定目标模型的描述信息,基于目标模型的描述信息获取模型特征和历史训练数据,所述模型特征包括多个特征值:
3、基于每个特征值,确定待训练的目标模型与样本库中每个样本集的匹配度,基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集,其中样本库至少包括以下一项:所述样本名称和与所述样本名称对应的样本集;
4、基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序;
5、基于所述初始输入次序将多个选定样本集依次输入到目标模型中,以对目标模型进行训练,获取结果;
6、基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序。
7、可选的,基于获取的样本库中每个样本集的样本平均正确率,确定待训练的目标模型与样本库中每个样本集的匹配度,所述样本平均正确率越高,所述匹配度越高。
8、可选的,历史训练数据,包括:历史训练中不同次序的训练结果。
9、可选的,基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序,包括:
10、根据所述历史训练数据,推算出当前多个选定样本集中用于训练目标模型的训练样本,对于历史目标模型训练后的效果,并确定效果值,对所述效果值由大至小进行排序,所述效果值大的训练样本进行优先训练。
11、可选的,基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序,包括:
12、针对初始输入次序与多个选定样本集中的训练样本进行组合,以得到新的选定样本集和新的初始输入次序,以新的初始输入次序将多个显得选定样本集依次输入到目标模型中,以对目标模型进行训练,获取组合结果,对组合结果和结果进行对比,若组合结果的评估值大于所述结果的评估值,则以新的初始输入次序作为初始输入次序;
13、若组合结果的评估值小于所述结果的评估值,则对初始输入次序与多个选定样本集中的训练样本进行重新组合,直到组合结果的评估值大于所述结果的评估值。
14、再一方面,本发明还提出了一种基于模型特征确定样本输入顺序的系统,包括:
15、特征提取单元,用于获取待训练的目标模型,确定目标模型的描述信息,基于目标模型的描述信息获取模型特征和历史训练数据,所述模型特征包括多个特征值:
16、匹配单元,用于基于每个特征值,确定待训练的目标模型与样本库中每个样本集的匹配度,基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集,其中样本库至少包括以下一项:所述样本名称和与所述样本名称对应的样本集;
17、初始单元,用于基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序;
18、测试单元,用于基于所述初始输入次序将多个选定样本集依次输入到目标模型中,以对目标模型进行训练,获取结果;
19、输出单元,用于基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序。
20、可选的,基于获取的样本库中每个样本集的样本平均正确率,确定待训练的目标模型与样本库中每个样本集的匹配度,所述样本平均正确率越高,所述匹配度越高。
21、可选的,历史训练数据,包括:历史训练中不同次序的训练结果。
22、可选的,基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序,包括:
23、根据所述历史训练数据,推算出当前多个选定样本集中用于训练目标模型的训练样本,对于历史目标模型训练后的效果,并确定效果值,对所述效果值由大至小进行排序,所述效果值大的训练样本进行优先训练。
24、可选的,基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序,包括:
25、针对初始输入次序与多个选定样本集中的训练样本进行组合,以得到新的选定样本集和新的初始输入次序,以新的初始输入次序将多个显得选定样本集依次输入到目标模型中,以对目标模型进行训练,获取组合结果,对组合结果和结果进行对比,若组合结果的评估值大于所述结果的评估值,则以新的初始输入次序作为初始输入次序;
26、若组合结果的评估值小于所述结果的评估值,则对初始输入次序与多个选定样本集中的训练样本进行重新组合,直到组合结果的评估值大于所述结果的评估值。
27、再一方面,本发明还提供了一种计算设备,包括:一个或多个处理器;
28、处理器,用于执行一个或多个程序;
29、当所述一个或多个程序被所述一个或多个处理器执行时,实现如上述所述的方法。
30、再一方面,本发明还提供了一种计算机可读存储介质,其上存有计算机程序,所述计算机程序被执行时,实现如上述所述的方法。
31、与现有技术相比,本发明的有益效果为:
32、本发明提供了一种基于模型特征确定样本输入顺序的方法,包括:获取待训练的目标模型,确定目标模型的描述信息,基于目标模型的描述信息获取模型特征和历史训练数据,所述模型特征包括多个特征值:基于每个特征值,确定待训练的目标模型与样本库中每个样本集的匹配度,基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集,其中样本库至少包括以下一项:所述样本名称和与所述样本名称对应的样本集;基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序;基于所述初始输入次序将多个选定样本集依次输入到目标模型中,以对目标模型进行训练,获取结果;基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序。本发明能够针对有偏样本集建立精确的模型。
1.一种基于模型特征确定样本输入顺序的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,基于获取的样本库中每个样本集的样本平均正确率,确定待训练的目标模型与样本库中每个样本集的匹配度,所述样本平均正确率越高,所述匹配度越高。
3.根据权利要求1所述的方法,其特征在于,所述历史训练数据,包括:历史训练中不同次序的训练结果。
4.根据权利要求1所述的方法,其特征在于,所述基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序,包括:
5.根据权利要求1所述的方法,其特征在于,所述基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序,包括:
6.一种基于模型特征确定样本输入顺序的系统,其特征在于,所述系统包括:
7.根据权利要求6所述的系统,其特征在于,基于获取的样本库中每个样本集的样本平均正确率,确定待训练的目标模型与样本库中每个样本集的匹配度,所述样本平均正确率越高,所述匹配度越高。
8.根据权利要求6所述的系统,其特征在于,所述历史训练数据,包括:历史训练中不同次序的训练结果。
9.根据权利要求6所述的系统,其特征在于,所述基于目标模型的历史训练数据,确定用于对目标模型进行训练时,多个选定样本集的初始输入次序,包括:
10.根据权利要求6所述的系统,其特征在于,所述基于结果对初始输入次序进行调整,以获得经过调整的初始输入次序,包括:
11.一种计算机设备,其特征在于,包括:
12.一种计算机可读存储介质,其特征在于,其上存有计算机程序,所述计算机程序被执行时,实现如权利要求1-5中任一所述的方法。