一种基于模型特征确定样本输入顺序的方法及系统与流程

文档序号：36815912发布日期：2024-01-26 16:21阅读：21来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及，并且更具体地，涉及一种基于模型特征确定样本输入顺序的方法及系统。

背景技术：

1、现有技术中，针对有偏样本集的建模，得到的模型准确度不高，训练的效率低，计算量大，且得到的模型准确度不高。

技术实现思路

1、针对上述问题，本发明提出了一种基于模型特征确定样本输入顺序的方法，包括：

2、获取待训练的目标模型，确定目标模型的描述信息，基于目标模型的描述信息获取模型特征和历史训练数据，所述模型特征包括多个特征值：

3、基于每个特征值，确定待训练的目标模型与样本库中每个样本集的匹配度，基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集，其中样本库至少包括以下一项：所述样本名称和与所述样本名称对应的样本集；

4、基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序；

5、基于所述初始输入次序将多个选定样本集依次输入到目标模型中，以对目标模型进行训练，获取结果；

6、基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序。

7、可选的，基于获取的样本库中每个样本集的样本平均正确率，确定待训练的目标模型与样本库中每个样本集的匹配度，所述样本平均正确率越高，所述匹配度越高。

8、可选的，历史训练数据，包括：历史训练中不同次序的训练结果。

9、可选的，基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序，包括：

10、根据所述历史训练数据，推算出当前多个选定样本集中用于训练目标模型的训练样本，对于历史目标模型训练后的效果，并确定效果值，对所述效果值由大至小进行排序，所述效果值大的训练样本进行优先训练。

11、可选的，基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序，包括：

12、针对初始输入次序与多个选定样本集中的训练样本进行组合，以得到新的选定样本集和新的初始输入次序，以新的初始输入次序将多个显得选定样本集依次输入到目标模型中，以对目标模型进行训练，获取组合结果，对组合结果和结果进行对比，若组合结果的评估值大于所述结果的评估值，则以新的初始输入次序作为初始输入次序；

13、若组合结果的评估值小于所述结果的评估值，则对初始输入次序与多个选定样本集中的训练样本进行重新组合，直到组合结果的评估值大于所述结果的评估值。

14、再一方面，本发明还提出了一种基于模型特征确定样本输入顺序的系统，包括：

15、特征提取单元，用于获取待训练的目标模型，确定目标模型的描述信息，基于目标模型的描述信息获取模型特征和历史训练数据，所述模型特征包括多个特征值：

16、匹配单元，用于基于每个特征值，确定待训练的目标模型与样本库中每个样本集的匹配度，基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集，其中样本库至少包括以下一项：所述样本名称和与所述样本名称对应的样本集；

17、初始单元，用于基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序；

18、测试单元，用于基于所述初始输入次序将多个选定样本集依次输入到目标模型中，以对目标模型进行训练，获取结果；

19、输出单元，用于基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序。

20、可选的，基于获取的样本库中每个样本集的样本平均正确率，确定待训练的目标模型与样本库中每个样本集的匹配度，所述样本平均正确率越高，所述匹配度越高。

21、可选的，历史训练数据，包括：历史训练中不同次序的训练结果。

22、可选的，基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序，包括：

23、根据所述历史训练数据，推算出当前多个选定样本集中用于训练目标模型的训练样本，对于历史目标模型训练后的效果，并确定效果值，对所述效果值由大至小进行排序，所述效果值大的训练样本进行优先训练。

24、可选的，基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序，包括：

25、针对初始输入次序与多个选定样本集中的训练样本进行组合，以得到新的选定样本集和新的初始输入次序，以新的初始输入次序将多个显得选定样本集依次输入到目标模型中，以对目标模型进行训练，获取组合结果，对组合结果和结果进行对比，若组合结果的评估值大于所述结果的评估值，则以新的初始输入次序作为初始输入次序；

26、若组合结果的评估值小于所述结果的评估值，则对初始输入次序与多个选定样本集中的训练样本进行重新组合，直到组合结果的评估值大于所述结果的评估值。

27、再一方面，本发明还提供了一种计算设备，包括：一个或多个处理器；

28、处理器，用于执行一个或多个程序；

29、当所述一个或多个程序被所述一个或多个处理器执行时，实现如上述所述的方法。

30、再一方面，本发明还提供了一种计算机可读存储介质，其上存有计算机程序，所述计算机程序被执行时，实现如上述所述的方法。

31、与现有技术相比，本发明的有益效果为：

32、本发明提供了一种基于模型特征确定样本输入顺序的方法，包括：获取待训练的目标模型，确定目标模型的描述信息，基于目标模型的描述信息获取模型特征和历史训练数据，所述模型特征包括多个特征值：基于每个特征值，确定待训练的目标模型与样本库中每个样本集的匹配度，基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集，其中样本库至少包括以下一项：所述样本名称和与所述样本名称对应的样本集；基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序；基于所述初始输入次序将多个选定样本集依次输入到目标模型中，以对目标模型进行训练，获取结果；基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序。本发明能够针对有偏样本集建立精确的模型。

技术特征：

1.一种基于模型特征确定样本输入顺序的方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，基于获取的样本库中每个样本集的样本平均正确率，确定待训练的目标模型与样本库中每个样本集的匹配度，所述样本平均正确率越高，所述匹配度越高。

3.根据权利要求1所述的方法，其特征在于，所述历史训练数据，包括：历史训练中不同次序的训练结果。

4.根据权利要求1所述的方法，其特征在于，所述基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序，包括：

5.根据权利要求1所述的方法，其特征在于，所述基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序，包括：

6.一种基于模型特征确定样本输入顺序的系统，其特征在于，所述系统包括：

7.根据权利要求6所述的系统，其特征在于，基于获取的样本库中每个样本集的样本平均正确率，确定待训练的目标模型与样本库中每个样本集的匹配度，所述样本平均正确率越高，所述匹配度越高。

8.根据权利要求6所述的系统，其特征在于，所述历史训练数据，包括：历史训练中不同次序的训练结果。

9.根据权利要求6所述的系统，其特征在于，所述基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序，包括：

10.根据权利要求6所述的系统，其特征在于，所述基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序，包括：

11.一种计算机设备，其特征在于，包括：

12.一种计算机可读存储介质，其特征在于，其上存有计算机程序，所述计算机程序被执行时，实现如权利要求1-5中任一所述的方法。

技术总结
本发明公开了一种基于模型特征确定样本输入顺序的方法及系统，属于模型训练技术领域。本发明，包括：基于目标模型的描述信息获取模型特征和历史训练数据，所述模型特征包括多个特征值：基于匹配度从样本库中选择用于对目标模型进行训练的多个选定样本集，其中样本库至少包括以下一项：所述样本名称和与所述样本名称对应的样本集；基于目标模型的历史训练数据，确定用于对目标模型进行训练时，多个选定样本集的初始输入次序；基于所述初始输入次序将多个选定样本集依次输入到目标模型中，以对目标模型进行训练，获取结果；基于结果对初始输入次序进行调整，以获得经过调整的初始输入次序。本发明能够针对有偏样本集建立精确的模型。

技术研发人员：陈振华,高少峰,李文贤,任世鸣,周培杰
受保护的技术使用者：天创信用服务有限公司
技术研发日：
技术公布日：2024/1/25

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：陈振华,高少峰,李文贤,任世鸣,周培杰
技术所有人：天创信用服务有限公司
我是此专利的发明人

上一篇：基于数据分发服务的通信方式动态选择方法及装置与流程
上一篇：一种基于多算法结合的绿潮分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。