模型训练方法、装置、通信设备及可读存储介质与流程

文档序号:35816835发布日期:2023-10-22 07:39阅读:30来源:国知局
模型训练方法、装置、通信设备及可读存储介质与流程

本申请实施例涉及模型训练,具体涉及一种模型训练方法、装置、通信设备及可读存储介质。


背景技术:

1、对于机器学习来说,没有高质量的数据集作为前提,模型就学习不到有用的知识。所有的机器学习/深度学习任务,必须要有大量的可信样本输入,模型才能兼顾效率和准确度。我们收集到的数据可能包括噪声、测量偏差或者产生机制所不能解释的例外情况。这些异常数据如果将来用在训练模型中就是异常样本,异常样本虽然是小概率事件,但是如果不对异常样本进行处理,可能会降低模型的准确率和可解释性。


技术实现思路

1、本申请实施例在于提供一种模型训练方法、装置、通信设备及可读存储介质,解决如何提高模型的准确率和可解释性的问题。

2、第一方面,提供一种模型训练方法,包括:

3、对样本数据进行单维度异常检测和多维度异常检测,确定异常样本;

4、基于异常样本占比、异常样本中正样本占比和预训练过程中目标模型的表现中的至少一项,对所述样本数据中的异常样本进行处理;

5、通过处理后的样本数据对所述目标模型进行训练。

6、可选的,对所述样本数据进行单维度异常检测和多维度异常检测,确定异常样本,包括:

7、对所述样本数据进行单维度异常检测;

8、如果所述样本数据中包括数值型特征和/或布尔型特征,则对所述样本数据进行相关性检测,否则,对所述样本数据中的离散特征进行编码,再对所述样本数据进行相关性检测;

9、根据所述样本数据中的相关性检测结果,构造相关关系的特征簇;

10、通过构造的相关关系的特征簇,对所述样本数据进行多维度异常检测;

11、根据单维度异常检测和多维度异常检测的结果,确定异常样本。

12、可选的,对离散特征进行编码,包括:

13、计算离散特征组合在连续两个采集周期的取值个数;

14、计算离散特征取值个数的变化率;

15、将所述样本数据按照变化率排序;

16、采用所述变化率作为离散特征编码或对排序后的离散特征按照顺序依次编码。

17、可选的,所述方法还包括:

18、通过异常样本中正样本占比和基准评估指标的对比,构建样本数据的特征取值异常的分类规则;

19、根据所述分类规则,对数据集中的样本数据进行分类。

20、第二方面,提供一种模型训练装置,包括:

21、确定模块,用于对样本数据进行单维度异常检测和多维度异常检测,确定异常样本;

22、处理模块,用于基于异常样本占比、异常样本中正样本占比和预训练过程中目标模型的表现中的至少一项,对所述样本数据中的异常样本进行处理;

23、第一训练模块,用于通过处理后的样本数据对所述目标模型进行训练。

24、可选的,装置还包括:

25、第二训练模块,用于通过样本数据对目标模型进行预训练。

26、可选的,所述确定模块进一步用于:

27、对所述样本数据进行单维度异常检测;

28、如果所述样本数据中包括数值型特征和/或布尔型特征,则对所述样本数据进行相关性检测,否则,对所述样本数据中的离散特征进行编码,再对所述样本数据进行相关性检测;

29、根据所述样本数据中的相关性检测结果,构造相关关系的特征簇;

30、通过构造的相关关系的特征簇,对所述样本数据进行多维度异常检测;

31、根据单维度异常检测和多维度异常检测的结果,确定异常样本。

32、可选的,对离散特征进行编码,包括:

33、计算离散特征组合在连续两个采集周期的取值个数;

34、计算离散特征取值个数的变化率;

35、将所述样本数据按照变化率排序;

36、采用所述变化率作为离散特征编码或对排序后的离散特征按照顺序依次编码。

37、可选的,所述装置还包括:

38、分类模块,通过异常样本中正样本占比和基准评估指标的对比,构建样本数据的特征取值异常的分类规则;根据所述分类规则,对数据集中的样本数据进行分类。

39、第七方面,提供一种通信设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如第一方面,第二方面或第三方面所述的方法的步骤。

40、第八方面,提供一种可读存储介质,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如第一方面,第二方面或第三方面所述的方法的步骤。

41、在本申请实施例中,可以先进行单维异常检测,再进行多维异常检测,确保既可发现单维数据异常问题,又可发现关联异常问题,然后基于异常样本占比、异常样本中正样本占比和预训练过程中目标模型的表现中的至少一项,选择合适的样本处理方法对所述样本数据中的异常样本进行处理,最后通过处理后的样本数据对所述目标模型进行训练,提高训练得到的模型的准确率和可解释性。



技术特征:

1.一种模型训练方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,对所述样本数据进行单维度异常检测和多维度异常检测,确定异常样本,包括:

3.根据权利要求2所述的方法,其特征在于,对离散特征进行编码,包括:

4.根据权利要求2所述的方法,其特征在于,所述方法还包括:

5.一种模型训练装置,其特征在于,包括:

6.根据权利要求5所述的装置,其特征在于,所述确定模块进一步用于:

7.根据权利要求5所述的装置,其特征在于,对离散特征进行编码,包括:

8.根据权利要求6所述的装置,其特征在于,所述装置还包括:

9.一种通信设备,其特征在于,包括处理器,存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令,所述程序或指令被所述处理器执行时实现如权利要求1至4中任一项所述的方法的步骤。

10.一种可读存储介质,其特征在于,所述可读存储介质上存储程序或指令,所述程序或指令被处理器执行时实现如权利要求1至4中任一项所述的方法的步骤。


技术总结
本申请实施例提供一种模型训练方法、装置、通信设备及可读存储介质,该方法包括:对样本数据进行单维度异常检测和多维度异常检测,确定异常样本;基于异常样本占比、异常样本中正样本占比和预训练过程中目标模型的表现中的至少一项,对所述样本数据中的异常样本进行处理;通过处理后的样本数据对所述目标模型进行训练。

技术研发人员:纪春芳,郭曦煜,邱婉,王础,刘遥遥,吴鹏,陈澜涛,赵学峰
受保护的技术使用者:中国移动通信有限公司研究院
技术研发日:
技术公布日:2024/1/15
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1