一种面向电力系统的AI模型的生成方法及系统与流程

文档序号：37125689发布日期：2024-02-22 21:37阅读：16来源：国知局

本发明涉及ai模型的训练，具体地涉及一种面向电力系统的ai模型的生成方法及系统。

背景技术：

1、人工智能(ai)已经在许多领域中实现了突破，包括但不限于图像识别、自然语言处理、语音识别等。这些ai系统的成功在很大程度上取决于训练数据集的质量和数量。然而，我们往往只关注模型在训练数据集上的表现，而忽视了模型在遇到扰动信息时的抗干扰能力。

2、扰动信息是指在训练过程中引入的噪声、异常值或与训练数据分布不一致的数据。这种扰动可能在数据收集、预处理或模型训练过程中产生，并可能对模型的泛化性能产生负面影响。

3、当前，大多数ai模型的训练都是通过直接采用同一个数据集进行的。这种方法虽然能够提高模型在训练数据上的性能，但往往会导致模型对扰动信息的抗干扰能力降低。因此，如何提高ai模型对扰动信息的抗干扰能力，成为了一个亟待解决的问题。

技术实现思路

1、本发明实施例的目的是提供一种面向电力系统的ai模型的生成方法及系统，该生成方法及系统能够提高训练完成的ai模型的鲁棒性。

2、为了实现上述目的，本发明实施例提供一种面向电力系统的ai模型的生成方法，包括：

3、根据待识别的图像的标签分布选择用于训练ai模型的训练数据集；

4、对所述训练数据集进行预处理，以增广所述训练数据集；

5、采用增广后的所述训练数据集训练所述ai模型。

6、可选地，根据待识别的图像的标签分布选择用于训练ai模型的训练数据集，包括：

7、通过人工筛查对每张所述待识别图像进行标定，以得到对应的标签数据；

8、根据所述标签数据确定待识别图像的标签分布；

9、根据所述标签分布确定标签分布中每种标签的分布概率；

10、获取数据集；

11、根据所述分布概率从所述数据集中随机选择带标签的图像，直到满足所述ai模型的训练数据量要求，以形成用于训练所述ai模型的训练数据集。

12、可选地，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

13、根据公式(1)生成新的样本数据，

14、

15、其中，x′(n)为新的样本数据，x为原始的样本数据，ε为添加噪声的强度系数，j表示训练网络的损失，θ为模型参数，y′为样本数据x对应的模型的新的输出量，f为输出函数，为反向传播梯度。

16、可选地，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

17、根据公式(2)生成新的样本数据，

18、

19、其中，x′(n)为新的样本数据，x为原始的样本数据，为反向传播梯度，j表示训练网络的损失，y为样本数据x对应的模型输出量。

20、可选地，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

21、根据公式(3)和公式(4)生成新的样本数据，

22、xt+1＝/pix+s(xt+/epsilon+(gt/||gt||))， (3)

23、gt＝/bigtriangledownxt(l(f/theta(xt)，y))， (4)

24、其中，xt+1为t+1时刻的输入，xt为t时刻的输出，epsilon为添加噪声的强度系数，/epsilon表示强度系数的约束区间，/pix+s表示如果扰动超过预定范围s，那么立即映射回所述预定范围s内，gt表示t时刻的损失关于t时刻输入的梯度，bigtriangledown表示最陡下降法的函数，l表示防御域，f/theta为带有约束条件的输出函数，y表示模型输出量。

25、可选地，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

26、获取所述ai模型的鲁棒性要求；

27、根据所述鲁棒性要求确定预处理系数；

28、根据所述预处理系数选择根据公式(1)、公式(2)、公式(3)和公式(4)中的至少一者，来生成新的样本数据，

29、

30、其中，x′(n)为新的样本数据，x为原始的样本数据，ε为添加噪声的强度系数，j表示训练网络的损失，θ为模型参数，y′为样本数据x对应的模型的新的输出量，f为输出函数，为反向传播梯度；

31、

32、其中，x′(n)为新的样本数据，x为原始的样本数据，为反向传播梯度，j表示训练网络的损失，y为样本数据x对应的模型输出量；

33、xt+1＝/pix+s(xt+/epsilon+(gt/||gt||))， (3)

34、gt＝/bigtriangledownxt(l(f/theta(xt)，y))， (4)

35、其中，xt+1为t+1时刻的输入，xt为t时刻的输出，epsilon为添加噪声的强度系数，/epsilon表示强度系数的约束区间，/pix+s表示如果扰动超过预定范围s，那么立即映射回所述预定范围s内，gt表示t时刻的损失关于t时刻输入的梯度，bigtriangledown表示最陡下降法的函数，l表示防御域，f/theta为带有约束条件的输出函数，y表示模型输出量。

36、可选地，根据所述预处理系数选择根据公式(1)、公式(2)、公式(3)和公式(4)中的至少一者，来生成新的样本数据，包括：

37、采用公式(5)至公式(7)确定选择每个所述公式的概率，

38、

39、

40、

41、其中，p1为选择公式(1)对应的概率，σ1为公式(1)对应的预处理系数，σ2为公式(2)对应的预处理系数，σ3为公式(3)和公式(4)对应的预处理系数，p2为选择(2)对应的概率，p3为选择公式(3)和公式(4)对应的概率。

42、可选地，采用公式(5)至公式(7)确定选择每个所述公式的概率，包括：

43、采用轮盘赌法根据所述概率选择公式(1)、公式(2)、公式(3)和公式(4)中的至少一者。

44、另一方面，本发明还提供一种面向电力系统的ai模型的生成系统，所述生成系统包括处理器，所述处理器被配置成执行如上述任一所述的生成方法。

45、通过上述技术方案，本发明提供的一种面向电力系统的ai模型的生成方法及系统，通过对标签分布选择训练数据集，然后针对选择的训练数据集结合ai模型的鲁棒性要求进行增广的预处理操作，从而使得训练的ai模型不仅能够满足图像识别的要求，还能够具有较高的鲁棒性。相较于现有技术单纯的通过精度预测的训练方式而言，本发明提供的生成方法及系统能够使得训练出的ai模型更加精准且高效。

46、本发明实施例的其它特征和优点将在随后的具体实施方式部分予以详细说明。

技术特征：

1.一种面向电力系统的ai模型的生成方法，其特征在于，所述生成方法包括：

2.根据权利要求1所述的生成方法，其特征在于，根据待识别的图像的标签分布选择用于训练ai模型的训练数据集，包括：

3.根据权利要求1所述的生成方法，其特征在于，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

4.根据权利要求1所述的生成方法，其特征在于，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

5.根据权利要求1所述的生成方法，其特征在于，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

6.根据权利要求1所述的生成方法，其特征在于，对所述训练数据集进行预处理，以增广所述训练数据集，包括：

7.根据权利要求6所述的生成方法，其特征在于，根据所述预处理系数选择根据公式(1)、公式(2)、公式(3)和公式(4)中的至少一者，来生成新的样本数据，包括：

8.根据权利要求7所述的生成方法，其特征在于，采用公式(5)至公式(7)确定选择每个所述公式的概率，包括：

9.一种面向电力系统的ai模型的生成系统，其特征在于，所述生成系统包括处理器，所述处理器被配置成执行如权利要求1至8任一所述的生成方法。

技术总结
本发明提供一种面向电力系统的AI模型的生成方法及系统，属于AI模型的训练技术领域。所述生成方法包括：根据待识别的图像的标签分布选择用于训练AI模型的训练数据集；对所述训练数据集进行预处理，以增广所述训练数据集；采用增广后的所述训练数据集训练所述AI模型。通过上述技术方案，本发明提供的一种面向电力系统的AI模型的生成方法及系统，通过对标签分布选择训练数据集，然后针对选择的训练数据集结合AI模型的鲁棒性要求进行增广的预处理操作，从而使得训练的AI模型不仅能够满足图像识别的要求，还能够具有较高的鲁棒性。相较于现有技术单纯的通过精度预测的训练方式而言，本发明提供的生成方法及系统能够使得训练出的AI模型更加精准且高效。

技术研发人员：尚书,余江斌,聂文萍,郭庆,陶俊,薛濛,黄旭东,刘健
受保护的技术使用者：安徽继远软件有限公司
技术研发日：
技术公布日：2024/2/21

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：尚书,余江斌,聂文萍,郭庆,陶俊,薛濛,黄旭东,刘健
技术所有人：安徽继远软件有限公司
我是此专利的发明人

上一篇：藤椅编藤挤塑成型装置及成型方法与流程
上一篇：显示母板、显示面板及显示装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。