基于随机森林的高压直流输电系统故障识别方法和装置与流程

文档序号:33338111发布日期:2023-03-04 01:46阅读:34来源:国知局
基于随机森林的高压直流输电系统故障识别方法和装置与流程

1.本技术涉及电力技术领域,特别是涉及一种基于随机森林的高压直流输电系统故障识别方法、装置、计算机设备、存储介质和计算机程序产品。


背景技术:

2.随着电力技术的发展,高压直流输电技术由于其线路输电能力强、损耗小等特点,被广泛应用于长距离点对点大功率输电中。高压直流输电系统发生故障时,会影响输电系统的稳定。因此,为了确保输电系统的稳定,如何对高压直流输电系统进行故障识别成为了重要的研究方向。
3.传统技术通常是通过人工收集高压直流输电系统的各方面数据,从而专家通过这些数据确定高压直流输电系统的故障类型,但是该方式主要依据主观判断,导致确定高压直流输电系统的故障类型的准确性较低。


技术实现要素:

4.基于此,有必要针对上述技术问题,提供一种基于随机森林的高压直流输电系统故障识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
5.第一方面,本技术提供了一种基于随机森林的高压直流输电系统故障识别方法。方法包括:
6.获取高压直流输电系统的运行数据;
7.从运行数据中提取出高压直流输电系统的运行特征;
8.将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型;预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;训练集由训练集生成模型,根据故障特征数据生成得到;
9.根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
10.在其中一个实施例中,预先训练的故障识别模型通过下述方式训练得到:
11.获取故障特征数据;
12.将故障特征数据输入至训练集生成模型,得到训练集生成模型生成的训练集;
13.利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型。
14.在其中一个实施例中,获取故障特征数据,包括:
15.获取故障文本特征数据和故障图像数据;
16.将故障图像数据输入至故障图像特征数据识别模型,得到故障图像数据的故障图像特征数据;
17.根据故障文本特征数据和故障图像特征数据,确定故障特征数据。
18.在其中一个实施例中,训练集生成模型中包含生成模型和判别模型;
19.将故障特征数据输入至训练集生成模型,得到训练集生成模型生成的训练集,包括:
20.将故障特征数据输入至训练集生成模型,利用训练集生成模型中的生成模型和判别模型,根据故障特征数据,生成样本故障特征数据;
21.根据样本故障特征数据,确定训练集。
22.在其中一个实施例中,利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型,包括:
23.利用训练集对待训练的故障识别模型进行训练,得到待验证的故障识别模型;待验证的故障识别模型中包含待验证的决策树模型;
24.在待验证的决策树模型满足预设决策树模型条件的情况下,将待验证的故障识别模型作为预先训练的故障识别模型。
25.在其中一个实施例中,利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型,包括:
26.对训练集进行多次随机抽取处理,得到训练集的多个训练子集;
27.利用多个训练子集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型。
28.第二方面,本技术还提供了一种基于随机森林的高压直流输电系统故障识别装置。所述装置包括:
29.数据获取模块,用于获取高压直流输电系统的运行数据;
30.特征提取模块,用于从所述运行数据中提取出所述高压直流输电系统的运行特征;
31.特征输入模块,用于将所述运行特征输入至预先训练的故障识别模型,通过所述故障识别模型中的各个决策树模型,从预存的故障类型中确定出所述高压直流输电系统的候选故障类型,得到所述各个决策树模型输出的候选故障类型;所述预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;所述训练集由训练集生成模型,根据故障特征数据生成得到;
32.类型确定模块,用于根据所述各个决策树模型输出的候选故障类型的众数,从所述各个决策树模型输出的候选故障类型中,确定出所述高压直流输电系统的目标故障类型。
33.第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
34.获取高压直流输电系统的运行数据;从运行数据中提取出高压直流输电系统的运行特征;将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型;预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;训练集由训练集生成模型,根据故障特征数据生成得到;根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
35.第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,
其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
36.获取高压直流输电系统的运行数据;从运行数据中提取出高压直流输电系统的运行特征;将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型;预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;训练集由训练集生成模型,根据故障特征数据生成得到;根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
37.第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
38.获取高压直流输电系统的运行数据;从运行数据中提取出高压直流输电系统的运行特征;将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型;预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;训练集由训练集生成模型,根据故障特征数据生成得到;根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
39.上述基于随机森林的高压直流输电系统故障识别方法、装置、计算机设备、存储介质和计算机程序产品,获取高压直流输电系统的运行数据,从运行数据中提取出高压直流输电系统的运行特征,将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型,预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到,训练集由训练集生成模型,根据故障特征数据生成得到,根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。该方案通过从高压直流输电系统的运行数据中提取出运行特征,将运行特征输入至经过训练的故障识别模型,通过经过训练的故障识别模型能够高效和准确地从预存的故障类型中确定出高压直流输电系统的候选故障类型,直接根据得到的各个候选故障类型的众数,快速和准确地确定出高压直流输电系统的目标故障类型,从而实现提高确定高压直流输电系统的故障类型的准确性和效率。
附图说明
40.图1为一个实施例中基于随机森林的高压直流输电系统故障识别方法的流程示意图;
41.图2为一个实施例中故障判断算法步骤的流程示意图;
42.图3为一个实施例中随机森林算法的训练示意图;
43.图4为一个实施例中基于随机森林的高压直流输电系统故障识别装置的结构框图;
44.图5为一个实施例中计算机设备的内部结构图。
具体实施方式
45.为了使本技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本技术进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本技术,并不用于限定本技术。
46.在一个实施例中,如图1所示,提供了一种基于随机森林的高压直流输电系统故障识别方法,本实施例以该方法应用于终端进行举例说明,包括以下步骤:
47.步骤s101,获取高压直流输电系统的运行数据。
48.本步骤中,运行数据可以是电数据和运行参数。
49.具体的,终端实时采集高压直流输电系统的运行数据。
50.步骤s102,从运行数据中提取出高压直流输电系统的运行特征。
51.本步骤中,运行特征可以是从运行数据中提取的运行故障数据,也可以是从运行数据中提取的有效的电数据和运行参数。
52.具体的,终端对运行数据进行识别处理,确定运行数据中的运行特征,从运行数据中提取出高压直流输电系统的运行特征。
53.步骤s103,将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型。
54.本步骤中,预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;训练集由训练集生成模型,根据故障特征数据生成得到。
55.具体的,终端将故障特征数据输入至训练集生成模型,得到训练集生成模型生成的训练集,利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型,将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预先存储的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型。
56.步骤s104,根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
57.本步骤中,众数可以是指出现次数最多的数据,各个决策树模型输出的候选故障类型的众数可以是指各个决策树模型输出的候选故障类型中出现次数最多的候选故障类型。
58.具体的,终端根据各个决策树模型输出的候选故障类型,确定出现次数最多的候选故障类型(相当于各个决策树模型投票次数最多的候选故障类型),将该出现次数最多的候选故障类型确定为高压直流输电系统的目标故障类型。
59.上述基于随机森林的高压直流输电系统故障识别方法中,获取高压直流输电系统的运行数据,从运行数据中提取出高压直流输电系统的运行特征,将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型,预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到,训练集由训练集生成模型,根据故障特征数据生成得到,根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。该
方案从高压直流输电系统的运行数据中提取出运行特征,将运行特征输入至经过训练的故障识别模型,通过经过训练的故障识别模型能够高效和准确地从预存的故障类型中确定出高压直流输电系统的候选故障类型,直接根据得到的各个候选故障类型的众数,快速和准确地确定出高压直流输电系统的目标故障类型,从而实现提高确定高压直流输电系统的故障类型的准确性和效率。
60.在一个实施例中,预先训练的故障识别模型通过下述方式训练得到,具体包括:获取故障特征数据;将故障特征数据输入至训练集生成模型,得到训练集生成模型生成的训练集;利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型。
61.本实施例中,故障特征数据可以是高压直流输电系统的故障特征历史数据;训练集生成模型可以是生成式对抗网络(generative adversarial networks,gan);训练集可以是用于训练模型的高压直流输电系统的故障特征的训练数据;待训练的故障识别模型可以是待训练的随机森林模型(随机森林算法模型);预先训练的故障识别模型可以是预先训练的随机森林模型(随机森林算法模型)。
62.具体的,终端获取故障特征数据,将故障特征数据输入至训练集生成模型,得到训练集生成模型根据故障特征数据生成的训练集,从而将样本数量较少的故障特征数据扩充为样本数量充足的故障特征数据,将样本数量充足的故障特征数据作为训练集,利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型。
63.本实施例的技术方案,通过利用训练集生成模型生成的训练集,对待训练的故障识别模型进行训练,有利于得到更准确的和更高效的预先训练的故障识别模型,从而有利于提高确定高压直流输电系统的故障类型的准确性和效率。
64.在一个实施例中,上述方法还可以通过如下步骤获取故障特征数据,具体包括:获取故障文本特征数据和故障图像数据;将故障图像数据输入至故障图像特征数据识别模型,得到故障图像数据的故障图像特征数据;根据故障文本特征数据和故障图像特征数据,确定故障特征数据。
65.本实施例中,故障文本特征数据可以是故障特征的文本数据,例如用文字或数字(非图像)记录的故障特征数据;故障图像数据可以是故障数据的图像数据,例如图像记录的故障数据;故障图像特征数据识别模型可以是用于从故障图像数据中识别出故障图像特征数据的模型,例如图卷积神经网络(graph convolution neural network,gcn);故障图像特征数据可以是故障图像数据中的表示故障特征的数据。
66.具体的,终端获取故障文本特征数据和故障图像数据,将故障图像数据输入至故障图像特征数据识别模型,通过故障图像特征数据识别模型识别故障图像数据中的特征数据,得到故障图像特征数据识别模型输出的故障图像数据的故障图像特征数据,将故障文本特征数据和故障图像特征数据作为故障特征数据。
67.本实施例的技术方案,通过根据故障文本特征数据和故障图像特征数据,确定故障特征数据,有利于使故障特征数据更全面性,从而有利于后续训练得到更准确和更高效的预先训练的故障识别模型。
68.在一个实施例中,上述步骤的将故障特征数据输入至训练集生成模型,得到训练集生成模型生成的训练集具体包括:将故障特征数据输入至训练集生成模型,利用训练集生成模型中的生成模型和判别模型,根据故障特征数据,生成样本故障特征数据;根据样本
故障特征数据,确定训练集。
69.本实施例中,训练集生成模型中包含生成模型和判别模型,其中,生成模型可以是图卷积神经网络中的生成器g(可以是神经网络结构),判别模型可以是图卷积神经网络中的判别器d(可以是神经网络结构);样本故障特征数据可以是故障特征数据的样本数据。
70.具体的,终端将故障特征数据输入至训练集生成模型,通过训练集生成模型中的生成模型和判别模型,根据故障特征数据,生成样本故障特征数据,将样本故障特征数据作为训练集。
71.本实施例的技术方案,通过利用训练集生成模型中的生成模型和判别模型,有利于生成更准确的(真实性更高的)样本故障特征数据,并根据更准确的(真实性更高的)样本故障特征数据,从而确定更准确的(真实性更高的)训练集,从而有利于后续训练得到更准确和更高效的预先训练的故障识别模型。
72.在一个实施例中,上述步骤的利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型具体包括:利用训练集对待训练的故障识别模型进行训练,得到待验证的故障识别模型;在待验证的决策树模型满足预设决策树模型条件的情况下,将待验证的故障识别模型作为预先训练的故障识别模型。
73.本实施例中,待验证的故障识别模型中包含待验证的决策树模型,决策树模型可以是随机森林模型中的决策树;预设决策树模型条件可以是预先设置的决策树模型条件,例如直至决策树无法再分裂的条件,也可以是决策树模型的数量或效果达到预先设置阈值的条件。
74.具体的,终端利用训练集对待训练的故障识别模型进行训练,得到待验证的故障识别模型,判断待验证的决策树模型是否满足预设决策树模型条件,在待验证的决策树模型不满足预设决策树模型条件的情况下,重复对待验证的决策树模型进行训练,直至待验证的决策树模型满足预设决策树模型条件,在待验证的决策树模型满足预设决策树模型条件的情况下,将待验证的故障识别模型作为预先训练的故障识别模型。
75.本实施例的技术方案,通过在待验证的决策树模型满足预设决策树模型条件的情况下,将待验证的故障识别模型作为预先训练的故障识别模型,从而有利于得到更准确的预先训练的故障识别模型,从而有利于后续提高确定高压直流输电系统的故障类型的准确性。
76.在一个实施例中,上述步骤的利用训练集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型具体包括:对训练集进行多次随机抽取处理,得到训练集的多个训练子集;利用多个训练子集对待训练的故障识别模型进行训练,得到预先训练的故障识别模型。
77.本实施例中,多次随机抽取处理可以是多次随机有放回的抽取,也可以是多次随机无放回的抽取。
78.具体的,终端对训练集进行多次随机抽取处理,得到训练集的多个训练子集,利用多个训练子集对待训练的故障识别模型进行多次训练,得到预先训练的故障识别模型。
79.本实施例的技术方案,通过利用多个训练子集对待训练的故障识别模型进行训练,从而有利于得到更准确和更高效的预先训练的故障识别模型,从而有利于后续提高确定高压直流输电系统的故障类型的准确性和效率。
80.以下以一个实施例说明本技术提供的基于随机森林的高压直流输电系统故障识别方法,本实施例以该方法应用于终端进行举例说明,主要步骤包括:
81.第一步,终端获取故障文本特征数据和故障图像数据。
82.第二步,终端将故障图像数据输入至故障图像特征数据识别模型,得到故障图像数据的故障图像特征数据。
83.第三步,终端根据故障文本特征数据和故障图像特征数据,确定故障特征数据。
84.第四步,终端将故障特征数据输入至训练集生成模型,利用训练集生成模型中的生成模型和判别模型,根据故障特征数据,生成样本故障特征数据。
85.第五步,终端根据样本故障特征数据,确定训练集。
86.第六步,终端对训练集进行多次随机抽取处理,得到训练集的多个训练子集。
87.第七步,终端利用多个训练子集对待训练的故障识别模型进行训练,得到待验证的故障识别模型。
88.第八步,终端在待验证的决策树模型满足预设决策树模型条件的情况下,将待验证的故障识别模型作为预先训练的故障识别模型。
89.第九步,终端获取高压直流输电系统的运行数据。
90.第十步,终端从运行数据中提取出高压直流输电系统的运行特征。
91.第十一步,终端将运行特征输入至预先训练的故障识别模型,通过故障识别模型中的各个决策树模型,从预存的故障类型中确定出高压直流输电系统的候选故障类型,得到各个决策树模型输出的候选故障类型。
92.第十二步,终端根据各个决策树模型输出的候选故障类型的众数,从各个决策树模型输出的候选故障类型中,确定出高压直流输电系统的目标故障类型。
93.其中,训练集生成模型中包含生成模型和判别模型;待验证的故障识别模型中包含待验证的决策树模型。
94.本实施例的技术方案,通过从高压直流输电系统的运行数据中提取出运行特征,将运行特征输入至经过训练的故障识别模型,通过经过训练的故障识别模型能够高效和准确地从预存的故障类型中确定出高压直流输电系统的候选故障类型,直接根据得到的各个候选故障类型的众数,快速和准确地确定出高压直流输电系统的目标故障类型,从而实现提高确定高压直流输电系统的故障类型的准确性和效率。
95.以下以一个应用实例说明本技术提供的基于随机森林的高压直流输电系统故障识别方法,本应用实例以该方法应用于终端进行举例说明,如图2和图3所示,主要步骤包括:
96.第一步,终端收集已知高压直流输电系统的故障特征(获取现有高压直流输电系统的故障特征),包括整流侧换流器阀短路故障特征、直流输电系统逆变器发生换相失败的故障特征、整流器直流侧出口短路的故障特征、直流输电线路发生的故障特征和/或交流侧发生的故障特征。
97.第二步,终端根据现有数据,采用生成式对抗网络gan生成数据。
98.第三步,终端根据故障数据,使用随机森林算法训练出适用于电网的故障判断算法:如图3所示,终端采用生成式对抗网络生成的数据,按照7:3随机划分为训练集和测试集,针对高压直流输电系统故障建立的随机森林故障诊断器训练及测试过程的具体步骤如
下:步骤1:对故障特征集a进行多重采样,产生n个随机的故障特征集a1,a2,
……
,an;步骤2:利用训练集a1,a2,
……
,an,生成对应的决策树c1,c2,
……
,cn;在每个分支节点选址属性前,从m(m为样本属性个数)个属性中随机抽取m(m为大于零且小于m的整数)个属性作为当前节点的分裂属性集,并以这m个属性中最好的分裂方式对该节点进行分裂;步骤3:将测试集样本x分别输入到各个决策树中进行判别,得到每个决策树的判别结果c1(x),c2(x),

,cn(x);步骤4:选取n个决策树输出结果中的众数(选择众数)作为测试集样本x所属类别,得到故障诊断结果,其输出结果为目前输电系统中的故障类型。
99.其中,高压直流输电系统主要由整流站、逆变站、直流输电线路以及接地极系统构成,换流站内的设备较为复杂,包括有换流器(整流器和逆变器)和交、直流开关站的一次设备及控制保护系统的二次设备,高压直流输电系统是否正常运行还会受到直流系统两端联接的交流输电系统的影响,直流系统中任何一个部分发生故障都会影响到整个直流输电系统的安全可靠性,按照发生故障的设备所在区域的不同高压直流输电系统的故障可以分为直流部分故障和交流部分故障,系统中任何部分出现故障都会危害到系统的正常运行,直流部分的故障包括换流器故障、直流开关站及接地极故障、直流线路故障。整流侧换流器阀短路故障的特征如下:(1)换流器的直流母线电压会迅速下降,甚至降为0;(2)故障阀臂上的电流会急剧增大并且是反向的(电流上升速率如果过大,相应的阀臂很容易会被烧毁);(3)换流阀和变压器受交流侧电流急剧增大的影响,需要承受较大的故障电流(故障电流通常会达到额定直流电流的10至20倍);4)整流器的交流侧交替发生两相短路和三相短路。直流输电系统逆变器发生换相失败的特征总结如下:(1)关断角小于换流阀恢复其阻断能力的时间(大功率晶闸管恢复阻断能力时间约0.4ms);(2)换相失败后的一段时间内直流电压持续下降直到降为0;3)直流电流急剧增大;(4)交流侧的电流下降并会出现短时间内的开路;(5)直流系统中有基波分量流入。整流器直流侧出口短路的故障特征是:(1)换流器的各阀能保持单向导通的特性,并且能正常的触发;(2)交流侧交替发生两相短路和三相短路;(3)导通阀和换流变压器上的电流急剧增大,且需要承受比正常值大得多的电流值;(4)因为短路电流的缘故直流线路电流减小,直流母线电压快速下降并且残压较小。直流输电线路发生故障类型中,对地短路的概率最大,大多数故障是闪络放电,占直流输电线路故障的80%以上,通常引起直流输电线路对地闪络的因素有遭受雷击、污秽,直流线路的空气绝缘被击穿、树枝等环境因素所造成的线路绝缘水平下降。交流侧发生故障对直流系统的影响主要是通过加在换流器上的换相变压的变化而引起的,一般影响直流系统正常运行的因素有交流系统电压下降的速率以及幅值和相位的变化,换流站交流侧可能会发生的故障包括换流变压器和辅助设备发生故障、换流站交流侧三相接地短路故障、换流站交流侧单相接地故障、交流滤波器故障和换流站用电设备故障。图卷积神经网络(graph convolution neural network,gcn)属于图神经网络的一种,可以从图数据中提取特征,便于识别出高压直流输电故障中的重要特征,对于图g=(v,e),v为节点的集合,e为边的集合,对于每个点i,均有其特征xi,可用xn×d表示,一个g中有3个比较重要的矩阵,分别为邻接矩阵a、度矩阵d和特征矩阵x,邻接矩阵a用来表示节点间的连接关系,度矩阵d是一个对角矩阵,每个节点的度指的是其连接的节点数,其中对角线元素d
ij
=∑
jaij
,特征矩阵x用于表示节点的特征,x∈rn×f,其中f是特征的维度,对于图任务,任何一个图卷积层都可以写成如下非线性函数h
l+1
=f(h
l
,a),h0=x为第一层的输入,其中x∈r^(n
×
d),n为图节点个数,d为每个节点特征
向量的维度,a为邻接矩阵。这里l指的是网络层数,h
(l)
就是网络第l层的特征,不同模型的差异点在于函数f的实现不同,在图学习中,每个节点的新特征就是对节点的邻域节点特征进行变换然后求和,其公式为h
l+1
=f(h
l
,a)=σ(ah
lwl
),式中,w
l
是学习权重,维度是f
l-1
×fl
,σ()是激活函数,这是神经网络的基本单元,而图卷积神经网络的最终形式为
[0100][0101]
式中,第l层网络的输入为h
(l)
∈rn×d(初始输入为h0=x),d~
ii
∑ja~
jj
;w
(l)
∈rd×d为待训练的参数,σ()为相应的激活函数。随机森林算法(cart算法)的决策树从上而下地生成,即首先从根节点的特征集合中取出某一特征,根据此特征将数据集划分为2个子节点,每个子节点中包含一定数量的样本,之后分别对每个子节点进行同样的处理,直到达到决策树不再生长的条件完成决策树的构建,随机森林算法是一种组合分类器算法,采用cart决策树作为基分类器,其通过随机有放回的抽取样本集和随机无放回的抽取特征集构建决策树,最终生成的多棵决策树组成随机森林模型,并通过基分类器投票的方式决定模型最终的预测结果,当用于分类时,通过随机抽取数据集中的样本及样本特征构建决策树,重复多次,生成的决策树间互不相关,并统计所有决策树的结果作为最终结果,预测新样本时,统计森林中的每个决策树的分类结果,选择最多的类别作为新样本预测结果。gan通过生成器g和判别器d的分工训练使整个网络得到训练输出,其中,判别器可以当作一个任意的神经网络结构,先输入一串特定的数据,然后输出对应的概率大小,该概率以0.5为分界线,越接近1,生成器的效果越好,使得判别器越难以判断准确;越接近0,说明判别器的能力越好,判别得越准确,从而使其能准确地区分该数据来自真实采样得到的还是生成的;而生成器同样可以当作是一个神经网络模型,以某种分布的一组随机数作为输入,输出特定数据,其目的是伪造样本,并且使得自己伪造样本的能力尽可能达到让判别器无法判别;首先已知真实样本集的分布,设其中的真实样本为x,若将其看作是一个向量,则这个集合的分布就是p
data
(x),为了较好地使生成器产生的数据接近真实,首先需要生成器产生在真实样本分布范围内的特定分布的数据,不断地与真实数据拟合接近,其中由生成器生成的样本数据分布可以假设pg(x;θ),由参数θ控制,需要经过训练找到特定的参数θ使得该分布不断地与真实数据分布接近;gcn属于图神经网络中的一种,gcn重点关注图数据,其中的每个节点的局部结构各异,数据多样化,且数据规模很大,而生成式对抗网络,是一组成对的网络结构,包括生成器网络和判别器网络,两者之间相互对抗,分别不断地完善自身生成数据和判别数据能力的过程,最后随机森林算法是一种组合分类器算法,采用cart决策树作为基分类器,其通过随机有放回的抽取样本集和随机无放回的抽取特征集构建决策树,最终生成的多棵决策树组成随机森林模型,并通过基分类器投票的方式决定模型最终的预测结果。
[0102]
本应用实例的技术方案,使用随机森林算法解决电网发生故障时对故障设备、故障成因以及故障定位的问题,从而提高电网故障诊断速度,提升电网稳定性,而且,采用图卷积神经网络作为生成式对抗网络的输入,由生成式对抗网络输出数据,以实现具有较高准确度的故障分类,然后采用随机森林算法对输出数据进行训练,以此得到基于随机森林的高压直流输电系统故障诊断算法,实现高效准确的故障类型识别与故障判断功能。
[0103]
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头
的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
[0104]
基于同样的发明构思,本技术实施例还提供了一种用于实现上述所涉及的基于随机森林的高压直流输电系统故障识别方法的基于随机森林的高压直流输电系统故障识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个基于随机森林的高压直流输电系统故障识别装置实施例中的具体限定可以参见上文中对于基于随机森林的高压直流输电系统故障识别方法的限定,在此不再赘述。
[0105]
在一个实施例中,如图4所示,提供了一种基于随机森林的高压直流输电系统故障识别装置,该装置400可以包括:
[0106]
数据获取模块401,用于获取高压直流输电系统的运行数据;
[0107]
特征提取模块402,用于从所述运行数据中提取出所述高压直流输电系统的运行特征;
[0108]
特征输入模块403,用于将所述运行特征输入至预先训练的故障识别模型,通过所述故障识别模型中的各个决策树模型,从预存的故障类型中确定出所述高压直流输电系统的候选故障类型,得到所述各个决策树模型输出的候选故障类型;所述预先训练的故障识别模型通过训练集,对待训练的故障识别模型进行训练得到;所述训练集由训练集生成模型,根据故障特征数据生成得到;
[0109]
类型确定模块404,用于根据所述各个决策树模型输出的候选故障类型的众数,从所述各个决策树模型输出的候选故障类型中,确定出所述高压直流输电系统的目标故障类型。
[0110]
在一个实施例中,该装置400还包括:模型训练模块,用于获取所述故障特征数据;将所述故障特征数据输入至所述训练集生成模型,得到所述训练集生成模型生成的所述训练集;利用所述训练集对所述待训练的故障识别模型进行训练,得到所述预先训练的故障识别模型。
[0111]
在一个实施例中,模型训练模块,还用于获取故障文本特征数据和故障图像数据;将所述故障图像数据输入至故障图像特征数据识别模型,得到所述故障图像数据的故障图像特征数据;根据所述故障文本特征数据和所述故障图像特征数据,确定所述故障特征数据。
[0112]
在一个实施例中,所述训练集生成模型中包含生成模型和判别模型;模型训练模块,还用于将所述故障特征数据输入至所述训练集生成模型,利用所述训练集生成模型中的所述生成模型和所述判别模型,根据所述故障特征数据,生成样本故障特征数据;根据所述样本故障特征数据,确定所述训练集。
[0113]
在一个实施例中,模型训练模块,还用于利用所述训练集对所述待训练的故障识别模型进行训练,得到待验证的故障识别模型;所述待验证的故障识别模型中包含待验证
的决策树模型;在所述待验证的决策树模型满足预设决策树模型条件的情况下,将所述待验证的故障识别模型作为所述预先训练的故障识别模型。
[0114]
在一个实施例中,模型训练模块,还用于对所述训练集进行多次随机抽取处理,得到所述训练集的多个训练子集;利用所述多个训练子集对所述待训练的故障识别模型进行训练,得到所述预先训练的故障识别模型。
[0115]
上述基于随机森林的高压直流输电系统故障识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0116]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口、通信接口、显示单元和输入装置。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口、显示单元和输入装置通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种基于随机森林的高压直流输电系统故障识别方法。该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0117]
本领域技术人员可以理解,图5中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0118]
在一个实施例中,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现上述各方法实施例中的步骤。
[0119]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0120]
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述各方法实施例中的步骤。
[0121]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
[0122]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,
本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0123]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0124]
以上所述实施例仅表达了本技术的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本技术专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本技术构思的前提下,还可以做出若干变形和改进,这些都属于本技术的保护范围。因此,本技术的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1