基于SSDAE的高压海底电缆状态评估方法及装置与流程

文档序号:28490431发布日期:2022-01-15 02:29阅读:209来源:国知局
基于SSDAE的高压海底电缆状态评估方法及装置与流程
基于ssdae的高压海底电缆状态评估方法及装置
技术领域
1.本技术涉及电力状态评估技术领域,特别涉及一种基于ssdae的高压海底电缆状态评估方法及装置。


背景技术:

2.本部分的陈述仅仅是提供了与本技术相关的背景技术,并不必然构成现有技术。
3.高压海底电缆输电具有远距离、大容量、低损耗电能跨海传输的优势,是实现海岛或海上平台供电、海上风电新能源并网、电网国际化互联的有效途径。近年来,高压海底电缆开始得到大量应用,其在线监测技术迅速成为国内外电力公司关注的热点。随着人工智能技术的快速发展,通过对海量数据资源进行深度挖掘与分析,实现高压海底电缆的状态自判别与故障自诊断,可有效避免传统人工诊断所存在的准确率与效率低等问题。
4.然而这些方法是以数据驱动为基础的,足量且分布平衡的训练样本才能保证人工智能算法具有出色的泛化能力,但高压海底电缆在实际运行中需长时间工作在正常状态,导致异常样本数量十分匮乏,这就导致训练出来的诊断模型具有一定的评估倾向性,对异常样本的预测能力降低。在高压海底电缆实际运维过程中,故障状态的漏判事件所造成的后果远严重于正常状态的误判事件。
5.基于此,如何修正高压海底电缆状态评估倾向性,提高对异常样本的预测准确率,甚至提升诊断模型的整体准确率,成为本领域技术人员亟待解决的技术问题。


技术实现要素:

6.为了解决现有技术的不足,本技术提供了一种基于stacked sparse denoising auto-encoder(ssdae)的高压海底电缆状态评估方法及装置,相较于传统方法实现了两类空间分布的平衡。两类样本对评价规则的影响是近似平衡的,因此可以修正高压海底电缆状态评估倾向性,提高对异常样本的预测准确率,甚至提升诊断模型的整体准确率。
7.为了实现上述目的,本技术采用如下技术方案:
8.本技术第一方面提供了一种基于ssdae的高压海底电缆状态评估方法,包括:
9.收集高压海底电缆状态在线监测数据,并整合成训练样本集;
10.确定每个样本的位置参数;
11.将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
12.将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
13.可选地,收集高压海底电缆状态在线监测数据,并整合成训练样本集,包括:
14.将高压海底电缆状态在线监测数据,按电流、温度和应力分类,并将所有数据统计整合成训练样本集。
15.可选地,确定每个样本的位置参数,包括:
16.计算每一个样本与其他样本之间的欧式距离;
17.以第i个样本xi为例,找到距离xi最近的五个不同类别样本,并统计五个不同类别
样本与样本xi的空间信息。对每个样本进行一次计算,得到每个样本的位置参数。
18.可选地,将样本分组,包括:
19.分别归一化正常样本和异常样本的位置参数;
20.将归一化位置参数分成多个区间;
21.按照多个区间将样本分组。
22.可选地,对每组样本采用样本生成方法,得到均衡的样本集包括:
23.确定两类样本在数量和空间分布上的不平衡信息;
24.基于空间分布的不平衡信息,通过样本生成方法对两类样本进行处理,得到均衡的样本集。
25.可选地,确定每个样本的位置参数前,还包括:
26.将样本集的数据中存在的空值、零值及远超量程的异常数值进行剔除处理;
27.将剔除异常数值后的数据重新整合,根据重新整合的样本集更新训练样本集。
28.可选地,将剔除异常数值后的数据重新整合,更新训练样本集后,还包括:
29.对样本集中由于异常数据剔除而产生的数据缺失采用缺失数据最近两个数据的均值来进行补缺处理,根据补缺完成后的样本集更新训练样本集。
30.本技术第二方面提供了一种用于基于ssdae的高压海底电缆状态评估的装置,包括:
31.数据整合模块:用于收集高压海底电缆状态在线监测数据,并整合成训练样本集;
32.数据处理模块:用于确定每个样本的位置参数;
33.数据生成模块:用于将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
34.数据输入模块:用于将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
35.可选地,收集高压海底电缆状态在线监测数据,并整合成训练样本集,包括:
36.将高压海底电缆状态在线监测数据,按电流、温度和应力分类,并将所有数据统计整合成训练样本集。
37.可选地,确定每个样本的位置参数,包括:
38.计算每一个样本与其他样本之间的欧式距离;
39.以第i个样本xi为例,找到距离xi最近的五个不同类别样本,并统计五个不同类别样本与样本xi的空间信息。对每个样本进行一次计算,得到每个样本的位置参数。
40.可选地,将样本分组,包括:
41.分别归一化正常样本和异常样本的位置参数;
42.将归一化位置参数分成多个区间;
43.按照多个区间将样本分组。
44.可选地,对每组样本采用样本生成方法,得到均衡的样本集包括:
45.确定两类样本在数量和空间分布上的不平衡信息;
46.基于空间分布的不平衡信息,通过样本生成的方法对两类样本进行处理,得到均衡的样本集。
47.可选地,确定每个样本的位置参数前,还包括:
48.将样本集的数据中存在的空值、零值及异常数值进行剔除处理;
49.将剔除异常数值后的数据重新整合,根据重新整合的样本集更新训练样本集。
50.可选地,将剔除异常数值后的数据重新整合,更新训练样本集后,还包括:
51.对样本集中由于异常数据剔除而产生的数据缺失采用缺失数据最近两个数据的均值来进行补缺处理,根据补缺完成后的样本集更新训练样本集。
52.本技术第三方面提供了一种介质,其上存储有程序,该程序被处理器执行时实现如本技术第一方面的基于ssdae的高压海底电缆状态评估方法中的步骤。
53.本技术第四方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现如本技术第一方面的基于ssdae的高压海底电缆状态评估方法中的步骤。
54.与现有技术相比,本技术的有益效果是:
55.将样本分成几个区间,采用样本生成方法改善每个区间的样本不均衡。传统方法需要生成的样本数量是通过比较两类样本的总数来确定的,新的样本是随机生成的,它们可能在临界或非临界情况下产生。因此,新生成的样本对评价规则的影响无法控制,本方案通过比较每个区间内两个类的数量来确定生成的样本数量,在每个间隔内分别生成相应的样本数量,相较于传统方法实现了两类空间分布的平衡。两类样本对评价规则的影响是近似平衡的,因此可以修正高压海底电缆状态评估倾向性的方法,来提高对异常样本的预测准确率,甚至提升诊断模型的整体准确率。
附图说明
56.图1为本公开实施例1提供的基于ssdae的高压海底电缆状态评估方法的流程图;
57.图2为本公开实施例1提供的原始样本集处理流程图;
58.图3为本公开实施例1提供的基于ssdae的高压海底电缆状态的具体流程图;
59.图4为本公开实施例2提供的用于基于ssdae的高压海底电缆状态评估的装置的示意图。
具体实施方式
60.应该指出,以下详细说明都是示例性的,旨在对本技术提供进一步的说明。除非另有指明,本技术使用的所有技术和科学术语具有与本技术所属技术领域的普通技术人员通常理解的相同含义。
61.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本技术的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
62.在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
63.实施例1:
64.如图1所示,本公开实施例提供了基于ssdae的高压海底电缆状态评估方法,包括以下步骤:
65.s01,收集高压海底电缆状态在线监测数据,并整合成训练样本集;
66.s02,确定每个样本的位置参数;
67.s03,将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
68.s04,将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
69.采用本公开实施例提供的基于ssdae的高压海底电缆状态评估方法,能够通过比较每个区间内两个类的数量来确定生成的样本数量,在每个间隔内分别生成相应的样本数量,相较于传统方法实现了两类空间分布的平衡。两类样本对评价规则的影响是近似平衡的,因此可以修正高压海底电缆状态评估倾向性的方法,来提高对异常样本的预测准确率,甚至提升诊断模型的整体准确率。
70.如图2所示,在一些实施例中,收集高压海底电缆状态在线监测数据,并整合成训练样本集,包括:
71.将高压海底电缆状态在线监测数据,按电流、温度和应力分类,并将所有数据统计整合成训练样本集。
72.在一些实施例中,确定每个样本的位置参数,包括:
73.计算每一个样本与其他样本之间的欧式距离;
74.以第i个样本xi为例,找到距离xi最近的五个不同类别样本,并统计三个不同类别样本与样本xi的空间信息。对每个样本进行一次计算,得到每个样本的位置参数。
75.可选地,对于每一个样本,在其近邻处有5个不同类样本,将5个样本与目标样本之间的欧氏距离之和定义为目标样本的位置参数di。
76.在一些实施例中,将样本分组,包括:
77.分别归一化正常样本和异常样本的位置参数;
78.将归一化位置参数分成多个区间;
79.按照多个区间将样本分组。
80.可选地,对每组样本采用样本生成方法,得到均衡的样本集包括:
81.确定两类样本在数量和空间分布上的不平衡信息;
82.基于空间分布的不平衡信息,通过样本生成的方法对两类样本进行处理,得到均衡的样本集。
83.在一些实施例中,确定每个样本的位置参数前,还包括:
84.将样本集的数据中存在的空值、零值及异常数值进行剔除处理;
85.将剔除异常数值后的数据重新整合,根据重新整合的样本集更新训练样本集。
86.可选地,异常数值是指远超量程的数值。
87.可选地,将剔除异常数值后的数据重新整合,更新训练样本集后,还包括:
88.对样本集中由于异常数据剔除而产生的数据缺失采用缺失数据最近两个数据的均值来进行补缺处理,根据补缺完成后的样本集更新训练样本集。
89.可选地,根据补缺完成后的样本集更新训练样本集后,还包括:
90.采用z-score标准化,对训练样本集s进行标准化,然后计算每一个样本到其他样本之间的距离d
ij

91.其中z-score标准化是指如下公式:
92.93.其中:x是原始数据,μ是全部数据的均值,σ为标准方差。
94.如图3所示,在一些实施例中,基于ssdae的高压海底电缆状态评估方法的具体实现步骤包括:
95.1)收集高压海底电缆状态在线监测数据,将其按电流、温度和应力分类,并将所有的数据统计整合成多个训练样本集a;
96.2)将各样本集的数据中存在的空值、零值及远超量程的异常数值进行剔除处理,并将剔除这些异常数值后的数据重新整合,更新训练样本集a,设为训练样本集b;
97.3)基于训练样本集b,采用线性插值的方法对样本集中由于异常数据剔除而产生的数据缺失进行补缺处理,以保留数据总体趋势的完整性,将补缺完成后的数据命名为训练样本集s;
98.4)采用z-score对训练样本集s进行标准化,然后计算每一个样本到其他样本之间的距离d
ij

[0099][0100]
其中:m为样本集s中各样本的特征维度;和分别为第i和第j个样本的第k维特征;
[0101]
5)对于每一个样本,在其k近邻处有α个不同类样本,将α个样本与目标样本之间的欧氏距离之和定义为目标样本的位置参数di;
[0102][0103]
6)分别通过线性归一化高压海底电缆正常样本和异常样本的位置参数di得到si和uj;
[0104][0105][0106]
其中:si为归一化后的高压海底电缆第i个正常样本的位置参数;uj为归一化后的高压海底电缆第j个异常样本的位置参数;d
s,i
为高压海底电缆第i个异常样品的位置参数;d
s,min
和d
s,max
分别为高压海底电缆正常样本中位置参数的最小值和最大值;d
u,j
为高压海底电缆第j个异常样品的位置参数;d
u,min
和d
u,max
分别为高压海底电缆异常样本中位置参数的最小值和最大值;
[0107]
7)根据si和uj,将两类样本分成n个区间,计算每个区间内两类样本的数量差ηk;
[0108]
ηk=|m
s,k-m
u,k
|,k=1,2,...,n
[0109]
其中,m
s,k
为第k个区间高压海底电缆正常样本的数量;m
u,k
为第k个区间高压海底电缆异常样本的数量;
[0110]
8)采用合成少数过采样技术作为样本生成方法用于平衡每个区间。每个区间产生的样本数为ηk,在每个区间随机抽取一些少数类样本,并在每个待生成的少数类样本周围再选择一个少数类样本,生成ηk个少数类样本xg,将新生成的样本整合成新的训练样本集
s’;
[0111]
xg=xi+λ
·
(x
i,n-xi)
[0112]
其中:xg为生成的样本;xi为随机选择的样本;x
i,n
为另一个在同一个区间内随机选择的样本;λ为0到1之间的随机数;
[0113]
9)对于新的训练样本集s’重复上述步骤5~8,直到每个区间的样本都均衡,即每个区间正常样本和异常样本的个数相等,最终整合成新的训练样本集s”;
[0114]
10)输入新的训练样本集s”,至训练ssdae模型,得到最终的诊断模型,该模型可用于高压海底电缆状态的实时评估。
[0115]
该方法通过统计每个样本近邻中五个类别不相同样本的空间信息,从而得到样本的空间分布情况,基于此将样本分成几个区间,采用样本生成方法改善每个区间的样本不均衡。传统方法需要生成的样本数量是通过比较两类样本的总数来确定的,新的样本是随机生成的,它们可能在临界或非临界情况下产生。因此,新生成的样本对评价规则的影响无法控制,本发明通过比较每个区间内两个类的数量来确定生成的样本数量,在每个间隔内分别生成相应的样本数量,相较于传统方法实现了两类空间分布的平衡。这样,两类样本对评价规则的影响是近似平衡的。
[0116]
结合上述实施例以ssdae分类器为基础,对比了几种常用的数据不平衡处理方法,包括过采样方法:自适应合成过采样技术(adaptive synthetic sampling,adasyn)和合成少数类过采样技术(synthetic minority oversampling technique,smote),随机欠采样方法,传统代价敏感方法,以及本方案的方法,实验结果对比如下表1:
[0117][0118]
表1
[0119]
由上表可知,本发明方法的修正效果最好,模型的整体准确率最高。
[0120]
实施例2:
[0121]
如图4所示,本公开实施例提供了基于ssdae的高压海底电缆状态评估的装置,包括:
[0122]
数据整合模块:用于收集高压海底电缆状态在线监测数据,并整合成训练样本集;
[0123]
数据处理模块:用于确定每个样本的位置参数;
[0124]
数据生成模块:用于将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
[0125]
数据输入模块:用于将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
[0126]
可选地,收集高压海底电缆状态在线监测数据,并整合成训练样本集,包括:
[0127]
将高压海底电缆状态在线监测数据,按电流、温度和应力分类,并将所有数据统计整合成训练样本集。
[0128]
可选地,确定每个样本的位置参数,包括:
[0129]
计算每一个样本与其他样本之间的欧式距离;
[0130]
以第i个样本xi为例,找到距离xi最近的五个不同类别样本,并统计五个不同类别样本与样本xi的空间信息。对每个样本进行一次计算,得到每个样本的位置参数。
[0131]
可选地,将样本分组,包括:
[0132]
分别归一化正常样本和异常样本的位置参数;
[0133]
将归一化位置参数分成多个区间;
[0134]
按照多个区间将样本分组。
[0135]
可选地,对每组样本采用样本生成方法,得到均衡的样本集包括:
[0136]
确定两类样本在数量和空间分布上的不平衡信息;
[0137]
基于空间分布的不平衡信息,通过样本生成的方法对两类样本进行处理,得到均衡的样本集。
[0138]
可选地,确定每个样本的位置参数前,还包括:
[0139]
将样本集的数据中存在的空值、零值及远超量程的异常数值进行剔除处理;
[0140]
将剔除异常数值后的数据重新整合,根据重新整合的样本集更新训练样本集。
[0141]
可选地,将剔除异常数值后的数据重新整合,更新训练样本集后,还包括:
[0142]
对样本集中由于异常数据剔除而产生的数据缺失采用缺失数据最近两个数据的均值来进行补缺处理,根据补缺完成后的样本集更新训练样本集。
[0143]
实施例3:
[0144]
本公开实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现如上述各实施例提供的基于ssdae的高压海底电缆状态评估方法中的步骤,包括:
[0145]
s01,收集高压海底电缆状态在线监测数据,并整合成训练样本集;
[0146]
s02,确定每个样本的位置参数;
[0147]
s03,将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
[0148]
s04,将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
[0149]
或者该程序被处理器执行时实现如上述各实施例提供的基于ssdae的高压海底电缆状态评估方法中的步骤。
[0150]
上述程序实现的方法的详细步骤与上述各实施例提供的基于ssdae的高压海底电缆状态评估方法相同,这里不再赘述。
[0151]
实施例4:
[0152]
本公开实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现如上述各实施例提供的基于ssdae的高压海底电缆状态评估方法中的步骤,包括:
[0153]
s01,收集高压海底电缆状态在线监测数据,并整合成训练样本集;
[0154]
s02,确定每个样本的位置参数;
[0155]
s03,将样本分组,对每组样本采用样本生成方法,得到均衡的样本集;
[0156]
s04,将均衡的样本集输入ssdae训练得到高压海底电缆状态评估模型。
[0157]
上述程序实现的方法的详细步骤与上述各实施例提供的基于ssdae的高压海底电缆状态评估方法相同,这里不再赘述。
[0158]
本领域内的技术人员应明白,本技术公开的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用硬件实施例、软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0159]
本技术是参照根据本公开实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0160]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0161]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0162]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0163]
以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1