多源异构电网数据融合方法、装置、设备及计算机介质与流程

文档序号:29492657发布日期:2022-04-06 13:55阅读:116来源:国知局
多源异构电网数据融合方法、装置、设备及计算机介质与流程

1.本发明涉及电力系统技术领域,特别是涉及一种多源异构电网数据融合方法、装置、设备及计算机介质。


背景技术:

2.随着智能电网与信息技术的高速发展,电力系统中多数据类型的海量信息极大促进了电力大数据的发展及应用。电力系统是一个复杂的高维系统,其内部数据流向有电力流、业务流、故障流、信息流和气象流等不同数据流,数据信息的多源异构问题,使得人们难以充分挖掘大数据的隐含信息,给电力大数据的高效应用造成极大阻碍。因此,对电力系统中多源异构数据进行综合处理,以获得符合应用需求的高价值信息,对于现代电网的高效运行具有重要意义。


技术实现要素:

3.针对上述技术问题,本发明提供一种多源异构电网数据融合方法、装置、设备及计算机介质,以为电网提供精准的多源异构数据融合信息。
4.第一方面,本发明提供一种多源异构电网数据融合方法,包括:
5.从多源异构电网数据中选取当前轮迭代的目标数据;
6.对所述目标数据进行迭代处理;在所述迭代处理过程中:计算所述多源异构电网数据与所述目标数据的相似度,基于相似度结果确定当前轮迭代的融合数据;对所述融合数据进行聚类,得到当前轮迭代的聚类结果;
7.将当前轮迭代的聚类结果与上一轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出当前轮迭代的融合数据。
8.可选的,所述方法还包括:当所述当前轮为初始轮时,从所述多源异构电网数据中选取初始轮迭代的目标数据,基于所述迭代处理过程对初始轮迭代的目标数据进行迭代处理,得到初始轮迭代的聚类结果;
9.根据初始轮迭代的聚类结果,确定所述多源异构电网数据中初始轮的下一轮迭代的目标数据,并基于所述迭代处理过程,得到所述初始轮的下一轮迭代的融合数据和聚类结果;
10.将所述初始轮的下一轮迭代的聚类结果与初始轮迭代的聚类结果进行校验,若校验结果满足预设条件,则输出所述初始轮的下一轮迭代的融合数据。
11.可选的,所述方法还包括:若所述校验结果不满足预设条件,则根据当前轮迭代的聚类结果确定所述多源异构电网数据中下一轮迭代的目标数据;
12.基于所述迭代处理过程,对下一轮迭代的目标数据进行迭代处理,得到下一轮迭代的融合数据和聚类结果;
13.将所述下一轮迭代的聚类结果与当前轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出所述下一轮迭代的融合数据。
14.可选的,所述方法还包括:基于所述聚类结果获取所述融合数据中的离群数据;根据所述离群数据确定所述多源异构电网数据中的异常信息。
15.可选的,所述迭代处理过程中,对所述融合数据进行聚类,得到聚类结果,具体为:
16.利用多种聚类算法分别对所述融合数据进行聚类,得到初始聚类结果集合;
17.对所述初始聚类结果集合进行二次聚类,得到当前轮迭代的二次聚类结果;其中,所述二次聚类结果包括若干个类簇中心,以及基于所述类簇中心确定的当前轮迭代的指标信息。
18.可选的,所述指标信息包括:
19.所述聚类结果中,各样本数据与对应类簇中心之间的距离信息。
20.可选的,所述多源异构电网数据包括:电网运行数据和电网设备状态数据。
21.第二方面,本发明提供一种多源异构电网数据融合装置,包括:
22.数据获取模块,用于从多源异构电网数据中选取当前轮迭代的目标数据;
23.迭代处理模块,用于对所述目标数据进行迭代处理;在所述迭代处理过程中:计算所述多源异构电网数据与所述目标数据的相似度,基于相似度结果确定当前轮迭代的融合数据;对所述融合数据进行聚类,得到当前轮迭代的聚类结果;
24.结果校验模块,用于将当前轮迭代的聚类结果与上一轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出当前轮迭代的融合数据。
25.第三方面,本发明提供一种数据处理设备,包括处理器,所述处理器和存储器耦合,所述存储器存储有程序,所述程序由所述处理器执行,使得所述数据处理设备执行第一方面所述的多源异构电网数据融合方法。
26.第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述第一方面所述的多源异构电网数据融合方法。
27.相比现有技术,本发明的有益效果在于:
28.本发明提供的多源异构电网数据融合方法通过计算多源异构电网数据与所选取的目标电网数据之间的相似度,将异构的电网数据融合为低维同构的电网融合数据,再通过聚类集成的方式得到融合数据的分布状态,并据此选取新的目标电网数据,再迭代多源异构电网数据的融合过程,使得最终输出的融合数据接近多源异构电网数据分布的自然状态;通过对输出的融合数据进行进一步的电网数据分析,可为电网高效、安全稳定运行提供更有价值的信息。
附图说明
29.为了更清楚地说明本发明的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
30.图1是本发明实施例提供的多源异构电网数据融合方法的流程示意图;
31.图2是本发明实施例提供的多源异构电网数据融合装置的结构示意图。
具体实施方式
32.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
33.如图1所示,第一方面,本发明一个实施例提供一种多源异构电网数据融合方法,具体包括下述步骤。
34.s1:从多源异构电网数据中选取当前轮迭代的目标数据。
35.可以理解的是,多源异构电网数据来源于电网中不同的业务系统,数据量往往庞杂且类型多样;在本实施例中,所述多源异构电网数据具体包括电网运行数据和电网设备状态数据。
36.在对所述多源异构电网数据进行数据融合时,首先需从多源异构电网数据选取若干个代表数据,作为当前轮迭代的目标数据。
37.需要说明的是,所述目标数据可在多源异构电网数据中随机选取,或基于限定条件对应选取。
38.s2:对所述目标数据进行迭代处理,在所述迭代处理过程中:计算所述多源异构电网数据与所述目标数据的相似度,基于相似度结果确定当前轮迭代的融合数据;对所述融合数据进行聚类,得到当前轮迭代的聚类结果。
39.在本实施例中,通过计算多源异构电网数据与目标数据之间的相似度,将多源异构电网数据融合为低维的同构电网融合数据。
40.具体地,迭代处理过程中,所述对融合数据进行聚类,得到聚类结果的具体过程为:利用多种聚类算法分别对融合数据进行聚类,得到初始聚类结果集合;再对初始聚类结果集合进行二次聚类,得到当前轮迭代的二次聚类结果。
41.其中,所述二次聚类结果包括若干个类簇中心,以及基于所述类簇中心确定的当前轮迭代的指标信息。
42.在本实施例中,所述指标信息是指所述聚类结果中,各样本数据与对应类簇中心之间的距离信息。
43.需要说明的是,本发明不对上述迭代过程中所使用的聚类算法类别进行限定。
44.在数据融合过程中,对于每一轮选取的目标数据,均进行上述迭代处理,以得到每一轮对应的融合数据和聚类结果;其中,所述聚类结果既用于校验融合数据的准确性,又作为下一轮迭代的目标数据选取的限定条件。
45.s3:将当前轮迭代的聚类结果与上一轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出当前轮迭代的融合数据。
46.基于预设条件对聚类结果进行校验,可确保最终输出的电网同构融合数据的分布状态更接近原始多源异构电网数据的分布状态,得到的融合数据准确性更高。
47.在本实施例中,若所述校验结果不满足预设条件,则根据当前轮迭代的聚类结果,确定所述多源异构电网数据中下一轮迭代的目标数据,并基于所述迭代处理过程,对下一轮迭代的目标数据进行迭代处理,从而得到下一轮迭代的融合数据和聚类结果。
48.进一步地,将所述下一轮迭代的聚类结果与当前轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出所述下一轮迭代的融合数据;若不满足,则重复上述过程。
49.需要说明的是,本实施例中,当所述当前轮为初始轮时,从所述多源异构电网数据
中选取初始轮迭代的目标数据;基于上述迭代处理过程对初始轮迭代的目标数据进行迭代处理,以得到初始轮迭代的聚类结果;再根据初始轮迭代的聚类结果,确定多源异构电网数据中,初始轮的下一轮迭代的目标数据,并基于所述迭代处理过程,得到初始轮的下一轮迭代的融合数据和聚类结果。
50.此时,将所述初始轮的下一轮迭代的聚类结果与初始轮迭代的聚类结果进行校验,若校验结果满足预设条件,则输出所述初始轮的下一轮迭代的融合数据。
51.通过上述方法得到多源异构电网数据对应的融合数据后,可基于所述融合数据的聚类结果,得到融合数据中的离群数据,再根据所述离群数据进一步获取所述多源异构电网数据中的异常信息,利用所述异常信息可确定电网中存在潜在故障的设备或部件。
52.以下将通过一个实施例具体描述所述多源异构电网数据的融合过程。
53.本实施例中,通过结合信息系统与电网物理系统以构建智能电网,因此,智能电网中的多源异构数据集包含了电网系统数据和信息系统数据。
54.1)从多源异构数据集中选取k0个目标数据,计算每一个多源异构数据与k0个目标数据之间的相似度,此时,可利用计算得到的k0个相似度结果构成新的同构电网融合数据。
55.在本实施例中,k0的取值为10。
56.在本实施例中,可将多源异构数据集表示为其中,表示电网系统数据,表示信息系统数据;具体地,xi={x
ij
|j=1,2,...,n}
t
和yi={y
ij
|j=1,2,...,n}
t
表示xi和yi对应的数据列向量,n1+n2=n。
57.本实施例中,多源异构数据的数量n取值为300,数据的维度n取值为30。
58.所选取的k0个目标数据表示为对应的,多源异构数据集可表示为
59.对于多源异构数据集中各电网系统数据之间的距离,可使用欧式距离进行计算:各信息系统数据之间的距离则使用余弦相似性进行计算:其中:
[0060][0061][0062][0063][0064]
因此,多源异构数据集x中,各异构数据与目标数据之间的距离可通过下式计算:
[0065][0066]
对于多源异构数据集x中任意的异构数据di,可基于前述异构数据与目标数据之间的距离计算公式进行计算,进而再计算异构数据di与目标数据rk间的相似度:
[0067]
sim(di,rk)=exp(-qd(di,rk)),q》0
[0068]
在本实施例中,q=2。
[0069]
进一步地,将所得到的相似度结果表示为z
ik
,即z
ik
=exp(-qd(di,rk))。
[0070]
进一步地,有:
[0071]
zi={z
ik
|k=1,2,...,k0};z={zi|i=1,2,...,n}
[0072]
此时,z即为多源异构数据转换后的同构的融合数据,其中,zi与di一一对应。
[0073]
2)选取多种聚类算法对步骤1中得到的融合数据z进行聚类,并基于每一种聚类算法计算对应融合数据z之间的关系矩阵,再将计算得到的关系矩阵进行分类汇总,以构建多个共联矩阵。
[0074]
具体地,本实施例选取了典型的8类聚类算法类型,每一类算法类型中包含2种算法,故共16种聚类算法,表示为
[0075]
进一步地,对16种聚类算法进行归类与编号,具体如表1所示。
[0076]
表1聚类算法以及类别
[0077][0078]
分别使用上述16种聚类算法对融合数据z进行聚类,所得到的聚类结果表示为θ={p1,p2,...,p
16
},其中,pk表示第k种聚类算法的聚类结果。
[0079]
进一步地,根据所得到的聚类结果构建各聚类算法所对应的关系矩阵qk,具体如下所示:
[0080][0081]
其中,k=1,2,...16。
[0082]
进一步地,通过下述公式计算归属于相同类型的聚类算法所对应的关系矩阵的均值:i=1,2,...,8。
[0083]
基于所述关系矩阵的均值结果可得到共联矩阵具体表示为
[0084]
3)对步骤2中得到的共联矩阵进行集成,得到融合数据z之间的最终共联矩阵,并基于所述最终共联矩阵进行融合数据的二次聚类。
[0085]
具体地,所述共联矩阵的集成过程如下述:
[0086]
首先,计算共联矩阵中任意不同的两个矩阵和间的相似度:
[0087][0088]
进一步地,令并据此计算各共联矩阵uk的权重ωk,具体为:
[0089][0090]
利用所得到的权重ωk可计算得到融合数据z的最终共联矩阵其表示为再依据所述最终共联矩阵选取表1所述的16种聚类算法中的算法m
11
(spectral using a sparse similarity matrix)对融合数据z进行二次聚类,得到聚类结果。
[0091]
4)基于步骤3所得到的聚类结果,选取k1个融合数据作为类簇中心,将所述类簇中心对应的k1个多源异构数据作为新的目标数据,并基于k1个新的目标数据重复上述步骤1至步骤3,直到聚类结果满足预设条件时停止。
[0092]
步骤4的具体步骤如下所示:
[0093]
首先,将上述融合数据z的聚类结果中的k1个类簇表示为并计算每个类簇ci的均值;在类簇ci中选取与所述均值之间欧式距离最小的融合数据作为该类簇的类簇中心,记为并计算指标信息wss:
[0094][0095]
进一步地,将所述类簇中心ci对应的多源异构数据表示为用作为新的目标数据以替换上一轮的目标数据r,并基于目标数据重复上述步骤1至步骤3,以得到新的融合数据以及新的k2个类簇
[0096]
选取所述类簇的中心点并计算本轮次的指标信息
[0097][0098]
对指标信息wss和指标信息进行校验,若满足预设条件:进行校验,若满足预设条件:则停止迭代,并输出融合数据若不满足,则重复步骤1至步骤4,直至输出最终的融合数据。
[0099]
在另一个实施例中,所述预设条件还可设置为k1=k2,即:当前轮迭代的聚类结果与上一轮迭代的聚类结果相同。
[0100]
需要说明的是,在上述步骤4中,完成了融合数据z的二次聚类后,如果存在融合数据不属于任一类簇,则该融合数据为离散数据。
[0101]
可以理解的是,离散数据对应的多源异构数据所包含的相应信息与其它异构数据包含的信息存在较大差异,因此,所述多源异构数据所对应的电网设备或部件为潜在故障设备或部件。
[0102]
本发明上述实施例提供的多源异构电网数据融合方法通过计算多源异构电网数据与选取的目标数据之间的相似度,将异构的电网数据融合为低维同构融合数据;再通过聚类集成的方式得到融合数据的分布状态,并据此选取新的目标数据,进而迭代上述数据融合过程。迭代后最终得到的融合数据结果更准确,且更接近于电网数据分布的自然状态;同时还可得到原始多源异构电网数据分布的状态。
[0103]
利用所得到的融合数据进行进一步的电网数据分析,可为电网高效、安全稳定运行提供更有价值的信息。
[0104]
参照图2,第二方面,本发明一个实施例还提供一种多源异构电网数据融合装置,包括数据获取模块101、迭代处理模块102和结果校验模块103。
[0105]
数据获取模块101用于从多源异构电网数据中选取当前轮迭代的目标数据。
[0106]
迭代处理模块102用于对所述目标数据进行迭代处理;在所述迭代处理过程中:计算所述多源异构电网数据与所述目标数据的相似度,基于相似度结果确定当前轮迭代的融合数据;对所述融合数据进行聚类,得到当前轮迭代的聚类结果。
[0107]
结果校验模块103用于将当前轮迭代的聚类结果与上一轮迭代的聚类结果进行校验,若校验结果满足预设条件,输出当前轮迭代的融合数据。
[0108]
上述装置内的各模块之间信息交互、执行过程等内容,由于与本发明第一方面提供的多源异构电网数据融合方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
[0109]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方法的目的。
[0110]
第三方面,本发明提供一种数据处理设备,包括处理器,所述处理器和存储器耦合,所述存储器存储有程序,所述程序由所述处理器执行,使得所述数据处理设备执行第一方面所述的多源异构电网数据融合方法。
[0111]
第四方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现如上述第一方面所述的多源异构电网数据融合方法。
[0112]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可监听存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)或随机存储记忆体(random access memory,ram)等。
[0113]
以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1