本发明涉及一种生成对应电网运行环境下的大数据因果模型的方法,属于电网自动化调度技术领域。
背景技术:
随着科学技术的不断发展以及电力系统的不断完善,不仅为人们的生活带来了无限的便利(如照明等),而且在人们的出行等方面也提供了更多的便利(如电动汽车、火车和有轨电车等)。而特高压电网建设的全面提速、新能源的快速发展和电力市场化改革的深入推进,电网一体化运行的特征愈发明显,对电网实施集中分析决策、多专业间业务协作和跨调度机构工作协同等需求更加迫切。
近年来,电网调度控制中心所能获取的信息资源越来越丰富,电网设备调控分析可利用的信息源也越来越多,而且信息量巨大,如电网设备的调控大数据。但是,大数据统计究其本身是统计分析的方法,无法检验逻辑上的因果关系,而且无法直观体现电网设备发生缺陷事件的因果关系,使得观察者无法直观的从数据中得知电网设备发生缺陷的原因以及原因的数据等。
技术实现要素:
本发明要解决的技术问题是目前电网系统中,电网调度控制中心所能获取的信息资源越来越丰富,电网设备调控分析可利用的信息源也越来越多,信息量巨大吗,而现有大数据统计究其本身是统计分析的方法,无法检验逻辑上的因果关系,使得观察者很难快速直观的从大量信息中了解到电网发生缺陷的直接原因。针对现有技术不足,提出一种生成对应电网运行环境下的大数据因果模型的方法。
本发明为了解决上述技术问题提出的技术方案是:一种生成对应电网运行环境下的大数据因果模型的方法,执行如下步骤:
1)获取与当前电网设备运行过程中发生事件相关联的关联因素集合,包括:
①获取与当前电网设备运行过程中发生事件相关联的因素;
②计算与当前电网设备运行过程中发生事件相关联的每个因素分别与所述事件之间的关联概率;
针对与当前电网设备运行过程中发生事件相关联的第i个因素,根据以下公式计算所述第i个因素与所述事件之间的关联概率
其中,ri为所述第i个关联因素与所述事件的关联概率,σxy为所述事件与所述第i个关联因素之间的关联值,σx为所述第i个关联因素的值,σy为所述事件的值;
③将计算出的关联概率大于第一预设值的因素所构成的集合确定为所述事件对应的关联因素集合;
2)从所述关联因素集合中筛选出与所述事件的相关性大于第二预设值的高概率关联因素;
3)对所述高概率关联因素与所述事件进行因果关系检测,并确定出所述高概率关联因素中与所述事件之间满足因果关系的强关联因素;
4)基于所述强关联因素,利用贝叶斯因果网络和调控大数据生成大数据因果模型,其中,所述调控大数据包括所述当前电网设备运行过程中的运行数据和调控数据;
5)将所述大数据因果模型和预设的经验模型进行匹配结合,生成当前电网设备的调控业务大数据因果模型;
基于所述强关联因素,使用有向图对所述强关联因素进行表征;
对所述有向图中的有向节点集进行条件依赖编码;
使用联合概率分布,对所述有向图中的无有向边连接的无向节点集进行条件独立编码;
基于所述条件依赖编码和所述条件独立编码,利用贝叶斯因果网络和调控大数据生成大数据因果模型;
其中,所述调控大数据包括所述当前电网设备运行过程中的运行数据和调控数据。
上述技术方案的改进是:步骤3)通过分别对所述事件和所述高概率关联因素进行回归性处理,获得所述事件的第一时间序列和所述高概率关联因素的第二时间序列;
基于所述第一时间序列和所述第二时间序列,对所述事件和所述高概率关联因素进行相关性检验;
基于所述相关性检验的结果,从所述高概率关联因素中确定与所述事件之间满足因果关系的强关联因素。
上述技术方案的改进是,所述分别对所述事件和所述高概率关联因素进行回归性处理,获得所述事件的第一时间序列和所述高概率关联因素的第二时间序列,包括:
根据以下回归公式计算所述事件的第一时间序列:
根据以下回归公式计算所述高概率关联因素的第二时间序列:
其中,yt为所述第一时间序列,xt为所述第二时间序列,αi、βi、λi和δi均为回归系数,ut1和ut2为白噪声,q为第一时间序列长度,s为第二时间序列长度。
上述技术方案的改进是,所述基于所述第一时间序列和所述第二时间序列,对所述事件和所述高概率关联因素进行相关性检验,包括:根据以下相关性检验方程计算所述事件和所述高概率关联因素的关联度:
其中,yt为所述第一时间序列,xt为所述第二时间序列,
本发明采用上述技术方案的有益效果是:本发明可以生成对应当前电网环境下的大数据因果模型。通过确定与电网设备运行过程中发生事件相关联的关联因素集合;从获取的关联因素集合中筛选出与所述事件的相关性大于设定值的高概率关联因素;对所述高概率关联因素与所述事件进行因果关系检测,从所述高概率关联因素中确定出与所述事件之间满足因果关系的强关联因素;基于所述强关联因素,利用贝叶斯因果网络和调控大数据生成大数据因果模型。
与现有技术中的调控大数据相比,本发明通过从关联因素集合中确定强关联因素,并将利用贝叶斯因果网络和调控大数据生成的大数据因果模型与预设的经验模型相匹配结合,得到调控业务大数据因果模型,可以直观的体现出电网设备发生缺陷事件与影响该时间的各因素之间的因果关系,和各因素及因果关系的数据体现,方便观察者在突发情况下使用本发明所提供的模型快速得到电网设备发生缺陷的原因。
附图说明
下面结合附图对本发明作进一步说明:
图1是本发明实施例一种可能的应用场景下的系统架构图。
具体实施方式
实施例
本实施例的一种生成对应电网运行环境下的大数据因果模型的方法,执行如下步骤:
1)获取与当前电网设备运行过程中发生事件相关联的关联因素集合,包括:
①获取与当前电网设备运行过程中发生事件相关联的因素;
②计算与当前电网设备运行过程中发生事件相关联的每个因素分别与所述事件之间的关联概率;
针对与当前电网设备运行过程中发生事件相关联的第i个因素,根据以下公式计算所述第i个因素与所述事件之间的关联概率
其中,ri为所述第i个关联因素与所述事件的关联概率,σxy为所述事件与所述第i个关联因素之间的关联值,σx为所述第i个关联因素的值,σy为所述事件的值;
③将计算出的关联概率大于第一预设值的因素所构成的集合确定为所述事件对应的关联因素集合;
2)从所述关联因素集合中筛选出与所述事件的相关性大于第二预设值的高概率关联因素;
3)对所述高概率关联因素与所述事件进行因果关系检测,并确定出所述高概率关联因素中与所述事件之间满足因果关系的强关联因素;
通过分别对所述事件和所述高概率关联因素进行回归性处理,获得所述事件的第一时间序列和所述高概率关联因素的第二时间序列;
基于所述第一时间序列和所述第二时间序列,对所述事件和所述高概率关联因素进行相关性检验;
基于所述相关性检验的结果,从所述高概率关联因素中确定与所述事件之间满足因果关系的强关联因素;
所述分别对所述事件和所述高概率关联因素进行回归性处理,获得所述事件的第一时间序列和所述高概率关联因素的第二时间序列,包括:
根据以下回归公式计算所述事件的第一时间序列:
根据以下回归公式计算所述高概率关联因素的第二时间序列:
其中,yt为所述第一时间序列,xt为所述第二时间序列,αi、βi、λi和δi均为回归系数,ut1和ut2为白噪声,q为第一时间序列长度,s为第二时间序列长度。
所述基于所述第一时间序列和所述第二时间序列,对所述事件和所述高概率关联因素进行相关性检验,包括:
根据以下相关性检验方程计算所述事件和所述高概率关联因素的关联度:
其中,yt为所述第一时间序列,xt为所述第二时间序列,
4)基于所述强关联因素,利用贝叶斯因果网络和调控大数据生成大数据因果模型,其中,所述调控大数据包括所述当前电网设备运行过程中的运行数据和调控数据;
5)将所述大数据因果模型和预设的经验模型进行匹配结合,生成当前电网设备的调控业务大数据因果模型;
基于所述强关联因素,使用有向图对所述强关联因素进行表征;
对所述有向图中的有向节点集进行条件依赖编码;
使用联合概率分布,对所述有向图中的无有向边连接的无向节点集进行条件独立编码;
基于所述条件依赖编码和所述条件独立编码,利用贝叶斯因果网络和调控大数据生成大数据因果模型;
其中,所述调控大数据包括所述当前电网设备运行过程中的运行数据和调控数据。
本发明的一种可能应用的场景,在某一如图1所示的电网环境下,对电网设备在运行过程中发生事件相关联的因素与时间进行关联分析,以便直观的体现出电网设备发生缺陷事件与影响该时间的各因素之间的因果关系,以及各因素和因果关系的数据体现,方便观察者直观和清晰的查看。所述电网环境包括基于本方法的一个分析装置、应用服务器和多个电网设备,分析装置与应用服务器连接,可以从应用服务器中调用各种数据,如电网设备的各种运行数据以及调控数据等,应用服务器可以收集电网设备的各种数据,如电网设备的基础数据、使用数据和调控数据等,还可以对电网设备进行调制和控制等,电网设备可以是各种不同功能和不同类型的电力设备,如电网网架、变压器、高压柜和低压柜等等。上述示例中,是以分析装置与应用服务器连接,从应用服务器中调取数据,但并不局限于此,在其他示例中,因果装置还可以是在与应用服务器连接的同时,还直接与各电力设备连接,或者与数据库等连接,以调取电网设备的数据。通过从关联因素集合中确定强关联因素,并将利用贝叶斯因果网络和调控大数据生成的大数据因果模型与预设的经验模型相匹配结合,得到调控业务大数据因果模型,可以直观的体现出电网设备发生缺陷事件与影响该时间的各因素之间的因果关系,和各因素及因果关系的数据体现,方便观察者直观和清晰的查看。
本发明不局限于上述实施例。凡采用等同替换形成的技术方案,均落在本发明要求的保护范围。