一种配电网信息物理侧风险预警方法及系统与流程

文档序号:18669081发布日期:2019-09-13 20:38阅读:182来源:国知局
一种配电网信息物理侧风险预警方法及系统与流程

本发明涉及配电网技术领域,具体涉及一种配电网信息物理侧风险预警方法及系统。



背景技术:

随着智能电网与能源互联网的发展,电力系统正成为一个融合电力、信息及通信网络的复杂大系统。信息物理融合系统(cyberphysicalsystem,cps)、能源信息融合系统(energyinformationsystem,eis)等概念也被提出以体现电力系统这种新的特点。信息网络融入电力物理系统,提高了电力系统运行效率,但同时也增加了电力系统的运行风险。信息物理融合背景下的复杂有源配电网安全性和可靠性是非常值得关注的问题,因此研究信息网络作用下的配电网运行风险显得十分必要。

大量的新型传感器与传感器网络接入配电网,使得配电网用电信息采集系统、配电线路在线监测系统、配电自动化系统和配变负荷监测系统等信息系统不断完善。获取信息网络-物理系统的运行状态信息和数据进行深度挖掘是对配电网信息物理融合系统中各种不确定性分析、预测的基础。配电网信息化起步较晚,数据质量、数据种类和数据完善度较差,需对配电网相关信息系统进行调研和分析,基于现有的、可靠的配电网数据信息进行数据预处理。如何高效地使用配电网信息侧和物理侧的数据源,灵活地将信息物理融合的大数据用于配电网风险特征的分析,实现对配电网故障准确预测和潜在风险扫描,从而针对配电网信息物理侧的薄弱环节进行风险报警,已成为当前亟待解决的问题。

信息网络和物理系统融合下的复杂有源配电网中的数据规模不断增大,使得配电网信息物理系风险数据源复杂、数据维数高、数据结构多样。大数据机器学习与数据挖掘的方法已经被广泛应用于电力系统运行的安全特征挖掘,其中特征选择作为一种数据降维方法,将原始的高维特征空间,通过某种标准筛选出一个最优或最有效的特征子集,剔除冗余特征,从而达到了降低电力系统特征维数的目的。但特征选择方法用于配电网cps风险预测领域的研究仍然较少,而且现有研究中特征选择方法主要分析特征之间的关联性,没有对配电网风险特征之间的独立性系统研究,未经筛选的原始风险特征之间会缺少数据的关联性,导致出现配电网信息物理侧风险等级预测精度低,效率低和报警信息不准确的问题。



技术实现要素:

为了解决现有技术中所存在的原始风险特征数据未经最优筛选,导致风险等级预测精度低,得到配电网信息物理侧薄弱环节的错误预警的问题,本发明提供了一种配电网信息物理侧风险预警方法及系统。

本发明提供的技术方案是,包括:

基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,并筛选得到最优风险因素特征集合;

将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级;

基于所述风险运行等级进行预警处理;

所述风险因素类别,包括:故障数据、运行数据、档案数据、气象数据和网络数据;

所述风险因素特征集合:停电时间、停电次数、配置容量、线路长度、温度、风速、网络攻击频率、通信故障次数和数据篡改次数。

优选的,所述基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,包括:

根据故障数据、运行数据、档案数据、气象数据和网络数据类型,从配电网信息物理系统的风险数据源中,获取各类原始数据;

基于各类原始数据,构建风险因素特征集合。

优选的,所述基于各类原始数据,构建风险因素特征集合,包括:

将所述各类原始数据进行填充,并对填充后的原始数据的特征值进行判断,若所述特征值全部为缺失值,则不进行规范化处理;否则,将所述特征值映射到预设区间内;

将天气数据按天气类型进行分类,并将天气类型用数值进行表示;

将风力数据按风力等级进行分类,并将风力等级用数值进行代表;

将所述天气类型和风力等级对应的数值,将风险值转换为类别型数据,得到风险因素特征集合。

优选的,所述筛选得到最优风险因素特征集合,包括:

通过所述独立性准则处理所述风险因素特征集合中的元素,得到积累分部函数;

基于所述积累分部函数,求取元素的独立性,并将所述元素进行独立性排序,筛选出风险因素最优特征集合。

优选的,所述积累分部函数如下式所示:

pvalue=1-f(x|α,β)

其中,f(x|α,β)是元素中gamma参数α和gamma参数β的累积分布函数,pvalue为元素独立性。

优选的,所述将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级,包括:

基于所述最优风险因素特征集合,确定配故障风险样本集,并进行去量纲预处理;

将去量纲预处理后的数据,通过随机森林、神经网络、支持向量机和集成学习算法分别构建初始评估模型并基于所述初始评估模型进行初始预测得到初始预测结果;

基于所述初始预测结果和实际数据进行比对,得到精准率和召回率,并根据所述精准率和召回率确定最优评估模型;

基于所述最优评估模型进行风险等级预测,得到当前配电网信息物理侧运行风险等级。

优选的,所述将去量纲预处理后的数据,通过随机森林、神经网络、支持向量机和集成学习算法分别构建初始评估模型并基于所述初始评估模型进行初始预测得到初始预测结果,包括:

将所述去量纲预处理后的数据按照预设比例分为训练数据和预测数据;

将所述训练数据通过随机森林、神经网络、支持向量机和集成学习算法分别进行训练,构建初始评估模型;

将所述预测数据通过所述初始评估模型进行初始评估,得到初始预测结果。

一种配电网信息物理侧风险预警系统,所述系统,包括:

最优特征集合获取模块:基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,并筛选得到最优风险因素特征集合;

风险等级预测模块:将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级;

预警模块:基于所述风险运行等级进行预警处理;

所述风险因素类别,包括:故障数据、运行数据、档案数据、气象数据和网络数据;

所述风险因素特征集合:停电时间、停电次数、配置容量、线路长度、温度、风速、网络攻击频率、通信故障次数和数据篡改次数。

优选的,所述最优特征集合获取模块,包括:

原始数据获取子模块:根据故障数据、运行数据、档案数据、气象数据和网络数据类型,从配电网信息物理系统的风险数据源中,获取各类原始数据;

风险因素特征集合构建子模块:基于各类原始数据,构建风险因素特征集合。

优选的,所述风险因素特征集合构建子模块,包括:

规范化处理单元:将所述各类原始数据进行填充,并对填充后的原始数据的特征值进行判断,若所述特征值全部为缺失值,则不进行规范化处理;否则,将所述特征值映射到预设区间内;

天气数据处理单元:将天气数据按天气类型进行分类,并将天气类型用数值进行表示;

风力数据处理单元:将风力数据按风力等级进行分类,并将风力等级用数值进行代表;

风险因素特征集合获取单元:将所述天气类型和风力等级对应的数值,将风险值转换为类别型数据,得到风险因素特征集合。

优选的,所述最优特征集合获取模块,还包括:

积累分部函数获取子模块:通过所述独立性准则处理所述风险因素特征集合中的元素,得到积累分部函数;

筛选子模块:基于所述积累分部函数,求取元素的独立性,并将所述元素进行独立性排序,筛选出风险因素最优特征集合。

与现有技术相比,本发明的有益效果为:

本发明提供的技术方案,包括:基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,并筛选得到最优风险因素特征集合;将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级;基于所述风险运行等级进行预警处理;所述风险因素类别,包括:故障数据、运行数据、档案数据、气象数据和网络数据;所述风险因素特征集合:停电时间、停电次数、配置容量、线路长度、温度、风速、网络攻击频率、通信故障次数和数据篡改次数。本方案充分考虑了配电网信息侧和物理侧的风险数据进行筛选,得到最优数风险因素特征集合,提高了配电网信息物理系统风险等级预测的计算效率和预警精度;基于配电网信息侧和物理侧的各类风险数据,考虑了不同风险数据的不同类型,从而进行独立性筛选,提高了配电网信息物理侧风险预测精度,降低了错误预警的概率。

附图说明

图1为本发明的一种配电网信息物理侧风险预警方法流程图;

图2为本发明的配电网信息物理系统风险数据源和多因素特征集合;

图3为本发明的独立性特征选择方法流程图;

图4为本发明的风险等级预测实现流程图。

具体实施方式

为了更好地理解本发明,下面结合说明书附图和实例对本发明的内容做进一步的说明。

实施例1:

本实施例提供了一种配电网信息物理侧风险预警方法,如图1所示,包括:

s1:基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,并筛选得到最优风险因素特征集合。

1、调研cps风险数据源:

通过对配电网信息管理系统中电网gis平台、营销业务应用系统、电能质量监测系统/用电信息采集系统、设备(资产)运维精益管理系统、调度自动化系统、oms/scada系统和气象信息系统的调研,风险数据源和多因素特征集合的示意图,如图2所示。

提取对应故障数据、运行数据、档案数据、气象数据和网络数据等用于配电网cps风险等级划分和预测。

2、cps风险数据预处理:

由于原始数据存在缺失、错漏等问题,因此需要先对配电网cps风险数据进行预处理,主要包括数据填充、特征规范化、特征映射等步骤。

(1)数据填充:

对原始数据中一些异常数据和缺失数据进行处理,常用的数据填充方法有均值填充、随机填充、线性回归填充以及em填充等。本发明中对于原始数据中的缺失值,将其填充为0;对于异常值,由于包含异常值的记录很少,直接删除包含异常值的记录。

(2)特征规范化:

对原始数据做规范化处理.常见的规范化方法有最小-最大规范化、z-score规范化及小数定标规范化等。本发明中采用区间规范化的方法,将所有特征值映射到[0,1]区间,如果特征取值全为0,不对该特征规范化,保持原始0值。

(3)特征映射:

由于在原始数据中有的特征是以文字的形式来描述的,因此需要转换为类别型数据才能作为算法输入,而有的特征是数值型的数据,在用于分类时也要转换为类别型数据才能作为算法输入。通过定义转换规则将特征进行映射。常用的特征映射方法有自组织特征映射、拉普拉斯特征映射、等距特征映射以及多域特征映射等。

本发明采用的转换规则如下:

1)天气规则转换:

首先,将天气分为雪、大雨、中雨、小雨、阴、多云和晴和其它等8类,分别用数值0~7代表;其次,将各类天气归入符合的最坏的天气类型。例如:“阴~小雨”归入小雨类,“中雨~小雨”归入大雨类。

2)风力转换规则:

风力转换规则与天气情况的转换规则类似,将风力归纳为1-2级、3-4级、5-6级、7-8级和其它等5个等级,分别用数值0~4代表.将原始风力情况归入相匹配的最大风力等级。

3)风险值转换规则:

由于实验数据中的风险值是数值型数据,要转换为类别型数据才能作为输出,因此采用风险值区间划分映射的方法将数值型数据转换为类别型数据输出为风险等级。

3.cps风险多因素特征集合:

分析配电网cps风险数据源,对故障数据、运行数据、档案数据、气象数据和网络数据进行数据预处理后,确定包括停电时间、停电次数、配变容量、线路长度、温度、风速、网络攻击频率、通信故障次数、数据篡改次数等的配电网cps风险多因素特征集合。

基于rkhs计算互协方差算子,采用一种基于rkhs上算子特征谱的独立性准则(即hilbertschmidt独立性准则,hsic)来对算子进行估计,从这些算子中推导出适合度量独立性的统计量来决定独立性的大小。

x和y分别是域χ和γ的随机变量,(hx,kx)和(hy,ky)分别是定义在χ和γ上的再生核希尔伯特空间,通过将原始变量映射为相应的核函数φx(x)和φy(y),核函数取高斯径向基核k(x,y)=exp(-||x-y||2/2σ2)。采用中值法确定高斯核中的参数σ,即|σ=median{||xi-xj||i≠j}。可得到hx和hy上的随机变量。互协方差算子∑xy定义为:

式中,表示张量集;φx(x)为x域的核函数,φy(y)为y域的核函数。

hsic定义为互协方差算子∑xy的hs范数平方,即:

当且仅当时,x和y独立。

对于给定样本z={(x1,y1),……(xn,yn)},hsic基于样本z的估计量为:

根据统计量hsic(z),可得到基于hsic的独立性检验标准。通过零假设h0:x与y独立,则可导出经验估计hsic(z)在h0下的渐进分布为一个二参数的gamma分布,近似表达为:

式中,α和β分别为gamma分布中的两个参数。e(hsic(z))和var(hsic(z))在零假设下的经验估计为:

根据hsic(z)在h0下的渐进分布,计算pvalue,即:

pvalue=1-f(x|α,β)(8)

式中,f(x|α,β)是参数为α和β的gamma分布的累积分布函数。pvalue的大小可用于衡量特征x与y独立性的大小,pvalue越大特征之间独立性越强,反之,独立性关系越弱。

配电网cps风险最优特征选择方法流程如图3所示。基于rkhs独立性度量方法求得pvalue的平均值后排序,筛选风险因素最优特征集合。

s2:将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级。

配电网cps故障风险等级预测实现流程,如图4所示。

首先,基于配电网cps故障风险最优特征集合,确定配电网cps故障风险样本集,并对样本数据经过“归一化”做去量纲预处理;

其次,对配电网cps故障风险样本数据进行拆分,按7:3的比例随机拆分,70%的数据用来训练模型,30%的数据用来预测;

再次,选择机器学习中的随机森林、神经网络、支持向量机、集成学习等分类算法分别对配电网cps故障风险进行预测;

最后,对比预测的精确率和召回率,确定产生最佳效果的算法训练模型,进行配电网cps故障风险等级的在线预测。

s3:基于所述风险运行等级进行预警处理。

实施例2:

本实施例提供了一种配电网信息物理侧风险预警系统,所述系统,包括:

最优特征集合获取模块:基于风险因素类别,从配电网信息物理侧的风险数据源中获取风险因素特征集合,并筛选得到最优风险因素特征集合;

风险等级预测模块:将最优风险因素特征集合带入预先构建的风险等级在线预测模型,得到当前配电网信息物理侧运行风险等级;

预警模块:基于所述风险运行等级进行预警处理;

所述风险因素类别,包括:故障数据、运行数据、档案数据、气象数据和网络数据;

所述风险因素特征集合:停电时间、停电次数、配置容量、线路长度、温度、风速、网络攻击频率、通信故障次数和数据篡改次数。

所述最优特征集合获取模块,包括:

原始数据获取子模块:根据故障数据、运行数据、档案数据、气象数据和网络数据类型,从配电网信息物理系统的风险数据源中,获取各类原始数据;

风险因素特征集合构建子模块:基于各类原始数据,构建风险因素特征集合。

所述风险因素特征集合构建子模块,包括:

规范化处理单元:将所述各类原始数据进行填充,并对填充后的原始数据的特征值进行判断,若所述特征值全部为缺失值,则不进行规范化处理;否则,将所述特征值映射到预设区间内;

天气数据处理单元:将天气数据按天气类型进行分类,并将天气类型用数值进行表示;

风力数据处理单元:将风力数据按风力等级进行分类,并将风力等级用数值进行代表;

风险因素特征集合获取单元:将所述天气类型和风力等级对应的数值,将风险值转换为类别型数据,得到风险因素特征集合。

所述最优特征集合获取模块,还包括:

积累分部函数获取子模块:通过所述独立性准则处理所述风险因素特征集合中的元素,得到积累分部函数;

筛选子模块:基于所述积累分部函数,求取元素的独立性,并将所述元素进行独立性排序,筛选出风险因素最优特征集合。

所述积累分部函数子模块得到的积累分部函数如下式所示:

pvalue=1-f(x|α,β)

其中,f(x|α,β)是元素中gamma参数α和gamma参数β的累积分布函数,pvalue为元素独立性。

所述风险等级预测模块,包括:

去量纲预处理子模块:基于所述最优风险因素特征集合,确定配故障风险样本集,并进行去量纲预处理;

初始预测结果获取子模块:将去量纲预处理后的数据,通过随机森林、神经网络、支持向量机和集成学习算法分别构建初始评估模型并基于所述初始评估模型进行初始预测得到初始预测结果;

最优评估模型确定子模块:基于所述初始预测结果和实际数据进行比对,得到精准率和召回率,并根据所述精准率和召回率确定最优评估模型;

预测子模块:基于所述最优评估模型进行风险等级预测,得到当前配电网信息物理侧运行风险等级。

所述初始预测结果获取子模块,包括:

划分单元:将所述去量纲预处理后的数据按照预设比例分为训练数据和预测数据;

初始评估模型构建单元:将所述训练数据通过随机森林、神经网络、支持向量机和集成学习算法分别进行训练,构建初始评估模型;

初始预测结果获取单元:将所述预测数据通过所述初始评估模型进行初始评估,得到初始预测结果。

显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上仅为本发明的实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均包含在申请待批的本发明的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1