本发明涉及配电网领域、大数据领域和人工智能领域,特别是一种新型的配电网运行状态画像分析方法。
背景技术:
随着近年来配电网规模不断扩张,智能配电网建设的不断深入和配用电领域的深度融合,采集终端的数据急剧增长,配用电数据量从tb级向pb级发展。配电业务逐步向智能化、精益化方向发展,需要进一步提升跨业务、跨平台的数据分析和处理能力。画像是一种快速、精准的分析方式,已广泛应用于金融、电信等领域。目前国内对于电力行业的画像多基于用户层面,针对配网运行方面的画像多采用分级指标,权值定义方式得到一个偏主观性的评价结果,为此建立一个基于营配贯通、面向配电业务应用的大数据体系架构,实现信息统一的存储、处理、可视化功能,结合机器学习内容,开展配电网健康状态评估技术研究,对提高电网运行的安全性、经济性和推进配电网管理水平具有重要意义。
现有的配网运行评价体系多采用分级指标评价,在指标间关联性分析时采用的是层次分析法、专家法、熵权法或者上述方法的结合,存在着评价结果主观性较强、准确度不高的缺点,且缺少对不同配网间的对比及运行薄弱点的挖掘。为此本申请在关联性分析时摒弃传统的权值定义,采用更为客观准确的评价方式最终构建起配网运行的画像,并且依据所形成的画像在纵向和横向上对各级配网进行挖掘、分析,找到配网运行的薄弱环节,指导实际的生产工作。
技术实现要素:
有鉴于此,本发明的目的是提供一种新型的配电网运行状态画像分析方法,采用受限玻尔兹曼机(rbm)来构建神经网络训练模型,通过机器的自我学习,摒弃了传统的指标权值定义,构建起配网运行的画像,使得评价结果更加客观准确。
本发明采用以下方案实现:一种新型的配电网运行状态画像分析方法,包括以下步骤:
步骤s1:从营配调相关生产和管理系统获取基础数据;
步骤s2:采用孤立森林法对步骤s1中获取的基础数据进行清洗;
步骤s3:对步骤s2中进行清洗后的正常数据作为特征量,参考城市配电网运行水平和供电能力评估导则构建指标体系,用层次分析法进行评价,再结合历史经验数据和实际生产要求进行评价结果的调整,并将调整后的评价结果作为s4中神经网络训练的标签;
步骤s4:将调整后的评价结果作为神经网络训练的标签构建神经网络模型,对各级别的指标进行关联性分析;
步骤s5:建立并分析画像,建立并分析画像,用以直观地展示各级配网运行状态水平,通过不同画像间的对比,挖掘配网运行存在的薄弱环节。
进一步地,所述营配调相关生产和管理系统包括但不限于调度管理系统、生产管理系统、用电信息采集系统和配网调度智能管控平台。
进一步地,所述基础数据包括配变三相电压值、故障停电时间、低电压用户数、总用户数、满足n-1线路条数、线路总条数和变压器故障停电次数。
进一步地,所述步骤s2具体包括以下步骤:
步骤s21:构建包含t个itree的孤立森林,具体步骤为:
步骤s211:采集n条电力调度数据样本,组成原始电力调度数据集;令x={x1,x2,…,xn}为给定数据集,
步骤s212:从d个维度中随机指定一个维度,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈x′)<p<max(xij,j=q,xij∈x′);
步骤s213:此切割点p生成了一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点;
步骤s214:判断数据是否继续分割,若是则返回步骤s212;当数据不能继续分割或者分割次数到达
步骤s22:对被检测的数据即s1步骤中获得的基础数据进行异常值检测。
进一步地,所述步骤s22具体包括以下内容:
将从所述营配调相关生产和管理系统中采集到的配网运行数据集设为x,遍历每个itree,得到每棵itree中x的路径长度h(x),即从itree的根节点到叶子节点所经过的边的数量;
给定一个包含n个样本的数据集,树的平均路径长度为:
其中h(n-1)为调和数,该值被估计为ln(n-1)+0.5772156649;c(n)为给定样本数n时,路径长度的平均值,用来标准化样本x的路径长度h(x);
样本x的异常得分定义为:
其中,e(h(x))为样本x在一批孤立树中的路径长度的期望;
当e(h(x))→c(n)时,s→0.5,即样本x的路径平均长度与树的平均路径长度相近时,则不能区分是不是异常;
当e(h(x))→0时,s→1,即x的异常分数接近1时,被判定为异常,排除该数据;
当e(h(x))→n-1时,s→0,被判定为正常,将其作为s3中指标体系的支撑数据。
进一步地,步骤s3中所述构建指标体系的具体内容为:通过获取的基础数据中的配变负载率和开关量的特征信息进行汇总分类,将其与重过载、故障和频繁停电业务事件相对应;根据城市配电网运行水平和供电能力评估导则构建三级评价体系;一级指标为:整体运行状态,分为稳定、良好、脆弱、恶化、极端五个等级;二级指标为:可靠性、安全性、经济性、优质性、供电能力;对应可靠性的三级指标包括:重复计划停电用户比例、故障停电时间占比、用户年平均停电时间、用户年平均停电次数、配网故障率、供电可靠率;对应安全性的三级指标包括:中压配电线路平均供电半径、中压架空配电线路平均分段数、中压配电网标准化结构占比、中压配电线路联络率、中压配电线路站间联络率、中压配电线路n-1通过率、运行超20年配变故障停电率、运行超20年的开关故障停电率、运行超30年线路故障停电率、架空线路故障停电率、电缆线路故障停电率、配变故障停电率、开关设备故障停电率、中压线路标准化率、中压配变标准化率、中压在运设备平均投运年限、中压线路电缆化率、中压架空线路绝缘化率、非晶合金配变占比、短路研判正确率、失地研判正确率、智能成票逻辑正确率、智能电表覆盖率、可控负荷容量占比、分布式电源渗透率、电动汽车充换电设施密度、10千伏变压器最大负载率分布、10千伏线路最大负载率分布、异动到位率、故障转供应用率、远方修改定值全流程执行率;对应经济性的三级指标为:高损配变占比、10千伏及以下综合线损率、高损台区比例;对应优质性的三级指标包括:综合电压合格率、低电压用户数占比、配电自动化系统运行指标得分、配电网图模数据合格率、公专变采集成功率、运行方式分析应用率;对应供电能力的三级指标包括:户均配变容量、配网故障平均修复时间、中压线路最大负载率平均值、中压线路负载不均衡度、中压配变最大负载率平均值、中压配变负载不均衡度、中压线路出线间隔利用率、中压重载线路占比、中压重载配变占比、中压轻载配变占比、容载比;
运用层次分析法,对s2中清洗后判定为正常的数据与s3中构建的三级指标体系进行综合赋权,得到各级权重和相应的评价结果;结合历史经验数据和实际生产要求,对各级指标的评价结果不符合实际情况的,进行调整,并将调整后的评价结果作为s4中神经网络训练的标签。
进一步地,步骤s4中所述构建神经网络的具体内容为:采用受限玻尔兹曼机来构建神经网络训练模型;所述受限玻尔兹曼机是一个两层的神经网络;上面一层神经元组成隐藏层,用h向量表示隐藏层神经元的值;下面一层的神经元组成可见层,用v向量表示可见层神经元的值;隐藏层和可见层之间是全连接的,隐藏层神经元之间是独立的,可见层神经元之间也是独立的;连接权重用矩阵w表示;rbm不区分前向和反向,可见层的状态作用于隐藏层,而隐藏层的状态也能够作用于可见层;隐藏层的偏倚系数是向量b,而可见层的偏倚系数是向量a。
进一步地,步骤s4中所述对各级别的标签进行关联性分析的具体内容为:
将步骤s2中清洗后判定为正常的数据随机分为训练集和测试集,将训练数据进行标准化,即把采集到的数值转化为高、中、低三个等级,令100表示高、010表示中、001表示低;采用神经网络模型分别训练可靠性、安全性、经济性、优质性、供电能力,最后再以这五个作为输入,训练整体运行状态;
若以可靠性高、中、低作为输出,输入为用户年平均停电时间、重复计划停电用户比例、用户年平均停电次数、故障停电时间占比、配网故障率和供电可靠率;
若以经济性高、中、低作为输出,输入为高损配变占比、10千伏及以下综合线损率、高损台区比例;
若以优质性高、中、低作为输出,输入为综合电压合格率、低电压用户数占比、配电自动化系统运行指标得分、配电网图模数据合格率、公专变采集成功率、运行方式分析应用率;
若以供电能力高、中、低作为输出,输入为户均配变容量、配网故障平均修复时间、中压线路最大负载率平均值、中压重载线路占比、中压线路出线间隔利用率等11个;
若以安全性高、中、低作为输出,输入包括中压配电网标准化结构占比、中压配电线路站间联络率、中压配电线路n-1通过率、非晶合金配变占比、短路研判正确率、分布式电源渗透率、智能成票逻辑正确率;
若以整体运行状态极端、恶化、脆弱、良好、稳定作为输出,输入为可靠性、经济性、优质性、供电能力、安全性;
对训练样本进行训练时,以最大化似然函数为目标,迭代更新网络参数直至收敛,获取相应的模型参数,每次迭代过程如下:
步骤sa:获取一个训练样本,令100表示高、010表示中、001表示低;根据不同输出对应的输入量的值设置网络的可见单元值;
步骤sb:对于每个神经网络中的隐藏层,计算它的激励能量:
然后计算概率值:
pi=σ(ci)
以pi的概率将第i个隐藏单元的状态值设置为1,以1-pi的概率将状态值设置为0;然后为每条边eij计算如下值:
pos(eij)=xixj
其中,xi为可见单元或隐藏单元第i个神经元的状态值;
步骤sc:用类似的方法计算每个神经网络中的可见层的激励能量ci,并更新它的状态;接下来再次更新隐藏单元状态,并对每条边计算:
neg(eij)=xixj
步骤sd:更新每条边eij的权重:
ωij=ωij+γ·(pos(eij)-neg(eij))
其中,ωij为边的权重,γ为更新率,是人工设定的参数;
步骤se:对每个训练样本重复步骤sa至步骤sd,该迭代过程直到收敛为止,即训练样本和步骤sc中获得的重构样本之差小于指定阈值,或达到指定的最大迭代次数。
在获取训练完善的模型后,带入测试集数据,得到网络的输出结果,用以画像的绘制。
进一步地,所述步骤s5的具体内容为:
步骤s51:统计信息,包括可靠性高的配电网络数目、频繁停电率高的网络数目;
步骤s52:建立行为指标,包括当前运行状态,可靠性表现、安全性表现;
步骤s53:建立薄弱环节,即任一级配电网络有哪些指标表现较差;
步骤s54:进行任意两个同级配电网络的指标对比:
根据一级指标的评价结果建立色斑图进行展示,根据二级指标的评价结果建立雷达图进行展示,根据三级指标的状态信息建立柱状图或表格进行展示;从色斑图中看出一级指标的表现情况,再往下查看支撑一级指标的二级指标的表现情况,从雷达图中表现较差的二级指标再去寻找支撑他的三级指标的表现情况,逐层往下分析,即找到薄弱环节所在。
与现有技术相比,本发明具有以下有益效果:
本发明采用受限玻尔兹曼机(rbm)来构建神经网络训练模型,通过机器的自我学习,摒弃了传统的指标权值定义,构建起配网运行的画像,使得评价结果较为客观准确。针对可靠性、安全性、供电能力、经济性、优质性五个二级标签,还能深入层层分析,在纵向和横向上对各级配网进行挖掘、对比,找到配网运行的薄弱环节,指导实际的工作。
附图说明
图1为本发明实施例的方法流程图。
图2为本发明实施例的系统级标签体系图。
图3为本发明实施例的系统级标签体系对应的安全性三级指标图。
图4为本发明实施例的rbm神经网络原理图。
图5为本发明实施例的具体示例效果图。
具体实施方式
下面结合附图及实施例对本发明做进一步说明。
应该指出,以下详细说明都是例示性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。
需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。
如图1所示,本实施例提供一种新型的配电网运行状态画像分析方法,所构建的配网运行评价体系研究对象为线路、系统、县区级配网、市级配网、省级配网包括以下步骤:
步骤s1:从营配调相关生产和管理系统获取基础数据;
步骤s2:采用孤立森林法对步骤s1中获取的基础数据进行清洗;
步骤s3:对步骤s2中进行清洗后的正常数据作为特征量,参考城市配电网运行水平和供电能力评估导则构建指标体系,用层次分析法进行评价,再结合专历史经验数据和实际生产要求进行评价结果的调整,并将调整后的评价结果作为s4中神经网络训练的标签;
在本实施例中,运用层次分析法,对s2中获取的正常数据与s3中构建的三级指标体系进行综合赋权,得到各级权重和相应的评价结果。由于上述评价方法在实际应用中存在偏差,故结合历史经验数据和实际生产要求,对各级指标的评价结果不符合实际情况的,进行调整,并将调整后的评价结果作为s4中神经网络训练的标签。
步骤s4:将调整后的评价结果作为神经网络训练的标签构建神经网络模型,对各级别的标签进行关联性分析;
步骤s5:建立并分析画像,用以直观地展示各级配网运行状态水平,通过不同画像间的对比,挖掘配网运行存在的薄弱环节,可以挖掘之前未发现的配电网各运行因素与指标之间的隐性关联,使得配电网运行、管理部门能够更深刻地了解和掌握配电网的运行情况与指标情况,为提高配电网的运行维护指标提供决策建议。
在本实施例中,所述营配调相关生产和管理系统包括但不限于调度管理系统(dms)、生产管理系统(pms)、用电信息采集系统和配网调度智能管控平台(smd)。
在本实施例中,根据评价的需求,以月或者日为周期,分别从营配调相关生产和管理系统获取基础数据,用以支撑后续的特征标签及关联分析,所述基础数据包括配变三相电压值、故障停电时间、低电压用户数、总用户数、满足n-1线路条数、线路总条数和变压器故障停电次数等。
数据清洗是为了保证数据挖掘和应用的准确性,本实施例从4个系统所获得的电气量数据一般可以分成4种类型:正常数据、异常数据、缺失数据以及有噪声的数据。本发明中所需清洗的数据主要为配网运行的实时状态数据,利用孤立森林算法(iforest)对数据进行预处理,该算法通过孤立异常数据
点来实现数据异常检测,具有精度高,计算率高的特点,适用于处理大数据问题。iforest的实现包括构建包含t个元素的孤立森林和对数据进行异常检测。具体实施方法为:
在本实施例中,所述步骤s2具体包括以下步骤:
步骤s21:构建包含t个itree的孤立森林,
iforest通过随机超平面实现数据的分离,如此循环分离直到子空间只有一个数据点。正常的数值处在高密度区域,需要多次数据隔离分离完全,异常数据则处于低密度区域,经过少数隔离就分离完全。iforest的核心问题是分离数据的方法,具体步骤为:
步骤s211:采集n条电力调度数据样本,组成原始电力调度数据集;令x={x1,x2,…,xn}为给定数据集,
步骤s212:从d个维度中随机指定一个维度,在当前数据中随机产生一个切割点p,min(xij,j=q,xij∈x′)<p<max(xij,j=q,xij∈x′);
步骤s213:此切割点p生成了一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p的放入右子节点;
步骤s214:判断数据是否继续分割,若是则返回步骤s212;当数据不能继续分割或者分割次数到达
步骤s22:对被检测的数据即s1步骤中获得的基础数据进行异常值检测。
在本实施例中,所述步骤s22具体包括以下内容:
将从所述营配调相关生产和管理系统中采集到的配网运行数据集设为x,遍历每个itree,得到每棵itree中x的路径长度h(x),即从itree的根节点到叶子节点所经过的边的数量;
给定一个包含n个样本的数据集,树的平均路径长度为:
其中h(n-1)为调和数,该值被估计为ln(n-1)+0.5772156649;c(n)为给定样本数n时,路径长度的平均值,用来标准化样本x的路径长度h(x);
样本x的异常得分定义为:
其中,e(h(x))为样本x在一批孤立树中的路径长度的期望;
当e(h(x))→c(n)时,s→0.5,即样本x的路径平均长度与树的平均路径长度相近时,则不能区分是不是异常;
当e(h(x))→0时,s→1,即x的异常分数接近1时,被判定为异常,排除该数据;
当e(h(x))→n-1时,s→0,被判定为正常,将其作为s3中指标体系的支撑数据。
在本实施例中,如图2所示,步骤s3中所述构建指标体系的具体内容为:将所获取到的基础数据中的配变负载率、开关量等配网运行的特征信息进行汇总分类,将其与重过载、故障、频繁停电等业务事件相对应。根据《q/gdw565-2010城市配电网运行水平和供电能力评估导则》,世界一流城市配电网建设主要指标,以及其他同类型文献,构建出三级评价体系,一级指标为:整体运行状态,分为稳定、良好、脆弱、恶化、极端五个等级;二级指标为:可靠性、安全性、经济性、优质性、供电能力;对应可靠性的三级指标包括:重复计划停电用户比例、故障停电时间占比、用户年平均停电时间、用户年平均停电次数、配网故障率、供电可靠率;对应安全性的三级指标包括:中压配电线路平均供电半径、中压架空配电线路平均分段数、中压配电网标准化结构占比、中压配电线路联络率、中压配电线路站间联络率、中压配电线路n-1通过率、运行超20年配变故障停电率、运行超20年的开关故障停电率、运行超30年线路故障停电率、架空线路故障停电率、电缆线路故障停电率、配变故障停电率、开关设备故障停电率、中压线路标准化率、中压配变标准化率、中压在运设备平均投运年限、中压线路电缆化率、中压架空线路绝缘化率、非晶合金配变占比、短路研判正确率、失地研判正确率、智能成票逻辑正确率、智能电表覆盖率、可控负荷容量占比、分布式电源渗透率、电动汽车充换电设施密度、10千伏变压器最大负载率分布、10千伏线路最大负载率分布、异动到位率、故障转供应用率、远方修改定值全流程执行率;对应经济性的三级指标为:高损配变占比、10千伏及以下综合线损率、高损台区比例;对应优质性的三级指标包括:综合电压合格率、低电压用户数占比、配电自动化系统运行指标得分、配电网图模数据合格率、公专变采集成功率、运行方式分析应用率;对应供电能力的三级指标包括:户均配变容量、配网故障平均修复时间、中压线路最大负载率平均值、中压线路负载不均衡度、中压配变最大负载率平均值、中压配变负载不均衡度、中压线路出线间隔利用率、中压重载线路占比、中压重载配变占比、中压轻载配变占比、容载比;
运用层次分析法,对s2中清洗后判定为正常的数据与s3中构建的三级指标体系进行综合赋权,得到各级权重和相应的评价结果。由于上述评价方法在实际应用中存在偏差,故结合历史经验数据和实际生产要求,对各级指标的评价结果不符合实际情况的,进行调整,并将调整后的评价结果作为s4中神经网络训练的标签。
在本实施例中,如图3所示,步骤s4中所述构建神经网络的具体内容为:采用受限玻尔兹曼机(rbm)来构建神经网络训练模型;所述受限玻尔兹曼机是一个两层的神经网络;上面一层神经元组成隐藏层(hiddenlayer),用h向量表示隐藏层神经元的值;下面一层的神经元组成可见层(visiblelayer),用v向量表示可见层神经元的值;隐藏层和可见层之间是全连接的,隐藏层神经元之间是独立的,可见层神经元之间也是独立的;连接权重用矩阵w表示;rbm不区分前向和反向,可见层的状态作用于隐藏层,而隐藏层的状态也能够作用于可见层;隐藏层的偏倚系数是向量b,而可见层的偏倚系数是向量a。
在本实施例中,步骤s4中所述对各级别的标签进行关联性分析的具体内容为:
将s2中清洗后判定为正常的数据分为训练集和测试集,将训练数据进行标准化,即把采集到的数值转化为高、中、低三个等级,令100表示高、010表示中、001表示低;采用神经网络模型分别训练可靠性、安全性、经济性、优质性、供电能力,最后再以这五个作为输入,训练整体运行状态;
若以可靠性高、中、低作为输出,输入为用户年平均停电时间、重复计划停电用户比例、用户年平均停电次数、故障停电时间占比、配网故障率和供电可靠率;
若以经济性高、中、低作为输出,输入为高损配变占比、10千伏及以下综合线损率、高损台区比例;
若以优质性高、中、低作为输出,输入为综合电压合格率、低电压用户数占比、配电自动化系统运行指标得分、配电网图模数据合格率、公专变采集成功率、运行方式分析应用率;
若以供电能力高、中、低作为输出,输入为户均配变容量、配网故障平均修复时间、中压线路最大负载率平均值、中压重载线路占比、中压线路出线间隔利用率等11个;
若以安全性高、中、低作为输出,输入包括中压配电网标准化结构占比、中压配电线路站间联络率、中压配电线路n-1通过率、非晶合金配变占比、短路研判正确率、分布式电源渗透率、智能成票逻辑正确率;
若以整体运行状态极端、恶化、脆弱、良好、稳定作为输出,输入为可靠性、经济性、优质性、供电能力、安全性;
对训练样本进行训练时,以最大化似然函数为目标,迭代更新网络参数直至收敛,获取相应的模型参数,,迭代更新网络参数直至收敛,每次迭代过程如下:
步骤sa:获取一个训练样本,令100表示高、010表示中、001表示低;根据不同输出对应的输入量的值设置网络的可见单元值;
步骤sb:对于每个神经网络中的隐藏层,计算它的激励能量:
然后计算概率值:
pi=σ(ci)
以pi的概率将第i个隐藏单元的状态值设置为1,以1-pi的概率将状态值设置为0;然后为每条边eij计算如下值:
pos(eij)=xixj
其中,xi为可见单元或隐藏单元第i个神经元的状态值;
步骤sc:用步骤sb中相同的方法计算每个神经网络中的可见层的激励能量ci,并更新它的状态;接下来再次更新隐藏单元状态,并对每条边计算:
neg(eij)=xixj
步骤sd:更新每条边eij的权重:
ωij=ωij+γ·(pos(eij)-neg(eij))
其中,ωij为边的权重,γ为更新率,是人工设定的参数;
步骤se:对每个训练样本重复步骤sa至步骤sd,该迭代过程直到收敛为止,即训练样本和步骤sc中获得的重构样本之差小于指定阈值,或达到指定的最大迭代次数。
在获取训练完善的模型后,带入测试集数据,得到网络的输出结果,用以画像的绘制。
在本实施例中,所述步骤s5的具体内容为:
步骤s51:统计信息,包括可靠性高的配电网络数目、频繁停电率高的网络数目;
步骤s52:建立行为指标,包括当前运行状态,可靠性表现、安全性表现;
步骤s53:建立薄弱环节,即任一级配电网络有哪些指标表现较差;
步骤s54:进行任意两个同级配电网络的指标对比:
根据一级指标的评价结果建立色斑图进行展示,根据二级指标的评价结果建立雷达图进行展示,根据三级指标的状态信息建立柱状图或表格进行展示;如图4所示,从色斑图中看出一级指标的表现情况,再往下查看支撑一级指标的二级指标的表现情况(雷达图),从雷达图中表现较差的二级指标再去寻找支撑他的三级指标的表现情况,逐层往下分析,即找到薄弱环节所在。
在本实施例中,根据网络的输出结果来进行画像展示,包括且不局限于以下内容:
(1)以色斑图展示每一级系统的整体运行状态(一级标签),五种颜色代表着极端、恶化、脆弱、良好、稳定五种等级;
(2)以雷达图展示每一级系统的二级标签(可靠性、供电能力、安全性、经济性、优质性)的状态信息;
(3)以可视化的信息(如柱状图、表格)展示三级标签的状态信息;
(4)对任意两个系统的画像内容按照一级标签、二级标签和三级标签的状态关系进行对比。
以福建省为例,其系统画像如图5所示:以不同颜色来表示福建省各个地市一级标签的运行状态,以雷达图来展示每个评价对象二级标签的状态。
以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。