一种适应电网多种调控运行场景的关联特征选择方法与流程

文档序号:21367821发布日期:2020-07-04 04:43阅读:490来源:国知局
一种适应电网多种调控运行场景的关联特征选择方法与流程
本发明属于电力系统特征选择
技术领域
,尤其涉及一种适应电网多种调控运行场景的关联特征选择方法。
背景技术
:近年来,随着大电网一体化紧密互联,送受端一体化特征显著。高渗透率可再生能源的接入,电力系统的安全稳定与经济运行也迎来了巨大挑战。电网中投入高比例电力电子设备,使得系统动态稳定性更为复杂。这些新能源以及随机性负荷在大规模接入电网时,其随机性与间歇性会大大提升电网规划与调度的难度,也可能会造成电网出现严重故障、重要断面重载、电力供需失衡、新能源消纳受阻等不同电力场景。而数据维数增加会显著增加相关数据分析处理的时间,降低了运行效率,还可能导致“维数灾难”。也不是所有数据特征都与分析目标密切相关,无用的数据特征很可能将会大大降低一些分类器以及预测器的准确性,造成不必要的模型训练时间的延长。目前机器学习、深度学习等相关智能算法广泛应用于电力系统,但电力系统中的数据样本获取难度大。若数据维数显著超过训练样本数很可能会导致过拟合等现象的发生。并且目前的调度为被动等待电网事故到来,对自然灾害等可预知的风险预警预防还有提升空间;对机组功率波动没有有效监控手段,依赖电厂汇报;对电网突发舆情事件没有监控手段,依赖下级调度汇报;技术支持系统信息纷繁分散,缺乏集中监视功能等。现有的调度模式缺乏对于电力系统各典型场景的特征分析,不能找准典型场景与其关联特征之间的关系,在对电力系统数据进行实际分析时往往不能有很好地针对性,对电力场景的类型判断存在准确性低、耗时高、所需处理数据量大等缺点。不能很好地预测和判断电力系统所处的运行场景,调度人员也就无法做出准确的运行决策,这将会对电力系统的安全稳定运行造成极大的危害。特征选择方法起源于计算机领域,其作用是从原始特征集中,利用相关方法得到一个可以代表原特征集信息的特征子集,该方法可以有效地剔除一些与分析目标无关的数据,剔除冗余,降低特征维数,在提高分类器和预测算法准确性和减少数据计算量方面都有重要作用。因此,在电网机构日益复杂,数据量和数据类型都不断增长的今天,为了能够提高电网对于可能出现的严重故障、重要断面重载、电力供需失衡、雷电预警、新能源消纳等不同典型场景的辨识和预测能力,降低计算复杂度,需要找到和电力系统典型场景最为相关的特征,构建典型场景关联特征库。技术实现要素:本发明的目的是提供一种适应电网多种调控运行场景的关联特征选择方法。为实现上述目的,本发明采用的技术方案是:一种适应电网多种调控运行场景的关联特征选择方法,包括以下步骤:步骤1、输入电网历史数据,利用数据流方法对其进行标准化预处理,构建时间序列数据,得到训练集和测试集;步骤2、根据电力系统典型场景和特定场景,构建特征变量备选集;步骤3、将所构建的特征变量备选集以及预处理形成的时间序列数据纳入灰色关联度计算程序,得到各特征变量与目标电力场景之间的定量关系,并对其进行大小排序,随后设置合理阈值,筛选出关联度数值排名较高的特征变量,形成针对典型场景的特征子集;步骤4、利用针对典型场景得到的特征子集作为分类器的分类参考特征,输入历史数据片段进行分类,并与其类型标签进行对比,计算采用特征子集进行分类的准确率,从而对特征子集的性能进行评价。在上述的适应电网多种调控运行场景的关联特征选择方法中,步骤1所述构建时间序列包括以下步骤:步骤1.1、识别信息并提取数据;包括识别提取节点电压数据、线路潮流数据、发电机出力数据、变压器数据;步骤1.2、将步骤1.1所提取的数据进行特征匹配,如果匹配则保留,否则剔除;步骤1.3、按照选取数据时间点构建节点电压时间序列、线路潮流时间序列、节发电机出力时间序列、变压器数据时间序列。在上述的适应电网多种调控运行场景的关联特征选择方法中,步骤2所述构建特征变量备选集包括针对典型场景特征变量的选取和针对特定场景特征变量的选取:步骤2.1、典型场景特征变量的选取包括;步骤2.1.1频率安全指标;1)反映电网频率偏离额定频率程度频率偏差:式中,fn为额定频率,通常为50hz;f为当前时刻电网频率;0.2为频率标准中频率偏差的允许范围最大值;2)评价各个控制区域对系统频率恢复到限定值所做贡献的区域控制偏差:计算一小时内ace均值,要求ace均值在规定范围内;ace=k·δf+δp(2)式中,k为负荷频率响应特性值,取定值300mw/0.1hz;δf为频率偏差;δp为区域实际交换功率与计划交换功率之间的偏差;步骤2.1.2、电压安全指标;1)反映电力系统运行时电压偏离额定电压的电压偏差:式中,u为运行电压;un为额定电压;2)反映所研究节点的无功储备能力的电压安全裕度为:式中,v0为负荷节点在当前状态下的电压;vcr为负荷节点在临界状态下的电压;步骤2.1.3、网络安全指标;1)实时反映电力系统运行的潮流裕度:式中,p为当前断面潮流;pl为断面稳定潮流;2)最大负载率:式中,pimax为第i条线路或断面所能承受的最大负载;pi为在当前统计点的实际负载;ω为选取的线路或断面集;步骤2.1.4、功率平衡;1)旋转备用率:系统旋转备用容量与系统最大负荷的比率;2)功率因数:交流电路有功功率对视在功率的比值;3)有功裕度:节点承受功率扰动的能力与电网承受负荷增长的能力的对应关系:式中,pmax为负荷节点在临界状态下的功率;p0为负荷节点在当前状态下的功率;4)有功备用率:系统有功备用容量相对其最低限值的大小:式中,psr为有功旋转备用容量;psr.lim为有功旋转备用容量的最低限值,取系统最大负荷的10%;5)无功备用率:系统无功备用容量相对系统总无功负荷的大小;式中,q为无功备用大小;qsum为系统总无功负荷大小;6)静态稳定储备系数:正常运行方式下,静态稳定储备系数控制于15%~20%之间;特殊方式或事故后运行方式,静态稳定储备系数≥10%;按功角判据计算和用小振荡法判别静态稳定时,计算公式为:式中,plimit为极限功率;pnormal为正常运行方式下的功率;步骤2.1.5、负荷水平;负荷率指在统计期间内的平均负荷与最大负荷之比的百分数:式中,为平均负荷;lmax为最大负荷;步骤2.1.6、新能源消纳;1)弃风率:电力系统在统计时间内实际损失风电量与预计最大风电发电量之比:式中,pwind为实际风电发电量;pwind_max为预计最大风电发电量;2)弃光率:电力系统在统计时间内实际损失光伏发电量与预计最大光伏发电量之比:式中,psolar为实际风电发电量;psolar_max为预计最大风电发电量;3)可再生能源消纳率:电力系统运行中可再生能源实际消耗与理想情况下可再生能源发电量之比:式中,qrenew_crate为可再生能源发电实际消耗;qrenew_max为理想可再生能源发电量;步骤2.2、针对特定场景特征变量的选取包括;步骤2.2.1、将全网所有的节点电压以及线路传输的i端功率均纳入特征变量备选集;式中,δu1与δu1分别为电压降落的横分量与纵分量,p1为线路i端传输有功功率,q1为线路i端传输无功功率,u1为首端节点的节点电压,x、r分别为传输线路的电抗和电阻参数,x、r在研究时间范围内固定不变;步骤2.2.2、将全网的发电出力,包括火电机组、水电机组、抽蓄电站、新能源发电、储能有功出力,以及变压器下网有功和网损纳入特征变量备选集;∑pg=∑pld+∑δp+∑pp(16)式中,∑pg为系统发电有功功率总和,∑pld为所有负荷有功功率之和,∑δp为网络有功功率损耗之和,∑pp为所有发电厂厂用电有功功率之和;步骤2.2.3、将非电气量纳入特征变量备选集。本发明的有益效果:将灰色关联度分析方法应用于电网典型场景的关联特征选择过程之中,利用灰色关联度分析对变量之间关联度的定量计算,将原来电力场景与关联特征之间的模糊关系进行量化,有利于调度人员在某些电力场景下做出更有针对性的决策,并且在经过特征选择之后,剔除了无用特征,对数据分析处理速度、场景分类辨识准确率、预测准确性方面都具有积极意义。本发明具有如下优点:1、分析了电力场景的动态特征,充分考虑了电气量与非电气量与电力场景之间对的关系,构建了较为完备的特征变量备选集。2、将灰色关联度分析计算方法应用于特征选择过程之中,对比相关方法运算速度快,计算效率高,属于过滤式特征选择方式,并将电力场景与特征变量之间的关联关系进行了量化,使得调度人员在进行相关操作时有了更好的指示。3、在电力系统数据量和数据类型都蓬勃增长的今天,将特征选择方法应用于电力系统场景辨识和分类领域之中,通过较少数目的特征子集代替维数较高的原始特征集,对于复杂的电力系统,在减少数据处理时间,提高数据分析效率,提高场景辨识准确度等方面都具有显著的帮助,最后通过实际历史数据验证了该方法的有效性。附图说明图1是本发明一个实施例数据处理的总体逻辑图;图2是本发明一个算例中所研究线路附近电网拓扑图;图3是本发明一个实施例特征变量在拓扑图中的直观展示。具体实施方式下面结合附图对本发明的实施方式进行详细描述。本实施例首先从电力系统历史实际数据的角度出发,对其进行标准化和预处理,使其成为能够直接纳入分析计算以及分类器的时间序列数据,随后对不同的电力系统典型场景的特点进行细化分析,从理论的角度出发,研究哪些特征变量可能指示电力系统场景的发生,或者典型场景的出现伴随着哪些特征变量的变化,利用这些信息构建出特征备选集,该集包含了所有的与电力系统典型场景可能的相关特征,包括全网潮流数据、发电数据、负荷数据等电气量,同时也包括一些可能引起电气量变化的非电气量,如温度、风速、光照强度等。然后利用灰色关联度分析算法定量计算特征与目标典型场景之间关联度数值,并对其进行排序,随后设置合理的阈值,得到最终的特征子集,并利用分类器准确度对特征子集进行评价。本实施例是通过以下技术方案来实现的,一种适应电网多种调控运行场景的关联特征选择方法,包括以下步骤:s1,从电网实际历史数据出发,首先分析电网实际历史数据结构特点,利用数据流方法对其进行统一标准化预处理,使其形成可以直接纳入计算分析和分类器程序的时间序列数据,并分出训练集和测试集。s2,从电力系统典型场景的特点出发,分析各个典型场景的动态特性,从理论的角度入手,分析哪些特征变量可以指示典型场景的发生,或者伴随着典型场景的出现而规律变化,从而构建完成特征变量备选集,这其中包括电气量与非电气量。s3,将构建完毕的特征变量备选集以及预处理之后的时间序列数据纳入灰色关联度计算程序,得到各特征变量与目标电力场景之间的定量关系,并对其进行大小排序,随后设置合理阈值,筛选出关联度数值排名较高的特征变量,从而形成针对典型场景的特征变量库。s4,利用针对典型场景得到的特征子集作为分类器的分类参考特征,输入历史数据片段对其进行分类,并与其类型标签进行对比,计算采用特征子集进行分类的准确率,从而对特征子集的性能进行评价。s5,以某区域大电网线路重载场景为例,选取电网实测数据作为算例,对其进行特征提取操作,随后利用筛选得到的特征子集在分类器中的表现对基于灰色关联度分析的特征选择方法的有效性和准确性进行评估。具体实施时,本实施例基于电网历史运行数据,以断面重载场景为例,首先针对电网的实际历史数据进行了标准化预处理过程和时间序列数据的构建,随后分析了断面重载的场景特性,充分考虑所有可能与断面重载场景的出现相关的特征,构建出特征备选集,之后利用基于灰色关联度分析的特征选择方法筛选出所需要的特征子集。该实施例有效结合了电力系统数据特点和特征选择方法,可以帮助建立对应于电网典型场景的特征库,增加电网对于各种场景的辨识和可预知能力,提高电网主动调度能力和场景预测准确性,减少数据处理时间和降低特征维数,有效避免了“维数灾难”,并最终通过分类器对场景分类的准确度验证了该提取方法的有效性。1.电网场景归类分析随着新能源和随机性负荷在电网的大规模接入,由于源荷两侧的不确定性,电网存在着出现包括直流闭锁、n-1故障在内的严重故障、重要断面重载、电力供需失衡、新能源消纳等不同典型场景的可能性。(1)严重故障严重故障指的是电网中由于某些突发因素而导致的突然的严重电力事故,它包括相间绝缘破坏造成二相或三相短路故障、相对地绝缘破坏造成单相或多相接地故障、一相或二相断线故障和非全相运行、同步发电机的低励或失磁、电力系统振荡、电压崩溃或频率崩溃,以及多种故障同时发生或相继发生而同时存在的复故障。在各种类型的故障中,使故障的电力系统仍旧维持三相对称状态的故障称为对称故障;而使故障的电力系统三相之间不再能维持三相对称状态的故障,统称为不对称故障。不对称故障有单相接地,二相短路,二相短路接地,单相或二相断线和非全相运行。1)直流闭锁换流器故障、直流线路故障、直流辅助设备故障以及临近交流系统故障等直流故障均会导致直流闭锁。当闭锁故障发生后,交流系统由于转子惯性大无法很快地做出响应,这将导致交流系统的动态性能恶化。特高压直流由于电压等级高、输送距离远、输送容量大,一旦在大功率送电方式下发生闭锁,送电断面功率将发生大幅度的波动,对送端电网和受端电网都会造成巨大冲击。送端电网面临巨大的功率盈余,导致系统频率急剧升高,引发电网高频问题。受端电网面临巨大的功率缺额,造成电网频率快速跌落、潮流大范围转移。潮流的大范围转移甚至可能引起联络线传输功率超出稳定极限,从而导致区域电网间失去同步,引起特高压联络线解列。2)n-1故障由“n-1”准则,当电力系统内包括发电机、输电线路、变压器等共n个元件,其中任意一个元件发生故障而被切除后不应造成其他线路发生过负荷跳闸、电压崩溃等事故。n-1故障指电力系统内某发电机、变压器或输电线路断线引起电网功率缺额,造成频率波动,通常可由发电机组一次调频与二次调频作用恢复频率稳定。但是由于大规模新能源和随机负荷的接入,在电网功率随机性增大的情况下,发生n-1故障,功率缺额可能超出火电机组调节容量,造成系统频率失稳。(2)重要断面重载电网断面指连接两个地区之间的多条支线所形成的联络线族。在所有区域电网的电网断面中,容易形成线路堵塞、负荷过载进而发生故障的断面称之为重要断面。重要断面重载是区域电网调度中经常需要面对的场景。(3)电力供需失衡随着用电需求及网供负荷逐年增长,在夏季高温、重负荷等特殊时段,容易出现负荷功率过大的情况;同时,由于新能源的随机性和波动性,供电功率波动性增加,容易出现电源侧功率变化过大的情况,造成局部电网供需不平衡。(4)新能源消纳场景风能、太阳能发电的集中开发,分布式电源的大量接入,使大电网运行控制的难度和安全稳定运行的风险明显增大,传统的电网调控手段难以满足大规模新能源接入带来的调节需求,使得弃风弃光问题突出。2.基于灰色关联度分析的特征选择方法对不同典型场景下的特征变量进行提取必须用海量的历史数据作为支撑,划分不同典型场景下的电网历史数据,对其进行特征分析,然后利用适当的方法进行提取。但电网数据一般都具有杂糅、量大、类别多的特点,将其纳入特征分析之前,必须对其进行预处理,剔除无用的数据,保留有用的数据,并调整格式,使其成为容易被程序接收的时间序列数据,随后采用灰色关联度方法对其进行特征选择。2.1针对海量历史数据的智能预处理方法电网历史数据即记录全网电网数据信息的历史文件,记录了过去一段时间里电网运行状态、潮流信息等关键电网信息,具体包括全网标幺值信息、厂站信息、母线信息、母线电压信息、交流线路信息、线路潮流信息、发电机出力信息、发电机连接点信息、变压器信息、变压器下网有功信息、负荷数据及连接点信息、并补设备信息、串补设备信息、直流控制器信息、直流线路参数及相关信息、电气岛号名称信息、拓扑节点信息、断路器信息、刀闸信息等等。根据电网历史数据所列出的信息清单见表1。表1电网数据类型多、内容繁杂,并且,由于电网一直在实时不间断运行,历史数据原则上会不断增加,根据a区域电网的实际情况和一般经验,调度部门所存储数据的间隔是5min,也就是说每5min系统内存中便会增加一个数据包,而单个数据包占用内存大概为67.7mb,存储一天的数据数据包个数则会达到288个,占用内存约为19.04gb,可见这数据存储量的巨大,更何况这只是调度中心的qs文件数据,若加上数据采样间隔更短的pmu数据,数据的存储容量将会进一步显著扩大。进一步观察电网历史数据的保存形式,发现目前大多数电网调度中心导出的原始数据包都是qs存储形式的,这是一种不可视的数据文件,现有的软件并不能直接打开它,而其与其他软件的交互形式目前也只存在excel数据导入功能一种,于是对于电网数据的批量读取和导入便成为了一个难题。利用excel的数据导入接口访问这些电网历史qs文件后,导入的数据存在文本与数据杂糅的情况,所有数据堆积在第一列,且都是以文本形式地进行存储,所有类型的数据全部都在一张表上,即表1中的所有数据类型都存在于一张工作表里面,并不能纳入分析计算。正是因为一般电网历史数据其数据量大,文件形式不可视,数据杂糅,利用人为的方法对其进行手动处理已经不能满足对于海量历史数据的处理和分析,必须设计合理的大数据处理方法对电网历史数据进行统一的集中处理,使处理完之后的数据适应分析处理的需求。对于所拿到的数据,首先对其进行excel的数据导入工作,使其可视化,采用人为手动将5min一个文件在excel进行数据导入,形成xlsx文件。形成xlsx文件后,观察文件数据的内容,可以发现每一个表中保存了15个分表,基于每个分表的表头特征信息,利用编程工具,在python中编写信息识别程序,先进行表头识别,并标记记号,随后利用记号提取出处于两个记号之间所有数据,并利用数据流处理方法输入另一个新建的工作表中,如此对每一个分表进行提取。然而提取之后的分表数据仍然是杂糅在第一列的文本数据,要对其进行分析还需要将其转化为列表形式,并且若是数据的情况需要转化为数据格式,在python中编写文本识别和数据转化程序,对每一行的数据的内容一一进行识别,对每个元素进行识别成功后便将其在python内部的容器列表空间里暂存,其中,对识别出来的数据先进行单精度转换,将其转换为可用于分析计算的单精度浮点数,以满足工程研究的精度需求,随后一同存入python内部的容器列表空间里,在对一个分表的数据全部进行上述操作之后,此时数据的每一个元素只会占用一个单元格,形成了可读可视的列表数据。对分列处理之后的数据文件进行进一步处理,源文件所包含的同一时间下全网的数据,其中不仅包含了所需要的a区域电网的数据,也包含了不需要的其他电网的运行数据,这是导致数据量巨大的其中一个关键原因。由于本实施例只涉及a区域电网内部的运行控制,将其他大电网的数据一同纳入对于分析a区域电网特性并没有过多的帮助,反而会因为数据量巨大而导致程序运行时间加长,或者因为其他电网的运行特性不同而导致分析结果受其他电网的影响。所以需要对表1数据进行选择性剔除,只保留与a区域电网相关的电网数据,由此方便后续的分析。其次,本实施例针对高电压等级的输电网,于是根据电压等级信息需要剔除500kv以下的数据,将研究范围准确定位到500kv以上的输电网络中。为了精准定位a区域电网的数据,剔除研究范围以外的一些数据,需要利用a区域电网的实际信息,对原有数据文件进行识别,并将处于研究范围之内的数据进行提取,将处于研究范围之外的数据进行剔除。首先利用图像识别技术对a区域电网实际拓扑图进行图像识别,提取其中的厂站名称,制作a区域电网各类型数据名称表,再利用这些名称信息去源数据文件中进行文字识别和匹配,名称信息匹配成功的则保留,匹配失败的则予以剔除,由此便可以保留只剩a区域电网研究范围内的厂站信息以及潮流数据,进一步对电压等级进行划分,识别出处于500kv以下的电压等级的数据信息,进行直接剔除,在剔除工作进行之后,我们便可以得到电压等级以及区域划分都属于a区域电网研究范围内的数据,对其中的名称信息进行进一步地分析和识别,可以更新得到各类型数据索引表。在进行无用剔除之后,我们可以得到适用于本实施例的数据,对所有的qs文件进行同样的操作之后,便可以得到一个事件发生前后全部数据,随后,基于此5min一个的数据文件,便可以纳入统计和分析,进一步求解相关参数。数据处理过程中所用的数据识别和数据剔除程序具有很强的通用性,对于类似的问题的解决起到了极大的作用,利用机器的高效性和人工智能算法的稳定性,便可以精准地对海量的历史数据进行预处理,从而基于预处理结果进一步得到所需要的可以直接纳入分析计算的有效数据。2.2特征变量备选集构建在对数据进行预处理之后,已经可以基于预处理之后的数据对其进行相关分析计算了,基于预处理时候的数据列表,可以利用程序将其导入至内存空间中,形成可以计算的矩阵或者list数据形式,基于该预处理结果还可以利用每一个数据的横纵向标记将其从总表中提取出来,进行直接计算,不仅可以索引到每一个数据元素,也可以索引到每一个其他类型的元素上,如文本。为方便后续进行指标计算及特征分析,基于这些预处理数据首先利用程序进行时间序列的构建。(1)时间序列数据构建时间序列数据,即带有时标的数据,是研究每一个变量随时间变化趋势的必要数据,也是计算波动率,负荷率等参数的必要数据,因此要基于历史数据构建出每个变量的在研究时间尺度范围内的时间序列数据。将每一个拓扑节点的电压、每一条线路的i端功率、每一台发电机的有功出力等信息都作为一个变量,记做xi,变量数总共有n,即i=1,2,3,...,n,则电网源数据的一个文件是记录一个时间断面下的全部的n个变量的在这个断面下的信息,故一个文件无法构建出时间序列数据,它只是一个时间断面下的全网变量数据的存储文件,故要构建出时间序列需要遍历所有的qs文件。每一个文件只为特定某一变量的序列的构建提供一个值,需要从电网连续记录的数据文件中依次提取,假设从第一个文件中取出xi的第一个时间点的数据,则需要从第二个文件中提取出xi的第二个时间点的数据,依次类推。时间序列构建的总体流程逻辑图如图1所示。通过以上步骤,可以将电网海量的历史数据转化为可以纳入程序计算分析的时间序列数据,从而进行进一步的特征变量备选集的构建。(2)从理论角度构建特征变量备选集特征提取的目的即寻找影响场景发生的变量,或者说是寻找电网中的什么因素在影响着场景的发生,以及是哪些因素在指示着场景的发生。通常,对于场景的发生,调度人员依据经验,可以定性地感受出场景与影响因素之间的关系,这些关系也就是那些可能的因素,而另一方面,从理论的角度,依据电网中存在的一些定量关系,同样可以得到一些可能的结论,在特征变量备选集的构建过程中,通常需要从以上两个方面同时去考虑所有可能的因素,以做到指标选取的全面性以及完备性。同时,场景的指标选取还遵从科学性、独立性、主成分性等原则。具体构建过程如下。1)频率方面频率安全会直接影响到电力系统中电动机的转速,影响补偿容量,影响电钟指示,影响设备安全。因此,频率安全是电力系统运行安全的重要组成部分。可以将频率安全更细化分为以下几个指标。a)频率偏差频率偏差反映了电网频率偏离额定频率的程度。通过对该指标的监控,调度员可以了解频率偏离额定值的程度以及距离安全事故频率的远近。计算公式为:式中,fn为额定频率,通常为50hz;f为当前时刻电网频率;0.2为频率标准中频率偏差的允许范围最大值。b)区域控制偏差区域控制偏差是系统频率控制的外在表现,并且该数据比较容易获得。因此,可以研究当系统瞬时频率越限时,通过对各个区域控制偏差的行为,用以评价各个控制区域对系统频率恢复到限定值所做贡献。计算一小时内ace均值,要求ace均值在规定范围内。计算公式为:ace=k·δf+δp(2)式中,k为负荷频率响应特性值,可暂定300mw/0.1hz;δf为频率偏差;δp为区域实际交换功率与计划交换功率之间的偏差。2)电压方面除频率外,电压安全是电力系统运行安全性的另一个重要因素。对于用户来说,电压过大地偏离额定值,将对用户产生不良影响。对于电网来说,电压降低会使电网的电能损耗增大,还可能危及电网运行的稳定性,发生电压崩溃事故,而电压过高要影响设备的绝缘。可以将电压安全更细化分为以下几个指标。a)电压偏差该指标反映电力系统运行时电压偏离额定电压的情况。计算公式为:式中,u为运行电压;un为额定电压。b)电压安全裕度电压安全裕度由潮流方程即负荷节点的功率特性和网络特性决定,反映了节点电压波动的相对大小与电网承受负荷增长的能力不具有很强的对应关系,它更能反映所研究节点的无功储备能力。计算公式为:式中,v0为负荷节点在当前状态下的电压;vcr为负荷节点在临界状态下的电压。3)网络方面电网的潮流、线路负载、电流等网络拓扑相关因素会给电网运行安全带来很大的影响。因此网络安全也是电力系统运行安全的重要组成部分之一。根据不同特征可以将其细化为以下几个指标。a)潮流裕度潮流裕度指标能够实时反映电力系统运行的稳定裕度,通过对该指标的监控,调度员在正常运行时能对重载断面进行重点监控并做好事故预想,在事故情况下能够及时发现过载断面、实施有针对性的控制以限制事故的发展。计算公式为:式中,p为当前断面潮流;pl为断面稳定潮流。b)最大负载率在安全性指标计算中,主要断面一般根据该电网的实际情况对电网安全稳定运行有重要影响,实际运行中需要对潮流进行监控。最大负载率具体计算公式如下:式中,pimax为第i条线路或断面所能承受的最大负载;pi为在当前统计点的实际负载;ω为选取的线路或断面集。4)功率方面电力系统运行中有功功率、无功功率平衡与稳定是保证其安全稳定运行的必要条件。因此,功率平衡在电力系统安全性指标中必不可少。功率平衡可以进一步细化为以下几个指标。a)旋转备用率旋转备用亦称热备用,是调度调频的主要监控指标。通过对该指标的监控,调度员可以了解到电网的发用电平衡能力和调节能力。旋转备用率反映了系统旋转备用容量与系统最大负荷的比率。b)功率因数功率因数是指交流电路有功功率对视在功率的比值。功率因数对电力系统运行状态产生很大的影响。功率因数较低时,系统会多发无功,无功则会影响电压,使得系统电压不能满足要求,造成设备达不到额定出力。c)有功裕度有功裕度反映了节点承受功率扰动的能力,与电网承受负荷增长的能力有比较强的对应关系。计算公式为:式中,pmax为负荷节点在临界状态下的功率;p0为负荷节点在当前状态下的功率。d)有功备用该指标反映了系统有功备用容量相对其最低限值的大小。计算公式为:式中,psr为有功旋转备用容量;psr.lim为有功旋转备用容量的最低限值,取系统最大负荷的10%。e)无功备用率该指标反映了系统无功备用容量相对系统总无功负荷的大小。计算公式为:式中,q为无功备用大小;qsum为系统总无功负荷大小。f)静态稳定储备系数静态稳定储备系数是衡量电力系统静态稳定性的指标。正常运行方式下,需控制在15%~20%之间;特殊方式或事故后运行方式,需控制≥10%。按功角判据计算和用小振荡法判别静态稳定时,计算公式为:式中,plimit为极限功率;pnormal为正常运行方式下的功率。5)负荷方面负荷是电网的重要组成部分,负荷水平是衡量电力系统运行经济性的另一个重要指标。进一步细化为下列指标:·负荷率该指标是指在统计期间内的平均负荷与最大负荷之比的百分数,是衡量经济性的重要指标。计算公式为:式中,为平均负荷;lmax为最大负荷。6)新能源方面a)弃风率该指标反映了电力系统在统计时间内实际损失风电量与预计最大风电发电量之比。计算公式为:式中,pwind为实际风电发电量;pwind_max为预计最大风电发电量。b)弃光率该指标反映了电力系统在统计时间内实际损失光伏发电量与预计最大光伏发电量之比。计算公式为:式中,psolar为实际风电发电量;psolar_max为预计最大风电发电量。c)可再生能源消纳率可再生能源消纳指的是可再生能源发电的使用。可再生能源消纳率反映了电力系统运行中可再生能源实际消耗与理想情况下可再生能源发电量之比。计算公式为:式中,qrenew_crate为可再生能源发电实际消耗;qrenew_max为理想可再生能源发电量。7)针对特定场景以上描述了针对典型场景的一般性特征变量选取规则及特征变量含义和获取方式,但针对某些特定的场景,特征变量的选取还具有场景特征。以断面重载为例,断面重载指的是连接两个区域间的数条支线所形成的联络线族上的功率达到功率传输上限的80%以上,断面重载实际上是一种负荷短期升高而导致的线路传输功率过大,因为线路在出厂时参数已经确定,而线路传输的功率是在变化的,故负荷增加很可能会引起断面功率传输上升,从而引起断面重载,从理论的角度对其进行分析。根据潮流计算中线路电压降落的横分量与纵分量的表达式(式15a、式15b)可以知道,线路两端传输的功率与线路两端的电压、上下游线路传输的功率均存在关系,故考虑将全网所有的节点电压以及线路传输的i端功率均纳入特征变量备选集之中。式中,δu1与δu1分别为电压降落的横分量与纵分量,p1为线路i端传输有功功率,q1为线路i端传输无功功率,u1为首端节点的节点电压,x、r分别为传输线路的电抗和电阻参数,这两个参数在研究时间范围内可认为固定不变,故不将其纳入特征变量备选集其次,由于线路传输的功率一定程度上是由于下游负荷的增加而引起的,而系统中的有功平衡关系(式16),系统负荷变化时,系统发电出力、损耗等不同程度也会发生变化,所以需要将全网的发电出力,包括火电机组、水电机组、抽蓄电站、新能源发电、储能等有功出力,以及变压器下网有功和网损等纳入特征变量备选集之中。∑pg=∑pld+∑δp+∑pp(16)式中,∑pg为系统发电有功功率总和,∑pld为所有负荷有功功率之和,∑δp为网络有功功率损耗之和,∑pp为所有发电厂厂用电有功功率之和。再者,从非电气量的角度去考虑影响负荷增加的因素,如天气的层面,若温度升高,居民、商场空调用电量势必会升高,导致居民、商用负荷增大;同时,长时间尺度角度考虑季节性影响因素,冬季的供暖负荷,夏季的空调负荷,都客观隐含了与断面重载之间的关系,而以短时间尺度角度,一天内观察,根据电力行业对负荷的描述,负荷的早高峰和晚高峰都和时间存在密不可分的关系;再者,光照、风速以及湿度都不同程度的与新能源出力,负荷存在内层隐含关系。基于上述分析,温度、时间等非电气量事实上与电网场景之间存在着内层的隐含关系,需要将这些非电气量纳入特征变量备选集中进行统一考虑。通过以上对于特征变量备选集构建的分析之后,便可以依据分析结果,对相关结果进行提取,从而组建得到特征变量备选集,用于后续的关联度分析程序中进行关联度大小的分析。2.3基于灰色关联度算法定量求解因素关联度特征变量备选集构建完毕后,采用适当的方法对场景与变量的关系进行定量指示。目前,特征变量备选集中的数据是以时间序列的形式存储的,也就是说,特征变量中的变量信息其实都可以绘制成一条条随时间变化的曲线,若场景也能用时间序列的形式体现,寻找场景与因素之间的关系便可以转化为求取两个序列之间的变化关系,即一对一,或者一对多,甚至一对多。典型场景都具有明显的特点,利用某一具有显著特征的指标对场景进行指示是目前常用的方法,在断面重载场景中,利用线路的i端功率指示线路是否重载是最直接也是最有效的方式,由于线路重载的定义本身基于线路的传输功率占传输上限的多少来提出,故使用传输线路的i端功率对线路重载场景进行指示可以大大减小算法的复杂度,是最为有效的方式,于是在断面重载这个场景中,便可以选取所研究线路的i端传输功率对场景进行指示。下面以断面重载场景为例展开描述所采用的gra算法在计算场景序列与影响因素序列之间关联度中的具体应用方法和实施步骤。(1)gra算法即greyrelationanalysis,它是目前常用的一种多因素分析统计方法,可以用来度量所关注的某个项目与其他因素之间的关联度,即受其影响的强弱,可用来挖掘数据内部的关联关系。简单来讲,就是在一个灰色系统中,想要了解其中某个所关注的项目受其他的因素影响的相对强弱,假设以及知道某一个指标可能与其他的某几个因素相关,如果想知道这个指标与其他哪个因素相对来说更有关系,而哪个因素相对关系弱一点,依次类推,把这些因素排个序,得到一个分析结果,就可以知道所关注的这个指标,与因素中的哪些更相关。其中,灰色系统这个概念的提出是相对于白色系统和黑色系统而言的。这个概念最初是由控制科学与工程的教授邓聚龙提出的。按照控制论的惯例,颜色一般代表的是对于一个系统我们已知的信息的多少,白色就代表信息充足,比如一个力学系统,元素之间的关系都是能够确定的,这就是一个白色系统;而黑色系统代表对于其中的结构并不清楚的系统,通常叫做黑箱或黑盒的就是这类系统。灰色介于两者之间,表示只对该系统有部分了解。gra算法的具体步骤如下所示。a)确定母序列即选取感兴趣的项目序列,用来分析其他变量与其之间的关系,在断面重载场景中即为重载线路的i端功率随时间变化的序列,在新能源消纳场景下则可以为火电机组深度调峰量,记为y(k),k=1,2,3,...,nk,nk为序列数据点个数,记其他影响因素序列为xi(k),i=1,2,3,...,ni,ni为其他影响因素个数;b)归一化处理电网数据在数值上存在很大差异,有些大有些小,这不是因为数据的内禀性质不同而导致的,而是由于数据量纲不同,必须进行归一化,即标准化处理,减少数据绝对值的差异,重点关注其趋势的变化,本实施例中采用均值化处理,消除初始值为0对分析结果的影响;式中,y′(k)为进行均值化处理之后的场景序列,xi′(k)为进行均值化处理之后的因素序列。c)计算关联系数式中,ρ为调节系数,用以调节输出结果的差距大小,其调节范围为0到1,数值越大表示关联系数之间差距越小,反之则差距越大,其中,ζi(k)为对应于第k个因素的关联系数序列。d)计算每个变量关联度大小式中,ri即为对应于因素xi与场景y之间的关联度大小。e)关联系数排序将进行关联系数计算之后因素根据其关联度系数的大小进行排序,得到与场景y之间关系大小的一个定量排序,由此来筛选所需要的特征变量,构建成为特征变量库。(2)针对特定场景的关联度计算方法针对不同的电力系统的典型场景,应用gra关联度算法定量求取关联度数值大小时,具有不同的要求,以断面重载场景为例,即一条线路的重载情况,而用于指示线路重载最直接也是最有效的指标便是线路i端的传输功率,利用历史数据构建出某一条线路的i端传输功率的时间序列,将其作为gra算法中提到的母序列,即y(k),将其他的特征变量备选集中的变量当做xi(k),这其中包括节点电压、发电机有功出力、发电机无功出力、直流注入功率、天气温度、变压器下网有功、发电机端电压、负荷有功、负荷无功、全网各线路的传输线路i端有功功率、全网各线路的传输线路i端无功功率等,在matlab中编程将这些序列作为输入,通过关联度计算程序的迭代计算,就可以将这些因素矛场景之间的定量关联度的大小计算出来,由此输出一个列表,该列表中便可以囊括所有可能的因素与场景y之间的关系大小,并利用输出序列的标记去前文所述的数据预处理过程中构建的各类型数据索引表中寻找对应标号的变量名称,由此便可以得到实际电网因素与场景之间的定量关系大小。在面对新能源消纳场景时,关注的是新能源消纳过程中的弃风量与弃光量,根据对相关场景的调研分析以及向相关调度人员了解的实际情况,在新能源消纳场景中,以火电机组深度调峰量作为新能源消纳场景中弃风量与弃光量的指示是十分合理和有效的,所以在新能源消纳场景中应该以火电机组深度调峰量作为母序列,即y(k),同时在特征变量备选集的构建过程中,需要更多地考虑与新能源消纳水平相关的因素,如天气温度、风速、湿度、光照等常见的影响新能源出力的因素,同时也包括大气污染防治限产、光伏扶贫政策和新能源补贴政策调整、发电设备成本下降、电价等非电力生产要素,并且,新能源消纳的季节性特征也十分的明显,这些因素有长时间尺度的也有短时间尺度的,在构建特征变量备选集中就应该予以充分考虑。另外,在针对其他典型场景时,应该用同样的思维和角度,将场景序列与因素序列构建好,充分考虑好与特定场景相关的特定因素,再将这些序列作为程序的输入,利用编写好的gra程序将场景与因素之间的定量关联度大小求取出来,从而进行下一步特征变量提取与特征指纹库构建的相关工作。3.仿真验证基于所研究区域电网的实际情况,在此以断面重载场景为例,利用所搜集的电网的历史数据,对特征提取方法进行仿真试验,验证所提出方法的有效性。依据调研数据,在断面重载场景下,针对这些断面进行断面重载特征提取的实例分析,选取其中的线路1o.1p作为研究对象,研究该线路重载的影响因素与其i端功率之间的定量关系,于是,绘制了改线路附近的拓扑图如图2所示。图2中,以线路1o.1p为中心,展示了其附近的线路及发电厂等组成部分。首先,从电网历史数据中选取属于断面重载典型场景的典型重载事件,选取其中的一个事件作为例子,该事件为2019年7月到9月间该电网负荷历史最大事件,即负荷最重的一个场景,符合断面重载场景的条件,事件发生的时间为2019年7月29日13:16分,为了充分考虑典型场景事件发生的前因后果,选取事件发生前后2小时的数据作为分析对象,研究这段时间内是哪些因素在影响着重载事件的发生。所拿到的电网数据如前文所述,是qs文件格式的,在进行数据预处理和特征变量备选集的构建之后我们可以得到数据的时间序列格式,见表2,其中示出了斗山线功率以及特征变量备选集中的前6个变量在研究时间范围内的变化趋势,特征变量备选集总共变量个数达到2381个。表2timey(k)x1(k)x2(k)x3(k)x4(k)x5(k)x6(k)12:1612.406747.327217.343441.275319.454049.2044110.0370212:2112.284057.193677.209591.603019.517749.348759.4539612:2611.99177.087337.103011.754349.498889.3350110.7661112:3111.71977.172317.18821.843359.493689.2657410.8946712:3611.896347.084617.10031.966079.514329.3255311.4678312:4111.828787.101477.117192.108869.329889.5441110.6123912:4611.824647.107447.123182.034729.340439.4947710.8030812:5112.241457.101217.116931.976359.393889.513110.1219912:5612.114167.120687.136472.102569.38269.466259.7439313:0112.251827.100177.115932.244539.357459.4857810.0355413:0612.183567.113717.129472.384349.36459.4888410.5689713:1112.613267.15737.173152.246339.492339.511998.302413:1612.163137.1567.171872.422119.495179.4764210.6121313:2112.243077.124947.140732.431329.533399.4995610.4039913:2611.974597.137377.15322.427779.472489.475311.6466313:3112.150127.1177.132762.383829.504099.4677711.3197613:3612.24067.098077.113812.404379.46749.3958110.8820213:4112.252347.090737.106462.395979.450779.3808710.092413:4611.781867.097267.113022.449789.569479.4113911.4844313:5112.38257.089297.105042.357549.557869.4197610.3051313:5612.327197.061917.077592.422789.548849.4296810.9870114:0112.531537.100017.115782.372929.560459.458019.9719714:0612.675087.141977.157812.4479.522169.4088510.1411714:1112.950217.124567.140382.274079.502639.409658.69521观察表2可以发现,数据点的采样间隔为5min一个,研究时间范围为事件发生前后2小时,则每一个因素在这段时间内应有24个值。基于上述数据,将其作为gra算法的输入,在matlab中编写程序进行计算,并将关联度计算结果进行排序,可以输出针对斗山线重载的影响因素的关联度数值的大小排序情况,见表3。表3表3中仅列出了关联度排序结果中最为靠前的前36个因素的关联度数值索引号(即xi(k)中的i)、名称和类型。对排序结果进行分析,最为靠前的一部分因素是该线路附近的线路传输功率及变化率,如属于同个常用断面的线路1o.ipⅱ回线的功率变化率以及i端功率,以及处于下游的线路1v.1x的i端功率,和处于该线路上游的线路1n.1o的i端传输功率,说明与线路重载最为相关的依然是线路附近的传输线路上的功率数值,因为这是与被研究线路存在直接联系的一部分因素,符合构建备选集时的推测。同时,节点1v-附近温度变化也与线路重载之间存在较高的关联度数值,这与我们温度上升导致居民负荷的升高的猜测相符合。另一方面,节点1x-/#3变下网有功、发电机8-#1机有功等因素同样与所研究对象存在较高的关联度。将关联度数值较高的16个变量绘制在拓扑图中直观展现。如图3所示。以上关联度排序结果符合对于场景与其影响因素之间的分析,将原来无法量化的因素与场景之间的关系大小进行了量化,将经验值转化为实际的数值对比,这样,调度人员在进行相关调度决策时就会有更加准确可靠的依据,也为后续利用特征变量的走势来指示场景的动向打下了坚实基础。同时,利用得到的关联度大小排序结果,选择前80名作为特征子集,也就是从原始的特征变量备选集的2381个变量中选取出关联度排序最高的80个变量,并将这些变量作为特征选择方法得到特征子集,利用十分常见的knn分类器作为特征子集评价指示器,输入对比数据集与测试数据集,在该算例中共采用模拟数据片段3400组,其中2200组比较样本,用于knn分类比较,分为两类,即重载和不重载,且带有标签;1200组测试样本,用于测试分类错误率。将以上数据作为输入,测试电力场景数据片段能否被准确分类,得到表4的分类结果统计表。表4根据表4结果,可以看出,当依靠前文得到的特征子集作为分类参考变量时,对电力场景数据片段的分类准确率高达98.83%,可见,本实施例提出的基于灰色关联度分析的特征选择方法在缩减原来数据维数的同时,保证了对电力系统场景片段的分类准确率,提高了电力系统在进行场景辨识和预测等工作时的工作效力和运算处理速度,增加了调度人员对数据意义的理解,起到了定量指示作用,有效避免了复杂电力系统中的维数灾难问题,对电力系统数据挖掘和动态分析工作都具有积极意义。应当理解的是,本说明书未详细阐述的部分均属于现有技术。虽然以上结合附图描述了本发明的具体实施方式,但是本领域普通技术人员应当理解,这些仅是举例说明,可以对这些实施方式做出多种变形或修改,而不背离本发明的原理和实质。本发明的范围仅由所附权利要求书限定。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1