基于改进Softmax回归的电网故障临界切除时间判别方法与流程

文档序号:14216924阅读:280来源:国知局
本发明属于大电网稳定与控制领域,是一种基于机器学习方法和历史计算数据,对电力系统预想故障对应的稳定特征进行自动辨识的方法,特别是涉及一种基于改进softmax回归的电网故障临界切除时间判别方法。
背景技术
:随着经济水平的飞速提升,中国社会对电力的需求也日益强烈。为了保障电能安全可靠的传输,中国电网中开展了西电东送、全国联网以及特高压输电等重大工程,交直流混联的特大电网已经基本形成。随着电网规模的扩大,电网安全稳定性愈加难以掌控。世界上已经发生的多次电网故障表明,输电电压等级的提高、联网规模扩大以及传输容量的增加,都会增大电网故障带来的危害,故障原因和过程也更为复杂。开展对运行电网全面细致的在线监视、分析和控制,保障电力生产、传输和使用的安全是各国电力行业的迫切需求。开展电网在线安全稳定分析工作,计算速度是必须保障的核心指标之一,如果失去计算速度,那么在线分析也就失去了时效性,而变得没有意义。现有在线分析系统主要采用时域仿真方法进行分析,计算量较大,难以进一步提升速度;而采用快速判稳方法,虽然速度较快,但它非常依赖于电网稳定特征的选取,不准确的特征将造成预测结果的极大误差。另一方面,在线分析系统积累了大量的历史数据,其中蕴含了宝贵的电网运行规律,同时又贴近实际运行情况,可作为稳定特征识别的依据。本发明的目标就是利用历史数据来对不同方式和预想故障下的电网稳定特征进行自动辨识。随着电网规模的扩大,影响电网稳定的因素越来越复杂,而从中有效地挖掘关键的稳定特征也就成为掌控电网运行的重要课题。稳定特征辨识方法目前已有一定的研究,现有方法往往过于依赖人工经验,所选特征比较局限,不能广泛地选取,造成存在漏选的可能。技术实现要素:发明目的:为了解决现有方法存在的问题,本发明提出了一种基于改进softmax回归的电网故障临界切除时间判别方法,可扩大特征选择范围,覆盖电力系统在线数据中全部设备的静态量,通过机器学习方法自动辨识出对于电网稳定影响最大的主要特征。技术方案:基于改进softmax回归的电网故障临界切除时间判别方法,该方法修改了标准softmax回归的代价函数,采用以正确分类为中心的正态分布作为目标概率分布,把模型计算得到的概率分布与目标概率分布之间的kl散度作为代价函数,通过缩小正态分布方差和不断迭代来获得最优模型。该方法步骤如下:a)初始化对于某一指定故障,统计样本库中cct结果的上下限,并做离散化处理,获得所有可能的分类和类别总数;初始化正态分布的方差,为迭代计算做准备;b)计算kl散度对于单个样本,通过预测得到的输入特征属于各个分类的概率,计算不同类别的概率分布;并根据正确分类和正态分布方差形成不同类别的目标概率分布,计算两种分布之间的kl散度;c)迭代优化采用批量梯度下降法进行优化,当代价函数持续迭代设定代数无明显下降时,能够缩小正态分布的方差,使得正确分类主导作用更加突出,并继续迭代,直至方差小于设定的阈值,然后输出模型的最终优化结果。优点及效果:本发明把预想故障的临界切除时间作为电网稳定程度指标,利用电力系统在线安全稳定分析系统中产生的历史数据,从数据自身特点和分布特征出发,扩大选择范围,可以覆盖电力系统在线数据中全部设备的静态量,最终通过机器学习方法自动辨识出对于电网稳定影响最大的主要特征。本发明利用了cct结果的特点,改进了softmax的代价函数,避免机器学习模型陷入到局部最优解,提升了模型的适用性;本发明只是在模型的输出层进行了改进,可以方便地与神经网络等其他模型相结合。附图说明图1是本发明实施方案程序流程图。具体实施方式下面结合附图对本发明做进一步的说明:本发明提出了一种改进softmax回归的电网故障临界切除时间判别方法。该方法修改了标准softmax回归的代价函数,采用以正确分类为中心的正态分布作为目标概率分布,把模型计算得到的概率分布与目标概率分布之间的kl散度作为代价函数,通过缩小正态分布方差和不断迭代来获得最优模型。相关概念临界切除时间三相短路故障是电力系统中最典型的故障形式,而三相短路临界切除时间(cct,criticalclearingtime)是指电网发生三相短路故障后,保证系统稳定的最大的故障切除时间。临界切除时间代表了系统稳定和不稳定的边界,可用于表征电力系统发生指定故障的稳定程度,临界切除时间越大,表示该短路故障对系统影响越小,系统就越稳定。如果临界切除时间小于正常的保护动作时间,则说明该故障会造成系统失稳,即系统存在安全隐患。求解临界切除时间的方法主要包括时域仿真法和直接法,前者采用时域仿真计算对临界切除时间进行精确求解,结果最为准确和可靠,但计算耗时较长,相当于若干次暂态稳定计算,难以适应在线分析的要求;后者的优点是计算速度快,能够提供稳定指标,但精度较低。由于临界切除时间是一个浮点数指标,而逻辑回归方法是用来解决多分类问题的,因此需要把临界切除时间进行离散化。由于目前在线暂稳计算都采用0.01秒作为仿真步长,因此可以自然地把临界切除时间按保留两位小数的方法进行离散。经仿真测试,重要的500kv交流线路的临界切除时间都在0.10-1.00之内,如果大于1.0秒则认为是非常稳定的状态,可归入1.0秒的档位。因此,临界切除时间的预测可转换为不超过100个类型的多分类问题。softmax回归softmax回归是一种经典的多分类问题机器学习算法。假设输入特征为x,分类数为k,算法的目的是寻找最优的参数矩阵θ,根据x与θ来预测x属于各个分类的概率,取其中概率最大的分类作为其预测的分类。算法的前向执行过程大致如下:1)输入特征x∈r1×m,即每个样本含有m个特征,在x后面加一个固定值1,得到2)设总的分类为k,随机初始化参数矩阵θ∈r(m+1)×k,将与θ相乘,得到:相当于对x各个特征进行线性组合再加一个偏置;3)设h=(h1,h2,...hk),进一步利用hi,i=1,2,...k得到x属于各个分类的概率:先都以e为底取对数,变为正数,再进行归一化。预测得到的x属于各个分类的概率为:找出pi中的最大值,其索引作为样本x预测的分类。然后采取后向传播(bp)算法来优化参数矩阵θ。其大致过程如下:1)假设x为已知分类的样本,其属于第i类,则其标签为y=(y1,y2,...yk),其第i个元素yi为1,其余元素为0。将与y的交叉熵(ce)作为预测分类模型的代价函数:还可以在上述代价函数中加入lasso惩罚项,更有利于的θ的优化求解:λ为控制交叉熵和lasso惩罚项的比例参数。2)再根据梯度下降算法优化θ值:求取j(θ)对θ的偏导数,并以此更新θ值:η称为学习率。kl散度kl(kullback-leibler)散度是衡量两个概率分布一致性的常用方法。对于所有的i,pi和qi之间的kl散度定义为:c即为本方法的代价函数,其值越小,两个概率分布越一致。可以通过梯度下降算法来求解softmax回归的参数,使得总体代价函数最小。指定故障的cct通常是基于时域仿真方法通过反复计算获取的,由于暂态稳定分析的仿真步长一般为0.01,因此获得的cct是以0.01为间隔的离散结果,对于cct的预测也就可以看作是一个多分类问题。但是,cct又有它的特殊性,它是一个具有大小顺序的指标,在同样分类错误的情况下,也存在着相对的好与不好。例如,cct真实值是0.25,此时预测结果可能为0.26或0.27,同样是错误,但前者优于后者。换言之,对于cct的预测是一种包含优劣关系的分类问题。经过公式(2)所得到的结果为输入x属于各个类别的概率分布,传统的softmax回归采用交叉熵作为损失函数,实际上是要最大化正确分类所对应的概率,而把不同类别之间看成没有关联关系,这样就没有用到cct存在大小关系这一重要先验条件。本发明提出了基于改进softmax回归的电网故障临界切除时间判别方法,该方法修改了标准softmax回归的代价函数,采用以正确分类为中心的正态分布作为目标概率分布,把模型计算(公式(2))得到的概率分布与目标概率分布之间的kl散度作为代价函数,通过缩小正态分布方差和不断反复迭代来获得最优模型。步骤如下:a)初始化对于某一指定故障,统计样本库中cct结果的上下限,并做离散化处理,获得所有可能的分类和类别总数;初始化正态分布的方差,为迭代计算做准备。b)计算kl散度对于单个样本,通过预测得到的输入特征属于各个分类的概率(公式(2))计算不同类别的概率分布;并根据正确分类和正态分布方差形成不同类别的目标概率分布,计算两种分布之间的kl散度。以类别总数为5,方差为1.0为例,下表列出了不同正确类别情况下的目标概率分布。例如当正确类别为2时,取第2行结果作为目标概率分布。这样处理既能保证正确分类的主导作用,又能对相近分类给予一定的评分。类别1类别2类别3类别4类别5正确类别为10.570.350.070.010.00正确类别为20.260.420.260.060.00正确类别为30.050.250.400.250.05正确类别为40.000.060.260.420.26正确类别为50.000.010.070.350.57c)迭代优化采用批量梯度下降法进行优化,当代价函数持续迭代设定代数(如100代)无明显下降时(把训练集中的样本完整地循环一遍为一代),可以缩小正态分布的方差,使得正确分类主导作用更加突出,并继续迭代,直至方差小于设定的阈值,然后输出模型的最终优化结果。实施例如图1所示,程序流程主要包括两个循环体:外部循环不断缩小方差σ,直至达到阈值;内部循环最小化kl散度;外部循环完成后训练过程结束,输出最优模型。以国家电网公司某年1-10月在线计算数据为基础,验证本课题方法的有效性。当月华北-华中处于联网运行状态,因此在线数据中包含国调直调以及华北、华中所有220kv以上的电网设备。电网主要状态量和统计量如下表所示;有效样本数(断面数)为29254个。算例采用机组有功作为输入,重要线路的cct作为输出,考察故障包括国调.峡葛i线、华北.黄滨一线。表1电网状态量和统计量列表预测峡葛线cct时,cct所在区间为0.19-0.29,共计11种可能。采用标准的softmax回归,预测峡葛i线cct的误差率为13.79%;采用本方法进行预测,误差率为11.58%,略有下降。预测黄滨一线cct时,cct所在区间为0.20-0.71,共计52种可能。采用标准softmax回归,预测黄滨一线cct的误差率为61.97%;采用本方法进行预测,误差率为28.73%,有比较显著的下降。从结果中可见:1)把cct预测看作一种分类问题的话,类别数量是决定预测效果的一个重要因素,类别越多通常误差率越高。如上述算例所示,峡葛i线类别数为11种,远小于黄滨一线的52种,此时采用标准softmax回归或本发明方法后,峡葛i线的误差率都会低于黄滨一线。2)两个算例都表明本方法可以进一步降低模型的误差率,尤其是在类别数量较多的情况下,这种效果更加明显。本发明方法充分利用了cct结果的有序性这一重要先验条件,通过缩小方差来逐渐突出正确分类,并且前序训练过程为后面提供了更好的参数初值,使模型逐步趋于最优结果。本说明书实施例所述的内容仅仅是对发明构思的实现形式的列举,本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1