一种国家电网覆冰灾害预测方法与流程

文档序号:20920991发布日期:2020-05-29 14:08阅读:358来源:国知局
一种国家电网覆冰灾害预测方法与流程

技术领域
】本发明涉及机器学习领域,具体涉及一种国家电网覆冰灾害预测方法。
背景技术
:覆冰灾害对电力传输的危害在于,电网系统覆冰严重时会断线、倒塔杆,导致大面积停电事故,且事故发生在严冬季节,大雪封山,公路结冻,难于抢修,造成长时间停电。因此,冰雪、冻雨是许多国家电网系统所面临的严重威胁之一。自20世纪40年代以来,冰灾的威胁是半个多世纪来电力系统工业界与学术界一直竭力应对的一大技术难题。2008年中国南方电网的冰灾、1998年美国东北部和加拿大东南部的冰灾给电力系统基础设施严重的威胁。但是,目前国家电网对于线路出现覆冰灾害的主要应对措施还处于加强防护和对于出现问题以后的应急,并没有对国家电网的电力塔杆、电力传输线路和电力传输通道出现覆冰灾害的可能性提前做出预警。技术实现要素:为解决前述问题,本发明提供了一种国家电网覆冰灾害预测方法,以对电力塔杆、电力传输线路和电力传输通道发生覆冰灾害的风险做出预测。为了达到上述目的,本发明采用如下技术方案:一种国家电网覆冰灾害预测方法,所述国家电网覆冰灾害预测方法用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行覆冰灾害预测,包括如下步骤:采集历史信息,对历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,所述维度即为数据特征;采用lightgbm模型对数据特征进行选择,得到训练特征;采用差分进化算法对lightgbm模型的参数进行调整,基于调整后的参数,利用训练特征对lightgbm模型进行训练;采集当前信息,对当前信息进行整理,形成完整的当前数据;基于完整的当前数据,利用训练好的lightgbm模型进行覆冰灾害预测。可选的,采集历史信息包括观冰站上报历史信息、气象历史信息、pms系统历史信息、国网覆冰预警中心历史信息、现场维修部门部署历史信息以及覆冰告警等级;所述观冰站上报历史信息包括第一天气状况、第一气温、第一湿度、第一风速、第一风向、线路设计覆冰厚度、有无模拟导线;所述气象历史信息包括第二天气状况、第二气温、第二湿度、第二风速、第二风向;所述pms系统历史信息包括塔杆子信息、线路子信息、导线子信息;所述国网覆冰预警中心历史信息包括历史线路覆冰子信息、短期覆冰预测子信息;现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息。可选的,对历史信息进行整理,形成完整的历史数据具体包括:基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;对各个历史信息下缺失的数值子信息补充完整;对各个历史信息下的非数值子信息进行独热编码;独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。可选的,对各个历史信息下缺失的数值子信息补充完整时,如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整。可选的,对非数值子信息进行独热编码时,将同一历史信息下的各个非数值子信息分别作为状态值,所述状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。可选的,采用差分进化算法对lightgbm模型的参数进行调整具体包括:确定需要优化的lightgbm模型参数,对需要优化的lightgbm模型参数形成原始种群,对原始种群计算个体适应度值,进行变异操作和交叉操作,判断是否达到预设迭代次数,如果达到预设迭代次数,则输出结果,如果为未达到预设迭代次数,则继续计算个体适应度值,进行变异操作和交叉操作,直至达到预设迭代次数。可选的,需要调整的lightgbm模型参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据。可选的,所述lightgbm模型输出的auc值作为lightgbm模型的适应度值。可选的,覆冰告警等级包括0级、1级、2级、3级,0级为无覆冰,1级和2级为严重覆冰,3级为轻微覆冰;历史线路覆冰子信息和短期覆冰预测子信息中,覆冰持续时间<5h为0级,若5h≤覆冰持续时间<10h为3级,10h≤覆冰持续时间<15h为2级,覆冰持续时间≥15h为1级。可选的,利用训练好的lightgbm模型进行覆冰灾害预测,包括对电力塔杆预测、对电力传输线路预测和对电力传输通道预测;对待预测区域的国家电网的电力传输线路划分第一区间,在任一第一区间内,任一电力塔杆的预测结果为严重覆冰,则该第一区间电力塔杆的覆冰灾害发生状态为严重覆冰;且对应的覆冰灾害风险发生概率为该第一区间内所有电力塔杆预测结果为严重覆冰的概率最大值;在任一第一区间内,所有电力塔杆的预测结果均不为严重覆冰,则计算该第一区间内每个电力塔杆的预测结果为无覆冰的概率、轻微覆冰的概率以及严重覆冰的概率,并对该第一区间内所有电力塔杆无覆冰的概率求和、轻微覆冰的概率求和以及严重覆冰的概率求和,求和后的最大值所对应的预测结果为该第一区间的覆冰灾害发生状态,且对应的覆冰灾害发生概率为该第一区间内所有电力塔杆预测结果为严重覆冰的平均概率;对电力传输线路的预测为:收集待预测区域内任一第一区间的电力塔杆的覆冰灾害发生状态,出现次数最多的覆冰灾害发生状态为该第一区间的电力传输线路的覆冰灾害发生状态;对待预测区域的国家电网的电力传输通道划分第二区间,对电力传输通道的预测为:收集待预测区域内任一第二区间的电力塔杆的覆冰灾害发生状态,出现次数最多的覆冰灾害发生状态为该第二区间的电力传输通道的覆冰灾害发生状态。可选的,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同。本发明具有如下有益效果:1、由于国家电网遭遇覆冰灾害的数据来源不同,脏数据比较多,因此,对采集的数据进行处理,对缺失的数据补全,对非数值型的数据进行编码,不仅便于计算机识别,也避免了脏数据、缺失数据对算法效果造成负面影响。而由于覆冰灾害数据来源较多,并且数据的维度较高,因此,采用lightgbm模型进一步筛选出数量合适的最优数据作为训练集,避免数据冗余导致计算速度减慢,同时还能保证数据的准确以及预测结果的准确;2、先采用差分进化算法对lightgbm模型的参数进行调优、训练,达到最佳参数值,再采用lightgbm模型进行预测,既能避免对于训练数据集中数据的过拟合,又能进一步提升lightgbm模型预测的准确性和稳定性,并且,lightgbm模型拥有更快的训练速度和更高的准确率,能够支持gpu,便于处理大规模数据,面对电网每天产生的海量数据能够及时有效的处理。以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。本发明的这些特点和优点将会在下面的具体实施方式以及附图中进行详细的揭露。本发明最佳的实施方式或手段将结合附图来详尽表现,但并非是对本发明技术方案的限制。另外,在每个下文和附图中出现的这些特征、要素和组件是具有多个,并且为了表示方便而标记了不同的符号或数字,但均表示相同或相似构造或功能的部件。【附图说明】下面结合附图对本发明作进一步说明:图1为本发明实施例的流程图;图2为本发明实施例中采用差分进化算法对lightgbm模型的参数进行调整的流程图。【具体实施方式】下面结合本发明实施例的附图对本发明实施例的技术方案进行解释和说明,但下述实施例仅为本发明的优选实施例,并非全部。基于实施方式中的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得其他实施例,都属于本发明的保护范围。在本说明书中引用的“一个实施例”或“实例”或“例子”意指结合实施例本身描述的特定特征、结构或特性可被包括在本专利公开的至少一个实施例中。短语“在一个实施例中”在说明书中的各位置的出现不必都是指同一个实施例。实施例:如图1所示,本实施例提供一种国家电网覆冰灾害预测方法,用于对国家电网的电力塔杆、电力传输线路和电力传输通道进行覆冰灾害预测,包括如下步骤:采集历史信息包括观冰站上报历史信息、气象历史信息、pms系统历史信息、国网覆冰预警中心历史信息、现场维修部门部署历史信息以及覆冰告警等级,其中,观冰站上报历史信息包括第一天气状况、第一气温、第一湿度、第一风速、第一风向、线路设计覆冰厚度、有无模拟导线;气象历史信息包括第二天气状况、第二气温、第二湿度、第二风速、第二风向;pms系统历史信息包括塔杆子信息、线路子信息、导线子信息;国网覆冰预警中心历史信息包括历史线路覆冰子信息、短期覆冰预测子信息;现场维修部门部署历史信息包括线路缺陷子信息、隐患子信息、故障子信息。对采集的上述历史信息进行整理,形成完整的历史数据,完整的历史数据具有若干维度,维度即为数据特征。由于国家电网覆冰灾害数据来源不同,脏数据比较多,因此,需要对采集的历史信息进行处理,对缺失的数据补全,以避免脏数据、缺失数据对后续算法效果造成负面影响,还需要对非数值型的数据进行编码,以便于计算机读取、识别。对历史信息进行整理,形成完整的历史数据具体包括如下子步骤:基于国家电网的电力传输线路,将与同一条电力传输线路相关的历史信息及其子信息作为一条完整的历史数据,一条完整的历史数据下,不同的历史信息及其子信息作为该完整的历史数据下不同的维度;对历史信息进行整理,确定各个历史信息下的数值子信息和/或非数值子信息;对各个历史信息下缺失的数值子信息补充完整:如果某一历史信息下的数值子信息缺失量超过一半,则删除该历史信息及其数值子信息;如果该历史信息下的数值子信息缺失量未超过一半,则采用相近的数值子信息合理地对缺失数值子信息的历史信息进行填补,具体可使用该历史信息下数值子信息的平均数、中位数或行/列众数对该历史信息补充完整,本实施例优选采用中位数对缺失数值子信息的历史信息补充完整。对各个历史信息下的非数值子信息进行独热编码:将同一历史信息下的各个非数值子信息分别作为状态值,状态值的位数与该历史信息下的各个非数值子信息的个数相等,每个状态值中只有一位为1,其余位为0。进行独热编码后,各个历史信息下的非数值子信息可由计算机读取、识别并计算。独热编码后,对气象历史信息构建气象子信息,构建的气象子信息包括每日温度、每日湿度、每日风速以及每日气压的平均统计、最大值统计、最小值统计,还包括月平均降雨频数统计、月平均降雨频率统计、月平均降雪频数统计、月平均降雪频率统计。完成了对历史信息的整理和补全,形成完整的历史数据以后,由于完整的历史数据的维度,即数据特征较多,因此,需要对众多的数据特征进行筛选,筛选出数量适中的最优特征作为训练特征集,以避免数据冗余导致计算速度减慢,本实施例采用lightgbm模型对数据特征进行选择,得到训练特征,至此,已经完成了从历史信息到训练数据集的转换。构建训练特征集的同时,还需要采用差分进化算法对lightgbm模型的参数进行调整,具体包括如下子步骤:确定需要优化的lightgbm模型参数,对需要优化的lightgbm模型参数形成原始种群,对原始种群计算个体适应度值,进行变异操作和交叉操作,判断是否达到预设迭代次数,如果达到预设迭代次数,则输出结果,如果为未达到预设迭代次数,则继续计算个体适应度值,进行变异操作和交叉操作,直至达到预设迭代次数。差分进化是一种简单有效的进化算法,基于群体的随机搜索方法,用于连续搜索领域的全局优化问题。几年来,差分进化算法在机器学习领域得到了广泛应用。与遗传算法不同的是,差分进化算法采用差分策略来实现个体之间的变异,通过从种群中随机选择两个个体计算其之间的差异,估计该区域间的梯度(而不是某个点)。变异算子可以自适应调整步长和方向,选择算子的局部指标也快速高效。因此,这些特性可以使差分进化算法收敛速度更快,较其他启发式算法也更稳定。完成了训练特征集的构建以及lightgbm模型参数的调整以后,基于已经构造的覆冰灾害的数据特征,本实施例采用lightgbm模型进行预测,在预测前,需要先利用训练数据集训练lightgbm模型,以保证预测的准确性。需要优化的lightgbm参数包括:基分类器个数、树最大深度、叶节点数、学习率、工具箱数、单个叶子上数据的最小数量、每次迭代中随机选择特征的比例、不进行重采样的情况下随机选择的数据,采用lightgbm模型输出的auc值作为lightgbm模型的适应度值。lightgbm模型主要有基于梯度的单边梯度采样(gradient-basedone-sidesampling,goss)和独立特征合并(exclusivefeaturebundle,efb)两个方面的改进提升:goss技术主要通过区分不同梯度的实例,保留较大梯度实例同时对较小梯度随机采样减少计算量,从而达到提升效率的目的;efb主要针对高维稀疏的特征空间,由于许多特征是互斥的,将这些互斥特征绑定一个单一的特征中,通过特征扫描算法,构建与个体特征类似的基于特征束的特征直方图,以提高训练速度。此外,lightgbm模型采用了基于直方图优化histogram算法,将连续的特征分桶(buckets)装进离散的箱子(bins)中,优化速度和内存;采用leaf-wise的决策树生长策略,避免了对整层节点分裂法,而采用了对增益最大的节点进行深入分解的方法。为克服过拟合,还可以采用控制单个决策树的最大深度控制;采取并行化学习的方式提高算法效率等方式。lightgbm算法拥有更快的训练速度和更高的准确率,并且能够支持gpu、便于处理大规模数据,面对电网每天产生的海量数据能够及时有效的处理,以便及时发现风险并避免风险,根据风险等级辅助确定治理措施,减少人力物力的损失,提高员工工作效率。采集当前信息,对当前信息进行整理,形成完整的当前数据,采集的当前信息与采集的历史信息的类目相同;对当前信息进行整理,形成完整的当前数据,与对历史信息进行整理,形成完整的历史数据的步骤相同,在此不再赘述。基于完整的当前数据,利用训练好的lightgbm模型进行覆冰灾害预测,包括对电力塔杆预测、对电力传输线路预测和电力传输通道预测。由于建模对象是电力塔杆,而业务评估的最终对象是电力传输线路和电力传输通道,因此本实施例中,采用分而治之的思想对电力传输线路、电力传输通道风险状态作评估预测,即对待预测区域的国家电网进行区间划分,把电力传输线路和电力传输通道视作由若干个区间构成,再把每个区间作为由若干根连续的电力塔杆构成。因此,可以通过对电力塔杆的风险状态预测,进而评估整条电力传输线路和电力传输通道的风险状态。但是,由于国家标准对于电力传输通道作出了标准性的规定,因此,对于电力传输通道的区间划分,应在国家标准对于电力传输通道所做规定的基础上进行,其划分的方式亦在国家标准中有相关规定,因而依照国家标准规定执行;而对于电力传输线路的区间划分,则可根据实际预测需求灵活进行,本实施例中采用3km*3km的网格进行划分。电力传输线路和电力传输通道不同的划分依据导致了对于电力传输线路的区间划分和对于电力传输通道的区间划分不可通用,本实施例中,对于电力传输线路的区间划分记作第一区间,对电力传输通道的区间划分记作第二区间,以示区别:覆冰告警等级包括0级、1级、2级、3级,0级为无覆冰,1级和2级为严重覆冰,3级为轻微覆冰;历史线路覆冰子信息和短期覆冰预测子信息中,覆冰持续时间<5h为0级,若5h≤覆冰持续时间<10h为3级,10h≤覆冰持续时间<15h为2级,覆冰持续时间≥15h为1级,如下表所示:数据源等级范围观冰站上报历史信息[无覆冰、轻微覆冰、严重覆冰]国网覆冰预警中心历史信息[0-5,5-10,10-15,15-20,20-30,30-40,40-50,>50]覆冰告警等级[0级、1级、2级、3级]国网覆冰预警中心历史信息时间范围跟覆冰告警等级的时间范围一致时,将国网预警中心历史信息作为数据特征;国网覆冰预警中心历史信息时间范围跟覆冰告警等级的时间范围不一致时,覆冰告警等级作为训练特征。在任一第一区间内,任一电力塔杆的预测结果为严重覆冰,则该第一区间电力塔杆的覆冰灾害发生状态为严重覆冰;训练好的lightgbm模型可以直接计算出任一电力塔杆预测结果为严重覆冰、轻微覆冰以及无覆冰的概率,在本实施例中,对应的覆冰灾害风险发生概率为该第一区间内所有电力塔杆预测结果为严重覆冰的概率最大值;在任一第一区间内,所有电力塔杆的预测结果均不为严重覆冰,则计算该第一区间内每个电力塔杆的预测结果为无覆冰的概率、轻微覆冰的概率以及严重覆冰的概率,并对该第一区间内所有电力塔杆无覆冰的概率求和、轻微覆冰的概率求和以及严重覆冰的概率求和,求和后的最大值所对应的预测结果为该第一区间的覆冰灾害发生状态,且对应的覆冰灾害发生概率为该第一区间内所有电力塔杆预测结果为严重覆冰的平均概率;对电力传输线路的预测为:收集待预测区域内任一第一区间的电力塔杆的覆冰灾害发生状态,出现次数最多的覆冰灾害发生状态为该第一区间的电力传输线路的覆冰灾害发生状态;对电力传输通道的预测为:收集待预测区域内任一第二区间的电力塔杆的覆冰灾害发生状态,出现次数最多的覆冰灾害发生状态为该第二区间的电力传输通道的覆冰灾害发生状态。预测结果总体如下表所示:以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,熟悉该本领域的技术人员应该明白本发明包括但不限于附图和上面具体实施方式中描述的内容。任何不偏离本发明的功能和结构原理的修改都将包括在权利要求书的范围中。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1