一种基于电网的地质灾害风险预警方法与流程

文档序号:21086625发布日期:2020-06-12 16:56阅读:123来源:国知局
一种基于电网的地质灾害风险预警方法与流程

本发明涉及一种地质灾害分析预警方法,特别涉及一种基于电网的地质灾害风险预警方法。



背景技术:

我国是一个地质灾害多发的国家,平均每年5级以上的地震总数高达20次,高频地震对电网的安全防护是一个重大考验,现有技术中,基于电网的地质灾害预警系统通常是在地质灾害发生后做事后防护,请参考公开的发明专利:一种电网地震预警方法及系统(cn108898798a),该技术方案的中各个变电站之间圈定一个圆,不同的变电站之间可根据变电站的电压大小而设置监测圆半径,在每个圆内设置地震波监测点,相邻的监测点之间通讯连接,通过监测地震波达到对地震的预警,该技术方案无法通过电网设备本身事先对地质灾害进行预测。



技术实现要素:

本发明其中一个目的在于提供一种基于电网的地质灾害风险预警方法,其中所述预警方法可通过现有的大数据、人工智能等技术对包括电力线路、电力通道和塔杆故障等风险进行预测,从而可以事先对有风险或故障的设备预先防护和维修。

本发明其中一个目的在于提供一种基于电网的地质灾害风险预警方法,所述方法采结合电力线路和通道状况、电网维修数据、植被数据、地质沙层数据、塔杆数据以及气象数据作为建模数据,通过数据挖掘和处理,用于监测地质灾害信息、电力线路和通道的损耗信息。

本发明其中一个目的在于提供一种基于电网的地质灾害风险预警方法,所述方法采用独热编码(one-hotencoding)将非数值型特征转换为数值型特征,用于gbdt模型训练。

本发明其中一个目的在于提供一种基于电网的地质灾害风险预警方法,所述方法采用smote算法对少数类样本集上采样并重建新样本集,使得少数类样本集和多数类样本集之间保持数据平衡。

本发明其中一个目的在于提供一种基于电网的地质灾害风险预警方法,所述方法对tomeklinks算法对多数类样本集进行下采样,通过删除tomeklinks对的方式剔除多数类样本集中的噪点,可以避免少数类新建样本集的边界入侵多数类样本集现象。

为了实现上述至少一个发明目的,本发明进一步提供一种基于电网的地质灾害风险预警方法,包括如下步骤:

采集数据;

预处理数据,所述数据包括正类样本集和负类样本集,正类样本集为少数类样本集,负类样本集为多数类样本集;

采用smote+tomeklinks算法对数据进行样本重采样;

将重采样后的数据输入gbdt模型;

将gbdt模型的输出的结果进行风险评估。

根据本发明一个较佳实施例,所述数据包括数值特征和类别特征,其中采用独热编码将类别特征转换为数值特征。

根据本发明一个较佳实施例,预处理数据中,包括:根据已采集的数据,采用平均数、中位数、行众数和列众数中任意一种填补同类缺失数据,其中已采集的数据包括历史数据。

根据本发明一个较佳实施例,预处理数据中,包括:统计气象数据中的降雨量、降雪量、气温、湿度、风速的平均值、最大值、最小值、频数和频率,采用gbdt模型选择并确定特征。

根据本发明一个较佳实施例,对数据重采样步骤中,采用smote算法对少数类样本集进行上采样,形成第一重建样本,所述第一重建样本集包括原多数类样本集和上采样后的新样本集,采用tomeklinks算法对第一重建样本中多数类样本集进行下采样,并删除tomeklinks对或tomeklinks对中的多数类样本

根据本发明一个较佳实施例,预处理数据中,包括采用独热编码将类别特征转换为数值特征。

根据本发明一个较佳实施例,采集数据中,包括对塔杆以及电力线路或电力通道周围植被、土壤、岩石状态进行数据采集。

根据本发明一个较佳实施例,所述风险评估以塔杆为对象,方法包括如下步骤:

划分由若干个连续塔杆组成的预测区间;

对预测区间内的每一塔杆风险进行预测;

计算每一塔杆和每一预测区间的风险概率;

预测和计算同一电力线路的风险和风险概率;

预测和计算同一电力通道的风险和风险概率。

根据本发明一个较佳实施例,在上述风险评估方法中,若预测区间内存在至少一塔杆存在风险,则判定该预测区间为有风险区间,标记该风险区间为1;若该预测区间内所有塔杆都无风险,则判定该预测区间为无风险区间,记该预测区间为0。

根据本发明另一较佳实施例,在上述风险评估方法中,若预测区间被判定为有风险区间,则计算所有该预测区间内每一塔杆的风险概率,将预测的塔杆中最大的风险概率作为该预测区间的风险概率。

根据本发明另一较佳实施例,在上述风险评估方法中,同一电力线路由多个预测区间组成,计算同一电力线路中所有预测区间的风险状态,记风险状态出现最多的为该同一电力线路的风险状态。

根据本发明另一较佳实施例,在上述风险评估方法中,同一电力线路由多个预测区间组成,计算同一电力线路中所有预测区间的风险概率,记风险概率最大值为该电力线路风险概率。

为了实现本发明上述至少一个发明目的,本发明进一步提供一种基于电网的地质灾害风险预警系统,所述系统采用上述方法实施,包括:

采集模块、预处理模块,gbdt算法模块和风险评估模块。

附图说明

图1显示的是本发明一种基于电网的地质灾害风险预警方法流程示意图;

图2显示的是本发明一种基于电网的地质灾害风险预警方法步骤示意图;

图3显示的是本发明电力线路或电力通道风险预测和评估流程示意图;

图4显示的是本发明一种风险评估表;

图5显示的是本发明另一种风险评估表;

图6显示的是本发明另一种风险评估表。

具体实施方式

以下描述用于揭露本发明以使本领域技术人员能够实现本发明。以下描述中的优选实施例只作为举例,本领域技术人员可以想到其他显而易见的变型。在以下描述中界定的本发发明的基本原理可以应用于其他实施方案、变形方案、改进方案、等同方案以及没有背离本发明的精神和范围的其他技术方案。

可以理解的是,术语“一”应理解为“至少一”或“一个或多个”,即在一个实施例中,一个元件的数量可以为一个,而在另外的实施例中,该元件的数量可以为多个,术语“一”不能理解为对数量的限制。

基于电网的风险预警系统包括采集模块、预处理模块、gbdt算法模块和风险评估模块,其中采集模块用于数据的采集归类,采集的数据包括塔杆自身的电力线路或通道数据、塔杆结构数据、气象数据、地质数据等,其中塔杆结构数据包括塔杆的水平载荷、垂直载荷、重力载荷、塔杆自身的弯曲角度、抗弯强度以及安装维修时的附加载荷等作为塔杆受力性能分析数据,其中电力线路或通道数据包括电力载荷,故障数据、隐患数据等,气象数据包括风向、风速、气温、雨雪等。地质数据包括植被种类、植被数量、土壤岩石状况以及一段时间内的地震强度和频率等,需要说明的是,所述数据可采用对应的传感器获取相应特征,本发明所述的特征是该领域技术人员对数据类型的一种技术术语,可以理解的是,对特征的描述不是本发明的限制。

可以理解的是,所述数据包括数值特征和类别特征,类别特征在地质灾害的预测中起到非常重要的作用,为了将上述类别特征转换为数值特征,本法明采用独热编码将类别特征编码为数值特征,需要说明的是,独热编码后的类别特征作为一种状态码,有多少个状态就有多少个比特,并且每个状态码只有一个比特是激活状态,该激活状态比特显示为1,类别特征处理的过程中,可根据需要的转化的类别特征数量决定独热编码位制。

请参考图1-3,数据采集过程中,存在部分数据缺失现象,需要对数据进行填补或删除,所述预处理模块用于数据填补和删除,其中填补的规则如下

预采集数据;

将类别特征通过独热编码转换为数值特征;

对于存在缺失值的同类特征,可以根据已采集同类特征的平均数、中位数,或者行/列众数进行填充,本发明优选同类特征的中位数填补缺失的数据。

其中若同类特征缺失值达到一半以上,则删除该类特征。

进一步地,由于地质灾害环境中风险数据出现的次数较少,属于类别不平衡数据。为了解决该问题,本发明采用smote(syntheticminorityover-samplingtechnique)算法对少数类样本集m进行上采样,以生成第一重建样本集,需要说明的是,少数类样本集中的数据为风险数据,多数类样本集中的数据为正常数据,其中第一重建样本集生成方法包括如下步骤:

采用k近邻算法计算距离少数类样本集m中任意一个样本最近的k个近邻点;

随机选取k个邻近点中的一个用于生成新样本集c,新样本集c生成公式为:

其中为随机选取的近邻点,xi为第i个样本点,δ∈[0,1]随机数,xnew为新样本集c,新样本集c和原多数类样本集构成所述第一重建样本集。

需要说明的是,上述距离指的是样本之间的n维欧式距离,其中n的数值可根据少数类样本集中特征种类数目而选择。

进一步地,对少数类样本集进行上采样的过程中,新样本集容易出现样本“入侵”现象,也就是说,少数类样本集的扩增会使得样本噪点或样本空间边界“入侵”多数类样本集,为了解决该问题,本发明采用tomeklinks算法清除对应的少数类样本集扩增过程中的噪点或“入侵”边界。包括如下步骤:

将扩增后的总样本集分成少数类样本集m1和多数类样本集n,其中所述总样本集包括第一重建样本集和原多数类样本集;

计算m1中样本点到n中样本点之间的距离,获取两样本点之间的最小距离d(xi,xj),其中xi和xj分别属于少数类样本集和多数类样本集的样本点,若不存在第三个样本点xl,使得d(xl,xi)<d(xi,xj)或d(xl,xj)<d(xi,xj)成立,则(xi,xj)为tomeklinks对,删除tomeklinks对或tomeklinks对中多数类样本,以形成第二重建样本,通过tomeklinks算法可使得样本之间的类别边界更加明确。其中将第二重建样本投入到gbdt模型中训练,以获取最佳模型。

本发明选择gbdt模型采用了boost中的boostingtree(提升树),并采用梯度提升算法gradientboost在残差减少的方向上建立新的模型,每一分类器都根据上一分类器产生残差值进行训练,并通过回归树作为基学习器,其中梯度提升算法gradientboost迭代过程中,选择梯度下降的方向并通过损失函数拟合状况判断数据和合理性,损失函数包括但不仅限于平方损失函数、绝对值损失函数、指数损失函数、对数损失函数和huber损失函数中的任意一种。由于梯度提升算法gradientboost需要按照损失函数的梯度拟合残差,拟合的数值是连续的,因此本发明优选采用回归树作为基学习器。

需要说明的是,gbdt模型需要设置初始参数,其中初始参数包括:学习率learning_rate,弱学习器数n_estimators,每一个学习器的最大深度max_depth,划分时考虑的最大特征数max_features等。输入特征后,根据损失函数的拟合状况调整上述初始参数,以获得最佳模型。

将gbdt模型所输出的数据对电力通道风险、电力线路风险和塔杆风险进行预测,请参考图3,其中该方法包括如下步骤:

划分由若干个连续塔杆组成的预测区间;

对预测区间内的每一塔杆风险进行预测;

计算每一塔杆和每一预测区间的风险概率;

预测和计算同一电力线路的风险和风险概率;

预测和计算同一电力通道的风险和风险概率。

请参考图4-6显示的风险评估表,本发明中以塔杆为主要对象采集数值特征和类别特征,针对塔杆所采集的特征作为第一风险分析依据,设一第一预测区间,所述第一预测区间由第若干个塔杆组成,若第一区间内的任意一塔杆被预测为有风险,则所述第一预测区间被判定为有风险,记该第一区间的风险为1,表示存在风险,并计算所述第一预测区间内每一塔杆的风险种类和风险概率;提取第一预测区间内所有塔杆中最高的风险概率,并将该风险概率作为第一预测区间的风险概率。若第一预测区间内所有塔杆都被预测为无风险,记该第一预测区间的风险为0,表示无风险,则第一预测区间被判定为无风险。

请参考图5和6,上述预测区间优选将同一电力线路上的塔杆划分为多个预测区间,每一个预测区间内的塔杆是连续的,通过所述gbdt算法模块和风险评估模块,获得同一电力线路下的多个预测区间的风险状况和风险概率。其中记同一电力线路中所有区间出现风险次数最多的为本电力线路风险类型,同时记同一电力线路所有预测区间风险最高的概率为该电力线路的风险概率。

进一步地,所述风险评估模块还用于将每一区间和每一电力线路中风险概率进行排序,其中排序方式可以采用包括但不仅限于枚举值实现,并分析提取影响风险概率最大的数据,并分析风险形成原因。

本发明可根据塔杆和预测区间的风险状况预测电力通道的风险和风险概率,预测方法和预测电力线路相同,需要说明的是,所述电力通道具有国家标准,预测方法可在国家标准基础上执行。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分从网络上被下载和安装,和/或从可拆卸介质被安装。在该计算机程序被中央处理单元(cpu)执行时,执行本申请的方法中限定的上述功能。需要说明的是,本申请上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。

附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

本领域的技术人员应理解,上述描述及附图中所示的本发明的实施例只作为举例而并不限制本发明,本发明的目的已经完整并有效地实现,本发明的功能及结构原理已在实施例中展示和说明,在没有背离所述原理下,本发明的实施方式可以有任何变形或修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1