一种基于数据挖掘的输电线路电磁环境参数预测方法与流程

文档序号:13640852阅读:340来源:国知局
本发明属于电力系统电磁环境防护
技术领域
,特别涉及一种基于数据挖掘的输电线路电磁环境参数预测方法。
背景技术
:电磁环境是输电线路设计的主要考虑因素,输电线路的电磁环境的根源是线路的电晕放电。电晕放电一方面会造成电能损耗,增加输电成本;另一方面影响导线周边电磁环境,进一步干扰人们的正常生活。随着经济的不断发展和民众环境意识的增强,电磁环境问题愈加引人关注,输电线路其电磁环境问题已成为其系统设计和运行的主要制约因素。输电线路的电磁环境参数主要包括有可听噪声、无线电干扰、地面合成场强、地面离子流密度和电晕损耗。若能在线路设计阶段合理预测电磁环境参数,则可对导线线型、导线分裂间距、极间距等线路参数进一步优化,实现更为环境友好的电网发展方式;或在保证合理的电磁环境水平下,尽可能减小输电走廊,降低线路征地及建设成本。这对在建及规划中的输变电工程具有重大工程实用价值。电磁环境参数影响因素众多,且具有明显的随机特性。当前电磁环境的模型有两个重要的不足:首先,大多数模型都是通过多元线性回归训练的,线性模型不能描述复杂的非线性模型。其次,这些模型都是针对海平面的电磁环境进行设计的,于是包含了一些潜在设定,比如标准大气压等等。技术实现要素:本发明的目的是为克服已有技术的不足之处,提出一种基于数据挖掘的输电线路电磁环境参数预测方法,本方法不仅可以考虑非线性关系,还能将不同的环境参数作为模型的参量进行考虑,如海拔等,本模型能更加全面地描述电磁辐射,不仅提高其预测精度,还提高该模型的工程实用价值。为此,本发明采用的技术方案为:一种基于数据挖掘的输电线路电磁环境参数预测方法,包括以下步骤:s1:收集数据:所述数据包括线路基本参数、电磁环境参数和空间电场参数以及离子流参数,所述线路基本参数包括分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔,所述电磁环境参数包括电晕放电cl、无线电干扰ri和可听噪声an,空间电场以及离子流参数包括最大标称场强nfs、最大复合电场强度mcefi和最大离子流密度micd。s2:划分数据:将步骤s1收集到的数据划分为自变量和因变量两部分,其中自变量包括所述的线路基本参数,因变量包括电磁环境参数、空间电场参数和离子流参数,系统模型为:在上式中,为自变量,为因变量;s3:分析所述电磁环境参数之间的关系,验证ri分别与an、cl线性相关;s4:分析所述空间电场以及离子流参数之间的关系,验证nfs分别与mcefi、micd线性相关;s5:分析影响电磁环境的主因素;s6:对所述电磁环境参数和空间电场参数进行预测。优选的,所述步骤s3具体为:s31:假设所述无线电干扰ri分别与可听噪声an、电晕放电cl不存在线性相关;s32:假设其中为模型线性回归后的斜率,为自变量的标准差;s33:对进行统计,并将统计阈值设定为95%,得出步骤s31的假设均不成立;s34:得出结论,即ri分别与an、cl线性相关。优选的,所述步骤s4具体为:s41:假设所述最大标称场强nfs分别与最大复合电场强度mcefi、最大离子流密度micd不存在线性相关;s42:假设其中为模型线性回归后的斜率,为自变量的标准差;s43:对进行统计,并将统计阈值设定为95%,得出步骤s41的假设均不成立;s44:得出结论,即nfs分别与mcefi、micd线性相关。优选的,所述步骤s5具体为:s51:定义信息熵的公式为:其中h为信息熵,是系统成为状态的概率;s52:定义信息增益ig的公式为:其中表示一系列的训练样本,而代表样本的其中一个参数;s53:以ri和nfs为因变量,根据步骤s52中的式子分别计算ri和nfs所对应的信息增益,其中t表示一系列的训练样本,每一个训练样本代表一组线路基本参数,a代表训练样本的其中一个参数,具体为分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔中的一个;s54:统计步骤s53的计算结果,归纳总结出影响无线电干扰ri和最大标称场强nfs的主要因素和次要因素。优选的,所述步骤s6中的预测采用决策树回归方法。优选的,所述决策树回归方法具体为:将整个样本数据分为训练集和测试集两组,训练组占总样本的90%,测试组占总样本的10%,将训练集对决策树模型进行训练后,再利用测试集对决策树模型进行计算,得到均方误差。优选的,所述决策树模型中每个方框中的百分比表示样本的比例,剩下的数值是相应的预测结果,在每个分割点上,左侧表示条件满足的情况,右侧则表示条件不满足的情况。本发明的益处在于:(1)运用本发明的预测方法,可在线路设计阶段对导线线型、导线分裂间距、极间距等线路参数进一步优化,实现更为环境友好的电网发展方式;(2)运用本发明的预测方法,可在保证合理的电磁环境水平下,尽可能减小输电走廊,降低线路征地及建设成本,具有重大工程实用价值;(3)本发明的预测方法,不仅可以考虑非线性关系,还能将不同的环境参数作为模型的参量进行考虑,更加全面地描述电磁辐射。从而提高其预测精度以及该模型的工程实用价值。附图说明图1为本发明的流程图。图2为电磁环境参数之间的关系图。图3为空间电场参数和离子流参数之间的关系图。图4为无线电干扰ri的决策树模型图。图5为最大标称场强nfs的决策树模型图。具体实施方式一种基于数据挖掘的输电线路电磁环境参数预测方法,如图1所示,包括以下步骤:s1:收集数据,所述数据包括线路基本参数、电磁环境参数和空间电场参数以及离子流参数。本实施例中,主要收集±800kv直流输电线路的基本参数信息及其所对应的电磁环境参数,空间电场参数以及离子流参数。具体的参数和单位如下所示:线路基本参数:分裂导线数、子导线直径(cm)、分裂导线间距(cm)、极间距(m)、导线平均高度(m)、海拔(m);电磁环境参数:电晕放电(cl,kw/km)、无线电干扰(ri,db)、可听噪声(an,db);空间电场以及离子流参数:最大标称场强(nfs,kv/cm)、最大复合电场强度(mcefi,kv/cm)、最大离子流密度(micd,na/)。s2:划分数据:将步骤s1收集到的数据划分为自变量和因变量两部分,其中自变量包括所述的线路基本参数,因变量包括电磁环境参数、空间电场参数和离子流参数,系统模型为在上式中,为自变量,为因变量;s3:分析所述电磁环境参数之间的关系,验证ri分别与an、cl线性相关;由上述分析可知,尽管有电晕放电cl、无线电干扰ri、可听噪声an、最大标称场强nfs、最大复合电场强度mcefi和最大离子流密度micd等6个不同的因变量需要分析,但它们当中有一些是高度线性相关的。为了分析其线性相关特性,本实施例首先绘制了不同因变量之间的关系,如图2和图3所示。图2为电磁环境参数之间的关系图。由图2可知,cl,ri和an都有着明显的线性相关性。为了更加严密地证明这一点,本实施例使用检测来判断这三个参量间的线性相关。即首先提出两个空假设,即ri和an没有线性相关性以及ri和cl也没有线性相关性。通过统计的假设,它的表达式可写为:其中为模型线性回归后的斜率,是自变量的标准差。最后统计后就得到线性相关检验假设的结果,如表1所示:表1因变量自变量值riclriannfsmcefimcefimicd由表1可知,通过设定统计阈值为95%,之前提出的两个空假设都会被否定。因此,可以判断ri与an,ri与cl都存在线性相关。图3为空间电场参数和离子流参数之间的关系图。由图3可知,micd和mcefi是线性相关的,而mcefi和nfs之间的关系不明显。同上所述,可以采用了检测对它们之间的关系进行判断。即假设nfs与mcefi不存在线性相关以及nfs与micd也不存在线性相关。检验的结果可以从表1中得到。因此,两个假设都被否定,即nfs与mcefi、micd都存在线性相关。由于显著线性相关的参量,它们理论上有着相近的模型。因此,本实施例只分析了显著线性相关参量的一部分,即只采用ri和nfs进行分析。s5:分析影响电磁环境的主因素;本发明采用信息增益ig作为不同因变量主因素分析的度量方法。信息增益ig是信息从一个状态到另一个状态后信息熵的变化。而信息熵h则是表示系统紊乱程度的度量,其定义为:其中是系统成为状态的概率。比如,一个拥有两个相等概率状态的系统,其信息熵为1,这是两态系统信息熵的最大值,也就是说,这种系统处于完全的无规律状态。此时,信息增益ig则可以表达为:(1)其中表示一系列的训练样本,而代表训练样本的其中一个参数。更大的信息增益代表因素可以为系统的判断带来更大的信息量,即知道参量之后可以大大减小系统的无序程度。根据上述对信息增益的定义,以ri和nfs为因变量,以线路基本参数值作为训练样本,而以分裂导线数、子导线直径、分裂导线间距、导线平均高度和海拔中的任一个作为这个训练样本的其中一个参数,代入式(1)进行计算统计,其结果如表2所示。表2由表2可知,分裂导线数量是影响无线电干扰ri和最大标称场强nfs的主要因素,而分裂导线间距则是影响无线电干扰ri的次要因素,导线平均高度是影响最大标称场强nfs的次要因素。s6:采用决策树回归方法对电磁环境参数和空间电场参数进行预测。由上述分析可知,ri与an、cl都存在线性相关,而nfs与mcefi、micd也存在线性相关。由于线性相关的参量,它们理论上有着相近的模型。因此,本实施例只采用ri和nfs进行分析。构建决策树模型时,决策树模型的每个方框中的百分比表示样本的比例,剩下的数值是相应的预测结果,在每个分割点上,左侧表示条件满足的情况,右侧则表示条件不满足的情况。将整个样本数据分为训练集和测试集两组,训练组占总样本的90%,测试组占总样本的10%,将训练集对决策树模型进行训练后,再利用测试集对决策树模型进行计算,得到均方误差(mse),均方误差表示了模型的性能。无线电干扰ri的决策树模型如图4所示。正如信息增益所表明的,分裂导线数量是影响它的主要因素,即分裂导线数量的增加产生更小的无线电干扰。同时,在分裂导线数量相当的范围之内,较小的海拔将导致较少的无线电干扰。通过测试集在模型上的计算可以得出,该模型实现了2.44的均方误差。最大标称场强nfs的决策树模型如图5所示。由图5可知,其导体的平均高度越高,分裂导线数量越多,显示的nfs强度越低,而较少的分裂导线数量意味着更大的场强。与无线电干扰决策树模型的结构相似,在一定条件下,子导线直径越小,nfs强度越高。最大标称场强的决策树模型在测试数据上实现了5.46的均方误差。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1