一种基于大数据技术的台区线损率异常诊断方法与流程

文档序号:18743922发布日期:2019-09-21 02:07阅读:334来源:国知局
一种基于大数据技术的台区线损率异常诊断方法与流程
本发明涉及配电网安全领域,尤其涉及一种基于大数据技术的台区线损率异常诊断方法。
背景技术
:中国配电网规模庞大,具有点多、线长、面广的特点。线损率作为一种综合反映电力系统中规划设计、生产运行、经营管理水平的经济技术指标,是电力部门日常关联工作中所关注的重要内容。我国对低压客户全面实行分台区管理,台区线损直接反映了一个地区的电网营销管理水平,降低线损率能够带来非常可观的经济与社会效益;但是在降低线损率之前,首先是要诊断出线损异常出现的原因,才能对不合理线损进行分析和预测,从而提供较为科学有效的降损措施。目前各个台区主要通过线损率计算公式得到线损率数值,然后依照人工设定的合理线损率进行分析哪些台区的线损率出现了异常。这种人工设定台区合理线损率的一刀切方式,缺乏科学依据,也与精益化的管理目标背道而驰。从台区线损计算公式可以看出统计线损率的逻辑并不复杂,但是仍然有很多因素影响着线损率计算的准确性,例如台区的用户采集覆盖情况、台区的户变关系、台区的供电考核电能表档案参数等等,这些因素都会影响台区线损率计算的准确性和正确性。传统数据分析手段在应对这些数据时存在种种局限性,并且工作量巨大且效率不高。同时在面临新的数据带来的问题时,传统的数据分析技术常常遇到实际困难。通常,传统的数据分析方法只处理包含相同类型属性的数据集,或者是固定属性的,或者是变动属性的。随着用电信息采集系统在智能用电领域的作用越来越大,越来越需要能够处理异种属性的技术,例如静态档案数据与动态采集数据的相关性、台区户变逻辑父子关系等等。技术实现要素:基于
背景技术
存在的技术问题,本发明提出了一种基于大数据技术的台区线损率异常诊断方法。本发明采用的技术方案是:一种基于大数据技术的台区线损率异常诊断方法,其特征在于,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:计算各变动属性辅助变量Xi的均值,Xi=X1,X2,……,XN,均值反映总体各单位变量分布的集中趋势和一般水平;(4)步骤(3)得到了各变动属性辅助变量的均值,再根据参考值范围公式:计算各变动属性辅助变量的波动范围,公式中表示极限误差,即用样本值估计总体值时所允许的最大绝对误差;由于一些外在因素的存在,数据中难免有个别超出正常范围的极大值和极小值,在此,我们将分布在均值附近95%的样本作为波动范围衡量的标准,最大限度降低极值带来的影响。由于季节自然因素的作用会对线损率产生一定的影响,因此划分春秋、冬夏两个层面对台区线损率进行分析,分别得到春秋时期以及冬夏时期各变动属性辅助变量集中趋势及波动范围;(5)依据步骤(4)中不同季节各台区变动属性辅助变量的集中趋势和波动范围进行分析,当该台区线损率出现异常时,依次对比各指标变量的波动范围,若某指标的数值不在该范围中,则在一定程度上,可以认为是由该因素导致的台区线损率异常;若各指标数值都在其合理的变化范围中时,利用公式:依次计算台区各指标数值距离其历史数据均值的差异度,差异度较大的指标就为导致台区线损率异常的指标变量,从而诊断出台区线损率异常的原因;(6)当步骤(5)中,各变动属性辅助变量的集中趋势与波动范围都较为合理时,针对固定属性辅助变量进行分析,固定属性指那些长期不变的指标变量,该类变量对于线损率只是一个基础层面的影响,由于其长期固定不变,所以对于线损率的影响也比较有限,当台区线损率发生异常时,若变动属性数据都在其合理范围时,就要考虑固定属性数据对台区线损率的影响,在此,采用k-means聚类的方式进行分析,首先通过肘部法则确定聚类的个数,进行依照变量对台区进行聚类;(7)根据步骤(6)中通过k-means聚类算法将台区划分为不同的类别,分别根据不同类别,计算各类别固定属性辅助变量的均值和变化范围,从而得到变量的集中趋势和波动范围,当某个台区线损率发生异常时,可以通过指标变量在日常时期的走势判断发生异常的原因。本发明的优点是:不同于以往只通过线损率数值大小等“一刀切”模式,来判断台区线损率是否发生了异常;本发明能够利用包括线损率在内的多个指标变量进行判断,综合采用统计分析方法以及聚类分析方法,从而更为全面、准确地度量台区线损率的状态。附图说明图1为各指标变量与台区线损率的相关性大小矩阵示意图。图2(a)为变动属性辅助变量在春秋季节其均值变化范围示意图。图2(b)为变动属性辅助变量在夏冬季节其均值变化范围示意图。图3为根据“肘部法则”确定聚类个数的示意图。图4为三类台区的各变量指标均值对比图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。一种基于大数据技术的台区线损率异常诊断方法,包括以下步骤:(1)搜集多个与台区线损率相关的指标变量,包括:峰谷差率、负荷率、电量、负载率、温度、台区运行年限、台区总导线长度、户均容量、台区额定容量,计算各指标与台区线损率的相关系数;(2)剔除与台区线损率无关的变量,得到与台区线损率高度相关的指标变量,将这些指标变量作为台区线损率异常诊断的辅助变量,并将辅助变量进行分类,分为固定属性辅助变量与变动属性辅助变量;(3)由于台区线损率每日都在变动,所以线损率与变动属性辅助变量相关性更大,因此首先将变动属性辅助变量单独进行分析,依照公式:计算各变动属性辅助变量Xi的均值,Xi=X1,X2,……,XN,均值反映总体各单位变量分布的集中趋势和一般水平;(4)步骤(3)得到了各变动属性辅助变量的均值,再根据参考值范围公式:计算各变动属性辅助变量的波动范围,公式中表示极限误差,即用样本值估计总体值时所允许的最大绝对误差;由于一些外在因素的存在,数据中难免有个别超出正常范围的极大值和极小值,在此,我们将分布在均值附近95%的样本作为波动范围衡量的标准,最大限度降低极值带来的影响。由于季节自然因素的作用会对线损率产生一定的影响,因此划分春秋、冬夏两个层面对台区线损率进行分析,分别得到春秋时期以及冬夏时期各变动属性辅助变量集中趋势及波动范围;(5)依据步骤(4)中不同季节各台区变动属性辅助变量的集中趋势和波动范围进行分析,当该台区线损率出现异常时,依次对比各指标变量的波动范围,若某指标的数值不在该范围中,则在一定程度上,可以认为是由该因素导致的台区线损率异常;若各指标数值都在其合理的变化范围中时,利用公式:依次计算台区各指标数值距离其历史数据均值的差异度,差异度较大的指标就为导致台区线损率异常的指标变量,从而诊断出台区线损率异常的原因;(6)当步骤(5)中,各变动属性辅助变量的集中趋势与波动范围都较为合理时,针对固定属性辅助变量进行分析,固定属性指那些长期不变的指标变量,该类变量对于线损率只是一个基础层面的影响,由于其长期固定不变,所以对于线损率的影响也比较有限,当台区线损率发生异常时,若变动属性数据都在其合理范围时,就要考虑固定属性数据对台区线损率的影响,在此,采用k-means聚类的方式进行分析,首先通过肘部法则确定聚类的个数,进行依照变量对台区进行聚类;(7)根据步骤(6)中通过k-means聚类算法将台区划分为不同的类别,分别根据不同类别,计算各类别固定属性辅助变量的均值和变化范围,从而得到变量的集中趋势和波动范围,当某个台区线损率发生异常时,可以通过指标变量在日常时期的走势判断发生异常的原因。实施例。1.如图1所示,判断各指标变量与台区线损率的相关性是否具有相关性,变量之间变动趋势相似,表示变量之间有一定程度的相关性;继而找到与判断台区线损率有较强相关性的辅助变量。由图1可以看到台区线损率与其他相关变量的波动关系,图1上三角部分所示,线损率为纵坐标数值,横坐标为各相关变量取值。由波动趋势可以判断线损率与各变量的相关关系。2.划分春秋、夏冬两个时间段,对于变动属性辅助变量分别计算其均值的变化范围,如图2(a)、2(b)所示,分析变量属性辅助变量在春秋、夏冬两个时间段内的波动,得到每个辅助变量的波动范围。图中中间的直线代表某个变量的均值,图上方的虚线代表某台区变量历史数据中,在合理范围内变动的最大值;图下方的虚线代表在合理范围内变动的最小值,合理范围由公式确定。查看各变动属性辅助变量是否都在其合理的变化范围中,若各指标数值都在其合理的变化范围中时,利用公式依次计算台区各指标数值距离其历史数据均值的差异度,以2018年10月3日,编号为101002296的台区为例,依次计算峰谷差率、负荷率、平均负载率、电量、温度的差异度,得到下表:峰谷差率负荷率负载率电量温度0.4650.0510.5930.6020.150综合对比峰谷差率、负荷率、负载率、电量、温度我们可以发现,电量这个因素偏移均值最大,因此可以在一定程度上判断当日该台区线损率异常是由电量引起的。3、若变动属性辅助变量都在其合理的区间内,使用固定属性辅助变量与变动属性辅助变量对台区进行聚类,首先根据“肘部法则”确定聚类个数,如图3所示。当台区每日运行数据被聚为三类时,曲线开始趋于平稳,这意味着若将数据划分为三类,我们获得的信息是最多的,聚类效果也是最好的。4.根据聚类的结果划分相应的台区,针对不同类别的台区,计算各变量的均值其变化范围,如图4所示:根据不同类别的台区分别分析,若某类台区某日线损率出现异常,且变动属性变量正常情况下,可以查看固定属性变量的范围,不在此范围则认为是由该属性变量导致的线损率异常。由图4中数值及占比可以看到,三类台区在各个指标上有一定的差异,线损率较高的样本往往在用电量、平均负载率、运行年限、导线长度上均值较大,在台区容量及户均容量上均值较小;线损率较小的样本正好相反,在用电量、平均负载率、运行年限、导线长度上均值较小,而在台区容量及户均容量上均值较大。以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本
技术领域
的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1