一种基于数据挖掘技术的台区合理线损预测方法

文档序号:9350453阅读:419来源:国知局
一种基于数据挖掘技术的台区合理线损预测方法
【技术领域】
[0001] 本发明涉及一种基于数据挖掘技术的台区合理线损预测方法,属于电力系统自动 化领域。
【背景技术】
[0002] 线损是在输送和分配电能过程中,电力网中各个元件或设备所产生的功率损失和 电能损失以及其他损失。线损率指的是电力网络中损耗的电能(线路损失负荷)与向电力 网络供应电能(供电负荷)的百分数,其计算公式如下:
[0003]
[0004] 线损率是综合反映电力系统规划设计、电力部门生产运行和经营管理水平的重要 经济技术指标,降低线损率可以带来非常可观的经济与社会效益。我国对线损实行分压、分 区、分线和分台区管理,其中低压客户全面实行分台区管理,台区线损直接反映了一个地区 的营销管理水平。所谓台区,是指在电力系统中,一台变压器的供电范围或区域。台区线损 管理通过比较理论线损与实际线损的差值,对线损率进行分析和预测,提供较为科学的降 损措施,有利于提升电力部门的管理水平与经济效益,促进电网的建设与改造。
[0005] 随着智能电表的推广应用以及用电信息采集系统建设工作的快速推进,低压台区 关口计量点和用户计量点实现远程准点抄表,极大提高了低压台区线损管理的实时性与准 确性。江苏省电力公司从2013年开始基于用电信息采集数据进行低压台区线损管理,全省 线损率在-1%至10%间的台区比重从65%提高到2014年底的91%,降损增效显著。
[0006] 为了进一步提高台区线损管理精益化水平,需要给出每个台区可参照的合理线损 率,实现线损在线监控,及时发现异常台区,分析原因,及时解决问题。但是由于低压台区下 分支线路复杂,元件多样,设备台账数据不全,理论线损计量非常困难,实时性不高。因此如 何快速计算合理线损率已成为当前低压台区线损研究的关键。数据挖掘技术的发展,为大 量的数据分析提供了可能。

【发明内容】

[0007] 为了解决上述技术问题,本发明提供了一种基于数据挖掘技术的台区合理线损预 测方法。
[0008] 为了达到上述目的,本发明所采用的技术方案是:
[0009] -种基于数据挖掘技术的台区合理线损预测方法,包括以下步骤,
[0010] 步骤一,提取台区线损的特征数据;
[0011] 步骤二,对特征数据进行筛选和清洗,获得线损稳定台区特征数据;
[0012] 所述线损稳定台区指用电信息采集系统在线计算的台区日和月线损率数值稳定, 能真实反应当前实际线损情况的台区;
[0013] 步骤三,设定聚类数K=n,n为正整数,设定聚类计算迭代终止阈值;
[0014] 步骤四,进行聚类计算,获得聚类数为K时的聚类结果;
[0015] 步骤五,计算步骤四中聚类结果的整体轮廓系数;
[0016] 步骤六,判断K是否小于n+p-1,p为正整数,如果是,则K=n+1,转至步骤四,否 则转至步骤七;
[0017] 步骤七,比较p个整体轮廓系数,确定最优的整体轮廓系数,获得最优的聚类结 果;
[0018] 步骤八,将最优聚类结果中的K类数据按照类别分别建立K个多元线性回归模 型;
[0019] 步骤九,通过K个多元线性回归模型得出K个回归方程,分析多元线性回归模型的 显著性,对输出数据进行预测验证,检验预测效果,并分析是否出现奇异点。
[0020] 进行聚类计算的过程为,
[0021]Al),在线损稳定台区特征数据中任选K个作为聚类中心,剩余的在线损稳定台区 特征数据作为样本数据;
[0022]A2),计算每个样本数据到每个聚类中心的欧氏距离,并将其归类于最近的聚类中 心;
[0023] A3)重新计算每个新类的平均值,并将该值作为新的聚类中心;
[0024]A4)重复步骤A2和A3,反复迭代,直到满足终止条件,即目标函数达到最小值迭代 终止阈值。
[0025] 所述目标函数采用平方误差准则,
[0027] 其中,E表示所有类对象的平方误差,Xq为第j个类C,中的元素,m,是第j个类C, 的聚类中心,je[1,K]。
[0028] 计算整体轮廓系数的过程为,
[0029] BI)对于第j个类Cj中的元素Xq,计算Xq与其同一类别内的所有其他元素距离的 平均值,记作c];
[0030] B2)选取xq外的一个类C](,j'G[1,K],计算\与(^,中所有元素的平均距离, 遍历所有其他类,找到最近的这个平均距离,记作(V;
[0032] B4)计算所有K个类中所有元素的轮廓系数,求平均值即为整体轮廓系数。。
[0033] 在建立多元线性回归模型之前,需要对最优聚类结果进行进一步优化,即将元素 少于在线损稳定台区特征数据总数〇. 1%的类删除。
[0034] 特征数据包括总用户数、居民户数、非居民户数、居民容量、非居民容量、变压器容 量、居民容量占比、居民户均容量和供电量。
[0035] 本发明所达到的有益效果:本发明采用台区线损的实际采样数据,利用数据挖掘 手段针对海量数据进行处理,目的是发现台区特征数据与台区线损间的潜在关联,与传统 的理论线损计算方法相比,数据来源可靠,更能反映现场实际线损状况;算法流程简单实 用,效率较高;多元线性回归模型结构简洁,能够直观反映各特征参数对台区线损的影响程 度,易于分析线损不合理的台区状况;易于软件实现,可以较为方便的融入线损管理系统。
【附图说明】
[0036] 图1为本发明的流程图。
[0037] 图2为当聚类数为3时聚类大小。
[0038] 图3为回归模型1的实际与预测线损率分布直方图。
[0039] 图4为回归模型2的实际与预测线损率分布直方图。
[0040] 图5为回归模型3的实际与预测线损率分布直方图。
[0041] 图6为回归模型1的实际与预测线损率分布散点图。
[0042] 图7为回归模型2的实际与预测线损率分布散点图。
[0043] 图8为回归模型3的实际与预测线损率分布散点图。
【具体实施方式】
[0044] 下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明 的技术方案,而不能以此来限制本发明的保护范围。
[0045] 如图1所示,一种基于数据挖掘技术的台区合理线损预测方法,包括以下步骤:
[0046] 步骤一,提取台区线损的特征数据?
[0047] 从电力系统用户数据采集系统中提取台区当月与线损率相关的特征数据,包括总 用户数、居民户数、非居民户数、居民容量、非居民容量、变压器容量、居民容量占比、居民户 均容量和供电量。
[0048] 其中,居民容量占比=非居民容量八非居民容量+居民容量);
[0049] 居民户均容量=居民容量/居民户数。
[0050] 步骤二,对特征数据进行筛选和清洗,获得线损稳定台区特征数据。
[0051] 在采用统计和聚类方法分析线损时,为了减少非主要因素的干扰,降低分析台区 线损影响因子和影响系数的难度,建立了线损稳定台区的概念,线损稳定台区指用电信息 采集系统在线计算的台区日和月线损率数值稳定,能真实反应当前实际线损情况的台区; 为保证数据的稳定可靠,对提取的特征数据进行筛查,去除的线损非稳定台的特征数据,获 得线损稳定台区特征数据。
[0052] 线损非稳定台区包括:
[0053] 1)采集未全覆盖:所有在用计量点均已采集,无未采集供、用电表计;
[0054] 2)台区下有特殊用户,如光伏发电、无表计量等;
[0055] 3)当月发生业务变更,如考核单元对象数量发生增减、户变关系调整、用户增减、 用户业务变更(换表除外);
[0056] 4)月线损值超出(_1 %~10% )的范围;
[0057] 5)月内日线损超出(-1 %~10% )范围的天数多于10天。
[0058] 步骤三,设定聚类数K=n,n为正整数,设定聚类计算迭代终止阈值。
[0059] 步骤四,进行聚类计算,获得聚类数为K时的聚类结果。
[0060] 进行聚类计算的过程为,
[0061] Al),在线损稳定台区特征数据中任选K个作为聚类中心,剩余的在线损稳定台区 特征数据作为样本数据;
[0062] A2),计算每个样本数据到每个聚类中心的欧氏距离(欧氏距离为一个已知的公 式,不具体写出了),并将其归类于最近的聚类中心;
[0063] A3)重新计算每个新类的平均值,并将该值作为新的聚类中心;
[0064] A4)重复步骤A2和A3,反复迭代,直到满足终止条件,即目标函数达到迭代终止阈 值。
[0065] 上述目标函数采用平方误差准则,
[0067] 其中,E表示所有类对象的平方误差,Xq为第j个类C,中的元素,m,是第j个类C,
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1