一种面向电力系统重过载预警的大数据分析方法

文档序号:9646875阅读:628来源:国知局
一种面向电力系统重过载预警的大数据分析方法
【技术领域】
[0001] 本发明涉及电力负荷预测技术领域,具体涉及一种面向电力系统重过载预警的大 数据分析方法。
【背景技术】
[0002] 电力负荷有两方面的含义:一方面是指电力工业的服务对象,包括使用电力的部 门、机关、企事业单位、工厂、农村、车间、学校以及各种各样的用电设备;另一方面是指上述 各用电单位、用电部门或用电设备使用电力和电量的具体数量。电力负荷预测中的负荷概 念是指国民经济整体或部门或地区对电力和电量消费的历史情况及未来的变化发展趋势。 [0003]负荷预测是根据系统的运行特性、增容决策、自然条件与社会影响等诸多因数,在 满足一定精度要求的条件下,确定未来某特定时刻的负荷数据,其中负荷是指电力需求量 (功率)或用电量;负荷预测是电力系统经济调度中的一项重要内容。
[0004] 目前,对负荷特性的现状、影响负荷特性的主要因素和未来负荷特性的变化趋势 等都进行了系统的分析和研究,得出了一些对电力规划和电网运行有指导意义和参考价值 的结论,但缺乏对影响负荷的相关因素分析。限于过去的条件,在绝大多数系统中没有考虑 气象、温度等因素对负荷的影响,预测精度不高。

【发明内容】

[0005] 针对现有技术的不足,本发明提供一种面向电力系统重过载预警的大数据分析方 法,利用区域内所有变压器的历史负载数据,本地区的天气数据及其他外部数据,对特定时 期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配 电网检测、检修等人力和物质资源,以提高系统运行的安全稳定性,并减少电网工作人员的 劳动强度。
[0006] 本发明的目的是采用下述技术方案实现的:
[0007] -种面向电力系统重过载预警的大数据分析方法,其改进之处在于,包括:
[0008] (1)对历史电力负荷数据进行预处理;
[0009] (2)对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性 关联性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据 集D,;
[0010] (3)利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据 类;
[0011] (4)根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过 载概率。
[0012] 优选的,所述步骤(1)包括:
[0013] (1-1)对所述历史电力负荷数据进行匿名化处理;
[0014] (1-2)采用K近邻填补算法对数值型数据缺失值进行填补;
[0015] (1-3)对所述历史电力负荷数据对应的天气数据进行处理;
[0016] (1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力 负荷数据分为正常、重载和过载三类。
[0017] 进一步的,所述步骤(1-1)中,采用混合K-匿名对所述历史电力负荷数据进行匿 名化处理,包括:
[0018] 令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,以客户作 为顶点,客户地址作为顶点属性,建立复合超图,其中,顶点包含 所述客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为min{m,|S|} 的子集;
[0019] 将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大 于或等于k;
[0020] 将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性 相同。
[0021] 进一步的,所述步骤(1-2)中,将所述历史电力负荷数据的数据表中的空缺位置 进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众数或平均值。
[0022] 进一步的,所述步骤(1-3)中,将每天t时间段内所述历史电力负荷数据对应的天 气温度求平均值作为温度基准值,采用温度基准值+温度变化率作为所述历史电力负荷数 据的属性。
[0023] 进一步的,所述步骤(1-4)中,确定所述历史电力负荷数据第i时的负荷值Pi,公 式为:
[0025]式⑴中,ie[1,24],Pi'为所述历史电力负荷数据第i时的视在功率值,P为 变压器容量;
[0026]若max{PJe(〇, 80],则所述历史电力负荷数据为正常运行数据;
[0027] 若max{PJe(80, 100],则所述历史电力负荷数据为重载数据;
[0028] 若max{PJe[100,+①),则所述历史电力负荷数据为过载数据。
[0029] 优选的,所述步骤(2)中,输入所述预处理后的历史电力负荷数据D作为事务集, A和B分别为两个互斥的项集,其中,A为所述历史电力负荷数据中除负荷属性数据外的属 性集合,B为所述历史电力负荷数据中负荷属性,设定支持度最小阈值min_supp,设定置信 度最小阈值min_conf,确定项集A与项集B的支持度support(A二B),公式为:
[0031] 式(2)中,P(AUB)为事务集D中既包含项集A又包含项集B的实例所占的百分 比;
[0032]确定项集A与项集B的置信度confidcncc(A,公式为:
[0034]式(3)中,P(B|A)为事务集D中包含项集A也包含项集B的实例所占的百分比;
[0036] 确定项集A与项集B的提升度///h:.4 =>Z?),公式为:
[0038] 式(4)中,P⑶为事务集D中包含项集B的实例所占的百分比;
[0039] 根据/興』竭对所述历史电力负荷数据中挖掘到的规则进行排序,设定阈值e, 提取/说(Jk的规则包含的属性数据和负荷属性数据建立所述数据集D'。
[0040] 优选的,所述步骤(3)中,调用DBSCAN算法,输入所述数据集D',具体包括:
[0041] (3-1)设置扫描半径d和最小包含点数min_pts,选择任意核心点,其中,核心点为 满足扫描半径d内指定数据样本数大于min_pts的对象;
[0042] (3-2)获取从所述核心点出发的所有密度相连的负荷样本;
[0043] (3-3)遍历所述核心点在扫描半径d内的全部核心点样本,并获取所述全部核心 点样本密度相连的负荷样本,形成聚类。
[0044] 优选的,所述步骤(4)中,调用随机森林算法,输入所述数据集D'构造电力负荷 预测模型,其中,以所述数据集D'为根节点构造分类决策树,叶子节点为模型决策的类别, 所述分类决策树中的分支选择根据下述公式:
[0045]GINI(s,t) =pLGINI(tL) +pRGINI(tR) (5)
[0046] 式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,队为节点t以S 为切分点生成的左子树中的样例占当前节点样例的比例,PR为节点t以s为切分点生成的 右子树中的样例占当前节点样例的比例,GINI(tj为节点t以s为切分点生成的左子树的 基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数 GINI(t)的公式为:
[0048] 式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示 正常运行/重载/过载;
[0049] 选择使GINI(s,t)值最小的t和s对当前节点进行分裂,生成所述分类决策树。
[0050] 与最接近的现有技术相比,本发明具有的有益效果:
[0051] 本发明提供的一种面向电力系统重过载预警的大数据分析方法,采用匿名化方 法,在保证数据安全性的同时最大限度保障数据的可用性,数据质量控制方法采用混合质 量评价模型,使数据质量具有高度可信性、可用性。
[0052] 本发明提供的一种面向电力系统重过载预警的大数据分析方法,,采用频繁项集 找不小于最小支持度和最小置信度的强关联规则,提取挖掘到的属性作为对负荷影响较大 的属性,解决电力大数据候选属性过多的问题,最大程度提高算法效率。
[0053] 本发明提供的一种面向电力系统重过载预警的大数据分析方法,采用随机森林方 法用于建模,对大数据有良好的可扩展性,能够解决大数据的快速处理问题,又防止电力系 统中正样本较少时过拟合发生,针对大数据环境下的电力负荷预测有较好的应用前景。
【附图说明】
[0054]图1是本发明提供的一种面向电力系统重过载预警的大数据分析方法流程图;
[0055] 图2是本发明实施例中用户与受电点的二分图;
[0056] 图3是本发明实施例中用户与受电点的复合超图;
[0057]图4是本发明实施例中合并超边后用户与受电点的复合超图。
【具体实施方式】
[0058] 下面结合附图对本发明的【具体实施方式】作进一步的详细说明。
[0059] 为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1