一种面向电力系统重过载预警的大数据分析方法_3

文档序号:9646875阅读:来源:国知局
据结合时间人口等外部因素较为 准确的预测出某时某地某台变压器的重、过载概率。短期来看,管理者可以根据预测的结果 及时做出相关调整,保障社会生产的安全稳定。长期来看,预测结果可以为配网改造提供决 策意见,对重过载频繁地区进行适当增容和维护,对其他地区进行线路改造来达到电力资 源分配的合理性。运用基于决策树的随机森林方法来构造分类模型,其中决策树从一组无 规则的事例推理得出树状的分类规则,树的根结点是整个数据集合空间,采用自顶向下的 递归方式,在每个内部节点上对属性测试,并根据不同属性判断从该节点向下分为2支或 者多支,最后在每个叶节点得到结论。从决策树的根结点到叶节点的1条路径就是1条分 类规则,整棵树对应着1组表达式规则。常用的经典决策树算法包括ID3,C4. 5和CART。
[0112] 具体的,调用随机森林算法,输入所述数据集D'构造电力负荷预测模型,其中,以 所述数据集D'为根节点构造分类决策树,叶子节点为模型决策的类别,所述分类决策树中 的分支选择根据下述公式:
[0113] GINI(s,t) =pLGINI(tL) +pRGINI(tR) (5)
[0114] 式(5)中,t为当前节点分支的属性,s为当前节点分支的属性值,队为节点t以S 为切分点生成的左子树中的样例占当前节点样例的比例,PR为节点t以s为切分点生成的 右子树中的样例占当前节点样例的比例,GINI(tj为节点t以s为切分点生成的左子树的 基尼指数,GINI(tR)为节点t以s为切分点生成的右子树的基尼指数,其中,所述基尼指数 GINI(t)的公式为:
[0116] 式(6)中,p(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示 正常运行/重载/过载;
[0117] 选择使GINI(s,t)值最小的t和s对当前节点进行分裂,生成所述分类决策树。
[0118] 最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽 管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然 可以对本发明的【具体实施方式】进行修改或者等同替换,而未脱离本发明精神和范围的任何 修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。
【主权项】
1. 一种面向电力系统重过载预警的大数据分析方法,其特征在于,包括步骤: (1) 对历史电力负荷数据进行预处理; (2) 对预处理后的所述历史电力负荷数据D进行关联规则挖掘,提取与负荷属性关联 性强的属性集合,建立包含所述负荷属性数据和与负荷属性关联性强的属性集合数据集 ; (3) 利用聚类方法将所述数据集D分为正常运行数据类、重载数据类和过载数据类; (4) 根据所述数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概 率。2. 如权利要求1所述的方法,其特征在于,所述步骤(1)包括: (1-1)对所述历史电力负荷数据进行匿名化处理; (1-2)采用K近邻填补算法对数值型数据缺失值进行填补; (1-3)对所述历史电力负荷数据对应的天气数据进行处理; (1-4)获取所述历史电力负荷数据的负荷值,并根据所述负荷值将所述历史电力负荷 数据分为正常、重载和过载Ξ类。3. 如权利要求2所述的方法,其特征在于,所述步骤(1-1)中,采用混合K-匿名对所述 历史电力负荷数据进行匿名化处理,包括: 令攻击者的背景知识包括:目标客户地址及目标客户至多m个受电点,W客户作为顶 点,客户地址作为顶点属性,建立复合超图,其中,顶点包含条超边,S为所述 客户的受电点集合,超边的标签为所述客户的受电点集合S的全部大小为minim, |S|}的子 集; 将所述复合超图中秩小于k的超边进行合并,直至所述复合超图中超边的秩均大于或 等于k; 将所述复合超图中顶点属性进行泛化,直至所述复合超图每个连通量中顶点属性相 同。4. 如权利要求2所述的方法,其特征在于,所述步骤(1-2)中,将所述历史电力负荷数 据的数据表中的空缺位置进行数据填充,填充内容为所述空缺位置列临近的k个邻居的众 数或平均值。5. 如权利要求2所述的方法,其特征在于,所述步骤(1-3)中,将每天t时间段内所述 历史电力负荷数据对应的天气溫度求平均值作为溫度基准值,采用溫度基准值+溫度变化 率作为所述历史电力负荷数据的属性。6. 如权利要求2所述的方法,其特征在于,所述步骤(1-4)中,确定所述历史电力负荷 数据第i时的负荷值Pi,公式为:α) 式(1)中,ie[1,24],Ρ' 1为所述历史电力负荷数据第i时的视在功率值,Ρ为变压 器容量; 若max{Pile(〇,80],则所述历史电力负荷数据为正常运行数据; 若111曰^巧1}£(80,100],则所述历史电力负荷数据为重载数据; 若max{PJe[100,+cx〇,则所述历史电力负荷数据为过载数据。7. 如权利要求1所述的方法,其特征在于,所述步骤(2)中,输入所述预处理后的历 史电力负荷数据D作为事务集,A和B分别为两个互斥的项集,其中,A为所述历史电力负 荷数据中除负荷属性数据外的属性集合,B为所述历史电力负荷数据中负荷属性,设定支 持度最小阔值min_supp,设定置信度最小阔值min_conf,确定项集A与项集B的支持度 S叩port(_A与>B) '公式为; S叩porUA=>B) =P(AUB) ?) 式(2)中,Ρ(ΑUΒ)为事务集D中既包含项集A又包含项集Β的实例所占的百分比; 确定项集A与项集Β的置信度confkicnce(A=:>Β),公式为: coni'idcncc(A二B)二巧公|'4) ( 式(3)中,P度|A)为事务集D中包含项集A也包含项集B的实例所占的百分比; 获取S叩port(A二B) >min__.s叩PIU〇nikkiic;e(A二巧 > 棋狂_卵斑的属性数据; 确定项集A与项集B的提升巧Ζ/々(/?^公;,公式为:C4) 式(4)中,Ρ做为事务集D中包含项集Β的实例所占的百分比; 根据/7巧.4 ^的对所述历史电力负荷数据中挖掘到的规则进行排序,设定阔值e,提取 /诉Μ^近):>e的规则包含的属性数据和负荷属性数据建立所述数据集D'。8. 如权利要求1所述的方法,其特征在于,所述步骤(3)中,调用DBSCAN算法,输入所 述数据集D',具体包括: (3-1)设置扫描半径d和最小包含点数min_pts,选择任意核屯、点,其中,核屯、点为满足 扫描半径d内指定数据样本数大于min_pts的对象; (3-2)获取从所述核屯、点出发的所有密度相连的负荷样本; (3-3)遍历所述核屯、点在扫描半径d内的全部核屯、点样本,并获取所述全部核屯、点样 本密度相连的负荷样本,形成聚类。9. 如权利要求1所述的方法,其特征在于,所述步骤(4)中,调用随机森林算法,输入所 述数据集D'构造电力负荷预测模型,其中,W所述数据集D'为根节点构造分类决策树, 叶子节点为模型决策的类别,所述分类决策树中的分支选择根据下述公式: GINI(S,t)=PlGINI(tL) +PrGINI(tR) (5) 式巧)中,t为当前节点分支的属性,s为当前节点分支的属性值,p,为节点tWs为 切分点生成的左子树中的样例占当前节点样例的比例,Ρκ为节点tWs为切分点生成的 右子树中的样例占当前节点样例的比例,GINI(t,)为节点tWS为切分点生成的左子树的 基尼指数,GINI(tK)为节点tWS为切分点生成的右子树的基尼指数,其中,所述基尼指数 GINI(t)的公式为:(的: 式化)中,P(j/t)为目标类别j在节点t出现的比例,j取值为0/1/2,分别表示正常 运行/重载/过载; 选择使GINI(S,t)值最小的t和S对当前节点进行分裂,生成所述分类决策树。
【专利摘要】本发明涉及一种面向电力系统重过载预警的大数据分析方法,包括:对历史电力负荷数据进行预处理;提取预处理后的历史电力负荷数据D中与负荷属性关联性强的属性集合,建立包含负荷属性数据和与负荷属性关联性强的属性集合数据集D′;利用聚类方法将数据集D分为正常运行数据类、重载数据类和过载数据类;根据数据集D构建电力负荷数据预测模型,预测变压器的重载概率和过载概率;本发明提供的方法利用历史负载数据,天气数据及其他外部数据,对特定时期区域下属各台区在特定时间段的负荷重过载概率进行预测,从而优化配置在此时期的配电网检测、检修等人力和物质资源,以提高系统运行的安全稳定性,并减少电网工作人员的劳动强度。
【IPC分类】G06Q50/06, G06Q10/04
【公开号】CN105404944
【申请号】CN201510920842
【发明人】王继业, 朱朝阳, 张东霞, 邓春宇, 王晓蓉, 贾育培, 李浥东, 季知祥, 张磊, 张涛, 贺简章, 王海波, 李慧芳
【申请人】中国电力科学研究院, 国家电网公司, 北京交通大学, 国网山东省电力公司电力科学研究院
【公开日】2016年3月16日
【申请日】2015年12月11日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1