基于聚类和卷积神经网络的台区线损预测方法

文档序号:26593113发布日期:2021-09-10 21:35阅读:202来源:国知局
基于聚类和卷积神经网络的台区线损预测方法

1.本发明涉及电力系统的线损预测技术领域,特别是一种基于聚类和卷积神经网络的台区线损预测方法。


背景技术:

2.线损一直是电力企业的一项重要考核指标,线损异常分析与线损准确预测对于制定电网发展规划的制定、降损措施的实施具有指导意义。开展线损预测研究工作有利于规范抄核收行为,开展反窃电工作;提升企业管理水平,提高经济效益;规化电网,建设节约型社会。
3.但由于配电网网架结构庞大,线路分支较多,元件复杂繁多,传统的线损计算统计方法工程量大且效率低,而且在进行传统潮流计算时还会出现数据缺失或错误的情况,致使线损计算结果不准确。随着智能电网的建设和发展,电力数据逐渐呈现大容量、多样性与高维数的特点,将线损预测研究与大数据技术结合可以很好的弥补传统方法的不足。
4.在线损预测方面,已经有很多学者尝试应用大数据技术,基于传统神经网络、循环神经网络、模糊识别算法等方法均在不断地完善。但浅层学习方法对高维数据处理能力有限,拟合能力很差,难以有效地解决复杂的非线性回归问题,泛化能力有限。此外,传统线损预测方法在实际应用中存在的计算量大、效率低的问题。


技术实现要素:

5.本发明的目的在于提供一种准确度高、可以处理海量数据的基于聚类和卷积神经网络的台区线损预测方法。
6.实现本发明目的的技术解决方案为:一种基于聚类和卷积神经网络的台区线损预测方法,步骤如下:
7.步骤1,采用psasp软件搭建电网模型,采集台区线损数据;
8.步骤2,采用k

means聚类算法

lof局部离群因子检测法的组合模型对线损异常数据进行判定和剔除;
9.步骤3,采用粒子群算法对卷积神经网络进行优化,得到pso

cnn神经网络,利用pso

cnn神经网络对台区线损进行预测分析。
10.本发明与现有技术相比,其显著优点为:(1)采用了k

means

lof算法对异常线损数据进行判定和剔除,排除了异常数据对模型训练的影响,大大提高了神经网络模型拟合的精度;(2)采用经pso算法对卷积神经网络进行优化,有效地解决了cnn神经网络训练时,在误差反向传播调整连接权值的过程中,会出现梯度下降甚至停滞,影响网络的收敛速度的问题;(3)采用pso

cnn神经网络对台区线损进行预测分析,可以弥补在电网企业运营过程中,面对海量数据集时,传统的线损预测方法工程量大、效率低,且数据缺失或错误造成计算结果不准确的缺陷。
附图说明
11.图1是本发明基于聚类和卷积神经网络的台区线损预测方法的流程图。
12.图2是本发明基于psasp搭建的数据采集仿真模型示意图。
13.图3是k

means聚类结果图。
14.图4是cnn神经网络测试集样本真实值与预测值对比结果图。
15.图5是cnn神经网络测试集样本误差百分比图。
16.图6是cnn神经网络测试集样本散点拟合图。
17.图7是pso

cnn神经网络测试集样本真实值与预测值对比结果图。
18.图8是pso

cnn神经网络测试集样本误差百分比图。
19.图9是pso

cnn神经网络测试集样本散点拟合图。
具体实施方式
20.近年来,深度学习算法由于其自身超强的特征学习能力开始受到人们的关注。深度学习算法通过建立多层次的智能学习模型和海量的数据训练,可以有效地提取数据的本质特征,分析大数据潜在价值的过程,从而解决复杂抽象的问题。以深度学习为首的机器学习方法的发展为电力系统线损预测提供了一种新的解决思路。
21.本发明涉及一种基于聚类和卷积神经网络的台区线损预测方法,为了解决传统线损预测方法在实际应用中存在的计算量大、效率低的问题,将卷积神经网络引入台区线损预测应用中,并结合聚类算法提高预测准确度。
22.本发明基于聚类和卷积神经网络的台区线损预测方法,利用psasp系统搭建农村电网模型进行数据仿真,采集台区配电变压器容量,有功、无功供电量,24h最大有功、无功,线路长度,供电半径及线损率数据;采用k

means聚类算法

lof局部离群因子检测法的组合模型对可能存在的线损异常数据进行挖掘,先通过k

means聚类算法将分散的数据聚成k类,利用轮廓稀疏确定最佳k值,再分别计算每类的数据离群因子,将离群因子过大的数据判定为异常数据并剔除;利用粒子群(pso)算法对卷积神经网络(cnn)进行优化,即在误差反向传播过程中,将经粒子群算法得到的最优解作为权值和阈值输入卷积神经网络中,解决误差梯度下降的问题;采用pso

cnn神经网络对台区线损进行预测分析。具体包含以下步骤:
23.步骤1,采用psasp软件搭建电网模型,采集台区线损数据;
24.步骤2,采用k

means聚类算法

lof局部离群因子检测法的组合模型对线损异常数据进行判定和剔除;
25.步骤3,采用粒子群算法对卷积神经网络进行优化,得到pso

cnn神经网络,利用pso

cnn神经网络对台区线损进行预测分析。
26.进一步地,步骤1中采用psasp软件搭建电网模型,采集台区线损数据,具体如下:采用psasp搭建了一个简化的低压农村配电网,10kv母线下共设置10台10/0.4kv变压器,即10个台区,其中有3个台区下引出2条主要线路接居民用电负荷,4个台区下引出3条主要线路接居民用电负荷,3个台区下引出4条主要线路接居民用电负荷,通过设置不同的参数模拟10个台区运行规律,以采集多组数据。
27.进一步地,步骤2所述采用k

means聚类算法

lof局部离群因子检测法的组合模型
对线损异常数据进行判定和剔除,具体如下:
28.所述的k

means聚类算法

lof局部离群因子检测法的组合模型,该模型主要先通过k

means聚类算法将离散的数据聚成相似度较高的k类,以轮廓系数的大小判定最佳k值。数据聚成k类后,再分别对每类内数据计算离群因子(lof)大小,将离群因子过大的数据判定为异常数据并做剔除处理。具体流程为:
29.(1.1)将psasp仿真得到的数据集随机选取k个点作为初始的聚类中心;
30.(1.2)根据式(1)分别计算每一个点到各个聚类中心点的欧式距离,将样本集中点分配到距离最小的类中;
[0031][0032]
式中,euclid表示欧式距离,x
i
是样本x的第i个变量值,y
i
是类质心y的第i个变量值;
[0033]
(1.3)所有的样本数据分配完成后,假设数据集聚为k类,k个聚类中心点(即均值代表点)分别为m1,m2,...,m
k
,则根据式(2)计算该类的误差平方和,判断是否收敛。
[0034][0035]
其中,e是数据集中所有对象的平方误差和,x代表样本空间的一个点,表示给定对象;m
i
是类c
i
的均值;
[0036]
(1.4)更新聚类中心,重复步骤(1.2)~(1.3)直至收敛,输出聚类结果;
[0037]
(1.5)采用轮廓系数s来判断聚类效果,s值越大,表明聚类效果越好;设聚类中第i个元素的轮廓系数为s(i),用所有元素的轮廓系数的平均值来表示该聚类的轮廓系数s,其中一个元素的轮廓系数s(i)计算如式(3):
[0038][0039]
式中,a(i)表示第i个元素与自身同一类内其他所有元素的平均距离;b(i)表示第i个元素与自身所有不同类内所有点的最小平均距离;
[0040]
(1.6)采用局部离群因子检测法判断元素的离群程度,筛选异常数据。将对象i的k距离记作k

distance(i)。与对象i之间距离小于或等于k

distance(i)的对象集合称为对象i的第k距离域,记作:nk(i)。
[0041]
在样本空间内,若存在对象o,则reachdist(i,o)表示对象i与对象o的之间可达距离,计算式为:
[0042]
reachdist(i,o)=max{k

distance(o),||i

o||}
ꢀꢀ
(4)
[0043]
则对象i的局部可达密度lrdk(i)的计算式为式(5):
[0044][0045]
则可以根据式(6)计算数据点离群因子lofk(i),该因子描述了第i个元素的离群点程度。元素离群程度越大,lofk(i)值就越大,本发明将lofk(i)值大于2的点判定为离群点。
[0046][0047]
式中,nk(i)表示对象i的第k距离域,lrdk(o)、lrdk(i)分别表示对象o和对象i的局部可达密度。
[0048]
进一步地,步骤3所述卷积神经网络,由多组卷积层和下采样层即池化层组成,尾部连接一个或多个全连接层;卷积层和池化层通过卷积核将每一层的输出结果,作为下一层的输入,利用每一层神经元之间的关系,对数据特征进行分层提取,训练过程如下:
[0049]
(2.1)首先对参数进行初始化,对权重和偏置项进行设定;
[0050]
(2.2)前馈运算,识别所有的训练样本,将样本输入卷积神经网络模型,并进行卷积处理,然后依次进入各操作层,通过正向向前传播得到输出值;
[0051]
(2.3)比较卷积神经网络模型输出值和真值,计算误差;
[0052]
(2.4)判断误差是否在设定范围内,若超出设定范围,将输出值返回卷积神经网络并反向传播;该过程依次求得误差对全连接层、池化层和卷积层的梯度,若求得的误差小于定义的期望值则停止训练;
[0053]
(2.5)对权值和偏置参数进行更新,重复步骤(2.2)~步骤(2.4),直到精确度满足要求,或达到预先设定的迭代次数上限。
[0054]
进一步地,步骤3所述采用粒子群算法对卷积神经网络进行优化,即在误差反向传播过程中,将经粒子群算法得到的最优解作为权值和阈值输入卷积神经网络中,具体流程为:
[0055]
(3.1)在卷积神经网络即cnn网络经过一次前向传播过程后,由式(7)计算输出值与期望值之间的误差,将误差值作为粒子群算法的输入,每一个误差参数都将作为pso中的一个粒子,则网络中训练参数个数即为粒子长度:
[0056][0057]
式中,e为输出值与期望值之间的误差;y
p
(t)为第p个样本t时刻网络输出期望值,即实际线损值;y
p
(t)为第p个样本t时刻网络输出值,即模型预测的结果;
[0058]
(3.2)由式(8)计算pso算法的适应度fit,求出全局最优和个体最优解。
[0059][0060]
式中,d
t
和为粒子群算法的第t个实际输出和目标输出;n为训练样本数。
[0061]
(3.3)再通过式(9)、(10)更新粒子的位置和速度,得到的新粒子即为更新后的cnn网络权值和阈值。
[0062][0063][0064]
式中,和分别表示第i个粒子在第k次迭代中第d维上的速度和位置;ω表示惯性系数;c1、c2表示加速常数;r
l
、r2表示0~1之间的随机数;p
id
表示第i个粒子历史最优位置中第d维上的位置;p
gd
表示群体历史最优位置中第d维上的位置。
[0065]
(3.4)对cnn网络重新进行前向传播过程,重复(3.1)~(3.3)步,直至误差收敛至最小值。
[0066]
在经过粒子化以后,每一个网络的阈值与权值的粒子都与一个神经网络唯一地对应,如果粒子的位置更新,那么对应的神经网络的阈值与权值也随着更新。
[0067]
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0068]
实施例
[0069]
本发明流程如图1所示,本实例操作步骤如下:
[0070]
步骤1,利用psasp系统搭建农村电网模型进行数据仿真,模型结构图如图2所示。分别设置变压器容量为800kva台区1个、400kva台区3个、250kva台区3个、200kva台区3个;根据农村电网的实际情况,设置线路长度在0.15~0.3km之间;导线型号为lgj

90、lgj

120、lgj

240;负荷设置根据农网24小时负荷变化规律,设置低压配电网台区的负载率如表1所示。搭建好模型后,通过psasp采集10个台区,60天共采集600组数据,每组数据包括配变变压器容量、总有功供电量、总无功供电量、24h内最大有功、24h内最大无功、线路总长度、供电半径、导线截面积、台区有功线损值共9个变量。
[0071]
表1负载率设置
[0072][0073]
步骤2,采用k

means聚类算法

lof局部离群因子检测法的组合模型对线损异常数据进行判定和剔除;首先对采集的数据进行用k

means聚类分析,k值分别取2~7,根据轮阔系数判定最佳聚类个数,不同聚类个数的轮廓系数如表2所示。
[0074]
表2聚类个数与轮廓系数统计表
[0075][0076]
当聚类个数为2时,轮廓系数最大,为0.9089,此时聚类效果最佳。因此选取聚类个数k=2,对数据集进行聚类分析。如表3所示,600组数据聚成两类时,类别1共包含207组数据,占全体数据的34.5%,类别2共包含393组数据,占全体数据的65.5%。聚类结果如图3所示。
[0077]
表3各类别数据个数统计表
[0078][0079]
本发明将离群因子lof大于2的数据判定为数据异常点。分别对类别1和类别2进行lof离群因子计算,发现共有12个数据的离群因子大于2。其中,类别1中共有4个数据离群因子大于2,类别2中共有8个数据离群因子大于2。将这12个数据判定为异常数据,做剔除处理。离群因子检测法的计算结果如表4所示。
[0080]
表4异常数据离群因子统计
[0081][0082]
步骤3,分别采用cnn神经网络和经粒子群算法优化后的pso

cnn神经网络对剔除异常数据后的数据集进行线损预测,对比分析优化效果。本发明选取台区总有功供电量、台区总无功供电量、24h最大有功、24h最大无功、低压台区线路总长度、供电半径、导线截面积、变压器容量8个变量作为卷积神经网络模型的输入变量,以配电网线损值为输出变量。对经k

means

lof算法判定为异常的12个数据剔除后剩余的588组数据进行仿真,其中488组作为训练样本集,100组作为测试样本集。根据样本的大小设置合适的卷积神经网络参数,本发明共设置两个卷积层,卷积核的尺寸为1
×
3,每个卷积层的卷积核数目分别为6和12,采用relu函数作为激活函数。
[0083]
首先采用单独的卷积神经网络(cnn)进行模型训练。cnn网络共迭代了6250次达到预设精度值,共用时为2分2秒。测试集的均方误差为0.0234,均方根误差为0.1529。其测试集预测结果真实值和预测值对比结果如图4。测试集数据的误差百分比多数小于10%,拟合的线性回归方程为y=0.9214x+0.2231,相关系数r为0.9343,r方为0.8701。样本误差百分比如图5,散点拟合图如图6所示。
[0084]
再采用经粒子群优化后的pso

cnn神经网络对线损样本集进行模型训练。经pso优化后的pso

cnn网络在迭代了3750次后收敛,用时为1分18秒。测试集的均方误差为0.0109,均方根误差为0.1045。其测试集预测结果真实值和预测值对比结果如图7。测试集数据的误差百分比多数小于8%,拟合的线性回归方程为y=0.9689x+0.0385,相关系数r为0.9886,r方为0.9754。样本误差百分比如图8,散点拟合图如图9所示。
[0085]
表5为cnn网络和pso

cnn网络的训练结果的对比分析,可以明确看出,无论是在迭代次数、收敛时间上,还是从误差,散点拟合程度上来看,经过粒子群算法优化后的卷积神经网络都优于单纯的卷积神经网络。
[0086]
表5 cnn与pso

cnn对比分析
[0087][0088]
综上所述,本发明在线损预测速度和准确率方面与传统方法相比均有显著的提升,有较高的实际应用价值。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1