一种基于GAN的风机轮毂测风缺失数据的插补方法与流程

文档序号:16680408发布日期:2019-01-19 00:22阅读:318来源:国知局
一种基于GAN的风机轮毂测风缺失数据的插补方法与流程
本发明涉及风机故障诊断
技术领域
,尤其涉及一种基于gan的风机轮毂测风缺失数据的插补方法。
背景技术
:随着全球风力发电能力持续增长和风电场的快速扩张、风机的不断应用,机组机舱体积随之增大,轮毂位置也更高,风机安全运行的挑战越来越大。风机不同部位故障皆有可能引起风机停电,即使是一些微小的故障的维修,都会带来昂贵的成本,风机的维护面临着众多挑战。研究表明,对风机进行预防性维护,可以大大降低风机故障后维修的成本。可靠的风机轮毂测风数据在风电功率预测、风电场安全运行评估、风电数值预报等方向应用广泛,有利于风机的安全运行维护,也是确定风电场荷载、有效利用风能的基础;但其数据的缺测、偏离等常困扰和影响着应用的可靠性和效果。因此,对风电场的风机轮毂测风数据的缺失部分进行补偿,其重要性不言而喻。对风电场测风数据的缺失情况,有多种插补方法,包括最小二乘法、卡尔曼滤波插补法、bp神经网络法、arima插补方法等。以任意一台风机为例,设计插补方案,经过使用多种方法研究对比,最小二乘法插补效果不佳,卡尔曼滤波插补在时间序列上插补局限性较大;bp神经网络法插补仅适用于平稳天气条件下的插补,对天气变化把握较差;arima插补方法是一种自适应、高效的风速插补方法,但是不能够进行较长时间的风速插补。技术实现要素:本发明要解决的技术问题是针对上述现有技术的不足,提供一种基于gan的风机轮毂测风缺失数据的插补方法,对风机场的数据进行了相关性分析,使得具有高相关性的数据能够聚集得更近,使得图片变得更为平滑,提高了模型训练的收敛速度,与此同时,该方法能够进行较长时间的数据插补。为解决上述技术问题,本发明所采取的技术方案是:一种基于gan的风机轮毂测风缺失数据的插补方法,具体步骤如下:步骤1:从风场scada系统获取包含风机属性的风机数据,并从该数据中提取每个风机的风速数据,构成初始风速数据集;步骤2:删除初始风速数据集中的异常数据,将风速数据按照风机编号构成风速数据集d;所述异常数据包括:风速错误记录为非数值格式的数据、长时间都恒定不变的风速数据;步骤3:进行不同风机之间的风速数据相关性分析,得出相关系数矩阵c;步骤4:采用蚁群算法对不同风机的风速数据进行排序,得到排序后的风速数据样本d;步骤5:根据风速数据样本构建生成对抗网络训练时所需的训练样本;步骤6:构建生成对抗网络的生成器模型mg及对抗器模型md;步骤7:将训练样本输入到生成器模型及对抗器模型中,进行迭代训练,完成数据的插补工作。所述步骤3具体步骤如下:步骤3.1:计算风场不同的风机风速样本之间的pcc系数,建立pcc相关系数向量;步骤3.2:计算风场不同的风机风速样本之间的mic系数,建立mic相关系数向量;步骤3.3:将pcc相关系数向量设置为变量a,将mic相关系数设置为变量b,构成相关系数矩阵p(a,b);步骤3.4:对相关系数矩阵p(a,b)进行归一化处理,计算变量a及变量b的信息熵值;步骤3.5:根据计算所得的信息熵值计算变量a的及变量b的权重;步骤3.6:根据计算所得的权重得出最终的相关性系数矩阵c。所述步骤4具体步骤如下:步骤4.1:根据相关系数矩阵c,构建风机之间的连接集合u;步骤4.2:设置蚁群算法的初始化参数,蚁群蚂蚁数量h,信息素强度程度因子δ,信息素挥发因子ρ,最大迭代次数l,相关性系数矩阵c;步骤4.3:根据蚁群算法开始进行训练;随机将蚂蚁置于风机出发点,按照状态转移规则让每个蚂蚁访问每个风机点一次且仅一次,直至每只蚂蚁访问完每个风机点;;步骤4.4:计算各蚂蚁经过的路径长度l,记录当前迭代的最优解,同时对路径上的信息素浓度进行更新;骤4.5:至迭代次数完成,输出风机风速数据的的排列顺序,得出排序后的风速数据样本所述步骤5具体步骤如下:步骤5.1:生成对抗网络训练所需的真实数据样本采用步骤5.2:构建生成对抗网络的缺失风机风速数据样本dm;其中,dmn代表风机m的第n个数,rg代表第g行皆为0的矩阵,dr及rg之间进行点乘运算;运算结果dm代表第g行值全为0的矩阵,代表第g个风机风速数据是缺失的,待进行插补;步骤5.3:根据rgb值将dm及dr,转化为图片形式。所述步骤6中生成器模型mg的输入为风速缺失图像,输出为补全后的风速图像;所述对抗器的输入参数包括补全后的风速图像及真实的风速图像,其输出为当前图像信息的一个映射值。所述步骤7具体步骤如下:步骤7.1:设置生成模型mg的目标函数中,加入l1距离及l2距离;目标函数设置为:l(mg)=[log(md(dm)]+[||dr-dm||1+||dr-dm||2](2)步骤7.2:设置对抗模型md的目标函数;l(md)=[log(md(dr)]+[log(1-md(dm)](3)步骤7.3:生成器模型及对抗器模型的目标函数,均采用adamoptimizer函数进行梯度下降训练,不断更改生成网络及对抗网络模型的训练参数,获取目标函数的最优值;步骤7.4:迭代训练完成后,输出插补后的风速图像,还原成风机风速数据。采用上述技术方案所产生的有益效果在于:本发明提供的一种基于gan的风机轮毂测风缺失数据的补偿方法,本方法建立的风机风速数据插补模型,仅涉及风速的采集,模型具有通用型,可以适用于任何风场;并对风机场的数据进行了相关性分析,使得具有高相关性的数据能够聚集得更近,使得图片变得更为平滑,提高了模型训练的收敛速度;本方法能够进行较长时间的数据恢复,在生成对抗网络的目标函数的构建过程中,加入了l1距离以及l2距离,能够加快风机图片数据的训练速度,并且数据插补的精度。附图说明图1为本发明实施例提供的基于gan的风机轮毂测风数据的插补方法的流程图。具体实施方式下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。本实施例的方法如下所述:首先从风电场的scada系统中将不同风机的风速数据进行提取,获取初始的风速数据集;之后进行数据清洗,将不同风机的风速数据进行编号;然后,对不同风机的风速数据进行相关性分析,利用蚁群算法根据相关性系数大小进行风机风速数据的排序,并将排序后的数据转化为图片形式;构建风机风速图像训练样本后,将训练样本输入到生成对抗网络中进行训练,训练完成后,将缺失的风速补偿完毕。如图1所示,一种轮毂测风数据的缺失数据插补方法,包括如下步骤:步骤1:从风场scada系统获取包含风机属性的风机数据,并从该数据中提取每个风机的风速数据,构成初始风速数据集;步骤2:删除风速数据集中的异常数据,所述异常数据包括:风速错误记录为非数值格式的数据、长时间都恒定不变的风速数据;将风速数据按照风机编号,处理后风速数据集样本为d;步骤3:采用相关系数进行不同风机之间的风速数据相关性分析,得出相关系数矩阵c;具体实施时,计算过程如下:步骤3.1:计算风场不同的风机风速样本之间的pcc系数,建立pcc相关系数向量;pcc皮尔森相关系数计算公式如下:其中,x及y分别对应不同的风机风速数据样本,e(x)及e(y)分别代表风机样本x及y的数学期望,e(xy)代表样本x及y的联合数学期望;步骤3.2:计算风场不同的风机风速样本之间的mic系数,建立mic相关系数向量;mic相关系数的计算公式如下:其中,a及b代表两个不同风机的风速数据向量,n为风机数据向量的维度数,b(n)=n0.6,na为样本在水平方向上的划分因子数,nb为样本在垂直方向上的划分因子数。坐标空间划分为nx乘以ny个网格的数据空间,xi为水平方向上第i个网格号,yj为垂直方向上第j个网格号,p(xi)的值为落在第xi列的数据点的频率,p(yi)的值使落在第yi行的数据点的频率,p(xi,yj)为落在第(xi,yj)格子中的数据点的频率。步骤3.3:将pcc相关系数向量设置为变量a,将mic相关系数设置为变量b,构成相关系数矩阵p(a,b),变量a在第一列,变量b在第二列;步骤3.4:对相关系数矩阵p(a,b)进行归一化处理,计算变量a及变量b的信息熵值;3.4.1:进行归一化,归一化公式如下:其中,xij代表相关系数矩阵p(a,b)的第i行j列的元素,maxx·j,minx·j,分别表示相关系数矩阵p第j列最大值,最小值和平均值,yij代表归一化后的矩阵p(a,b)的第i行j列的值。3.4.2:计算熵值,u指标的熵值其中,l取值为变量a及变量b的维度数,fuv为系数中的u指标的对应的第v列的值,u指标分别为变量a及变量b,u指标变量a对应的v的值取1,u指标变量b对应的v的值为2;步骤3.5:根据计算所得的信息熵值计算变量a的及变量b的权重;经计算完成,wj代表j指标的权重,q代表指标个数,本实施例中取值为2,指标分别为变量a及变量b;经过计算,变量a的权重为α,变量b的权重为β。步骤3.6:根据计算所得的权重得出最终的相关性系数矩阵c。根据公式(10)计算所得的权重得出最终的相关系数k(x,y)的结果为:k(x,y)=αpcc(x,y)+βmic(x,y)(10)通过k(x,y)计算得出最终的相关系数矩阵c。步骤4:根据相关系数矩阵c,采用蚁群算法对不同风机的风速数据进行排序,得到排序后的风速数据样本步骤4.1:根据相关系数矩阵c,构建风机之间的连接集合u;风机之间的连接集合表征不同风机之间有互联关系;u={(r,s):r,s∈v},是所有风机之间的连接集合,r,s是风机集合v中的任意风机号;c={crs:r,s∈v},表征的是风机r及s之间的相关系数;步骤4.2:设置蚁群算法的初始化参数,蚁群蚂蚁数量h,信息素强度程度因子δ,信息素挥发因子ρ,最大迭代次数l,相关性系数矩阵c;步骤4.3:根据蚁群算法开始进行训练;随机将蚂蚁置于风机出发点,按照状态转移规则让每个蚂蚁访问每个风机点一次且仅一次,直至每只蚂蚁访问完每个风机点,并回到初始点,状态转移规则公式如下:其中τij是风机点i和风机点j之间在时刻t的信息素强度,ηij=1/dij,为启发式函数,dij是风机i和风机j之间的相关性系数,s是蚂蚁k待访问的风机点s,allowedk是蚂蚁k待访问的风机点集合,δ为信息素强度因子,ε为启发式函数的重要程度因子,值越大,表征蚂蚁会以更大的概率访问距离短的城市;步骤4.4:计算各蚂蚁经过的路径长度l,记录当前迭代的最优解,同时对路径上的信息素浓度进行更新;信息素根据以下公式进行更新:τij(t+1)=(1-ρ)τij(t)+δτij(12)其中q是一个常数,lk是蚂蚁k走过的旅行风机点回路的总长度,是蚂蚁k已走路径(i,j)的影响因子,h是蚁群的蚂蚁数量。骤4.5:至迭代次数完成,输出风机风速数据的的排列顺序,得出排序后的风速数据样本步骤5:根据风速数据样本构建生成对抗网络训练时所需的训练样本;步骤5.1:生成对抗网络训练所需的真实数据样本采用步骤5.2:构建生成对抗网络的缺失风机风速数据样本dm;其中dmn代表风机m的第n个数,rg代表第g行皆为0的矩阵,dr及rg之间进行点乘运算;运算结果dm代表第g行值全为0的矩阵,代表第g个风机风速数据是缺失的,待进行插补。步骤5.3:根据rgb值将dm及dr,转化为图片形式;步骤6:构建生成对抗网络的生成器模型mg及对抗器模型md;步骤6.1:设置生成器模型的结构,生成器模型结构由编码器解码器组成。首先设置编码器的结构,编码器包含四个处理层,每个处理层包含了:卷积运算、归一化batchnorm运算,此运算可以加快训练的收敛速度;relu层,可以添加神经网络各层之间的非线性关系;设置的编码器的结构参数如表1所示:表1.编码器层次结构解码器包含四个处理层,前三个处理层包含了:反卷积运算、归一化运算、relu层。最后一个处理层使用:卷积运算、归一化运算以及tanh函数;解码器的结构参数如表2所示:表2解码器层次结构生成器模型mg的输入为风速缺失图像,输出为补全后的风速图像;步骤6.2:构建对抗器模型,对抗器模型md的参数如下表所示,包含5层;表3对抗器层次结构对抗器的输入参数包括了:补全后的风速图像及真实的风速图像,其输出为当前图像信息的一个映射值;步骤7:将训练样本输入到生成器模型及对抗器模型中,优化目标函数,进行迭代训练,完成数据的插补工作。步骤7.1:设置生成模型mg的目标函数中,加入l1距离及l2距离;l1距离的作用在于提高图像的清晰度;l2距离的使用在于使生成的模型更加逼近真实的图像,目标函数设置为:l(mg)=[log(md(dm)]+[||dr-dm||1+||dr-dm||2](2)步骤7.2:设置对抗模型md的目标函数;l(md)=[log(md(dr)]+[log(1-md(dm)](3)步骤7.3:生成器模型及对抗器模型的目标函数,均采用adamoptimizer函数进行梯度下降训练,不断更改生成网络及对抗网络模型的训练参数,获取目标函数的最优值,目标函数达到最优值的时候,就可以停止训练了;表3adamoptimizer训练参数学习速率0.002beta10.9beta20.999步骤7.4:迭代训练完成后,输出插补后的风速图像,还原成风机风速数据。最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明权利要求所限定的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1