一种基于GAN的风机轮毂测风缺失数据的插补方法与流程

文档序号：16680408发布日期：2019-01-19 00:22阅读：318来源：国知局

本发明涉及风机故障诊断
技术领域：
，尤其涉及一种基于gan的风机轮毂测风缺失数据的插补方法。
背景技术：
：随着全球风力发电能力持续增长和风电场的快速扩张、风机的不断应用，机组机舱体积随之增大，轮毂位置也更高，风机安全运行的挑战越来越大。风机不同部位故障皆有可能引起风机停电，即使是一些微小的故障的维修，都会带来昂贵的成本，风机的维护面临着众多挑战。研究表明，对风机进行预防性维护，可以大大降低风机故障后维修的成本。可靠的风机轮毂测风数据在风电功率预测、风电场安全运行评估、风电数值预报等方向应用广泛，有利于风机的安全运行维护，也是确定风电场荷载、有效利用风能的基础；但其数据的缺测、偏离等常困扰和影响着应用的可靠性和效果。因此，对风电场的风机轮毂测风数据的缺失部分进行补偿，其重要性不言而喻。对风电场测风数据的缺失情况，有多种插补方法，包括最小二乘法、卡尔曼滤波插补法、bp神经网络法、arima插补方法等。以任意一台风机为例，设计插补方案，经过使用多种方法研究对比，最小二乘法插补效果不佳，卡尔曼滤波插补在时间序列上插补局限性较大；bp神经网络法插补仅适用于平稳天气条件下的插补，对天气变化把握较差；arima插补方法是一种自适应、高效的风速插补方法，但是不能够进行较长时间的风速插补。技术实现要素：本发明要解决的技术问题是针对上述现有技术的不足，提供一种基于gan的风机轮毂测风缺失数据的插补方法，对风机场的数据进行了相关性分析，使得具有高相关性的数据能够聚集得更近，使得图片变得更为平滑，提高了模型训练的收敛速度，与此同时，该方法能够进行较长时间的数据插补。为解决上述技术问题，本发明所采取的技术方案是：一种基于gan的风机轮毂测风缺失数据的插补方法，具体步骤如下：步骤1：从风场scada系统获取包含风机属性的风机数据，并从该数据中提取每个风机的风速数据，构成初始风速数据集；步骤2：删除初始风速数据集中的异常数据，将风速数据按照风机编号构成风速数据集d；所述异常数据包括：风速错误记录为非数值格式的数据、长时间都恒定不变的风速数据；步骤3：进行不同风机之间的风速数据相关性分析，得出相关系数矩阵c；步骤4：采用蚁群算法对不同风机的风速数据进行排序，得到排序后的风速数据样本d；步骤5：根据风速数据样本构建生成对抗网络训练时所需的训练样本；步骤6：构建生成对抗网络的生成器模型mg及对抗器模型md；步骤7：将训练样本输入到生成器模型及对抗器模型中，进行迭代训练，完成数据的插补工作。所述步骤3具体步骤如下：步骤3.1：计算风场不同的风机风速样本之间的pcc系数，建立pcc相关系数向量；步骤3.2：计算风场不同的风机风速样本之间的mic系数，建立mic相关系数向量；步骤3.3：将pcc相关系数向量设置为变量a,将mic相关系数设置为变量b，构成相关系数矩阵p(a,b)；步骤3.4：对相关系数矩阵p(a,b)进行归一化处理,计算变量a及变量b的信息熵值；步骤3.5：根据计算所得的信息熵值计算变量a的及变量b的权重；步骤3.6：根据计算所得的权重得出最终的相关性系数矩阵c。所述步骤4具体步骤如下：步骤4.1：根据相关系数矩阵c，构建风机之间的连接集合u；步骤4.2：设置蚁群算法的初始化参数，蚁群蚂蚁数量h，信息素强度程度因子δ，信息素挥发因子ρ，最大迭代次数l，相关性系数矩阵c；步骤4.3：根据蚁群算法开始进行训练；随机将蚂蚁置于风机出发点，按照状态转移规则让每个蚂蚁访问每个风机点一次且仅一次，直至每只蚂蚁访问完每个风机点；；步骤4.4：计算各蚂蚁经过的路径长度l，记录当前迭代的最优解，同时对路径上的信息素浓度进行更新；骤4.5：至迭代次数完成，输出风机风速数据的的排列顺序，得出排序后的风速数据样本所述步骤5具体步骤如下：步骤5.1：生成对抗网络训练所需的真实数据样本采用步骤5.2：构建生成对抗网络的缺失风机风速数据样本dm；其中，dmn代表风机m的第n个数，rg代表第g行皆为0的矩阵，dr及rg之间进行点乘运算；运算结果dm代表第g行值全为0的矩阵，代表第g个风机风速数据是缺失的，待进行插补；步骤5.3：根据rgb值将dm及dr,转化为图片形式。所述步骤6中生成器模型mg的输入为风速缺失图像，输出为补全后的风速图像；所述对抗器的输入参数包括补全后的风速图像及真实的风速图像，其输出为当前图像信息的一个映射值。所述步骤7具体步骤如下：步骤7.1：设置生成模型mg的目标函数中，加入l1距离及l2距离；目标函数设置为：l(mg)＝[log(md(dm)]+[||dr-dm||1+||dr-dm||2](2)步骤7.2：设置对抗模型md的目标函数；l(md)＝[log(md(dr)]+[log(1-md(dm)](3)步骤7.3：生成器模型及对抗器模型的目标函数，均采用adamoptimizer函数进行梯度下降训练，不断更改生成网络及对抗网络模型的训练参数，获取目标函数的最优值；步骤7.4：迭代训练完成后，输出插补后的风速图像，还原成风机风速数据。采用上述技术方案所产生的有益效果在于：本发明提供的一种基于gan的风机轮毂测风缺失数据的补偿方法，本方法建立的风机风速数据插补模型，仅涉及风速的采集，模型具有通用型，可以适用于任何风场；并对风机场的数据进行了相关性分析，使得具有高相关性的数据能够聚集得更近，使得图片变得更为平滑，提高了模型训练的收敛速度；本方法能够进行较长时间的数据恢复，在生成对抗网络的目标函数的构建过程中，加入了l1距离以及l2距离，能够加快风机图片数据的训练速度，并且数据插补的精度。附图说明图1为本发明实施例提供的基于gan的风机轮毂测风数据的插补方法的流程图。具体实施方式下面结合附图和实施例，对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明，但不用来限制本发明的范围。本实施例的方法如下所述：首先从风电场的scada系统中将不同风机的风速数据进行提取，获取初始的风速数据集；之后进行数据清洗，将不同风机的风速数据进行编号；然后，对不同风机的风速数据进行相关性分析，利用蚁群算法根据相关性系数大小进行风机风速数据的排序，并将排序后的数据转化为图片形式；构建风机风速图像训练样本后，将训练样本输入到生成对抗网络中进行训练，训练完成后，将缺失的风速补偿完毕。如图1所示，一种轮毂测风数据的缺失数据插补方法，包括如下步骤：步骤1：从风场scada系统获取包含风机属性的风机数据，并从该数据中提取每个风机的风速数据，构成初始风速数据集；步骤2：删除风速数据集中的异常数据，所述异常数据包括：风速错误记录为非数值格式的数据、长时间都恒定不变的风速数据；将风速数据按照风机编号，处理后风速数据集样本为d；步骤3：采用相关系数进行不同风机之间的风速数据相关性分析，得出相关系数矩阵c；具体实施时，计算过程如下：步骤3.1：计算风场不同的风机风速样本之间的pcc系数，建立pcc相关系数向量；pcc皮尔森相关系数计算公式如下：其中，x及y分别对应不同的风机风速数据样本，e(x)及e(y)分别代表风机样本x及y的数学期望，e(xy)代表样本x及y的联合数学期望；步骤3.2：计算风场不同的风机风速样本之间的mic系数，建立mic相关系数向量；mic相关系数的计算公式如下：其中，a及b代表两个不同风机的风速数据向量，n为风机数据向量的维度数，b(n)＝n0.6,na为样本在水平方向上的划分因子数，nb为样本在垂直方向上的划分因子数。坐标空间划分为nx乘以ny个网格的数据空间，xi为水平方向上第i个网格号，yj为垂直方向上第j个网格号，p(xi)的值为落在第xi列的数据点的频率，p(yi)的值使落在第yi行的数据点的频率，p(xi,yj)为落在第(xi,yj)格子中的数据点的频率。步骤3.3：将pcc相关系数向量设置为变量a,将mic相关系数设置为变量b，构成相关系数矩阵p(a,b),变量a在第一列，变量b在第二列；步骤3.4：对相关系数矩阵p(a,b)进行归一化处理,计算变量a及变量b的信息熵值；3.4.1：进行归一化，归一化公式如下：其中，xij代表相关系数矩阵p(a,b)的第i行j列的元素，maxx·j，minx·j，分别表示相关系数矩阵p第j列最大值，最小值和平均值，yij代表归一化后的矩阵p(a,b)的第i行j列的值。3.4.2：计算熵值，u指标的熵值其中，l取值为变量a及变量b的维度数，fuv为系数中的u指标的对应的第v列的值，u指标分别为变量a及变量b,u指标变量a对应的v的值取1，u指标变量b对应的v的值为2；步骤3.5：根据计算所得的信息熵值计算变量a的及变量b的权重；经计算完成，wj代表j指标的权重，q代表指标个数，本实施例中取值为2，指标分别为变量a及变量b；经过计算，变量a的权重为α,变量b的权重为β。步骤3.6：根据计算所得的权重得出最终的相关性系数矩阵c。根据公式(10)计算所得的权重得出最终的相关系数k(x,y)的结果为：k(x,y)＝αpcc(x,y)+βmic(x,y)(10)通过k(x,y)计算得出最终的相关系数矩阵c。步骤4：根据相关系数矩阵c，采用蚁群算法对不同风机的风速数据进行排序，得到排序后的风速数据样本步骤4.1：根据相关系数矩阵c，构建风机之间的连接集合u；风机之间的连接集合表征不同风机之间有互联关系；u＝{(r,s):r,s∈v}，是所有风机之间的连接集合，r,s是风机集合v中的任意风机号；c＝{crs:r,s∈v}，表征的是风机r及s之间的相关系数；步骤4.2：设置蚁群算法的初始化参数，蚁群蚂蚁数量h，信息素强度程度因子δ，信息素挥发因子ρ，最大迭代次数l，相关性系数矩阵c；步骤4.3：根据蚁群算法开始进行训练；随机将蚂蚁置于风机出发点，按照状态转移规则让每个蚂蚁访问每个风机点一次且仅一次，直至每只蚂蚁访问完每个风机点，并回到初始点，状态转移规则公式如下：其中τij是风机点i和风机点j之间在时刻t的信息素强度，ηij＝1/dij，为启发式函数，dij是风机i和风机j之间的相关性系数，s是蚂蚁k待访问的风机点s，allowedk是蚂蚁k待访问的风机点集合，δ为信息素强度因子，ε为启发式函数的重要程度因子，值越大，表征蚂蚁会以更大的概率访问距离短的城市；步骤4.4：计算各蚂蚁经过的路径长度l，记录当前迭代的最优解，同时对路径上的信息素浓度进行更新；信息素根据以下公式进行更新：τij(t+1)＝(1-ρ)τij(t)+δτij(12)其中q是一个常数，lk是蚂蚁k走过的旅行风机点回路的总长度，是蚂蚁k已走路径(i,j)的影响因子，h是蚁群的蚂蚁数量。骤4.5：至迭代次数完成，输出风机风速数据的的排列顺序，得出排序后的风速数据样本步骤5：根据风速数据样本构建生成对抗网络训练时所需的训练样本；步骤5.1：生成对抗网络训练所需的真实数据样本采用步骤5.2：构建生成对抗网络的缺失风机风速数据样本dm；其中dmn代表风机m的第n个数，rg代表第g行皆为0的矩阵，dr及rg之间进行点乘运算；运算结果dm代表第g行值全为0的矩阵，代表第g个风机风速数据是缺失的，待进行插补。步骤5.3：根据rgb值将dm及dr,转化为图片形式；步骤6：构建生成对抗网络的生成器模型mg及对抗器模型md；步骤6.1：设置生成器模型的结构,生成器模型结构由编码器解码器组成。首先设置编码器的结构，编码器包含四个处理层，每个处理层包含了：卷积运算、归一化batchnorm运算，此运算可以加快训练的收敛速度；relu层，可以添加神经网络各层之间的非线性关系；设置的编码器的结构参数如表1所示：表1.编码器层次结构解码器包含四个处理层，前三个处理层包含了：反卷积运算、归一化运算、relu层。最后一个处理层使用：卷积运算、归一化运算以及tanh函数；解码器的结构参数如表2所示：表2解码器层次结构生成器模型mg的输入为风速缺失图像，输出为补全后的风速图像；步骤6.2：构建对抗器模型，对抗器模型md的参数如下表所示，包含5层；表3对抗器层次结构对抗器的输入参数包括了：补全后的风速图像及真实的风速图像，其输出为当前图像信息的一个映射值；步骤7：将训练样本输入到生成器模型及对抗器模型中，优化目标函数，进行迭代训练，完成数据的插补工作。步骤7.1：设置生成模型mg的目标函数中，加入l1距离及l2距离；l1距离的作用在于提高图像的清晰度；l2距离的使用在于使生成的模型更加逼近真实的图像，目标函数设置为：l(mg)＝[log(md(dm)]+[||dr-dm||1+||dr-dm||2](2)步骤7.2：设置对抗模型md的目标函数；l(md)＝[log(md(dr)]+[log(1-md(dm)](3)步骤7.3：生成器模型及对抗器模型的目标函数，均采用adamoptimizer函数进行梯度下降训练，不断更改生成网络及对抗网络模型的训练参数，获取目标函数的最优值,目标函数达到最优值的时候，就可以停止训练了；表3adamoptimizer训练参数学习速率0.002beta10.9beta20.999步骤7.4：迭代训练完成后，输出插补后的风速图像，还原成风机风速数据。最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述实施例所记载的技术方案进行修改，或者对其中部分或者全部技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明权利要求所限定的范围。当前第1页12

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘金海;洪晓伟;汪刚;马大中;卢森骧;张化光;冯健
技术所有人：东北大学
我是此专利的发明人

上一篇：捆扎机的制作方法
上一篇：一种轮胎平衡机使用管理方法、系统及相关设备与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。