一种优化神经网络的风机噪音预测方法与流程

文档序号:15230397发布日期:2018-08-21 19:21阅读:213来源:国知局

本发明涉及噪音预测领域,特别地,涉及一种优化神经网络的风机噪音预测方法。



背景技术:

风机的种类众多,应用场合广泛。不同种类的风机、不同应用场合的风机、作用不同的风机,对容许噪音的要求有所差异,可从十多分贝到近百分贝不等。风机噪音的来源很多,比如:叶片回转、叶片涡流、乱流、与风管外壳产生共振,这些都属于风机的固定噪音,除此之外还有外在装配、维护等引发的异常噪音等。通常特定场合对风机噪音的容许度均有一定的标准,故对风机噪音进行准确预测显得尤为重要。

神经网络是一种应用类似于大脑神经突触联接的结构进行信息处理的数学模型,其模仿动物神经网络行为特征,进行分布式并行信息处理,依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。近年来神经网络被广泛应用于模式识别、信号处理、知识工程、专家系统、优化组合和机器人控制等领域,特别是预测控制方面的应用越来越多,因此,将神经网络应用于风机噪音预测不失为一种很好的选择,精确的预测可以大大节约设计成本,缩短产品设计周期,有效避免制造浪费。

现有的神经网络方法具体如下:

(1)样本分类:将所有的样本分为训练样本和测试样本;

(2)输入输出参数确定:将所有的已知参数列出,确定输入和输出变量;

(3)神经网络隐藏层结构确定:输出参数个数确定,根据输入神经元数目和输出参数确定隐含层神经元的数目;

(4)用训练样本和确定的参数来训练神经网络;

(5)用测试样本来测试神经网络的预测精度和泛化能力。

在步骤(2)中,关于输入输出参数确定,其中输出参数就是需要预测的目标参数,关于输入神经元数目的确定,有文献报道,输入神经元数目太少则会引起神经网络训练的欠拟合(神经网络模型拟合不够,在训练集上表现效果差),而输入参数过多一方面会加大训练的难度和训练神经网络所需要的时间,另一方面会导致训练过拟合(训练精度高,但测试精度相对差),而得不到合理的神经网络预测模型。到底是几个输入神经元数目才合适并没有现成的规律和公式。

在步骤(3)中,关于神经网络隐藏层结构的确定,其中最重要的一个影响神经网络的训练精度和预测精度的因素就是隐藏层神经元数目。对于已经确定输入神经元数目,隐藏层神经元数目少则训练精度低,会出现欠拟合,隐藏层神经元数目多则训练精度高、训练时间长,并且会出现过拟合,影响预测精度。关于隐藏层神经元数目的确定,文献中基本是基于4个经验公式。而这4个公式所确定的隐藏层数目却各不相同。

根据相关文献有下面几种隐藏层神经元m确定方法;方法1:其中α是1到10的常数;方法2:方法3:方法4:m=0.75n。



技术实现要素:

本发明目的在于提供一种优化神经网络的风机噪音预测方法,确定最佳输入层和隐藏层神经元,以提高神经网络的训练精度和泛化能力,提高对风机噪音的预测精度。

为实现上述目的,本发明提供了一种优化神经网络的风机噪音预测方法,包括步骤:

s1.采集风机性能参数和几何参数;

s2.分析风机性能参数现状;

s3.确定输入层神经元和输出层神经元:将输入参数对输出参数的影响重要性进行排序,根据训练精度和预测精度确定输入层神经元数目范围与最佳输入层神经元数目;

s4.确定训练神经网络的训练样本和测试样本;

s5.确定训练神经网络隐藏层神经元的数目、训练次数以及最佳结果的保存:根据输入层神经元数目、训练误差合适、预测误差最优准则自适应确定最佳隐藏层神经元数目;

s6.利用训练并保存好的神经网络参数进行风机噪音预测;

s7.得到预测结果,从中选出最理想预测结果。

作为优选的技术方案之一,步骤s1中,性能参数共6个,包括:1-流量,2-全压,3-转速,4-功率,5-效率,6-出口风速;几何参数共10个,包括:7-叶轮直径,8-轮毂比,9-叶根安装角,10-叶根弦长,11-叶中安装角,12-叶中弦长,13-叶尖安装角,14-叶尖弦长,15-叶片数,16-导叶数。

作为优选的技术方案之一,步骤s2的具体方法是:针对步骤s1测试到的风机参数进行性能分析,并对同款不同批次的风机在相同条件下进行试验,验证风机性能参数的合理性。通过对风机现有性能参数曲线观察去掉一些不合理的点,为后面的训练和检测数据做好预处理,有效避免低精度训练样本的存在。

作为优选的技术方案之一,步骤s3中,输出参数,即输出层神经元为噪音(声压级),其数目是唯一确定的1。

作为优选的技术方案之一,输入参数包括步骤s1采集的性能参数和几何参数,共计16个。

作为优选的技术方案之一,步骤s3中,先将输入参数与输出参数进行归一化,然后进行相关性分析,根据相关值的大小对输入参数的重要性进行排序。

作为进一步优选的技术方案之一,采用皮尔逊相关系数进行相关性分析,用于反映变量之间相关关系密切程度。

作为优选的技术方案之一,步骤s3中,训练精度是通过以下方法确定的:对于所有的训练样本来计算百分比误差均值和百分比误差方差,从均值角度来衡量均值越小说明训练精度越高;从方差角度来衡量,则方差越小训练精度越高。

作为优选的技术方案之一,步骤s3中,预测精度是通过以下方法确定的:对于所有的测试样本来计算百分比误差均值和百分比误差方差,从均值角度来衡量均值越小说明预测精度越高;从方差角度来衡量,则方差越小预测精度越高。

作为进一步优选的技术方案之一,百分比误差均值的计算方法如下:

利用公式

计算百分比误差,其中y表示真实测量值;当perr表示训练百分比误差时,表示训练网络拟合值;perr表示预测百分比误差时,表示利用训练网络对未知输入进行预测得到的值;

利用公式

计算百分比误差均值,其中mean_perr表示百分比误差均值,n表示整个训练或预测记录的条数,perr(k)表示第k条记录的训练或预测误差。

作为进一步优选的技术方案之一,百分比误差方差的计算方法如下:

利用公式

计算百分比误差方差,其中var_perr表示百分比误差方差。

作为优选的技术方案之一,步骤s4的具体方法是:当样本足够多的时候通过聚类分析对全部样本进行分类,避免因为样本过多对训练过程的干扰形成过拟合;同时避免将(输入输出的)极值点作为测试样本。

作为优选的技术方案之一,步骤s5中最佳隐藏层神经元的数目随着输入层神经元数目和具体变量的变化而变化。

作为优选的技术方案之一,步骤s5的具体方法是:

s5-1.确定输入层神经元数目,针对不同的隐藏层神经元数目按照步骤s5-2进行判断;

s5-2.判断训练精度是否满足要求,是则进入步骤s5-3,否则返回步骤s5-1;

s5-3.判断预测精度是否满足要求,是则进入步骤s5-4,否则返回步骤s5-1;

s5-4.保存此时的网络参数,包括隐藏层神经元数目以及其他参数,进入步骤s6预测界面,结束。

作为优选的技术方案之一,步骤s6的具体方法是:根据步骤s5确定的网络结构参数对输入参数计算输出,即可预测风机噪音。

作为进一步优选的技术方案之一,所述网络结构参数包括传递函数、最佳隐层神经元数目。

作为优选的技术方案之一,步骤s7中的预测结果有四种,在神经网络训练中采用两种传递函数结合两种评价标准得到四种网络结构,在预测时调用所述的四种网络结构,从而得到四种预测结果。

作为进一步优选的技术方案之一,比较四种预测结果,根据结构精度进行最理想预测结果的确定。

作为进一步优选的技术方案之一,所述的两种传递函数为小波morlet函数和bp神经网络传递函数tansig。

作为进一步优选的技术方案之一,所述的两种评价标准为训练误差的最大值最小准则和训练误差的均值最小准则。

本发明具有以下有益效果:

本发明提出一种基于最佳输入层和隐藏层神经元联动控制的改进神经网络预测风机噪音方法,在神经网络应用中,最引人关注的就是训练精度和预测精度以及泛化能力。本发明主要通过对输入神经元数目和隐藏层神经元数目的联合控制提高风机噪音预测精度和神经网络的泛化能力。

通常来说,包含输入层、1个隐藏层和输出层的三层神经网络是性能最好的网络。本发明的神经网络也是采用三层式的结构,但是,输入神经元数目不是越多越好,而是合适就好。输入层和隐藏层神经元个数参数的联动确定:输入层神经元个数越少,则操作起来越简单,但容易出现欠拟合;随着输入层神经元个数越多,则训练精度越高,但是当超过一定的数据量以后,增加输入神经元个数并不会提高训练精度,反而会影响预测精度,所以这个输入层神经元数目必须合适。

本发明基于相关性分析将风机样本中的输入参数对输出参数影响的重要性进行排序,根据训练精度和预测精度确定输入层神经元数目范围与最佳输入层神经元数目。利用相关性分析有效减少输入神经元数目,降低了最优神经网络结构的构建难度。本发明利用最佳隐藏层神经元数目来确定最优神经网络结构,有效避免了过拟合和欠拟合,提高训练精度的同时也改善了预测精度和泛化能力。

具体如下:

1、可以根据相关性将输入参数对输出参数的影响程度根据重要性将参数进行排序,为后续输入神经元数目和具体的确定做好准备;

2、能够根据输入神经元数目、训练误差合适、预测误差最优准则自适应确定最佳隐含层神经元数目,且这个值会随着输入神经元的数目和具体变量的变化而变化。

3、输入层和隐藏层神经元数目的联动控制提高神经网络训练精度和预测的精度,最大程度提高神经网络的泛化能力。

4、对神经网络最优结构构建方法上有改进,在风机噪音预测这一个应用上有创新。

除了上面所描述的目的、特征和优点之外,本发明还有其它的目的、特征和优点。下面将参照图,对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明的流程图;

图2是训练误差和测试误差随着输入神经元数目变化的曲线图,其中,(a)、(b)、(c)分别对应146点训练误差百分比方差、16点中测试误差小于1%的点数、16点预测百分比误差方差;

图3是确认最佳隐藏层神经元数目的流程图;

图4是训练精度展示图;

图5是预测精度展示图;

图6是预测超限记录号和预测的误差均值(%)和方差(%)示意图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明,但是本发明可以根据权利要求限定和覆盖的多种不同方式实施。

如图1所示的一种优化神经网络的风机噪音预测方法,包括步骤:

s1.采集风机性能参数和几何参数;

性能参数共6个,包括:1-流量,2-全压,3-转速,4-功率,5-效率,6-出口风速;几何参数共10个,包括:7-叶轮直径,8-轮毂比,9-叶根安装角,10-叶根弦长,11-叶中安装角,12-叶中弦长,13-叶尖安装角,14-叶尖弦长,15-叶片数,16-导叶数。

s2.分析风机性能参数现状;

针对步骤s1测试到的风机参数进行性能分析,并对同款不同批次的风机在相同条件下进行试验,验证风机性能参数的合理性。

s3.确定输入层神经元和输出层神经元:将输入参数对输出参数的影响重要性进行排序,根据训练精度和预测精度确定输入层神经元数目范围与最佳输入层神经元数目;

输出参数,即输出层神经元为噪音(声压级),其数目是唯一确定的1。

输入参数包括步骤s1采集的性能参数和几何参数,共计16个。

先将输入参数与输出参数进行归一化,然后进行相关性分析,根据相关值的大小对输入参数的重要性进行排序。

采用皮尔逊相关系数进行相关性分析,用于反映变量之间相关关系密切程度。

训练精度是通过以下方法确定的:对于所有的训练样本来计算百分比误差均值和百分比误差方差,从均值角度来衡量均值越小说明训练精度越高;从方差角度来衡量,则方差越小训练精度越高。

预测精度是通过以下方法确定的:对于所有的测试样本来计算百分比误差均值和百分比误差方差,从均值角度来衡量均值越小说明预测精度越高;从方差角度来衡量,则方差越小预测精度越高。

百分比误差均值的计算方法如下:

利用公式

计算百分比误差,其中y表示真实测量值;当perr表示训练百分比误差时,表示训练网络拟合值;perr表示预测百分比误差时,表示利用训练网络对未知输入进行预测得到的值;

利用公式

计算百分比误差均值,其中mean_perr表示百分比误差均值,n表示整个训练或预测记录的条数,perr(k)表示第k条记录的训练或预测误差。

百分比误差方差的计算方法如下:

利用公式

计算百分比误差方差,其中var_perr表示百分比误差方差。

根据计算得到16个输入参数与输出参数(噪音)的相关性排序为:[47621151051698111231314],最大的相关系数为0.7294,变量序号为4-功率,表明与噪音最相关的变量为功率,第二相关的是7-叶轮直径,以此类推。

数据包括6个性能参数和10个几何参数,这16个参数作为输入的备选参数;1个声压级作为输出。整个数据共162条,其中146条作为训练样本,16条作为输出样本。为了展示预测精度,图2中的所有数据是对整个162条记录进行分析和展示,当输入层神经元数目为4到14时训练网络和预测精度表现具体见图2。

观察图(a)发现输入神经元数目过少则会出现欠拟合,如小于等于4,当输入神经元数目为8的时候,训练误差百分比方差已经非常小并且趋于稳定,并且训练网络的精度不再变化;(a)和(c)可以展示预测误差随神经元数目的变化的趋势,图(b)表明16点中可以预测且误差小于1%的数据记录点数随着输入神经元数目的变化,其趋势出现不同程度的波动,这表明神经网络为7的时候可以预测的点数最多为15点,且误差百分比方差最小为0.305%。所以综合(a)、(b)、(c)这三幅图,找到训练精度中等,但是预测精度不错的点,找了一个比较适合的输入神经元范围4到8,并且尽可能要使得既不是过拟合,也不是欠拟合,最终确定了输入神经元数目为7。

s4.确定训练神经网络的训练样本和测试样本;

s5.确定训练神经网络隐藏层神经元的数目、训练次数以及最佳结果的保存:根据输入层神经元数目、训练误差合适、预测误差最优准则自适应确定最佳隐藏层神经元数目;

最佳隐藏层神经元的数目随着输入层神经元数目和具体变量的变化而变化。

由于本发明的目的是根据部分输入神经元数目来预测噪音(输出参数)。所以神经网络模型的输出是唯一确定的。当输入层神经元数目为n(=7),输出层神经元数目为l(=1),根据相关文献有下面几种隐藏层神经元m确定方法;方法1:其中α是1到10的常数;方法2:方法3:方法4:m=0.75n,综合上述四种方法,可以得到最小值和最大值是13,最小值为4,在系统训练时,实际要对不同的隐藏层隐神经元数目(4~13)分别进行比较,并且基于预测精度最优,而不是训练精度最优来确定出最合理的网络结构。

如图3所示,步骤s5的具体方法是:

s5-1.确定输入层神经元数目,针对不同的隐藏层神经元数目按照步骤s5-2进行判断;

s5-2.判断训练精度是否满足要求,是则进入步骤s5-3,否则返回步骤s5-1;

s5-3.判断预测精度是否满足要求,是则进入步骤s5-4,否则返回步骤s5-1;

s5-4.保存此时的网络参数,包括隐藏层神经元数目以及其他参数,进入步骤s6预测界面,结束。

在确定最优隐藏层神经元数目的过程中,如果选择不同相似风机,则会有不同的最优神经网络隐藏层节点数目,本发明采用了4种相似风机的组合,得到的训练精度和测试精度如表1所示,表1中的风机均购自联城机电有限公司。

表1.不同相似风机训练与预测精度对比

综合观察表1可知,当将相似风机设定为全部风机的时候,则可以有利于在训练的时候兼顾所有训练记录的特色,因此所有的记录其训练样本的误差均值(0.513)和方差(0.305)都是最小的。得到的自适应训练神经元数目是11,考虑到最佳输入神经元的数目是7,输出神经元的数目是输入是1,则本神经网络自适应最佳结构为[7-11-1],显然11处于4个经验公式所确定的小值3到最大值14之间,同时满足经验公式。

s6.利用训练并保存好的神经网络参数进行风机噪音预测;

根据步骤s5确定的网络结构参数对输入参数计算输出,即可预测风机噪音。网络结构参数包括传递函数、最佳隐层神经元数目。

s7.得到预测结果,从中选出最理想预测结果。

图4为训练精度展示图-共146点(包括测试噪音、预测噪音和百分比误差),训练点误差全部在1%范围内。图5为预测精度展示图-共16点(包括测试噪音、预测噪音和百分比误差)。测试预测点有15点在1%范围之内,仔细观察超出范围的点是风机序号2901(风机型号:tztf8.0b)的第146条记录(图6),仔细分析原始数据发现该数据是一条最大功率工况点的数据,没有作为训练数据而直接作为测试数据,其误差为1.36%,经过调整将这一峰值点作为训练数据,则预测准确度从93.8%上升到100%。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1