一种基于改进型神经网络的Smith预估控制方法与流程

文档序号:11231350阅读:799来源:国知局
一种基于改进型神经网络的Smith预估控制方法与流程

本发明涉及自动控制技术领域,特别是涉及一种基于改进型神经网络的smith预估控制方法。



背景技术:

在实际的工业生产过程中,被控对象不仅具有容积延迟,而且广泛存在着不同程度的纯滞后,比如在常见的管道输送过程、探测与制导过程等工艺过程中普遍存在着纯滞后现象,纯滞后对于控制系统的性能极其不利,在滞后时间范围内,控制器由于不能从闭环回路中得到当前时间被控量的实际变化而导致其无法做出相应的调整,控制信号的输出与被控量偏差的动作不一致,使得系统的调节时间和超调量变大,严重时甚至会导致系统因不稳定而失控。一般认为,若纯滞后时间与过程的时间常数之比大于0.3,则称该过程为具有大纯滞后的过程。如何对大纯滞后过程进行有效控制一直是控制工程领域所关注的问题,目前比较常见的解决方法主要有常规控制方案、离散控制方案以及smith预估补偿控制方案。

传统smith预估器的构造需要知道被控过程的精确数学模型,对于多数工业过程来说,常具有非线性和复杂性的特点,建立精确模型的难度极大;另外,如果系统存在外干扰且扰动没有包含在smith预估补偿器内,系统抑制外扰动的效果将很不理想。为此,研究改进传统smith预估器的设计是很有必要的。随着现代计算机技术的飞速发展,借助计算机强大的运算能力和存储能力解决此类非线性模型问题成为现实。目前已有学者提出利用bp神经网络模型通过对被控过程的输入输出关系的学习,构造出可在线辨识的神经网络smith预估器,但是由于传统的bp神经网络存在收敛速度缓慢以及容易陷入局部极小点的固有缺陷,导致其实用性和可靠性下降。另外,bp神经网络的泛化能力有限,所以一般使用在线调整权值的方法进行辨识,在动态调整过程中,辨识的输出有可能会有较大幅度的振荡,所以单纯的使用bp神经网络辨识大滞后对象然后加以普通控制仍然有可能会导致系统不稳定。



技术实现要素:

本发明所要解决的技术问题是提供一种基于改进型神经网络的smith预估控制方法,能够对大时滞被控对象进行更好的控制。

本发明解决其技术问题所采用的技术方案是:提供一种基于改进型神经网络的smith预估控制方法,包括以下步骤:

(1)采集大滞后被控对象的输入输出数据作为初步样本,利用系统的输出响应曲线得到延迟时间,然后将输入样本序列的延迟时间进行时滞消除,即把原初步样本转换为被控对象非滞后部分的输入输出数据集并将此输入输出数据集作为训练样本;

(2)由每组样本中输入输出数据的个数确定bp神经网络的输入层和输出层节点个数,同时确定隐含层层数以及隐含层节点数;

(3)根据bp神经网络各层的节点数确定遗传算法个体的长度;

(4)确定遗传算法的种群规模,迭代次数,交叉概率以及变异概率,然后使用实数编码的方式均匀随机地初始化种群的各个个体;

(5)由种群中的所有个体解码得到bp神经网络的初始权值和阈值,用训练样本训练bp神经网络,将实际输出与训练后的预测输出的差值的平方和作为个体的适应度;

(6)经过选择、交叉、变异以及优胜劣汰的竞争方式后得到下一代种群,计算该种群的适应度;

(7)判断当前种群最优个体的适应度是否满足设定要求或者目前的迭代次数是否已达到设定最大值,如果没有,则返回步骤(6);

(8)保留目前的最佳个体,将其解码取得bp神经网络的最佳初始权值和阈值;

(9)训练此时的bp网络,用其辨识被控对象以及被控对象的非滞后部分;

(10)将bp神经网络辨识后的输入输出信息传给rbf神经网络整定的pid控制器,利用整定后的pid控制器实现预估控制。

所述步骤(1)中采集数据时全面的采集被控对象处于各阶段时的数据。

所述步骤(3)中遗传算法个体的长度与bp神经网络的权值以及阈值的总个数相等。

所述步骤(5)中解码得到bp神经网络的初始权值和阈值的具体方式为:

w1=chrom(1:inputnum*hiddennum)

b1=chrom(inputnum*hiddennum+1:inputnum*hiddennum+hiddennum)

w2=chrom(inputnum*hiddennum+hiddennum+1:inputnum*hiddennum

+hiddennum+hiddennum*outputnum)

b2=chrom(inputnum*hiddennum+hiddennum+hiddennum*outputnum+1:

inputnum*hiddennum+hiddennum+hiddennum*outputnum+outputnum)

再将w1的元素重新按顺序排列为一个inputnum行hiddennum列的矩阵w1,

将b1的元素重新按顺序排列为一个1行hiddennum列的矩阵b1,

将w2的元素重新按顺序排列为一个hiddennum行outputnum列的矩阵w2,

将b2的元素重新按顺序排列为一个1行outputnum列的矩阵b2,

上式中,chrom代表种群中的个体,chrom(x1:x2)代表该个体的第x1个元素到第x2个元素;inputnum为输入层节点个数,outputnum为输出层节点个数,hiddennum为隐含层节点个数;w1、b1、w2、b2分别表示输入层到隐含层的权值矩阵和阈值矩阵以及隐含层到输出层的权值矩阵以及阈值矩阵。

所述步骤(6)中,选择操作时使用赌轮盘法,交叉操作采用实数交叉法,变异操作时选择实数变异法;优胜劣汰指的是每经过一轮选择、交叉、变异操作后使用当前适应度最好的个体去替代种群中适应度最差的个体。

所述步骤(10)中bp神经网络辨识后的输入输出信息的传递方式是通过使用rbf神经网络辨识bp神经网络的输入输出信息,计算得到被控对象的jacobian信息,然后利用jacobian信息在线整定pid参数。

所述步骤(10)中rbf神经网络输入层采用三个节点,分别对应δu(k)、y(k)以及y(k-1),其中δu(k)为控制器的输出增量,y(k)和y(k-1)为bp神经网络的辨识输出,y(k)表示当前采样时刻的输出,y(k-1)则是上一采样时刻的输出;所述rbf神经网络的输出为ym(k),性能指标定为其输出权值、节点中心以及节点基宽参数的调整使用梯度下降法,目标是使得性能指标j尽可能的小,即ym(k)逼近y(k)。

有益效果

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明使用bp神经网络辨识大滞后被控对象,因此可以在不必知道被控对象精确数学模型的情况下对其加以控制,同时利用rbf神经网络整定pid控制器,有效提升了pid的整定速度,增强了系统的稳定性;另外,使用遗传算法优化bp网络,使其尽可能的跳出局部最优而找到全局最优点,提升了整个方案的实用性。

附图说明

图1是本发明基于改进型神经网络的smith预估控制方法的流程图;

图2是传统smith预估控制原理方框图;

图3是本发明的整个预估控制系统的结构示意图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

图3是整个预估控制系统的结构图,包括大时滞被控对象gp(s),nn1和nn2神经网络模块,以及rbf网络辨识模块。其中nn1神经网络用于辨识被控过程,nn2神经网络与nn1结构相同,用于辨识被控过程的非延迟部分,即传统smith预估器(如图2所示)的gs(s)e-ts与gs(s)分别用神经网络模块nn1以及nn2代替;另外,通过rbf神经网络模块对bp网络的输入输出信息的辨识,得到被控对象的jacobian信息,然后利用jacobian信息在线整定pid参数。如图1所示,具体包括以下步骤:

(1)采集大滞后被控对象gp(s)的输入输出数据作为初步样本,利用系统的输出响应曲线得到延迟时间τ,然后将输入样本序列的延迟时间τ进行时滞消除,即把原初步样本转换为被控对象非滞后部分的输入输出数据集并将此输入输出数据集作为训练样本,采集数据时应尽可能全面的采集被控对象处于各阶段时的数据,比如使用多种输入信号测试被控对象并采集其相应的过渡过程和稳态过程的输出;

(2)由样本中输入输出数据的个数确定bp神经网络的输入层和输出层节点个数,比如被控对象的数学模型可由此式描述:y(k)=f[y(k-1),...,y(k-n),u(k-d),...u(k-d-m)],此时bp神经网络的输入层节点数应为n+m+1个,另外由于本发明主要针对单输入单输出系统,所以输出层节点个数一般为1;同时需要确定隐含层层数以及隐含层节点数,隐含层层数选择一层即可,至于隐含层节点数这里使用经验公式其中,inputnum为输入层节点个数,outputnum为输出层节点个数,hiddennum为隐含层节点个数,a为0~10之间的常数;

(3)根据bp神经网络各层的节点数确定遗传算法个体的长度,具体来说,个体长度应与网络的权值以及阈值的总个数相等,对于步骤(2)中所述三层网络来说,个体长度可由下式确定:numsum=(inputnum+1)*hiddennum+(hiddennum+1)*outputnum;

(4)确定遗传算法的各项参数,如种群规模,迭代次数,交叉概率以及变异概率等,然后使用实数编码的方式均匀随机地初始化种群的各个个体;

(5)由种群中的所有个体解码得到bp神经网络的初始权值和阈值,这里具体的解码方式为:

w1=chrom(1:inputnum*hiddennum)

b1=chrom(inputnum*hiddennum+1:inputnum*hiddennum+hiddennum)

w2=chrom(inputnum*hiddennum+hiddennum+1:inputnum*hiddennum

+hiddennum+hiddennum*outputnum)

b2=chrom(inputnum*hiddennum+hiddennum+hiddennum*outputnum+1:

inputnum*hiddennum+hiddennum+hiddennum*outputnum+outputnum)

再将w1的元素重新按顺序排列为一个inputnum行hiddennum列的矩阵w1,

将b1的元素重新按顺序排列为一个1行hiddennum列的矩阵b1,

将w2的元素重新按顺序排列为一个hiddennum行outputnum列的矩阵w2,

将b2的元素重新按顺序排列为一个1行outputnum列的矩阵b2,

上式中,chrom代表种群中的个体,chrom(x1:x2)代表该个体的第x1个元素到第x2个元素,比如chrom(1:inputnum*hiddennum)表示chrom这个个体的第1个元素到第inputnum*hiddennum个元素;w1、b1、w2、b2分别表示输入层到隐含层的权值矩阵和阈值矩阵以及隐含层到输出层的权值矩阵以及阈值矩阵。

然后用训练样本训练bp神经网络,将实际输出与训练后的预测输出的差值的平方和作为个体的适应度,即个体适应度可表示为:

式中,yi表示bp网络训练时第i个训练样本的实际输出,oioi则为bp神经网络对应的预测输出,n为总的训练样本数目;

(6)经过选择、交叉、变异以及优胜劣汰的竞争方式后得到下一代种群,然后计算该种群的适应度。具体的操作:

a)选择操作使用赌轮盘法,每个个体i的选择概率为:

式中,fitness(i)表示个体i的适应度,n为种群个体数目;

b)交叉操作采用实数交叉法,第m个个体am和第n个个体an在j位的交叉操作方法如下:

amj=amj*(1-b)+anj*b

anj=anj*(1-b)+amj*b

式中,b为0~1之间的随机数;

c)变异操作选择实数变异法,选取第i个个体的第j个基因aij进行变异,

若rand>0.5,aij=aij+(aij-amax)*f(g)

若rand≤0.5,aij=aij+(amin-aij)*f(g)

且f(g)=r*(1-g/gmax)2

式中,rand和r均为为0~1之间的随机数,amax为基因aij的上界,amin为基因aij的下界,g为当前迭代次数,gmax为最大迭代次数;

d)优胜劣汰指的是每经过一轮择、交叉、变异操作后使用当前适应度最好的个体去替代种群中适应度最差的个体;

(7)判断当前种群的适应度是否满足设定要求或者目前的迭代次数是否已达到设定最大值,如果否,跳转至步(6),每执行一次步骤(6),迭代次数加1;

(8)保留目前的最佳个体,将其解码取得bp神经网络的最佳初始权值和阈值,解码过程与步骤(5)中相同;

(9)使用随机梯度下降法训练此时的bp神经网络,然后用其辨识被控对象以及被控对象的非滞后部分,辨识时需要在线调整网络的权值,以保证辨识结果尽量接近实际的被控对象;

(10)将bp神经网络辨识后的输入输出信息传给rbf神经网络整定的pid控制器,传递方式是通过使用rbf神经网络辨识bp神经网络的输入输出信息,计算得到被控对象的jacobian信息,然后利用jacobian信息在线整定pid参数。

具体的,rbf神经网络输入层采用三个节点,分别对应δu(k)、y(k)以及y(k-1),其中δu(k)为控制器的输出增量,y(k)和y(k-1)为bp神经网络的辨识输出,y(k)表示当前采样时刻的输出,y(k-1)则是上一采样时刻的输出。

rbf神经网络的输出为ym(k),性能指标定为其输出权值、节点中心以及节点基宽参数的调整使用梯度下降法,目标是使得性能指标j尽可能的小,即ym(k)逼近y(k)。

则被控对象的jacobian信息可由下式取得:

式中,wj为隐含层到输出层的权值,bj为基带宽参数,cji为隐含层节点中心量。

同时,kp、ki、kd的调整使用梯度下降法,其响应的调整量如下:

式中,η为kp、ki、kd的学习率,e(k)为系统的输出误差,即e(k)=r(k)-y(k),r(k)为系统给定值。

不难发现,由于本发明使用bp神经网络辨识大滞后被控对象,因此可以在不必知道被控对象精确数学模型的情况下对其加以控制,同时利用rbf神经网络整定pid控制器,有效提升了pid的整定速度,增强了系统的稳定性;另外,使用遗传算法优化bp网络,使其尽可能的跳出局部最优而找到全局最优点,提升了整个方案的实用性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1