基于粒子滤波和rbf辨识的神经网络pid控制参数自整定方法

文档序号:6327799阅读:376来源:国知局
专利名称:基于粒子滤波和rbf辨识的神经网络pid控制参数自整定方法
技术领域
本发明具体涉及一种用于神经网络PID控制参数自整定的方法,属控制系统领 域,用于对象模型未知且干扰为非线性及非高斯噪声的控制系统。
背景技术
在实际工业生产过程中,控制对象往往具有非线性、时变不确定性以及控制过程 中各种非线性、非高斯噪声的干扰,控制对象难以建立精确的数学模型,参数自整定方法繁 杂,因此常规的PID控制器往往难以达到良好的控制效果。为了提高控制精度和系统的鲁棒性,前苏联学者在控制系统不变性原理的基础上 提出了复合控制系统。复合控制的优点是既能大幅度提高跟踪精度,同时还对系统稳定性 没有影响。在负反馈控制系统中,增加前馈补偿元件构成二自由度系统。在标称情况下,这 种二自由度控制系统的给定值响应和负载干扰响应是完全解耦的,可以分别通过调节给定 点跟踪控制器和前馈滤波器来达到各自期望的控制性能指标,以期在扰动信号的不利影响 之前,通过前馈来抵消这种扰动对系统输出的影响。但在实际工作中,难免会受到随机噪声 的干扰、以及外部负载的变化,导致控制信号中含有高频干扰,致使精度下降和控制饱和, 因此,为了获取所需信号,排除干扰噪声,就需要对控制信号进行滤波。目前,国内已有用扩展卡尔曼滤波等方法来改善复合控制系统,实验表明,改善过 后的复合控制系统有效地抑制了系统扰动,提升了动态性能,但是在实际设定值跟踪系统 中,由于噪声的干扰使得目标信噪比很低,常用的扩展卡尔曼滤波要求噪声独立或相关的 高斯噪声,在实际应用中存在缺陷。粒子滤波(PF)算法摆脱了扩展卡尔曼滤波时随机量 必须满足高斯分布的制约条件,为解决非线性非高斯干扰问题提供了新的思路。粒子滤波 通过预测和更新来自于系统概率密度函数的采样集来近似非线性系统的随机贝叶斯估计, 其基本方法是首先依据系统状态向量的经验条件分布在状态空间产生一组随机样本的 集合,假设在k时刻得到了一组描述系统状态后验概率分布P [x(k) zk)]的采样值,记为 {x(k,i),i = 1,. . . .,N},这些样本称为粒子;然后根据观测量不断地更新粒子的权重和位 置,通过调整后的粒子的信息,修正最初的经验条件分布,对系统状态值进行预测,得到一 组采样值Ix(k+l,i),i = 1,..., ,使其近似于?^&+1)|21;+1)]。当样本容量很大时,就 近似于状态变量真实的后验概率密度函数。这种技术适用于任何非高斯背景的非线性随机 系统,精度可以逼近最优估计,是一种很有效的非线性滤波技术。在应用RBF (径向基函数)神经网络实现PID参数整定的控制方法中,首先根据系 统的输入、输出个数,确定RBF网络的结构,即网络输入层、隐含层和输出层中神经元的个 数。一般选择辨识网络的三个输入为11(10,7(10,7&-1),其中11(10表示k时刻PID控制 器输出的控制信号,y(k)表示k时刻系统的输出信号,y(k-l)表示k-Ι时刻系统的输出信
号。神经网络的整定指标函数为㈨= >(幻㈨-少㈨)2其中r(k)表示k时刻系统的参考输入,然后采用梯度下降法可以得到PID的三个参数kp、ki和kd的调整量,从而实 现PID参数的整定。采用RBF神经网络整定PID参数,结构简单,且RBF网络对非线性系统辨识具有精 度高和较强的自适应能力,但是这种方法容易受到控制过程中各种非线性非高斯噪声的干 扰,从而对RBF网络的辨识精度产生较大的影响;而粒子滤波虽然可以消除噪声对系统控 制性能的影响,但是它无法辨识PID控制器的参数。

发明内容
本发明的目的是针对现有技术中对象模型未知且干扰为非线性、非高斯噪声的控 制系统而提出一种基于粒子滤波(PF)和RBF(径向基函数)辨识的神经网络PID控制参数 自整定方法,将粒子滤波和RBF神经网络结合起来,采用粒子滤波处理非线性非高斯时变 系统参数估计和状态滤波问题的独到优势,以及采用RBF神经网络对非线性系统辨识具有 精度高和自适应能力强的特点,更好地改善控制系统的性能指标和抗干扰能力。本发明的技术方案是采用如下步骤1)将系统中的神经元PID控制器输出连接控 制对象输入,将PID控制器输出和系统输出y。ut分别连接RBF神经网络辨识结构的输入,系 统输出y。ut和RBF神经网络辨识结构之间连接粒子滤波部分;幻采用粒子滤波对系统输出 y-进行滤波,得到粒子滤波输出ye,将粒子滤波输出和RBF神经网络输出ym相减的值% =ye_ym作为目标函数训练RBF神经网络,得到RBF神经网络辨识输出ym(k) ;3)结合RBF
dy t(k) dy (k)
神经网络辨识输出ym(k)计算系统的雅可比信息^^ =彳·,u (k)是PID控制器输出
的控制信号,y。ut(k)是系统输出的控制信号;4)将系统参考输入rin和系统输出y。ut之间的 偏差信号ei作为目标函数训练神经元,应用雅可比信息指导神经元通过学习算法调整PID 控制器的比例系数、积分时间常数和微分时间常数这3个参数。本发明的有益效果是本发明通过粒子滤波和RBF系统辨识得到精确的雅可比信 息,即控制对象输出对控制输入的灵敏度信息,解决单神经元PID控制由于雅可比信息未 知、用符号函数替代计算带来的计算不精确的问题;在保留PID控制鲁棒性高和可靠性好 等特点的同时,进一步提高了控制系统的动态响应性能和抗干扰能力。


下面结合附图和具体实施方式
对本发明作进一步详细说明图1是基于粒子滤波和RBF的PID参数自整定结构示意图。
具体实施例方式参见图1,首先建立如图1所示的控制系统结构,该结构的建立方法是原有控制 系统是将系统中的PID控制器输出连接控制对象输入,本发明在原有的神经元PID控制器 基础上,增加RBF神经网络辨识结构和粒子滤波部分。将神经元PID控制器输出和系统的 输出分别连接RBF神经网络辨识结构的输入,粒子滤波部分连接于系统的输出和RBF神经 网络辨识结构之间,RBF神经网络的输入信号为PID控制器输出的控制信号u(k)和系统的 输出y。ut。利用粒子滤波对系统的输出y。ut进行滤波,得到滤波的输出结果^ ;将粒子滤波的输出结果ye和RBF神经网络的输出ym相减,即% = ye_ym,将其作为目标函数训练RBF神 经网络,得到RBF神经网络的辨识输出7111后(图1中的虚线为系统辨识过程),计算得到系 dy (k)
统的雅可比信息^^,即控制对象输出对控制输入的灵敏度信息。利用系统参考输入rin
和系统输出y。ut之间的偏差信号ei作为目标函数训练神经元,并结合RBF网络辨识得到的 雅克比信息调整神经元的权系数,即应用雅可比信息指导神经元(ANN)通过学习算法调整 PID控制器的3个参数,从而得到PID控制器的3个参数,即比例系数KP、积分时间常数T1 和微分时间常数TD。上述应用粒子滤波对控制系统的输出y。ut进行滤波的方法如下粒子滤波的基本方法是通过寻找一组在状态空间中传播的随机样本对概率密度 函数ρ UkI Zk)进行近似,以样本均值代替积分运算,从而获得状态最小方差估计,而这些样 本即称为“粒子”。采用数学语言描述如下对于平稳的随机过程,假定k-i时刻系统的后验 概率密度为P (xk-! I Zk^1),依据一定原则选取η个随机样本点,k时刻获得测量信息后,经过 状态和时间更新,η个粒子的后验概率密度可近似为ρ (xk I zk)。随着粒子滤波数目的增加, 粒子的概率密度函数逐渐逼近状态的概率密度函数,粒子滤波估计即达到了最优贝叶斯估 计的效果,其滤波步骤如下步骤1 初始化设时刻 k = 0 时,X10 Pix0XW0 = I, i = 1,2,. . .,N ;从
p(xk|xk-i; yk)中随机抽取η个样本(粒子);其中, 表示0时刻系统的状态向量, 表示 k时刻系统的状态向量,yk表示k时刻系统的输出,p(g)表示系统的状态先验条件概率,< 表示k = 0时刻状态向量的第i个样本(粒子),其权值为<。步骤2 逐点计算对应的样本ρ (xk IykJ和p(xk|yk)采样值;
w, p(yk I xDwI-I
yy —-步骤3 利用k ^! x[ )wi ι式计算对应样本的权值,并对其进行归
;=1
一化;<是k时刻状态向量的第i个粒子X丨的权值。
N步骤4 计算新的粒子集,根据尸( I ^1) = Σ- 式重采样N
i = \
次,得到{ XDll ; δ (g)表示狄拉克函数。
N步骤5:输出结果状态估计^=Σ<<,方差估计
权利要求
1.一种基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方法,其特征是采用 如下步骤1)将系统中的神经元PID控制器输出连接控制对象输入,将PID控制器输出和系统输 出y。ut分别连接RBF神经网络辨识结构的输入,系统输出y。ut和RBF神经网络辨识结构之间 连接粒子滤波部分;2)采用粒子滤波对系统输出y-进行滤波,得到粒子滤波输出^,将粒子滤波输出Ie 和RBF神经网络输出ym相减的值% = ye-ym作为目标函数训练RBF神经网络,得到RBF神 经网络辨识输出ym(k);dy Ak) dy (k)3)结合RBF神经网络辨识输出ym(k)计算系统的雅可比信息^^= ^^,u (k)是PID控制器输出的控制信号,yout(k)是系统输出的控制信号;4)将系统参考输入rin和系统输出y。ut之间的偏差信号ei作为目标函数训练神经元, 应用雅可比信息指导神经元通过学习算法调整PID控制器的比例系数、积分时间常数和微 分时间常数这3个参数。
2.根据权利要求1所述的基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方 法,其特征是步骤2)所述对系统输出y。ut进行滤波的方法包括如下步骤A)在k= 0时刻随机抽取η个样本,逐点计算对应样本的采样值;B)计算对应样本的权值并对其进行归一化;C)重采样N次;D)输出状态估计和方差估计;Ε)循环k — k+Ι直至结束,得到粒子滤波输出ye。
全文摘要
本发明公开一种用于对象模型未知且干扰为非线性及非高斯噪声的控制系统的基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方法;先将PID控制器输出和系统输出分别连接RBF神经网络辨识结构输入,系统输出和RBF神经网络辨识结构之间连接粒子滤波部分;再用粒子滤波对系统输出滤波得到粒子滤波输出,将粒子滤波输出和RBF神经网络输出相减的值作为目标函数训练RBF神经网络得到其输出,然后计算系统的雅可比信息,最后将系统参考输入和系统输出之间的偏差信号作为目标函数训练神经元,用雅可比信息指导神经元通过学习算法调整PID控制器。本发明在保留PID控制鲁棒性高和可靠性好等特点的同时能进一步提高控制系统的动态响应性能和抗干扰能力。
文档编号G05B13/02GK102141776SQ20111010485
公开日2011年8月3日 申请日期2011年4月26日 优先权日2011年4月26日
发明者伍雪冬, 戴晓强, 朱志宇, 杨官校, 王建华, 王敏, 赵成 申请人:江苏科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1