基于粒子滤波和rbf辨识的神经网络pid控制参数自整定方法

文档序号：6327799阅读：376来源：国知局

专利名称：基于粒子滤波和rbf辨识的神经网络pid控制参数自整定方法
技术领域：
本发明具体涉及一种用于神经网络PID控制参数自整定的方法，属控制系统领域，用于对象模型未知且干扰为非线性及非高斯噪声的控制系统。
背景技术：
在实际工业生产过程中，控制对象往往具有非线性、时变不确定性以及控制过程中各种非线性、非高斯噪声的干扰，控制对象难以建立精确的数学模型，参数自整定方法繁杂，因此常规的PID控制器往往难以达到良好的控制效果。为了提高控制精度和系统的鲁棒性，前苏联学者在控制系统不变性原理的基础上提出了复合控制系统。复合控制的优点是既能大幅度提高跟踪精度，同时还对系统稳定性没有影响。在负反馈控制系统中，增加前馈补偿元件构成二自由度系统。在标称情况下，这种二自由度控制系统的给定值响应和负载干扰响应是完全解耦的，可以分别通过调节给定点跟踪控制器和前馈滤波器来达到各自期望的控制性能指标，以期在扰动信号的不利影响之前，通过前馈来抵消这种扰动对系统输出的影响。但在实际工作中，难免会受到随机噪声的干扰、以及外部负载的变化，导致控制信号中含有高频干扰，致使精度下降和控制饱和，因此，为了获取所需信号，排除干扰噪声，就需要对控制信号进行滤波。目前，国内已有用扩展卡尔曼滤波等方法来改善复合控制系统，实验表明，改善过后的复合控制系统有效地抑制了系统扰动，提升了动态性能，但是在实际设定值跟踪系统中，由于噪声的干扰使得目标信噪比很低，常用的扩展卡尔曼滤波要求噪声独立或相关的高斯噪声，在实际应用中存在缺陷。粒子滤波(PF)算法摆脱了扩展卡尔曼滤波时随机量必须满足高斯分布的制约条件，为解决非线性非高斯干扰问题提供了新的思路。粒子滤波通过预测和更新来自于系统概率密度函数的采样集来近似非线性系统的随机贝叶斯估计，其基本方法是首先依据系统状态向量的经验条件分布在状态空间产生一组随机样本的集合，假设在k时刻得到了一组描述系统状态后验概率分布P [x(k) zk)]的采样值，记为 {x(k，i)，i = 1，. . . .，N}，这些样本称为粒子；然后根据观测量不断地更新粒子的权重和位置，通过调整后的粒子的信息，修正最初的经验条件分布，对系统状态值进行预测，得到一组采样值Ix(k+l，i)，i = 1，...，，使其近似于？^&+1)|21;+1)]。当样本容量很大时，就近似于状态变量真实的后验概率密度函数。这种技术适用于任何非高斯背景的非线性随机系统，精度可以逼近最优估计，是一种很有效的非线性滤波技术。在应用RBF (径向基函数)神经网络实现PID参数整定的控制方法中，首先根据系统的输入、输出个数，确定RBF网络的结构，即网络输入层、隐含层和输出层中神经元的个数。一般选择辨识网络的三个输入为11(10，7(10，7&-1)，其中11(10表示k时刻PID控制器输出的控制信号，y(k)表示k时刻系统的输出信号，y(k-l)表示k-Ι时刻系统的输出信
号。神经网络的整定指标函数为㈨= >(幻㈨-少㈨)2其中r(k)表示k时刻系统的参考输入，然后采用梯度下降法可以得到PID的三个参数kp、ki和kd的调整量，从而实现PID参数的整定。采用RBF神经网络整定PID参数，结构简单，且RBF网络对非线性系统辨识具有精度高和较强的自适应能力，但是这种方法容易受到控制过程中各种非线性非高斯噪声的干扰，从而对RBF网络的辨识精度产生较大的影响；而粒子滤波虽然可以消除噪声对系统控制性能的影响，但是它无法辨识PID控制器的参数。

发明内容
本发明的目的是针对现有技术中对象模型未知且干扰为非线性、非高斯噪声的控制系统而提出一种基于粒子滤波(PF)和RBF(径向基函数)辨识的神经网络PID控制参数自整定方法，将粒子滤波和RBF神经网络结合起来，采用粒子滤波处理非线性非高斯时变系统参数估计和状态滤波问题的独到优势，以及采用RBF神经网络对非线性系统辨识具有精度高和自适应能力强的特点，更好地改善控制系统的性能指标和抗干扰能力。本发明的技术方案是采用如下步骤1)将系统中的神经元PID控制器输出连接控制对象输入，将PID控制器输出和系统输出y。ut分别连接RBF神经网络辨识结构的输入，系统输出y。ut和RBF神经网络辨识结构之间连接粒子滤波部分；幻采用粒子滤波对系统输出 y-进行滤波，得到粒子滤波输出ye，将粒子滤波输出和RBF神经网络输出ym相减的值％ =ye_ym作为目标函数训练RBF神经网络，得到RBF神经网络辨识输出ym(k) ；3)结合RBF
dy t(k) dy (k)
神经网络辨识输出ym(k)计算系统的雅可比信息^^ =彳·，u (k)是PID控制器输出
的控制信号，y。ut(k)是系统输出的控制信号；4)将系统参考输入rin和系统输出y。ut之间的偏差信号ei作为目标函数训练神经元，应用雅可比信息指导神经元通过学习算法调整PID 控制器的比例系数、积分时间常数和微分时间常数这3个参数。本发明的有益效果是本发明通过粒子滤波和RBF系统辨识得到精确的雅可比信息，即控制对象输出对控制输入的灵敏度信息，解决单神经元PID控制由于雅可比信息未知、用符号函数替代计算带来的计算不精确的问题；在保留PID控制鲁棒性高和可靠性好等特点的同时，进一步提高了控制系统的动态响应性能和抗干扰能力。

下面结合附图和具体实施方式
对本发明作进一步详细说明图1是基于粒子滤波和RBF的PID参数自整定结构示意图。
具体实施例方式参见图1，首先建立如图1所示的控制系统结构，该结构的建立方法是原有控制系统是将系统中的PID控制器输出连接控制对象输入，本发明在原有的神经元PID控制器基础上，增加RBF神经网络辨识结构和粒子滤波部分。将神经元PID控制器输出和系统的输出分别连接RBF神经网络辨识结构的输入，粒子滤波部分连接于系统的输出和RBF神经网络辨识结构之间，RBF神经网络的输入信号为PID控制器输出的控制信号u(k)和系统的输出y。ut。利用粒子滤波对系统的输出y。ut进行滤波，得到滤波的输出结果^ ；将粒子滤波的输出结果ye和RBF神经网络的输出ym相减，即％ = ye_ym，将其作为目标函数训练RBF神经网络，得到RBF神经网络的辨识输出7111后(图1中的虚线为系统辨识过程)，计算得到系 dy (k)
统的雅可比信息^^，即控制对象输出对控制输入的灵敏度信息。利用系统参考输入rin
和系统输出y。ut之间的偏差信号ei作为目标函数训练神经元，并结合RBF网络辨识得到的雅克比信息调整神经元的权系数，即应用雅可比信息指导神经元(ANN)通过学习算法调整 PID控制器的3个参数，从而得到PID控制器的3个参数，即比例系数KP、积分时间常数T1 和微分时间常数TD。上述应用粒子滤波对控制系统的输出y。ut进行滤波的方法如下粒子滤波的基本方法是通过寻找一组在状态空间中传播的随机样本对概率密度函数ρ UkI Zk)进行近似，以样本均值代替积分运算，从而获得状态最小方差估计，而这些样本即称为“粒子”。采用数学语言描述如下对于平稳的随机过程，假定k-i时刻系统的后验概率密度为P (xk-! I Zk^1)，依据一定原则选取η个随机样本点，k时刻获得测量信息后，经过状态和时间更新，η个粒子的后验概率密度可近似为ρ (xk I zk)。随着粒子滤波数目的增加，粒子的概率密度函数逐渐逼近状态的概率密度函数，粒子滤波估计即达到了最优贝叶斯估计的效果，其滤波步骤如下步骤1 初始化设时刻 k = 0 时，X10 Pix0XW0 = I, i = 1，2，. . .，N ；从
p(xk|xk-i; yk)中随机抽取η个样本(粒子)；其中，表示0时刻系统的状态向量，表示 k时刻系统的状态向量，yk表示k时刻系统的输出，p(g)表示系统的状态先验条件概率，< 表示k = 0时刻状态向量的第i个样本(粒子)，其权值为<。步骤2 逐点计算对应的样本ρ (xk IykJ和p(xk|yk)采样值；
w, p(yk I xDwI-I
yy —-步骤3 利用k ^！ x[ )wi ι式计算对应样本的权值，并对其进行归
；=1
一化；<是k时刻状态向量的第i个粒子X丨的权值。
N步骤4 计算新的粒子集，根据尸( I ^1) = Σ- 式重采样N
i = \
次，得到{ XDll ； δ (g)表示狄拉克函数。
N步骤5:输出结果状态估计^=Σ<<，方差估计
权利要求
1.一种基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方法，其特征是采用如下步骤1)将系统中的神经元PID控制器输出连接控制对象输入，将PID控制器输出和系统输出y。ut分别连接RBF神经网络辨识结构的输入，系统输出y。ut和RBF神经网络辨识结构之间连接粒子滤波部分；2)采用粒子滤波对系统输出y-进行滤波，得到粒子滤波输出^，将粒子滤波输出Ie 和RBF神经网络输出ym相减的值％ = ye-ym作为目标函数训练RBF神经网络，得到RBF神经网络辨识输出ym(k)；dy Ak) dy (k)3)结合RBF神经网络辨识输出ym(k)计算系统的雅可比信息^^= ^^，u (k)是PID控制器输出的控制信号，yout(k)是系统输出的控制信号；4)将系统参考输入rin和系统输出y。ut之间的偏差信号ei作为目标函数训练神经元，应用雅可比信息指导神经元通过学习算法调整PID控制器的比例系数、积分时间常数和微分时间常数这3个参数。
2.根据权利要求1所述的基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方法，其特征是步骤2)所述对系统输出y。ut进行滤波的方法包括如下步骤A)在k= 0时刻随机抽取η个样本，逐点计算对应样本的采样值；B)计算对应样本的权值并对其进行归一化；C)重采样N次；D)输出状态估计和方差估计；Ε)循环k — k+Ι直至结束，得到粒子滤波输出ye。
全文摘要
本发明公开一种用于对象模型未知且干扰为非线性及非高斯噪声的控制系统的基于粒子滤波和RBF辨识的神经网络PID控制参数自整定方法；先将PID控制器输出和系统输出分别连接RBF神经网络辨识结构输入，系统输出和RBF神经网络辨识结构之间连接粒子滤波部分；再用粒子滤波对系统输出滤波得到粒子滤波输出，将粒子滤波输出和RBF神经网络输出相减的值作为目标函数训练RBF神经网络得到其输出，然后计算系统的雅可比信息，最后将系统参考输入和系统输出之间的偏差信号作为目标函数训练神经元，用雅可比信息指导神经元通过学习算法调整PID控制器。本发明在保留PID控制鲁棒性高和可靠性好等特点的同时能进一步提高控制系统的动态响应性能和抗干扰能力。
文档编号G05B13/02GK102141776SQ20111010485
公开日2011年8月3日申请日期2011年4月26日优先权日2011年4月26日
发明者伍雪冬, 戴晓强, 朱志宇, 杨官校, 王建华, 王敏, 赵成申请人:江苏科技大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱志宇;赵成;伍雪冬;王建华;王敏;杨官校;戴晓强
技术所有人：江苏科技大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。