参数自整定的MISO异因子紧格式无模型控制方法与流程

文档序号:17738341发布日期:2019-05-22 03:27阅读:179来源:国知局
参数自整定的MISO异因子紧格式无模型控制方法与流程

本发明属于自动化控制领域,尤其是涉及一种参数自整定的miso异因子紧格式无模型控制方法。



背景技术:

炼油、石化、化工、制药、食品、造纸、水处理、火电、冶金、水泥、橡胶、机械、电气等行业的被控对象,包括反应器、精馏塔、机器、设备、装置、生产线、车间、工厂,其中不少被控对象是miso(multipleinputandsingleoutput,多输入单输出)系统。实现对miso系统的高精度、高稳定、高适用性控制,对工业的节能降耗、提质增效具有重要意义。然而,miso系统的控制难题,尤其是强非线性miso系统的控制难题,一直以来都是自动化控制领域所面临的重大挑战。

miso系统的现有控制方法中包括miso紧格式无模型控制方法。miso紧格式无模型控制方法是一种新型的数据驱动控制方法,不依赖被控对象的任何数学模型信息,仅依赖于miso被控对象实时测量的输入输出数据进行控制器的分析和设计,并且实现简明、计算负担小及鲁棒性强,具有良好的应用前景。miso紧格式无模型控制方法的理论基础,由侯忠生与金尚泰在其合著的《无模型自适应控制—理论与应用》(科学出版社,2013年,第95页)中提出,其控制算法如下:

其中,u(k)为k时刻控制输入向量,u(k)=[u1(k),…,um(k)]t,m为控制输入总个数(m为大于1的正整数);e(k)为k时刻误差;φ(k)为k时刻miso系统伪雅克比矩阵估计值,||φ(k)||为矩阵φ(k)的2范数;λ为惩罚因子;ρ为步长因子。

上述现有的miso紧格式无模型控制方法,采用了同因子结构,也就是说:在k时刻,针对控制输入向量u(k)中的不同控制输入u1(k),…,um(k),只能采用相同数值的惩罚因子λ与相同数值的步长因子ρ。当现有的miso同因子紧格式无模型控制方法应用于强非线性miso系统等复杂对象时,由于控制通道特性各异,往往难以实现理想的控制效果,制约了miso紧格式无模型控制方法的推广应用。

为此,为了打破现有的miso同因子紧格式无模型控制方法的应用瓶颈,本发明提出了一种参数自整定的miso异因子紧格式无模型控制方法。



技术实现要素:

为了解决背景技术中存在的问题,本发明的目的在于,提供一种参数自整定的miso异因子紧格式无模型控制方法,其特征在于:

当被控对象为miso(multipleinputandsingleoutput,多输入单输出)系统时,所述miso异因子紧格式无模型控制方法计算k时刻第i个控制输入ui(k)的数学公式如下:

其中,k为正整数;i表示所述miso系统控制输入总个数中的第i个,i为正整数,1≤i≤m,m为所述miso系统控制输入总个数,m为大于1的正整数;ui(k)为k时刻第i个控制输入;e(k)为k时刻误差;φ(k)为k时刻miso系统伪雅克比矩阵估计值,φj,i(k)为矩阵φ(k)的第j行第i列元素,||φ(k)||为矩阵φ(k)的2范数;λi为第i个控制输入的惩罚因子;ρi为第i个控制输入的步长因子;

针对miso系统,所述miso异因子紧格式无模型控制方法将i的取值遍历正整数区间[1,m]内的所有值,即可计算得到k时刻控制输入向量u(k)=[u1(k),…,um(k)]t

所述miso异因子紧格式无模型控制方法具有异因子特征;所述异因子特征是指针对正整数区间[1,m]内任意两个互不相等的正整数i与x,在采用所述控制方法对miso系统进行控制期间,至少存在一个时刻,使得如下两个不等式中至少有一个不等式成立:

λi≠λx;ρi≠ρx

在采用所述控制方法对miso系统进行控制期间,对计算k时刻控制输入向量u(k)=[u1(k),…,um(k)]t的数学公式中的待整定参数进行参数自整定;所述待整定参数包含惩罚因子λi、步长因子ρi(i=1,…,m)的任意之一或任意种组合。

所述参数自整定采用神经网络计算所述控制输入向量u(k)=[u1(k),…,um(k)]t的数学公式中的待整定参数;在更新所述神经网络的隐含层权系数、输出层权系数时,使用所述控制输入向量u(k)=[u1(k),…,um(k)]t分别针对各自数学公式中的待整定参数在k时刻的梯度;所述控制输入向量u(k)=[u1(k),…,um(k)]t中的ui(k)(i=1,…,m)针对所述ui(k)的数学公式中的待整定参数在k时刻的梯度,由ui(k)分别针对所述ui(k)的数学公式中的各个待整定参数在k时刻的偏导数组成;所述ui(k)分别针对所述ui(k)的数学公式中的各个待整定参数在k时刻的偏导数,采用如下的数学公式进行计算:

当所述ui(k)的数学公式中的待整定参数包含惩罚因子λi时,ui(k)针对所述惩罚因子λi在k时刻的偏导数为:

当所述ui(k)的数学公式中的待整定参数包含步长因子ρi时,ui(k)针对所述步长因子ρi在k时刻的偏导数为:

计算得到的所述ui(k)分别针对所述ui(k)的数学公式中的各个待整定参数在k时刻的偏导数,全部放入集合{ui(k)的梯度};针对miso系统,将i的取值遍历正整数区间[1,m]内的所有值,分别得到集合{u1(k)的梯度},…,集合{um(k)的梯度},并全部放入集合{梯度集合},所述集合{梯度集合}为包含全部{{u1(k)的梯度},…,{um(k)的梯度}}的集合;

所述参数自整定采用神经网络计算所述控制输入向量u(k)=[u1(k),…,um(k)]t的数学公式中的待整定参数,所述神经网络的输入包含所述集合{梯度集合}中的元素、集合{误差集合}中的元素的任意之一或任意种组合;所述集合{误差集合}包含e(k)与e(k)的误差函数组;所述e(k)的误差函数组为k时刻及之前所有时刻误差的累积即k时刻误差e(k)的一阶后向差分e(k)-e(k-1)、k时刻误差e(k)的二阶后向差分e(k)-2e(k-1)+e(k-2)、k时刻误差e(k)的高阶后向差分的任意之一或任意种组合。

在采用上述技术方案的同时,本发明还可以采用或者组合采用以下进一步的技术方案:

所述k时刻误差e(k)采用误差计算函数计算得到;所述误差计算函数的自变量包含输出期望值与输出实际值。

所述误差计算函数采用e(k)=y*(k)-y(k),其中y*(k)为k时刻输出期望值,y(k)为k时刻输出实际值;或者采用e(k)=y*(k+1)-y(k),其中y*(k+1)为k+1时刻输出期望值;或者采用e(k)=y(k)-y*(k);或者采用e(k)=y(k)-y*(k+1)。

所述神经网络为bp神经网络;所述bp神经网络采用隐含层为单层的结构,即采用由输入层、单层隐含层、输出层组成的三层网络结构。

所述神经网络以系统误差函数的值最小化为目标,采用梯度下降法进行系统误差反向传播计算,更新所述神经网络的隐含层权系数、输出层权系数;所述系统误差函数的自变量包含误差e(k)、输出期望值、输出实际值的任意之一或任意种组合。

所述系统误差函数为其中,e(k)为k时刻误差,δuiu(k)=uiu(k)-uiu(k-1),uiu(k)为k时刻第iu个控制输入,a与biu为大于或等于0的常数,iu为正整数。

所述被控对象包含反应器、精馏塔、机器、设备、装置、生产线、车间、工厂。

运行所述控制方法的硬件平台包含工业控制计算机、单片机控制器、微处理器控制器、现场可编程门阵列控制器、数字信号处理控制器、嵌入式系统控制器、可编程逻辑控制器、集散控制系统、现场总线控制系统、工业物联网控制系统、工业互联网控制系统的任意之一或任意种组合。

本发明提供的参数自整定的miso异因子紧格式无模型控制方法,针对控制输入向量中的不同控制输入可采用不同数值的惩罚因子或不同数值的步长因子,能够解决强非线性miso系统等复杂对象中存在的各个控制通道特性各异的控制难题,同时有效克服惩罚因子和步长因子需要费时费力进行整定的难题。因此,与现有的miso同因子紧格式无模型控制方法相比,本发明提供的参数自整定的miso异因子紧格式无模型控制方法具有更高的控制精度、更好的稳定性与更广的适用性。

附图说明

图1为本发明的原理框图;

图2为本发明采用的第i个bp神经网络结构示意图;

图3为两输入单输出miso系统采用本发明的参数自整定的miso异因子紧格式无模型控制方法时的控制效果图;

图4为两输入单输出miso系统采用本发明的参数自整定的miso异因子紧格式无模型控制方法时的控制输入曲线;

图5为两输入单输出miso系统采用本发明的参数自整定的miso异因子紧格式无模型控制方法时的惩罚因子变化曲线;

图6为两输入单输出miso系统采用本发明的参数自整定的miso异因子紧格式无模型控制方法时的步长因子变化曲线;

图7为两输入单输出miso系统采用现有的miso同因子紧格式无模型控制方法时的控制效果图;

图8为两输入单输出miso系统采用现有的miso同因子紧格式无模型控制方法时的控制输入曲线。

具体实施方式

下面结合附图和具体实施例对本发明进一步说明。

图1给出了本发明的原理框图。针对具有m个控制输入(m为大于1的正整数)的miso系统,采用miso异因子紧格式无模型控制方法进行控制。针对第i个控制输入ui(k)(i=1,…,m),miso异因子紧格式无模型控制方法用于计算ui(k)的数学公式的参数包含惩罚因子λi、步长因子ρi;选择ui(k)的数学公式中的待整定参数,其为ui(k)的数学公式的参数的部分或全部,包含惩罚因子λi、步长因子ρi的任意之一或任意种组合;在图1的示意图中,所有控制输入ui(k)(i=1,…,m)的数学公式中的待整定参数为惩罚因子λi、步长因子ρi;ui(k)的数学公式中的待整定参数采用第i个bp神经网络进行计算。

图2为本发明采用的第i个bp神经网络结构示意图;bp神经网络可以采用隐含层为单层的结构,也可以采用隐含层为多层的结构;在图2的示意图中,为简明起见,bp神经网络采用了隐含层为单层的结构,即采用由输入层、单层隐含层、输出层组成的三层网络结构;确定第i个bp神经网络的输入层节点数、隐含层节点数、输出层节点数;第i个bp神经网络的输入层节点数设为m×2+3个,其中m×2个输入层节点的输入为集合{梯度集合}中的元素其中3个输入层节点的输入为集合{误差集合}中的元素第i个bp神经网络的输出层节点数不少于ui(k)的数学公式中的待整定参数的个数,图2中设定为ui(k)的数学公式中的待整定参数个数2个,分别输出惩罚因子λi、步长因子ρi;第i个bp神经网络的隐含层权系数、输出层权系数的更新过程具体为:以系统误差函数的值最小化为目标,图2中以系统误差函数e2(k)的值最小化为目标,采用梯度下降法进行系统误差反向传播计算,更新第i个bp神经网络的隐含层权系数、输出层权系数;在更新第i个bp神经网络的隐含层权系数、输出层权系数时,使用包含{u1(k)的梯度},…,{um(k)的梯度}的集合{梯度集合}中的元素,也就是使用控制输入向量u(k)=[u1(k),…,um(k)]t分别针对各自数学公式中的待整定参数在k时刻的梯度

结合图1与图2的上述说明,将本发明技术方案的实现步骤进一步说明如下:

将当前时刻记为k时刻;将输出期望值y*(k)与输出实际值y(k)之差作为k时刻误差e(k);然后将集合{梯度集合}中的元素与集合{误差集合}中的元素作为第i个bp神经网络的输入,第i个bp神经网络进行前向计算,计算结果通过第i个bp神经网络的输出层输出,得到miso异因子紧格式无模型控制方法计算ui(k)的数学公式中的待整定参数的值;基于误差e(k)、ui(k)的数学公式中的待整定参数的值,采用miso异因子紧格式无模型控制方法计算k时刻第i个控制输入ui(k);将i的取值遍历正整数区间[1,m]内的所有值,即可计算得到k时刻控制输入向量u(k)=[u1(k),…,um(k)]t;对于控制输入向量u(k)中的ui(k),分别计算针对ui(k)的数学公式中的各个待整定参数在k时刻的偏导数,全部放入集合{ui(k)的梯度};将i的取值遍历正整数区间[1,m]内的所有值,分别得到集合{u1(k)的梯度},…,集合{um(k)的梯度},并全部放入集合{梯度集合};随后,以系统误差函数e2(k)的值最小化为目标,使用集合{梯度集合}中的梯度采用梯度下降法进行系统误差反向传播计算,更新第i个bp神经网络的隐含层权系数、输出层权系数;将i的取值遍历正整数区间[1,m]内的所有值,即可更新全部m个bp神经网络的隐含层权系数、输出层权系数;控制输入向量u(k)作用于被控对象后,得到被控对象在后一时刻的输出实际值,然后重复执行本段落所述的步骤,对miso系统进行后一时刻的控制。

以下是本发明的具体实施例。

被控对象采用的两输入单输出miso系统,具有强非线性的复杂特征,属于典型难控的miso系统:

系统输出期望值y*(k)如下:

y*(k)=(-1)round((k-1)/100)

在具体实施例中,m=2。

针对上述具体实施例,开展五组试验进行对比验证。为了更清楚地比较五组试验的控制性能,采用均方根误差(rootmeansquareerror,rmse)作为控制性能评价指标:

其中,e(k)=y*(k)-y(k),y*(k)为k时刻输出期望值,y(k)为k时刻输出实际值。rmse(e)的值越小,表明输出实际值y(k)与输出期望值y*(k)的误差总体而言更小,控制性能更好。

运行本发明控制方法的硬件平台采用工业控制计算机。

第一组试验时:第1个bp神经网络与第2个bp神经网络的输入层节点数均设为7个,其中4个输入层节点的输入均为集合{梯度集合}中的元素其中3个输入层节点的输入均为集合{误差集合}中的元素第1个bp神经网络与第2个bp神经网络的隐含层节点数均设为6个;第1个bp神经网络与第2个bp神经网络的输出层节点数均设为2个,其中第1个bp神经网络分别输出惩罚因子λ1与步长因子ρ1,第2个bp神经网络分别输出惩罚因子λ2与步长因子ρ2;然后采用本发明的参数自整定的miso异因子紧格式无模型控制方法,对上述两输入单输出miso系统进行控制,图3为输出的控制效果图,图4为控制输入曲线,图5为惩罚因子变化曲线,图6为步长因子变化曲线;从控制性能评价指标进行考察,图3中输出的rmse(e)为0.3062;从异因子特征进行考察,图5中两个控制输入的惩罚因子变化曲线存在部分不重叠的现象表明对上述两输入单输出miso系统进行控制时惩罚因子具有异因子特征,图6中两个控制输入的步长因子变化曲线存在部分不重叠的现象表明对上述两输入单输出miso系统进行控制时步长因子具有异因子特征。

第二组试验时:第1个bp神经网络与第2个bp神经网络的输入层节点数均设为4个,4个输入层节点的输入均为集合{梯度集合}中的元素第1个bp神经网络与第2个bp神经网络的隐含层节点数均设为6个;第1个bp神经网络与第2个bp神经网络的输出层节点数均设为2个,其中第1个bp神经网络分别输出惩罚因子λ1与步长因子ρ1,第2个bp神经网络分别输出惩罚因子λ2与步长因子ρ2;然后采用本发明的参数自整定的miso异因子紧格式无模型控制方法,对上述两输入单输出miso系统进行控制;从控制性能评价指标进行考察,输出的rmse(e)为0.3140。

第三组试验时:第1个bp神经网络与第2个bp神经网络的输入层节点数均设为3个,3个输入层节点的输入均为集合{误差集合}中的元素第1个bp神经网络与第2个bp神经网络的隐含层节点数均设为6个;第1个bp神经网络与第2个bp神经网络的输出层节点数均设为2个,其中第1个bp神经网络分别输出惩罚因子λ1与步长因子ρ1,第2个bp神经网络分别输出惩罚因子λ2与步长因子ρ2;然后采用本发明的参数自整定的miso异因子紧格式无模型控制方法,对上述两输入单输出miso系统进行控制;从控制性能评价指标进行考察,输出的rmse(e)为0.3297。

第四组试验时:惩罚因子λ1与步长因子ρ1均固定,待整定参数只选择第2个控制输入的惩罚因子λ2与步长因子ρ2,因此只需采用一个bp神经网络;bp神经网络的输入层节点数设为3个,3个输入层节点的输入为集合{误差集合}中的元素bp神经网络的隐含层节点数设为6个;bp神经网络的输出层节点数设为2个,分别输出惩罚因子λ2与步长因子ρ2;然后采用本发明的参数自整定的miso异因子紧格式无模型控制方法,对上述两输入单输出miso系统进行控制;从控制性能评价指标进行考察,输出的rmse(e)为0.3300。

第五组试验时:直接采用现有的miso同因子紧格式无模型控制方法,设定惩罚因子λ=3,设定步长因子ρ=1,对上述两输入单输出miso系统进行控制,图7为输出的控制效果图,图8为控制输入曲线;从控制性能评价指标进行考察,图8中输出的rmse(e)为0.3396。

五组试验控制性能评价指标的比较结果列于表1,采用本发明的第一组到第四组试验的结果均优于采用现有的miso同因子紧格式无模型控制方法的第五组试验,其中通过对比图3与图7可以发现第一组试验的改进效果尤其显著,充分表明本发明提供的参数自整定的miso异因子紧格式无模型控制方法具有更高的控制精度、更好的稳定性与更广的适用性。

表1控制性能比较

更进一步地,还应该特别指出以下六点:

(1)炼油、石化、化工、制药、食品、造纸、水处理、火电、冶金、水泥、橡胶、机械、电气等行业的被控对象,包括反应器、精馏塔、机器、设备、装置、生产线、车间、工厂,其中不少被控对象是miso系统,并具有强非线性的复杂特征,是典型的难控对象;举例来说,比如炼油、石化、化工、制药等行业常用的连续搅拌反应器cstr就是常见的两输入单输出miso系统,其两个控制输入分别是进料流量与冷却水流量,其输出是反应温度;当化学反应具有强放热效应时,连续搅拌反应器cstr的miso系统就具有强非线性的复杂特征,是典型的难控对象。在上述具体实施例中,被控对象采用的两输入单输出miso系统,也具有强非线性的复杂特征,属于特别难以控制的miso系统;本发明对该被控对象能够实现高精度、高稳定、高适用性的控制,说明本发明的控制方法也能够对反应器、精馏塔、机器、设备、装置、生产线、车间、工厂等复杂miso系统实现高精度、高稳定、高适用性的控制。

(2)在上述具体实施例中,运行本发明控制方法的硬件平台为工业控制计算机;在实际应用时,还可以根据具体情况,选择单片机控制器、微处理器控制器、现场可编程门阵列控制器、数字信号处理控制器、嵌入式系统控制器、可编程逻辑控制器、集散控制系统、现场总线控制系统、工业物联网控制系统、工业互联网控制系统的任意之一或任意种组合作为运行本发明控制方法的硬件平台。

(3)在上述具体实施例中,将输出期望值y*(k)与输出实际值y(k)之差作为k时刻误差e(k),也就是e(k)=y*(k)-y(k),仅为所述误差计算函数中的一种方法;也可以将k+1时刻输出期望值y*(k+1)与k时刻输出y(k)之差作为误差e(k),也就是e(k)=y*(k+1)-y(k);所述误差计算函数还可以采用自变量包含输出期望值与输出实际值的其他计算方法,举例来说,对上述具体实施例的被控对象而言,采用上述不同的误差计算函数,都能够实现良好的控制效果。

(4)bp神经网络的输入包含集合{梯度集合}中的元素、集合{误差集合}中的元素的任意之一或任意种组合;当bp神经网络的输入包含集合{梯度集合}中的元素时,上述具体实施例选择了k-1时刻的梯度,即在实际应用时还可以根据具体情况,进一步增加更多时刻的梯度,举例来说,可增加k-2时刻的梯度,即当bp神经网络的输入包含集合{误差集合}中的元素时,上述具体实施例选择了在实际应用时还可以根据具体情况,在集合{误差集合}中增加更多的误差函数组,举例来说,可增加e(k)的二阶后向差分,就是说将{e(k)-2e(k-1)+e(k-2)}也作为bp神经网络的输入;更进一步地,bp神经网络的输入包含但不限于集合{梯度集合}中的元素、集合{误差集合}中的元素,举例来说,可增加{u1(k-1),u2(k-1)}也作为bp神经网络的输入;对上述具体实施例的被控对象而言,当bp神经网络的输入层节点数不断增加时,都能够实现良好的控制效果,多数情况下还会略有改善,但同时也增加了计算负担,所以bp神经网络的输入层节点数在实际应用时可以根据具体情况设定合理的数目。

(5)在上述具体实施例中,在以系统误差函数的值最小化为目标来更新bp神经网络的隐含层权系数、输出层权系数时,所述系统误差函数采用e2(k),仅为所述系统误差函数中的一种函数;所述系统误差函数还可以采用自变量包含误差、输出期望值、输出实际值的任意之一或任意种组合的其他函数,举例来说,所述系统误差函数采用(y*(k)-y(k))2或(y*(k+1)-y(k))2,也就是采用e2(k)的另一种函数形式;再举例来说,所述系统误差函数采用其中,e(k)为k时刻误差,δuiu(k)=uiu(k)-uiu(k-1),uiu(k)为k时刻第iu个控制输入,a与biu为大于或等于0的常数,iu为正整数;显然,当biu均为0时,所述系统误差函数仅考虑了e2(k)的贡献,表明最小化的目标是系统误差最小,也就是追求精度高;而当biu大于0时,所述系统误差函数同时考虑e2(k)的贡献和的贡献,表明最小化的目标在追求系统误差小的同时,还追求控制输入变化小,也就是既追求精度高又追求操纵稳;对上述具体实施例的被控对象而言,采用上述不同的系统误差函数,都能够实现良好的控制效果;与系统误差函数仅考虑e2(k)贡献时的控制效果相比,在系统误差函数同时考虑e2(k)的贡献和的贡献时其控制精度略有降低而其操纵平稳性则有提高。

(6)所述参数自整定的miso异因子紧格式无模型控制方法的待整定参数包含惩罚因子λi、步长因子ρi(i=1,…,m)的任意之一或任意种组合;在上述具体实施例中,第一组到第三组的试验验证时,对惩罚因子λ1,λ2与步长因子ρ1,ρ2全部实现了参数自整定,而第四组试验时则固定惩罚因子λ1与步长因子ρ1,而仅对第2个控制输入的惩罚因子λ2与步长因子ρ2实现参数自整定;在实际应用时,还可以根据具体情况,选择待整定参数的任意种组合;此外,所述待整定参数包括但不限于惩罚因子λi、步长因子ρi(i=1,…,m)的任意之一或任意种组合;举例来说,根据具体情况,所述待整定参数还可以包括计算miso系统伪雅克比矩阵估计值φ(k)所需的参数。

上述具体实施方式用来解释说明本发明,仅为本发明的优选实施例,而不是对本发明进行限制,在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改、等同替换、改进等,都落入本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1