一种噪声信道下的迭代学习控制系统输入信号估计方法与流程

文档序号:18398709发布日期:2019-08-09 23:39阅读:186来源:国知局
一种噪声信道下的迭代学习控制系统输入信号估计方法与流程

本发明涉及网络控制的技术领域,尤其涉及一种噪声信道下的迭代学习控制系统输入信号估计方法,用于无线信道环境下存在信道噪声时的保障迭代学习控制系统收敛性的输入信号估计。



背景技术:

近些年来,随着信息通信技术的飞速发展,网络控制系统的概念随之提出并得到了极大关注。这种系统利用有线或无线通信方式传输相应的测量信号和控制信号,进而构成闭合的控制回路。特别是无线通信网络下的控制系统,此类系统不仅具备了低成本、重量轻、布线简单、易于安装和维护等优点,而且控制器和系统平台实现了分离,使用方式更为灵活。

当受控对象具备重复运动特性时,网络控制系统的控制器采用迭代学习控制(ilc)策略是一种有效的方式。这种方式通过给定初始输入,对受控对象进行尝试,得到相应的输出误差,并利用输出误差和当前输入进行迭代学习,进而修正下次控制所需的输入信号。随着“学习、修正”过程的不断进行,当学习增益满足一定条件,输出误差即可得到收敛。相较于pid等其他控制策略,ilc策略具备了简单且有效的特点。

显然,无线通信方式下的ilc系统同时具备了上述两方面的优点。但是,通信链路的引入也给ilc系统收敛性能的保障带来了新的挑战。由于无线信道的不可靠性,通过其传输的测量信号和控制信号不可避免地会受到各种干扰影响,其中最为典型的一种就是测控信号无线传输过程中叠加上的信道噪声。显然,无线信道引入的信道噪声会干扰控制器迭代学习过程的进行,并随着节点学习过程的进行得到累积,进而影响系统输出的收敛性。

需要指出的是,过程噪声作用下的ilc系统收敛性一直是该领域的研究重点之一,且提出了遗忘因子,可变增益等多种方法用来抑制其对系统收敛性的影响,但与过程噪声不同的是,信道噪声是测控信号在无线传输过程中叠加上的,属于外部干扰,而过程噪声是在系统状态更新过程中引入的,属于内部干扰。因此,用来处理过程噪声干扰的方法不能够直接用来处理信道噪声的干扰。



技术实现要素:

针对测量信号和控制信号均通过无线信道传输受到噪声干扰,本发明提出一种噪声信道下的迭代学习控制系统输入信号估计方法,从而保障系统输出在存在信道噪声干扰的情况下仍能实现对期望轨迹的精确跟踪。

为了达到上述目的,本发明的技术方案是这样实现的:一种噪声信道下的迭代学习控制系统输入信号估计方法,首先分别获取控制器端和执行器端的输入信号迭代差值和噪声迭代差值的关系表达式,然后用两个关系表达式构建用于输入信号迭代差值估计的滤波方程,最后用估计得到的输入信号迭代差值得到执行器端用于驱动执行器的输入信号,其步骤如下:

步骤一:利用超级向量法对包含噪声干扰的系统模型进行转换,在控制端和执行端分别获取输入信号向量迭代差值和噪声向量迭代差值的关系表达式;

步骤二:利用步骤一获得的输入信号向量迭代差值和噪声向量迭代差值的两个关系表达式构建用于输入信号估计的状态方程和测量方程;

步骤三:根据步骤二获得的用于输入信号估计的状态方程和测量方程利用卡尔曼滤波估计理论构建用于输入信号迭代差值估计的预测方程组;

步骤四、根据步骤三得到的预测方程组构建用于输入信号迭代差值估计的更新方差组,并分别在迭代域用预测值对输入信号估计值进行更新;

步骤五、利用估计得到的输入信号迭代差值获得用于驱动执行端的输入信号。

所述步骤二获取输入信号向量迭代差值和噪声向量迭代差值的关系表达式的方法为:所述噪声干扰的系统模型为噪声信道条件下的系统输入、输出和噪声向量之间的关系,其表达式为:

yk(t)=cxk(t),

其中,xk(t)、yk(t)和分别表示系统第k次迭代学习的运行时间为t的状态、输出和执行器接收到的输入,xk(t+1)表示第k次迭代学习的运行时间为t+1的状态;执行器接收到的输入uk(t)为控制器端发送的输入信号,mk(t)是输入信号无线传输过程中叠加的信道噪声;k表示系统的迭代学习次数,t∈[0,t′-1]表示系统运行时间;a、b、c为系统的系数矩阵,t′表示系统运行的时间周期;

系统的比例型学习控制策略为:

其中,γ(t)为学习增益,为控制器接收到的测量误差信号,且ek(t+1)=yd(t+1)-yk(t+1)为传感器端发送的测量误差信号,nk(t+1)为测量误差信号传输过程中叠加的信道噪声,yd(t+1)和yk(t+1)分别为运行时间t+1的期望轨迹和输出;

利用超级向量法将噪声干扰的系统模型和比例型策略分别压缩表示为:

yk=g(uk+mk),

uk+1=uk+γ(ek+nk),

其中,yk、uk、ek、mk和nk分别表示系统的输出向量、输入向量、输出误差向量、输入信号噪声向量和输出信号噪声向量,g表示系统矩阵,γ表示学习增益矩阵;且yk=[yk(1)yk(2)···yk(t)]t,ek=[ek(1)ek(2)···ek(t)]t,uk=[uk(0)uk(1)···uk(t-1)]t其中,t表示矩阵的转置,gt=cat-1b,t=1,2,…,t′;

定义输出误差向量的迭代差值δek+1=ek+1-ek,利用压缩后的系统模型和输出误差向量ek=yd-yk,可得:

其中,δuk+1=uk+1-uk为输入向量迭代差值,δmk+1=mk+1-mk为输入噪声迭代差值;

利用压缩后的比例型策略和输出误差向量的迭代差值得到控制端的输入信号向量迭代差值、输入噪声向量迭代差值和输出噪声向量迭代差值之间的关系表达式:

其中,δnk+1=nk+1-nk为输出噪声迭代差值;

最后,根据执行器接收到的输入利用超级向量法将执行器端的输入向量迭代差值和输入信号噪声向量迭代差值之间的关系表达式表示为:

所述步骤二中构建用于输入信号估计的状态方程和测量方程的方法为:利用步骤一获得的控制器端的输入信号噪声向量差值和输出信号噪声向量差值之间的关系表达式δuk+1=(i-γg)δuk+γgδmk+γgδnk和执行器端的输入向量迭代差值和输入信号噪声向量差值之间的关系表达式根据卡尔曼滤波估计理论,构建用于执行器端输入信号滤波估计的状态方程和测量方程分别为:

其中,uk=δuk,vk=δmk+δnk,wk=δmk,且vk~n(0,q),wk~n(0,r),q为状态方程噪声方差,r为测量方程噪声方差。

所述步骤三中构建用于输入信号迭代差值估计的预测方程组的方法为:根据执行器端输入信号估计的状态方程和测量方程式根据卡尔曼滤波估计理论,构建用于输入信号迭代差值估计的预测方程组:

其中,表示迭代域内预测的输入向量迭代差值,表示迭代域内预测的输入向量迭代差值对应的方差;表示迭代域内估计的输入向量迭代差值,表示迭代域内估计的输入向量迭代差值对应的方差。

所述步骤四中构建用于输入信号迭代差值估计的更新方差组的方法为:利用卡尔曼滤波估计理论,根据输入信号迭代差值估计的预测方程组构建用于输入信号迭代差值估计的更新方程组:

其中,表示估计得到的输入信号迭代差值,表示估计得到的输入信号迭代差值对应的方差,kk表示用方差得到对应的滤波估计增益。

所述步骤五中获得用于驱动执行器端的输入信号的方法为:利用更新方程组中估计得到的输入信号迭代差值计算获得第k次迭代用于驱动执行端的输入信号估计值

本发明的有益效果:通过对系统模型进行转换分别获取控制器端和执行器端的输入信号迭代差值与信道噪声迭代差值之间的关系表达式,构建了用于在执行器端对输入信号迭代差值进行估计的滤波方程,进而获得执行器端的输入信号的估值。本发明通过在执行器端对接收到的控制信号进行滤波,有效改善了存在信道噪声情况下的迭代学习控制系统输出的跟踪精度,可以保证在测量信号和控制信号受噪声干扰的条件下系统输出仍能实现对期望轨迹的精确跟踪。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明的流程图。

图2为无线信道条件下的ilc系统框图。

图3为本发明输入迭代差值范数的收敛性对比图。

图4为本发明的期望轨迹示意图。

图5为无滤波估计噪声干扰下的第40次迭代输出轨迹的示意图。

图6为本发明的第40次迭代输出轨迹的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种噪声信道下的迭代学习控制系统输入信号估计方法,其构思是:首先利用超级向量法对包含噪声干扰的系统模型进行转换;分别在控制端和执行端获取输入信号信号迭代差值,测量信号向量迭代差值和控制信号迭代差值之间的关系,即分别获取控制端和执行端的输入信号迭代差值和噪声迭代差值的关系表达式;然后用这两个关系表达式构建用于输入信号迭代差值估计的滤波方程;最后利用估计得到的输入信号迭代差值得到执行端用于驱动执行器的输入信号。其具体实现步骤是:

步骤一:利用超级向量法对包含噪声干扰的系统模型进行转换,在控制端和执行端分别获取输入信号向量迭代差值和噪声向量迭代差值的关系表达式。

如图2所示,无线信道条件下的ilc系统的原理框图,首先考虑如下一类网络通信条件下的线性、离散、时不变的ilc控制系统:

其中,xk(t)、yk(t)和分别表示系统第k次迭代学习的运行时间t的状态、输出和执行器接收到的输入。xk(t+1)表示运行时间t+1的状态。这里,执行器接收到的输入uk(t)为控制器端发送的输入信号,mk(t)是输入信号无线传输过程中叠加的信道噪声。k表示系统的迭代学习次数,t∈[0,t′-1]表示系统运行时间,a、b、c为系统的系数矩阵。t′表示系统运行的时间周期。

控制的目标是在期望输入ud(t)的作用下,实现对期望轨迹yd(t)的精确跟踪,二者满足:

其中,xd(t)和xd(t+1)分别为运行时间t和t+1的期望状态。为了实现对期望轨迹yd(t)的精确跟踪,现有多种ilc策略,其中一种比例型策略为:

其中,为控制器接收到的测量误差信号,ek(t+1)=yd(t+1)-yk(t+1)为传感器端发送的测量误差信号,nk(t+1)为测量误差信号传输过程中叠加的信道噪声。yd(t+1)和yk(t+1)分别为运行时间t+1的期望轨迹和输出。

利用超级向量法,可以将噪声信道条件下的系统输出和噪声向量之间的关系表达式即式(1)、系统输入和噪声向量之间的关系表达式即式(3)分别压缩表示为:

yk=g(uk+mk)(4)

uk+1=uk+γ(ek+nk)(5)

其中,yk、uk、ek、mk和nk分别表示系统的输出向量、输入向量、输出误差向量、输入信号噪声向量和输出信号噪声向量,g表示系统矩阵,γ表示学习增益矩阵,其实现方法分别如式(6)—(12)所示:

yk=[yk(1)yk(2)···yk(t)]t(10)

ek=[ek(1)ek(2)···ek(t)]t(11)

uk=[uk(0)uk(1)···uk(t-1)]t(12)

mk=[mk(0)mk(1)···mk(t-1)]t(13)

nk=[nk(1)nk(2)···nk(t)]t(14)

其中,gt=cat-1b,t=1,2,…,t。

然后,利用超级向量法压缩表示的系统模型分别获取控制器端和执行器端输入向量迭代差值、输入噪声向量迭代差值和输出噪声向量迭代差值之间的关系。

定义输出误差向量的迭代差值δek+1=ek+1-ek,利用式(4)和输出误差向量的定义ek=yd-yk,可得:

δek+1=-gδuk+1-gδmk+1(17)

其中,δuk+1=uk+1-uk为输入向量迭代差值,δmk+1=mk+1-mk为输入噪声迭代差值。利用式(5)和式(17)即可得到控制端的输入信号向量迭代差值、输入噪声向量迭代差值和输出噪声向量迭代差值之间的关系表达式:

其中,δnk+1=nk+1-nk为输出噪声迭代差值。最后,根据执行器接收到的输入利用超级向量法可将执行器端的输入向量迭代差值和输入信号噪声向量迭代差值之间的关系表达式表示为:

步骤二:利用步骤一获得的输入信号向量迭代差值和噪声向量迭代差值的两个关系表达式构建用于输入信号估计的状态方程和测量方程。

利用获得的控制器端和执行器端的输入信号向量迭代差值、输入信号噪声迭代差值和输出噪声迭代差值之间的关系式(18)和式(19),参考标准kalman滤波估计方差式,构建用于执行器端输入信号估计的状态方程和测量方程,分别如式(20)和(21)所示:

其中,uk=δuk,vk=δmk+δnk,wk=δmk,vk~n(0,q),wk~n(0,r)。q为状态方程噪声方差,r为测量方程噪声方差。

步骤三:根据步骤二获得的用于输入信号估计的状态方程和测量方程,利用卡尔曼滤波估计理论构建用于输入信号迭代差值估计的预测方程组,对迭代域内预测的输入向量迭代差值以及其对应的方差进行预测。

根据执行器端输入信号估计的状态方程和测量方程式(20)和式(21)构建用于输入信号迭代差值估计的预测方程组:

其中,表示迭代域内预测的输入向量迭代差值,表示迭代域内预测的输入向量迭代差值对应的方差。表示迭代域内估计的输入向量迭代差值。迭代域内估计的输入向量迭代差值对应的方差。

步骤四、根据步骤二获得的用于输入信号估计的状态方程和测量方程,利用卡尔曼滤波估计理论构建用于输入信号迭代差值估计的更新方差组,在迭代域用预测值对输入信号估计值、输入信号估计值对应的方差以及滤波增益进行更新。

根据方程组式(20)和式(21),利用卡尔曼滤波估计理论构建用于输入信号迭代差值估计的更新方程组:

其中,表示估计得到的输入信号迭代差值,表示估计得到的输入信号迭代差值对应的方差,kk表示用方差得到对应的卡尔曼滤波估计增益。

步骤五、利用估计得到的输入信号迭代差值获得用于驱动执行端的输入信号。

利用估计得到的输入信号迭代差值计算获得当前第k次迭代用于驱动执行端的输入信号估计值

为了更好地理解本发明是具体操作步骤,图1给出了相应的操作流程图。

下面,考虑参数如式(28)所示的一类受控系统,其迭代学习控制方式如式(29)所示,期望跟踪轨迹如式(30)所示。

uk+1(t)=uk(t)+γ(t)(ek(t+1)+nk(t+1))(29)

yd(t)=5(sin(8(t-1)/t)+π/2)(30)

其中,信道噪声mk(t)和nk(t)的均值均为零,方差均为0.05。控制器学习增益γ(t)为0.05。利用本发明所提迭代输入差值滤波估计方法,在执行器端对输入信号进行处理,以无滤波处理情况下的系统性能为参照,分别从系统输出和输入迭代差值范数两个角度验证所提算法的有效性。仿真实验结果如图3~6所示。其中,图3是无滤波估计和有滤波估计的输入迭代差值范数的收敛情况对比。由图3可知,在采用本发明所提方法进行滤波估计处理后,输入迭代差值的收敛情况明显改善。图4为期望跟踪轨迹,图5为信道噪声条件下无滤波估计处理的系统第40次迭代输出轨迹,图6为采用本发明所提滤波估计方法处理的系统第40次迭代输出轨迹。通过对比图4~6可知,在采用本发明所提滤波估计方法对输入信号处理后,信道噪声对系统输出跟踪精度的影响明显得到抑制,跟踪精度明显提高。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1