草地或玻璃环境下的多移动机器人的二自由度分数阶协同控制方法与流程

文档序号:14518485阅读:232来源:国知局
草地或玻璃环境下的多移动机器人的二自由度分数阶协同控制方法与流程

本发明涉及草地或玻璃环境下的多移动机器人的二自由度分数阶协同控制方法。



背景技术:

多移动机器人系统是分布式人工智能系统领域的一个相当重要的分支。多移动机器人系统在20世纪80年代后期已经成为分布式人工智能研究中的主要研究对象。研究多移动机器人系统的主要目的是功能相对简单的多个移动机器人之间进行分布式协同控制,完成复杂任务,为在极端环境下的作业提供了可靠的支持。

关于多移动机器人的研究主要包括移动机器人的知识、目标、技能、规划等,以及移动机器人在解决问题时的协调行动。研究者主要研究移动机器人个体之间的信息交互、协同合作、冲突解决等方面,注重多个移动机器人之间的紧密群体合作,而不是单个移动机器人能力的自治和发挥,说明如何分析、设计和集成多个移动机器人,从而构成互相协作的系统是主要目标。

所谓一致性,即在一个多移动机器人系统中,所有的移动机器人最终状态能够趋于一致。一致性问题的出现主要源于合作控制问题。对于多移动机器人系统的合作控制问题,移动机器人之间共享信息是保证合作的一个前提条件,共享信息可以以多种形式出现,比如说一个共同的目标,一种共同的控制算法,或者相对的位置信息。当一组移动机器人要合作共同去完成一项任务,合作控制策略的有效性表现在,多移动机器人必须能够应对各种不可预知的形势和环境的改变,这就要求移动机器人随着环境的改变能够达到一致。因此,多移动机器人达到一致是实现协调合作控制的一个首要条件。

近年来,针对多移动机器人控制的分析与研究,已在一致性和协同控制方面取得了很大的进展。li在文献distributedconsensusoflinearmulti-agentsystemswithadaptivedynamicprotocols(automatica,2013,49(7):1986-1995.)中对具有领导和没有领导的线性多智能体系统,分析了系统一致性问题。philip在文献adaptiveconsensuscontrolforaclassofnonlinearmultiagenttime-delaysystemsusingneuralnetworks(ieeetransactionsonneuralnetworksandlearningsystems,2014,25(6):1217-1226.)中对于一类具有时滞的非线性多智能体系统,介绍了自适应神经网络一致性控制方法。yu在文献distributedcontrolgainsdesignforconsensusinmulti-agentsystemswithsecond-ordernonlineardynamics(automatica,2013,49(7):2107-2115.)中基于相邻智能体的局部信息对每个跟随者提出了一个分布式自适应律。上述研究针对的机器人模型都是整数阶的模型。对于滑行在草地或者玻璃上的移动机器人而言,它的动力学模型是分数阶的,以上的控制算法无法从根本上进行系统设计使整个多移动机器人系统满足一定的性能指标要求,也很难灵活地实现不同的全局控制目标。



技术实现要素:

本发明克服现有技术的上述缺点,提供一种针对草地或玻璃环境下的多移动机器人的二自由度分数阶协同控制方法,改善分数阶移动机器人的一致性和协同控制。

本发明提出了二自由度控制器稳定集的求法。二自由度控制器包括了两类控制器,一类是与移动机器人自身动态有关的个体控制器,其目的是控制移动机器人,使其达到稳定状态;另一类是影响网络拓扑动态的耦合控制器,其目的在于多移动机器人系统通过拓扑结构的信息交互使各个移动机器人的终值能够趋向一致。同时利用粒子群算法在控制器稳定集内通过迭代寻找到各个控制器参数的最优解。使用这两类控制器能分别有效地控制单个移动机器人的稳定性和整个多移动机器人系统的一致性,有效地提高多移动机器人系统的鲁棒性、快速性。

本发明的目的在于:针对移动在草地或玻璃上的多移动机器人系统,提出二自由度的控制器设计方法。首先,设计能使单个移动机器人稳定的分数阶pid控制器,即个体控制器。然后在所求得的个体控制器稳定参数范围内通过粒子群算法迭代寻找到最优的控制器参数,与原来的移动机器人结合成新的模型。接着运用矩阵原理,分解拓扑结构,得到能使新的模型达成协同控制的条件。最后通过所得的条件求取控制器参数,即耦合控制器。在所得到的个体控制器稳定的范围内选取参数值,使单个移动机器人达到稳定状态;只要在所得到的耦合控制器可取范围内选取参数值,就能使整个系统达到一致,完成协同控制。

本发明是通过以下技术方案实现的:先基于移动机器人移动在草地或者玻璃上时的特性,建立单个移动机器人的分数阶模型,为了使其能够不受外界干扰按照设定的速度前进,在现有的鲁棒控制器设计方法以及控制系统稳定性分析结果的基础上,采用单位反馈控制结构,基于移动机器人模型参数计算出个体控制器中控制参数的稳定域;将移动机器人的模型和个体控制器结合成一个新的模型,针对这个模型,运用矩阵原理,分解拓扑结构,得到能使新的模型达成协同控制的条件。通过所得的条件求取耦合控制器参数。最后,通过在算法获得的稳定集合中通过粒子群算法进行控制参数选取和调节,选取能够满足控制要求的控制参数并得到控制信号,使多移动机器人系统达到一致,实现对多移动机器人的协同控制。

一种针对草地或玻璃环境下的多移动机器人的二自由度分数阶协同控制方法,具体步骤如下:

步骤1,先基于刚体运动学原理,考虑移动机器人移动在草地或者玻璃上时的特性,建立具有如下传递函数形式的移动机器人模型g(s):

若令g(s)的分子和分母分别为n(s)和d(s),则式(1)中,s为复平面上的一个变量,αn和βn分别表示d(s)和n(s)中s项的最高阶次,αn>βn,e为数学常数,si为s的i次方,在d(s)中,αi为分数,ai是d(s)中项所对应的系数,在n(s)中,βi为分数,bi是n(s)中项所对应的系数。然后,将辨识出的模型参数送到主机的存储单元ram中。

步骤2,建立多移动机器人系统的二自由度控制结构图如图2所示,图中,g(s)为单个移动机器人,c1(s)和c2(s)是具有以下形式的分数阶pid控制器:

其中,kp、ki和kd分别为pid控制器的比例、积分和微分增益,λ为积分环节阶数,μ为微分环节阶数。将图2转化成系统控制框图如图3所示,图中,为控制单个移动机器人状态的个体反馈控制器矩阵,为控制系统达到一致性的耦合控制器矩阵,为具有时滞的移动机器人模型矩阵,为与单个移动机器人相邻的邻居个数矩阵,k为单个移动机器人的邻居个数,并且e为单位矩阵,为克罗内克积,a为邻接矩阵,r为系统输入,y为系统输出。

步骤3,根据以下步骤确定能使移动机器人稳定的个体控制器c1(s)的参数范围。

31.确定系统闭环特征函数δ(s)为

δ(s)=sλd(s)+n(s)(kdsλ+μ+kpsλ+ki)(3)

32.固定一个kp,根据以下步骤确定能够保证闭环系统稳定的(kd,ki)稳定域:

(a)计算b0/[a0+b0kp]。如果b0/[a0+b0kp]>0,那么ki>0;如果b0/[a0+b0kp]<0,那么ki>0。

(b)计算λ+μ。如果λ+μ∈(0,2),那么(kd,ki)的范围是下式的左侧。如果λ+μ∈(2,4),那么(kd,ki)的范围是下式的右侧:

其中,

(c)计算βn+μ-αn和并由下式得到(kd,ki)的约束条件:

步骤4,根据以下的粒子群算法获取个体控制器的控制参数最优解:

41.通过步骤3得到的稳定集确定控制器参数的上下界;

42.初始化粒子群算法的各个参数,即粒子的速度v(t)与位置v(t),学习因子β1和β2,搜索速度γ1和γ2,最大迭代次数k;

43.根据下式计算各个粒子的适应函数:

其中,e是系统的跟踪误差。

44.记录每个粒子的个体最优值pi以及种群最优值pg。

45.根据下式更新粒子的位置与速度:

46.重复步骤43-45,直到达到最大迭代次数;

45.最后得到的种群最优值pg即是最优控制器参数。

步骤5,根据以下步骤确定能使多移动机器人系统一致的耦合控制器c2(s)的参数范围:

51.选取步骤4得到的参数最优解作为个体控制器c1(s)的参数,将个体控制器c1(s)与原移动机器人模型g(s)进行整合得到新的模型g'(s),其中由此可将复杂的多反馈系统简化为具有多时滞单反馈的多输入多输出多移动机器人系统,如图5所示,则系统的特征方程为:

其中,e为单位矩阵,l表示laplacian矩阵。因为-l是可对角化矩阵,一定存在一个可逆矩阵p使得-l=p-1λp,其中,λ为对角矩阵。对特征方程进行变形,得到其特征方程为:

其中,表示新的传递函数矩阵,c2(s)表示耦合控制器矩阵,g'(s)为各个子系统的传递函数,c2(s)为各个子系统上的分数阶pid控制器,λi为矩阵-l的特征值,n为特征值个数。

52.对于不同的λ值,重复步骤3的方法,确定能使整个系统达到一致,完成系统协同控制的所有控制器的集合。

53.在得到的控制器的稳定集中,利用步骤4的方法,得到使系统达到最快收敛的最优控制参数。适应度函数选取为下式:

j=ts(kp,ki,kd)(9)

其中,ts选取为系统的收敛时间。

步骤6,将移动机器人的模型参数输入个体控制器c1(s)参数的计算单元,在个体控制器的稳定集合中选取控制参数,将控制参数输入监控模块执行预调控制程序:经模拟量输入信号,经a/d装换模块将模拟信号转化为数字信号输入,将输入值与设定值进行比较可得到不同的跟踪误差按照离散域分数阶pid控制算式计算控制信号增量δu(n1)的值,与前一时刻的控制信号u(n1-1)通过加法器进行加法运算就得到当前时刻的输出控制信号u(n1),其中,n1为当前时刻的采样步数。δu(n1)计算公式如下:

δu(n1)=a1e(n1)+a2eλ(n1-1)+a3eμ(n1-2)(10)

其中,a1=(kp1r1+kd1+r12ki1)/r1,a2=-(kp1r1+2kd1)/r1,a3=kd1/r1,r1为系统采样周期,δu(n1)为当前采样步数为n1时控制器输出信号增量,e(n1)为当前采样步数为n1时的跟踪误差,e(n1-1)为采样步数为n1-1时的跟踪误差,e(n1-2)为采样步数为n1-2时的跟踪误差,λ和μ分别是积分和微分的阶次。通过对分数阶pid控制器的调节减少误差以确保移动机器人的稳定运行。

步骤6,将步骤5中经过预调系统镇定的个体控制器施加于每个移动机器人,以便于对稳定的移动机器人进行协同控制。

步骤7,将个体控制器与原模型结合形成新的模型,并将模型参数输入耦合控制器c2(s)参数的计算单元,由步骤4计算耦合控制器c2(s)的稳定集合。然后由监控模块执行事先编制好的控制程序:经模拟量输入通道传输信号,并将信号接入检测变送装置,再经a/d转换后得到数字量输入信号与此时的系统设定值比较后得到不同时刻的跟踪误差,基于跟踪误差,在所获得的c2(s)稳定集合中选取控制参数,然后按照控制器c2(s)的离散域分数阶pid控制算式计算控制信号增量δu(n2)的值,与前一时刻的控制信号u(n2-1)通过加法器进行加法运算就得到当前时刻的输出控制信号u(n2),其中,n2为当前时刻的采样步数。δu(n2)计算公式如下:

δu(n2)=b1e(n2)+b2eλ(n2-1)+b3eμ(n2-2)(11)

其中,b1=(kpr2+kd+r22ki)/r2,b2=-(kpr2+2kd)/r2,b3=kd/r2,r2为系统采样周期,δu(n2)为当前采样步数为n2时控制器输出信号增量,e(n2)为当前采样步数为n2时的跟踪误差,e(n2-1)为采样步数为n2-1时的跟踪误差,e(n2-2)为采样步数为n2-2时的跟踪误差,λ和μ分别是积分和微分的阶次。通过c2(s)控制器程序调节各移动机器人之间的速度差来使整个系统达到一致,完成协同控制。

对分数阶多移动机器人的协同控制采用本发明提出的将个体控制器和耦合控制器结合的二自由度控制器的稳定集的求法,最大的特点就是:通过分别设计两类控制器,个体控制器只需要控制移动机器人自身的稳定性,耦合控制器只需要控制整个系统的一致性,将单个移动机器人的稳定性控制和整个系统的协同控制有机的结合,完成对不稳定多移动机器人的协同控制。

本发明的优点是:求得的稳定域给粒子群算法的参数上下界提供了重要依据,而通过粒子群算法得到的控制器参数则保证了系统的鲁棒性和快速一致性。使用二自由度控制方法不仅能达到全局的控制目标,而且使系统具有良好的全局性能和局部性能,提高多移动机器人系统的鲁棒性和稳定性,系统的抗干扰能力也得到显著改善。

附图说明

图1为本发明方法采用的工作流程图。

图2为本发明采用的多移动机器人系统结构图。

图3为本发明采用的闭环控制框图。其中c1(s)为控制单个移动机器人状态的个体控制器矩阵,c2(s)为控制系统达到一致性的耦合控制器矩阵,g(s)为具有时滞的移动机器人矩阵,r为系统输入,y为系统输出,k为与单个移动机器人相邻的邻居个数矩阵,l为laplacian矩阵。

图4为本发明采用的系统闭环控制框图的简化图。

图5为本发明实施例中kp1=1,λ=0.4,μ=1.2时,(ki1,kd1)的可取范围。

图6为本发明实施例中耦合控制器c2(s)对于不同λ值的稳定域交集。

图7为本发明实施例中选取耦合控制器稳定域中的最优控制器参数(kp2,ki2,kd2)=(1,1,0.1)的系统响应。

图8为本发明实施例中选取耦合控制器稳定域边界内的非最优控制器参数(kp2,ki2,kd2)=(1,-19,-0.1)的系统响应。

具体实施方式

以下结合附图和实施例对本发明的技术方案作进一步描述。

先基于刚体运动学原理,考虑移动机器人移动在草地或者玻璃上时的特性,建立单个移动机器人的模型。通过自身加载个体控制器c1(s),反馈误差使单个移动机器人保持稳定。然后在所得的个体控制器参数稳定域内选取合适的控制器参数,与原模型结合成新的模型。接着运用矩阵原理,分解拓扑结构,得到能使新个体达成协同控制的条件。最后通过所得的条件求取耦合控制器c2(s)的参数。给定单个移动机器人的初速度,通过分数阶pid控制程序调节各移动机器人的速度,使整个系统达到一致。

实施例:

1.先基于刚体运动学原理,考虑移动机器人移动在草地或者玻璃上时的特性,具有如下传递函数形式的移动机器人模型:

2.建立多移动机器人系统的二自由度控制结构图如图2所示,图中,g(s)为单个移动机器人,c1(s)和c2(s)是具有以下形式的分数阶pid控制器:

其中,kp、ki和kd分别为pid控制器的比例、积分和微分增益,λ为积分环节阶数,μ为微分环节阶数。在本例中,kp=1,λ=0.4,μ=0.6。将图2转化成系统控制框图如图3所示,图中,c1(s)为控制单个移动机器人状态的个体控制器矩阵,c2(s)为控制系统达到一致性的耦合控制器矩阵,g(s)为具有时滞的移动机器人矩阵,l为laplacian矩阵,r为系统输入,y为系统输出。

3.求解个体控制器c1(s)的稳定范围,最终得到的稳定域如图5所示。

(a)由模型参数得到

d(s)=2.1s1.5+0.5s0.2,v(s)=e-0.5s

(b)由b0/[a0+b0kp]>0可知ki>0。

(c)由λ+μ=1∈(0,2)可知,(kd,ki)的范围是下式的左侧:

其中,

a1=1,a2=0b1=0,b2=ω,c1=ω0.4cos(0.2π),c2=ω0.4sin(0.2π),

d1=2.1ω1.9cos(0.95π+0.5ω)+0.5ω0.6cos(0.3π+0.5ω),

d2=2.1ω1.9sin(0.95π+0.5ω)+0.5ω0.6sin(0.3π+0.5ω)

(d)由βn+μ-αn<0可知,此时不存在限制条件。

4.通过粒子群算法在稳定域范围内搜索使下式最小的最优控制参数。在粒子群算法中,搜索粒子数设置为40,学习因子β1和β2设置为2,搜索速度γ1和γ2设置为1.492,最大迭代次数k设置为100;

5.求解耦合控制器c2(s)的稳定范围并得到最优控制器参数:

a)选取通过粒子群算法求得的最优点(ki1,kd1)=(0.92,2.46),将个体控制器和原来的模型结合成新的模型。接着分解系统,求得特征值分别为λ=2和λ=1。根据步骤3中的(d)求得耦合控制器c2(s)对应的(ki2,kd2)的取值范围如图6所示。

b)通过步骤4中设置的粒子群算法寻找到耦合控制器的最优控制参数。

6.将移动机器人的模型参数输入个体控制器c1(s)参数的计算单元,由步骤4得到的个体控制器的最优控制参数,将控制参数输入监控模块执行预调控制程序:经模拟量输入信号,经a/d装换模块将模拟信号转化为数字信号输入,将输入值与设定值进行比较可得到不同的跟踪误差按照离散域分数阶pid控制算式计算控制信号增量δu(n1)的值,与前一时刻的控制信号u(n1-1)通过加法器进行加法运算就得到当前时刻的输出控制信号u(n1),其中,n1为当前时刻的采样步数。δu(n1)计算公式如下:

δu(n1)=a1e(n1)+a2e0.4(n1-1)+a3e0.6(n1-2)

其中,a1=(r1+kd+r12ki)/r1,a2=-(r1+2kd)/r1,a3=kd/r1,r1为系统采样周期,δu(n1)为当前采样步数为n1时控制器输出信号增量,e(n1)为当前采样步数为n1时的跟踪误差,e(n1-1)为采样步数为n1-1时的跟踪误差,e(n1-2)为采样步数为n1-2时的跟踪误差。通过对pid控制器的调节减少误差以确保移动机器人的稳定运行。

7.将步骤5中经过预调系统镇定的个体控制器施加于每个移动机器人,以便于对稳定的移动机器人进行协同控制。

8.将个体控制器与原模型结合形成新的模型,并将模型参数输入耦合控制器c2(s)参数的计算单元,由步骤4计算耦合控制器的c2(s)的稳定集合。然后由监控模块执行事先编制好的控制程序:经模拟量输入通道传输信号,并将信号接入检测变送装置,再经a/d转换后得到数字量输入信号与此时的系统设定值比较后得到不同时刻的跟踪误差,基于跟踪误差,在所获得的c2(s)稳定集合中选取控制参数,然后按照控制器c2(s)的离散域分数阶pid控制算式计算控制信号增量δu(n2)的值,与前一时刻的控制信号u(n2-1)通过加法器进行加法运算就得到当前时刻的输出控制信号u(n2),其中,n2为当前时刻的采样步数。δu(n2)计算公式如下:

δu(n2)=b1e(n2)+b2e0.4(n2-1)+b3e0.6(n2-2)

其中,b1=(kpr2+kd+r22ki)/r2,b2=-(kpr2+2kd)/r2,b3=kd/r2,r2为系统采样周期,δu(n2)为当前采样步数为n2时控制器输出信号增量,e(n2)为当前采样步数为n2时的跟踪误差,e(n2-1)为采样步数为n2-1时的跟踪误差,e(n2-2)为采样步数为n2-2时的跟踪误差。通过分数阶控制器程序调节各移动机器人之间的速度差来使整个系统达到一致,完成协同控制。

在耦合控制器的稳定集合内选取最优控制参数(kp2,ki2,kd2)=(1,0.31,0.64)时系统的输出曲线如图7所示,以验证该稳定方法确实能够使得多移动机器人的协同控制。随后选取耦合控制器集合内的非最优控制参数(kp2,ki2,kd2)=(1,-19,-0.1),系统的输出曲线如图8所示。从而,验证了二自由度控制器的有效性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1