一种多机器人合作时序预测控制方法

文档序号:8543052阅读:241来源:国知局
一种多机器人合作时序预测控制方法
【技术领域】
[0001] 本发明属于自动化技术领域,设及一种面向环境质量参数监测的多机器人合作时 序预测控制方法。
【背景技术】
[0002] 环境质量对人类安全有着非常重要的意义,如海洋环境中的盐分浓度分布、化值 分布、温度分布,陆地上的有毒气体浓度分布等等。该些环境参数能够很好地表征环境的质 量特征,因此,统称为环境质量参数。如何快速有效地追踪环境质量参数中的最优值,是建 立环境质量参数分布模型的一个极其重要的问题。然而,环境质量参数的分布在不同的环 境下,呈现出不同的特点。通常的情况,可W采用梯度的方法控制多机器人系统追踪环境质 量参数的最优值,从而建立合适的环境质量参数分布模型。然而,实际的环境中,由于洋流、 温度、风力等不同因素的影响,使得环境质量参数分布极其复杂,采用梯度的方法由于不确 定因素的存在,使得多机器人系统建立的环境质量参数模型仅具有局部特征。在该一背景 下,本发明弥补了现有技术的不足。

【发明内容】

[0003] 本发明的目标是针对现有技术的不足之处,提供了一种有效地环境质量参数监测 方法,使得建立的环境质量参数模型具有全局特征。本发明首先采用径向基函数网络建立 环境质量参数模型,对于每一个机器人,在每一时刻,都可W使用自己和他的邻居机器人通 过网络传输过来的新的质量参数数据来更新建立的环境质量参数模型;然后,在环境质量 参数模型的基础上,建立环境质量参数优化问题;接下来,将环境监控任务中的时序和逻辑 部分用线性时序逻辑方法表示,建立有限状态转移系统,采用预测控制方法,获得满足给定 线性时序逻辑的机器人最优理想运动轨迹,它能够引导多机器人系统有序探索兴趣区域, 获得复杂环境的质量参数数据;最后,建立多机器人合作控制优化问题,基于机器人的最优 的理想运动轨迹,采用预测控制方法,产生机器人最优的实际控制序列,并采用实际最优控 制序列中第一个控制输入到机器人,控制机器人的运动。本发明方法的步骤包括:
[0004] 第一步:采用径向基函数网络建立环境质量参数模型,具体步骤如下:
[0005] a、对于第i个机器人的环境质量参数模型,其中;i= 1,2,. . .,n,n是机器人的数 量,即径向基函数网络如(1)式所示。
[0006]
【主权项】
1. 一种多机器人合作时序预测控制方法,其特征在于,该方法包括以下步骤: 第一步:采用径向基函数网络建立环境质量参数模型,具体步骤如下: a、 对于第i个机器人的环境质量参数模型,其中:i = 1,2, . . .,η,η是机器人的数量, 即径向基函数网络如(1)式所示;
其中:α』是径向基函数的权重;m是径向基函数的个数;X是机器人的位置;fi(x)表示 在机器人位置X,径向基函数网络输出的环境质量参数预测值;Pj (X)是第j个径向基函数, 具体如(2)式所示;
其中:T是归一化常数;Uj是径向基函数中心;〇」是径向基函数的宽度;exp (·)是指 数函数;11 · 11表示2范数; b、 对于第i个机器人的所有邻居,即可以和第i个机器人通信的机器人集合用Ni表示, 那么第i个机器人的环境质量参数模型中径向基函数的权重a j(j = 1,2,. . .,m)根据(3) 式更新,
其中:min表示取最小值;I · I表示绝对值;由于第1个机器人在第i个机器人的邻域 内,即I e Ni,因此,能和第i个机器人通信;可以将第1个机器人的位置X1和环境实际质 量参数数值z (X1)发送给第i个机器人;z (X1)表示第1个机器人在位置&的环境质量参数 实际数值,fi (X1)表示第i个机器人的环境质量参数模型对第1个机器人的位置X1上的环 境质量参数预测值; 第二步:基于环境质量参数模型,建立环境质量参数优化问题:
其中:N是预测长度;max表示取最大值;^ (/?·)表示第i个机器人在k时刻预测的理想 位置序列允(1拉)《..厶(兔(々))是关于位置序列童#)的成本函数;s.t.表 示约束条件= :n(的 是第i个机器人在k时刻的实际位置;?·/(0|() = .?.',(fr)是 第i个机器人在k时刻的实际速度;:?⑷λ:)是第i个机器人在k时刻预测的在第k+1时刻 的理想位置;麵(£_)是第i个机器人在k时刻预测的在第k+Ι时刻的理想速度;Λ,(??λ·) 是第i个机器人在k时刻需要求得的在第k+1时刻的理想控制输入;表示第i个机 器人在k时刻需要求得的理想控制序列+料1拉),.,.,对下述符号的约定如下: Xi (I I k)是第i个机器人在k时刻预测的第k+l时刻的实际位置;是第i个机器人 在k时刻预测的第k+Ι时刻的最优实际位置;是第i个机器人在k时刻预测的第k+1 时刻的理想位置;.GGW是第i个机器人在k时刻预测的第k+1时刻的最优理想位置;速 度和控制的符号约定和位置一致; 第三步:采用预测控制方法产生机器人最优的理想运动轨迹,具体步骤如下: a、 根据机器人的动力学,划分搜索环境为多个方格,每个方格用/lfi, λ € 表不,£*τ 是一个有限的整数集合{1,2,...,q},定义一个映射〇,使得0(Xi(k)) = λ,; b、 基于搜索环境划分的方格和机器人的动力学,建立有限状态确定转移系统:
其中:λ。= 〇(χ(〇))是初始状态;知G X乙τ是一个转移集合; ωτ : £τ X £T ^ I+是一个权重函数;Π 是一个观测集合;J : /V ^ 2π是一个观测 映射;2π是观测集合的幂集;对于转移系统的一个有限状态序列λ i,λ 2,...,λ g,定义一 个距离函数
c. 我们用线性时序逻辑表达式Φ来表达环境监控任务中时序和逻辑部分,并且将线 性时序逻辑表达式Φ分解成Cl' = ^2,...,11),Λ:是一个正整数,以至于每一个Φ』 可以被单独并有序的执行,根据Φ」,可以设定是可接受状态集合;对于每一个状态 λ € £7",找到个最短的状态转移路径^,· · ,以至于>米用E ( λ )标记 该状态,其中
d. 在初始时刻k = 0时,首先执行线性时序逻辑表达式Φ i,根据公式(5),获得初始最 优控制序列,位置序列和速度序列:
其中:β『(〇)表示第i个机器人在初始时刻获得最优的理想控制序列 +MiiMGVjO);对应于该最优的理想控制序列,我们可以得到第i个机 器人在初始时刻最优理想位置序列对(1....i0.Y|())和最优理想速度序列 釕(1丨0),·..,哲(]¥丨0);将第i个机器人在初始时刻获得最优理想位置序列和最优理想速 度序列发给他的邻居,同时,获得他的邻居发给他的最优位置序列和最优速度序列; e. 在任意时刻k > 〇,对于一个理想的位置序列.... 对应于状态转 移系统T中的一个状态转移序列λ = Al|k,λ2|1?,...,λ_,需要说明的是,对于每一个 j e {1,· · ·,ff},存在一个I e {1,· · ·,N},使得= λ浙;根据不同的条件要求, 采用下列不同的控制器: ① 如果E (λ k) > 〇,并且,对于所有的j e {1,...,w},有:Ε(λ^......丨)> 0,那么:
② 如果EUk) >〇,并且,存在一个最小j e {I,...,ff},有= (),那么:
f. 根据不同的条件,应用上述控制器(6)、(7)、(8),产生最优的理想控制序列 埒对应于该最优的理想控制序列,我们可以得到第i个机器 人在k时刻最优的理想位置序列柯(ip),... :对(#μ·)和最优的理想速度序列 …,考(綱fc),如果用,§汾Ρ)=[柯⑷Α*)· ?7(?|λ*)]Γ,上标T表示矩阵的 转置,表示在k时刻获得的第k+i时刻的最优状态,那么对应于最优的理想控制序列,我 们可以将最优的理想位置序列和最优的理想速度序列表示成最优的理想运动轨迹(状 态序列)的,..· ;将第i个机器人在k时刻获得最优的理想运动轨迹 ;发给他的邻居,同时,获得他的邻居发给他的最优的理想运动轨迹 3(ιμ·)· · · ·.3(λγ|/,,)·./ (Ξ ,V;-;当 E(λk) = 〇 时,用也.(Αι:.,,,依次代替 φ 1; 第四步:建立多机器人合作控制优化问题,基于最优的理想运动轨迹,获得最优的实际 控制序列,并产生最优的实际运动轨迹,具体步骤如下: a.建立多机器人合作能量函数,如(9)式所示;
其中:d表示相邻机器人之间的理想距离;Si(i|k) = [Xi(i|k),VidiiohVihaik) 表示第i个机器人在状态Si a I k)时的能量;能量函数用来约束多机器人系统之间的距离 和速度,即在理想的情况下,相邻机器人之间的距离为d;并且速度相 等 cC*) = b.根据不同条件,采用下述不同的控制器; ① 如果存在一个I e {1,...,N},使得ν;·(#(?+μ>)) ¥ 0,那么:
其中:γ是距离约束参数用来约束产生的实际运动轨迹Si(Ilk),...,Si(N|k)和最优 理想的运动轨迹|A·),..., 之间的距离;优化的目的是要求产生的实际运动轨 迹在接近理想运动轨迹的情况下,即保持多机器人系统搜索环境质量参数最优数值的情况 下,使得多机器人避免碰撞并速度相差有界,并且满足线性时序逻辑Φ ;Ui(k)表示第i个 机器人在k时刻需要求得的控制序列Ui (I I k),...,Ui (N| k) 表示第i个机器人在k 时刻需要求得的最优实际控制序列<(11以…… ② 如果对于所有的I e {1,…,N},使得\%别/+|的)=0,那么:
其中:fiMfr)表示第i个机器人在k时刻获得的最优理想控制序列
第五步:将第i个机器人在k时刻获得的最优的实际控制序列…,tif(iVp) 中的第一个最优控制4(11幻施加给第i个机器人; 第六步:如果终止条件满足,则第i个机器人停止运行,并将他的环境模型fi (X)输出; 如果终止条件没有满足,则返回第一步继续执行。
【专利摘要】本发明涉及一种多机器人合作时序预测控制方法。本发明首先采用径向基函数网络建立环境质量参数模型,然后,在环境质量参数模型的基础上,建立环境质量参数优化问题;接下来,将环境监控任务用线性时序逻辑方法表示,建立有限状态转移系统;最后,建立多机器人合作控制优化问题,基于机器人的理想的最优运动轨迹,采用预测控制方法,产生机器人实际最优的控制序列,并采用实际最优控制序列中第一个控制输入到机器人,控制机器人的运动。本发明弥补了传统控制的不足,设计的合作时序预测控制方法,在保证多机器人追踪环境质量参数最优值的同时,有序地探索环境区域,并且保持多机器人运动避碰以及速度相差有界。
【IPC分类】G05B13-04
【公开号】CN104865825
【申请号】CN201510121218
【发明人】吕强, 刘士荣, 张波涛, 谢小高
【申请人】杭州电子科技大学
【公开日】2015年8月26日
【申请日】2015年3月19日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1