自主与协商相结合的多机器人协同探索技术的制作方法

文档序号:15279435发布日期:2018-08-28 23:21阅读:185来源:国知局

本发明涉及智能机器人领域,具体涉及一种自主与协商相结合的多机器人协同探索技术。



背景技术:

相对于由一个昂贵的机器人构成的单机器人系统,由多个廉价机器人构成的多机器人系统具有多方面的优势,一是个别机器人的故障不影响系统作业的正常进行,也就是系统具有冗余性;二是多机器人系统能够完成单一机器人无法完成的任务,如搬运较大的物体,加速探索作业过程,等等。

由有限状态自动机描述的机器人监控器,在确定自动机状态时,常规的方法是对机器人工作空间进行划分,不同的空间位姿对应不同的集合元素,这样带来的弊端就是状态集合维数过大。具体的,存在以下缺点:

一是多机器人系统中的各个机器人在整个作业过程中完全依赖通信确定各个作业目标,一旦通信出现故障,机器人将无所适从;其次是现有的机器人之间的协调算法存在计算复杂性,它对各个机器人的计算资源的硬件要求过高;再次,现有的机器人导航目标点选择策略不合理;最后,就是现有的技术都是通过一个中央控制器进行协调,一旦该控制器出现故障,系统就会瘫痪。



技术实现要素:

为解决上述问题,本发明提供了一种自主与协商相结合的多机器人协同探索技术,通过离散事件系统监督控制实现多机器人系统协同作业控制,设计了全新而高效的导航目标点选择策略、全新的探索工作模式。。

为实现上述目的,本发明采取的技术方案为:

自主与协商相结合的多机器人协同探索技术,n个异构移动机器人r1,...,rn通过结合自主与协商两种工作模式实现多机器人协同探索,每个机器人在进行环境探索的同时分别创建一个局部占有栅格地图;该技术包括如下步骤:

s1、全体机器人根据探索能力的强弱依次选择探索方向,使机器人在环境内充分展开;

s2、通过极坐标形式的由机器人ri(i=1,...,n)的几何中心出发的若干射线将工作空间划分成若干个动态的扇区,任意两条相邻直线所构成的楔形区间内的环境部分称之为扇区;

s3、机器人ri对当前位置的四周环境进行扫描,然后根据扫描结果决定下一步的导航目标,分为三种情况:

(1)机器人ri检测到边缘格,则更新自身保存的未完成任务列表;具体的,如果机器人在探索过程中,在某个方向的扇区能够检测到最大数目的边缘格,并且在机器人该方向的扇区内没有其它机器人在进行探索,则该机器人对该扇区保持自主探索模式;如果机器人在探索过程中,在各个方向检测到的边缘格数目都小于能够检测到的最大边缘格数量,则调用通信程序,与其它机器人协商后确定导航目标点;其中,

ri在每移动一个单元格后都进行各个扇区的效益计算,如果在当前位置检测到扇区sk(k=1,…,4)中存在个边缘格,则由边缘格产生的sk的效益就是扇区内的边缘格数;

式中,pj(·)是ri到达时边缘格被覆盖的概率,是ri的移动目标点,是边缘格j的位置,是传感器检测范围;

(2)机器人ri没有检测到边缘格,则调用通信程序,与其它机器人协商后确定导航目标点;

(3)机器人ri检测到障碍物或其它机器人,调用避碰程序;

s4、机器人ri(i=1,...,n)与其它机器人通信确定导航目标点;如果没有检测到边缘格,则判断各个扇区内是否存在边缘格簇,分为两种情况:

(1)如果扇区内存在边缘格簇,则进行以下操作:

s41、首先,通过下式计算各个边缘格簇的效益

ri的扇区sk的边缘格簇效益可以表示为

式中,分别表示边缘格簇效益对机器人的吸引和排斥部分,ξ是加权系数;吸引部分由sk的fcck中所有成员产生,可表示为

式中,是欧几里德距离,与(1)相同,nfi是边缘格簇的维数;

位于sk内的已经分配的目标点对ri有排斥作用;因此,式(2)中边缘格簇效益的排斥部分的表达式为

式中,的目标点位置,nri是相应的机器人数;的作用是防止ri无效率探索行为的发生,也就是防止更多的机器人向同一扇区移动;如果rj(i≠j)的移动目标点位于sk内,则ri在进入sk后能够探索的未知栅格数量减小的程度与rj的检测半径成正比,与ri的当前位置到rj目标点的距离成反比;如果有nri个目标位于sk,则边缘格簇效益的排斥部分可以表示为

式中,是从ri当前位置到rj目标位置的欧几里德距离;

s42、在合作探索阶段,ri将选择一个具有最大边缘格簇效益的扇区进行探索,该扇区的标号由下式确定

s43、在确定目标扇区之后,再确定目标点坐标,通过以下方式实现

s44、计算从sk的边缘格到ri当前位置的最短距离

如果式中并且该边缘格不是fcck的结尾,则式(7)表示的目标栅格应该被位置替换,式中

s45、更新多机器人系统的未完成任务列表;

(2)如果扇区内不存在边缘格簇,则机器人ri选择与其它机器人的目标点距离最远的独立的边缘格作为导航目标点;

s5、如果通信失败,则机器人ri强制转入自主探索工作模式,也就是机器人ri在选择目标点时不再考虑其它机器人的当前位置和当前的目标点;

s6、完成机器人ri的逻辑层建模:

机器人ri的探索进程用下面的有限状态自动机表示

gi={qi,∑i,δi,q0i}(10)

式中,qi为ri的状态集合,为ri的一个状态;∑i是一个字母表,它的元素如表1所示;代表部分转移函数,即σi发生后机器人的状态由qi转移到q′i,用公式表示就是q′i=δi(σi,qi),q0i是初始状态;

s7、在机器人ri的各个行为发生后,通过允许和禁止后续行为的发生,使机器人ri按闭环系统行为运行,实现自主与协商相结合确定目标点的探索工作模式;

s8、更新机器人ri的状态信息;

s9、整个环境是否探索完毕,如果未完成则转到s2;否则结束。

其中,每个机器人的协调体系的软件结构为分层结构,上层是前面描述的自动机和形式语言实现的离散事件监控系统,下层是运动控制系统。每个机器人的监控器具有相同的形式,这是一种完全分散的结构,没有中央控制器。

本发明提出的自主与协商相结合的多机器人协同探索技术首先降低了对多机器人系统中各个成员机器人硬件的要求,这样每个机器人的生产制造成本同时降低;另外,不同生产商、不同型号的机器人都可以加入到多机器人系统中,增加了机器人的通用性;自主模式的引入,避免了现有的所有多机器人都是工作在协商状态下的模式,使多机器人系统在不能保证不限距离、不限带宽通信的环境中得到了应用。

本发明将进一步拓宽多机器人系统的应用领域,有效替代人类在危险、有毒等环境中的作业,包括危险爆炸物的搜索与排除,地质灾害后生命的搜索与救援,月球及火星等外太空探索,放射性环境作业等。

附图说明

图1为本发明中边缘格与扇区划分示意图。

图2为本发明中基于边缘格簇效益的目标选择。

图3为机器人ri的期望逻辑行为k。

具体实施方式

为了使本发明的目的及优点更加清楚明白,以下结合实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

本发明具体实施提供一种自主与协商相结合的多机器人协同探索技术,其特征在于,n个异构移动机器人r1,...,rn通过结合自主与协商两种工作模式实现多机器人协同探索,每个机器人在进行环境探索的同时分别创建一个局部占有栅格地图;该技术包括如下步骤:

s1、全体机器人根据探索能力的强弱依次选择探索方向,使机器人在环境内充分展开;

s2、通过极坐标形式的由机器人ri的几何中心出发的若干射线将工作空间划分成若干个动态的扇区,任意两条相邻直线所构成的楔形区间内的环境部分称之为扇区,如图1所示,ri的周围环境被划分为4个扇区,它们分别称为s1、s2、s3和s4。扇区内的环境信息可以是已知的、未知的或部分未知的。所有扇区的夹角都是相同的,但是大多数扇区没有规则的几何形状,在图1中只有扇区s1的形状是等边三角形。ri的扇区是动态的,也就是它们根据相对于ri的当前位置定义的。

s3、机器人ri(i=1,...,n)对当前位置的四周环境进行扫描,然后根据扫描结果决定下一步的导航目标,分为三种情况:

(1)机器人ri检测到边缘格,则更新自身保存的未完成任务列表:具体的,如果机器人在探索过程中,在某个方向能够检测到最大数目的边缘格,并且在机器人该方向的扇区内没有其它机器人在进行探索,则该机器人对该扇区保持自主探索模式:如果机器人在探索过程中,在各个方向检测到的边缘格数目都小于能够检测到的最大边缘格数量,则调用通信程序,与其它机器人协商后确定导航目标点:其中,

ri在每移动一个单元格后都进行各个扇区的效益计算,如果在当前位置检测到扇区sk(k=1,…,4)中存在个边缘格,则由边缘格产生的sk的效益就是扇区内的边缘格数:

式中,pj(·)是ri到达时边缘格被覆盖的概率,是ri的移动目标点,是边缘格j的位置,是传感器检测范围:

(2)机器人ri没有检测到边缘格,则调用通信程序,与其它机器人协商后确定导航目标点:

(3)机器人ri检测到障碍物或其它机器人,调用避碰程序:

s4、机器人ri(i=1,...,n)与其它机器人通信确定导航目标点:如果没有检测到边缘格,则判断各个扇区内是否存在边缘格簇(frontiercellclusters,简称为fcc,它是彼此邻接的一系列边缘格,并且所有这些边缘格都位于sk内),分为两种情况:

(1)如果扇区内存在边缘格簇,则进行以下操作:

s41、首先,通过下式计算各个边缘格簇的效益

ri的扇区sk的边缘格簇效益可以表示为

式中,分别表示边缘格簇效益对机器人的吸引和排斥部分,ξ是加权系数;吸引部分由sk的fcck中所有成员产生,可表示为

式中,是欧几里德距离,与(1)相同,是边缘格簇的维数;

位于sk内的已经分配的目标点对ri有排斥作用;因此,式(2)中边缘格簇效益的排斥部分的表达式为

式中,的目标点位置,nri是相应的机器人数;的作用是防止ri无效率探索行为的发生,也就是防止更多的机器人向同一扇区移动;如果rj的移动目标点位于sk内,则ri在进入sk后能够探索的未知栅格数量减小的程度与rj的检测半径成正比,与ri的当前位置到rj目标点的距离成反比;如果有nri个目标位于sk,则边缘格簇效益的排斥部分可以表示为

式中,是从ri当前位置到rj目标位置的欧几里德距离;

s42、在合作探索阶段,ri将选择一个具有最大边缘格簇效益的扇区进行探索,该扇区的标号由下式确定

s43、在确定目标扇区之后,再确定目标点坐标,通过以下方式实现

s44、计算从sk的边缘格到ri当前位置的最短距离

如果式中并且该边缘格不是fcck的结尾,则式(7)表示的目标栅格应该被位置替换,式中

s45、更新多机器人系统的未完成任务列表;

(2)如果扇区内不存在边缘格簇,则机器人ri选择与其它机器人的目标点距离最远的独立的边缘格作为导航目标点;

s5、如果通信失败,则机器人ri强制转入自主探索工作模式,也就是机器人ri在选择目标点时不再考虑其它机器人的当前位置和当前的目标点;

s6、完成机器人ri的逻辑层建模:

机器人ri的探索进程用下面的有限状态自动机表示

gi={qi,∑i,δi,q0i}(10)

式中,qi为ri的状态集合,为ri的一个状态,例如,到达一个新的目标点,或者完成了与其它机器人队员的通信等;∑i是一个字母表,它的元素如表1所示;δi:∑i×qi→qi代表部分转移函数,即σi发生后机器人的状态由qi转移到用公式表示就是q′i=δi(σi,qi),q0i是初始状态;

s7、在机器人ri的各个行为发生后,通过允许和禁止后续行为的发生,使机器人ri按照图3所示的期望闭环系统行为运行,实现自主与协商相结合确定目标点的探索工作模式;具体的,ri实现协作探索时的期望行为k如图3显示,据此可以构造一个监督者来使闭环行为

l(s/gi)=k(11)

在每个监控周期内,ri的实际行为只是图3中所描述语言的一个子集。

由于每个机器人的探索模式和目标是一致的,所以能够开发一个通用和独立的监控器。为了描述ri的行为,将机器人动作和动作结果分别定义为事件,如表1所示。

表1字符表

为了实现期望的行为,引入若干可控事件对不可控事件发生后的结果进行处理。

检测周围环境的动作(α0)是可控的,即它的发生可以被监督器允许或禁止。然而,检测结果是不可控的,即结果可能是以下之一,检测到边缘格(α1),未检测到边缘格(α2),检测到障碍物或其它机器人(α3)。换句话说,这些结果事件不能被禁止发生。另外,两个机器人之间的通信成功(η1)或通信失败(η2),取决于环境和通信子系统的软件、硬件,而不取决于监督器,这两个事件也是不可控的。

下面介绍完成协同功能的事件。τ是状态更新事件,即到达目标栅格后,ri将当前状态更新这个目标栅格。因此,在式(10)中仅需要一个状态集合中的元素qi即可表示ri的位置。β1通过使式(1)立即效益最大化选择一个扇区作为运动目标。类似地,β2根据(6)选择一个具有最大边缘格簇效益的扇区作为目标扇区。β3代表ri根据有限的可用信息选择扇区的行为。必须说明的是,β1和β3从相邻栅格中选择目标点,β2根据未完成任务列表选择目标点。

在独立探索阶段,用形式语言描述的ri的行为是(α0α2β1λτ)*;在合作探索阶段,探索行为由两个字符串(α0α2η0η1β2λτ)*和(α0α2η0η2β3λτ)*组成,分别应对通信成功和通信失败的情况。

一般来讲,当ri向由(7)或(9)生成的目标移动时,不能保证对障碍物和其它机器人的避碰能力,原因是在边缘格簇效益计算中,排斥部分与吸引部分是融合在一起的。为了使ri能够可靠地躲避其它同伴机器人或障碍物,避碰行为(α0α3β4λτ)*包含在了期望的行为中,这个避碰行为具有最高的优先级。

在协调算法实现时,每个机器人都有自己的监督器,所以多机器人系统没有中央监控器。中央就避免了构成描述所有机器人行为的由自动机构成的积系统带来的状态爆炸。换言之,多机器人系统的监控协调是以分布方式实现的。另外,对于所有机器人而言,在独立探索阶段于合作探索阶段都不需要采样时刻的同步。

s8、更新机器人ri的状态信息;

s9、整个环境是否探索完毕,如果未完成则转到s2;否则结束。

本发明实施例中,每个机器人的协调体系的软件结构为分层结构,上层是前面描述的自动机和形式语言实现的离散事件监控系统,下层是运动控制系统。每个机器人的监控器具有相同的形式,这是一种完全分散的结构,没有中央控制器。图2说明了本发明中目标点选择策略的实施及其优越性,其中栅格的颜色含义与图1相同图中有25个边缘格和4个扇形区。在常规的方法中,这些边界栅格被认为是独立的任务,不论是基于距离的方法或基于时间的方法都将选择f4作为移动目标;虽然是最短距离,但f4不是ri的最优目标。显然,如果ri向上移动2个栅格将探索到3个边缘格,而如果它向下移动一个栅格,将只探索到一个边缘格。根据本发明中fcc的定义和图中的扇区划分,fcc1=φ,fcc2={f1,…,f3},fcc3={f5,…,f9},和fcc4={f4}。根据式(5)可以计算出这4个扇区的边缘格簇效益的结果分别为0,0.49,0.36和0.2。本发明提出的方法将根据式(6)和(8)分别选择s2和f2为目标扇区和目标点。

目标分配策略行为也包括禁止不希望的任务切换动作等,这是因为当机器人ri能够检测到边缘格的情况下,只有该机器人探索它本身检测到的边缘格,才不会增加无效的移动;如果ri投标并获得另外一个机器人rj(i≠j)检测到的边缘格作为它的移动目标点,这样将增加同时降低ri和rj的探索效率。

如果在机器人ri将要探索的区域存在另外的机器人,并且两个机器人的探索区域将重叠,ri将被重新分配一个新的目标;否则,ri在随后的探索中应该继续保持在自主探索情形。本项目所开发的监控器就是保持ri在最大效益检测情形并实时进行目标选择策略的切换。

此外,系统的通信流量集中在每一个拍卖周期内,通过对图1的分析可知,当ri在探索过程中能够实现最大效益检测时,用于选择任务的通信量是不需要的,因为ri不需要参与协商。

每个机器人的探索过程在固定的采样周期上由上级自动机进行评估和控制,这类似于采样控制系统的相应概念;不同的是,采样数据是从机器人和环境中采集的,采用周期由机器人移动一个单元格的时间确定。每个机器人的探索过程都将在采样周期由监控器进行监督和调整,以实现整个系统具有期望的行为。ri的行为模型用自动机(10)产生的形式语言表示为

l(gi)代表ri执行环境探索时的所有可能行为。为了实现期望的行为监控器存在的充分必要条件是k是前缀封闭且可控的,也就是满足等条件期望行为是根据赋予每个机器人的自主能力离线设计的。

每个机器人的协调探索是通过在每个采样时刻监控扇区效益或边缘格簇效益实现的,这样每个机器人的探索过程是若干自主探索阶段与若干协商探索阶段的相互交错构成。每个机器人根据传感器检测到的环境信息进行工作模式的切换,如果能够检测到未知区域就继续独立探索,否则就与其它机器人进行协商,进入合作探索模式。这里的采样周期小于协商周期。以上机器人的目标选择和移动模式的一个附带的优势是通信量在整个采用周期内分布。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1