一种用于多机器人多任务协作工作的智能优化方法和系统与流程

文档序号：18706233发布日期：2019-09-17 23:45阅读：215来源：国知局

本发明涉及机器人协同优化技术领域，尤其涉及一种用于多机器人多任务协作工作的智能优化方法。

背景技术：

随着社会经济的发展和科学技术的进步，智能机器人已经逐步实现多机器人执行多任务协调工作。

让多机器人之间具备一定信息交互机制相互协同工作或者中央控制器协同控制多机器执行多个任务时需要建立一种用于多机器人多任务协作工作的智能优化方法。该方法在复杂的环境下也能够较为高效地使多机器人快速决策最优的任务规划方案来完成多项任务。

该方法在目前的研究具备一定的创新性，目前如专利申请cn201811014007提供一种基于云平台下多机器人协作的方法及操作系统，专利申请cn201810211742基于ukf框架提高一种适应于时变串行通信拓扑的多机器人分布式协作定位方法，专利申请cn201811077944提供了一种基于强化学习的多组机器人协作控制方法及系统。目前研究缺少针对多机器人执行多任务的方案进行优化来提高工作的效率的方法，需要提供一种用于多机器人多任务协作工作的智能优化方法。

因此为丰富相关领域的算法研究，以科学的方法解决市场中多机器人协作工作效率低、服务质量差的问题，设计了智能优化方法。

技术实现要素：

有鉴于此，本申请提供一种用于多机器人多任务协作工作的智能优化方法和系统。

本申请是通过如下技术方案实现的：

一种用于多机器人多任务协作工作的智能优化方法，该方法应用于智能优化系统中，该方法包括如下步骤：

步骤1，进行多机器人多任务协作工作环境的初始化；

步骤2，设定工作环境区，以机器人充电位置处为机器人起始出发点和完成任务后的路径终点，设定需要完成的工作任务以及完成任务所在的环境位置，所有机器人均在一个起始出发点出发，去完成任务集合n∈{1，……，n}，其中n为大于1的正整数；

步骤3，设定所有机器人的状态；

步骤4，设定系统优化所需的基本参数；

步骤5，输入运动环境信息；

步骤6，确定能够完成所有工作任务的所需机器人的初始数量；

步骤7，将机器人数量r、工作环境区涉及的信息参数、机器人状态信息参数、系统优化所需参数以及运动环境信息参数输入到所述智能优化系统中，所述智能优化系统根据优化模型获取任务规划方案，若获取的任务规划方案为最优，则执行步骤9，若获取的任务规划方案不是最优，则执行步骤8；

步骤8，增加一个机器人，派遣r+1个机器人去执行上述多任务，返回执行步骤7，以获取最优的任务规划方案；

步骤9，输出当前获取的任务规划方案，结束。

进一步的，所述步骤2中还包括：

所述任务集合中的每一项任务分别需在各个任务位置点完成，任务位置点集合i∈{1，…，i，…，x}；

每一个所述任务位置点都具有对应的需求时间窗，设定在任务位置点i所需完成di项工作任务(∑idi＝n)，设定在任务位置点i完成工作所需的时间ti，该时间由之前完成任务所需的时间估算得到，在任务位置点i完成工作具有需求时间窗[qi,pi],在任务位置点i所需完成的工作任务是在时刻qi后开始执行，在时刻pi前要执行完任务。

进一步的，其特征在于，在所述步骤3中，所述设定所有机器人的状态，具体包括：

设定机器人的总数量为r，设定机器人的移动速度为v，设定使用每一个机器人的固定成本为g，设定机器人一次最多完成的任务数量为q。

进一步的，在所述步骤4中，设定系统优化所需的基本参数，具体包括：

计算的时间惩罚成本，若机器人在工作任务需求时间窗提前到达了该任务位置所产生的惩罚成本系数为c1，同时若机器人在工作任务需求时间窗之后才到达了该任务位置产生的惩罚成本系数为c2，根据任务的性质及其重要性，设定合理的c1、c2；所以第r个机器人，其中r∈{1，……，r}，从起始出发点出发到达第i个任务位置点时的时间为l(i,r)，mi(sir)表示产生的时间惩罚成本，通过如下公式计算：

其中，mi(sir)为第r个机器人从起始出发点出发到达第i个任务位置点时产生的时间惩罚成本，其中r∈{1，……，r}；

c1为机器人提早到达产生的惩罚成本系数；

c2为机器人迟到到达产生的惩罚成本系数；

l(i,r)为第r个机器人从起始出发点到达任务位置点i的时间，qi为i任务位置点的任务的需求时间的起始时刻，pi为i任务位置点的任务的需求时间的结束时刻。

进一步的，在步骤5中，所述输入运动环境信息，具体包括：

设定完成任务所在的环境任务位置点i到另一个完成任务所在的环境任务位置点j的距离为s(i,j)，设定从任务位置点i到任务位置点j的运动时间为t(i,j)，该时间t(i,j)通过如下公式计算：

其中v是机器设定的运动速度。

进一步的，在所述步骤6中，所述初始数量通过如下公式计算：

其中，r为机器人的初始数量，完成的任务总数量为n,设定机器人最多一次完成的任务数量为q，int()为取整函数。

进一步的，根据优化模型获取任务规划方案，具体包括：

所述优化模型通过如下公式计算：

其中，z为所述优化模型的评价函数值，z包括机器人在各个任务位置点间移动的运动时间成本，机器人去到各个任务位置点后产生的时间惩罚成本mi(sir)以及使用机器人产生的固定成本g；

ai,j,r用于指示是否需要第r个机器人从任务位置i运动到任务位置j的参数

其中，当ai,j,r取值为1时，表示第r个机器人需要从任务位置i运动到任务位置j，当ai,j,r取值为0时，表示第r个机器人不需要从任务位置i运动到任务位置j。

设定bi,r表示任务位置点i的任务是否由第r个机器人完成，

其中，当bi,r取值为1时，表示任务位置点i的任务是由第r个机器人完成，当bi,r取值为0时，表示任务位置点i的任务不由第r个机器人完成；

并且满足，其中，

进一步的，根据优化模型获取任务规划方案还包括：

初始出发点视为第一任务位置点，每个机器人都是从初始出发点出发，最后又回到初始出发点，即满足

在工作时每个机器人最多到每个任务位置点1次，且在该任务位置点完成任务后就离开，即满足以及

进一步的，根据优化模型获取任务规划方案还包括：

确定在任务位置点i由机器人r完成的任务量，设定为fi,r，获取机器人一次最多完成的任务数量q，

确定的任务方案会保证所有任务点的任务都被完成，在任务位置点i所需完成di项工作任务，其中∑idi＝n，则

机器人由任务位置点i到达任务位置点j的时间由下式确定：

sjr＝ai,j,r×(sir+wi,r+t(i,j)+ti)；

其中，sjr为第r个机器人到达任务位置点j的时间，ai,j,r为是否由第r个机器人到从任务位置点i到任务位置点j，sir为第r个机器人到达任务位置点i的时间，wi,r为机器人r满足任务位置点i的时间窗口约束而在任务位置点i等待的时间，t(i,j)为从位置i到位置j的运动时间。

一种用于多机器人多任务协作工作的智能优化系统，该智能优化系统包括：

处理器；以及

存储指令的存储器，所述指令在由处理器执行时使处理器实现如权利要求1至9之一所述智能优化方法。

与现有技术相比，本发明的优点在于：计算模型简单、效率高，在复杂的环境下也能够较为高效地使多机器人快速决策最优的任务规划方案来完成多项任务。本发明方法简单、科学且可靠。

附图说明

图1为本发明的优化方法的流程示意图；

图2为本发明的场景应用示例图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

下面将结合附图和实例对本发明作进一步的详细说明。

图1为本发明的优化方法的流程示意图，图2为本发明的场景应用示例图。本发明提供的用于多机器人多任务协作工作的智能优化方法包括如下步骤：

步骤1，进行系统环境初始化；

所述初始化包括设定工作区域的栅格化的环境地图，预留存储空间，进行后续任务集合，位置点集合等信息的输入等初始预处理工作。

步骤2，设定工作环境区，以机器人充电位置处为机器人起始出发点和完成任务后的路径终点，设定需要完成的工作任务以及完成任务所在的环境位置，所有机器人均在一个起始出发点出发，去完成多项任务(设定任务的数量为n，设定任务集合n∈{1，……，n})，任务分别需在各个任务点完成(设定任务位置点的数量为x-1，设定任务点位置集合i∈{1，…，i，…，x-1})，那么将初始出发点也视为一个任务位置点，则任务点位置集合i∈{1，…，i，…，x}。每一个任务位置点都具有对应的需求时间窗,设定在位置i所需完成di项工作任务(∑idi＝n)，设定在位置i完成工作所需的时间ti,该时间由之前完成任务所需的时间估算得到,在位置i完成工作具有需要时间窗[ai,bi],在位置i所需完成的工作任务是在时刻ai后开始执行，在时刻bi前要执行完任务；

步骤3，设定所有机器人的状态，设定机器人的总数量为r，设定机器人的移动速度为v，设定去使用每一个机器人的固定成本为g，设定机器人最多一次完成的任务数量为q；

步骤4，设定系统优化所需的基本参数，包括计算的惩罚成本，若机器人在工作任务需求时间窗提前到达了该任务位置所产生的惩罚成本系数为c1，同时若机器人在工作任务需求时间窗之后才到达了该任务位置产生的惩罚成本系数为c2，根据任务的性质及其重要性，设定合理的c1,c2。所以第r个机器人(r∈{1，……，r})从起始出发点出发到达第i个位置时的时间为l(i,r)，时间l(i,r)是经过考虑各种复杂因素测试选取的合理时间值，mi(sir)表示其产生的时间惩罚成本，满足一下公式：

式中，mi(sir)为第r个机器人(r∈{1，……，r})从起始出发点出发到达第i个位置时产生的时间惩罚成本；c1为机器人提早到达产生的惩罚成本系数；c2为机器人迟到到达产生的惩罚成本系数；l(i,r)为第r个机器人从起始出发点到达位置i的时间，ai为i位置的任务的需求时间的起始时刻，bi为i位置的任务的需求时间的结束时刻；

步骤5，输入运动环境信息，设定完成任务所在的环境位置i到另一个完成任务所在的环境位置j的距离为s(i,j)，设定从位置i到位置j的运动时间为t(i,j)，该时间t(i,j)并不简单的设定为：(其中v是机器设定的运动速度)，因为考虑到需动态壁障和复杂的现实环境与实际状态，该时间具有不确定性，但是为经考虑多种复杂因素多次测试从位置i站点到位置j站点的时间统计得到的均值视为其运动时间.

步骤6，确定可完成所有工作的所需机器人的初始数量,由以下公式获取；

式中，r为机器人的初始数量，完成的任务总数量为n,设定机器人最多一次完成的任务数量为q，int()为取整函数，即得到整数部分。

系统优化的基本参数是步骤4所指的提前到达时间惩罚成本系数和延后到达时间惩罚系数。

优化过程：利用8所述优化模型，给定参数ai,j,r，即是否第r个机器人从任务位置i运动到任务位置j的参数，和给定参数bi,r，即任务位置点i的任务是由第r个机器人完成两个参数给定就是把所有机器人完成所有任务的计划表指定了，然后会得出在该计划表计算的优化模型评价函数值，不断穷举搜索满足约束的两个参数值ai,j,r和bi,r，找到最小的z,评价函数值z越小方案越优。

优化模型包括：

优化模型评价函数：

式中：z为该优化模型的评价函数值，z包括机器人在各个任务位置点间移动的运动时间成本，机器人去到各个任务位置点后产生的时间惩罚成本以及使用机器人产生的固定成本。该优化模型的评价函数值z越小方案越优。

ai,j,r表示是否需要第r个机器人从任务位置i运动到任务位置j的参数，

然后初始出发点视为第一任务位置点，要保证每个机器人都是从初始出发点出发，最后又回到初始出发点，即满足

同时在工作时保证每个机器人最多到每个任务位置点1次，且在该任务位置点完成任务后就离开，即满足以及

在第r个机器人从任务位置i运动到任务位置j，由于每个任务位置点是多个任务需要完成，已经设定了在任务位置点i所需完成di项工作任务(∑idi＝n)，所以有可能多个机器人在同一个任务位置点分别完成其中几项，所以设定bi,r表示任务位置点i的任务是否由第r个机器人完成，

那么，

因为每一个任务位置点至少被访问一次，所以

任务方案还会确定在任务位置点i由机器人r完成的任务量,设定为fi,r,在步骤3中以及获取了机器人最多一次完成的任务数量为q，所以确保机器人一次完成的任务数量不超过最大可完成数量；

确定的任务方案会保证所有任务点的任务都被完成，根据步骤2输入的在位置i所需完成di项工作任务(∑idi＝n)，那么

考虑到机器人r去满足了在任务位置i的一个时间窗口的约束，有可能其会在任务位置i等待一段时间，设置其为wi,r,然后综合所有因素，机器人由任务位置点i到达任务位置点j的时间(注意将起始出发点也视为第一个任务位置点，则也包括起始出发点到第一个任务位置点的时间)可由下式确定：

sjr＝ai,j,r×(sir+wi,r+t(i,j)+ti)

式中，sjr为第r个机器人到达任务位置点j的时间，ai,j,r为是否由第r个机器人到从任务位置点i到任务位置点j，sir为第r个机器人到达任务位置点i的时间，若第一个点时起始位置点，i为起始位置，那么sir为最初的起始时间，wi,r机器人r满足任务位置i的时间窗口的约束，有可能在任务位置i等待的时间，t(i,j)为从位置i到位置j的运动时间，该时间t(i,j)并不简单的设定为：(其中v是机器设定的运动速度)，因为考虑到需动态壁障和复杂的现实环境与实际状态，该时间具有不确定性，但是为经考虑多种复杂因素多次测试从位置i站点到位置j站点的时间统计得到的均值视为其运动时间，ti在位置i完成工作所需的时间,也是考虑到任务情况的不同，该时间由之前完成对应任务所需的时间估算得到。t(i,j)与ti考虑到时间不确定性，将充分得到多条件的测试以及历史经验的矫正获取合理科学的数值。

最优规划方案是使得求解的优化模型的评价函数值z最小的的结果值，参数ai,j,r，即是否第r个机器人从任务位置i运动到任务位置j的参数，参数bi,r，是即任务位置点i的任务是由第r个机器人完成，这两个参数把所有机器人和所有任务的完成计划表确定了。

步骤8，增加一个机器人，派遣r+1个机器人去执行上述多任务，返回执行步骤7，以获取最优的任务规划方案；

步骤9，输出当前获取的任务规划方案，结束。

本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序来指令相关硬件完成，所述程序可以存储于计算机可读存储介质中，如只读存储器、磁盘或光盘等。可选地，上述实施例的全部或部分步骤也可以使用一个或多个集成电路来实现，相应地，上述实施例中的各模块/单元可以采用硬件的形式实现，也可以采用软件功能模块的形式实现。本发明不限制于任何特定形式的硬件和软件的结合。

需要说明的是，本发明还可有其他多种实施例，在不背离本发明精神及其实质的情况下，熟悉本领域的技术人员可根据本发明作出各种相应的改变和变形，但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴新开;霍向;马亚龙;宋涛;何山
技术所有人：北京洛必德科技有限公司
我是此专利的发明人

上一篇：锂离子电容器的制作方法
上一篇：钻地下斜孔定位的直角三角形法的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。