基于自组织神经网络的多水下机器人任务分配方法及系统

文档序号：31388118发布日期：2022-09-03 01:53阅读：125来源：国知局

1.本发明属于多智能体系统协同控制领域，尤其涉及基于自组织神经网络的多水下机器人任务分配方法及系统。

背景技术：

2.水下机器人作为人类对海洋资源实现勘测、环境监测与信息收集等任务主要的工具之一，正在受到广泛的重视与应用。然而，对于单一的水下机器人由于其自身功能的限制，如机载资源有限、自带动力受限，在大部分情况下难以满足日益复杂的任务需求。与单一的水下机器人相比，多水下机器人作为新的应用形式出现，通过多水下机器人的协同工作，能够更方便、更快捷、更可靠地完成单个水下机器人无法独立完成的复杂系统任务。同时在大海域情况下，协同式的任务分配，可极大的提高任务完成效率与完成实践。在大规模任务场景中，水下机器人系统任务分配的优化效果直接影响系统的工作效率。因此，多水下机器人系统的任务分配问题已经成为水下机器人研究领域的热点问题。
3.水下机器人的任务分配即，如何在不确定海洋环境中将一组水下机器人针对多个目标进行任务分配和合理实施任务规划，这是多水下机器人系统一个极具挑战性的问题。多水下机器人任务分配是多水下机器人系统研究的一个热点问题，体现了水下机器人系统自组织形式运行机制，是多水下机器人系统目标实现的基础。一方面，随着大规模任务场景下，待分配任务规模的增大，任务复杂度的增加，现有的自组织神经网络收敛速度较慢，收敛时间较长。另外一方面，在有限资源的情况下，涉及到多水下机器人系统间的资源协调，负载均衡问题变得难以解决，需要合理分配任务负载以实现最大化系统工作能力。因此，设计一种适用于大规模任务场景且具有高效率、兼顾负载均衡的多水下机器人任务分配方法尤为关键。

技术实现要素：

4.本发明为了解决上述缺陷，提出了基于自组织神经网络的多水下机器人任务分配方法及系统。
5.为解决上述技术问题，本发明所采用的技术方案是：
6.基于自组织神经网络的多水下机器人任务分配方法，包括：
7.根据洋流影响、资源消耗、负载均衡和资源有限多重约束，构建多重约束的多异构水下机器人系统任务分配优化模型，其中，任务分配优化模型为自组织神经网络；
8.任务分配优化模型通过机器人路径点对应的神经元竞争与学习，完成任务分配，最终生成每个机器人所需的环形路径。
9.本方法的进一步改进在于：所述根据水下洋流影响、资源消耗、负载均衡和资源有限多重约束，构建多重约束的多异构水下机器人系统任务分配优化模型，其中，任务分配优化模型为自组织神经网络包括：
10.在构建多水下机器人系统任务分配优化模型时，首先考虑洋流的影响，综合考虑
机器人的速度和洋流速度；
11.根据每个机器人的能量消耗，将其路径分段考虑，在速度矢量和的情况下转化为计算其巡航时间以准确衡量其负载，同时其所需的巡航时间必须小于最大巡航时间；
12.以最小化水下机器人系统的资源消耗、最大化机器人系统的任务奖励获取为目标来构建适应度函数，建立任务分配优化模型。
13.本方法的进一步改进在于：所述任务分配优化模型通过机器人路径点对应的神经元竞争与学习，完成任务分配，最终生成每个机器人所需的环形路径包括：
14.每个机器人在初始时以其基地为中心点，生成若干个神经元以构成神经元环，神经元环上的神经元作为输出神经元参与到自组织神经网络的竞争与更新中，通过迭代学习，最终保留下可访问任务的神经元作为路径点，这些路径点构成环形路径，依次路径行进，则可完成所有分配的任务并最终返回到基地。
15.本方法的进一步改进在于：所述任务分配优化模型通过机器人路径点对应的竞争与学习的过程与特征如下：
16.参数初始化：设定自组织神经网络自身参数，参数包括学习率，邻域半径，迭代轮次，衰减系数与优化函数的参数；根据任务数量和机器人数量确定的输入输出神经元；
17.任务的输入：在每轮开始时，将任务顺序随机化处理，并依次输入到自组织神经网络，
18.获胜神经元选择与负载均衡机制：提出的速度合成法将行驶的路径转化为巡航时间的计算，准确衡量其负载，同时根据不同工作能力的机器人，提出负载均衡参数，作用于提出的获胜神经元选择机制中，通过机器人速度和洋流速度的速度合成法将行驶的路径转化为巡航时间的计算，准确衡量其负载，同时通过机器人的负载均衡参数，优化神经元选择机制；
19.神经元的更新：通过神经元增加机制和历史信息指导机制，得到高效的自组织神经网络，过程如下:
20.神经元增加机制过程：设定每个神经元的获胜参数其中，为神经元作为获胜神经元的次数，若参数大于等于阈值，则复制该神经元信息作为新神经元，原神经元设置对于新增加的神经元不参与对本次任务的更新；
21.神经元历史信息指导过程，将邻域神经元历史上作为利用的更新向量合成一个历史信息指导向量，作为额外的学习信息加入到本次的更新中，具体计算如下：
[0022][0023][0024][0025]
[0026]
其中，任务集合中的每个任务都在过去的更新中选择神经元ki作为获胜神经元，该任务与神经元元ki对应的距离为参数取决于该任务在该任务集合中顺序，权重参数ψ则为该历史信息指导向量的整体权重；
[0027]
神经元删除机制过程，在每个神经元环中，计算每个邻域神经元的累计误差，累计误差用于衡量神经元的映射能力；计算方式为对于每次作为邻域神经元更新时，其更新程度与获胜神经元的更新程度差别的累加和，然后除以作为邻域神经元的次数，然后计算本环的平均累计误差，将大于本环平均累计误差的神经元进行删除，具体公式为：
[0028][0029][0030][0031]
其中，任务集合中的每个任务都选择了神经元ki作为邻域神经元，则与分别决定了对于任务更新强度，该比值即反映了更新的误差，表明了作为邻域神经元时与获胜神经元更新能力的差异；神经元平均后得到的则全面反映了其更新能力。对于环上所有神经元更新能力误差的平均得到平均误差err
i,ave
。
[0032]
基于自组织神经网络的多水下机器人任务分配系统，包括：
[0033]
构建模块，用于根据洋流影响、资源消耗、负载均衡和资源有限多重约束，构建多重约束的多异构水下机器人系统任务分配优化模型，其中，任务分配优化模型为自组织神经网络；
[0034]
任务分配模块，用于任务分配优化模型通过机器人路径点对应的神经元竞争与学习，完成任务分配，生成每个机器人所需的环形路径。
[0035]
由于采用了上述技术方案，本发明取得的技术进步是：(1)考虑在洋流影响下，将机器人的能量消耗转为计算其巡航时间，提出任务完成率、负载均衡、资源有限等约束，建立了复杂的优化模型，与常见的任务分配优化模型相比，本发明建立的模型考虑的因素更全面，有利于提高机器人系统的工作效率；(2) 在利用自组织神经网络算法求解任务分配问题时，提出了神经元自布局机制，其中包括，神经元删除，神经元增加与历史信息指导机制来综合优化神经元种群的质量，同时改进原有的更新方式以实现不同学习阶段的开发与利用的平衡关系，从而提高求解效率；(3)在多机器人系统中，充分考虑机器人能耗的不同，在洋流的影响下准确的衡量其能量消耗，同时提出神经元获胜机制，从而实现负载均衡，可充分发挥不同工作能力的机器人，提高其连续工作时间。因此，本发明提出的基于自组织神经网络算法的任务分配方法具有求解速度快、求解精度高的优点，能在有限迭代次数内提供良好的任务分配方案，由其在复杂的大规模任务场景中，本发明所提出方法的优势更为明显。
附图说明
[0036]
图1为本发明的自组织神经网络结构图；
[0037]
图2为本发明方法的流程图；
[0038]
图3为本发明所提出的自组织神经网络算法流程图；
[0039]
图4为小规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的效用函数过程对比图；
[0040]
图5为中规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的效用函数过程对比图；
[0041]
图6为大规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的效用函数过程对比图；
[0042]
图7为小规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的神经元数量变化过程对比图；
[0043]
图8为中规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的神经元数量变化过程对比图；
[0044]
图9为大规模任务场景下，本发明方法与传统自组织神经网络som、平滑式自组织神经网络ssom和改进型自组织神经网络isom的神经元数量变化过程对比图。
具体实施方式
[0045]
下面结合附图对本发明做进一步详细说明：
[0046]
如图2所示，本发明主要包括以下几个步骤：
[0047]
⑴
建立多异构机器人任务分配系统模型
[0048]
构建任务分配场景，其中机器人集i＝{1,2,...,i,...,i}，任务(传感器)集 m＝{1,2,...,m,...,m}，其中i和m分别代表第i个机器人和第m个任务，i和m分别代表机器人和任务的数量。每个任务都需要被机器人执行，即机器人需要获取每个传感器的数据。所有机器人共同执行任务，在完成分配的任务后回到其所属的基地。为验证本发明所提出方法的广泛适用性，我们设置了三种不同规模的任务场景，小规模、中规模和大规模任务场景。在任务场景中，任务随机分布，机器人有固定的基地点，各场景规模、任务数量、机器人数量、基地及对应的最大巡航时间如表3所示。
[0049]
表3
[0050][0051]
⑵
构建具有多重约束的多机器人系统任务分配优化模型
[0052]
本发明考虑在洋流影响下，多机器人系统资源有限、负载均衡以及任务访问要求的基础上构建了综合考虑海洋环境、机器人系统资源消耗和负载均衡的优化模型。
[0053]
①
将多机器人任务分配问题转化为具有多重约束的优化模型。在水下作业环境中，洋流的影响不可避免，因此机器人的耗能既取决于其行驶路程长短也取决于其航向。本发明中提出的方法为通过速度合成机器人的速度和洋流的速度，计算在行驶路程上所耗费的时间作为机器人的耗能，提出的耗能公式定义为：
[0054][0055][0056]
其中为机器人的速度矢量，为洋流的速度矢量，为速度矢量和，指向当前的目标方向，为当前的距离，因此c
ki,m
为当前路径对应的时间消耗。
[0057]
对于机器人i，可将其在执行任务过程中的路径分为不同的路径点，因此这些路径点可组成一个环形路径，同时其相邻的路径点之间保持相同的航向，其速度为上述的速度矢量和，则该机器人在执行分配的任务时耗能可计算为：
[0058][0059]
其中k'i＝{1'i,2'i,...,k'i,...k'i},i∈i为机器人i的所有路径点，而路径点1'i与路径点 k'i都为该机器人的基地点，保证在执行任务后返回基地。
[0060]
对于机器人i，由于其所带的消耗性能量有限，因此在任务分配中，其耗能不可大于其最大工作能力，表示为：
[0061][0062]
为其最大巡航时间。
[0063]
对于任务m∈m，其具有奖励值为.通信半径为rm，当且仅当机器人与任务的距离小于通信半径时，可成功传输数据，并可获得对应的任务奖励值。因此对于机器人系统，执行完任务以后，建立其优化模型为：
[0064][0065]
其中α与β分别为系数，可根据实际情况调整，如公式(4)所定义的，fi为机器人i所获得任务奖励和，ci为机器人i所消耗的成本。在上述约束和目标函数的基础上，建立多机器人任务分配的优化模型。在该模型中，通过最小化能耗消耗函数值、最大化任务奖励值保证机器人系统在资源消耗最小的情况下获得最大的任务奖励值，同时符合能耗的约束。
[0066]
⑶
利用基于增强型自组织神经网络的算法对构建的优化模型进行求解
[0067]
本发明所提出的基于增强型自组织神经网络的算法简单流程图如附图3所示。
[0068]
①
神经网络参数初始化
[0069]
参数初始化主要包括两部分：首先是神经网络自身参数的输入与设定，主要包括学习率，邻域半径，迭代轮次，衰减系数与优化函数的参数。另一部分为根据任务数量和机器人数量确定的输入输出神经元，在本发明中，将每个任务作为一个单独的输入的神经元，每个机器人对应一个输出神经元环，总输出神经元数量等于任务数量，则根据总机器人数量均分初始输出神经元数量。本发明中采用的各项参数具体值见表4。
[0070]
表4
[0071]
参数学习率μ邻域半径σ邻域衰减系数a最大迭代轮次tαβ数值0.60.1m0.02503-1
[0072]
其中初始学习率为0.6，从第二轮迭代开始学习率为迭代轮次为所有任务输入一次作为一轮，邻域半径变化关系为σ＝σ(1-t a)。
[0073]
②
任务的输入
[0074]
对于给定的任务场景，在每轮开始时，将任务顺序随机化处理，以避免陷入局部极值。输入当前顺序第一个任务，更新以后将已输入任务序号删除，根据上述定义当本轮所有的任务输入一次后，本轮结束。
[0075]
③
获胜神经元选择与负载均衡机制
[0076]
在多机器人系统间，机器人工作能力不同，所处的基地位置不同，可能造成部分机器人过早耗尽自己的能量，而部分机器人难以获得任务，导致该机器人系统间负载不均衡，同时不均衡的负载会延长任务完成时间。因此考虑在洋流影响下，提出可以针对工作能力非均质化的机器人实行负载均衡。
[0077]
·
衡量真实能力消耗
[0078][0079][0080]
如上所示，考虑了洋流速度和机器人航向的和速度，在对应的路程下，计算机器人已消耗的工作能力较其余研究中的距离计算更加全面且准确。
[0081]
·
负载均衡参数
[0082]
由于机器人系统间各机器人工作能力的不同，负载均衡的关键是工作能力高的机器人执行较多的任务，工作能力低的机器人执行较少的任务，既负载情况正比于其工作能力。因此提出负载均衡参数，如下：
[0083][0084]
·
获胜神经元选择机制
[0085][0086][0087][0088]
其中，距离表示的属于机器人i上的输出神经元ki与当前任务的距离，而的方向为当前位置指向目标位置。因此在获胜神经元选择过程中，不仅考虑了神经元与任务的距离，同时考虑机器人的工作能力，在负载均衡参数的作用下，机器人工作能力的差异被解决，从而实现真正的按工作能力分配任务。
[0089]
④
神经元的更新
[0090]
在更新过程中，提出了神经元增加机制和历史信息指导机制。其中神经元增加机制是为了实现输出神经元种群的快速更新，从而引入高质量的神经元加速算法的迭代与收敛。而历史信息指导机制则为更新的邻域神经元增加额外的更新信息，从而在其更新过程中实现算法开发与利用的均衡。具体如下：
[0091]
·
神经元增加机制
[0092]
自组织神经网络算法就是将输入神经元输入，输出神经元不断调整最终达到对输入神经元的准确映射。根据上述的获胜神经元选择机制，对于获胜神经元，表明其是当前神经元种群中具有最高映射准确性的，但是更新机制使其更新到更高价值的映射点处，当前的映射位置虽然价值依旧很高但是被放弃了，因此提出神经元增加机制以优化神经元种群，实现如下：
[0093]
给每个获胜神经元赋予参数记录其作为获胜神经元的次数，达到则复制该神经元信息作为新神经元，原神经元设置对于新增加的神经元不参与对本次任务的更新。
[0094]
·
邻域神经元的选择与确定
[0095][0096][0097]
距离为获胜神经元与所属同一个神经元环上的神经元的距离，按照公式，当该距离小于邻域半径时被选为邻域神经元，大于该距离时不参加本次的更新，其中为更新强度，因此距离火神神经元越远的邻域神经元其更新强度越低。
[0098]
·
历史信息指导机制
[0099]
对于邻域神经元，其随着获胜神经元的更新由于强度没有获胜神经元大，因此在算法的整体中是增强神经元种群的扩散已探寻更好的映射位置，因此获胜神经元的更新为利用而邻域神经元的更新主要目的为开发。但对于邻域神经元，其可能在之前的更新中作为获胜神经元进行更新，但本次作为邻域神经元的更新是忽视了之前的更新，从而可能造成其更新的混乱，影响其原作为开发的更新。基于此，本发明提出历史信息指导机制，将邻域神经元历史上作为利用的更新向量合成一个历史信息指导向量，作为额外的学习信息加入到本次的更新中。具体计算如下：
[0100][0101][0102][0103]
其中任务集合中的每个任务都在过去的更新中选择神经元ki作为获胜神经元，因此该任务与神经元元ki对应的距离为参数取决于该任务在该任务集合中顺序，所有任务依据时许顺序排序，因此越是最近的任务其权重系数越大，符合当前更新的趋势，权重参数ψ则为该历史信息指导向量的整体权重，可以看出来随着迭代轮数的增加，该权重参数逐渐增加，这样的趋势符合算法前期侧重于开发而逐渐过度到注重于利用的特点。
[0104]
·
神经元的更新
[0105]
基于上述提出的历史信息指导机制，提出获胜神经元的更新于邻域神经元的更新公式分别如下：
[0106]
[0107]
基于提出的更新公式更新后，对于当前任务的输入的响应完成，接着按照任务顺序输入下一个任务，重复次迭代过程。
[0108]
⑤
神经元删除机制
[0109]
在任务集合中的所有任务输入一次后，本轮迭代完成。根据输出神经元在本来更新中的角色，可将所有输出神经元分为三类：静止神经元、仅作为邻域神经元和获胜神经元。为提高算法的迭代效率与学习能力，需要对神经元种群进行优化。提出的神经元删除机制为，首先删除所有的静止神经元，这些神经元不参与更新，表明毫无价值。对于获胜神经元由于其高价值全部保留。对于邻域神经元的删除标准具体为：在每个神经元环中，计算每个邻域神经元的累计误差，累计误差用于衡量神经元的映射能力，计算方式为对于每次作为邻域神经元，其更新时与获胜神经元的差别的累加和然后除以作为邻域神经元的次数，然后计算本环的平均累计误差，大于平均累计误差的神经元进行删除，具体公式为：
[0110][0111][0112][0113]
任务集合中的每个任务都选择了神经元ki作为邻域神经元，则与分别决定了对于任务更新强度，该比值即为更新的误差，表明了作为邻域神经元时与获胜神经元更新能力的差异。对于每个神经元平均后得到的则全面反映了其更新能力。对于环上所有神经元更新能力误差的平均得到平均误差err
i,ave
，从而根据公式确定需要删除的神经元。
[0114]
在提出的神经元删除机制下，神经元映射能力被量化衡量，从而保证了只有低价值神经元被删除，邻域神经元中具有较高价值的神经元同时被保存下来，既不会导致神经元种群大规模减少，又合理高效的优化了神经元种群的质量，从而在提高算法效率的同时较低了冗余神经元带来的计算负担。
[0115]
⑥
仿真
[0116]
在本发明中，我们提供了一种基于增强型自组织神经网络的任务分配方法，其中任务的通信半径为{1,2,3}中任意值，任务奖励为30≤θm≤80，其余仿真中各项参数如上所示。为评估算法的收敛速度与负载均衡效果，我们进行了大量蒙特卡洛仿真实验。表1为三种规模任务场景下，本发明方法与传统自组织神经网络(som)、平滑式自组织神经网络(ssom)和改进型自组织神经网络(isom) 的仿真结果数据对比表。图4为三种规模任务场景下，本发明方法与som、ssom 和isom的效用函数过程对比图。图5为三种规模任务场景下，本发明方法与som、ssom和isom的神经元数量变化过程对比图。
[0117]
表1 仿真结果数据对比表
[0118][0119]
表2为三种规模任务场景下，本发明方法多机器人系统间负载均衡情况对比表。
[0120]
表2 负载均衡情况对比表
[0121][0122]
通过仿真结果可以看出，无论是从收敛速度，仿真时间还是任务分配率上，与常用的任务分配方法(som、ssom和isom)相比，本发明所提出的任务分配方法都具有更高的性能，同时本发明可在具有不同工作能力的机器人之间实现良好的负载均衡。
[0123]
改进的增强型自组织神经网络具体的实施过程概括如下:
[0124]
(1)初始化算法参数，输入任务与机器人信息，同时以每个机器人的基地为中心构建一个输出神经元组成的环。
[0125]
(2)任务顺序随机，从随机后的任务顺序依次输入。
[0126]
(3)不同机器人的输出神经元进行竞争，根据提出的获胜规则选择最优者成为获胜神经元，提出的获胜规则可实现负载均衡，无论机器人系统间的巡航时间是相同还是不同。
[0127]
(4)对于获胜神经元，衡量其获胜次数，若符合提出的复制标准，即成为获胜神经元的次数与提出的复制标准相同时，复制该神经元，但在本次更新中，该复制得到的新神经元不进行更新，同时原获胜神经元获胜次数清零。
[0128]
(5)根据获胜神经元所属，确定其对应的机器人所属的神经元环，通过领域公式确定其邻域神经元，对于邻域神经元，提出历史信息指导机制，从而指导其更新。
[0129]
(6)根据提出的邻域更新公式，更新获胜神经元与其邻域神经元。
[0130]
(7)更新完成后，对于该任务的更新完成，依次输入下一个任务，直至任务全部输入一次，本输入纪元结束。
[0131]
(8)对于每个机器人对应的神经元环上的神经元进行选择性删除。具体删除标准为:首先删除本轮中的静止神经元，对于参与过更新的邻域神经元，计算其累计误差，与该环上所有邻域神经元的平均累计误差，将大于平均累计误差的神经元进行删除。
[0132]
(9)重复输入任务以继续更新迭代，直到满足迭代终止条件。
[0133]
综上所述，本发明是一种基于增强型自组织神经网络的任务分配方法，针对水下环境约束、机器人本体设计制约和大规模任务场景限制，构建具有负载均衡、资源有限等多重约束的优化模型；针对现有优化算法在求解复杂优化问题时的求解精度不足、求解速度过慢的问题，设计了改进的自组织神经网络，通过合理地优化种群质量，丰富神经元学习信息来提高算法的效率，使其无论在小规模任务场景还是大规模任务场景中都能快速、高精度的求解，满足系统任务需求。同时对于洋流的影响，提出速度合成方法，将路径转为巡航时间从而合理衡量不同机器人的负载，同时实现了良好的负载均衡。
[0134]
以上所述的实施例仅仅是对本发明的优选实施方式进行描述，并非对本发明的范围进行限定，在不脱离本发明设计精神的前提下，本领域普通技术人员对本发明的技术方案做出的各种变形和改进，均应落入本发明权利要求书确定的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：韩松张涛李鑫滨于海峰
技术所有人：燕山大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。