路径规划方法和系统、电子设备及可读存储介质与流程

文档序号:32991833发布日期:2023-01-17 23:36阅读:26来源:国知局
路径规划方法和系统、电子设备及可读存储介质与流程

1.本发明涉及路径规划领域,尤其涉及一种路径规划方法和系统、电子设备及可读存储介质。


背景技术:

2.海洋占据了地球70%的空间,其中蕴含了无法估量的资源,各国对于海洋资源的探索与开采也愈发的重视。但人类是无法直接潜入深海海底进行资源的探索以及信息的收集。随着现代技术的发展,人们开始使用水下的智能机器人(auv)来代替人类潜入海底完成操作作业。
3.由于操作机器人在水底执行任务时,受到燃料或是电力能源容量的限制,作业时间无法持续过久,因此能够根据水底环境的实际情况,快速找到一条短路径,对于完成一次下潜操作任务是至关重要的。
4.目前已经有许多成熟的路径规划算法被提出使用,常用的有:
5.人工势场法(apf),类比于自然界中的电势场和重力势场,人工构建一个起点、终点以及途径障碍物势场的机制,利用整个配置空间上的势函数来指导机器人的运动。是一种效果良好的局部路径规划解决方案。但是容易陷入局部极小,出现无法规划出完整路径的问题,对于势力场的建立,单纯的依靠限制范围无法得到很好的解决。
6.基于采样的算法,如概率路线图(prm)和快速随机探索树(rrt),但是prm的效果不稳定,且在进行规划前需要提前对路标做准备。rrt相比prm,路径规划的能力更强,采用树叶般随即生长的方式,对状态空间采样点不断进行碰撞检测,能够快速且有效的探索状态空间。快速随机探索树(rrt)以及对于rrt的各种改进方法,凭借基于随机采样的规划方法,采用树叶般随即生长的方式,对状态空间采样点不断进行碰撞检测,探索状态空间。快速随机探索树(rrt)以及对于rrt的各种改进方法,均对初始解敏感,且对最优解的收敛缓慢,导致在寻找最优路径时需要消耗大量的内存和时间,而且生成的路径不一定是最优的,采样的分布很大程度决定了规划的性能。
7.基于网格的算法包括a*和d*,静态路网中求解最短路径最有效的直接搜索方法,算法中的距离估算值与实际值越接近,最终搜索速度越快。如果存在最优路径,则可以保证找到最优路径。但其时间成本和内存消耗和规划范围大小以及状态空间维度成正比,范围越大,状态空间维度越高,则时间以及内存消耗会成倍的增加。性能无法满足水下操作机器人复杂动态的环境。


技术实现要素:

8.本发明提供一种路径规划方法和系统、电子设备及可读存储介质,用以解决现有技术中存在的技术缺陷。
9.本发明提供一种路径规划方法,包括:
10.获取地图和机器人特征属性;
11.将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
12.基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
13.根据本发明所述的路径规划方法,所述获取地图和机器人特征属性包括:
14.获取以像素点描述每个自由空间的二维地图和机器人特征属性,所述机器人特征属性包括:机器人的属性包括机器人步长以及机器人与障碍物之间的间隔距离。
15.根据本发明所述的路径规划方法,所述神经网络模型的损失函数为每个像素位置的预测概率和真实标签的交叉熵,所述交叉熵是所述地图上所有可能位置的总和,所述损失函数为:
16.l=∑ce(o,g)+λce(i,r)
17.其中,λ是权衡重建损失的参数,o表示预测概率图像,g表示真实概率图像,ce表示cross-entropy交叉熵函数,i表示input输入,r表示真实标签。
18.根据本发明所述的路径规划方法,所述将地图和机器人特征属性输入至神经网络模型,输出预测的采样分布之前,包括:
19.获取一随机数;
20.当所述随机数大于第一预设值,选取rrt*算法的随机采样器作为采样器;
21.当所述随机数不大于第一预设值,选取所述神经网络模型对应的采样器作为采样器。
22.根据本发明所述的路径规划方法,基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径包括:
23.在所述预测的采样分布结果中选取预测概率大于第二预设值的采样点;
24.基于预测概率大于第二预设值的采样点,利用rrt*算法确定地图中的最优路径。
25.根据本发明所述的路径规划方法,所述基于预测概率大于第二预设值的采样点,利用rrt*算法确定地图中的最优路径,包括:
26.s1、将预测概率大于第二预设值的采样点中产生一个随机点xrand;
27.s2、在随机生长树上找到与随机点xrand最近的节点xnearest,连接xrand与xnearest形成第一路径;
28.s3、以xrand为中心,ri为半径,在所述随机生长树上搜索节点,找出潜在的父节点集合;
29.s4、将潜在的父节点xpotential_parent作为父节点时,将xpotential_parent与xrand连接起来形成第二路径,计算出所述第二路径的代价;
30.s5、将所述第二路径的代价与第一路径的代价作比较;
31.s6、若所述第二路径的代价更小,则进行碰撞检测;
32.s7、若碰撞检测失败,该潜在的父节点xpotential_parent不作为新的父节点,将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4;
33.s8、若所述第二路径路径代价更大,则将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4;
34.s9、若碰撞检测通过,则将潜在的父节点xpotential_parent加入到随机生成树中,确定出地图中的最优路径的路径点;
35.s10、判断是否遍历所述潜在的父节点集合中的潜在的父节点,若是,则基于所述地图中的最优路径的路径点,得到地图中的最优路径;若否,则将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4。
36.根据本发明所述的路径规划方法,所述将预测概率大于第二预设值的采样点中产生一个随机点xrand之前,包括:
37.初始化一棵由顶点集和边缘集组成的随机生成树t=(v,e)。
38.本发明还提供了一种路径规划系统,包括:
39.特征获取模块,用于获取地图和机器人特征属性;
40.采样分布预测模块,用于将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
41.路径规划模块,用于基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
42.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述路径规划方法的步骤。
43.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述路径规划方法的步骤。
44.本发明通过将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果,可以预测不同参数设置环境下最优路径的概率分布;再将采样分布结果应用于rrt*算法,具有很好的可替换性与复用性,规划速度更快,根据预测模型进行采样,减少了许多的无效采样路径,可以很好的得到最优路径,节省了大量的时间和内存占用。
附图说明
45.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
46.图1是本发明提供的路径规划方法的流程示意图;
47.图2是本发明提供的路径规划系统的结构示意图;
48.图3是本发明提供的电子设备的结构示意图。
具体实施方式
49.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
50.下面结合图1描述本发明的一种路径规划方法,该方法包括:
51.s10、获取地图和机器人特征属性;
52.将整个地图状态空间描述为2d图像像素范围,使用像素点描述表示每个可能的采样位置点。
53.s20、将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
54.每个像素使用0表示自由空间,1表示障碍物,2表示起始位置,3表示目标位置;机器人步长表示为s,输入i与这些机器人步长s一起输入到神经网络模型中,神经网络模型输出相应的图像表示为o。每个像素都有一个概率^p∈[0,1],表示用这个采样点来构建得到最佳路径的概率。如果一个状态的^p值很大,则最优路径很可能会经过这个位置。
[0055]
s30、基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
[0056]
神经网络的输出结果主要用于引导rrt*的采样。
[0057]
rrt算法首先在起点建立树的根节点作为第一个节点,每一次循环中,通过随机采样并进行碰撞检测,产生一个新的无碰撞随机点;然后遍历树中的每个节点,计算每个节点与该循环生成的随机点的距离,找到距离此点最近的节点;定义步进变量eps作为状态空间的输入,距离此点最近的节点向着其与无碰撞随机点连线的方向扩展eps步长,进而判断是否满足非完整微分约束。每个新节点都要经过两次判断,一次碰撞检测,一次非完整约束检测,当都满足条件时,则加入新的节点,继续进行下一步循环。
[0058]
与rrt相比,rrt*多了两个过程,即重新选择父节点过程和重布线随机树过程。在重新选择父节点过程中,在新产生的节点附近以定义的半径范围内寻找“近邻”,作为替换新产生的节点的父节点的备选。依次计算“近邻”节点到起点的路径代价加上新产生的节点到每个“近邻”的路径代价。在重布线过程中,如果近邻节点的父节点改为新产生的节点可以减小路径代价,则进行更改。每当生成了新的节点后,是否可以通过重新布线,使得某些节点的路径代价减少。在生成随机树的过程中,每一次的重布线都尽可能的为最终路径减小代价。
[0059]
也就是说,在原始rrt的基础上,rrt*主要有两点改进:
[0060]
为新节点选择代价最小的父节点;
[0061]
重布线:按照流程,先以新节点为圆心,一定半径画出一个圈,圈内的节点都是可能的父节点,然后挨个计算起点圈内的节点的代价与圈内节点到新节点代价之和,选其中最小的代价为新节点的代价,相应的节点为新节点的父节点。
[0062]
重新选择父节点使新生成的节点路径代价尽可能小,重布线使得生成新节点后的随机树减少冗余通路,减小路径代价。随着迭代次数走向无穷大,可以保证渐进最优性。但要达到最优解,需要消耗大量的时间和内存占用。因此,本发明结合了神经网络模型可以一次性对整个地图上的采样点进行了初步筛选,对于淘汰的采样点无需再进行计算,节省了大量的时间和内存占用。
[0063]
本发明在新的rrt*中,首先使用训练好的神经网络模型来初始化采样过程。模型输出当前地图的最优路径的概率分布。改进rrt*的实施过程,首先初始化一棵由顶点集和边缘集组成的树t=(v,e),然后在当前地图和参数设置的条件下,通
过设计的神经网络输出预测的采样分布o。预测概率小于0.5的采样点将被淘汰。后面过程类似于rrt*。如果最新的样本属于目标区域,即xnew∈g(xgoal),算法将返回一个由连接x_init和g(x_goal)的可行路径σ组成的树t。需要注意的是,改进的rrt*与rrt*的区别在于改变了采样的方式,其它过程基本一致,可以通用的迁移到其他基于采样的算法。
[0064]
本发明通过将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果,可以预测不同参数设置环境下最优路径的概率分布;再将采样分布结果应用于rrt*算法,具有很好的可替换性与复用性,规划速度更快,根据预测模型进行采样,减少了许多的无效采样路径,可以很好的得到最优路径,节省了大量的时间和内存占用。
[0065]
根据本发明所述的路径规划方法,所述获取地图和机器人特征属性包括:
[0066]
获取以像素点描述每个自由空间的二维地图和机器人特征属性,所述机器人特征属性包括:机器人的属性包括机器人步长以及机器人与障碍物之间的间隔距离。
[0067]
根据本发明所述的路径规划方法,所述神经网络模型的损失函数为每个像素位置的预测概率和真实标签的交叉熵,所述交叉熵是所述地图上所有可能位置的总和,所述损失函数为:
[0068]
l=∑ce(o,g)+λce(i,r)
[0069]
其中,λ是权衡重建损失的参数,o表示预测概率图像,g表示真实概率图像,ce表示cross-entropy交叉熵函数,i表示input输入,r表示真实标签。
[0070]
其中有一个编码和解码阶段,采用了空洞卷积。编码阶段,将二维残差卷积网络应用到输入i中,以层次化的方式提取输入图的特征。以大小为(w,h,3)的图像i
uv
为例。每个二维卷积层都有自己的小核k
ij
。卷积运算的定义如下。
[0071][0072]
神经网络模型,也就是卷积神经网络预测模型中,i和j是卷积核k的大小,卷积操作应用于整个状态空间,卷积操作的输出称为特征图。该特征图被送入更高的卷积层,提取另一个特征图。低级特征图f
l
和高级特征图fh分别是低卷积层和高卷积层的卷积结果。低级特征图对局部信息进行编码,而高级特征图则代表地图的描述。
[0073]
采用resnet50作为基础网络,在resnet50中提取特征图c1和c4作为低级特征和高级特征。特征图c1的维度为(w/8,h/8,256),特征图c4的维度为(w/32,h/32,2048)。空洞卷积的形式定义如下:
[0074][0075]
其中r为扩张率。空洞卷据可以获得多尺度信息。空间金字塔池化(aspp)应用于高层特征,以提取我们网络中的多尺度信息。最终的特征图fh的维度为(w/32,h/32,256)。在另一个输入分支上,这些输入的机器人步长s进入全连接的神经网络,提取相应的低级和高级特征图,并表示为f
ai
和f
ah
。f
ai
的维度为(1,1,32),f
ah
的维度为(1,1,64)。
[0076]
将规划地图范围以及机器人属性的特征一起作为特征输入,使神经网络模型能够根据这些机器人属性来调整最优路径。同一层次的特征图是并联在一起的。并联操作后的
低级和高级特征图分别表示为a和b,a的维度为(w/8,h/8,256+32),b的维度为(w/32,h/32,256+64)。将b进行线性调整,使其维度为(w/8,h/8,256+64),并与f
cl
进行连接。最后的编码特征表示为c具有(w/8,h/8,608)的维度。
[0077]
在解码阶段,将特征图c输入到解码卷积网络中,得到最终的输出o,最终输出的维度为(w,h,1),分辨率与输入i相同,在(u,v)处的每个像素都包含一个概率^p,表示该位置在最优路径内的机率。在提出的神经网络中,采用全卷积网络方式来处理输入i和输出o,全卷积网络可以处理不同分辨率的输入i。
[0078]
根据本发明所述的路径规划方法,所述将地图和机器人特征属性输入至神经网络模型,输出预测的采样分布之前,包括:
[0079]
获取一随机数;随机数是0-1范围内的任意数,可以采用现有的随机数产生算法来产生一个随机数。
[0080]
当所述随机数大于第一预设值,选取rrt*算法的随机采样器作为采样器;第一预设值可以设置为0.5,rrt*算法具有两个采样器,当所述随机数大于0.5,此时选取rrt*算法的随机采样器作为采样器;
[0081]
当所述随机数不大于第一预设值,选取所述神经网络模型对应的采样器作为采样器。当所述随机数小于或等于0.5,此时选取神经网络模型对应的采样器作为采样器。设置随机采样器和神经网络模型对应的采样器可以增强模型算法的鲁棒性。
[0082]
根据本发明所述的路径规划方法,基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径包括:
[0083]
在所述预测的采样分布结果中选取预测概率大于第二预设值的采样点;
[0084]
基于预测概率大于第二预设值的采样点,利用rrt*算法确定地图中的最优路径。
[0085]
第二预设值也可以设置为0.5,预测概率小于0.5的采样点将被淘汰。
[0086]
根据本发明所述的路径规划方法,所述基于预测概率大于第二预设值的采样点,利用rrt*算法确定地图中的最优路径,包括:
[0087]
s1、将预测概率大于第二预设值的采样点中产生一个随机点xrand;
[0088]
s2、在随机生长树上找到与随机点xrand最近的节点xnearest,连接xrand与xnearest形成第一路径;
[0089]
s3、以xrand为中心,ri为半径,在所述随机生长树上搜索节点,找出潜在的父节点集合;其目的是要更新xrand,看看有没有比它更好的父节点,从某一个潜在的父节点xpotential_parent开始考虑。
[0090]
s4、将潜在的父节点xpotential_parent作为父节点时,将xpotential_parent与xrand连接起来形成第二路径,计算出所述第二路径的代价;
[0091]
s5、将所述第二路径的代价与第一路径的代价作比较;
[0092]
s6、若所述第二路径的代价更小,则进行碰撞检测;
[0093]
s7、若碰撞检测失败,该潜在的父节点xpotential_parent不作为新的父节点,将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4;
[0094]
s8、若所述第二路径路径代价更大,则将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4;
[0095]
s9、若碰撞检测通过,则将潜在的父节点xpotential_parent加入到随机生成树中,确定出地图中的最优路径的路径点;碰撞检测通过则在树中将之前的边删掉,在树中将新的边添加进去,将潜在的父节点集合中的下一个潜在的父节点作为下一个潜在的父节点xpotential_parent,遍历所有的潜在父节点,得到更新后的树。
[0096]
s10、判断是否遍历所述潜在的父节点集合中的潜在的父节点,若是,则基于所述地图中的最优路径的路径点,得到地图中的最优路径;若否,则将潜在的父节点集合中的下一个潜在的父节点作为潜在的父节点xpotential_parent,并返回所述s4。
[0097]
根据本发明所述的路径规划方法,所述将预测概率大于第二预设值的采样点中产生一个随机点xrand之前,包括:
[0098]
初始化一棵由顶点集和边缘集组成的随机生成树t=(v,e)。
[0099]
参见图2,下面对本发明提供的路径规划系统进行描述,下文描述的路径规划系统与上文描述的路径规划方法可相互对应参照。该系统包括:
[0100]
特征获取模块10,用于获取地图和机器人特征属性;
[0101]
采样分布预测模块20,用于将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
[0102]
路径规划模块30,用于基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
[0103]
图3示例了一种电子设备的实体结构示意图,该电子设备可以包括:处理器(processor)310、通信接口(communications interface)320、存储器(memory)330和通信总线340,其中,处理器310,通信接口320,存储器330通过通信总线340完成相互间的通信。处理器310可以调用存储器330中的逻辑指令,以执行路径规划方法,该方法包括:
[0104]
s10、获取地图和机器人特征属性;
[0105]
s20、将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
[0106]
s30、基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
[0107]
此外,上述的存储器330中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0108]
另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的路径规划方法,该方法包括:
[0109]
s10、获取地图和机器人特征属性;
[0110]
s20、将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
[0111]
s30、基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
[0112]
又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各提供的路径规划方法,该方法包括:
[0113]
s10、获取地图和机器人特征属性;
[0114]
s20、将获取的地图和机器人特征属性输入至神经网络模型,输出预测的采样分布结果;其中,所述神经网络模型是通过输入的地图样本和机器人特征属性样本、以及预先确定的地图节点的最优路径的概率分布标签训练得到的;
[0115]
s30、基于所述预测的采样分布结果,利用rrt*算法确定地图中的最优路径。
[0116]
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0117]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
[0118]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1