轨迹规划方法、装置、自动驾驶设备和存储介质与流程

文档序号:20669282发布日期:2020-05-08 17:10阅读:238来源:国知局
轨迹规划方法、装置、自动驾驶设备和存储介质与流程

本申请涉及自动驾驶领域,具体涉及轨迹规划方法、装置、自动驾驶设备和存储介质。



背景技术:

自动驾驶技术中的一个重要部分就是如何进行轨迹规划,这里的轨迹规划通常包括两方面的内容:一方面是路径规划,另一方面是速度规划。

现有技术中有利用em(expectationmaximization最大化期望)算法结合frenet坐标系进行轨迹规划的方法,其优点是可以将路径与速度解耦,但是也存在一些缺点,如采样方式固定,没有充分利用周围环境信息,以及frenet坐标系容易带来投影错误,等等,因此现有轨迹规划方法仍存在改进空间和需求。



技术实现要素:

鉴于上述问题,提出了本申请以便提供一种克服上述问题或者至少部分地解决上述问题的轨迹规划方法、装置、自动驾驶设备和存储介质。

依据本申请的一个方面,提供了一种轨迹规划方法,应用于自动驾驶设备的轨迹规划模块中,包括:

依据滑动窗口在地图中确定待规划区域,将自动驾驶设备获取到的驾驶场景信息融合到所述待规划区域中,生成状态空间;其中,所述驾驶场景信息至少包含动态障碍物信息;

利用采样模型在所述状态空间中确定采样点;其中,所述采样模型是利用生成对抗网络训练得到的;

根据确定的采样点进行轨迹规划。

可选地,所述生成对抗网络的生成网络由所述采样模型构成,所述生成对抗网络的判别网络由鉴别器构成;所述采样模型包括编码器和解码器;

所述生成对抗网络是通过如下方式训练的:

将环境数据和采样点数据经所述编码器进行编码,得到隐藏向量;

对所述隐藏向量添加标准高斯分布噪声,得到混合数据;

将所述混合数据通过所述解码器进行解码,得到生成数据;

将所述生成数据经所述鉴别器进行鉴别;

根据鉴别结果同步更新所述鉴别器、所述编码器和所述解码器的参数,直至价值评估函数满足预设条件。

可选地,所述采样点数据是通过如下方式制作的:

对历史轨迹进行特征提取,基于提取的特征生成采样点集合。

可选地,所述环境数据为经过初始化处理为带有时间信息的截断符号距离场地图格式。

可选地,所述根据确定的采样点进行轨迹规划包括:

从确定的采样点中选出轨迹点,连接各选出的轨迹点得到初步轨迹;

对所述初步轨迹进行平滑处理,得到最终轨迹;所述平滑处理包括:

基于代价函数对所述初步轨迹上的轨迹点进行状态量估计和时间间隔估计,所述代价函数包括平滑代价函数、障碍物代价函数和参考线约束函数中的至少一种。

可选地,所述基于代价函数对所述初步轨迹上的轨迹点进行状态量估计和时间间隔估计包括:

基于图优化方法进行估计,将待估计的量作为图中的顶点,将约束条件和代价函数作为图中的边。

可选地,所述基于图优化方法进行估计包括:

利用高斯牛顿迭代求解,在求解过程中利用黑塞矩阵进行子矩阵拆解,对各子矩阵进行并行化计算。

依据本申请的另一方面,提供了一种轨迹规划装置,应用于自动驾驶设备的轨迹规划模块中,包括:

状态空间单元,用于依据滑动窗口在地图中确定待规划区域,将自动驾驶设备获取到的驾驶场景信息融合到所述待规划区域中,生成状态空间;其中,所述驾驶场景信息至少包含动态障碍物信息;

采样点单元,用于利用采样模型在所述状态空间中确定采样点;其中,所述采样模型是利用生成对抗网络训练得到的;

轨迹规划单元,用于根据确定的采样点进行轨迹规划。

可选地,所述生成对抗网络的生成网络由所述采样模型构成,所述生成对抗网络的判别网络由鉴别器构成;所述采样模型包括编码器和解码器;所述生成对抗网络是通过如下方式训练的:将环境数据和采样点数据经所述编码器进行编码,得到隐藏向量;对所述隐藏向量添加标准高斯分布噪声,得到混合数据;将所述混合数据通过所述解码器进行解码,得到生成数据;将所述生成数据经所述鉴别器进行鉴别;根据鉴别结果同步更新所述鉴别器、所述编码器和所述解码器的参数,直至价值评估函数满足预设条件。

可选地,所述采样点数据是通过如下方式制作的:对历史轨迹进行特征提取,基于提取的特征生成采样点集合。

可选地,所述环境数据为经过初始化处理为带有时间信息的截断符号距离场地图格式。

可选地,所述轨迹规划单元,用于从确定的采样点中选出轨迹点,连接各选出的轨迹点得到初步轨迹;对所述初步轨迹进行平滑处理,得到最终轨迹;所述平滑处理包括:基于代价函数对所述初步轨迹上的轨迹点进行状态量估计和时间间隔估计,所述代价函数包括平滑代价函数、障碍物代价函数和参考线约束函数中的至少一种。

可选地,所述轨迹规划单元,用于基于图优化方法进行估计,将待估计的量作为图中的顶点,将约束条件和代价函数作为图中的边。

可选地,所述轨迹规划单元,用于利用高斯牛顿迭代求解,在求解过程中利用黑塞矩阵进行子矩阵拆解,对各子矩阵进行并行化计算。

依据本申请的又一方面,提供了一种自动驾驶设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行如上述任一所述的方法。

依据本申请的再一方面,提供了一种计算机可读存储介质,其中,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被处理器执行时,实现如上述任一所述的方法。

由上述可知,本申请的技术方案,采用滑动窗口和包含动态障碍物信息的驾驶场景信息生成状态空间,利用预先通过生成对抗网络模型训练得到的采样模型在状态空间中生成采样点,根据确定的采样点进行轨迹规划。该技术方案实现了轨迹规划中的局部规划,并且采样点的生成考虑到了动态障碍物信息,充分利用了驾驶场景信息,使得采样点的生成不再拘泥于固定方式,对外界环境更为鲁棒,从而使得规划的轨迹更适合当前驾驶场景,有助于提升自动驾驶水平,对物流、外卖配送等领域的自动化提供了技术支撑。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了根据本申请一个实施例的一种轨迹规划方法的流程示意图;

图2示出了根据本申请一个实施例的一种轨迹规划装置的结构示意图;

图3示出了根据本申请一个实施例的自动驾驶设备的结构示意图;

图4示出了根据本申请一个实施例的计算机可读存储介质的结构示意图;

图5示出了根据本申请一个实施例的用于训练采样模型的生成对抗网络的示意图;

图6示出了根据本申请一个实施例的一帧带有时间信息的截断符号距离场地图;

图7示出了据本申请一个实施例的图优化建模示意图;

图8示出了对代价函数利用黑塞矩阵划分矩阵块的示意图;

图9示出了s矩阵分解示意图。

具体实施方式

下面将参照附图更详细地描述本申请的示例性实施例。虽然附图中显示了本申请的示例性实施例,然而应当理解,可以以各种形式实现本申请而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本申请,并且能够将本申请的范围完整的传达给本领域的技术人员。

针对背景技术所提到的现有技术的缺点,本申请的技术方案从两个方面进行了设计,一方面,对于固化的采样方式进行了调整,在生成采样点时尽可能考虑到更多的信息;另一方面,对于轨迹规划过程中的平滑处理进行了优化,由于涉及不同方面的内容,下面分别以不同的实施例进行介绍,当然,各实施例也可以结合实施。

图1示出了根据本申请一个实施例的一种轨迹规划方法的流程示意图,轨迹规划方法可用于自动驾驶设备的轨迹规划模块中。如图1所示,该方法包括:

步骤s110,依据滑动窗口在地图中确定待规划区域,将自动驾驶设备获取到的驾驶场景信息融合到所述待规划区域中,生成状态空间;其中,驾驶场景信息至少包含动态障碍物信息。

滑动窗口法是进行局部规划时常被采样的技术,可以理解为在进行局部规划时,依据时间在地图上进行滑动,选取与一段时间对应的区域,在区域内进行轨迹规划。在本申请的实施例中,滑动窗口的大小可以是可变的,例如,当前时刻选取的滑动窗口的大小可以与当前自动驾驶设备的速度有关,速度越大,则滑动窗口越大,速度越小,则滑动窗口越小。

驾驶场景信息可以包含多方面的信息,现有技术中往往将动态障碍物,如移动的车或行人等纳入驾驶场景信息并据此进行采样点生成。例如,现有的一种轨迹规划方案中采用固定步长进行采样,这样显然是无法将动态障碍物信息考虑进来的。

除了动态障碍物信息外,驾驶场景信息还可以包含静态障碍物信息、轨迹初始点信息、轨迹目标点信息、自动驾驶设备的控制量等等。驾驶场景信息也可以理解为环境量信息,可表达为与时间相关的函数y(t)。

将驾驶场景信息融合到待规划区域,可以在地图上标注出动态障碍物等原地图不包含的信息,便于进一步进行采样点选取和轨迹规划。

步骤s120,利用采样模型在状态空间中确定采样点;其中,采样模型是利用生成对抗网络训练得到的。

本申请的技术方案中,采样点是利用神经网络学习得到的模型确定的,这里通过对训练数据进行学习,预先训练一个能够生成采样点分布的采样模型在实际场景中加以利用,有效地将驾驶场景信息考虑进来。

生成对抗网络(generativeadversarialnetwork,gan)也称为生成式对抗网络,其包括一个生成网络,以及一个判别网络,生成网络需要根据真实数据生成同一类别的生成数据,判别网络需要能够准确分辨出生成数据和真实数据。显然,生成网络的目标是能够欺骗判别网络,而判断网络的目标是能够不被欺骗,通过这种对抗使得生成网络最终能够生成符合需求的生成数据。

在本申请的实施例中,就利用了这种特性,使得生成的采样点更符合自动驾驶的需求。

步骤s130,根据确定的采样点进行轨迹规划。具体的轨迹规划算法可以利用现有技术实现,本实施例对此不做限制。

可见,图1所示的方法,利用滑动窗口和包含动态障碍物信息的驾驶场景信息生成状态空间,利用预先通过生成对抗网络模型训练得到的采样模型在状态空间中生成采样点,根据确定的采样点进行轨迹规划。该技术方案实现了轨迹规划中的局部规划,并且采样点的生成考虑到了动态障碍物信息,充分利用了驾驶场景信息,使得采样点的生成不再拘泥于固定方式,对外界环境更为鲁棒,从而使得规划的轨迹更适合当前驾驶场景,有助于提升自动驾驶水平,对物流、外卖配送等领域的自动化提供了技术支撑。

在本申请的一个实施例中,上述方法中,生成对抗网络的生成网络由采样模型构成,生成对抗网络的判别网络由鉴别器构成;采样模型包括编码器和解码器;生成对抗网络是通过如下方式训练的:将环境数据和采样点数据经编码器进行编码,得到隐藏向量;对隐藏向量添加标准高斯分布噪声,得到混合数据;将混合数据通过解码器进行解码,得到生成数据;将生成数据经鉴别器进行鉴别;根据鉴别结果同步更新鉴别器、编码器和解码器的参数,直至价值评估函数满足预设条件。

其中,训练数据包括采样点数据和环境数据,采样点数据可以是具体的采样点,也可以是能够生成采样点的区域。在本申请的一个实施例中,上述方法中,采样点数据是通过如下方式制作的:对历史轨迹进行特征提取,基于提取的特征生成采样点集合。

历史轨迹可以包括在本次轨迹规划前,已成功规划的轨迹;也可包括本次轨迹规划过程中,在前面阶段规划的轨迹,可以理解为状态空间之前的轨迹,因为本申请实施例的轨迹规划为局部轨迹规划。由于历史轨迹是经过实际验证的可用轨迹,也容易获取,以此来生成采样点数据,即能够节约成本,也能确保训练数据的有效性。

图5示出了根据本申请一个实施例的用于训练采样模型的生成对抗网络的示意图。如图5所示,首先对输入轨迹进行特征提取,得到采样点数据,采样点数据可表示为与时间相关的函数,记为m(t)。另外获取环境数据,也就是图5中示出的环境量,同样可以表示为与时间相关的函数,记为y(t)。将m(t)和y(t)输入到编码器encoder(e),通过编码器确定对于采样点数据m和环境数据y的均值向量μ(m,y)和对于m和y的方差向量∑(m,y),将采样点数据和环境数据降维到一个编码,生成隐藏向量z(t)。隐藏向量z(t)基本服从标准高斯分布。然后对隐藏向量添加标准高斯分布噪声,得到混合数据;将混合数据通过解码器(即图中的生成器g)进行解码,得到生成数据。

上述过程是为了根据输入的采样点数据,生成难以与之分辨开来的生成数据。

鉴别器的作用是对生成的采样点进行质量检查,通过了说明鉴别器的质量不够好,需要增加鉴别器的训练。没有通过说明解码器质量欠缺,需要完善解码器的模型,重新估计潜在层,提升采样模型的效果。也就是说,理想情况下,在训练过程中,只有一个模型的参数被更新,另一个模型的参数固定不变。

然而实际上整个生成网络是无法被训练到最优的,因此实际可以采取的策略为,鉴别器经过少量的迭代训练,鉴别器和编码器,解码器同步更新。在不断的进行鉴别器和解码器的对抗中,提高生成采样点的质量。

整个生成对抗网络的训练目标是获得让鉴别器鉴别的准确率最大化的参数和获得最大化欺骗鉴别器的参数。训练的代价由一个价值评估函数v(e,g,d)评估:

v(e,g,d)=epdata(x)logd(x)+eplog(1-d(x)),对应于编码器、解码器和鉴别器之间的极小极大博弈,d(x)代表x来源于真实数据(即输入到生成对抗网络的采样点数据)而不是生成数据的概率,e指代取期望。

对于epdata(x)logd(x),这一项是根据“正类”(即辨别出x属于真实数据data)的对数损失函数而构建的。最大化这一项相当于令鉴别器d在x服从于data的概率密度时能准确地预测d(x)=1。

对于eplog(1-d(x),这一项则是企图欺骗生成网络,根据“负类”(即x是生成数据)的对数损失函数而构建。

可见,对于鉴别器而言要,尽量使上述价值评估函数最大化(识别能力强),而对于生成网络而言,又想使之最小(生成数据接近真实数据)。

在本申请的一个实施例中,上述方法中,环境数据为经过初始化处理为带有时间信息的截断符号距离场地图格式。

地图的表示方式中,一种是占据网格地图,可以得到网格的占据概率。但在轨迹规划中,仅仅得到占据概率大小是不够的,还需要知道自动驾驶设备与障碍物之间的距离。所以本实施例中,地图用带有时间信息的截断符号距离场(tsdf)表示,环境数据在输入到生成对抗网络之前,也初始化处理为带有时间信息的截断符号距离场地图格式。

图6示出了一帧截断符号距离场地图,每个地图网格内存储当前时刻自动驾驶设备与最近障碍物的相对距离,超过一定距离用1表示。图中左侧ti对应的点为自动驾驶设备的当前位置。地图网格中正负交界面是障碍物表面所在的位置。vg为自动驾驶设备的当前速度。

将环境数据处理为tsdf格式的方式可以如下所示:

首先,获取体素在全局坐标系下的坐标(x,y,z),根据点云配准得到的变换矩阵,将体素的坐标从全局坐标系转换到相机坐标系;其次,根据相机的内参矩阵,将体素的坐标转换到图像坐标系,得到体素所在的图像坐标(u,v);再次,如果第i帧深度图像(u,v)处的深度值d(u,v)不为零,则比较d(u,v)与体素相机坐标v(x,y,z)中z的大小。如果d>z,说明体素距离相机近。反之同理。最后,根据上一步的结果更新体素中距离值d和权重w。公式如下:

wi(x,y,z)=min(maxweight,wi-1(x,y,z)+1)

sdfi=di(u,v)-v.z

其中,wi为当前帧立方体中该体素的权重,wi-1为上一帧立方体中该体素的权重。maxweight为最大权重,设为1;di为当前帧体素到物体表面的距离,di-1为上一帧体素到物体表面的距离。di为根据当前帧深度数据计算得到的全局数据立方体体素到物体表面体素的距离,v.z为体素在相机坐标系下的z轴坐标,di(u,v)表示当前帧深度图像(u,v)处的深度值。maxtrunction与mintrunction限定截断范围的上下限,截断范围的大小会影响重建结果的精细程度。

由于将时间信息表征在不同的通道上,因此利用截断符号距离场地图实现采样模型中的分类器,可以使分类的效果更好,解码器更鲁棒。

在本申请的一个实施例中,上述方法中,根据确定的采样点进行轨迹规划包括:从确定的采样点中选出轨迹点,连接各选出的轨迹点得到初步轨迹;对初步轨迹进行平滑处理,得到最终轨迹;平滑处理包括:基于代价函数对初步轨迹上的轨迹点进行状态量估计和时间间隔估计,代价函数包括平滑代价函数、障碍物代价函数和参考线约束函数中的至少一种。

具体地,每段路径并行处理,待估计的量是n个采样点的状态量和时间间隔,状态量为xi=[xi,yi,βi]t(方括号内x、y分别为笛卡尔坐标系中的横纵坐标,β为转向角),采样间的时间间隔t={δti}{i=0,…n-1}。优选地,代价函数由三部分组成,第一项与平滑代价函数cs相关,第二项与障碍物代价函数cobs相关,第三项与参考线约束函数cguidance相关,设ωs、ωc、ωg为参数,代价函数经整理,可以写成

f(x)=σc(xi,xj,cij)tωijc(xi,xj,cij),x*=argminf(x)。

也就是说,处理目标是找到合适的状态点使得目标函数最小。

在本申请的一个实施例中,上述方法中,基于代价函数对初步轨迹上的轨迹点进行状态量估计和时间间隔估计包括:基于图优化方法进行估计,将待估计的量作为图中的顶点,将约束条件和代价函数作为图中的边。

图7示出了一种图优化的建模示例。如图7所示,待估计变量用顶点表示,边表示代价函数和约束条件。具体地,在本申请的一个实施例中,上述方法中,基于图优化方法进行估计包括:利用高斯牛顿迭代求解,在求解过程中利用黑塞hessian矩阵进行子矩阵拆解,对各子矩阵进行并行化计算。

由于代价函数是非线性的,可以用高斯牛顿迭代求解。即hδx=b。由于代价函数只和部分状态量有关系,所以信息矩阵h是个稀疏矩阵,可以分为四个矩阵块,如图8所示。b=jwc,j是代价函数对状态量的雅可比,w是权重,δx=[δxx,δxt]t。如图8所示,hxx是对角阵(对应图8中左上角至右下角的一列),代表状态量间的约束关系。htt是稠密矩阵(图8中右下角的方块),是时间t之间的相互关系。htx也是对角阵(图8中剩余部分),代表状态量和时间的对应关系。

由舒尔补可以进行高斯消元:

先消去δxx,计算δxt,得到

于是把h矩阵的维度降到了hxx和htt。hxx是对角阵,求逆比较快。该矩阵的稀疏程度取决于不同状态量间的约束关系。当障碍物代价函数设为

也就是说,当障碍物离线段较远时,该障碍物对线段没有影响,对应到s矩阵为0。则s矩阵可以表示为图。s矩阵可以拆分为主对角线元素和次对角线元素和稀疏的元素相加的结果,如图9所示,所以求逆的速度也很快。

上述平滑处理过程的创新点在于,1)同时处理xyt维度的曲线平滑,跟利用frenet坐标系,sl和st降维度分别处理相比(st轨迹是随时间变化的纵向位移,sl轨迹是纵向轨迹上每个点的横向偏移),避免了突发情况的车辆抖动问题;2)优化过程利用hessian矩阵的稀疏性降低计算量,设计合理的代价函数进一步拆解h矩阵的子矩阵,并行化计算,有效降低运算时间。

图2示出了根据本申请一个实施例的一种轨迹规划装置的结构示意图,轨迹规划装置可用于自动驾驶设备的轨迹规划模块中。如图2所示,轨迹规划装置200包括:

状态空间单元210,用于依据滑动窗口在地图中确定待规划区域,将自动驾驶设备获取到的驾驶场景信息融合到所述待规划区域中,生成状态空间;其中,驾驶场景信息至少包含动态障碍物信息。

滑动窗口法是进行局部规划时常被采样的技术,可以理解为在进行局部规划时,依据时间在地图上进行滑动,选取与一段时间对应的区域,在区域内进行轨迹规划。在本申请的实施例中,滑动窗口的大小可以是可变的,例如,当前时刻选取的滑动窗口的大小可以与当前自动驾驶设备的速度有关,速度越大,则滑动窗口越大,速度越小,则滑动窗口越小。

驾驶场景信息可以包含多方面的信息,现有技术中往往将动态障碍物,如移动的车或行人等纳入驾驶场景信息并据此进行采样点生成。例如,现有的一种轨迹规划方案中采用固定步长进行采样,这样显然是无法将动态障碍物信息考虑进来的。

除了动态障碍物信息外,驾驶场景信息还可以包含静态障碍物信息、轨迹初始点信息、轨迹目标点信息、自动驾驶设备的控制量等等。驾驶场景信息也可以理解为环境量信息,可表达为与时间相关的函数y(t)。

将驾驶场景信息融合到待规划区域,可以在地图上标注出动态障碍物等原地图不包含的信息,便于进一步进行采样点选取和轨迹规划。

采样点单元220,用于利用采样模型在状态空间中确定采样点;其中,采样模型是利用生成对抗网络训练得到的。

本申请的技术方案中,采样点是利用神经网络学习得到的模型确定的,这里通过对训练数据进行学习,预先训练一个能够生成采样点分布的采样模型在实际场景中加以利用,有效地将驾驶场景信息考虑进来。

生成对抗网络(generativeadversarialnetwork,gan)也称为生成式对抗网络,其包括一个生成网络,以及一个判别网络,生成网络需要根据真实数据生成同一类别的生成数据,判别网络需要能够准确分辨出生成数据和真实数据。显然,生成网络的目标是能够欺骗判别网络,而判断网络的目标是能够不被欺骗,通过这种对抗使得生成网络最终能够生成符合需求的生成数据。

在本申请的实施例中,就利用了这种特性,使得生成的采样点更符合自动驾驶的需求。

轨迹规划单元230,用于根据确定的采样点进行轨迹规划。具体的轨迹规划算法可以利用现有技术实现,本实施例对此不做限制。

可见,图2所示的装置,利用滑动窗口和包含动态障碍物信息的驾驶场景信息生成状态空间,利用预先通过生成对抗网络模型训练得到的采样模型在状态空间中生成采样点,根据确定的采样点进行轨迹规划。该技术方案实现了轨迹规划中的局部规划,并且采样点的生成考虑到了动态障碍物信息,充分利用了驾驶场景信息,使得采样点的生成不再拘泥于固定方式,对外界环境更为鲁棒,从而使得规划的轨迹更适合当前驾驶场景,有助于提升自动驾驶水平,对物流、外卖配送等领域的自动化提供了技术支撑。

在本申请的一个实施例中,上述装置中,生成对抗网络的生成网络由采样模型构成,生成对抗网络的判别网络由鉴别器构成;采样模型包括编码器和解码器;生成对抗网络是通过如下方式训练的:将环境数据和采样点数据经编码器进行编码,得到隐藏向量;对隐藏向量添加标准高斯分布噪声,得到混合数据;将混合数据通过解码器进行解码,得到生成数据;将生成数据经鉴别器进行鉴别;根据鉴别结果同步更新鉴别器、编码器和解码器的参数,直至价值评估函数满足预设条件。

在本申请的一个实施例中,上述装置中,采样点数据是通过如下方式制作的:对历史轨迹进行特征提取,基于提取的特征生成采样点集合。

在本申请的一个实施例中,上述装置中,环境数据为经过初始化处理为带有时间信息的截断符号距离场地图格式。

在本申请的一个实施例中,上述装置中,轨迹规划单元230,用于从确定的采样点中选出轨迹点,连接各选出的轨迹点得到初步轨迹;对初步轨迹进行平滑处理,得到最终轨迹;平滑处理包括:基于代价函数对初步轨迹上的轨迹点进行状态量估计和时间间隔估计,代价函数包括平滑代价函数、障碍物代价函数和参考线约束函数中的至少一种。

在本申请的一个实施例中,上述装置中,轨迹规划单元230,用于基于图优化方法进行估计,将待估计的量作为图中的顶点,将约束条件和代价函数作为图中的边。

在本申请的一个实施例中,上述装置中,轨迹规划单元230,用于利用高斯牛顿迭代求解,在求解过程中利用黑塞矩阵进行子矩阵拆解,对各子矩阵进行并行化计算。

需要说明的是,上述各装置实施例的具体实施方式可以参照前述对应方法实施例的具体实施方式进行,在此不再赘述。

综上所述,本申请的技术方案,利用滑动窗口和包含动态障碍物信息的驾驶场景信息生成状态空间,利用预先通过生成对抗网络模型训练得到的采样模型在状态空间中生成采样点,根据确定的采样点进行轨迹规划。该技术方案实现了轨迹规划中的局部规划,并且采样点的生成考虑到了动态障碍物信息,充分利用了驾驶场景信息,使得采样点的生成不再拘泥于固定方式,对外界环境更为鲁棒;基于学习的采样,缩小搜索范围,提高轨迹规划的质量;在优化时同时优化路径和速度,避免了分开优化的抖动问题;从而使得规划的轨迹更适合当前驾驶场景,有助于提升自动驾驶水平,对物流、外卖配送等领域的自动化提供了技术支撑。

需要说明的是:

在此提供的算法和显示不与任何特定计算机、虚拟装置或者其它设备固有相关。各种通用装置也可以与基于在此的示教一起使用。根据上面的描述,构造这类装置所要求的结构是显而易见的。此外,本申请也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本申请的内容,并且上面对特定语言所做的描述是为了披露本申请的最佳实施方式。

在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本申请的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。

类似地,应当理解,为了精简本申请并帮助理解各个发明方面中的一个或多个,在上面对本申请的示例性实施例的描述中,本申请的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本申请要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本申请的单独实施例。

本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。

此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。

本申请的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(dsp)来实现根据本申请实施例的轨迹规划装置中的一些或者全部部件的一些或者全部功能。本申请还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本申请的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。

例如,图3示出了根据本申请一个实施例的自动驾驶设备的结构示意图。该自动驾驶设备300包括处理器310和被安排成存储计算机可执行指令(计算机可读程序代码)的存储器320。存储器320可以是诸如闪存、eeprom(电可擦除可编程只读存储器)、eprom、硬盘或者rom之类的电子存储器。存储器320具有存储用于执行上述方法中的任何方法步骤的计算机可读程序代码331的存储空间330。例如,用于存储计算机可读程序代码的存储空间330可以包括分别用于实现上面的方法中的各种步骤的各个计算机可读程序代码331。计算机可读程序代码331可以从一个或者多个计算机程序产品中读出或者写入到这一个或者多个计算机程序产品中。这些计算机程序产品包括诸如硬盘,紧致盘(cd)、存储卡或者软盘之类的程序代码载体。这样的计算机程序产品通常为例如图4所述的计算机可读存储介质。图4示出了根据本申请一个实施例的一种计算机可读存储介质的结构示意图。该计算机可读存储介质400存储有用于执行根据本申请的方法步骤的计算机可读程序代码331,可以被自动驾驶设备300的处理器310读取,当计算机可读程序代码331由自动驾驶设备300运行时,导致该自动驾驶设备300执行上面所描述的方法中的各个步骤,具体来说,该计算机可读存储介质存储的计算机可读程序代码331可以执行上述任一实施例中示出的方法。计算机可读程序代码331可以以适当形式进行压缩。

应该注意的是上述实施例对本申请进行说明而不是对本申请进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本申请可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1