不同横向加速度约束下的最优纵向轨迹生成的制作方法

文档序号:20669176发布日期:2020-05-08 17:10阅读:219来源:国知局
不同横向加速度约束下的最优纵向轨迹生成的制作方法

本公开的实施方式总体涉及自动车辆。更具体地,本公开的实施方式涉及在横向加速度约束下规划纵向轨迹。



背景技术:

以自动驾驶模式运行(例如,无人驾驶)的车辆可将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。

运动规划和控制是自动驾驶中的关键。纵向轨迹是指定自动车辆沿道路/车道中心线的运动的轨迹。纵向轨迹生成对于例如自适应巡航控制系统的许多自动驾驶系统非常重要。这些自动驾驶系统通常处理车道内的驾驶场景,例如,巡航至目标速度、跟随引导车辆或在同一车道中的目标点处停下。在轨迹生成过程中必须考虑几个常见因素,例如安全性、舒适性、时间效率,使得轨迹生成成为难题。具体地,考虑到道路/车道的形状,自动驾驶车辆必须在弯道处减低速度以进行安全和舒适的行驶,并且在相对直的路段加速至期望的速度以节省时间。



技术实现要素:

本申请一方面提供了一种计算机实施的方法,包括:接收多个优化输入,所述多个优化输入包括轨迹时长、时间离散分辨率、自动驾驶车辆起始状态、道路形状函数、最大急动度和最大横向加速度;接收多个优化约束,所述多个优化约束包括与所述最大急动度和所述最大横向加速度有关的约束;接收与优化目标相关联的成本函数,所述成本函数包括与累积急动度有关的第一项、与最终纵向位置有关的第二项、与最终纵向速度有关的第三项以及与最终纵向加速度有关的第四项;利用非线性优化生成多个规划的自动驾驶车辆状态作为优化结果,其中,所述优化结果使所述成本函数的值最小化;以及基于所述多个规划的自动驾驶车辆状态生成控制所述自动驾驶车辆的控制信号。

根据本申请实施方式,利用包括纵向维度和横向维度的sl坐标系,其中,所述纵向维度沿着参考线的切线方向,以及其中,所述横向维度垂直于所述纵向维度。

根据本申请实施方式,所述自动驾驶车辆起始状态和所述多个规划的自动驾驶车辆状态中的每个状态均包括纵向姿态、纵向速度和纵向加速度。

根据本申请实施方式,所述道路形状函数包括四次螺旋曲线的序列。

根据本申请实施方式,所述成本函数还包括与所述第一项相关联的第一权重、与所述第二项相关联的第二权重,与所述第三项相关联的第三权重以及与所述第四项相关联的第四权重。

根据本申请实施方式,所述多个规划的自动驾驶车辆状态对应于位于规划起始时间与规划结束时间之间的、由所述时间离散分辨率间隔开的时刻,以及其中,所述规划结束时间比所述规划起始时间晚所述轨迹时长。

根据本申请实施方式,所述多个优化输入还包括目标自动驾驶车辆最终状态。

本申请另一方面提供了一种存储有指令的非暂时性机器可读介质,所述指令在由处理器执行时致使所述处理器执行操作,所述操作包括:接收多个优化输入,所述多个优化输入包括轨迹时长、时间离散分辨率、自动驾驶车辆起始状态、道路形状函数、最大急动度和最大横向加速度;接收多个优化约束,所述多个优化约束包括与所述最大急动度和所述最大横向加速度有关的约束;接收与优化目标相关联的成本函数,所述成本函数包括与累积急动度有关的第一项、与最终纵向位置有关的第二项、与最终纵向速度有关的第三项以及与最终纵向加速度有关的第四项;利用非线性优化生成多个规划的自动驾驶车辆状态,作为优化结果,其中,所述优化结果使所述成本函数的值最小化;以及基于所述多个规划的自动驾驶车辆状态生成控制所述自动驾驶车辆的控制信号。

根据本申请实施方式,利用包括纵向维度和横向维度的sl坐标系,其中,所述纵向维度沿着参考线的切线方向,以及其中,所述横向维度垂直于所述纵向维度。

根据本申请实施方式,所述自动驾驶车辆起始状态和所述多个规划的自动驾驶车辆状态中的每个状态均包括纵向姿态、纵向速度和纵向加速度。

根据本申请实施方式,所述道路形状函数包括四次螺旋曲线的序列。

根据本申请实施方式,所述成本函数还包括与所述第一项相关联的第一权重、与所述第二项相关联的第二权重,与所述第三项相关联的第三权重以及与所述第四项相关联的第四权重。

根据本申请实施方式,所述多个规划的自动驾驶车辆状态对应于位于规划起始时间与规划结束时间之间的、由所述时间离散分辨率间隔开的时刻,以及其中,所述规划结束时间比所述规划起始时间晚所述轨迹时长。

根据本申请实施方式,所述多个优化输入还包括目标自动驾驶车辆最终状态。

本申请又一方面提供了一种数据处理系统,包括:处理器;以及存储器,所述存储器联接至所述处理器以存储指令,所述指令在由所述处理器执行时致使所述处理器执行以下操作,所述操作包括:接收多个优化输入,所述多个优化输入包括轨迹时长、时间离散分辨率、自动驾驶车辆起始状态、道路形状函数、最大急动度和最大横向加速度;接收多个优化约束,所述多个优化约束包括与所述最大急动度和所述最大横向加速度有关的约束;接收与优化目标相关联的成本函数,所述成本函数包括与累积急动度有关的第一项、与最终纵向位置有关的第二项、与最终纵向速度有关的第三项以及与最终纵向加速度有关的第四项;利用非线性优化生成多个规划的自动驾驶车辆状态,作为优化结果,其中,所述优化结果使所述成本函数的值最小化;以及基于所述多个规划的自动驾驶车辆状态生成控制所述自动驾驶车辆的控制信号。

根据本申请实施方式,利用包括纵向维度和横向维度的sl坐标系,其中,所述纵向维度沿着参考线的切线方向,以及其中,所述横向维度垂直于所述纵向维度。

根据本申请实施方式,所述自动驾驶车辆起始状态和所述多个规划的自动驾驶车辆状态中的每个状态均包括纵向姿态、纵向速度和纵向加速度。

根据本申请实施方式,所述道路形状函数包括四次螺旋曲线的序列。

根据本申请实施方式,所述成本函数还包括与所述第一项相关联的第一权重、与所述第二项相关联的第二权重,与所述第三项相关联的第三权重以及与所述第四项相关联的第四权重。

根据本申请实施方式,所述多个规划的自动驾驶车辆状态对应于位于规划起始时间与规划结束时间之间的、由所述时间离散分辨率间隔开的时刻,以及其中,所述规划结束时间比所述规划起始时间晚所述轨迹时长。

根据本申请实施方式,所述多个优化输入还包括目标自动驾驶车辆最终状态。

附图说明

本公开的实施方式在附图的各图中以举例而非限制的方式示出,附图中的相同参考标记指示相似元件。

图1是示出根据一个实施方式的网络化系统的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3a至图3b是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4是示出根据一个实施方式的在xy平面下的sl坐标系下的车辆姿态的图示。

图5是示出根据一个实施方式的优化过程中涉及的各种示例性部件的框图。

图6是示出根据一个实施方式的用于规划adv处的最优轨迹的示例性方法的流程图。

图7是示出根据一个实施方式的数据处理系统的框图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是本公开的说明,而不应当解释为对本公开进行限制。描述了许多特定细节以提供对本公开的各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节,以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。

根据一些实施方式,提供了一种用于使用直接考虑道路/车道的形状的优化技术来生成时间最优轨迹的方法、设备和系统。具体地,轨迹优化器基于多个优化输入、多个优化约束和成本函数生成具有非线性优化的多个规划的自动驾驶车辆(adv)状态。然后所规划的adv状态可用于生成控制adv的控制信号。

在一个实施方式中,由轨迹优化器接收多个优化输入,多个优化输入包括轨迹时长、时间离散分辨率、adv起始状态、道路形状函数、最大急动度(加速度相对于时间的导数)和最大横向加速度。接收包括与最大急动度和最大横向加速度有关的约束的多个优化约束。接收与优化目标相关联的成本函数,成本函数包括与累积急动度有关的第一项和分别与最终纵向位置、最终纵向速度和最终纵向加速度有关的第二项、第三项和第四项。此后,通过轨迹优化器的非线性优化生成多个规划的adv状态作为优化结果,其中,该优化结果使成本函数的值最小化。然后基于多个规划的adv状态生成控制adv的控制信号。

在一个实施方式中,利用包括纵向维度和横向维度的sl坐标系,其中,纵向维度沿着参考线的切线方向,以及横向维度垂直于纵向维度。

在一个实施方式中,adv起始状态和多个规划的adv状态中的每个状态均包括纵向姿态、纵向速度和纵向加速度。在一个实施方式中,道路形状函数包括四次多项式函数形式的螺旋曲线的序列。在一个实施方式中,成本函数还包括与第一项相关联的第一权重、与第二项相关联的第二权重,与第三项相关联的第三权重以及与第四项相关联的第四权重。

在一个实施方式中,多个规划的adv状态对应于位于规划起始时间与规划结束时间之间的、由时间离散分辨率间隔开的时刻,并且其中,规划结束时间比规划起始时间晚轨迹时长。在一个实施方式中,多个优化输入还包括目标adv最终状态。

因此,本公开的一个实施方式涉及轨迹优化器,该轨迹优化器执行非线性优化并生成满足以下两个优化目标的、规划的adv状态:1)使累积急动度最小化,以及2)使车辆在轨迹时长的结尾尽可能地接近目标最终纵向位置,或者如果未指定目标最终纵向位置,则使车辆尽可能沿着参考线(即,纵向维度)的切线方向。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动车辆可通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(lan)、诸如互联网的广域网(wan)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(mpoi)服务器或位置服务器等。

自动驾驶车辆是指可被配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可包括传感器系统,所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。下文中,术语“自动车辆”和“自动驾驶车辆”(adv)可互换地使用。

在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可经由控制器局域网(can)总线通信地联接到彼此。can总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。

现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个相机211、全球定位系统(gps)单元212、惯性测量单元(imu)213、雷达单元214以及光探测和测距(lidar)单元215。gps单元212可包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。imu单元213可基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中,除感测对象之外,雷达单元214可另外感测对象的速度和/或前进方向。lidar单元215可使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,lidar单元215还可包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的,例如,通过将相机安装在旋转和/或倾斜平台上。

传感器系统115还可包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可集成为集成式油门/制动传感器。

在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。

返回参考图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可使用任何蜂窝通信网络或无线局域网(wlan),例如,使用wifi,以与另一部件或系统通信。无线通信系统112可例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储装置)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。可替代地,感知与规划系统110可与车辆控制系统111集成在一起。

例如,作为乘客的用户可例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可从mpoi服务器中获得位置和路线信息,所述mpoi服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且mpoi服务器提供地图服务和某些位置的poi。可替代地,此类位置和mpoi信息可本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可从交通信息系统或服务器(tis)获得实时交通信息。应注意,服务器103至104可由第三方实体进行操作。可替代地,服务器103至104的功能可与感知与规划系统110集成在一起。基于实时交通信息、mpoi信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。

服务器103可以是数据分析系统,从而为各种客户执行数据分析服务。在一个实施方式中,数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动车辆或由人类驾驶员驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括指示所发出的驾驶指令(例如,油门、制动、转向指令)以及由车辆的传感器在不同的时间点捕捉到的车辆的响应(例如,速度、加速、减速、方向)的信息。驾驶统计数据123还可包括描述不同时间点下的驾驶环境的信息,例如,路线(包括起始位置和目的地位置)、mpoi、道路状况、天气状况等。

基于驾驶统计数据123,出于各种目的,机器学习引擎122生成或训练一组规则、算法和/或预测模型124。在一个实施方式中,算法124可包括基于输入、约束和成本函数生成最优规划adv状态的优化算法。然后算法124可上传到adv上以在自动驾驶期间实时使用。

图3a和图3b是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可被实施为图1的自动驾驶车辆101的一部分,包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3a至图3b,感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线安排模块307、轨迹优化器308。

模块301至308中的一些或全部可以以软件、硬件或其组合实施。例如,这些模块可安装在永久性存储装置352中、加载到存储器351中,并且由一个或多个处理器(未示出)执行。应注意,这些模块中的一些或全部可通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至308中的一些可一起集成为集成模块。

定位模块301确定自动驾驶车辆300的当前位置(例如,利用gps单元212)以及管理与用户的行程或路线相关的任何数据。定位模块301(又称作为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图与路线信息311的其它部件通信,以获得行程相关数据。例如,定位模块301可从位置服务器和地图与poi(mpoi)服务器获得位置和路线信息。位置服务器提供位置服务,并且mpoi服务器提供地图服务和某些位置的poi,从而可作为地图与路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时,定位模块301也可从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可包括例如采用对象形式的车道配置、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。车道配置包括描述一个或多个车道的信息,诸如,例如车道的形状(例如,直线或弯曲)、车道的宽度、道路中的车道数量、单向或双向车道、合并或分开车道、出口车道等。

感知模块302可包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个相机采集的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中,计算机视觉系统可绘制环境地图,跟踪对象,以及估算对象的速度等。感知模块302也可基于由诸如雷达和/或lidar的其它传感器提供的其它传感器数据来检测对象。

针对每个对象,预测模块303预测对象在这种情况下将如何表现。预测是基于感知数据执行的,该感知数据在考虑一组地图/路线信息311和交通规则312的时间点感知驾驶环境。例如,如果对象为相反方向上的车辆且当前驾驶环境包括十字路口,则预测模块303将预测车辆是否可能会笔直向前移动或转弯。如果感知数据表明十字路口没有交通灯,则预测模块303可能会预测车辆在进入十字路口之前可能需要完全停车。如果感知数据表明车辆目前处于左转唯一车道或右转唯一车道,则预测模块303可能预测车辆将更可能分别左转或右转。

针对每个对象,决策模块304作出关于如何处置对象的决定。例如,针对特定对象(例如,交叉路线中的另一车辆)以及描述对象的元数据(例如,速度、方向、转弯角度),决策模块304决定如何与所述对象相遇(例如,超车、让行、停止、超过)。决策模块304可根据诸如交通规则或驾驶规则312的规则集来作出此类决定,所述规则集可存储在永久性存储装置352中。

路线安排模块307配置成提供从起始点到目的地点的一个或多个路线或路径。对于从起始位置到目的地位置的给定行程,例如从用户接收的给定行程,路线安排模块307获得路线与地图信息311,并确定从起始位置至到达目的地位置的所有可能路线或路径。路线安排模块307可生成地形图形式的参考线,它确定了从起始位置至到达目的地位置的每个路线。参考线是指不受其它诸如其它车辆、障碍物或交通状况的任何干扰的理想路线或路径。即,如果道路上没有其它车辆、行人或障碍物,则adv应精确地或紧密地跟随参考线。然后,将地形图提供至决策模块304和/或规划模块305。决策模块304和/或规划模块305检查所有可能的路线,以根据由其它模块提供的其它数据选择和更改最佳路线中的一个,其中,其它数据诸如为来自定位模块301的交通状况、由感知模块302感知到的驾驶环境以及由预测模块303预测的交通状况。根据时间点下的特定驾驶环境,用于控制adv的实际路径或路线可能接近于或不同于由路线安排模块307提供的参考线。

基于针对所感知到的对象中的每个的决定,规划模块305使用由路线安排模块307提供的参考线作为基础,为自动驾驶车辆规划路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。换言之,针对给定的对象,决策模块304决定对该对象做什么,而规划模块305确定如何去做。例如,针对给定的对象,决策模块304可决定超过所述对象,而规划模块305可确定在所述对象的左侧还是右侧超过。规划和控制数据由规划模块305生成,包括描述车辆300在下一移动循环(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可指示车辆300以30英里每小时(mph)的速度移动10米,随后以25mph的速度变到右侧车道。

作为规划过程的一部分,轨迹优化器308可基于成本函数313生成多个规划的adv状态,其中,成本函数313可存储在永久性存储装置352中。

基于规划和控制数据,控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息,以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如,油门、制动、转向命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中,规划阶段在多个规划周期(也称作为驾驶周期)中执行,例如,在每个时间间隔为100毫秒(ms)的周期中执行。对于规划周期或驾驶周期中的每一个,将基于规划和控制数据发出一个或多个控制命令。即,对于每100ms,规划模块305规划下一个路线段或路径段,例如,包括目标位置和adv到达目标位置所需要的时间。可替代地,规划模块305还可规定具体的速度、方向和/或转向角等。在一个实施方式中,规划模块305为下一个预定时段(诸如,5秒)规划路线段或路径段。对于每个规划周期,规划模块305基于在前一周期中规划的目标位置规划用于当前周期(例如,下一个5秒)的目标位置。控制模块306然后基于当前周期的规划和控制数据生成一个或多个控制命令(例如,油门、制动、转向控制命令)。

应注意,决策模块304和规划模块305可集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能,以确定自动驾驶车辆的驾驶路径。例如,导航系统可确定用于影响自动驾驶车辆沿着以下路径移动的一系列速度和前进方向:所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时,基本上避免感知到的障碍物。目的地可根据经由用户接口系统113进行的用户输入来设定。导航系统可在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可将来自gps系统和一个或多个地图的数据合并,以确定用于自动驾驶车辆的驾驶路径。

术语多项式优化或多项式拟合是指由多项式函数(例如,五次或四次多项式函数)表示的曲线形状(在该示例中,轨迹)的优化,使得曲线沿曲线是连续的(例如,可获得两个相邻段的连接处的导数)。在自动驾驶的领域中,从起始点到终点的多项式曲线被分成多个段(片段),每个段均与控制点(或参考点)相对应。这种分段多项式曲线称为分段多项式。当优化分段多项式时,除了初始状态约束和最终状态约束的集合之外,还必须满足两个相邻段之间的一组连接约束和一组边界约束。

该组连接约束包括位置(x,y)、速度、前进方向,并且相邻段的加速度必须相同。例如,第一段(例如,引导段)的结束位置和第二段(例如,下一段)的起始位置必须相同或在预定接近度内。第一段的结束位置的速度、前进方向和加速度与第二段的起始位置的相应速度、前进方向和的加速度必须相同或在预定范围内。此外,每个控制点均与预定边界(例如,控制点周围的左右0.2米)相关联。多项式曲线必须经过其相应边界内的每个控制点。当在优化期间满足这两组约束时,表示轨迹的多项式曲线应是平滑且连续的。

在一个实施方式中,在sl坐标系中规划轨迹。sl坐标系可相对于参考线进行限定。纵向距离或s距离表示沿参考线的切线方向的距离。相应地,横向距离或l距离表示垂直于s方向的距离。sl空间中的纵向维度表示特定对象与大概沿着参考线行驶的车辆的当前位置的纵向距离。sl空间中的横向维度表示在由纵向维度表示的特定时间或位置处对象与参考线之间的最短距离。sl空间中的这种图被称为sl图。在一个实施方式中,横向距离可简单地限定为距参考线的距离。因此,除了在笛卡尔坐标系(xy平面)中的表示之外,车辆姿态(位置)可在sl坐标系中表示为相对于参考线的有序对(纵向姿态“s-姿态”,横向姿态“l-姿态”)或简单地(s,l)。

参考图4,示出了根据一个实施方式的图示400,该图示400示出了在xy平面下的sl坐标系下的车辆姿态。车辆410在2d笛卡尔坐标系中具有姿态(x,y)。另外,车辆410姿态也可在相对于参考线420限定的sl坐标系下表示为(s,l)。

在sl坐标系中,车辆可具有s速度或纵向速度,该s速度或纵向速度是沿着参考线的切线方向的速度,并且可表示为(即,s姿态相对于时间的一阶导数)。车辆还具有s加速度或纵向加速度,该s加速度或纵向加速度是沿着参考线的切线方向的加速度,并且可表示为(即,s速度相对于时间的一阶导数,或s姿态相对于时间的二阶导数)。应当理解,在任何时刻,车辆的状态可在sl坐标系下由三元体表示。此外,车辆的急动度可表示为i和δt的含义将在下面详细说明。

此外,在sl坐标系中,车辆的横向加速度可表示为(即,s姿态相对于l-姿态的二阶导数)。

在一个实施方式中,轨迹优化器接收一个或多个输入,并在一个或多个约束下生成一个或多个优化输出,其中,优化输出是优化变量中的、使与一个或多个优化目标相关联的成本函数的值最小化的值。

在一个实施方式中,轨迹优化器的输入可包括:1)轨迹时长t;2)时间离散分辨率δt;3)车辆起始状态(即t=0时的车辆状态);4)道路形状函数κ(s);5)最大急动度6)最大横向加速度以及7)目标车辆最终状态

在不同的实施方式中,轨迹时长t可以是5秒、8秒或任何其它合适的时长。时间离散分辨率δt可以是100ms或任何其它合适的时间。另外,应当理解,如果不使用目标车辆最终状态,则可将se设置为无穷大(∞)。

在一个实施方式中,提供每个s位置处的参考线的曲率(即,半径的倒数或1/r)的道路形状函数κ(s)可以是分段四阶(四次)螺旋曲线的序列。四次螺旋曲线中的每个均可以是k(s)=as4+bs3+cs2+ds+e的形式。这样的道路形状函数κ(s)可通过使用四次螺旋曲线的序列来生成,以连接参考线的连续的、稀疏离散的点。通过使用四次螺旋曲线,保证曲线在连接点处直至二阶也是平滑的。这是期望的,因为在优化中约束需要是平滑的-需要一阶平滑并且期望二阶平滑。在传统方法中,参考线的形状由一系列密集离散点给出,并且线性函数用于连续点之间的内插。参考线的这种常规分段线性表示导致一阶导数的不连续性,因此不适合用于优化。

优化变量可以是在开始时间之后直至轨迹时长t的每个时间离散分辨率δt下的车辆状态其中,轨迹时长t对应于规划结束时间。换言之,优化变量可包括:(即,t=1δt时的车辆状态),(即,t=2δt时的车辆状态))等,包括直至最终状态(即,t=t=nδt时的车辆状态)的所有中间车辆状态。

在一个实施方式中,轨迹优化器在以下等式约束下操作:1)(对于1与n之间的任何i,包括端点),2)以及3)应当理解,等式约束1)至3)确保从一个δt到下一δt,si、si-1及之间的正确数学关系得到维护。

轨迹优化器还在以下不等式约束下操作:1)这确保了急动度决不超过任一方向上的最大急动度以及2)这确保了横向加速度决不超过任一方向上的最大横向加速度

在一个实施方式中,与目标相关联并且被最小化的成本函数可以是其中,w0,w1,w2和w3是可凭经验确定的权重。因此,应当理解,通过使成本函数最小化,优化在输入和约束的范围内产生满足以下多个目标的输出:1)使累积急动度最小化;2)使车辆在轨迹时长t的结尾尽可能地接近目标最终s-姿态se,或者如果未指定目标最终s-姿态se(即,设置为无穷大),则使车辆尽可能沿着参考线的切线方向;3)使车辆在轨迹时长t的结尾尽可能地接近目标最终s速度(例如,预定的非零目标s速度,用于例如停车标志的零目标s速度,或与前面车辆的速度相同的s速度);以及4)使车辆在轨迹时长t的结尾尽可能地接近目标最终s加速度(例如,零目标最终加速度)。这些目标的相对重要性由权重w0、w1、w2和w3控制。

参考图5,示出了框图500,该框图500示出了根据一个实施方式的优化过程中涉及的各种示例性部件。在一个实施方式中,轨迹优化器308可集成到图3a和3b的规划模块305中。轨迹优化器308接收输入520、约束530、优化变量540和与优化目标相关联的成本函数313。轨迹优化器308执行非线性优化并产生优化结果560,其中,优化结果560是优化变量540的、使成本函数313的值最小化的值。非线性优化在本领域中是公知的,因此本文中不再进一步详细描述。轨迹优化器308可以以硬件、软件或两者的组合来实施。

参考图6,示出了流程图,该流程图示出了根据一个实施方式的用于规划adv处的最优轨迹的示例性方法600。方法600可通过硬件、软件或两者的组合来执行。在框610处,可接收多个优化输入,该多个优化输入包括轨迹时长(t)、时间离散分辨率(δt)、自动驾驶车辆(adv)起始状态、道路形状函数(κ(s)),最大急动度和最大横向加速度。在框620处,可接收多个优化约束,该多个优化约束包括与最大急动度和最大横向加速度有关的约束。在框630处,可接收与优化目标相关联的成本函数,该成本函数包括与累积急动度有关的第一项、与最终纵向位置有关的第二项、与最终纵向速度有关的第三项以及与最终纵向加速度有关的第四项。在框640处,可利用非线性优化生成多个规划的adv状态作为优化结果,其中,该优化结果使成本函数的值最小化。在框650处,可基于多个规划的adv状态生成控制adv的控制信号。

在一个实施方式中,可利用包括纵向维度和横向维度的sl坐标系。纵向(s)维度沿参考线的切线方向,以及横向(l)维度垂直于纵向维度。adv起始状态和多个规划的adv状态中的每个状态均可包括纵向位置(s-姿态)、纵向速度(s-速度)和纵向加速度(s-加速度)。

道路形状函数可包括四次螺旋曲线的序列。成本函数还可包括与第一项相关联的第一权重(w0)、与第二项相关联的第二权重(w1)、与第三项相关联的第三权重(w2),以及与第四项相关联的第四权重(w3)。

多个规划的adv状态可对应于由规划起始时间(t=0)与规划结束时间(t=t)之间的时间离散分辨率(δt)间隔开的时刻,以及其中,规划结束时间比规划起始时间晚轨迹时长(t)。在一个实施方式中,多个优化输入还可包括目标adv最终状态。

应注意,如上文示出和描述的部件中的一些或全部可在软件、硬件或其组合中实施。例如,此类部件可实施为安装并存储在永久性存储装置中的软件,所述软件可通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。可替代地,此类部件可实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或asic)、数字信号处理器(dsp)或现场可编程门阵列(fpga))中的可执行代码,所述可执行代码可经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

图7是示出可与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图1的感知与规划系统110或者服务器103至104中的任一个以及图5的轨迹优化器308。系统1500可包括许多不同的部件。这些部件可实施为集成电路(ic)、集成电路的部分、分立电子装置或适用于电路板(诸如,计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。

还应注意,系统1500旨在示出计算机系统的许多部件的高阶视图。然而,应当理解的是,某些实施例中可具有附加的部件,此外,其它实施例中可具有所示部件的不同布置。系统1500可表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(pda)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(ap)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中,系统1500包括通过总线或互连件1308连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可表示一个或多个通用处理器,诸如,微处理器、中央处理单元(cpu)等。更具体地,处理器1501可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如,专用集成电路(asic)、蜂窝或基带处理器、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。

处理器1501(其可以是低功率多核处理器套接口,诸如超低电压处理器)可充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可实施为片上系统(soc)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可包括与可选的图形子系统1504通信的图形接口,图形子系统1504可包括显示控制器、图形处理器和/或显示装置。

处理器1501可与存储器1503通信,存储器1503在一个实施方式中可经由多个存储器装置实施以提供给定量的系统存储。存储器1503可包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(ram)、动态ram(dram)、同步dram(sdram)、静态ram(sram)或者其它类型的存储装置。存储器1503可存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或bios)和/或应用的可执行代码和/或数据可加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统,例如,机器人操作系统(ros)、来自公司的操作系统、来自苹果公司的mac来自公司的linux、unix,或者其它实时或嵌入式操作系统。

系统1500还可包括io装置,诸如装置1505至1508,包括网络接口装置1505、可选的输入装置1506,以及其它可选的io装置1507。网络接口装置1505可包括无线收发器和/或网络接口卡(nic)。所述无线收发器可以是wifi收发器、红外收发器、蓝牙收发器、wimax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(gps)收发器)或其它射频(rf)收发器或者它们的组合。nic可以是以太网卡。

输入装置1506可包括鼠标、触摸板、触敏屏幕(其可与显示装置1504集成在一起)、指针装置(诸如,手写笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。

io装置1507可包括音频装置。音频装置可包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其它io装置1507还可包括通用串行总线(usb)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,pci-pci桥)、传感器(例如,诸如加速度计运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可包括成像处理子系统(例如,相机),所述成像处理子系统可包括用于促进相机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(ccd)或互补金属氧化物半导体(cmos)光学传感器。某些传感器可经由传感器集线器(未示出)联接到互连件1308,而诸如键盘或热传感器的其它装置可根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储装置(未示出)也可联接到处理器1501。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储装置可经由固态装置(ssd)来实施。然而,在其它实施方式中,大容量存储装置可主要使用硬盘驱动器(hdd)来实施,其中较小量的ssd存储装置充当ssd高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可例如经由串行外围接口(spi)联接到处理器1501。这种闪存装置可提供系统软件的非易失性存储,所述系统软件包括所述系统的bios以及其它固件。

存储装置1508可包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质),其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可表示上述部件中的任一个,例如规划模块305、控制模块306和轨迹优化器308。处理模块/单元/逻辑1528还可在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内,数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可通过网络经由网络接口装置1505进行传输或接收。

计算机可读存储介质1509也可用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其它非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1528、部件以及其它特征可实施为分立硬件部件或集成在硬件部件(诸如,asics、fpga、dsp或类似装置)的功能中。此外,处理模块/单元/逻辑1528可实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。

应注意,虽然系统1500被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本公开的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可与本公开的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储装置、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“rom”)、随机存取存储器(“ram”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可按不同的顺序执行。此外,一些操作可并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下,可对本发明作出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1