用于自动驾驶车辆的基于2D约束平滑样条的平滑道路参考线路的制作方法

文档序号:17210436发布日期:2019-03-27 10:44阅读:252来源:国知局
用于自动驾驶车辆的基于2D约束平滑样条的平滑道路参考线路的制作方法

本公开的实施方式大体涉及操作自动驾驶车辆。更具体地,本公开的实施方式涉及用于自动驾驶车辆(adv)的平滑道路参考线路。



背景技术:

以自动驾驶模式运行(例如,无人驾驶)的车辆可以将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时,车辆可以使用车载传感器导航到各个位置,从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。

车辆可使用参考线路进行导航。参考线路是在不存在周围的障碍物时自动驾驶车辆应沿其驾驶的路径。平滑参考线路可使得车辆控制更加稳定。此外,路径规划轨迹的平滑(其也依赖于参考线路的平滑)和/或速度规划轨迹的平滑(其包括由车辆感知到的障碍物和/或交通信息)可使得车辆控制更加稳定。



技术实现要素:

为实现上述技术背景中所提及的问题,本申请提供一种用于生成自动驾驶车辆(adv)的最优参考线路的计算机实施的方法,非暂时性机器可读介质以及数据处理系统。

根据本申请一方面,公开了用于生成自动驾驶车辆(adv)的最优参考线路的计算机实施的方法,所述方法包括:确定以第一参考线路的多个控制点中的每个为中心具有预定尺寸的多个边界区域;选择多个二维多项式,所述多个二维多项式中的每个表示相邻的控制点之间的最优参考线路的段;对所述二维多项式限定约束集合,以至少确保所述多个二维多项式经过所述多个边界区域中的每个;对目标函数执行二次规划(qp)优化,使得在满足所述约束集合的情况下使所述目标函数的总成本达到最小值;以及基于所述二次规划优化生成表示所述最优参考线路的第二参考线路,以根据所述第二参考线路自动地控制所述自动驾驶车辆。

根据本申请另一方面,公开了非暂时性机器可读介质,所述非暂时性机器可读介质中存储有指令,所述指令在由处理器执行时使所述处理器执行操作,所述操作包括:确定以第一参考线路的多个控制点中的每个为中心具有预定尺寸的多个边界区域;选择多个二维多项式,所述多个二维多项式中的每个表示相邻的控制点之间的最优参考线路的段;对所述二维多项式限定约束集合,以至少确保所述多个二维多项式经过所述多个边界区域中的每个;对目标函数执行二次规划(qp)优化,使得在满足所述约束集合的情况下使所述目标函数的总成本达到最小值;以及基于所述二次规划优化生成表示所述最优参考线路的第二参考线路,以根据所述第二参考线路自动地控制所述自动驾驶车辆。

根据本申请又一方面,公开了数据处理系统,包括:处理器;以及存储器,联接至所述处理器并且存储指令,所述指令在由所述处理器执行时使所述处理器执行操作,所述操作包括:确定以第一参考线路的多个控制点中的每个为中心具有预定尺寸的多个边界区域;选择多个二维多项式,所述多个二维多项式中的每个表示相邻的控制点之间的最优参考线路的段;对所述二维多项式限定约束集合,以至少确保所述多个二维多项式经过所述多个边界区域中的每个;对目标函数执行二次规划(qp)优化,使得在满足所述约束集合的情况下使所述目标函数的总成本达到最小值;以及基于所述二次规划优化生成表示所述最优参考线路的第二参考线路,以根据所述第二参考线路自动地控制所述自动驾驶车辆。

附图说明

通过示例的方式而不是限制的方式在附图的各图中示出本公开的实施方式,在附图中相同的参考标记指示相同的元件。

图1是示出根据一个实施方式的联网系统的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3a和图3b是示出根据某些实施方式的由自动驾驶车辆使用的感知和规划系统的示例的框图。

图4是示出根据一个实施方式的决策和规划过程的示例的框图。

图5a是示出根据一个实施方式的决策模块的示例的框图。

图5b是示出根据一个实施方式的规划模块的示例的框图。

图6是示出根据一个实施方式的平滑模块的示例的框图。

图7是示出根据一个实施方式的道路段的示例的图。

图8是示出根据一个实施方式的方法的流程图。

图9是示出根据一个实施方式的路径优化过程的示例的流程图。

图10a至图10c是示出根据某些实施方式的路径轨迹的示例的图。

图11是示出根据一个实施方式的方法的流程图。

图12a至图12c是示出根据某些实施方式的示例性行驶距离-时间(station-time)曲线图。

图13是示出根据一个实施方式的方法的流程图。

图14是示出根据一个实施方式的数据处理系统的框图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面,附图将示出所述各种实施方式。下列描述和附图是对本公开的说明,而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而,在某些情况下,并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部指同一实施方式。

根据某些实施方式,adv包括决策和规划系统,该决策和规划系统从路线导航模块(routingmodule)检索地图和路线信息并且将地图和路线信息转换成平滑的路径和平滑的速度驾驶轨迹。例如,基于起始位置和结束位置,系统针对本地地图和路线数据向路线导航模块进行查询并且基于二次规划优化生成平滑参考线路。基于平滑参考线路,路径规划模块可基于所感知的障碍物和/或交通信息生成平滑的路径轨迹。基于平滑的路径轨迹,速度规划模块可生成平滑的速度轨迹,使得通过平滑的路径轨迹和平滑的速度轨迹控制adv在不发生碰撞的情况下沿着路径平稳地行驶。

根据一个方面,系统确定以第一参考线路的多个控制点中的每一个为中心的、具有预定尺寸的多个边界区域。系统选择各自代表相邻控制点之间的最佳参考线路的段的多个二维多项式。系统对二维(2d)多项式限定约束集合,以至少确保二维多项式通过边界区域中的每一个。系统对目标函数执行二次规划(qp)优化,使得在满足约束集合的情况下目标函数的总成本达到最小值。系统基于qp优化生成表征最佳参考线路的第二参考线路,以根据第二参考线路自动控制adv。

根据另一方面,系统将自adv的起始位置所选择的第一路径轨迹分段成多个路径段,其中每个路径段由多项式函数表征。系统根据路径段的多项式函数选择用于对各路径段之间的连结处进行平滑的目标函数。系统至少根据由adv感知的道路边界以及障碍物,基于相邻路径段对路径段的多项式函数限定约束集合。系统根据所添加的约束对目标函数执行二次规划(qp)优化,使得在满足约束集合的情况下目标函数的输出达到最小值。系统通过基于qp优化的已优化的目标函数来生成表征路径轨迹的第二路径轨迹,以根据第二路径轨迹自动控制adv。

根据又一方面,系统选择表征持续时间的多个时间段的多个多项式,以使路径轨迹完整。系统基于多个成本函数来选择目标函数以对各时间段之间的速度进行平滑。系统对多项式限定约束集合,以至少确保多项式平滑地连结。系统根据所添加的约束对目标函数执行二次规划(qp)优化,使得在满足约束集合的情况下与目标函数关联的成本达到最小值。系统基于已优化的目标函数生成对于持续时间的平滑速度,以自动控制adv。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1,网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆,但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络,例如,有线或无线的局域网(lan)、诸如互联网的广域网(wan)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集,诸如,网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(mpoi)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆,在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统,所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。

在一个实施方式中,自动驾驶车辆101包括,但不限于,感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件,诸如:发动机、车轮、方向盘、变速器等,所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制,该多种通信信号和/或命令例如,加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如,部件110至115可以经由控制器局域网(can)总线通信地联接到彼此。can总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议,但也用于许多其它环境。

现在参考图2,在一个实施方式中,传感器系统115包括但不限于一个或多个摄像机211、全球定位系统(gps)单元212、惯性测量单元(imu)213、雷达单元214以及光探测和测距(lidar)单元215。gps系统212可以包括收发器,所述收发器可操作以提供关于自动驾驶车辆的位置的信息。imu单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在某些实施方式中,除感测对象之外,雷达单元214可以另外感测对象的速度和/或前进方向。lidar单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外,lidar单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。摄像机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。摄像机211可以是静物摄像机和/或视频摄像机。摄像机可以是可机械地移动的,例如,通过将摄像机安装在旋转和/或倾斜平台上。

传感器系统115还可以包括其它传感器,诸如:声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如,麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下,油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中,车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度,电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意,如图2所示的部件可以以硬件、软件或其组合实施。

回到图1,无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如,无线通信系统112可以与一个或多个装置直接无线通信,或者经由通信网络进行无线通信,诸如,通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(wlan),例如,使用wifi,以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如,乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的一部分,包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理,尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如,处理器、存储器、存储设备)和软件(例如,操作系统、规划和路线安排程序),以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息,处理所接收的信息,规划从起始点到目的地点的路线或路径,随后基于规划和控制信息来驾驶车辆101。替代地,感知与规划系统110可以与车辆控制系统111集成在一起。

例如,作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如,感知与规划系统110可以从mpoi服务器中获得位置和路线信息,所述mpoi服务器可以是服务器103至104的一部分。位置服务器提供位置服务,并且mpoi服务器提供地图服务和某些位置的poi。替代地,此类位置和mpoi信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时,感知与规划系统110也可以从交通信息系统或服务器(tis)获得实时交通信息。应注意,服务器103至104可以由第三方实体进行操作。替代地,服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、mpoi信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如,障碍物、对象、附近车辆),感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101,以安全且高效到达指定目的地。

服务器103可以是针对各种客户端执行数据分析服务的数据分析系统。在一个实施方式中,数据分析系统103包括数据采集器121和机器学习引擎122。数据采集器121从各种车辆(自动驾驶车辆或由人类驾驶员驾驶的常规车辆)采集驾驶统计数据123。驾驶统计数据123包括这样的信息,该信息指示在不同时间点处发布的驾驶命令(例如,油门命令、刹车命令、转向命令)以及由车辆的传感器获取的车辆响应(例如,速度、加速、减速、方向)。驾驶统计数据123还可包括描述在不同时间点处的驾驶环境的信息,例如,路径(包括起始位置和目的地位置)、mpoi、道路条件、天气条件等。

出于多种目的,机器学习引擎122基于驾驶统计数据123生成或训练规则、算法和/或预测模型124的集合。在一个实施方式中,例如,算法124可包括用于对路径规划和速度规划进行优化的优化方法。优化方法可包括用于表征路径段或时间段的成本函数和多项式函数的集合。这些函数可上传到自动驾驶车辆上以用于实时生成平滑路径。

图3a和图3b是示出与根据一个实施方式的自动驾驶车辆一起使用的感知和规划系统的示例的框图。系统300可实现为图1的自动驾驶车辆101的一部分,包括但不限于感知和规划系统110、控制系统111和传感器系统115。参照图3a至图3b,感知和规划系统110包括但不限于:位置管理模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306、路线导航模块307以及平滑模块308。

模块301-308中的一些或全部可以以软件、硬件或它们的组合来实现。例如,这些模块可安装在永久性存储装置352中、加载到存储器351中并且被一个或多个处理器(未示出)执行。注意,这些模块中的一些或全部可通信地联接至图2的车辆控制系统111的一些或全部模块或者与这些模块集成。模块301-308中的一些可集成在一起作为集成模块。例如,决策模块304和规划模块305可集成为单个模块,路线导航模块307和平滑模块308可集成为单个模块。

位置管理模块301确定自动驾驶车辆300的当前位置(例如,利用gps单元212)并且管理与用户的行程或路线相关的任何数据。位置管理模块301(也称为地图和路线模块)管理与用户的行程或路线相关的任何数据。用户可登陆用户接口并且例如经由用户接口指定行程的起始位置和目的地。位置管理模块301与自动驾驶车辆300的其他组件(诸如,地图和路径信息311)通信,以获得行程相关数据。例如,位置管理模块301可从位置服务器以及地图和poi(mpoi)服务器获得位置和路线信息。位置服务器提供位置服务,mpoi服务器提供地图服务和某些位置的poi,其可作为地图和路径信息311的一部分被缓存。当自动驾驶车辆300沿着路径移动时,位置管理模块301还可从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息,感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括例如采用对象形式的车道配置(例如,直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如,停止标志、让行标志)等。

感知模块302可以包括计算机视觉系统或计算机视觉系统的功能,以处理并分析由一个或多个摄像机采集的图像,从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在某些实施方式中,计算机视觉系统可以绘制环境地图,跟踪对象,以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或lidar的其它传感器提供的其它传感器数据来检测对象。

对于对象中的每一个,预测模块303预测车辆在环境下将采取什么行为。预测是根据地图/路线信息311和交通规则312的集合、基于感知数据(在某个时间点处感知驾驶环境)来执行的。例如,如果对象是相反方向上的车辆并且当前驾驶环境包括交叉路口,则预测模块303将预测车辆将可能直线向前移动还是进行转弯。如果感知数据指示交叉路口存在交通灯,则预测模块303可预测车辆可能在进入交叉路口之前必须完全停止。如果感知数据指示车辆当前处于仅左转车道或仅右转车道,则预测模块303可预测车辆将更可能分别进行左转弯或右转弯。

对于对象中的每一个,决策模块304做出与如何处理对象有关的决定。例如,对于特定对象(例如,处于交叉路线中的另一车辆)以及描述该对象的元数据(例如,速度、方向、转弯角度),决策模块304决定针对对象采取何种措施(例如,赶超、让路、停车、经过)。决策模块304可根据规则集合(诸如,交通规则或驾驶规则312)做出这样的决定,其可存储在永久性存储装置352中。

基于针对所感知的对象中的每一个的决定,规划模块305规划自动驾驶车辆的路径或路线以及驾驶参数(例如,距离、速度和/或转弯角度)。换言之,对于给定对象,决策模块304决定对对象做什么,而规划模块305确定怎么做。例如,对于给定对象,决策模块304可决定经过对象,而规划模块305可确定是在左侧经过对象还是在右侧经过对象。通过规划模块305生成规划和控制数据,包括描述车辆300在下一移动周期(例如,下一路线/路径段)中将如何移动的信息。例如,规划和控制数据可指示车辆300以30英里每小时(mph)的速度移动10米,然后以25mph的速度改变到右车道。

基于规划和控制数据,控制模块306根据通过规划和控制数据限定的路线或路径、通过向车辆控制系统111发送适当的命令或信号来控制并驾驶自动驾驶车辆。规划和控制数据包括这样的信息,该信息足够在不同时间点利用适当的车辆设置或驾驶参数(例如,油门、刹车和转向命令)使车辆沿着路径或路线从路线或路径的第一点驾驶到路线或路径的第二点。

在一个实施方式中,在多个规划周期(也称为命令周期)中执行规划步骤,例如,在每个100毫秒(ms)的时间间隔中执行规划步骤。对于规划周期或命令周期中的每一个,将基于规划和控制数据发布一个或多个控制命令。换言之,对于每个100ms,规划模块305规划下一路线段或路径段,例如,包括目标位置和adv到达目标位置所需要的时间。可替代地,规划模块305可进一步指定特定速度、方向和/或转向角度等。在一个实施方式中,规划模块305针对下一预定时间段(诸如5秒)规划路线段或路径段。对于每个规划周期,规划模块305基于在先前周期中规划的目标位置来规划用于当前周期(例如,下一个5秒)的目标位置。控制模块306之后基于当前周期的规划和控制数据生成一个或多个控制命令(例如,油门、刹车、转向控制命令)。

注意,决策模块304和规划模块305可集成为集成模块。决策模块304/规划模块305可包括导航系统或导航系统的功能,以确定用于自动驾驶车辆的驾驶路径。例如,导航系统可确定影响自动驾驶车辆沿着如下一种线路移动的一系列速度和前进方向,其中,所述路径在大致使自动驾驶车辆沿着基于车行道的、通向最终目的地的路径前进的情况下基本避免所感知的障碍物。目的地可经由用户接口系统113根据用户输入设定。当自动驾驶车辆操作时,导航系统可动态地更新驾驶路径。导航系统可将来自gps系统的数据和一个或多个地图合并,以确定自动驾驶车辆的驾驶路径。

决策模块304/规划模块305还可包括防撞系统或防撞系统的功能,以识别、评估和躲避或越过自动驾驶车辆的环境中的潜在障碍物。例如,防撞系统可通过操作控制系统111中的一个或多个子系统影响自动驾驶车辆的导航中的改变,以采取转向动作(swervingmaneuver)、转弯动作、刹车动作等。防撞系统可基于周围交通模式、道路条件等,自动地确定可行的障碍物躲避动作。防撞系统可配置为使得:当其他传感器系统检测到自动驾驶车辆附近的、其将要进入的区域中存在车辆、建筑物、障碍物等时,不采取转向动作。防撞系统可自动地选择既可用又使自动驾驶车辆乘员的安全性最大化的动作。防撞系统可选择预测会在自动驾驶车辆的乘客舱中产生最小的加速度的躲避动作。

路线导航模块307例如可从地图信息(诸如,道路段的信息、道路段的车行道以及从车道到路缘的距离)生成参考路径。例如,道路可分成表示三个道路段的区间或段{a、b和c}。道路段a的三个车道可列举为{a1、a2和a3}。通过沿着参考路线生成参考点来生成参考路线。例如,对于车行道,路线导航模块307可将由地图数据提供的车行道的两个相对的路缘或端部之间的中间点连接。基于中间点以及表征所采集的先前在不同时间点在车行道上行驶的车辆的数据点的机器学习数据,路线导航模块307可通过选择在车行道的预定接近度内所采集的数据点的子集以及根据所采集的数据点的子集对中间点应用平滑函数来计算参考点。

基于参考点或车道参考点,路线导航模块307可通过内插参考点来生成参考线路,使得使用所生成的参考线路作为用于控制车行道上的adv的参考线路。在某些实施方式中,实时地将表征参考线路的参考点表和道路段表下载到adv,使得adv可基于adv的地理位置和驾驶方向生成参考线路。例如,在一个实施方式中,adv可通过经由表征即将来临的前方道路区间的路径段标识符和/或基于adv的gps位置请求对于路径段的路线制订服务,来生成参考线路。基于路径段标识符,路线制订服务可向adv返回参考点表,其中该参考点表包括感兴趣的道路段的全部车道的参考点。adv可针对路径段的车道查找参考点,以生成用于控制车行道上的adv的参考线路。

平滑模块308可基于由路线导航模块307提供的参考线路生成平滑的道路参考线路。例如,平滑模块308沿着参考线路选择多个控制点。在一个实施方式中,控制点可以是由路线导航模块307提供的参考线路的参考点或者沿着参考线路的、以近似相等的距离与其相邻点间隔开的内插点。平滑模块308在每个控制点周围添加表征边界区域(例如,具有预配置大小和/或方向的边界框)的约束集合。平滑模块308添加连接平滑度约束的集合,以确保表征相邻控制点之间的参考线路的各段的多个分段多项式平滑地连结。平滑模块308选择具有核函数或加权函数的集合的目标函数,其中,分段多项式将指向所述目标函数。平滑模块308使用二次规划求解器来优化目标函数以生成平滑的道路参考线路。

如上所述,路线或路线导航模块307管理与用户的行程或路线相关的任何数据。adv的用户指定起始位置和目的地位置以获得行程相关数据。行程相关数据包括路线段以及路线段的参考线路或参考点。例如,基于路线地图信息311,路线模块307生成路线或道路段表以及参考点表。参考点与道路段表中的道路段和/或车道有关。可内插参考点来形成用于控制adv的一个或多个参考线路。可对道路段和/或道路段的特定车道指定参考点。

例如,道路段表可以是包括用于道路段a-d的先前道路车道和下一道路车道的名称-值对。例如,道路段表可以是:用于具有车道1的道路段a-d的{(a1,b1),(b1,c1),(c1,d1)}。参考点表可包括用于道路段车道的x-y坐标中的参考点,例如,{(a1,(x1,y1)),(b1,(x2,y2)),(c1,(x3,y3)),(d1,(x4,y4))},其中,a1…d1表示道路段a-d的车道1,以及(x1,y1)…(x4,y4)是相应的真实世界坐标。在一个实施方式中,道路段和/或车道划分成预定长度,诸如大约200米的段/车道。在另一实施方式中,道路段和/或车道根据道路条件(诸如道路曲率)划分成长度可变的段/车道。在某些实施方式中,每个道路段和/或车道可包括多个参考点。在某些实施方式中,参考点可转换至其他坐标系,例如,经度-纬度。

在某些实施方式中,参考点可转换到相对坐标系中,诸如,行驶距离-横向偏移(station-lateral;sl)坐标。行驶距离-横向偏移坐标系是参考固定的参考点来追踪参考线路的坐标系。例如,(s,l)=(1,0)坐标可表示在横向偏移量为零米的情况下参考线路上的静止点(即,参考点)前方一米处。(s,l)=(2,1)参考点可表示沿着参考线路的静止参考点前方两米处并且从参考线路具有一米的横向偏移量,例如,向左侧偏移一米。

在一个实施方式中,平滑模块308基于表征由路线导航模块307提供的参考线路的参考点来生成平滑参考线路。在决策模块和/或规划模块(诸如决策模块304和/或规划模块305)将平滑参考线路与所感知的障碍物和/或交通信息合并之前,可将平滑参考线路转换成相对坐标系(诸如,sl坐标系)。

在一个实施方式中,决策模块304基于由路线导航模块307提供的参考线路(所述参考线路已经如上所述通过平滑模块308进行平滑)以及基于由adv感知的围绕adv的障碍物和/或交通信息,生成粗略的路径配置文件。粗略的路径配置文件可以是可存储在永久性存储装置352中的路径/速度配置文件313的一部分。通过沿着参考线路选择点来生成粗略的路径配置文件。对于各点中的每一个,决策模块304基于关于针对对象采取何种措施的一个或多个障碍物决策,使点向参考线路的左侧或右侧移动(例如,候选移动),而各点中的剩余点保持不动。在利用成本函数(作为图3a的成本函数315的一部分)搜索具有最低路径成本的路径候选项的过程中,利用对路径候选项进行动态规划来迭代地执行候选移动,由此生成粗略的路径配置文件。成本函数的示例包括基于以下的成本:路线路径的曲率、从adv到所感知的障碍物的距离以及adv到参考线路的距离。在一个实施方式中,所生成的粗略的路径配置文件包括行驶距离-横向偏移地图,作为可存储在永久性存储装置352中的sl地图/st曲线图314的一部分。

在一个实施方式中,决策模块304基于所生成的粗略的路径配置文件生成粗略的速度配置文件(作为路径/速度配置文件313的一部分)。粗略的速度配置文件是指在控制adv的特定时间点处的最佳速度。类似于粗略的路径配置文件,利用动态规划对在不同时间点的候选速度进行迭代,以根据由adv感知的障碍物、基于成本函数(作为图3a的成本函数315的一部分)求解具有最低速度成本的速度候选项(例如,加速或减速)。粗略的速度配置文件决定adv是否应当赶超或躲避障碍物以及向障碍物左侧还是右侧赶超或躲避。在一个实施方式中,粗略的速度配置文件包括行驶距离-时间(station-time;st)曲线图(作为sl地图/st曲线图314的一部分)。行驶距离-时间曲线图是指相对于时间行进的距离。

在一个实施方式中,规划模块305根据障碍物决策和/或人为屏障重新计算粗略的路径配置文件,以禁止规划模块305搜索屏障的几何空间。例如,如果粗略的速度配置文件确定成从左侧绕行(nudge)障碍物,则规划模块305可在障碍物的右侧设置屏障(呈障碍物形式),以避免对于adv从右侧绕行障碍物的情况进行计算。在一个实施方式中,通过利用二次规划(qp)对路径成本函数(作为成本函数315的一部分)进行优化来重新计算粗略的路径配置文件。在一个实施方式中,重新计算的粗略的路径配置文件包括行驶距离-横向偏移地图(作为sl地图/st曲线图314的一部分)。

在一个实施方式中,规划模块305利用二次规划(qp)重新计算粗略的速度配置文件,以优化速度成本函数(作为成本函数315的一部分)。可添加相似的速度屏障约束,以禁止qp求解器搜索一些被禁止的速度。在一个实施方式中,重新计算的粗略的速度配置文件包括行驶距离-时间曲线图(作为sl地图/st曲线图314的一部分)。

应注意,如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如,此类部件可以实施为安装并存储在永久性存储装置中的软件,所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。替代地,此类部件可以实施为编程或嵌入到专用硬件(诸如,集成电路(例如,专用集成电路或asic)、数字信号处理器(dsp)或现场可编程门阵列(fpga))中的可执行代码,所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外,此类部件可以实施为处理器或处理器内核中的特定硬件逻辑,作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

图4是示出根据一个实施方式的决策和规划过程的示例的框图。图5a是示出根据一个实施方式的决策模块的示例的框图。图5b是示出根据一个实施方式的规划模块的示例的框图。参照图4,决策和规划过程400包括路线导航模块307、平滑模块308(可与路线导航模块307集成)、位置管理/数据感知401、路径决策过程403、速度决策过程405、路径规划过程407、速度规划过程409、聚合器411以及轨迹计算器413。

可分别通过图5a中的决策模块304的路径决策模块501和速度决策模块503来执行路径决策过程403和速度决策过程405。参照图4和图5a,路径决策过程403或路径决策模块501包括路径状态机505、路径交通规则507以及行驶距离-横向偏移地图生成器509。路径决策过程403或路径决策模块501可利用动态规划生成粗略的路径配置文件作为用于路径规划过程407/速度规划过程409的初始约束。在一个实施方式中,路径状态机505包括至少三个状态:慢行(cruising)、变道和空闲状态。路径状态机505提供先前规划结果和重要信息,诸如adv是慢行还是变道。路径交通规则507(作为图3a的驾驶/交通规则312的一部分)包括可能影响路径决策模块的结果的交通规则。例如,路径交通规则507可包括交通信息(诸如,施工交通标志),由此adv可利用这样的施工标志避开车道。根据状态、交通规则、由路线导航模块307提供的参考线路以及由adv感知的障碍物,路径决策过程403可决定如何对待所感知的障碍物(即,忽视、赶超、让路、停止、经过),这作为粗略的路径配置文件的一部分。

例如,在一个实施例中,通过由成本构成的成本函数、基于路径的曲率以及从参考线路和/或参考点到障碍物的距离来生成粗略的路径配置文件。参考线路上的点被选择并且向参考线路的左侧或右侧移动作为表征路径候选项的候选移动。每一个候选移动具有关联的成本。对于最佳成本,可通过动态规划一次一个点顺序地求解参考线路上的一个或多个点的候选移动的关联成本。在一个实施方式中,sl地图生成器509生成行驶距离-横向偏移地图,作为粗略的路径配置文件的一部分。行驶距离-横向偏移地图是包括由adv感知的障碍物信息的二维几何地图(类似于x-y坐标平面)。根据sl地图,路径决策过程403可布置遵循障碍物决策的adv路径。动态规划(或动态优化)是这样的数学优化方法,其将待解决的问题分解成一系列值函数,对这些值函数中的每一个仅进行一次求解并存储它们的解。同一值函数下次出现时,简单地查找先前计算的解,而不是重新计算其解,从而节约计算时间。

速度决策过程405或速度决策模块503包括速度状态机511、速度交通规则513和行驶距离-时间曲线图生成器515。速度决策过程405或速度决策模块503可利用动态规划生成粗略的速度配置文件作为对于路径规划过程407/速度规划过程409的初始约束。在一个实施方式中,速度状态机511包括至少两个状态:加速状态和减速状态。速度交通规则513(作为图3a的驾驶/交通规则312的一部分)包括可能影响速度决策模块的结果的交通规则。例如,速度交通规则513可包括交通信息,诸如红/绿交通灯、交叉路线中的另一车辆等。根据速度状态机的状态、速度交通规则、通过路径决策过程403生成的粗略的路径配置文件/sl地图以及所感知的障碍物,速度决策过程405可生成粗略的速度配置文件以控制adv何时加速和/或减速。行驶距离-时间曲线图生成器515可生成行驶距离-时间曲线图,其作为粗略的速度配置文件的一部分。

参照图4和图5b,路径规划过程407或路径规划模块521包括行驶距离-横向偏移地图525、几何平滑器527以及路径成本模块529。行驶距离-横向偏移地图525可包括由路径决策过程403的sl地图生成器509生成的行驶距离-横向偏移地图。路径规划过程407或路径规划模块521可使用粗略的路径配置文件(例如,行驶距离-横向偏移地图)作为初始约束,以利用二次规划重新计算最佳参考线路。二次规划包括将受到界限、线性等式和/或不等式约束的目标函数(例如,具有若干变量的二次函数)最小化或最大化。动态规划和二次规划之间的一个差异是,二次规划针对参考线路上的所有点一次性地优化全部候选移动。几何平滑器527可对输出的行驶距离-横向偏移地图应用平滑算法(诸如b样条或回归)。路径成本模块529可利用路径成本函数(作为图3a的成本函数315的一部分)重新计算参考线路,以优化对于参考点的候选移动的总成本,例如,利用由qp模块540执行的qp优化来进行优化。

速度规划过程409或速度规划模块523包括行驶距离-时间曲线图531、序列平滑器533以及速度成本模块535。行驶距离-时间曲线图531可包括由速度决策过程405的st曲线图生成器515生成的行驶距离-时间(st)曲线图。速度规划过程或速度规划模块523可使用粗略的速度配置文件(例如,行驶距离-时间曲线图)和来自路径规划过程407的结果作为初始约束,以计算最佳行驶距离-时间曲线。序列平滑器533可对点的时间序列应用平滑算法(诸如b样条或回归)。速度成本模块535可利用速度成本函数(作为图3a的成本函数315的一部分)重新计算st曲线图,以优化在不同时间点对于移动候选项(例如,加速/减速)的总成本。

聚合器411执行将路径和速度规划结果聚合的函数。例如,在一个实施方式中,聚合器411可将二维st曲线图和sl地图组合成三维slt图形。在另一实施方式中,聚合器411可基于sl参考线或st曲线上的2个连续点进行内插(或填充附加的点)。在另一实施方式中,聚合器411可将参考点从(s,l)坐标转换成(x,y)坐标。轨迹计算器413可计算最终轨迹以控制adv。例如,轨迹计算器413基于由聚合器411提供的slt图形,计算指示adc应当何时经过特定(x,y)坐标的点(x,y,t)的列表。

因此,返回参照图4,路径决策过程403和速度决策过程405考虑障碍物和/或交通条件来生成粗略的路径配置文件和粗略的速度配置文件。考虑到与障碍物有关的所有路径和速度决策,路径规划过程407和速度规划过程409根据障碍物利用qp规划对粗略的路径配置文件和速度配置文件进行优化,以生成具有最少路径成本和/或速度成本的最佳轨迹。

图6是示出根据一个实施方式的平滑模块的示例的框图。参照图6,平滑模块601可以是图3a至图3b的平滑模块308。平滑模块601可基于二维(2d)样条(例如,二维分段多项式)应用平滑优化。平滑模块601可包括但不限于约束模块603、边界盒模块605和目标函数模块607。约束模块603可限定优化问题必须满足的对基本约束、限制、约束或条件的定义。约束模块603可包括但不限于:初始约束611、等式约束613和不等式约束615。初始约束611包括与adv的初始条件(例如,adv的紧接着的方向和/或地理位置)对应的约束集合。等式约束613包括推断必须满足的一些等式条件的等式约束集合。例如,等式约束613可包括确保满足连接平滑度和/或一些逐点约束的约束集合(例如,样条将经过一些点或者具有一些特定前方点)。不等式约束615包括确保样条处于一些边界内(例如,小于或大于一些约束值)的不等式约束集合。例如,不等式约束615可包括确保样条将经过一些边界的约束集合。不等式和等式约束二者均是强制约束,这意味着要求满足它们。边界盒模块605可围绕每个控制点构建边界区域(例如,边界盒)。目标函数模块607可生成一个或多个核作为二次规划优化的目标函数参数。

图7是示出根据一个实施方式的道路段的示例的框图。参照图7,道路段700可以是围绕adv的路线段。在一个实施方式中,路线导航模块307基于adv的gps位置为adv提供地图和路线段信息。地图和路线段信息可包括多个控制点,诸如用于道路段700的控制点701。控制点701可选择成近似等距地间隔开,例如间隔大约五至十米,从而基于地图信息和/或所采集的人类驾驶数据呈现道路段700的粗略的参考线路。

在一个实施方式中,基于控制点701,平滑模块(诸如图6的平滑模块601)应用2d样条优化,以生成用于控制adv的平滑参考线路(诸如样条705)。样条是通过连结以形成曲线的一个或多个(例如,分段的)多项式表征的曲线。例如,多项式或多项式函数可表示相邻的控制点701之间的段。在一个实施方式中,样条内的每个多项式函数可以是二维多项式,例如:

x(t)=p0+p1t+p2t2+…+pntn,以及

y(t)=q0+q1t+q2t2+…+qntn

其中,x、y表示n阶多项式的二维(x,y)几何坐标,以及p0..n和q0..n是待求解的二维多项式的系数。

在另一实施方式中,多项式函数可以是一维的。例如,

l(s)=p0+p1s+p2s2+…+pnsn

其中,s、l表示对于n阶多项式的行驶距离-横向偏移一维(s,l)几何坐标,以及p0..n是待求解的一维多项式的系数。

参照图6和图7,在一个实施方式中,平滑模块601针对样条或分段多项式配置多项式的阶数,以确保样条平滑度的期望阈值。在一个实施方式中,分段多项式可预配置成五阶多项式。基于控制点701,边界盒模块605限定边界区域,诸如,具有预定义尺寸(诸如大约0.2米×0.2米)的边界盒703,以包围每个控制点701。边界区域可表示平滑参考线路(例如,样条或分段多项式)705必须触及或经过的不等式约束(作为不等式约束615的一部分)。例如,对于在(x(1),y(1))处的样条,具有0.2米×0.2米边界盒的控制点(x1,y1)可包括诸如以下的不等式约束:

x1-0.1≤x(1)≤x1+0.1,以及

y1-0.1≤y(1)≤y1+0.1

其中,(x1,y1)是控制点的x-y坐标,以及(x(1),y(1))是控制点附近的样条的x-y坐标。

等式约束613或不等式约束615可包括作为施加在边界盒703上的方向约束的边缘704,因此样条将具有特定前方点。在某些实施方式中,约束模块603添加连结约束集合(作为等式约束613的一部分)以确保连接平滑度,例如,

x2(t)=x1(t)andy2(t)=y1(t)

x′2(t)=x′1(t)andy′2(t)=y′1(t)

x″2(t)=x″1(t)andy″2(t)=y″1(t)

其中,x1(t)和x2(t)是值t下的两个相邻x多项式;y1(t)和y2(t)是值t下的两个相邻的y多项式;以及x1'(t)、y1'(t)、x1″(t)和y1″(t)是二维分段多项式在值t下的一阶导数和二阶导数。这里,二阶导数等式约束确保相邻点之间的连接平滑度具有某一阈值。

约束模块603可对分段多项式增加初始约束集合(作为初始约束611的一部分)。初始约束集合可与adv的当前地理位置和/或当前前进方向对应,例如:

x(0)=x0andy(0)=y0

x′(0)=dx0andy′(0)=dy0

其中,(x0,y0)是adv的地理位置的当前x-y坐标;(dx0,dy0)是adv的当前方向;以及x(0),y(0)与一阶x-y多项式的初始值对应。在某些实施方式中,约束模块603可添加与adv到达目的地点时的adv的位置和方向对应的结束约束集合。

在某些实施方式中,平滑模块601可选择具有多个核的目标函数(作为目标函数607的一部分)或样条将指向的成本函数。示例性目标函数可包括平滑核和/或引导核,诸如:

其中,x(t),y(t)是x-y二维分段多项式;w1,…,w8是加权因子;(x')2(t),(y')2(t)是分段多项式的一阶导数平方;(x″)2(t),(y″)2(t)是分段多项式的二阶导数平方;(x″′)2(t),(y″′)2(t)是分段多项式的三阶导数平方;以及xref(t),yref(t)是来自先前采集的数据的平均人类驾驶路线的x-y参考路线值。

在一个实施方式中,qp求解器(诸如由图5b的优化模块540执行的qp优化)可求解目标函数以生成平滑参考线路。在一个实施方式中,对目标函数执行qp优化,使得在满足约束集合的情况下目标函数达到预定阈值(例如,最小值)。一旦目标函数已经根据约束被优化,则可确定多项式函数的系数。之后,可利用具有优化系数的多项式函数,确定沿着路径的路径点(例如,控制点)的位置,其表示平滑参考线路。如上所述,平滑函数被并入待求解的目标函数中,即,平滑不是用于确保在应用平滑函数之后的已优化参考线路依然受限于所限定约束集合的后处理步骤。

图8是示出根据一个实施方式的2d样条参考线路平滑的流程图。可通过处理逻辑(其可以包括软件、硬件或它们的组合)来执行过程800。例如,可通过自动驾驶车辆的平滑模块601来执行过程800。参照图8,在框801处,处理逻辑确定以第一参考线路的多个控制点中的每一个为中心的、具有预定尺寸的多个边界区域。在框802处,处理逻辑选择各自表示相邻控制点之间的最佳参考线路的段的多个二维多项式。在框803处,处理逻辑对二维多项式限定约束集合,以至少确保多个二维多项式经过边界区域中的每一个。在框804处,处理逻辑对目标函数执行二次规划(qp)优化,使得在满足约束集合的情况下目标函数的总成本达到最小值。在框805处,处理逻辑基于qp优化生成表示最佳参考线路的第二参考线路,以根据第二参考线路自动地控制adv。

在一个实施方式中,相邻控制点大致等距地间隔开。在一个实施方式中,边界区域是具有面向与第一参考线路平行的方向的边缘的边界盒。在一个实施方式中,对二维多项式限定约束集合包括:限定等式约束或不等式约束的集合。在一个实施方式中,对二维多项式限定约束集合包括:在相邻控制点之间平滑地对连结段限定连结约束,其中,连结约束配置为三阶导数平滑度。

在一个实施方式中,目标函数包括多个核,该核是一阶导数核、二阶导数核和三阶导数核之一,其中,一阶导数、二阶导数和三阶导数通过相应导数的平方的积分来生成。在另一实施方式中,对于核中的每一个,目标函数包括单独的加权因子。在一个实施方式中,目标函数包括基于先前采集的驾驶路线数据的引导核。

根据一个方面,可使用路径样条优化方法来优化具有约束的平滑路径,其中所述约束诸如道路边界约束、感知的障碍物以及adv的一些限制(诸如,转弯半径)。图9是示出根据一个实施方式的示例性路径优化过程的流程图。图10a至图10c是示出根据某些实施方式的待优化路径轨迹的示例的框图。

参照图9,可通过图5b的路径规划模块521(作为图4的路径规划过程407)执行过程900。在框901处,处理逻辑对于地图上的位置限定具有长度p的目标路径,例如,选择地图上具有长度p=200米的基础路径作为地图上的几何车道,诸如图10a的路径1000。参照图10a,路径1000包括起始位置1003、目的地位置1005和参考线路1001。起始位置1003可以是adv的当前位置,而目的地位置1005是待到达的目标位置。参考线路1001可以是由路线导航模块307生成的平滑参考线路,或者可基于地图几何信息(诸如,从路径1000的侧路缘和/或车道分隔线/标记起沿着车道追踪的中点值)来计算。在某些实施方式中,路径1000可处于二维(x,y)几何坐标中。在某些实施方式中,如图10b至图10c所示,路径1000从x-y坐标转换成s-l坐标。返回参照图9,在框902处,处理逻辑限定具有由多个段或分段多项式(诸如,图10b的多项式1011)表征的样条或目标轨迹的目标路径。在一个实施方式中,分段多项式限定为如下:

l(s)=ai+bis+cis2+dis3+eis4+fis5(0≤s≤si)

其中,(s,l)是行驶距离和横向偏移坐标;ai,…,fi是五阶分段多项式的系数;以及i=0…n是表征样条的n个分段多项式。注意,根据路线或道路条件,分段多项式可以是任何次数的多项式。

图10b示出包括四个分段多项式1011的样条1009。虽然示出四个分段多项式,但是样条可包括任何数量的分段多项式。参照图9,在框903处,处理逻辑限定用于路径优化的目标函数。在框904处,处理逻辑限定用于路径优化的约束集合。在框905处,处理逻辑将目标函数和约束转换成qp公式。在框906处,处理逻辑对qp公式进行求解以获得已优化结果。

在某些实施方式中,用于路径优化的目标函数包括具有多个核(诸如平滑度成本和引导成本)的路径成本函数。在一个实施方式中,例如,具有四个核的路径成本函数限定为如下:

其中,核具有一阶导数平滑度、二阶导数平滑度、三阶导数平滑度和引导核的顺序;其中,(s,l)是行驶距离和横向偏移坐标;w1…w3是平滑度的加权因子;w4是引导成本的加权因子;li(s)是i阶分段多项式;以及lref(s)是从先前采集的人类驾驶数据中所得的根据段的平均路径。

这里,平滑度成本确保分段多项式平滑至三阶导数。附加的引导成本可在诸如变道或转弯的各种动作中引导adv。在某些实施方式中,约束包括一个或多个约束集合,诸如,起始点约束和结束点约束、相邻分段多项式之间的连接平滑度约束、道路边界约束和/或障碍物约束。如上所述的约束是施加到qp优化问题上的、候选项的解必须满足的条件。起始点约束和结束点约束表示在路径的起始位置(或点)和结束位置(或点)处对adv的状态的限制。例如,如果adv在起始点和结束点的方向应与路径在一条直线上,则在这些控制点处的第二导数应为零。连接平滑度约束确保相邻分段多项式是连续的和/或平滑的(例如,路径是连续的和/或平滑的)。道路边界约束确保adv不会太靠近道路缘。障碍物约束表示基于对于感知到的障碍物的障碍物决策和/或adv周围的交通信息的约束。在一个实施方式中,初始约束集合可包括与adv的起始位置、方向和/或曲率对应的约束。在另一实施方式中,结束点约束的集合可包括与adv到达目的地位置时的目的地位置、方向和/或曲率对应的约束。在某些实施方式中,道路边界或由adv感知的任何障碍物均可建模为障碍物,诸如图10c的障碍物1013、1015。在另一实施方式中,障碍物或人为形成的屏障可设置为约束,因此,决策或规划模块将不会搜索被约束的几何空间。参照图10c,在该示例中,决策和/或规划模块可生成对于障碍物1013、1015的决策,诸如躲避这些障碍物的决策。处理逻辑之后可将障碍物约束转换成qp公式并且通过优化模块(诸如图5b的优化模块540)对qp公式进行求解,以得到用于控制adv的最佳轨迹(诸如轨迹1017)。在一个实施方式中,可对轨迹1017进行内插并将其离散为离散轨迹点,使得这些点可存储在adv的存储器和/或永久性存储装置上。

在某些实施方式中,障碍物约束可通过作为如上所述的路径成本的一部分的成本函数来表征。例如,障碍物成本函数可基于障碍物与样条或路径轨迹之间的距离。根据一个实施方式,当轨迹和障碍物之间的距离大于阈值(诸如两米)时,可忽视障碍物成本。在一个实施方式中,障碍物成本是指数函数。例如,障碍物成本可以是:w5*exp(2-x)-1,其中,w5是加权因子,x是轨迹和障碍物之间的距离。这里,道路边界可通过两个或更多障碍物成本来表示,上述两个或更多障碍物成本表示对于adv的行驶距离-横向偏移坐标地图上的侧向偏差的上边界约束和下边界约束。在另一实施方式中,障碍物成本包括基于对数函数的经过速度(例如,adv将多快地经过障碍物)的成本。在一个实施方式中,经过速度的成本可以是:w6*log(speed,4),其中,w6是加权因子,speed(速度)是adv相对于经过的障碍物的相对速度。在一个实施方式中,基于距离成本和经过速度成本来计算障碍物成本,例如,两个成本的乘积:(w5*exp(2-x)-1)*(w6*log(speed,4))。

图11是示出根据一个实施方式的优化路径的方法的流程图。可通过处理逻辑(其可以包括软件、硬件或它们的组合)执行过程1100。例如,可通过自动驾驶车辆的路径规划模块521执行过程1100。参照图11,在框1101处,处理逻辑将自adv的起始位置所选择的第一路径轨迹分段成多个路径段,其中每个路径段由多项式函数表征。在框1102处,处理逻辑根据路径段的、用于对路径段之间的连结处进行平滑的多项式函数来选择目标函数。在框1103处,处理逻辑至少根据由adv感知的道路边界以及障碍物,基于相邻的路径段对路径段的多项式函数限定约束集合。在框1104处,处理逻辑根据添加的约束对目标函数执行二次规划(qp)优化,使得在满足约束集合的情况下使目标函数的输出达到最小值。在框1105处,处理逻辑基于qp优化通过已优化的目标函数生成表示路径轨迹的第二路径轨迹,以根据第二路径轨迹自动控制adv。

在一个实施方式中,对路径段的多项式函数限定约束集合包括:限定表征adv的起始位置、方向和/或曲率的初始约束集合。在一个实施方式中,对路径段的多项式函数限定约束集合包括:限定表征道路边界的上边界约束和下边界约束。在一个实施方式中,路径段的多项式函数是五阶多项式函数。在一个实施方式中,多项式函数是在行驶距离-横向偏移坐标系中表示为行驶距离单元的函数的横向偏移单元。

在一个实施方式中,目标函数包括平滑核。在一个实施方式中,目标函数包括adv变道时的引导核。在一个实施方式中,处理逻辑利用不处于第一路径轨迹中的多个点进一步对第二路径轨迹进行内插。

根据又一方面,可使用持续时间样条优化来沿着给定路径轨迹优化平滑速度。在某些实施方式中,假设给定具有给定规划持续时间的路径轨迹,则执行图4的速度规划过程409的速度规划模块(诸如图5b的速度规划模块523)将规划持续时间划分成n个段,每个段具有持续期间d。速度规划模块523限定多个分段多项式以表示持续时间的每个段。在一个实施方式中,分段多项式可以是:

f(t)=a0i+a1it+a2it2+a3it3+a4it4+a5it5

其中,a0i,…,a5i是五阶多项式的系数,t是范围从0到段的总长度的段中的时间,s是时间t上的累计距离。注意,在一个实施方式中,段可划分成不相等的时间段。在某些实施方式中,分段多项式可以是任何次数的多项式。

在一个实施方式中,速度规划模块523限定分段多项式或样条将指向的目标函数。在某些实施方式中,用于速度优化的目标函数包括具有多个核(诸如平滑度成本和引导成本)的速度成本函数。在一个实施方式中,例如,具有四个核的速度成本函数可以是:

其中,四个核具有一阶导数平滑度、二阶导数平滑度、三阶导数平滑度和引导核的顺序,其中,(s,t)是行驶距离-时间曲线图的行驶距离和时间坐标;w1…w3是用于平滑度成本的加权因子;w4是用于引导成本的加权因子;fi(t)是i阶分段多项式;以及fref(t)是来自先前采集的人类驾驶数据的、用于规划段的持续时间的平均速度。

除了平滑成本和引导成本之外,速度成本函数可包括各种其他核。图12a至图12c是示出根据某些实施方式的示例性行驶距离-时间曲线图的框图。参照图12a,行驶距离-时间曲线图1200包括与慢行(cruise)对应的st轨迹1201。在一个实施方式中,目标函数包括与慢行速度对应的速度成本。慢行速度可与adv沿着具有较少或没有交通流量的开放道路慢行的情况对应。成本可限定为具有给定速度限制的最终行驶距离-时间(st)轨迹和慢行st轨迹之间的差异,诸如:

其中,(s,t)是行驶距离-时间曲线图的行驶距离和时间坐标;sj是慢行st轨迹;fi(tj)是分段多项式且i=1..n对应于n个多项式;j=1..m对应于相应多项式的m个行驶位置点(stationpoint)。

参照图12b,行驶距离-时间曲线图1210包括与跟随adv前方的移动车辆的st轨迹对应的st轨迹1211。在一个实施方式中,目标函数包括与跟随成本对应的速度成本。跟随成本可与如图12b中所示的跟随移动车辆的情况对应。成本可限定为最终行驶距离-时间(st)轨迹和“跟随(follow)”st轨迹之间的差异,诸如:

其中,(s,t)是行驶距离-时间曲线图的行驶距离和时间坐标;sj是“跟随”st轨迹;fi(tj)是分段多项式,并且i=1..n对应于n个多项式,j=1..r对应于相应多项式的r个行驶位置点(stationpoint)。

参照图12c,行驶距离-时间曲线图1220包括与使adv停在adv前方某一距离处(例如,因由adv感知的障碍物1223,例如,红色交通灯或行人而停止)的st轨迹对应的st轨迹1221。在一个实施方式中,目标函数包括与停止(stop)成本对应的速度成本,其类似于上述跟随成本。最后,在一个实施方式中,目标函数具有总速度成本,诸如:

speedcost=costsmoothing+costcrutse+costfollow+coststop

接着,速度规划模块523对分段多项式函数添加约束集合。在某些实施方式中,添加的约束可包括对于起始点和/或结束点的约束、单调性约束、连接平滑度约束、障碍物边界约束和/或速度限制边界约束。相邻分段多项式之间的连接平滑度约束以及障碍物边界约束类似于以上描述的约束。起始点约束和/或结束点约束可分别对应于adv的初始速度和结束速度、加速和/或急变速(jerk)。单调性约束确保st轨迹延伸或者确保adv及时向前移动,即,adv不会向后移动。在一个实施方式中,速度限制边界约束可以是基于当前路线速度限制减去adv操作速度的绝对值的成本。在某些实施方式中,起始点约束和/或结束点约束可利用速度限制约束积分所得。最后,将目标函数和所添加的约束转换成qp公式并且通过优化模块(诸如,图5b的优化模块540)对其进行求解,以求得用于控制adv的速度的最佳st轨迹。在一个实施方式中,可对st轨迹进行内插并且将st轨迹离散成离散st轨迹点,使得这些点可存储在adv的存储器和/或永久性存储装置上。

图13是示出根据一个实施方式的用于优化速度的方法的流程图。可通过处理逻辑(其可以包括软件、硬件或它们的组合)执行过程1300。例如,可通过自动驾驶车辆的速度规划模块523执行过程1300。参照图13,在框1301处,处理逻辑选择表征持续时间的多个时间段以使路径轨迹完整的多个多项式。在框1302处,处理逻辑基于多个成本函数(诸如速度成本)选择目标函数以对各时间段之间的速度进行平滑。在框1303处,处理逻辑对多项式限定约束集合以至少确保多项式平滑地连结。在框1304处,处理逻辑根据所添加的约束对目标函数执行二次规划(qp)优化,使得在满足约束的情况下与目标函数关联的成本达到最小值。在框1305处,处理逻辑基于已优化的目标函数生成对于持续时间的平滑速度以用于自动控制adv。

在一个实施方式中,时间段在时间上大致等距地间隔开。在另一实施方式中,时间段可在时间上不等距地间隔开。在一个实施方式中,多项式是五阶(或五次)多项式。在一个实施方式中,成本函数包括慢行成本、停止成本或对于adv前方的车辆的跟随成本中的至少一个。在另一实施方式中,基于由adv感知的、表示前方车辆的障碍物来计算对adv前方的车辆的跟随成本。在一个实施方式中,对多项式限定约束集合包括:限定单调性约束使得adv向前移动。在一个实施方式中,对多项式限定约束集合包括:限定速度限制约束。在一个实施方式中,对多项式限定约束集合包括:限定表征adv的初始速度、初始加速度和/或初始急变速的初始约束集合。

图14是示出可以与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如,系统1500可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统,例如,图1的感知与规划系统110或者服务器103至104中的任一个。系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(ic)、集成电路的一部分、分立电子装置或适用于电路板(诸如,计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。

还应注意,系统1500旨在示出计算机系统的许多部件的高阶视图。然而,应当理解的是,某些实施例中可以具有附加的部件,此外,其它实施例中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(pda)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(ap)或中继器、机顶盒或其组合。此外,虽然仅示出了单个机器或系统,但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中,系统1500包括经由总线或互连件1510连接的处理器1501、存储器1503和设备1505-1508。处理器1501可表示其中包括有单个处理器内核或多个处理器内核的单处理器或者多处理器。处理器1501可表示一个或多个通用处理器,诸如,微处理器、中央处理单元(cpu)等。更具体地,处理器1501可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器或实现其他指令集的处理器,或者实现指令集的组合的处理器。处理器1501还可以是一个或多个专用处理器,诸如专用集成电路(asic)、蜂窝或基带处理器、场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器或者能够处理指令的任何其他类型的逻辑。

处理器1501(其可以是低功率多核处理器套接口,诸如超低电压处理器)可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(soc)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口,图形子系统1504可以包括显示控制器、图形处理器和/或显示装置。

处理器1501可以与存储器1503通信,存储器1503在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)装置,诸如,随机存取存储器(ram)、动态ram(dram)、同步dram(sdram)、静态ram(sram)或者其它类型的存储装置。存储器1503可以存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如,各种操作系统、装置驱动程序、固件(例如,输入输出基本系统或bios)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统,例如,机器人操作系统(ros)、来自公司的操作系统、来自苹果公司的mac来自公司的linux、unix,或者其它实时或嵌入式操作系统。

系统1500还可以包括io装置,诸如装置1505至1508,包括网络接口装置1505、可选的输入装置1506,以及其它可选的io装置1507。网络接口装置1505可以包括无线收发器和/或网络接口卡(nic)。所述无线收发器可以是wifi收发器、红外收发器、蓝牙收发器、wimax收发器、无线蜂窝电话收发器、卫星收发器(例如,全球定位系统(gps)收发器)或其它射频(rf)收发器或者它们的组合。nic可以是以太网卡。

输入装置1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指针装置(诸如,手写笔)和/或键盘(例如,物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如,输入装置1506可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种,以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。

io装置1507可以包括音频装置。音频装置可以包括扬声器和/或麦克风,以促进支持语音的功能,诸如语音识别、语音复制、数字记录和/或电话功能。其它io装置1507还可以包括通用串行总线(usb)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如,pci-pci桥)、传感器(例如,诸如加速度计移动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可以包括成像处理子系统(例如,摄像机),所述成像处理子系统可以包括用于促进摄像机功能(诸如,记录照片和视频片段)的光学传感器,诸如电荷耦合装置(ccd)或互补金属氧化物半导体(cmos)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1510,而诸如键盘或热传感器的其它装置可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储,大容量存储设备(未示出)也可以联接到处理器1501。在各种实施方式中,为了实现更薄且更轻的系统设计并且改进系统响应性,这种大容量存储设备可以经由固态装置(ssd)来实施。然而,在其它实施方式中,大容量存储设备可以主要使用硬盘驱动器(hdd)来实施,其中较小量的ssd存储设备充当ssd高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储,从而使得在系统活动重新启动时能够实现快速通电。另外,闪存装置可以例如经由串行外围接口(spi)联接到处理器1501。这种闪存装置可以提供系统软件的非易失性存储,所述系统软件包括所述系统的bios以及其它固件。

存储装置1508可包括其上存储有实现本文描述的方法或函数中的任何一个或多个的一个或多个指令集或软件(例如,模块、单元和/或逻辑1528)的计算机可访问存储介质1509(也称为机器可读存储介质或计算机可读介质)。处理模块/单元/逻辑1528可表示以上描述的组件中的任何组件,例如,图3b的平滑模块308、图5b的路径规划模块521和速度规划模块523。处理模块/单元/逻辑1528在其由数据处理系统1500执行的期间还可完全地或至少部分地驻留在存储器1503内或者处理器1501内,其中存储器1503和处理器1501也构成机器可访问存储介质。处理模块/单元/逻辑1528可经由网络接口设备1505通过网络进一步被传输或接收。

计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质,但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如,集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质,所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此,术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质,或者任何其它非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1528、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(诸如,asics、fpga、dsp或类似装置)的功能中。此外,处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外,处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。

应注意,虽然系统1500被示出为具有数据处理系统的各种部件,但是并不旨在表示使部件互连的任何特定架构或方式;因为此类细节和本公开的实施方式没有密切关系。还应当认识到,具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本公开的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式,以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中,算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而,应当牢记,所有这些和类似的术语均旨在与适当的物理量关联,并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出,否则应当了解,在整个说明书中,利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理,所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据,并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如,计算机)可读的形式存储信息的任何机构。例如,机器可读(例如,计算机可读)介质包括机器(例如,计算机)可读存储介质(例如,只读存储器(“rom”)、随机存取存储器(“ram”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行,所述处理逻辑包括硬件(例如,电路、专用逻辑等)、软件(例如,体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的,但是应当了解,所述操作中的一些可以按不同的顺序执行。此外,一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到,可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中,已经参考本公开的具体示例性实施方式对本公开的实施方式进行了描述。将显而易见的是,在不脱离所附权利要求书中阐述的本公开的更宽泛精神和范围的情况下,可以对本公开做出各种修改。因此,应当在说明性意义而不是限制性意义上来理解本说明书和附图。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1