用于自动驾驶车辆的基于动态规划和梯度下降的决策和规划的制作方法

文档序号：17158625发布日期：2019-03-20 00:20阅读：314来源：国知局

本公开的实施方式总体涉及操作自动驾驶车辆。更具体地，本公开的实施方式涉及用于自动驾驶车辆(adv)的基于动态规划(dynamicprogramming，dp)和梯度下降(gradientdescent)的决策和规划。

背景技术：

以自动驾驶模式运行(例如，无人驾驶)的车辆可以将乘客、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时，车辆可以使用车载传感器导航到各个位置，从而允许车辆在最少人机交互的情况下或在没有任何乘客的一些情况下行驶。

运动规划与控制是自动驾驶中的关键操作。然而，运动规划与控制可能是开放式的，并且可能难以在没有一些初始约束的情况下进行优化。此外，运动规划与控制在一些情况下应用于可能不精确且不平稳的所有类型的车辆。

技术实现要素：

本申请提供了一种为自动驾驶车辆生成驾驶轨迹的计算机实施的方法。所述方法包括：基于地图和路线信息计算第一轨迹；基于所述第一轨迹、交通规则以及描述由所述自动驾驶车辆感知的一个或多个障碍物的障碍物信息来生成路径配置文件，其中，针对所述多个障碍物中的每一个障碍物，所述路径配置文件包括让行或从所述障碍物的左侧或右侧掠过的决策；基于所述路径配置文件根据所述交通规则来生成速度配置文件；基于所述路径配置文件和所述速度配置文件执行梯度下降优化，以生成表示优化后的第一轨迹的第二轨迹；以及根据所述第二轨迹控制所述自动驾驶车辆。

根据本申请实施方式，所述路径配置文件和所述速度配置文件使用动态规划迭代地生成。

根据本申请实施方式，针对所述障碍物信息中的遇到的每个障碍物，所述速度配置文件包括跟随、超过、让行、停止或经过所遇到的障碍物的决策。

根据本申请实施方式，基于所述路径配置文件和所述速度配置文件执行梯度下降优化包括：使用所述梯度下降优化来对第一成本函数和第二成本函数进行优化，以基于所述路径配置文件生成基点-侧移图并且基于所述速度配置文件生成基点-时间图；以及基于所述基点-侧移图和所述基点-时间图生成所述第二轨迹，以根据所述第二轨迹控制所述自动驾驶车辆。

根据本申请实施方式，所述基点-侧移图通过基于一个或多个障碍物决策形成一个或多个障碍而生成。

根据本申请实施方式，所述第一成本函数和所述第二成本函数包括前进方向成本、曲率成本、距离成本、加速度成本和急动度成本。

根据本申请实施方式，还包括：基于所述基点-侧移图和所述基点-时间图向所述第二轨迹插入在所述第一轨迹中不存在的多个点。

本申请还提供了一种存储有指令的非暂时性机器可读介质。所述指令在由处理器运行时致使所述处理器执行以下操作，所述操作包括：基于地图和路线信息计算第一轨迹；基于所述第一轨迹、交通规则以及描述由所述自动驾驶车辆感知的一个或多个障碍物的障碍物信息来生成路径配置文件，其中，针对所述多个障碍物中的每一个障碍物，所述路径配置文件包括让行或从所述障碍物的左侧或右侧掠过的决策；基于所述路径配置文件根据所述交通规则来生成速度配置文件；基于所述路径配置文件和所述速度配置文件执行梯度下降优化，以生成表示优化后的第一轨迹的第二轨迹；以及根据所述第二轨迹控制所述自动驾驶车辆。

本申请还提供了一种数据处理系统，包括：处理器；以及存储器，所述存储器联接到所述处理器以存储指令，所述指令在由所述处理器运行时致使所述处理器执行以下操作，所述操作包括：基于地图和路线信息计算第一轨迹；基于所述第一轨迹、交通规则以及描述由所述自动驾驶车辆感知的一个或多个障碍物的障碍物信息来生成路径配置文件，其中，针对所述多个障碍物中的每一个障碍物，所述路径配置文件包括让行或从所述障碍物的左侧或右侧掠过的决策；基于所述路径配置文件根据所述交通规则来生成速度配置文件；基于所述路径配置文件和所述速度配置文件执行梯度下降优化，以生成表示优化后的第一轨迹的第二轨迹；以及根据所述第二轨迹控制所述自动驾驶车辆。

附图说明

本公开的实施方式以示例而非限制的方式示出在附图的各图中，附图中相似的附图标记指示相似的元件。

图1是示出根据一个实施方式的网络化系统的框图。

图2是示出根据一个实施方式的自动驾驶车辆的示例的框图。

图3a至图3b是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4是示出根据一个实施方式的决策过程和规划过程的示例的框图。

图5a是示出根据一个实施方式的决策模块的示例的框图。

图5b是示出根据一个实施方式的规划模块的示例的框图。

图6是示出根据一个实施方式的基点-侧移地图的框图。

图7a和图7b是示出根据一些实施方式的基点-时间图的框图。

图8是示出根据一个实施方式的方法的流程图。

图9是示出根据一个实施方式的规划模块的示例的框图。

图10是示出根据一个实施方式的方法的流程图。

图11是示出根据一个实施方式的规划模块的示例的框图。

图12a至图12b是分别示出根据一个实施方式的路径成本模块和速度成本模块的框图。

图13是示出根据一个实施方式的方法的流程图。

图14a是示出根据一个实施方式的方法的流程图。

图14b是示出根据一个实施方式的方法的流程图。

图15是示出根据一个实施方式的数据处理系统的框图。

具体实施方式

将参考以下所讨论的细节来描述本公开的各种实施方式和方面，附图将示出所述各种实施方式。下列描述和附图是对本公开的说明，而不应当解释为限制本公开。描述了许多特定细节以提供对本公开各种实施方式的全面理解。然而，在某些情况下，并未描述众所周知的或常规的细节以提供对本公开的实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的引述意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本公开的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各处的记载不必全部指同一实施方式。

根据一些实施方式，adv包括自主控制adv的决策与规划系统。基于起始位置和结束位置，系统查询用于参考路线的路线安排服务，并计算adv从起始位置驾驶至结束位置的参考线路。基于感知的adv周围的障碍物和交通状况，系统根据交通规则和/或adv的状况来确定路径决策和速度决策，从而忽视、经过、让行、或超过障碍物。系统基于路径决策和速度决策来优化一条或多条参考线路作为轨迹，以规划在特定时间点车辆应在何时处于何地。

根据一方面，系统基于地图和路线信息来计算第一轨迹。系统基于第一轨迹、交通规则以及描述由adv感知的一个或多个障碍物的障碍物信息来生成路径配置文件(pathprofile)。系统基于路径配置文件生成速度配置文件(spaceprofile)，其中，对于每一个障碍物，所述速度配置文件包括让行或超过所述障碍物的决策。系统对路径配置文件和速度配置文件执行二次规划优化以识别具有最佳速度的最佳路径，并基于最佳路径和最佳速度生成第二轨迹，从而可基于第二轨迹自主地控制adv。第二轨迹表示使用二次规划优化被优化后的第一轨迹。

根据另一方面，系统基于地图和路线信息来计算第一轨迹。系统基于第一轨迹、交通规则以及描述由adv感知的一个或多个障碍物的障碍物信息来生成路径配置文件，其中，对于每一个障碍物，路径配置文件包括让行或从所述障碍物的左侧或右侧掠过的决策。系统基于路径配置文件根据交通规则生成速度配置文件。系统基于路径配置文件和速度配置文件来执行梯度下降优化以生成表示优化后的第一轨迹的第二轨迹，并根据第二轨迹控制adv。

根据又一方面，系统基于感知adv周围的驾驶环境(包括一个或多个障碍物)的感知信息根据交通规则集来生成用于将adv从第一位置循迹移动至第二位置的多种可行的决策。系统基于一个或多个可行的决策的组合来计算多个轨迹。系统使用多个成本函数来计算用于每一个轨迹的总成本，并选择具有最小总成本的一个轨迹作为驾驶轨迹来自主地控制adv。成本函数包括路径成本函数、速度成本函数和障碍物成本函数。

图1是示出根据本公开的一个实施方式的自动驾驶车辆网络配置的框图。参考图1，网络配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆，但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络，例如，有线或无线的局域网(lan)、诸如互联网的广域网(wan)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集，诸如，网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(mpoi)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆，在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统，所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。

在一个实施方式中，自动驾驶车辆101包括，但不限于，感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件，诸如：发动机、车轮、方向盘、变速器等，所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制，该多种通信信号和/或命令例如，加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如，部件110至115可以经由控制器局域网(can)总线通信地联接到彼此。can总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的复用电气布线设计的基于消息的协议，但也用于许多其它环境。

现在参考图2，在一个实施方式中，传感器系统115包括但不限于一个或多个相机211、全球定位系统(gps)单元212、惯性测量单元(imu)213、雷达单元214以及光探测和测距(lidar)单元215。gps系统212可以包括收发器，所述收发器可操作以提供关于自动驾驶车辆的位置的信息。imu单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中，除感测对象之外，雷达单元214可以另外感测对象的速度和/或前进方向。lidar单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其它系统部件之外，lidar单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。相机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。相机211可以是静物相机和/或视频相机。相机可以是可机械地移动的，例如，通过将相机安装在旋转和/或倾斜平台上。

传感器系统115还可以包括其它传感器，诸如：声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如，麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中采集声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下，油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中，车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度，电动机或发动机的速度进而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减速而使车辆减速。应注意，如图2所示的部件可以以硬件、软件或其组合实施。

回到图1，无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其它车辆等外部系统之间的通信。例如，无线通信系统112可以与一个或多个装置直接无线通信，或者经由通信网络进行无线通信，诸如，通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(wlan)，例如，使用wifi，以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如，乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分，包括例如键盘、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理，尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如，处理器、存储器、存储设备)和软件(例如，操作系统、规划和路线安排程序)，以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息，处理所接收的信息，规划从起始点到目的地点的路线或路径，随后基于规划和控制信息来驾驶车辆101。替代地，感知与规划系统110可以与车辆控制系统111集成在一起。

例如，作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如，感知与规划系统110可以从mpoi服务器中获得位置和路线信息，所述mpoi服务器可以是服务器103至104的一部分。位置服务器提供位置服务，并且mpoi服务器提供地图服务和某些位置的poi。替代地，此类位置和mpoi信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时，感知与规划系统110也可以从交通信息系统或服务器(tis)获得实时交通信息。应注意，服务器103至104可以由第三方实体进行操作。替代地，服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、mpoi信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如，障碍物、对象、附近车辆)，感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101，以安全且高效到达指定目的地。

服务器103可以是为多种客户端执行数据分析服务的数据分析系统。在一个实施方式中，数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121从各种车辆(自动驾驶车辆或由人类驾驶员所驾驶的常规车辆)收集驾驶统计数据123。驾驶统计数据123包括表明在不同的时间点时发出的驾驶命令(例如，油门命令、制动命令、转向命令)以及车辆的传感器所捕获的车辆的响应(例如速度、加速、减速、方向)的信息。驾驶统计数据123还可包括描述在不同的时间点时的驾驶环境的信息，诸如，例如路线(包括起始位置和目的地位置)、mpoi、道路条件、天气条件等。

基于驾驶统计数据123，机器学习引擎122出于多种目的而生成或训练规则集、算法和/或预测模型124。例如，服务器103可包括路线安排服务125，以向adv101提供路线安排服务(例如，路线和地图信息)。adv101可通过指示起始位置和结束位置来从路线安排服务125请求参考路线(例如，没有障碍物信息或交通状况的理想路线)。路线安排服务125随后返回所请求的路线。在一个实施方式中，返回参考路线可包括返回一个或多个表，诸如参考点表和路段/车道表。替代地，路线和地图信息可下载并缓存到车辆中，所述信息可被实时使用。

服务器103可生成参考路线，例如，机器学习引擎122可从地图信息(诸如路段、路段的车道和从车道到路缘的距离的信息)生成参考路线。例如，道路可划分成{a、b和c}节或段来表示三个路段。路段a的三个车道可列举为{a1、a2和a3}。参考路线通过沿着参考路线生成参考点而生成。例如，对于车道，机器学习引擎122可连接由地图数据提供的车道的两个相对的路缘或路沿的中点。基于表示曾经车辆在不同的时间点在该车道上驾驶所收集的数据点的机器学习数据以及上述中点，引擎122可通过在车道的预定邻近范围内选择所收集的数据点的子集并根据收集到的数据点的子集对所述中点应用平滑函数，从而计算参考点。

基于参考点或车道参考点，接收参考点的adv可通过对参考点插值来生成参考线路，以使得所生成的参考线路被用作用于控制所述车道上的adv的参考线路。在一些实施方式中，代表参考线路的参考点表和路段表被实时下载到adv，以使得adv可基于adv的地理位置和驾驶方向生成参考线路。例如，在一个实施方式中，adv可通过利用表示前方即将到来的路段的路径段标识符和/或基于adv的gps位置来请求用于路径段的路线安排服务，从而生成参考线路。基于路径段标识符，路线安排服务可返回到adv参考点表，所述adv参考点表包含用于关注路段的所有车道的参考点。adv可查阅路径段的车道的参考点，以生成用于控制车道上的adv的参考线路。应注意，以上过程通过分析服务器103离线执行，其中，路线的参考点基于路线和地图信息来确定。然而，相同的数据可在各个车辆内实时动态地确定，这将在下文进一步详细描述。

图3a和图3b是示出根据一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分，包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3a至图3b，感知与规划系统110包括但不限于定位模块301、感知模块302、预测模块303、决策模块304、规划模块305、控制模块306和路线安排模块307。

模块301至307中的一些或全部可以以软件、硬件或其组合实施。例如，这些模块可以安装在永久性存储装置352中、加载到存储器351中，并且由一个或多个处理器(未示出)执行。应注意，这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至307中的一些可以一起集成为集成模块。例如，决策模块304和规划模块305可集成为单个模块。

定位模块301(例如，利用gps单元212)确定自动驾驶车辆300的当前位置，并管理与用户的行程或路线相关的任何数据。定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的诸如地图和路线信息311的其它部件通信，以获得行程相关数据。例如，定位模块301可以从位置服务器和地图与poi(mpoi)服务器获得位置和路线信息。位置服务器提供位置服务，并且mpoi服务器提供地图服务和某些位置的poi，从而可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时，定位模块301也可以从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息，感知模块302确定对周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括例如采用对象形式的车道配置(例如，直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或其它交通相关标志(例如，停止标志、让行标志)等。

感知模块302可以包括计算机视觉系统或计算机视觉系统的功能，以处理并分析由一个或多个相机采集的图像，从而识别自动驾驶车辆环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其它车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其它计算机视觉技术。在一些实施方式中，计算机视觉系统可以绘制环境地图，跟踪对象，以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或lidar的其它传感器提供的其它传感器数据来检测对象。

针对每个对象，预测模块303预测所述对象在所述情况下的行为。基于在某时间点感知的驾驶环境的感知数据根据地图/路线信息311与交通规则312的集合来执行所述预测。例如，如果对象是相反方向处的车辆且当前驾驶环境包括十字路口，预测模块303则将预测该车辆是可能向前直行还是可能转弯。如果感知数据表明十字路口没有交通灯，则预测模块303可预测该车辆可能在进入十字路口之前必须完全停下。如果感知数据表明该车辆当前处于左转专用车道或右转专用车道，则预测模块303可分别预测该车辆更可能进行左转或右转。

针对每个对象，决策模块304作出关于如何处置对象的决定。例如，针对特定对象(例如，交叉路线中的另一车辆)以及描述对象的元数据(例如，速度、方向、转弯角度)，决策模块304决定如何与所述对象相遇(例如，超车、让行、停止、经过)。决策模块304可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定，所述规则集可以存储在永久性存储装置352中。

基于针对所感知到的对象中的每个的决定，规划模块305为自动驾驶车辆规划路径或路线以及驾驶参数(例如，距离、速度和/或转弯角度)。换言之，针对给定的对象，决策模块304决定对该对象做什么，而规划模块305确定如何去做。例如，针对给定的对象，决策模块304可以决定经过所述对象，而规划模块305可以确定在所述对象的左侧还是右侧经过。规划和控制数据由规划模块305生成，包括描述车辆300在下一移动周期(例如，下一路线/路径段)中将如何移动的信息。例如，规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米，随后以25mph的速度变到右侧车道。

基于规划和控制数据，控制模块306根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息，以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如，油门、制动和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。

在一个实施方式中，规划阶段在多个规划周期(也称为命令周期)中执行，诸如，以例如每100毫秒(ms)的时间间隔执行。针对每个规划周期或命令周期，将基于规划和控制数据发出一个或多个控制命令。即，对于每100ms，规划模块305规划下一路线段或路径段，例如，包括目标位置和adv到达该目标位置所需的时间。替代地，规划模块305还可指定具体速度、方向和/或转向角度等。在一个实施方式中，规划模块305为下一预定的时间段(诸如5秒)规划路线段或路径段。对于每个规划周期，规划模块305基于先前周期中所规划的目标位置为当前周期(例如，下个5秒)规划目标位置。控制模块306随后基于当前周期的规划和控制数据生成一个或多个控制命令(例如，油门控制命令、制动控制命令、转向控制命令)。

应注意，决策模块304和规划模块305可以集成为集成模块。决策模块304/规划模块305可以包括导航系统或导航系统的功能，以确定自动驾驶车辆的驾驶路径。例如，导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向：所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时，基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自gps系统和一个或多个地图的数据合并，以确定用于自动驾驶车辆的驾驶路径。

决策模块304/规划模块305还可以包括防撞系统或防撞系统的功能，以识别、评估并且避免或以其它方式越过自动驾驶车辆的环境中的潜在障碍物。例如，防撞系统可以通过以下方式实现自动驾驶车辆的导航中的变化：操作控制系统111中的一个或多个子系统来采取变向操纵、转弯操纵、制动操纵等。防撞系统可以基于周围的交通模式、道路状况等自动确定可行的障碍物回避操纵。防撞系统可以被配置成使得当其它传感器系统检测到位于自动驾驶车辆将变向进入的相邻区域中的车辆、建筑障碍物等时不采取变向操纵。防撞系统可以自动选择既可使用又使得自动驾驶车辆乘客的安全性最大化的操纵。防撞系统可以选择预测使得自动驾驶车辆的乘客舱中出现最小量的加速度的避让操纵。

路线安排模块307可例如从地图信息(诸如路段、路段的车道和从车道到路缘的距离的信息)生成参考路线。例如，道路可划分成{a、b和c}节或段来表示三个路段。路段a的三个车道可列举为{a1、a2和a3}。参考路线通过沿着参考路线生成参考点而生成。例如，对于车道，路线安排模块307可连接由地图数据提供的车道的两个相对的路缘或路沿的中点。基于表示曾经车辆在不同的时间点在该车道上驾驶所收集的数据点的机器学习数据和上述中点，路线安排模块307可通过在车道的预定邻近范围内选择所收集的数据点的子集并根据收集到的数据点的子集对所述中点应用平滑函数，从而计算参考点。

基于参考点或车道参考点，路线安排模块307可通过对参考点插值来生成参考线路，以使得所生成的参考线路被用作用于控制所述车道上的adv的参考线路。在一些实施方式中，代表参考线路的参考点表和路段表可被实时下载到adv，以使得adv可基于adv的地理位置和驾驶方向生成参考线路。例如，在一个实施方式中，adv可通过利用表示前方即将到来的路段的路径段标识符和/或基于adv的gps位置来请求用于路径段的路线安排服务，从而生成参考线路。基于路径段标识符，路线安排服务可返回到adv参考点表，所述adv参考点表包含用于关注路段的所有车道的参考点。adv可查阅路径段的车道的参考点，以生成用于控制车道上的adv的参考线路。

如上所述，路线或路线安排模块307管理与用户的行程或路线相关的任何数据。adv的用户指定起始位置和目的地位置以获取行程相关数据。行程相关数据包括路线段和路线段的参考线路或参考点。例如，基于路线地图信息311，路线模块307生成路线或路段表和参考点表。参考点与路段表中的路段和/或车道有关。参考点可被插值以形成用于控制adv的一个或多个参考线路。参考点可以仅限于路段和/或路段的具体车道。

例如，路段表可以是名称-值对，以包括路段a至d的先前车道和下一车道。例如，对于具有车道1的路段a至d，路段表可以是：{(a1，b1)，(b1，c1)，(c1，d1)}。参考点表可包括用于路段车道的x-y坐标形式的参考点，例如{(a1，(x1，y1))，(b1，(x2，y2))，(c1，(x3，y3))，(d1，(x4，y4))}，其中a1至d1表示路段a至d的车道1，并且(x1，y1)至(x4，y4)为相应的真实世界的坐标。在一个实施方式中，路段和/或车道被划分成预定长度，诸如大概200米的路段/车道。在另一实施方式中，根据诸如道路的曲率的道路条件，路段和/或车道被划分成可变长度段/车道。在一些实施方式中，每个路段和/或车道可包括若干参考点。在一些实施方式中，参考点可转变成其它的坐标系，例如，纬度-经度。

在一些实施方式中，参考点可转变至相对坐标系中，诸如基点-侧移(sl)坐标。基点-侧移坐标系是参考固定参考点来跟随参考线路的坐标系。例如，(s，l)＝(1，0)坐标可表示具有0米侧向偏移的参考线路上的基点(即，参考点)之前1米。(s，l)＝(2，1)参考点可表示沿着参考线路在固定参考点之前2米，且从参考线路侧向偏移1米，例如，向左偏移1米。

在一个实施方式中，决策模块304基于由路线安排模块307提供的参考线路并基于adv感知的adv周围的障碍物来生成粗略的路径配置文件。粗略的路径配置文件可以是路径/速度配置文件313的一部分，所述粗略的路径配置文件可被存储在永久性存储装置352中。粗略的路径配置文件通过从参考线路中选择点而生成。针对每个点，在其余点保持稳定的情况下，决策模块304基于关于如何与所述对象相遇的一个或多个障碍物决策来将该点移动到参考线路的左侧或右侧(例如，候选移动)。所述候选移动通过对路径候选使用动态规划而被迭代地执行，其中，使用作为图3a的成本函数315的一部分的成本函数来寻找具有最小路径成本的路径候选，从而生成粗略的路径配置文件。成本函数的示例包括基于以下项的成本：路线路径的曲率、从adv到感知到的障碍物的距离和adv到参考线路的距离。在一个实施方式中，所生成的粗略的路径配置文件包括基点-侧移图，所述基点-侧移图可被存储在永久性存储装置352中以作为sl地图/st图形314的一部分。

在一个实施方式中，决策模块304基于生成的粗略的路径配置文件来生成粗略的速度配置文件(作为路径/速度配置文件313的一部分)。粗略的速度配置文件表明在特定的时间点控制adv的最佳速度。类似于粗略的路径配置文件，使用动态规划来迭代不同时间点的候选速度，其中，根据adv所感知的障碍物基于成本函数(作为图3a的成本函数315的一部分)来寻找具有最小速度成本的速度候选(例如，加速或减速)。粗略的速度配置文件决定adv是否应超过或避开障碍物，以及驶向障碍物的左侧或右侧。在一个实施方式中，粗略的速度配置文件包括基点-时间(st)图形(作为sl地图/st图形314的一部分)。基点-时间图表明行驶的距离与时间的关系。

在一个实施方式中，规划模块305根据障碍物决策和/或人为障碍来重新计算粗略的路径配置文件，以禁止规划模块305搜索所述障碍的几何空间。例如，如果粗略的速度配置文件确定从左侧掠过障碍物，则规划模块305可在障碍物的右侧设置障碍(以障碍物的形式)，以防止adv从右侧掠过障碍物的计算。在一个实施方式中，通过使用二次规划(qp)优化路径成本函数(作为成本函数315的一部分)来重新计算粗略的路径配置文件。在一个实施方式中，重新计算的粗略的路径配置文件包括基点-侧移图(作为sl地图/st图形314的一部分)。

在一个实施方式中，规划模块305使用二次规划(qp)重新计算粗略的速度配置文件，从而优化速度成本函数(作为成本函数315的一部分)。可增加类似的速度障碍约束以禁止qp求解器搜索一些受禁的速度。在一个实施方式中，重新计算的粗略的速度配置文件包括基点-时间图(作为sl地图/st图形314的一部分)。

应注意，如上文示出和描述的部件中的一些或全部可以在软件、硬件或其组合中实施。例如，此类部件可以实施为安装并存储在永久性存储装置中的软件，所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施本申请全文中所述的过程或操作。替代地，此类部件可以实施为编程或嵌入到专用硬件(诸如，集成电路(例如，专用集成电路或asic)、数字信号处理器(dsp)或现场可编程门阵列(fpga))中的可执行代码，所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外，此类部件可以实施为处理器或处理器内核中的特定硬件逻辑，作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

图4是示出根据一个实施方式的决策和规划过程的示例的框图。图5a是示出根据一个实施方式的决策模块的示例的框图。图5b是示出根据一个实施方式的规划模块的示例的框图。参考图4，决策和规划过程400包括路线安排模块307、定位/感知数据401、路径决策过程403、速度决策过程405、路径规划过程407、速度规划过程409、聚合器411和轨迹计算器413。

路径决策过程403和速度决策过程405可分别通过图5a中的决策模块304的路径决策模块501和速度决策模块503来执行。参考图4和图5a，路径决策过程403或路径决策模块501包括路径状态机505、路径交通规则507和基点-侧移图生成器509。路径决策过程403或路径决策模块501可使用动态规划生成粗略的路径配置文件作为路径规划过程407和速度规划过程409的初始约束。在一个实施方式中，路径状态机505包括至少三种状态：巡航状态、变道状态和闲置状态。路径状态机505提供先前的规划结果和重要信息，诸如adv是在巡航还是在变道。作为图3a的驾驶/交通规则312的一部分的路径交通规则507包括能够影响路径决策模块的结果的交通规则。例如，路径交通规则507可包括诸如施工交通标志的交通信息，adv从而可避开具有这种施工标志的车道。通过状态、交通规则、由路线安排模块307提供的参考线路以及由adv感知的障碍物，路径决策过程403可决定如何处理所感知的障碍物(即，忽视、超过、让行、停止、经过)，所述决定作为粗略的路径配置文件的一部分。

例如，在一个实施方式中，粗略的路径配置文件通过成本函数生成，所述成本函数包括：基于路径的曲率的成本；以及基于从参考线路和/或参考点到障碍物的距离的成本。选择参考线路上的点并将参考线路上的点移动到参考线路的左侧或右侧以作为表示路径候选的候选移动。每一个候选移动均具有相关成本。参考线路上的一个或多个点的候选移动的相关成本可使用动态规划顺序地(一次一个点)求解以获得最佳成本。在一个实施方式中，sl地图生成器509生成基点-侧移图作为粗略的路径配置文件的一部分。所述基点-侧移图是包括由adv感知的障碍物信息的二维几何地图(类似于x-y坐标平面)。从sl地图，路径决策过程403可安排遵循障碍物决策的adv路径。动态规划(或动态优化)是数学优化方法，该方法将待求解的问题分解成一系列价值函数，一次仅解决这些价值函数中的一个函数并存储其答案。下一次出现相同的价值函数时，仅需查找先前计算的答案而不是重新计算答案，从而节省了计算时间。

速度决策过程405或速度决策模块503包括速度状态机511、速度交通规则513和基点-时间图生成器515。速度决策过程405或速度决策模块503可使用动态规划生成粗略的速度配置文件作为路径规划过程407和速度规划过程409的初始约束。在一个实施方式中，速度状态机511包括至少两种状态：加速或减速。作为图3a的驾驶/交通规则312的一部分的速度交通规则513包括能够影响速度决策模块的结果的交通规则。例如，速度交通规则513可包括诸如红/绿交通灯、十字路口路线中的另一车辆等交通信息。通过速度状态机的状态、速度交通规则、由决策过程403生成的粗略的路径配置文件/sl地图以及感知的障碍物，速度决策过程405可生成粗略的速度配置文件来控制adv何时加速和/或减速。基点-时间图生成器515可生成基点-时间图以作为粗略的速度配置文件的一部分。

参考图4和图5b，路径规划过程407或路径规划模块521包括基点-侧移图525、几何平滑器527和路径成本模块529。基点-侧移图525可包括由路径决策过程403的sl地图生成器509生成的基点-侧移图。路径规划过程407或路径规划模块521可使用粗略的路径配置文件(例如，基点-侧移图)作为初始约束，以使用二次规划重新计算最佳参考线路。二次规划涉及在边界、线性等式和不等式约束的限制下使目标函数(例如，具有若干变量的二次函数)最小化或最大化。动态规划与二次规划之间的一个不同之处在于，二次规划一次性优化用于参考线路上的所有点的所有候选移动。几何平滑器527可对输出基点-侧移图应用平滑算法(诸如b-spline或回归)。路径成本模块529可利用路径成本函数(作为图3a的成本函数315的一部分)重新计算参考线路，以例如使用由qp模块540执行的qp优化来对参考点的候选移动的总成本进行优化。例如，在一个实施方式中，总路径成本函数可以是：

其中，在参考线路上的所有点上对路径成本求和，heading(前进方向)表示所述点相对于所述参考线路之间的径向角(例如，方向)上的差异，curvature(曲率)表示由这些点形成的曲线相对于该点的参考线路的曲率之间的差异，以及distance(距离)表示从所述点到所述参考线路的侧向(垂直于参考线路的方向)距离。在一些实施方式中，distance(距离)是从所述点到目的地位置或参考线路的中间点的距离。在另一实施方式中，curvature(曲率)成本是在相邻点处形成的曲线的曲率值之间的变化。应注意，参考线路上的点可被选为到相邻点处具有相等的距离的点。基于路径成本，路径成本模块529可通过使用二次规划优化使路径成本最小化(例如通过qp模块540)，从而重新计算参考线路。

速度规划过程409或速度规划模块523包括基点-时间图531、时序平滑器533和速度成本模块535。基点-时间图531可包括由速度决策过程405的st图形生成器515生成的基点-时间(st)图形。速度规划过程409或速度规划模块523可使用粗略的速度配置文件(例如，基点-时间图)和路径规划过程407的结果作为初始约束，以计算最佳基点-时间曲线。时序平滑器533可向点的时间序列应用平滑算法(诸如b-spline或回归)。速度成本模块535可利用速度成本函数(作为图3a的成本函数315的一部分)重新计算st图形，以优化不同的时间点的运动候选(例如，加速/减速)的总成本。例如，在一个实施方式中，总速度成本函数可以是：

其中，在所有时间数列点上对速度成本求和，speed'表示加速度值或在两个相邻点之间改变速度的成本，speed”表示急动度值，或加速度值的导数，或在两个相邻点之间改变速度变化的成本，以及distance(距离)表示st点到目的地位置的距离。这里，速度成本模块535通过使用二次规划优化使速度成本最小化(例如通过qp模块540)来计算基点-时间图。

聚合器411执行将路径规划结果和速度规划结果聚合的功能。例如，在一个实施方式中，聚合器411可将二维的st图形和sl地图组合成三维的slt图形。在另一实施方式中，聚合器411可基于sl参考线路或st曲线上的2个连续点来内插(或以附加点填充)。在另一实施方式中，聚合器411可将参考点从(s，l)坐标转化成(x，y)坐标。轨迹生成器413可计算用于控制adv的最终轨迹。例如，基于由聚合器411提供的slt图形，轨迹生成器413计算一列(x，y，t)点，所述(x，y，t)点表明adv应在何时经过特定的(x，y)坐标。

因此，返回参考图4，路径决策过程403和速度决策过程405将在考虑到障碍物和/或交通状况的情况下生成粗略的路径配置文件和粗略的速度配置文件。基于与障碍物有关的所有路径决策和速度决策，路径规划过程407和速度规划过程409将根据所述障碍物使用qp规划来优化粗略的路径配置文件和粗略的速度配置文件，以生成具有最小路径成本和/或速度成本的最佳轨迹。在另一实施方式中，路径成本和速度成本可通过下文进一步描述的图12a至图12b的路径成本模块1110和速度成本模块1120来计算。

图6是示出根据一个实施方式的基点-侧移图的框图。参考图6，地图600具有s水平轴(或基点)和l竖直轴(或侧移)。如上所述，基点-侧移坐标是参考在参考线路上的特定的基点并跟随参考线路的相对几何坐标系。例如，(s，l)＝(1，0)坐标可表示在参考线路上的基点(即，参考点)之前1米并且具有0米的侧向偏移。(s，l)＝(2，1)参考点可表示沿着参考线路在固定的参考点之前2米，且从参考线路垂直侧向偏移1米，例如左偏移。

参考图6，地图600包括参考线路601和由adv感知的障碍物603至609。在一个实施方式中，障碍物603至609可在不同的坐标系中通过adv的radar或lidar单元感知，并可被转化到sl坐标系。在另一实施方式中，障碍物603至609可以是人为形成的障碍作为约束，使得决策模块和规划模块不会在受约束的几何空间中搜索。在该示例中，诸如路径决策模块501的路径决策模块可针对障碍物603至609中的每一个障碍物生成决策，诸如避开障碍物603至608并掠过(很靠近地接近)障碍物609(即，这些障碍物可以是其它汽车、建筑物和/或结构)的决策。诸如路径规划模块521的路径规划模块随后可考虑到障碍物603至609基于路径成本使用qp规划重新计算或优化参考线路601，以如上所述地优化具有最小总体成本的参考线路601。在该示例中，adv101从障碍物609的左侧掠过(或非常靠近地接近)障碍物609。

图7a和图7b是示出根据一些实施方式的基点-时间图的框图。参考图7a，图形700具有基点(或s)竖直轴和时间(或t)水平轴。图形700包括曲线701和障碍物703至707。如上所述，在基点-时间图上的曲线701表明时间以及adv距离基点的距离。例如，(t，s)＝(10000，150)可表示10000毫秒，adv将距离基点(即，参考点)150米。在该示例中，障碍物703可以是待避开的建筑物/结构，以及障碍物707可以是与超过移动车辆的决策相对应的人为障碍。

参考图7b，在该情况下，向st图形710增加人为障碍705作为约束。人为障碍可以是例如由adv感知的位于距基点参考点大概s2的距离处的红灯或路径中的行人。障碍705与使adv“停下”直至稍后清除了人为障碍(即，交通灯从红变为绿，或者行人不再处于路径中)的决策相对应。

图8是示出根据一个实施方式的方法的流程图。过程800可通过处理逻辑来执行，所述处理逻辑可包括软件、硬件或其组合。例如，过程800可通过自动驾驶车辆的感知与规划系统110执行。参考图8，在框801处，处理逻辑基于地图和路线信息来计算第一轨迹。在框802处，处理逻辑基于第一轨迹、交通规则以及描述由adv感知的一个或多个障碍物的障碍物信息来生成路径配置文件。在框803处，处理逻辑基于路径配置文件来生成速度配置文件，其中，对于每一个障碍物，速度配置文件包括让行或超过所述障碍物的决策。在框804处，处理逻辑对路径配置文件和速度配置文件执行二次规划优化，以识别具有最佳速度的最佳路径。二次规划优化可使用相应的路径成本函数、速度成本函数和/或障碍物成本函数来执行，以确定具有最小总成本的最佳路线。在框805处，处理逻辑基于最佳路径和最佳速度生成第二轨迹，从而根据第二轨迹自主地控制adv。

在一个实施方式中，使用动态规划迭代地生成路径配置文件和速度配置文件。在一个实施方式中，对于遇到的每个障碍物决策，路径配置文件包括避开、让行、忽视或从所遇到的障碍物的左边或右边掠过的决策。

在一个实施方式中，对路径配置文件和速度配置文件执行二次规划优化包括：使用二次规划优化第一成本函数(例如，一个或多个路径成本函数)以基于路径配置文件生成基点-侧移图；以及使用二次规划优化第二成本函数(例如，一个或多个速度成本函数)以基于速度配置文件生成基点-时间图。在另一实施方式中，基点-侧移图通过基于一个或多个障碍物决策形成一个或多个障碍而生成。在另一实施方式中，第一成本函数包括前进方向成本、曲率成本和/或距离成本。在另一实施方式中，第二成本函数包括加速度成本、急动度成本和/或距离成本。在另一实施方式中，处理逻辑基于基点-侧移图和基点-时间图进一步向第二轨迹插入在第一轨迹中不存在的多个点。

图9是示出根据一个实施方式的规划模块的示例的框图。规划模块901类似于图5b的规划模块305。此外，规划模块901包括梯度下降模块903。梯度下降模块903可执行梯度下降优化方法来优化成本函数。例如，在一个实施方式中，梯度下降模块903对与如上所述的路径成本函数类似的路径成本函数执行梯度下降优化，代替由路径成本模块529执行的二次规划优化。在另一实施方式中，梯度下降模块903对与如上所述的速度成本函数类似的速度成本函数执行梯度下降优化，代替由速度成本模块535执行的二次规划优化。梯度下降是用于找出函数的最小值的一阶迭代优化算法。为了使用梯度下降找出函数的局部最小值，所述算法采取与当前点处的函数的梯度的负值成比例的步长。所述算法可计算当前值处的成本函数的微分(即，梯度)并采取与所述微分成比例的步长，并重复直至达到最小值点。

图10是示出根据一个实施方式的方法的流程图。过程1000可通过处理逻辑来执行，所述处理逻辑可包括软件、硬件或其组合。例如，过程1000可通过自动驾驶车辆的感知与规划系统110来执行。参考图10，在框1001处，处理逻辑基于地图和路线信息来计算第一轨迹。在框1002处，处理逻辑基于第一轨迹、交通规则以及描述由adv感知的一个或多个障碍物的障碍物信息来生成路径配置文件，其中，对于每一个障碍物，路径配置文件包括从障碍物的左侧或右侧掠过或让行的决策。在框1003处，处理逻辑基于路径配置文件根据交通规则来生成速度配置文件。在框1004处，处理逻辑基于路径配置文件和速度配置文件执行梯度下降优化，以生成表示优化后的第一轨迹的第二轨迹。梯度下降优化可使用相应的路径成本函数、速度成本函数和/或障碍物成本函数来执行，以确定具有最小总成本的最佳路线。在框1005处，处理逻辑根据第二轨迹控制adv。

在一个实施方式中，路径配置文件和速度配置文件使用动态规划迭代地生成。在一个实施方式中，对于障碍物信息中的遇到的每个障碍物，速度配置文件包括跟随、超过、让行、停止或经过所遇到的障碍物的决策。

在一个实施方式中，基于路径配置文件和速度配置文件执行梯度下降优化包括：使用梯度下降优化来对第一成本函数和第二成本函数进行优化，以分别基于路径配置文件和速度配置文件生成基点-侧移图和基点-时间图；以及基于基点-侧移图和基点-时间图生成第二轨迹，从而根据第二轨迹控制adv。在另一实施方式中，基点-侧移图通过基于一个或多个障碍物决策形成一个或多个障碍而生成。在另一实施方式中，第一成本函数和第二成本函数包括前进方向成本、曲率成本、距离成本、加速度成本和急动度成本。在另一实施方式中，处理逻辑基于基点-侧移图和基点-时间图进一步在第二轨迹中插入在第一轨迹中不存在的多个点。

在一个实施方式中，规划模块可根据adv所遇到的障碍物来确定将adv从起始位置移动到结束位置的所有可行的和/或可能的决策。在没有初始约束的情况下，规划模块1100基于由路线安排模块307提供的参考线路根据可行的和/或可能的障碍物决策(即，避开、超过、经过、让行、掠过、停止、忽视)来优化每个可行的轨迹，并计算每一个可行的轨迹的最小总成本。例如，对于车道中的红色交通灯障碍物，尽管其它的障碍物决策也可行，但很有可能的决策将是使adv停下。规划模块1100随后选择具有最小总成本的轨迹来控制adv。

图11是示出根据一个实施方式的规划模块的示例的框图。图12a和图12b是分别示出根据一个实施方式的路径成本模块和速度成本模块的框图。

参考图11，规划模块1100与图5b的规划模块305类似。规划模块1100包括障碍物规划模块1101、路径成本模块1110和速度成本模块1120。障碍物规划模块1101包括障碍物成本计算器1103。障碍物规划模块1101规划怎样根据障碍物来控制adv。障碍物成本计算器1103可对由adv感知的每个障碍物计算障碍物成本。障碍物成本可表示避免障碍物与被计算出的特定轨迹之间的冲突的成本。例如，避免障碍物与轨迹之间的冲突的成本可包括基于障碍物与所述轨迹的最近点之间的距离的成本(“距离成本”)，以及预估经过障碍物的通过速度的成本(“通过速度的成本”)。

在一个实施方式中，当轨迹与障碍物之间的距离比阈值(诸如2米)大时，距离成本可被忽略。在一个实施方式中，距离成本是指数函数。例如，距离成本可以是：w1*exp^(2-x)-1，其中，w1是权重因数，以及x是轨迹与障碍物之间的距离。在一个实施方式中，通过速度的成本是对数函数。例如，通过速度的成本可以是：w2*log(speed,4)，其中，w2是权重因数，以及speed(速度)是adv相对于所经过的障碍物的相对速度。在一个实施方式中，总障碍物成本基于距离成本和通过速度的成本来计算，例如，总障碍物成本是上述两个成本的乘积：(w1*exp^(2-x)-1)*(w2*log(speed,4))。

路径成本模块1110与图5b的路径成本模块529类似。参考图12a，路径成本模块1110包括曲率成本计算器1201、曲率增量成本计算器1203和正向长度成本计算器1205。曲率成本计算器1201基于沿着所述轨迹的每个点的曲率来计算曲率成本。在一个实施方式中，曲率成本是指数函数。例如，曲率成本可以是w3*exp(100*c)-1，其中，w3是权重因数，以及c通常是在[0，0.2]范围内的曲率。曲率增量成本计算器1203可基于被计算出的轨迹的两个相邻点之间的曲率的差异来计算曲率增量成本。在一个实施方式中，曲率增量成本是指数函数。例如，曲率增量成本可以是w4*exp(100*c’)-1，其中，w4是权重因数，以及c'是曲率上的变化。正向长度成本计算器1205可计算表示朝向轨迹的参考线路向前移动的成本的正向长度成本。在一个实施方式中，正向长度成本是线性函数。例如，正向长度成本可以是w5*(x-x)，其中，w5是权重因数，x是到路径段的目的地的距离，以及x是行驶的距离。在一个实施方式中，路径成本模块1110可基于沿着被计算出的轨迹的所有点中的每个点的曲率成本、曲率增量成本和/或正向长度成本来计算总路径成本。例如，总路径成本可以是沿着被计算出的轨迹的所有点中的每个点的这三个成本的总和。路径成本可通过如上所述的二次规划和/或梯度下降优化来进行优化，从而获得最小的路径成本。

速度成本模块1120与图5b的速度成本模块535类似。参考图12b，速度成本模块1120包括速度成本计算器1207、速度增量成本计算器1209和速度增量变化成本计算器1211。速度成本计算器1207可根据每个点处的速度限制基于速度来计算个体速度成本。例如，在一个实施方式中，成本函数可以是当前的路线速度限制减去adv运行速度的绝对值。速度增量成本计算器1209可计算在两个相邻点之间改变速度的成本。速度增量变化成本计算器1211可计算在轨迹的两个相邻点之间改变加速度的成本。在一个实施方式中，速度增量成本和速度增量变化成本是线性函数。

在另一实施方式中，当速度增量和速度增量变化分别低于或高于预定阈值时，速度增量成本和速度增量变化成本是常量。在一个实施方式中，速度成本模块1120随后基于沿着被计算出的轨迹的所有点中的每个点的速度成本、速度增量成本和/或速度增量变化成本来计算总速度成本。例如，总速度成本可以是沿着被计算出的基点-时间曲线的所有点的每个点的这三个成本的总和。总速度成本可通过如上所述的二次规划和/或梯度下降优化来进行优化，从而获得最小速度成本。随后可通过规划模块1100来选择具有总体上具有最小的路径成本和速度成本的轨迹，从而自主地控制adv。

图13是示出根据一个实施方式的方法的流程图。过程1300可通过处理逻辑来执行，所述处理逻辑可包括软件、硬件或其组合。例如，过程1300可通过自动驾驶车辆的感知与规划系统110来执行。参考图13，在框1301处，处理逻辑基于感知到adv周围的驾驶环境(包括一个或多个障碍物)的感知信息根据交通规则集来生成用于将adv从第一位置循迹移动至第二位置的多种可行的决策。在框1302处，处理逻辑基于一个或多个可行的决策的组合来计算多个轨迹。在框1303处，处理逻辑使用多个成本函数来计算每一个轨迹的总成本。在框1304处，处理逻辑选择具有最小总成本的一个轨迹作为用于自主地控制adv的驾驶轨迹。

图14a是示出根据一个实施方式的计算路径成本的过程的流程图。过程1400可被执行为图13的框1303的一部分。过程1400可通过处理逻辑来执行，所述处理逻辑可包括软件、硬件或其组合。例如，过程1400可通过自动驾驶车辆的路径成本模块1110来执行。参考图14a，在框1401处，处理逻辑基于沿着轨迹的每个点的曲率来计算曲率成本。在框1402处，处理逻辑基于两个相邻点之间的曲率的差异来计算曲率增量成本。在框1403处，处理逻辑计算表示朝向轨迹的参考线路向前移动的成本的正向长度成本。在框1404处，处理逻辑基于曲率成本、曲率增量成本和正向长度成本来计算总路径成本。

图14b是示出根据一个实施方式的计算速度成本的过程的流程图。过程1410可执行为图13的框1303的一部分。过程1410可通过处理逻辑来执行，所述处理逻辑可包括软件、硬件或其组合。例如，过程1410可通过自动驾驶车辆的速度成本模块1120来执行。参考图14b，在框1411处，处理逻辑根据每个点处的速度限制基于速度来计算速度成本。在框1412处，处理逻辑计算表示在两个相邻点之间改变速度的成本的速度增量成本。在框1413处，处理逻辑计算表示在两个相邻点之间改变速度变化的成本的速度增量变化成本。在框1414处，处理逻辑基于速度成本、速度增量成本和速度增量变化成本来计算总速度成本。

在一个实施方式中，针对每个轨迹，处理逻辑还使用路径成本函数来计算路径成本，所述路径成本函数表示根据轨迹将adv从第一位置循迹移动至第二位置的成本。处理逻辑还计算速度成本函数，所述速度成本函数表示沿着轨迹以不同的速度来控制adv的成本，其中，基于路径成本和速度成本来计算总成本。

在一个实施方式中，使用路径成本函数来计算路径成本包括：基于沿着轨迹的每个点的曲率来计算曲率成本；以及基于两个相邻点之间的曲率的差异来计算曲率增量成本，其中，所述路径成本基于沿着轨迹的所有点的曲率成本和曲率增量成本进行计算。在另一实施方式中，处理逻辑还计算表示朝向轨迹的参考线路向前移动的成本的正向长度成本，其中，所述路径成本还基于每个点的正向长度成本进行计算。

在一个实施方式中，使用速度成本函数来计算速度成本包括：根据每个点处的速度限制基于速度来计算个体速度成本，以及计算表示在两个相邻点之间改变速度的成本的速度增量成本，其中，所述速度成本基于沿着轨迹的所有点的个体速度成本和速度增量成本进行计算。在另一实施方式中，处理逻辑还基于轨迹的每个点的加速度来计算加速度成本，其中，所述速度成本还基于每个点的加速度成本进行计算。

在一个实施方式中，处理逻辑还计算所感知的每个障碍物的障碍物成本，所述障碍物成本表示避免轨迹与障碍物之间的冲突的成本，其中，总成本还基于所述障碍物成本进行计算。在另一实施方式中，计算障碍物成本包括计算轨迹与障碍物之间的最小距离，以及计算预估经过障碍物的通过速度，其中，所述障碍物成本基于最小距离和通过速度进行计算。

图15是示出可以与本公开的一个实施方式一起使用的数据处理系统的示例的框图。例如，系统1500可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统，例如，图1的感知与规划系统110或者服务器103至104中的任一个。系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(ic)、集成电路的部分、分立电子装置或适用于电路板(诸如，计算机系统的主板或插入卡)的其它模块或者实施为以其它方式并入计算机系统的机架内的部件。

还应注意，系统1500旨在示出计算机系统的许多部件的高阶视图。然而，应当理解的是，某些实施例中可以具有附加的部件，此外，其它实施例中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(pda)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(ap)或中继器、机顶盒或其组合。此外，虽然仅示出了单个机器或系统，但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中，系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可以表示一个或多个通用处理器，诸如，微处理器、中央处理单元(cpu)等。更具体地，处理器1501可以是复杂指令集计算(cisc)微处理器、精简指令集计算(risc)微处理器、超长指令字(vliw)微处理器、或实施其它指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器，诸如，专用集成电路(asic)、蜂窝或基带处理器、现场可编程门阵列(fpga)、数字信号处理器(dsp)、网络处理器、图形处理器、通信处理器、加密处理器、协处理器、嵌入式处理器、或者能够处理指令的任何其它类型的逻辑。

处理器1501(其可以是低功率多核处理器套接口，诸如超低电压处理器)可以用作用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(soc)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口，图形子系统1504可以包括显示控制器、图形处理器和/或显示装置。

处理器1501可以与存储器1503通信，存储器1503在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)装置，诸如，随机存取存储器(ram)、动态ram(dram)、同步dram(sdram)、静态ram(sram)或者其它类型的存储装置。存储器1503可以存储包括由处理器1501或任何其它装置执行的指令序列的信息。例如，各种操作系统、装置驱动程序、固件(例如，输入输出基本系统或bios)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统，例如，机器人操作系统(ros)、来自公司的操作系统、来自苹果公司的mac/、来自公司的、linux、unix，或者其它实时或嵌入式操作系统。

系统1500还可以包括io装置，诸如装置1505至1508，包括网络接口装置1505、可选的输入装置1506，以及其它可选的io装置1507。网络接口装置1505可以包括无线收发器和/或网络接口卡(nic)。所述无线收发器可以是wifi收发器、红外收发器、蓝牙收发器、wimax收发器、无线蜂窝电话收发器、卫星收发器(例如，全球定位系统(gps)收发器)或其它射频(rf)收发器或者它们的组合。nic可以是以太网卡。

输入装置1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指针装置(诸如，手写笔)和/或键盘(例如，物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如，输入装置1506可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种，以及其它接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其它元件来检测其接触和移动或间断。

io装置1507可以包括音频装置。音频装置可以包括扬声器和/或麦克风，以促进支持语音的功能，诸如语音识别、语音复制、数字记录和/或电话功能。其它io装置1507还可以包括通用串行总线(usb)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如，pci-pci桥)、传感器(例如，诸如加速度计运动传感器、陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可以包括成像处理子系统(例如，相机)，所述成像处理子系统可以包括用于促进相机功能(诸如，记录照片和视频片段)的光学传感器，诸如电荷耦合装置(ccd)或互补金属氧化物半导体(cmos)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1510，而诸如键盘或热传感器的其它装置可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供对诸如数据、应用、一个或多个操作系统等信息的永久性存储，大容量存储设备(未示出)也可以联接到处理器1501。在各种实施方式中，为了实现更薄且更轻的系统设计并且改进系统响应性，这种大容量存储设备可以经由固态装置(ssd)来实施。然而，在其它实施方式中，大容量存储设备可以主要使用硬盘驱动器(hdd)来实施，其中较小量的ssd存储设备充当ssd高速缓存以在断电事件期间实现上下文状态以及其它此类信息的非易失性存储，从而使得在系统活动重新启动时能够实现快速通电。另外，闪存装置可以例如经由串行外围接口(spi)联接到处理器1501。这种闪存装置可以提供系统软件的非易失性存储，所述系统软件包括所述系统的bios以及其它固件。

存储装置1508可以包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质)，其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如，模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可以表示上述部件中的任一个，例如图3a和图3b的决策模块304、规划模块305、控制模块306、图5a的路径决策模块501、速度决策模块502以及图5b的路径规划模块521、速度规划模块523。处理模块/单元/逻辑1528还可以在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内，数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可以通过网络经由网络接口装置1505进行传输或接收。

计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质，但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如，集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质，所述指令集用于由机器执行并且使得所述机器执行本公开的任何一种或多种方法。因此，术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质，或者任何其它非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1528、部件以及其它特征可以实施为分立硬件部件或集成在硬件部件(诸如，asics、fpga、dsp或类似装置)的功能中。此外，处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外，处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。

应注意，虽然系统1500被示出为具有数据处理系统的各种部件，但是并不旨在表示使部件互连的任何特定架构或方式；因为此类细节和本公开的实施方式没有密切关系。还应当认识到，具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其它数据处理系统也可以与本公开的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式，以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中，算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而，应当牢记，所有这些和类似的术语均旨在与适当的物理量关联，并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其它方式明确地指出，否则应当了解，在整个说明书中，利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理，所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据，并将所述数据变换成计算机系统存储器或寄存器或者其它此类信息存储设备、传输或显示装置内类似地表示为物理量的其它数据。

本公开的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如，计算机)可读的形式存储信息的任何机构。例如，机器可读(例如，计算机可读)介质包括机器(例如，计算机)可读存储介质(例如，只读存储器(“rom”)、随机存取存储器(“ram”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行，所述处理逻辑包括硬件(例如，电路、专用逻辑等)、软件(例如，体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的，但是应当了解，所述操作中的一些可以按不同的顺序执行。此外，一些操作可以并行地执行而不是顺序地执行。

本公开的实施方式并未参考任何特定的编程语言进行描述。应认识到，可以使用多种编程语言来实施如本文描述的本公开的实施方式的教导。

在以上的说明书中，已经参考本公开的具体示例性实施方式对本发明的实施方式进行了描述。将显而易见的是，在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下，可以对本公开作出各种修改。因此，应当在说明性意义而不是限制性意义上来理解本说明书和附图。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱帆;孔旗
技术所有人：百度（美国）有限责任公司
我是此专利的发明人

上一篇：一种提取植物有效成分方法与流程
上一篇：服务器的防火墙更新方法和装置与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。