使用基于学习的模型预测控制来确定自动驾驶车辆的道路摩擦的方法和系统与流程

文档序号：15702343发布日期：2018-10-19 20:03阅读：256来源：国知局

导航： X技术> 最新专利>控制;调节装置的制造及其应用技术

本发明实施方式总体涉及操作自动驾驶车辆。更具体地，本发明实施方式涉及确定自动驾驶车辆的道路摩擦。

背景技术：

以自动驾驶模式运行(例如，无人驾驶)的车辆可以将乘员、尤其是驾驶员从一些驾驶相关的职责中解放出来。当以自动驾驶模式运行时，车辆可以使用车载传感器导航到各种位置，从而允许车辆在最少人机交互的情况下或在一些没有任何乘客的情况下行驶。

运动规划和控制是自动驾驶的关键操作。然而，传统的运动规划操作主要从其曲率和速度估计完成给定路径的难度，而不考虑不同类型的车辆的特征上的差异。相同的运动规划和控制被应用于所有类型的车辆，这在某些情况下可能是不准确和不顺畅的。

此外，道路摩擦对于在自动驾驶中增加车辆路径控制是关键的。然而，利用直接测量方法来确定道路摩擦是困难的。

技术实现要素：

本公开的实施方式提供了用于操作自动驾驶车辆的计算机实现的方法、非临时性机器可读介质和数据处理系统。

在本公开一方面中，用于操作自动驾驶车辆的计算机实现的方法包括：接收规划数据以从起始位置和目的地位置驾驶自动驾驶车辆(ADV)；基于规划数据生成一系列控制命令，其中，控制命令待在从起始位置到目的地位置的多个时间点处被施加；通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦应用成本函数来计算成本；以及鉴于先前行程的先前终止成本，使用成本函数来估计当前行程的第一道路摩擦，以使得成本达到最小值。

在本公开另一方面中，非临时性机器可读介质具有存储在其中的指令，该指令在由处理器执行时使得处理器执行操作，该操作包括：接收规划数据以从起始位置和目的地位置驾驶自动驾驶车辆(ADV)；基于规划数据生成一系列控制命令，其中，控制命令待在从起始位置到目的地位置的多个时间点处被施加；通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦应用成本函数来计算成本；以及鉴于先前行程的先前终止成本，使用成本函数来估计当前行程的第一道路摩擦，以使得成本达到最小值。

在本公开另外一方面中，数据处理系统包括处理器和存储器，该存储器与处理器联接以存储指令，该指令在由处理器执行时使得处理器执行操作，该操作包括：接收规划数据以从起始位置和目的地位置驾驶自动驾驶车辆(ADV)；基于规划数据生成一系列控制命令，其中，控制命令待在从起始位置到目的地位置的多个时间点处被施加；通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦应用成本函数来计算成本；以及鉴于先前行程的先前终止成本，使用成本函数来估计当前行程的第一道路摩擦，以使得成本达到最小值。

附图说明

本发明实施方式在附图的各图中以举例而非限制的方式示出，附图中的相同参考数字指示类似元件。

图1是示出根据本发明一个实施方式的网络化系统的框图。

图2是示出根据本发明一个实施方式的自动驾驶车辆的示例的框图。

图3是示出根据本发明一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。

图4是示出根据本发明一个实施方式的模型预测控制器的示例的框图。

图5是示出根据本发明一个实施方式的估计道路摩擦的处理的事务图。

图6是示出根据本发明一个实施方式的估计道路摩擦的处理的流程图。

图7是示出根据本发明另一个实施方式的估计道路摩擦的处理的流程图。

图8是示出根据一个实施方式的数据处理系统的框图。

具体实施方式

以下将参考所讨论的细节来描述本发明的各种实施方式和方面，附图将示出所述各种实施方式。下列描述和附图是对本发明的说明，而不应当解释为限制本发明。描述了许多特定细节以便提供对本发明各种实施方式的全面理解。然而，在某些情况下，并未描述众所周知的或常规的细节以便提供对本发明实施方式的简洁讨论。

本说明书中对“一个实施方式”或“实施方式”的提及意味着结合该实施方式所描述的特定特征、结构或特性可以包括在本发明的至少一个实施方式中。短语“在一个实施方式中”在本说明书中各个地方的出现不必全部是指同一实施方式。

在日常通勤中，驾驶员通常定期在如家庭和工作场所的两个固定地点之间移动。因此，它们是大致相同的起始位置和目的地位置。根据一些实施方式，基于学习的模型预测控制(MPC)机制被利用于学习和适应性地更新如道路摩擦的未知参数的估计，以优化自动驾驶的控制算法。对于从起始位置到目的地位置的每次行程，道路摩擦是基于车辆响应于沿着起始位置与目的地位置之间的路径在不同的时间点处发出的控制命令(例如，油门、制动、转向命令)的反应(例如，位置、速度、方向)来估计的。

当前行程的道路摩擦是使用MPC方法基于在从相同的起始位置到目的地位置的先前行程期间估计的道路摩擦来估计的。成本是对行程中的每个使用成本函数基于当前行程和最后一次行程的道路摩擦之间的差值来计算的。道路摩擦是对从起始位置到目的地的每次行程迭代地估计的，直到最后两次行程的成本的差值降低到预定阈值以下。此时，最后一次估计的道路摩擦被指定为针对起始位置与目的地位置之间的道路的前进方向上的最终道路摩擦。出于从起始位置和目的地位置驾驶自动驾驶车辆的目的，道路摩擦可被利用为确定或调整后续控制命令。

在一个实施方式中，例如从规划模块接收规划数据以从起始位置和目的地位置驾驶自动驾驶车辆(ADV)。作为响应，基于规划数据生成一系列控制命令，其中，控制命令待在从起始位置到目的地位置的不同的时间点处被施加。通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦应用成本函数来计算成本。鉴于先前行程的终止成本，使用成本函数来估计当前行程的第一道路摩擦，以使得成本达到最小值。终止成本是在先前行程的目的地处计算的成本。

图1是示出根据本发明一个实施方式的自动驾驶车辆网络配置的框图。参考图1，配置100包括可以通过网络102通信地联接到一个或多个服务器103至104的自动驾驶车辆101。尽管示出一个自动驾驶车辆，但多个自动驾驶车辆可以通过网络102联接到彼此和/或联接到服务器103至104。网络102可以是任何类型的网络，例如，有线或无线的局域网(LAN)、诸如互联网的广域网(WAN)、蜂窝网络、卫星网络或其组合。服务器103至104可以是任何类型的服务器或服务器群集，诸如，网络或云服务器、应用服务器、后端服务器或其组合。服务器103至104可以是数据分析服务器、内容服务器、交通信息服务器、地图和兴趣点(MPOI)服务器或者位置服务器等。

自动驾驶车辆是指可以被配置成处于自动驾驶模式下的车辆，在所述自动驾驶模式下车辆在极少或没有来自驾驶员的输入的情况下导航通过环境。这种自动驾驶车辆可以包括传感器系统，所述传感器系统具有被配置成检测与车辆运行环境有关的信息的一个或多个传感器。所述车辆和其相关联的控制器使用所检测的信息来导航通过所述环境。自动驾驶车辆101可以在手动模式下、在全自动驾驶模式下或者在部分自动驾驶模式下运行。

在一个实施方式中，自动驾驶车辆101包括，但不限于，感知与规划系统110、车辆控制系统111、无线通信系统112、用户接口系统113、信息娱乐系统114和传感器系统115。自动驾驶车辆101还可以包括普通车辆中包括的某些常用部件，诸如：发动机、车轮、方向盘、变速器等，所述部件可以由车辆控制系统111和/或感知与规划系统110使用多种通信信号和/或命令进行控制，例如，加速信号或命令、减速信号或命令、转向信号或命令、制动信号或命令等。

部件110至115可以经由互连件、总线、网络或其组合通信地联接到彼此。例如，部件110至115可以经由控域网(CAN)总线通信地联接到彼此。CAN总线是被设计成允许微控制器和装置在没有主机的应用中与彼此通信的车辆总线标准。它是最初是为汽车内的多路电线设计的基于消息的协议，但也用于许多其他环境。

现在参考图2，在一个实施方式中，传感器系统115包括但不限于一个或多个摄像机211、全球定位系统(GPS)单元212、惯性测量单元(IMU)213、雷达单元214以及光探测和测距(LIDAR)单元215。GPS系统212可以包括收发器，所述收发器可操作以提供关于自动驾驶车辆的位置的信息。IMU单元213可以基于惯性加速度来感测自动驾驶车辆的位置和定向变化。雷达单元214可以表示利用无线电信号来感测自动驾驶车辆的本地环境内的对象的系统。在一些实施方式中，除感测对象之外，雷达单元214可以另外感测对象的速度和/或前进方向。LIDAR单元215可以使用激光来感测自动驾驶车辆所处环境中的对象。除其他系统部件之外，LIDAR单元215还可以包括一个或多个激光源、激光扫描器以及一个或多个检测器。摄像机211可以包括用来采集自动驾驶车辆周围环境的图像的一个或多个装置。摄像机211可以是静物摄像机和/或视频摄像机。摄像机可以是可机械地移动的，例如，通过将摄像机安装在旋转和/或倾斜平台上。

传感器系统115还可以包括其他传感器，诸如：声纳传感器、红外传感器、转向传感器、油门传感器、制动传感器以及音频传感器(例如，麦克风)。音频传感器可以被配置成从自动驾驶车辆周围的环境中捕获声音。转向传感器可以被配置成感测方向盘、车辆的车轮或其组合的转向角度。油门传感器和制动传感器分别感测车辆的油门位置和制动位置。在一些情形下，油门传感器和制动传感器可以集成为集成式油门/制动传感器。

在一个实施方式中，车辆控制系统111包括但不限于转向单元201、油门单元202(也被称为加速单元)和制动单元203。转向单元201用来调整车辆的方向或前进方向。油门单元202用来控制电动机或发动机的速度，电动机或发动机的速度转而控制车辆的速度和加速度。制动单元203通过提供摩擦使车辆的车轮或轮胎减慢而使车辆减速。应注意，如图2所示的部件可以在硬件、软件或其组合中实施。

回到图1，无线通信系统112允许自动驾驶车辆101与诸如装置、传感器、其他车辆等外部系统之间的通信。例如，无线通信系统112可以与一个或多个装置直接无线通信，或者经由通信网络进行无线通信，诸如，通过网络102与服务器103至104通信。无线通信系统112可以使用任何蜂窝通信网络或无线局域网(WLAN)，例如，使用WiFi，以与另一部件或系统通信。无线通信系统112可以例如使用红外链路、蓝牙等与装置(例如，乘客的移动装置、显示装置、车辆101内的扬声器)直接通信。用户接口系统113可以是在车辆101内实施的外围装置的部分，包括例如关键词、触摸屏显示装置、麦克风和扬声器等。

自动驾驶车辆101的功能中的一些或全部可以由感知与规划系统110控制或管理，尤其当在自动驾驶模式下操作时。感知与规划系统110包括必要的硬件(例如，处理器、存储器、存储装置)和软件(例如，操作系统、规划和安排路线程序)，以从传感器系统115、控制系统111、无线通信系统112和/或用户接口系统113接收信息，处理所接收的信息，规划从起始点到目的地点的路线或路径，随后基于规划和控制信息来驾驶车辆101。替代地，感知与规划系统110可以与车辆控制系统111集成在一起。

例如，作为乘客的用户可以例如经由用户接口来指定行程的起始位置和目的地。感知与规划系统110获得行程相关数据。例如，感知与规划系统110可以从MPOI服务器中获得位置和路线信息，所述MPOI服务器可以是服务器103至104的一部分。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI。替代地，此类本地和MPOI信息可以本地高速缓存在感知与规划系统110的永久性存储装置中。

当自动驾驶车辆101沿着路线移动时，感知与规划系统110也可以从交通信息系统或服务器(TIS)获得实时交通信息。应注意，服务器103至104可以由第三方实体进行操作。替代地，服务器103至104的功能可以与感知与规划系统110集成在一起。基于实时交通信息、MPOI信息和位置信息以及由传感器系统115检测或感测的实时本地环境数据(例如，障碍物、对象、附近车辆)，感知与规划系统110可以规划最佳路线并且根据所规划的路线例如经由控制系统111来驾驶车辆101，以安全有效地到达指定目的地。

服务器103可以是用于为各种客户端执行数据分析服务的数据分析系统。在一个实施方式中，数据分析系统103包括数据收集器121和机器学习引擎122。数据收集器121收集来自各种车辆(自动驾驶车辆或由驾驶员驾驶的常规车辆)的驾驶统计信息123。驾驶统计信息123包括指示在不同的时间点处发出的驾驶命令(例如，油门、刹车、转向命令)和由车辆的传感器捕获的车辆响应(例如，速度、加速度、减速度、方向)的信息。驾驶统计信息123还可以包括描述不同的时间点处的驾驶环境的信息，诸如例如路线(包括起始位置和目的地位置)、MPOI、道路状况、天气状况等。

基于驾驶统计信息123，机器学习引擎122出于各种目的执行或训练一组规则、算法和/或预测模型124。在一个实施方式中，基于相同类型或相似类型的车辆的驾驶统计信息，为特定类型的自动驾驶车辆创建用于确定道路摩擦的MPC模型。MPC模型的系数或增益可以基于驾驶统计信息123来确定，其中，驾驶统计信息123可以在各种驾驶条件下由驾驶员驾驶车辆时捕获和记录。在一个实施方式中，MPC模型可以包括或调用成本函数以实时确定道路摩擦。道路摩擦可以基于从起始位置到目的地位置的重复行驶中的驾驶之间的成本来确定，以使得成本在重复行程之间达到最小值。MPC模型和相应的成本函数可以被上载到相应类型的车辆上以被利用于实时确定特定道路的道路摩擦。

图3是示出根据本发明一个实施方式的与自动驾驶车辆一起使用的感知与规划系统的示例的框图。系统300可以被实施为图1的自动驾驶车辆101的一部分，包括但不限于感知与规划系统110、控制系统111和传感器系统115。参考图3，感知与规划系统110包括但不限于定位模块301、感知模块302、决策模块303、规划模块304以及控制模块305。

模块301至307中的一些或全部可以以软件、硬件或其组合中实现。例如，这些模块可以安装在永久性存储装置352中、加载到存储器351中，并且由一个或多个处理器(未示出)执行。应注意，这些模块中的一些或全部可以通信地联接到图2的车辆控制系统111的一些或全部模块或者与它们集成在一起。模块301至307中的一些可以一起集成为集成模块。

定位模块301(也被称为地图与路线模块)管理与用户的行程或路线相关的任何数据。用户可以例如经由用户接口登录并且指定行程的起始位置和目的地。定位模块301与自动驾驶车辆300的其他部件通信，诸如地图和路线信息311，以获得行程相关数据。例如，定位模块301可以从位置服务器和地图与POI(MPOI)服务器获得位置和路线信息。位置服务器提供位置服务，并且MPOI服务器提供地图服务和某些位置的POI，从而可以作为地图和路线信息311的一部分高速缓存。当自动驾驶车辆300沿着路线移动时，定位模块301也可以从交通信息系统或服务器获得实时交通信息。

基于由传感器系统115提供的传感器数据和由定位模块301获得的定位信息，感知模块302确定周围环境的感知。感知信息可以表示普通驾驶员在驾驶员正驾驶的车辆周围将感知到的东西。感知可以包括车道配置(例如，直线车道或弯曲车道)、交通灯信号、另一车辆的相对位置、行人、建筑物、人行横道或例如采用对象形式的其他交通相关标志(例如，停止标志、让路标志)等。

感知模块302可以包括计算机视觉系统或计算机视觉系统的功能，以处理并分析由一个或多个摄像机捕获的图像，以便识别自动驾驶车辆环境中的对象和/或特征。所述对象可以包括交通信号、道路边界、其他车辆、行人和/或障碍物等。计算机视觉系统可以使用对象识别算法、视频跟踪以及其他计算机视觉技术。在一些实施方式中，计算机视觉系统可以绘制环境地图，跟踪对象，以及估算对象的速度等。感知模块302也可以基于由诸如雷达和/或LIDAR的其他传感器提供的其他传感器数据来检测对象。

针对每个对象，决策模块303作出关于如何处置对象的决定。例如，针对特定对象(例如，交叉路线中的另一车辆)以及描述对象的元数据(例如，速度、方向、转弯角度)，决策模块303决定如何与所述对象相遇(例如，超车、让路、停止、超过)。决策模块303可以根据诸如交通规则或驾驶规则312的规则集来作出此类决定，所述规则集可以存储在永久性存储装置352中。

基于针对所感知到的对象中的每个的决定，规划模块304为自动驾驶车辆规划路径或路线以及驾驶参数(例如，距离、速度和/或转弯角度)。换言之，针对给定的对象，决策模块303决定对该对象做什么，而规划模块304确定如何去做。例如，针对给定的对象，决策模块303可以决定超过所述对象，而规划模块304可以确定在所述对象的左侧还是右侧超过。规划和控制数据由规划模块304生成，包括描述车辆300在下一移动循环(例如，下一路线/路径段)中将如何移动的信息。例如，规划和控制数据可以指示车辆300以30英里每小时(mph)的速度移动10米，随后以25mph的速度变到右侧车道。

基于规划和控制数据，控制模块305根据由规划和控制数据限定的路线或路径通过将适当的命令或信号发送到车辆控制系统111来控制并驾驶自动驾驶车辆。所述规划和控制数据包括足够的信息，以沿着路径或路线在不同的时间点使用适当的车辆设置或驾驶参数(例如，油门、制动和转弯命令)将车辆从路线或路径的第一点驾驶到第二点。

应注意，决策模块303和规划模块304可以集成为集成模块。决策模块303/规划模块304可以包括导航系统或导航系统的功能，以确定自动驾驶车辆的驾驶路径。例如，导航系统可以确定用于实现自动驾驶车辆沿着以下路径移动的一系列速度和前进方向：所述路径在使自动驾驶车辆沿着通往最终目的地的基于车行道的路径前进的同时，基本上避免感知到的障碍物。目的地可以根据经由用户接口系统113进行的用户输入来设定。导航系统可以在自动驾驶车辆正在运行的同时动态地更新驾驶路径。导航系统可以将来自GPS系统和一个或多个地图的数据合并，以确定用于自动驾驶车辆的驾驶路径。

决策模块303/规划模块304还可以包括防撞系统或防撞系统的功能，以识别、评估并且避免或以其他方式越过自动驾驶车辆的环境中的潜在障碍物。例如，防撞系统可以通过以下方式实现自动驾驶车辆的导航中的变化：操作控制系统111中的一个或多个子系统来采取转向操纵、转弯操纵、制动操纵等。防撞系统可以基于周围的交通模式、道路状况等自动确定可行的障碍物回避操纵。防撞系统可以被配置成使得当其他传感器系统检测到位于自动驾驶车辆将转向进入的相邻区域中的车辆、建筑障碍物等时不采取转向操纵。防撞系统可以自动选择既可使用又使得自动驾驶车辆乘员的安全性最大化的操纵。防撞系统可以选择预测使得自动驾驶车辆的乘客舱中出现最小量的加速度的避让操纵。

根据一个实施方式，控制模块305包括MPC控制器310以确定两个固定或预定位置之间的道路的道路摩擦。这两个位置可以是普通驾驶员定期来回行驶的日常通勤路线的起始位置和目的地位置。MPC控制器310基于从两个位置之间的迭代行程重复收集的驾驶统计信息来估计道路摩擦。鉴于从一个或多个先前行程估计的道路摩擦，当前行程的道路摩擦是基于当前行程的驾驶统计信息来估计的。

在一个实施方式中，成本函数(如成本函数315)被利用于基于驾驶统计信息和估计的道路摩擦来计算成本，以使得当前行程和最后一次行程的成本之间的差值达到最小值。该处理对这两个位置之间行驶的每次行程迭代地执行，并且道路摩擦被迭代地估计和调整，直到相同位置之间的最后两次行程的成本收敛，即，最新两次行程的成本之间的差值低于预定阈值。在这一点上，最新估计的道路摩擦将被指定为道路的最终道路摩擦。随后，控制命令将鉴于最终道路摩擦来生成并发出。MPC控制器310和成本函数315可以通过数据分析系统(如图1的数据分析系统103)来离线创建和建模。

图4是示出根据本发明一个实施方式的模型预测控制器的示例的框图。参照图4，MPC控制器310包括摩擦确定模块401和成本计算器402，其中，MPC控制器310是控制模块305的一部分。响应于从规划模块304接收的规划数据，控制模块305生成并向车辆平台或底盘403发出一个或多个控制命令(例如，油门、制动和转向命令)以根据由规划模块304规划的路径来驾驶车辆。车辆响应(例如，位置、速度、方向)可以在不同的时间点处被捕获和记录，并且响应被反馈回控制模块和/或规划模块以确定后续的规划和控制命令。

根据一些实施方式，MPC控制器310利用基于学习的模型预测控制方法来学习和适应性地更新道路摩擦的估计，以优化自动驾驶的控制算法。对于从起始位置到目的地位置的每次行程，道路摩擦是基于车辆响应于沿着起始位置与目的地位置之间的路径在不同的时间点处发出的控制命令(例如，油门、制动、转向命令)的响应(例如，位置、速度、方向)来估计的。

MPC控制器310的摩擦确定模块401基于在从相同的起始位置到目的地位置的先前行程期间估计的道路摩擦来估计当前行程的道路摩擦。估计的道路摩擦被估计和记录为道路摩擦数据411的一部分，其中，道路摩擦数据411可以存储在如硬盘的永久性存储装置中。成本计算器使用一个或多个成本函数315基于当前行程与先前行程之间的道路摩擦之间的差值来计算行程中的每个的成本。如上所述，成本函数315可被离线创建和建模。成本还可以鉴于先前行程的终止成本来计算，其可以被记录为存储在永久性存储装置中的终止成本412的一部分。术语“终止成本”是指使用成本函数在特定行程的目的地位置处计算的成本。

道路摩擦对从起始位置到目的地的每次行程由MPC控制器310迭代地估计，直到最后两次行程的成本的差异降低到预定阈值以下。此时，最后一次估计的道路摩擦被指定为针对起始位置与目的地位置之间的道路的前进方向上的最终道路摩擦。出于从起始位置和目的地位置驾驶自动驾驶车辆的目的，道路摩擦可被利用为确定后续控制命令。

在一个实施方式中，例如从规划模块304接收规划数据，以从起始位置和目的地位置驾驶自动驾驶车辆(ADV)。作为响应，一系列控制命令基于规划数据通过控制模块生成，其中，控制命令待在从起始位置到目的地位置的不同时间点处被施加。MPC控制器的成本计算器402通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦(例如，摩擦数据411)应用成本函数315来计算成本。摩擦确定模块401鉴于先前行程的先前终止成本412使用成本函数来估计当前行程的第一道路摩擦，以使得成本达到最小值。终止成本412是在先前行程的目的地处计算的成本。

图5是示出根据本发明一个实施方式的估计道路摩擦的处理的事务图。参照图5，当车辆在两个已知的位置(在本示例中为位置501和位置502)之间重复行驶时，先前的驾驶统计信息可被利用于估计道路摩擦。例如，位置501可以是家庭位置，而位置502可以是特定用户的工作场所。用户可以定期每天在位置501至502之间驾驶车辆。当从规划模块接收到规划数据以将车辆从位置501驾驶到位置502时，一系列控制命令被生成以沿着从位置501到位置502的路径在不同的时间点处应用到车辆，正如由时间刻度1、2、...k、...和n-1。

对于每个时间点，车辆响应(例如，位置、速度和方向)响应于例如在前一时间点或时隙(也称为命令周期)中发出的控制命令来测量和记录。此外，鉴于从相同的时间点的先前行程估计的摩擦，估计与每个时间点对应的路段相关联的道路摩擦。成本函数被利用于基于在位置501与位置502之间当前行程中估计的摩擦与先前行程中估计的摩擦之间的差值来计算成本。差值表示在两个迭代行程之间估计道路摩擦中的误差。目标在于估计当前行程的道路摩擦，以使得成本(表示误差)达到最小值。因此，道路摩擦的估计将变得更接近每次行程的实际道路摩擦。随着行程数量的增加，迭代地执行的道路摩擦的估计将最终足够接近以表示实际的道路摩擦。

返回参照图5，将行程511假设为从位置501到位置502的第一个总体行程，则系统为由时间或命令周期1到N表示的路段中的每个初始地设置初始道路摩擦(称为路段摩擦)。对于每个命令周期，响应于在命令周期期间发出的控制命令(例如，油门、制动、转向)，来自车辆的响应(例如，位置、速度、方向)被测量。命令周期是指将发出控制命令的周期性时间段。例如，控制命令可以每0.1秒发出一次。0.1秒的时间段被称为命令周期。

通常，响应于控制命令的来自车辆的响应将受到道路摩擦的影响。行程511的成本是使用成本函数(表示为成本函数J)鉴于控制命令、来自车辆的响应、当前行程的估计的道路摩擦(例如，初始道路摩擦)和来自先前行程的估计的道路摩擦(例如，在先前行程中确定的“实际”摩擦)来计算的。在本示例中，由于行程511是第一个整体行程，系统可以分配预定的初始值。在一个实施方式中，道路摩擦可以初始地分配有如2的大值，而试路的典型摩擦可以是大约0.9。行程的道路摩擦由与位置501与位置502之间的路段相关联的多个路段摩擦表示。每个路段对应于时间点或命令周期中的一个。时间或命令周期1到N的路段摩擦被估计或调整成使得成本达到最小值。成本也被称为行程的终止成本。在本示例中，针对行程511，终止成本Q0被计算并保持。

当车辆再次从位置501行驶到位置502(在本示例中为行程512)时，基于从先前行程(即，行程511)估计的道路摩擦，迭代地执行上述处理以估计行程的道路摩擦。如图5中所示，针对行程512，成本函数将基于先前行程(例如，行程511)的终止成本：J+Q0。行程512的成本将使用成本函数鉴于行程511的终止成本Q0来计算。行程512的道路摩擦被估计为使得鉴于行程511的终止成本的成本函数的成本达到最小值。具体地，行程512的道路摩擦可以基于在行程512期间估计的路段摩擦与在本示例中如上所述在行程511期间针对对应的路段1至N估计的对应的路段摩擦之间的差值来估计。成本表示当前行程的估计的路段摩擦与先前行程的估计的路段摩擦之间的误差之和或总和。

上述处理被迭代地执行，直到当前行程的终止成本与先前行程的终止成本之间的差值收敛。也就是说，上述处理被迭代地执行，直到当前行程与最后一次行程之间的终止成本的差值低于预定阈值。在这种情况下，最后一次估计的最后一次行程的道路摩擦将成为表示实际道路摩擦的估计的道路摩擦。通过作为反馈鉴于先前成本和道路摩擦估计而迭代地执行成本处理，估计的准确度可以随时间推移而被改进。

成本函数可以基于作为MPC控制器310的一部分的MPC算法或模型来创建和建模。模型预测控制器依赖于处理的动态模型，最通常是线性经验模型。MPC的主要优点在于其可以使当前的时隙得到优化，同时保留未来的时隙作为考虑。这是通过优化有限的时间范围来实现的，但是只实现当前的时隙。MPC具有预测未来事件的能力，并且相应地可以采取控制行动。MPC模型预测将由自变量的变化引起的模型化系统的因变量的变化。不能被控制器调整的自变量被用作干扰。这些处理中的因变量是代表控制目标或处理约束的其他测量。这些变化被计算以将因变量保持得接近目标，同时遵守自变量和因变量的约束。

在一个实施方式中，成本函数(J)可以实现为如下：

其中，ek表示在与当前行程(j)期间的时间点(k)对应的道路摩擦与针对当前行程的估计的道路摩擦(例如，基于先前行程确定的道路摩擦)之间的误差。Δk是指示车辆是否到达目的地的常量。如果车辆到达目的地，则Δk可以设置成1；否则为0。Q^j-1表示先前行程(j-1)的终止成本。

注意，上述MPC成本函数被称为是增强的MPC成本函数，因为其考虑了先前行程的终止成本，而传统的MPC函数不考虑先前行程的终止成本。传统的MPC成本函数(在此被称为标称成本函数)将仅具有第一部分，而不考虑先前的行程Q^j-1的终止成本，如下所示：

在一个实施方式中，上述MPC成本函数可以由以下公式表示：

其中，qk是表示在时间点(k)处的车辆状态的状态矩阵。表示qk的转置。

在一个实施方式中，Qk＝{xk,yk,vk,sk,ek}。xk和yk表示车辆在时间(k)处的位置，例如，车辆的纬度和经度。vk表示车辆在时间(k)处的速度。sk表示在与时间(k)处的路段对应的估计的道路摩擦。ek表示在当前行程和最后一次行程中估计的与时间(k)对应的路段的道路摩擦之间的误差。M是状态加权矩阵(例如，5×5矩阵)。μk表示鉴于估计的摩擦sk而在时间(k)处发出的控制命令的输入矩阵。表示μk的转置。在一个实施方式中，μk＝{αk,θk,sk+1-sk}，其中，αk表示速度控制命令(例如，油门或制动命令)，并且θk表示转向命令。sk+1-sk表示在相同的行程内在时隙(k+1)和时隙(k)处确定的道路摩擦之间的差值。N是输入加权矩阵(例如，3×3矩阵)。M和N可以由数据分析系统(如数据分析系统103)预先确定。在本示例中，MPC模型中的自变量是μk。因变量是车辆的位置、方向/角度、速度和转速等。

图6是示出根据本发明一个实施方式的估计道路摩擦的处理的流程图。处理600可以通过处理逻辑来执行，其中，处理逻辑可以包括软件、硬件或其组合。例如，处理600可以由图3的MPC控制器310执行。参照图6，在操作601中，处理逻辑接收规划数据以将自动驾驶车辆(ADV)从起始位置驾驶到目的地位置。基于规划数据，在操作602中，处理逻辑生成将沿着从起始位置到目的地位置的路径在不同的时间点或命令周期处应用的一系列控制命令(例如，油门、制动、转向命令)。在操作603中，处理逻辑通过向控制命令、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦上应用成本函数来计算成本。在操作604中，鉴于在起始位置与目的地位置之间的先前行程的终止成本，使用成本函数对当前行程处理估计或调整第一道路摩擦，以使得成本达到最小值。

图7是示出根据本发明另一个实施方式的估计道路摩擦的处理的流程图。处理700可以通过处理逻辑来执行，其中，处理逻辑可以包括软件、硬件或其组合。例如，处理600可以由图3的MPC控制器310执行。参照图7，在操作701中，处理逻辑生成将沿着从起始位置到目的地位置的路径在不同的时间点或命令周期处应用的一系列控制命令(例如，油门、制动、转向命令)。在操作702中，处理逻辑通过向控制命令、对于先前控制命令的车辆响应、待在当前行程中估计的第一道路摩擦和在从起始位置到目的地位置的先前行程期间估计的第二道路摩擦上应用成本函数来计算成本。在操作703中，鉴于在起始位置与目的地位置之间的先前行程的终止成本，使用成本函数对当前行程处理估计或调整第一道路摩擦，以使得成本达到最小值。在操作704中，处理逻辑对当前行程的终止成本与先前行程的终止成本进行比较以确定成本是否收敛。在操作705中，如果当前行程和先前行程的成本收敛，则最后一次估计的道路摩擦将被指定为最终估计(例如，实际)的道路摩擦。否则，操作701至704可以在从起始位置到目的地位置的随后的行程中迭代地执行。

应注意，如上文示出和描述的部件中的一些或全部可以以软件、硬件或其组合中实现。例如，此类部件可以实施为安装并存储在永久性存储装置中的软件，所述软件可以通过处理器(未示出)加载在存储器中并在存储器中执行以实施贯穿本申请所述的过程或操作。替代地，此类部件可以实施为编程或嵌入到专用硬件(诸如，集成电路(例如，专用集成电路或ASIC)、数字信号处理器(DSP)或现场可编程门阵列(FPGA))中的可执行代码，所述可执行代码可以经由来自应用的相应驱动程序和/或操作系统来访问。此外，此类部件可以实施为处理器或处理器内核中的特定硬件逻辑，作为可由软件部件通过一个或多个特定指令访问的指令集的一部分。

图8是示出可以与本发明的一个实施方式一起使用的数据处理系统的示例的框图。例如，系统1500可以表示以上所述的执行上述过程或方法中的任一个的任何数据处理系统，例如，图1的感知与规划系统110或者服务器103至104中的任一个。系统1500可以包括许多不同的部件。这些部件可以实施为集成电路(IC)、集成电路的部分、分立电子装置或适用于电路板的其他模块(诸如，计算机系统的主板或插入卡)或者实施为以其他方式并入计算机系统的机架内的部件。

还应注意，系统1500旨在示出计算机系统的许多部件的高阶视图。然而，应当理解的是，某些实施方式中可以具有附加的部件，此外，其他实施方式中可以具有所示部件的不同布置。系统1500可以表示台式计算机、膝上型计算机、平板计算机、服务器、移动电话、媒体播放器、个人数字助理(PDA)、智能手表、个人通信器、游戏装置、网络路由器或集线器、无线接入点(AP)或中继器、机顶盒或其组合。此外，虽然仅示出了单个机器或系统，但是术语“机器”或“系统”还应当被理解为包括单独地或共同地执行一个(或多个)指令集以执行本文所讨论的任何一种或多种方法的机器或系统的任何集合。

在一个实施方式中，系统1500包括通过总线或互连件1510连接的处理器1501、存储器1503以及装置1505至1508。处理器1501可以表示其中包括单个处理器内核或多个处理器内核的单个处理器或多个处理器。处理器1501可以表示一个或多个通用处理器，诸如，微处理器、中央处理单元(CPU)等。更具体地，处理器1501可以是复杂指令集计算(CISC)微处理器、精简指令集计算(RISC)微处理器、超长指令字(VLIW)微处理器、或实施其他指令集的处理器、或实施指令集组合的处理器。处理器1501还可以是一个或多个专用处理器，诸如，专用集成电路(ASIC)、蜂窝或基带处理器、现场可编程门阵列(FPGA)、数字信号处理器(DSP)、网络处理器、图形处理器、网络处理器、通信处理器、加密处理器、协同处理器、嵌入式处理器、或者能够处理指令的任何其他类型的逻辑。

处理器1501(其可以是低功率多核处理器套接口，诸如超低电压处理器)可以充当用于与所述系统的各种部件通信的主处理单元和中央集线器。这种处理器可以实施为片上系统(SoC)。处理器1501被配置成执行用于执行本文所讨论的操作和步骤的指令。系统1500还可以包括与可选的图形子系统1504通信的图形接口，图形子系统1504可以包括显示控制器、图形处理器和/或显示装置。

处理器1501可以与存储器1503通信，存储器1503在一个实施方式中可以经由多个存储器装置实施以提供给定量的系统存储。存储器1503可以包括一个或多个易失性存储(或存储器)装置，诸如，随机存取存储器(RAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、静态RAM(SRAM)或者其他类型的存储装置。存储器1503可以存储包括由处理器1501或任何其他装置执行的指令序列的信息。例如，各种操作系统、装置驱动程序、固件(例如，输入输出基本系统或BIOS)和/或应用的可执行代码和/或数据可以加载到存储器1503中并由处理器1501执行。操作系统可以是任何类型的操作系统，例如，机器人操作系统(ROS)、来自公司的操作系统、来自苹果公司的Mac来自公司的LINUX、UNIX，或者其他实时或嵌入式操作系统。

系统1500还可以包括IO装置，诸如装置1505至1508，包括网络接口装置1505、可选的输入装置1506，以及其他可选的IO装置1507。网络接口装置1505可以包括无线收发器和/或网络接口卡(NIC)。所述无线收发器可以是WiFi收发器、红外收发器、蓝牙收发器、WiMax收发器、无线蜂窝电话收发器、卫星收发器(例如，全球定位系统(GPS)收发器)或其他射频(RF)收发器或者它们的组合。NIC可以是以太网卡。

输入装置1506可以包括鼠标、触摸板、触敏屏幕(其可以与显示装置1504集成在一起)、指针装置(诸如，指示笔)和/或键盘(例如，物理键盘或作为触敏屏幕的一部分显示的虚拟键盘)。例如，输入装置1506可以包括联接到触摸屏的触摸屏控制器。触摸屏和触摸屏控制器例如可以使用多种触敏技术(包括但不限于电容、电阻、红外和表面声波技术)中的任一种，以及其他接近传感器阵列或用于确定与触摸屏接触的一个或多个点的其他元件来检测其接触和移动或间断。

IO装置1507可以包括音频装置。音频装置可以包括扬声器和/或麦克风，以促进支持语音的功能，诸如语音识别、语音复制、数字记录和/或电话功能。其他IO装置1507还可以包括通用串行总线(USB)端口、并行端口、串行端口、打印机、网络接口、总线桥(例如，PCI-PCI桥)、传感器(例如，诸如加速度计的运动传感器，陀螺仪、磁强计、光传感器、罗盘、接近传感器等)或者它们的组合。装置1507还可以包括成像处理子系统(例如，摄像机)，所述成像处理子系统可以包括用于促进摄像机功能(诸如，记录照片和视频片段)的光学传感器，诸如电荷耦合装置(CCD)或互补金属氧化物半导体(CMOS)光学传感器。某些传感器可以经由传感器集线器(未示出)联接到互连件1510，而诸如键盘或热传感器的其它装置可以根据系统1500的具体配置或设计由嵌入式控制器(未示出)控制。

为了提供诸如数据、应用、一个或多个操作系统等信息的永久性存储，大容量存储装置(未示出)也可以联接到处理器1501。在各种实施方式中，为了实现更薄且更轻的系统设计并且改进系统响应性，这种大容量存储装置可以经由固态装置(SSD)来实施。然而，在其他实施方式中，大容量存储装置可以主要使用硬盘驱动器(HDD)来实施，其中较小量的SSD存储装置充当SSD高速缓存以在断电事件期间实现上下文状态以及其他此类信息的非易失性存储，从而使得在系统活动重新启动时能够实现快速通电。另外，闪存装置可以例如经由串行外围接口(SPI)联接到处理器1501。这种闪存装置可以提供系统软件的非易失性存储，所述系统软件包括所述系统的BIOS以及其他固件。

存储装置1508可以包括计算机可访问的存储介质1509(也被称为机器可读存储介质或计算机可读介质)，其上存储有体现本文所述的任何一种或多种方法或功能的一个或多个指令集或软件(例如，模块、单元和/或逻辑1528)。处理模块/单元/逻辑1528可以表示上述部件中的任一个，例如诸如规划模块304和/或控制模块305。处理模块/单元/逻辑1528还可以在其由数据处理系统1500、存储器1503和处理器1501执行期间完全地或至少部分地驻留在存储器1503内和/或处理器1501内，数据处理系统1500、存储器1503和处理器1501也构成机器可访问的存储介质。处理模块/单元/逻辑1528还可以通过网络经由网络接口装置1505进行传输或接收。

计算机可读存储介质1509也可以用来永久性地存储以上描述的一些软件功能。虽然计算机可读存储介质1509在示例性实施方式中被示为单个介质，但是术语“计算机可读存储介质”应当被认为包括存储所述一个或多个指令集的单个介质或多个介质(例如，集中式或分布式数据库和/或相关联的高速缓存和服务器)。术语“计算机可读存储介质”还应当被认为包括能够存储或编码指令集的任何介质，所述指令集用于由机器执行并且使得所述机器执行本发明的任何一种或多种方法。因此，术语“计算机可读存储介质”应当被认为包括但不限于固态存储器以及光学介质和磁性介质，或者任何其他非暂时性机器可读介质。

本文所述的处理模块/单元/逻辑1528、部件以及其他特征可以实施为分立硬件部件或集成在硬件部件(诸如，ASIC、FPGA、DSP或类似装置)的功能中。此外，处理模块/单元/逻辑1528可以实施为硬件装置内的固件或功能电路。此外，处理模块/单元/逻辑1528可以以硬件装置和软件部件的任何组合来实施。

应注意，虽然系统1500被示出为具有数据处理系统的各种部件，但是并不旨在表示使部件互连的任何特定架构或方式；因为此类细节和本发明的实施方式没有密切关系。还应当认识到，具有更少部件或可能具有更多部件的网络计算机、手持计算机、移动电话、服务器和/或其他数据处理系统也可以与本发明的实施方式一起使用。

前述详细描述中的一些部分已经根据在计算机存储器内对数据位的运算的算法和符号表示而呈现。这些算法描述和表示是数据处理领域中的技术人员所使用的方式，以将他们的工作实质最有效地传达给本领域中的其他技术人员。本文中，算法通常被认为是导致所期望结果的自洽操作序列。这些操作是指需要对物理量进行物理操控的操作。

然而，应当牢记，所有这些和类似的术语均旨在与适当的物理量关联，并且仅仅是应用于这些量的方便标记。除非在以上讨论中以其他方式明确地指出，否则应当了解，在整个说明书中，利用术语(诸如所附权利要求书中所阐述的术语)进行的讨论是指计算机系统或类似电子计算装置的动作和处理，所述计算机系统或电子计算装置操控计算机系统的寄存器和存储器内的表示为物理(电子)量的数据，并将所述数据变换成计算机系统存储器或寄存器或者其他此类信息存储装置、传输或显示装置内类似地表示为物理量的其他数据。

本发明的实施方式还涉及用于执行本文中的操作的设备。这种计算机程序被存储在非暂时性计算机可读介质中。机器可读介质包括用于以机器(例如，计算机)可读的形式存储信息的任何机构。例如，机器可读(例如，计算机可读)介质包括机器(例如，计算机)可读存储介质(例如，只读存储器(“ROM”)、随机存取存储器(“RAM”)、磁盘存储介质、光存储介质、闪存存储器装置)。

前述附图中所描绘的过程或方法可以由处理逻辑来执行，所述处理逻辑包括硬件(例如，电路、专用逻辑等)、软件(例如，体现在非暂时性计算机可读介质上)或两者的组合。尽管所述过程或方法在上文是依据一些顺序操作来描述的，但是应当了解，所述操作中的一些可以按不同的顺序执行。此外，一些操作可以并行地执行而不是顺序地执行。

本发明的实施方式并未参考任何特定的编程语言进行描述。应认识到，可以使用多种编程语言来实施如本文描述的本发明的实施方式的教导。

在以上的说明书中，已经参考本发明的具体示例性实施方式对本发明的实施方式进行了描述。将显而易见的是，在不脱离所附权利要求书中阐述的本发明的更宽泛精神和范围的情况下，可以对本发明做出各种修改。因此，应当在说明性意义而不是限制性意义上来理解本说明书和附图。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗琦;朱帆;胡森;孔旗;于翔;朱振广;潘余昌;杨文利;杨光
技术所有人：百度时代网络技术（北京）有限公司;百度（美国）有限责任公司
我是此专利的发明人

上一篇：一种便于下料的中药粉碎研磨一体机的制作方法
上一篇：一种医疗药物生产用草药烘干装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、唐老师：1.高效节能装备 2.流动稳定性 3.汽车流场分析和淀粉糖工艺技术。
2、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
3、王老师：电子信息处理、先进检测方法和智能化仪表
4、周老师：1.智能电网 2.新能源利用 3.泛在电力物联网
5、赵老师：检测与控制技术、机器人技术、机电一体化技术
如您是高校老师，可以点此联系我们加入专家库。