一种自动驾驶模型的训练方法及装置与流程

文档序号：17590047发布日期：2019-05-03 21:42阅读：257来源：国知局

本发明涉及汽车技术领域，尤其涉及一种自动驾驶模型的训练方法及装置。

背景技术：

自动驾驶汽车是通过ecu(electroniccontrolunit，电子控制单元)等车载终端设备，对车辆中各个部分进行精准的控制与计算分析，从而实现车辆的全自动运行，达到车辆无人驾驶的目的。随着深度学习的迅速发展以及人工智能的深入研究，通过端到端的深度学习实现自动驾驶便是自动驾驶领域的一个主要研究方向。

现有的端到端自动驾驶的模型训练中，为训练模型所提供的训练数据通常是车辆按照预定线路行驶。但是，车辆在自动驾驶过程中，可能存在偏离预定路线的情况，而通过预定路线行驶时采集的数据所训练的端到端模型缺乏纠偏能力，在自动驾驶模式下无法实现及时纠正车辆的偏离，从而降低车辆的安全性。

技术实现要素：

本发明实施例提供一种自动驾驶模型的训练方法及装置，以目前端到端的自动驾驶模型缺乏纠偏能力，而导致车辆自动驾驶时安全性低的问题。

第一方面，本发明实施例提供了一种自动驾驶模型的训练方法，包括：

获取第一训练数据和第二训练数据；

使用所述第一训练数据和所述第二训练数据对端到端模型训练，以得到所述自动驾驶模型；

其中，所述第一训练数据包括车辆在预设路线行驶过程中采集的数据；所述第二训练数据包括所述车辆在偏离路线的纠偏路径行驶过程中采集的数据，所述偏离路线与所述预设路线不同，且所述纠偏路径为：在所述偏离路线中，所述车辆在纠偏后行驶的路线。

第二方面，本发明实施例还提供了一种自动驾驶模型的训练装置，包括：

第一获取模块，用于获取第一训练数据和第二训练数据；

模型训练模块，用于使用所述第一训练数据和所述第二训练数据对端到端模型训练，以得到所述自动驾驶模型；

第三方面，本发明实施例还提供了一种电子设备，其特征在于，包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序，所述计算机程序被所述处理器执行时实现上述自动驾驶模型的训练方法的步骤。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现上述自动驾驶模型的训练方法的步骤。

本发明实施例，通过获取第一训练数据和第二训练数据；使用第一训练数据和第二训练数据对端到端模型训练，以得到自动驾驶模型；其中，第一训练数据包括车辆在预设路线行驶过程中采集的数据；第二训练数据包括车辆在偏离路线的纠偏路径行驶过程中采集的数据，偏离路线与预设路线不同，且纠偏路径为：在偏离路线中，车辆在纠偏后行驶的路线。这样，通过将车辆正常行驶过程中采集的第一训练数据，以及纠偏后行驶过程中采集的数据，即在纠偏路线行驶过程中采集的第二训练数据作为端到端模型的训练样本，从而可以使训练得到的自动驾驶模型具备纠偏能力，提升车辆自动驾驶时的安全性。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的自动驾驶模型的训练方法的流程示意图；

图2是本发明实施例提供的车辆行驶过程中的路线示意图；

图3是本发明实施例提供的自动驾驶模型的训练装置的结构示意图之一；

图4是本发明实施例提供的自动驾驶模型的训练装置的结构示意图之二；

图5是本发明实施例提供的自动驾驶模型的训练装置的结构示意图之三；

图6是本发明实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，图1是本发明实施例提供的一种自动驾驶模型的训练方法的流程图，如图1所示，包括以下步骤：

步骤101、获取第一训练数据和第二训练数据；

步骤102、使用第一训练数据和第二训练数据对端到端模型训练，以得到自动驾驶模型；

其中，第一训练数据包括车辆在预设路线行驶过程中采集的数据；第二训练数据包括车辆在偏离路线的纠偏路径行驶过程中采集的数据，偏离路线与预设路线不同，且纠偏路径为：在偏离路线中，车辆在纠偏后行驶的路线。

这里，电子设备可以通过将车辆正常行驶过程中采集的第一训练数据，以及纠偏后行驶过程中采集的数据，即在纠偏路线行驶过程中采集的第二训练数据作为端到端模型的训练样本，从而可以使训练得到的自动驾驶模型具备纠偏能力，提升车辆自动驾驶时的安全性。

需要说明的是，上述电子设备可以包括车载终端或者除车载终端设备之外的其他设备，如远程服务器等。

本发明实施例中，在上述步骤101中，获取第一训练数据和第二训练数据，可以是：在电子设备为车载终端的情况下，车载终端在车辆行驶过程中采集到上述第一训练数据和上述第二训练数据；或者，在电子设备为远程服务器等其他设备的情况下，接收车载终端发送的包括第一训练数据和第二训练数据的数据集，该数据集由车载终端在车辆行驶过程中采集得到。

其中，上述第一训练数据为车辆在预设路线上行驶过程中，由车载终端采集的数据，即第一训练数据为正常行驶数据；而上述第二训练数据为车辆在偏离预设路线之后，在偏离路线中的纠偏路径上行驶过程中采集的数据，为纠正车辆的偏离行驶状态之后采集的数据，即第二训练数据为纠偏数据，该纠偏数据可以反映车辆在偏离预定路线之后至回复至预定路线行驶的纠偏行为。

另外，在车辆行驶过程中，车辆的驾驶状态在预设路线和偏离路线中均为人工驾驶状态，即数据采集的全程人工驾驶该车辆；或者，也可以是，在预设路线中车辆为自动驾驶，在车辆发生偏离后，车辆的驾驶状态由自动驾驶切换为人工驾驶，且车辆在人工驾驶中行驶的路线为上述纠偏路线，在此并不进行限定。

需要说明的是，上述车载终端采集数据，可以是通过其车头设置的摄像头采集图像，并通过采集的图像生成对应的行车速度、转向角以及制动力矩等数据。

当然，上述车辆可以是在封闭场景中行驶，实现对自动驾驶模型的训练样本(即上述第一训练数据和上述第二训练数据)的采集。该封闭场景例如可以通过有限场景、有限路线、有限范围来进行设定，例如一个封闭园区，其覆盖范围有限，其中端到端之间可以行驶的路线也是有限的，并且能够遇到的场景也是有限的。

本发明实施例中，上述偏离路线可以是车辆由偏离预设路线时刻起，至恢复至预设路线时刻行驶过程中所经过的路线，其可以是任意曲线，如偏离路线s型路线或者折线等，在此并不进行限定。

其中，上述纠偏可以理解为车辆在偏离预设路线行驶过程中，为纠正车辆的偏离行驶，测试人员对车辆的转向角进行调整，以使车辆由偏离预设路径行驶重新恢复至按照预设路径行驶的行为。

例如：车辆在沿预设直线路段行驶时，当车辆发生向左偏离时，驾驶人员为控制车辆重新恢复至按照预设直线路段行驶，控制车辆由向左偏转转变为向右偏转，则车辆发生纠偏，且车辆由转变为向右偏转后行驶的路径为上述纠偏路径。

在实际的数据采集过程中，车载终端还会采集到偏离路线中偏离路径的偏离数据，该偏离路径为在偏离路线中，车辆在纠偏前行驶的路线，即在该偏离路径中，车辆处于偏离预设路径而未进行纠偏的行驶状态。

例如：如图2中所示，偏离路线包括偏离路径(即虚线21)和纠偏路径(即虚线22)，偏离路径和纠偏路径为车辆偏离预设路径(即实线23)之后行驶的偏离路线中的路径，则车载终端在偏离路径可以采集到偏离数据，在纠偏路径可以采集到纠偏数据。

但是，在端到端模型训练过程中，如果将车载终端采集的偏离数据也作为训练样本，将影响到自动驾驶模型的准确性，从而导致自动驾驶模型在实际驾驶过程中无法作出正确的预测。

可选的，偏离路线还包括偏离路径，偏离路径为：在偏离路线中，车辆在纠偏前行驶的路线；

上述获取第一训练数据和第二训练数据之前，还包括：

获取车辆在偏离路线行驶过程中采集的数据集；

将数据集中的偏离数据过滤，以得到第二训练数据，其中，偏离数据为车辆在偏离路径上行驶过程中采集的数据。

这里，通过将车辆在偏离路线行驶过程中采集的数据集中的偏离数据过滤，从而可以避免偏离数据影响到自动驾驶模型的预测准确性，优化自动驾驶模型。

其中，上述偏离数据可以是由电子设备在数据集中确定，例如：在车辆在预设路线以及偏离路径中处于自动驾驶，而纠偏路径处于人工驾驶，即纠偏路径为车辆由自动驾驶切换为人工驾驶之后行驶的路径的情况下，电子设备可以根据采集的图像中的时间信息，获取车辆由自动驾驶切换为人工驾驶的时间点，并将上述数据集中在获取的时间点之后采集的数据确定为偏离数据，等等。

或者，上述偏离数据可以通过人工标注的方式进行获取，即可选的，上述将数据集中的偏离数据过滤之前，还包括：获取标注人员基于车辆行驶过程中采集的图像在数据集中标注的数据；将数据集中的标注数据确定为偏离数据，通过人工标注偏离数据的方式，可以实现准确标注除车辆在任何场景下行驶过程中所采集的偏离数据，尤其是全程为人工驾驶的情况。

其中，车载终端采集图像，可以是通过设置于其车头且用于拍摄车头正前方的前向摄像头采集。而由于通过前向摄像头采集的图像难以确定车辆是否发生偏离，标注人员通过采集的图像难以实现对偏离数据的标注。

可选的，上述图像为设置于车辆的车头的相对两侧摄像头采集得到。其中，通过设置于车头相对两侧的摄像头采集的图像，在车辆偏离时图像变化较为明显，从而使标注人员可以准确标注偏离数据，提升模型预测准确性。

本发明实施例中，上述步骤102中，在获取到第一训练数据和第二训练数据之后，电子设备还可以将第一训练数据和第二训练数据作为训练样本，输入至端到端模型，通过该训练样本对端到端模型训练，从而得到自动驾驶模型。

其中，上述对端到端模型训练的过程大致为：从输入端(输入上述训练样本)到输出端会得到一个预测结果，与真实结果相比较会得到一个误差，这个误差会在模型中的每一层传递(反向传播)，每一层的表示都会根据这个误差来做调整，直到模型收敛或达到预期的效果才结束，得到最终的自动驾驶模型。

需要说明的是，本发明实施例中介绍的多种可选的实施方式，彼此可以相互结合实现，也可以单独实现，对此本发明实施例不作限定。

参见图3，图3是本发明实施例提供的自动驾驶模型的训练装置的结构图，如图3所示，自动驾驶模型的训练装置300包括：

第一获取模块301，用于获取第一训练数据和第二训练数据；

模型训练模块302，用于使用所述第一训练数据和所述第二训练数据对端到端模型训练，以得到所述自动驾驶模型；

可选的，所述偏离路线还包括偏离路径，所述偏离路径为：在所述偏离路线中，所述车辆在纠偏前行驶的路线；

如图4所示，所述自动驾驶模型的训练装置300，还包括：

第二获取模块303，用于获取所述车辆在所述偏离路线行驶过程中采集的数据集；

数据过滤模块，用于将所述数据集中的偏离数据过滤，以得到所述第二训练数据，其中，所述偏离数据为所述车辆在所述偏离路径上行驶过程中采集的数据。

可选的，如图5所示，所述自动驾驶模型的训练装置300，还包括：

第三获取模块304，用于获取标注人员基于所述车辆行驶过程中采集的图像在所述数据集中标注的数据；

确定模块305，用于将所述数据集中的标注数据确定为所述偏离数据。

可选的，所述图像为设置于所述车辆的车头的相对两侧摄像头采集得到。

本发明实施例提供的自动驾驶模型的训练装置300能够实现图1中方法实施例中电子设备实现的各个过程，为避免重复，这里不再赘述。

图6为实现本发明各个实施例的一种电子设备的硬件结构示意图。

该电子设备600包括但不限于：射频单元601、网络模块602、音频输出单元603、输入单元604、传感器605、显示单元606、用户输入单元607、接口单元608、存储器609、处理器610、以及电源611等部件。本领域技术人员可以理解，图6中示出的电子设备结构并不构成对电子设备的限定，电子设备可以包括比图示更多或更少的部件，或者组合某些部件，或者不同的部件布置。

其中，处理器610，用于：

获取第一训练数据和第二训练数据；

使用所述第一训练数据和所述第二训练数据对端到端模型训练，以得到所述自动驾驶模型；

可选的，所述偏离路线还包括偏离路径，所述偏离路径为：在所述偏离路线中，所述车辆在纠偏前行驶的路线；

处理器610，还用于：

获取所述车辆在所述偏离路线行驶过程中采集的数据集；

将所述数据集中的偏离数据过滤，以得到所述第二训练数据，其中，所述偏离数据为所述车辆在所述偏离路径上行驶过程中采集的数据。

可选的，处理器610，还用于：

获取标注人员基于所述车辆行驶过程中采集的图像在所述数据集中标注的数据；

将所述数据集中的标注数据确定为所述偏离数据。

可选的，所述图像为设置于所述车辆的车头的相对两侧摄像头采集得到。

本发明实施例提供的电子设备400能够实现图1中方法实施例中电子设备实现的各个过程，为避免重复，这里不再赘述。

应理解的是，本发明实施例中，射频单元601可用于收发信息或通话过程中，信号的接收和发送，具体的，将来自基站的下行数据接收后，给处理器610处理；另外，将上行的数据发送给基站。通常，射频单元601包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器、双工器等。此外，射频单元601还可以通过无线通信系统与网络和其他设备通信。

电子设备通过网络模块602为用户提供了无线的宽带互联网访问，如帮助用户收发电子邮件、浏览网页和访问流式媒体等。

音频输出单元603可以将射频单元601或网络模块602接收的或者在存储器609中存储的音频数据转换成音频信号并且输出为声音。而且，音频输出单元603还可以提供与电子设备600执行的特定功能相关的音频输出(例如，呼叫信号接收声音、消息接收声音等等)。音频输出单元603包括扬声器、蜂鸣器以及受话器等。

输入单元604用于接收音频或视频信号。输入单元604可以包括图形处理器(graphicsprocessingunit，gpu)6041和麦克风6042，图形处理器6041对在视频捕获模式或图像捕获模式中由图像捕获装置(如摄像头)获得的静态图片或视频的图像数据进行处理。处理后的图像帧可以显示在显示单元606上。经图形处理器6041处理后的图像帧可以存储在存储器609(或其它存储介质)中或者经由射频单元601或网络模块602进行发送。麦克风6042可以接收声音，并且能够将这样的声音处理为音频数据。处理后的音频数据可以在电话通话模式的情况下转换为可经由射频单元601发送到移动通信基站的格式输出。

电子设备600还包括至少一种传感器605，比如光传感器、运动传感器以及其他传感器。具体地，光传感器包括环境光传感器及接近传感器，其中，环境光传感器可根据环境光线的明暗来调节显示面板6061的亮度，接近传感器可在电子设备600移动到耳边时，关闭显示面板6061和/或背光。作为运动传感器的一种，加速计传感器可检测各个方向上(一般为三轴)加速度的大小，静止时可检测出重力的大小及方向，可用于识别电子设备姿态(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等；传感器605还可以包括指纹传感器、压力传感器、虹膜传感器、分子传感器、陀螺仪、气压计、湿度计、温度计、红外线传感器等，在此不再赘述。

显示单元606用于显示由用户输入的信息或提供给用户的信息。显示单元606可包括显示面板6061，可以采用液晶显示器(liquidcrystaldisplay，lcd)、有机发光二极管(organiclight-emittingdiode,oled)等形式来配置显示面板6061。

用户输入单元607可用于接收输入的数字或字符信息，以及产生与电子设备的用户设置以及功能控制有关的键信号输入。具体地，用户输入单元607包括触控面板6071以及其他输入设备6072。触控面板6071，也称为触摸屏，可收集用户在其上或附近的触摸操作(比如用户使用手指、触笔等任何适合的物体或附件在触控面板6071上或在触控面板6071附近的操作)。触控面板6071可包括触摸检测装置和触摸控制器两个部分。其中，触摸检测装置检测用户的触摸方位，并检测触摸操作带来的信号，将信号传送给触摸控制器；触摸控制器从触摸检测装置上接收触摸信息，并将它转换成触点坐标，再送给处理器610，接收处理器610发来的命令并加以执行。此外，可以采用电阻式、电容式、红外线以及表面声波等多种类型实现触控面板6071。除了触控面板6071，用户输入单元607还可以包括其他输入设备6072。具体地，其他输入设备6072可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆，在此不再赘述。

进一步的，触控面板6071可覆盖在显示面板6061上，当触控面板6071检测到在其上或附近的触摸操作后，传送给处理器610以确定触摸事件的类型，随后处理器610根据触摸事件的类型在显示面板6061上提供相应的视觉输出。虽然在图6中，触控面板6071与显示面板6061是作为两个独立的部件来实现电子设备的输入和输出功能，但是在某些实施例中，可以将触控面板6071与显示面板6061集成而实现电子设备的输入和输出功能，具体此处不做限定。

接口单元608为外部装置与电子设备600连接的接口。例如，外部装置可以包括有线或无线头戴式耳机端口、外部电源(或电池充电器)端口、有线或无线数据端口、存储卡端口、用于连接具有识别模块的装置的端口、音频输入/输出(i/o)端口、视频i/o端口、耳机端口等等。接口单元608可以用于接收来自外部装置的输入(例如，数据信息、电力等等)并且将接收到的输入传输到电子设备600内的一个或多个元件或者可以用于在电子设备600和外部装置之间传输数据。

存储器609可用于存储软件程序以及各种数据。存储器609可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、电话本等)等。此外，存储器609可以包括高速随机存取存储器，还可以包括非易失性存储器，例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

处理器610是电子设备的控制中心，利用各种接口和线路连接整个电子设备的各个部分，通过运行或执行存储在存储器609内的软件程序和/或模块，以及调用存储在存储器609内的数据，执行电子设备的各种功能和处理数据，从而对电子设备进行整体监控。处理器610可包括一个或多个处理单元；优选的，处理器610可集成应用处理器和调制解调处理器，其中，应用处理器主要处理操作系统、用户界面和应用程序等，调制解调处理器主要处理无线通信。可以理解的是，上述调制解调处理器也可以不集成到处理器610中。

电子设备600还可以包括给各个部件供电的电源611(比如电池)，优选的，电源611可以通过电源管理系统与处理器610逻辑相连，从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。

另外，电子设备600包括一些未示出的功能模块，在此不再赘述。

优选的，本发明实施例还提供一种电子设备，包括处理器610，存储器609，存储在存储器609上并可在所述处理器610上运行的计算机程序，该计算机程序被处理器610执行时实现上述自动驾驶模型的训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。

本发明实施例还提供一种计算机可读存储介质，计算机可读存储介质上存储有计算机程序，该计算机程序被处理器执行时实现上述自动驾驶模型的训练方法实施例的各个过程，且能达到相同的技术效果，为避免重复，这里不再赘述。其中，所述的计算机可读存储介质，如只读存储器(read-onlymemory，简称rom)、随机存取存储器(randomaccessmemory，简称ram)、磁碟或者光盘等。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到，为描述的方便和简洁，上述描述的系统、装置和单元的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本发明实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：闫泳杉
技术所有人：百度在线网络技术（北京）有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。