基于联邦学习的自动驾驶训练方法、设备及介质与流程

文档序号:23223281发布日期:2020-12-08 15:06阅读:498来源:国知局
基于联邦学习的自动驾驶训练方法、设备及介质与流程

本申请涉及互联网科技的人工智能技术领域,尤其涉及一种基于联邦学习的自动驾驶训练方法、设备及介质。



背景技术:

随着金融科技,尤其是互联网科技的不断发展,越来越多的技术(如分布式、区块链blockchain、人工智能等)应用在互联网科技领域,但互联网科技领域业也对技术提出了更高的要求,如互联网科技领域对基于联邦学习的自动驾驶训练也有更高的要求。

近来,自动驾驶技术发展非常迅速,自动驾驶的应用具有降低驾驶工作强度,缓解驾驶疲劳,提升驾驶安全,降低事故率等优点,其中,环境感知是自动驾驶的核心技术之一,自动驾驶通过环境感知的结果进行分析和决策,作为路径规划的依据,从而实现自动驾驶,环境感知包括车道检测、行人检测、交通标志识别、障碍物检测等。

目前,环境感知是通过基于深度学习训练得到的识别目标的模型实现的,但是现有技术中,往往是基于离线数据,通过深度学习即通过离线的方式,训练得到识别目标的模型,进而再进行各个环境场景的实际应用,而离线训练得到的模型往往会存在局部性,即离线训练得到的模型与实际环境不匹配的问题,且离线训练数据往往是庞大的,导致训练过程中数据传输负载过多,导致模型训练效率低,也即,现有技术中存在难以快速准确获取有效自动驾驶模型的技术问题。



技术实现要素:

本申请的主要目的在于提供一种基于联邦学习的自动驾驶训练方法、设备和介质,旨在解决现有技术中难以快速准确获取有效自动驾驶模型的技术问题。

为实现上述目的,本申请提供一种基于联邦学习的自动驾驶训练方法,应用于云端服务器,所述基于联邦学习的自动驾驶训练方法包括:

在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆;

获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;

基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤,包括:

在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型;

将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型的步骤,包括:

在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取预设模型子集合;

根据所述训练指令中携带的时间信息以及车辆类型信息,从预设模型子集合中选取所述预设待训练模型。

可选地,所述将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能的步骤,包括:

对所述第二目标模型参数进行加密处理,得到加密模型参数;

将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤,还包括:

在检测到训练指令时,获取预设待训练模型;

与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤之前,所述方法包括:

获取预设基础模型;

基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件;

将达到预设训练完成条件后的所述预设基础模型设置为预设待训练模型。

可选地,所述具有预设识别标签的离线训练数据包括具有预设识别标签的离线激光雷达扫描数据,离线摄像数据以及离线毫米波雷达数据。

本申请还提供一种基于联邦学习的自动驾驶训练方法,应用于车辆,所述基于联邦学习的自动驾驶训练方法包括:

接收云端服务器发送的预设待训练模型;

基于实时本地数据集对所述预设待训练模型进行训练,得到第一目标模型参数;

将所述第一目标模型参数加密发送给所述云端服务器,以供所述云端服务器执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

接收云端服务器加密发送的所述第二目标模型参数,基于所述第二目标模型参数得到目标模型,以实现自动驾驶功能。

本申请还提供一种基于联邦学习的自动驾驶训练装置,应用于云端服务器,所述基于联邦学习的自动驾驶训练装置包括:

第一获取模块,用于在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆;

第二获取模块,用于获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;

第一训练模块,用于基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

发送模块,用于将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述第一获取模块包括:

选取单元,用于在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型;

发送单元,用于将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述选取单元包括:

第一选取子单元,用于在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取预设模型子集合;

第二选取子单元,用于根据所述训练指令中携带的时间信息以及车辆类型信息,从预设模型子集合中选取所述预设待训练模型。

可选地,所述发送模块包括:

加密单元,用于对所述第二目标模型参数进行加密处理,得到加密模型参数;

发送单元,用于将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述第一获取模块还包括:

检测单元,用于在检测到训练指令时,获取预设待训练模型;

分发单元,用于与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述基于联邦学习的自动驾驶训练装置还包括:

第三获取模块,用于获取预设基础模型;

第二训练模块,用于基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件;

设置模块,用于将达到预设训练完成条件后的所述预设基础模型设置为预设待训练模型。

可选地,所述具有预设识别标签的离线训练数据包括具有预设识别标签的离线激光雷达扫描数据,离线摄像数据以及离线毫米波雷达数据。

本申请还提供一种基于联邦学习的自动驾驶训练装置,应用于车辆,所述基于联邦学习的自动驾驶训练装置包括:

第一接收模块,用于接收云端服务器发送的预设待训练模型;

第四获取模块,用于基于实时本地数据集对所述预设待训练模型进行训练,得到第一目标模型参数;

第五获取模块,用于将所述第一目标模型参数加密发送给所述云端服务器,以供所述云端服务器执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

第二接收模块,用于接收云端服务器加密发送的所述第二目标模型参数,基于所述第二目标模型参数得到目标模型,以实现自动驾驶功能。

本申请还提供一种基于联邦学习的自动驾驶训练设备,所述基于联邦学习的自动驾驶训练设备为实体设备,所述基于联邦学习的自动驾驶训练设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于联邦学习的自动驾驶训练方法的程序,所述基于联邦学习的自动驾驶训练方法的程序被处理器执行时可实现如上述的基于联邦学习的自动驾驶训练方法的步骤。

本申请还提供一种介质,所述介质上存储有实现上述基于联邦学习的自动驾驶训练方法的程序,所述基于联邦学习的自动驾驶训练方法的程序被处理器执行时实现如上述的基于联邦学习的自动驾驶训练方法的步骤。

本申请提供一种基于联邦学习的自动驾驶训练方法、设备及介质,与目前由局部的离线数据,训练得到识别目标的模型后,再将模型投入到不同实际环境中使用相比,本申请通过在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。在本申请中,获取预设待训练模型后,在实际环境场景下基于各目标车辆在线实时训练联邦模型,避免联邦模型与实际环境不匹配或者联邦模型具有局部局限性的问题,且由于在本申请中,只进行模型参数的交互,因而,避免联邦模型训练过程中数据传输负载过多,导致模型训练效率低的问题,以实现快速准确获取有效自动驾驶模型。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本申请基于联邦学习的自动驾驶训练方法第一实施例的流程示意图;

图2为本申请基于联邦学习的自动驾驶训练方法第一实施例中在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤细化流程示意图;

图3为本申请实施例方案涉及的硬件运行环境的设备结构示意图。

本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供一种基于联邦学习的自动驾驶训练方法,在本申请基于联邦学习的自动驾驶训练方法的第一实施例中,参照图1,应用于云端服务器,所述基于联邦学习的自动驾驶训练方法包括:

步骤s10,在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆;

步骤s20,获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;

步骤s30,基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

步骤s40,将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

具体步骤如下:

步骤s10,在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆;

在本实施例中,基于联邦学习的自动驾驶训练方法应用于云端服务器,该云端服务器与各个参与方通过基站进行通信连接,需要说明的是,在本实施例中,各个参与方是目标车辆,其中,目标车辆以及云端服务器共同构成基于联邦学习的自动驾驶训练系统,该基于联邦学习的自动驾驶训练系统属于基于联邦学习的自动驾驶训练设备,需要说明的是,在本实施例中,该基于联邦学习的自动驾驶训练系统可以划分为不同地区的联邦学习的自动驾驶训练子系统,具体地,例如,a地区的联邦学习的自动驾驶训练子系统以及b地区的联邦学习的自动驾驶训练子系统,其中,可以是由用户通过基于联邦学习的自动驾驶训练系统(或者子系统)触发训练指令,在基于联邦学习的自动驾驶训练系统触发训练指令后,云端服务器会检测到该训练指令,云端服务器在检测到训练指令后,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,需要说明的是,在云端服务器是存在多个模型的,因而,需要从多个模型中选取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,其中,从多个模型中选取预设待训练模型的方式可以是从训练指令中提取目标模型属性信息,以从多个模型中选取预设待训练模型,或者基于训练指令关联的模型信息,以从多个模型中选取预设待训练模型。

在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型在线实时发送给预设行驶范围内的各目标车辆,其中,预设行驶范围可以是由预设待训练模型确定的,即是预设待训练模型确定,则预设行驶范围确定,将所述预设待训练模型发送给预设行驶范围内的各目标车辆可以指的是:将所述预设待训练模型发送给预设行驶范围内的所有车辆,或者将所述预设待训练模型发送给预设行驶范围内的某一类型车辆,例如,将所述预设待训练模型发送给预设行驶范围内的载货大卡车类型车辆,将所述预设待训练模型发送给预设行驶范围内的小汽车类型车辆或者将所述预设待训练模型发送给预设行驶范围内的客运汽车类型车辆。在本实施例中,需要说明的是,将所述预设待训练模型发送给预设行驶范围内的某一类型车辆的目的在于:提升训练的准确性,这是因为,车辆不同,车辆摄像头或者雷达的环境感知不同,因而,根据不同车辆类型单独进行训练,数据针对性强,因而,可以提升训练准确率。

需要说明的是,在本实施例中,将所述预设待训练模型发送给预设行驶范围内的某一类型车辆时,需要在车辆进入预设行驶范围内时即进行车辆类别的识别,具体地,可以根据道路系统的路边单元对车辆的类型进行识别,在识别后,云服务器端接收识别的车辆类型,以最终确定目标车辆。

参照图2,所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤,包括:

步骤s11,在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型;

在本实施例中,在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型,例如,预设模型集合中共有100个模型,该100个模型对应不同城市,则根据训练指令中携带的城市信息,从预设模型集合中选取所述预设待训练模型。

步骤s12,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

在得到预设待训练模型后,在线实时将所述预设待训练模型发送给预设行驶范围内的各目标车辆,也即,只要车辆进入预设行驶范围内,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,以供目标车辆进行本地训练。

所述在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型的步骤,包括:

步骤s111,在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取预设模型子集合;

步骤s112,根据所述训练指令中携带的时间信息以及车辆类型信息,从预设模型子集合中选取所述预设待训练模型。

在本实施例中,在从预设模型集合中选取预设模型子集合后,根据所述训练指令中携带的时间信息以及车辆类型信息,从预设模型子集合中选取所述预设待训练模型,也即,在本实施例中,预设待训练模型的选取与车辆类型和时间同时关联,这是因为,在不同时间段,日照不同,日照不同,则光线变化规律不同,车辆上车载摄像头的摄取会发生变化,因而,根据车辆类型和时间同时选取预设待训练模型,具体地,假设预设模型子集合中共有100个模型,且夏季以及客运汽车对应有10个模型,则从该10个模型中选取预设待训练模型,在本实施例中,根据所述训练指令中携带的时间信息以及车辆类型信息,针对性从预设模型子集合中选取所述预设待训练模型,因而,提升模型训练的速率以及准确率,需要说明的是,预设待训练模型是春季的预设待训练模型,而当前是秋季,那对应春季模型在应用时就不能更新到秋季的环境中。

所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤之前,所述方法包括:

步骤s01,获取预设基础模型;

在本实施例中,需要说明的是,虽然通过离线训练产生的模型,会有一定的偏失的可能性,即离线数据的样本与采集的地点、环境等相关性比较大,往往会有局部样本的情况,比如离线训练的数据采集局限于某一个区域,局限于某一特定的环境(光照、天气等),从而影响训练结果,但是为了确保初始训练阶段的安全性,在本实施例中,将离线数据经由离线训练后,得到的目标模型作为在初始训练阶段的预设待训练模型,即预设待训练模型是通过预设基础模型经由离线训练得到的。

步骤s02,基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件;

基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件,其中,所述具有预设识别标签的离线训练数据包括具有预设识别标签的离线激光雷达扫描数据,离线摄像数据以及离线毫米波雷达数据等。基于具有预设识别标签的离线训练数据,具体地,基于不同区域(或者不同时间,不同车辆类型的)的具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以得到不同类型的预设待训练模型,具体地,基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代联邦训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件,该预设训练完成条件包括训练次数达到第二预设次数或者是第一预设损失函数收敛。

步骤s03,将达到预设训练完成条件后的所述预设基础模型设置为预设待训练模型。

将达到预设训练完成条件后的所述预设基础模型设置为预设待训练模型,以供,其中,预设待训练模型为多个。

步骤s20,获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;

在本实施例中,在确定目标车辆后,获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数,具体地,获取所述各目标车辆基于各自具有相应标签的实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数,其中,各目标车辆可以经过第二预设次数的训练后,得到对应第一目标模型参数。

步骤s30,基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数,具体地,各个目标车辆将第一目标模型参数发送给云服务器端,云服务器端接收各个第一目标模型参数后,对各个第一目标模型参数进行取平均值等聚合手段,得到第一聚合参数,在得到第一聚合参数后,将第一聚合参数发送给各个目标车辆,以供各个目标车辆进行下轮的本地迭代训练,得到对应下一轮的目标模型参数,在得到对应下一轮的目标模型参数后,各个目标车辆将下一轮的目标模型参数发送给云服务器端,以供云服务器端进行聚合,基于此,不断进行迭代训练,直至系统的第二预设损失函数收敛,将收敛的模型的参数设置为第二目标模型参数。

步骤s40,将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

在本实施例中,在得到第二目标模型参数后,将所述第二目标模型参数发送给所述目标车辆,目标车辆基于第二目标模型参数,完善本地的目标模型,即各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,在得到目标模型后,实现各目标车辆的自动驾驶功能。

本申请提供一种基于联邦学习的自动驾驶训练方法、设备及介质,与目前由参与方将不同的样本数据转化为一个嵌入向量,与服务器进行交互联邦建模相比,本申请通过获取样本数据,所述样本数据包括用户数据和物品数据;在所述第一参与方本地,确定所述用户数据的用户嵌入向量,并接收服务器发送的物品嵌入向量,所述物品嵌入向量为在所述服务器本地基于所述物品数据生成的;基于所述用户嵌入向量以及所述物品嵌入向量,通过联邦学习训练得到所述第一参与方的预设预测模型。在本申请中,获取样本数据后,在所述第一参与方本地,确定所述用户数据的用户嵌入向量,接收在服务器端基于物品数据确定的物品嵌入向量,进而基于所述用户嵌入向量以及所述物品嵌入向量,通过联邦学习训练得到所述第一参与方的预设预测模型,也即本申请中将不同的样本数据转化为不同的嵌入向量,具体将致使产生大量计算量的物品数据置于服务器端生成物品嵌入向量,且只与服务器端进行物品嵌入向量的交互联邦建模而不进行用户嵌入向量的交互,以避免在参与方本地产生大量的计算开销和通信开销,进而,提升预设预测模型的获取效率。

本申请实施例提供一种基于联邦学习的自动驾驶训练方法,在本申请基于联邦学习的自动驾驶训练方法的另一实施例中所述将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能的步骤,包括:

步骤a1,对所述第二目标模型参数进行加密处理,得到加密模型参数;

在本实施例中,为确保安全性,目标车辆与云端服务器进行交互时,都是通过加密交互的,如对第一目标模型参数进行加密处理,发送给云端服务器,云端服务器对所述第二目标模型参数进行加密处理,得到加密模型参数。

步骤a2,将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能,在本实施例中,可以通过区块链将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

在本实施例中,通过对所述第二目标模型参数进行加密处理,得到加密模型参数;将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。在本实施例中,实现安全得到目标模型。

本申请实施例提供一种基于联邦学习的自动驾驶训练方法,在本申请基于联邦学习的自动驾驶训练方法的另一实施例中,所述在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆的步骤,还包括:

步骤b1,在检测到训练指令时,获取预设待训练模型;

步骤b2,与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

在本实施例中,在检测到训练指令时,云端服务器获取预设待训练模型,云端服务器与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,也即,在本实施例中,为了减少通信时长,以供各个目标车辆快速获取得到预设待训练模型,以最终实现快速得到目标模型,各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆,具体地,使得各个目标车辆在最短通信距离内,获得预设待训练模型。

在本实施例中,通过在检测到训练指令时,获取预设待训练模型;与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。在本实施例中,各目标车辆基于最近距离得到预设待训练模型,提升模型训练效率。

本申请实施例提供一种基于联邦学习的自动驾驶训练方法,在本申请基于联邦学习的自动驾驶训练方法的另一实施例中,应用于车辆,所述基于联邦学习的自动驾驶训练方法包括:

接收云端服务器发送的预设待训练模型;

基于实时本地数据集对所述预设待训练模型进行训练,得到第一目标模型参数;

将所述第一目标模型参数加密发送给所述云端服务器,以供所述云端服务器执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

接收云端服务器加密发送的所述第二目标模型参数,基于所述第二目标模型参数得到目标模型,以实现自动驾驶功能。

在本实施例中,对于车辆而言,接收云端服务器发送的预设待训练模型;基于实时本地数据集对所述预设待训练模型进行训练,得到第一目标模型参数;将所述第一目标模型参数加密发送给所述云端服务器,以供所述云端服务器执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;接收云端服务器加密发送的所述第二目标模型参数,基于所述第二目标模型参数得到目标模型,以实现自动驾驶功能。在本实施例中,目标车辆通过联邦在线实时训练目标模型,以实现自动驾驶。

参照图3,图3是本申请实施例方案涉及的硬件运行环境的设备结构示意图。

如图3所示,该基于联邦学习的自动驾驶训练设备可以包括:处理器1001,例如cpu,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速ram存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。

可选地,该基于联邦学习的自动驾驶训练设备还可以包括矩形用户接口、网络接口、摄像头、rf(radiofrequency,射频)电路,传感器、音频电路、wifi模块等等。矩形用户接口可以包括显示屏(display)、输入子模块比如键盘(keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。

本领域技术人员可以理解,图3中示出的基于联邦学习的自动驾驶训练设备结构并不构成对基于联邦学习的自动驾驶训练设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

如图3所示,作为一种计算机介质的存储器1005中可以包括操作系统、网络通信模块以及基于联邦学习的自动驾驶训练程序。操作系统是管理和控制基于联邦学习的自动驾驶训练设备硬件和软件资源的程序,支持基于联邦学习的自动驾驶训练程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于联邦学习的自动驾驶训练系统中其它硬件和软件之间通信。

在图3所示的基于联邦学习的自动驾驶训练设备中,处理器1001用于执行存储器1005中存储的基于联邦学习的自动驾驶训练程序,实现上述任一项所述的基于联邦学习的自动驾驶训练方法的步骤。

本申请基于联邦学习的自动驾驶训练设备具体实施方式与上述基于联邦学习的自动驾驶训练方法各实施例基本相同,在此不再赘述。

本申请还提供一种基于联邦学习的自动驾驶训练装置,本申请提供一种基于联邦学习的自动驾驶训练装置,应用于云端服务器,所述基于联邦学习的自动驾驶训练装置包括:

第一获取模块,用于在检测到训练指令时,获取预设待训练模型,将所述预设待训练模型发送给预设行驶范围内的各目标车辆;

第二获取模块,用于获取所述各目标车辆基于各自实时本地数据集对所述预设待训练模型进行训练后得到的各第一目标模型参数;

第一训练模块,用于基于所述各第一目标模型参数,执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

发送模块,用于将所述第二目标模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述第一获取模块包括:

选取单元,用于在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取所述预设待训练模型;

发送单元,用于将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述选取单元包括:

第一选取子单元,用于在检测到训练指令时,根据所述训练指令中携带的区域属性,从预设模型集合中选取预设模型子集合;

第二选取子单元,用于根据所述训练指令中携带的时间信息以及车辆类型信息,从预设模型子集合中选取所述预设待训练模型。

可选地,所述发送模块包括:

加密单元,用于对所述第二目标模型参数进行加密处理,得到加密模型参数;

发送单元,用于将所述加密模型参数发送给所述目标车辆,以供各所述目标车辆基于所述第二目标模型参数得到各自的目标模型,以实现各自的自动驾驶功能。

可选地,所述第一获取模块还包括:

检测单元,用于在检测到训练指令时,获取预设待训练模型;

分发单元,用于与预设行驶范围内的各个基站进行通信,将所述预设待训练模型分发给所述各个基站,以供所述各个基站基于与各个目标车辆的距离信息,将所述预设待训练模型发送给预设行驶范围内的各目标车辆。

可选地,所述基于联邦学习的自动驾驶训练装置还包括:

第三获取模块,用于获取预设基础模型;

第二训练模块,用于基于具有预设识别标签的离线训练数据,对所述预设基础模型进行迭代训练,以对所述预设基础模型中的模型参数进行训练更新,直至所述预设基础模型达到预设训练完成条件;

设置模块,用于将达到预设训练完成条件后的所述预设基础模型设置为预设待训练模型。

可选地,所述具有预设识别标签的离线训练数据包括具有预设识别标签的离线激光雷达扫描数据,离线摄像数据以及离线毫米波雷达数据。

本申请还提供一种基于联邦学习的自动驾驶训练装置,应用于车辆,所述基于联邦学习的自动驾驶训练装置包括:

第一接收模块,用于接收云端服务器发送的预设待训练模型;

第四获取模块,用于基于实时本地数据集对所述预设待训练模型进行训练,得到第一目标模型参数;

第五获取模块,用于将所述第一目标模型参数加密发送给所述云端服务器,以供所述云端服务器执行预设联邦流程,并对所述预设待训练模型进行迭代训练,得到第二目标模型参数;

第二接收模块,用于接收云端服务器加密发送的所述第二目标模型参数,基于所述第二目标模型参数得到目标模型,以实现自动驾驶功能。

本申请基于联邦学习的自动驾驶训练装置的具体实施方式与上述基于联邦学习的自动驾驶训练方法各实施例基本相同,在此不再赘述。

本申请实施例提供了一种介质,且所述介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于联邦学习的自动驾驶训练方法的步骤。

本申请介质具体实施方式与上述基于联邦学习的自动驾驶训练方法各实施例基本相同,在此不再赘述。

以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1