碰撞预警方法及装置与流程

文档序号:20570538发布日期:2020-04-29 00:45阅读:640来源:国知局
碰撞预警方法及装置与流程

本发明涉及智能控制领域,尤其涉及一种碰撞预警方法及装置。



背景技术:

车辆碰撞是一种常见的交通事故,在拥堵的城市道路上,如果车辆与前方目标物距离过近时,很容易发生碰撞事件,因此,亟需一种碰撞预警方法,当存在潜在的碰撞危险时对驾驶员进行报警。

目前,碰撞预警的方法一般是通过测量车辆和前方目标物之间的距离以及车辆行驶的车速,根据测量得到的距离和车速计算碰撞时间,碰撞时间是指车辆与前方目标物发生碰撞所需的时间;根据距离与安全车距阈值的比对结果以及碰撞时间与碰撞时间阈值的比对结果,对驾驶员进行报警。

上述技术通过设置安全车距阈值和碰撞时间阈值等报警阈值来实现碰撞预警,针对所有驾驶员的报警时机是一样的,但不同驾驶员由于驾驶习惯的差异,对于报警时机的认可度不一样,这种报警阈值的设置难以满足不同驾驶员的驾驶习惯,碰撞预警的准确性较低。



技术实现要素:

本发明实施例提供了一种碰撞预警方法及装置,可以解决相关技术碰撞预警的准确性较低的问题。所述技术方案如下:

第一方面,提供了一种碰撞预警方法,所述方法包括:

获取状态信息,将所述状态信息输入碰撞预警模型,输出所述状态信息对应的动作信息;

当所述动作信息指示报警时,则进行报警;

当在报警后的目标时间段内接收到目标指令时,获取所述目标指令的接收时间点和报警时间点之间的时间差以及车辆的速度信息,所述目标指令由驾驶员对本次报警的响应操作触发;

根据所述时间差以及所述车辆的速度信息,更新所述碰撞预警模型。

在一种可能实现方式中,所述获取状态信息,包括:

根据所述车辆上安装的摄像设备的内参、外参以及目标点在所述摄像设备所拍摄的图像中成像的坐标信息,得到相对距离,所述内参包括焦距和所述图像的中心点的坐标信息,所述外参包括所述摄像设备的安装高度和俯仰角度;

根据所述焦距、所述相对距离、前方目标物的实际尺度、目标时间间隔以及所述目标时间间隔内所述前方目标物在所述图像中成像的尺度变化量,得到所述车辆与所述前方目标物的相对速度;

根据所述相对距离和所述相对速度,得到所述车辆与所述前方目标物发生碰撞所需的时间。

在一种可能实现方式中,所述根据所述车辆上安装的摄像设备的内参、外参以及目标点在所述摄像设备所拍摄的图像中成像的坐标信息,得到所述相对距离,包括:

应用下述公式,得到所述相对距离:

其中,δs为所述相对距离,hc为所述摄像设备的安装高度,y为所述目标点在所述摄像设备所拍摄的图像中成像的纵坐标,v0为所述图像的中心点的纵坐标,fy为垂直方向上的焦距,αr为所述摄像设备的俯仰角度。

在一种可能实现方式中,所述根据所述焦距、所述相对距离、所述前方目标物的实际尺度、目标时间间隔以及所述目标时间间隔内所述前方目标物在所述图像中成像的尺度变化量,得到所述车辆与所述前方目标物的相对速度,包括:

应用下述公式,得到所述相对速度:

其中,δv为所述相对速度,δs为所述相对距离,δw为所述尺度变化量,f为所述焦距,wg为所述车辆的实际尺度,δt为所述目标时间间隔。

在一种可能实现方式中,所述动作信息包括报警的权值和不报警的权值;

相应地,所述当所述动作信息指示报警时,则进行报警,包括:

当所述动作信息中所述报警的权值大于所述不报警的权值时,进行报警。

在一种可能实现方式中,所述根据所述时间差以及所述车辆的速度信息,更新所述碰撞预警模型,包括:

根据所述时间差以及所述车辆的速度信息,得到本次报警的回报值,所述回报值用于评价驾驶员对本次报警的认可度;

基于所述回报值,更新所述碰撞预警模型。

在一种可能实现方式中,所述车辆的速度信息为所述车辆的加速度,

相应地,所述根据所述时间差以及所述车辆的速度信息,得到本次报警的回报值,包括:

根据所述时间差以及所述车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,所述车辆的速度信息包括所述车辆在所述报警时间点的第一速度,以及所述车辆在所述目标指令的接收时间点的第二速度;

相应地,所述根据所述时间差以及所述车辆的速度信息,得到本次报警的回报值,包括:

根据所述第一速度、所述第二速度以及所述时间差,得到所述车辆的加速度;

根据所述时间差以及所述车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,所述根据所述时间差以及所述车辆的加速度,得到本次报警的回报值,包括:

根据所述时间差、所述车辆的加速度以及回报函数,得到本次报警的回报值;其中,所述回报函数为:

其中,rt为所述回报值,tb为所述目标指令的接收时间点,tw为所述报警时间点,t0为所述驾驶员对报警的反应时间,a为所述车辆的加速度。

在一种可能实现方式中,所述当所述动作信息指示报警时,则进行报警之后,所述方法还包括:

当在报警后的所述目标时间段内未接收到所述目标指令时,将所述时间差赋值为所述目标时间段对应的时间差,执行获取速度信息以及更新碰撞预警模型的步骤。

在一种可能实现方式中,所述输出所述状态信息对应的动作信息之后,所述方法还包括:

当所述动作信息指示不报警,且在目标时间段内接收到所述目标指令时,将所述时间差赋值为目标数值,执行获取速度信息以及更新碰撞预警模型的步骤。

第二方面,提供了一种碰撞预警装置,所述装置包括:

获取模块,用于获取状态信息,将所述状态信息输入碰撞预警模型,输出所述状态信息对应的动作信息;

报警模块,用于当所述动作信息指示报警时,则进行报警;

所述获取模块还用于当在报警后的目标时间段内接收到目标指令时,获取所述目标指令的接收时间点和报警时间点之间的时间差以及所述车辆的速度信息,所述目标指令由驾驶员对本次报警的响应操作触发;

更新模块,用于根据所述时间差以及车辆的速度信息,更新所述碰撞预警模型。

在一种可能实现方式中,所述获取模块用于:

根据所述车辆上安装的摄像设备的内参、外参以及目标点在所述摄像设备所拍摄的图像中成像的坐标信息,得到相对距离,所述内参包括焦距和所述图像的中心点的坐标信息,所述外参包括所述摄像设备的安装高度和俯仰角度;

根据所述焦距、所述相对距离、前方目标物的实际尺度、目标时间间隔以及所述目标时间间隔内所述前方目标物在所述图像中成像的尺度变化量,得到所述车辆与所述前方目标物的相对速度;

根据所述相对距离和所述相对速度,得到所述车辆与所述前方目标物发生碰撞所需的时间。

在一种可能实现方式中,所述获取模块用于:

应用下述公式,得到所述相对距离:

其中,δs为所述相对距离,hc为所述摄像设备的安装高度,y为所述目标点在所述摄像设备所拍摄的图像中成像的纵坐标,v0为所述图像的中心点的纵坐标,fy为垂直方向上的焦距,αr为所述摄像设备的俯仰角度。

在一种可能实现方式中,所述获取模块用于:

应用下述公式,得到所述相对速度:

其中,δv为所述相对速度,δs为所述相对距离,δw为所述尺度变化量,f为所述焦距,wg为所述车辆的实际尺度,δt为所述目标时间间隔。

在一种可能实现方式中,所述动作信息包括报警的权值和不报警的权值;

相应地,所述报警模块用于当所述动作信息中所述报警的权值大于所述不报警的权值时,进行报警。

在一种可能实现方式中,所述更新模块用于根据所述时间差以及所述车辆的速度信息,得到本次报警的回报值,所述回报值用于评价驾驶员对本次报警的认可度;基于所述回报值,更新所述碰撞预警模型。

在一种可能实现方式中,所述车辆的速度信息为所述车辆的加速度,相应地,所述更新模块用于根据所述时间差以及所述车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,所述车辆的速度信息包括所述车辆在所述报警时间点的第一速度,以及所述车辆在所述目标指令的接收时间点的第二速度;

相应地,所述更新模块用于根据所述第一速度、所述第二速度以及所述时间差,得到所述车辆的加速度;根据所述时间差以及所述车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,所述更新模块用于:

根据所述时间差、所述车辆的加速度以及回报函数,得到本次报警的回报值;其中,所述回报函数为:

其中,rt为所述回报值,tb为所述目标指令的接收时间点,tw为所述报警时间点,t0为所述驾驶员对报警的反应时间,a为所述车辆的加速度。

在一种可能实现方式中,所述获取模块还用于当在报警后的所述目标时间段内未接收到所述目标指令时,将所述时间差赋值为所述目标时间段对应的时间差,执行获取速度信息的步骤;

所述更新模块还用于执行更新碰撞预警模型的步骤。

在一种可能实现方式中,所述获取模块还用于当所述动作信息指示不报警,且在目标时间段内接收到所述目标指令时,将所述时间差赋值为目标数值,执行获取速度信息的步骤;

所述更新模块还用于执行更新碰撞预警模型的步骤。

第三方面,提供了一种计算机设备,包括处理器和存储器;所述存储器,用于存放至少一条指令;所述处理器,用于执行所述存储器上所存放的至少一条指令,实现第一方面任一种实现方式所述的方法步骤。

第四方面,提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有至少一条指令,所述至少一条指令被处理器执行时实现第一方面任一种实现方式所述的方法步骤。

本发明实施例提供的技术方案带来的有益效果至少包括:

通过获取车辆实时的状态信息,利用碰撞预警模型,获取对应的动作信息,每次报警后,根据报警时间点与驾驶员进行响应操作的时间点之间的时间差,以及报警后车辆的速度信息,来更新碰撞预警模型。上述方案考虑了驾驶员的驾驶习惯,根据驾驶员对本次报警的反馈来更新模型,使得模型的输出结果,也即是报警时机更符合驾驶员的期望,提高了碰撞预警的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的一种碰撞预警方法的流程图;

图2是本发明实施例提供的一种碰撞预警方法的流程图;

图3是本发明实施例提供的一种单目测距方法的示意图;

图4是本发明实施例提供的一种强化学习过程的示意图;

图5是本发明实施例提供的一种碰撞预警装置的结构示意图;

图6是本发明实施例提供的一种计算机设备600的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。

图1是本发明实施例提供的一种碰撞预警方法的流程图。参见图1,该方法包括:

101、获取状态信息,将该状态信息输入碰撞预警模型,输出该状态信息对应的动作信息,该状态信息用于描述车辆与前方目标物的相对运动情况、车辆的行驶状态和当前路面状况中至少一项,该碰撞预警模型用于根据输入的状态信息输出动作信息,该动作信息用于指示是否报警。

102、当该动作信息指示报警时,则进行报警。

103、当在报警后的目标时间段内接收到目标指令时,获取该目标指令的接收时间点和报警时间点之间的时间差以及车辆的速度信息,该目标指令由驾驶员对本次报警的响应操作触发。

104、根据该时间差以及该车辆的速度信息,更新该碰撞预警模型。

本发明实施例提供的方法,通过获取车辆实时的状态信息,利用碰撞预警模型,获取对应的动作信息,每次报警后,根据报警时间点与驾驶员进行响应操作的时间点之间的时间差,以及报警后车辆的速度信息,来更新碰撞预警模型。上述方案考虑了驾驶员的驾驶习惯,根据驾驶员对本次报警的反馈来更新模型,使得模型的输出结果,也即是报警时机更符合驾驶员的期望,提高了碰撞预警的准确性。

在一种可能实现方式中,该获取状态信息,包括:

根据该车辆上安装的摄像设备的内参、外参以及目标点在该摄像设备所拍摄的图像中成像的坐标信息,得到相对距离,该内参包括焦距和该图像的中心点的坐标信息,该外参包括该摄像设备的安装高度和俯仰角度;

根据该焦距、该相对距离、该前方目标物的实际尺度、目标时间间隔以及该目标时间间隔内该前方目标物在该图像中成像的尺度变化量,得到该车辆与该前方目标物的相对速度;

根据该相对距离和该相对速度,得到该车辆与该前方目标物发生碰撞所需的时间。

在一种可能实现方式中,该根据该车辆上安装的摄像设备的内参、外参以及目标点在该摄像设备所拍摄的图像中成像的坐标信息,得到相对距离,包括:

应用下述公式,得到该相对距离:

其中,δs为该相对距离,hc为该摄像设备的安装高度,y为该目标点在该摄像设备所拍摄的图像中成像的纵坐标,v0为该图像的中心点的纵坐标,fy为垂直方向上的焦距,αr为该摄像设备的俯仰角度。

在一种可能实现方式中,该根据该焦距、该相对距离、该前方目标物的实际尺度、目标时间间隔以及该目标时间间隔内该前方目标物在该图像中成像的尺度变化量,得到该车辆与该前方目标物的相对速度,包括:

应用下述公式,得到该相对速度:

其中,δv为该相对速度,δs为该相对距离,δw为该尺度变化量,f为该焦距,wg为该车辆的实际尺度,δt为该目标时间间隔。

在一种可能实现方式中,该动作信息包括报警的权值和不报警的权值;

相应地,该当该动作信息指示报警时,则进行报警,包括:

当该动作信息中该报警的权值大于该不报警的权值时,进行报警。

在一种可能实现方式中,该根据该时间差以及该车辆的速度信息,更新该碰撞预警模型,包括:

根据该时间差以及该车辆的速度信息,得到本次报警的回报值,该回报值用于评价驾驶员对本次报警的认可度;

基于该回报值,更新该碰撞预警模型。

在一种可能实现方式中,该车辆的速度信息为该车辆的加速度,

相应地,该根据该时间差以及该车辆的速度信息,得到本次报警的回报值,包括:

根据该时间差以及该车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,该车辆的速度信息包括该车辆在该报警时间点的第一速度,以及该车辆在该目标指令的接收时间点的第二速度;

相应地,该根据该时间差以及该车辆的速度信息,得到本次报警的回报值,包括:

根据该第一速度、该第二速度以及该时间差,得到该车辆的加速度;

根据该时间差以及该车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,该根据该时间差以及该车辆的加速度,得到本次报警的回报值,包括:

根据该时间差、该车辆的加速度以及回报函数,得到本次报警的回报值;其中,该回报函数为:

其中,rt为该回报值,tb为该目标指令的接收时间点,tw为该报警时间点,t0为该驾驶员对报警的反应时间,a为该车辆的加速度。

在一种可能实现方式中,该当该动作信息指示报警时,则进行报警之后,该方法还包括:

当在报警后的该目标时间段内未接收到该目标指令时,将该时间差赋值为该目标时间段对应的时间差,执行获取速度信息以及更新碰撞预警模型的步骤。

在一种可能实现方式中,该输出该状态信息对应的动作信息之后,该方法还包括:

当该动作信息指示不报警,且在目标时间段内接收到该目标指令时,将该时间差赋值为目标数值,执行获取速度信息以及更新碰撞预警模型的步骤。

上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。

图2是本发明实施例提供的一种碰撞预警方法的流程图。参见图2,该方法包括:

201、获取状态信息,该状态信息用于描述车辆与前方目标物的相对运动情况、车辆的行驶状态和当前路面状况中至少一项。

本发明实施例中,车辆在行驶过程中,可以实时获取该状态信息。在一种可能实现方式中,状态信息包括该车辆与前方目标物发生碰撞所需的时间、该车辆与该前方目标物的相对距离、车辆的速度信息和路面附着系数。其中,车辆与前方目标物发生碰撞所需的时间和该车辆与该前方目标物的相对距离用于描述车辆与前方目标物的相对运动情况,车辆的速度信息用于描述车辆的行驶状态,路面附着系数用于描述当前路面状况。

在一种可能实现方式中,针对车辆的速度信息,车辆的速度信息可以包括车辆的速度和车辆的加速度,车辆可以通过车速传感器来测量车辆的速度,根据车辆在一段时间内的速度变化情况,得到车辆的加速度,或直接通过加速度传感器来测量车辆的加速度。针对路面附着系数,车辆可以通过雨量传感器和温度传感器分别采集路面的实时雨量和实时温度,进而根据该实时雨量和实时温度,以及预先标定的雨量和温度与路面附着系数之间的对应关系,得到该实时雨量和实时温度对应的路面附着系数。

针对车辆与该前方目标物的相对距离,车辆可以根据该车辆上安装的摄像设备的内参、外参以及目标点在该摄像设备所拍摄的图像中成像的坐标信息,得到该相对距离,该内参包括焦距和该图像的中心点的坐标信息,该外参包括该摄像设备的安装高度和俯仰角度。

其中,摄像设备可以是单目摄像机。参见图3,图3是本发明实施例提供的一种单目测距方法的示意图,如图3所示,以摄像机为坐标系原点,摄像机的内参已知(包括焦距f、图像中心点(u0,v0)、镜头畸变系数),假定摄像机安装于水平方向且没有偏转,则需要标定的外参有:摄像机的安装高度hc、俯仰角αr)。

需要测距的目标点是p,p在图像中成像的坐标为y,p到摄像机中心点的连线与路面的夹角为αs,则有:

αs=αc+αr(1)

由透视成像关系有:

而测距结果(相对距离)为:

δs=hc×tan(αs)(3)

结合式(1)至式(3),车辆可以应用下述公式(4),得到该相对距离:

其中,δs为该相对距离,hc为该摄像设备的安装高度,y为该目标点在该摄像设备所拍摄的图像中成像的纵坐标,v0为该图像的中心点的纵坐标,fy为垂直方向上的焦距,αr为该摄像设备的俯仰角度。

针对车辆与前方目标物发生碰撞所需的时间,车辆可以根据该焦距、该相对距离、该前方目标物的实际尺度、目标时间间隔以及该目标时间间隔内该前方目标物在该图像中成像的尺度变化量,得到该车辆与该前方目标物的相对速度;根据该相对距离和该相对速度,得到该车辆与该前方目标物发生碰撞所需的时间。其中,该前方目标物的实际尺度可以是指该前方目标物的实际宽度。

相对速度根据车辆与前方目标物的相对距离以及前方目标物在图像中的尺度变化量计算,假设前方目标物的实际尺度为wg,在图像中成像的尺度是w,人眼观察物体,总是近大远小,即w和δs成反比;物理尺度大的物体,所成的像也大,即w和wg成正比。

假定前方目标物的实际尺度已知(wg=2米),尺度变化计算的间隔时间是δt,在时间δt内的尺度变化量为δw,根据前方目标物的成像尺度,车辆可以应用下述公式(5),得到相对速度:

其中,δv为该相对速度,δs为该相对距离,δw为该尺度变化量,f为该焦距,wg为该车辆的实际尺度,δt为该目标时间间隔。

进一步地,车辆可以基于相对距离和相对速度,应用下述公式(6),计算碰撞时间ttc:

ttc=δs/δv(6)

相关技术通过比较实时测量值与报警阈值的大小关系,如比较碰撞时间ttc与碰撞时间阈值,来确定是都进行报警,因而需要设置报警阈值,如碰撞时间阈值一般设定在1.5秒至2.7秒之间,具体为根据车辆与前方目标物不同的安全车距来调整报警阈值,安全车距越小,报警阈值越大,报警越灵敏。针对不同路况要设置一个合理的报警阈值是困难的,进一步考虑到不同驾驶员本身不同的驾驶习惯,要让驾驶体验度高,报警阈值的设置更困难。这种通过设置报警阈值来进行碰撞预警的效率和准确率较低。另外,基于规则的报警策略,在场景非常多变时,创建的规则就无法保证足够的覆盖面,当添加更多新的规则时,就必须撤消或者重写旧的规则,这使得报警系统变得脆弱。

而本发明实施例提供的技术方案无需设置报警阈值,而是使用强化学习方式,分析报警后驾驶员操作带来的影响,从而进行报警策略的优化。其中,强化学习是指通过探索环境学习一个最优策略,可以让本体在特定环境中,根据当前的状态作出决策或动作,从而获得最大回报。

参见图4,图4是本发明实施例提供的一种强化学习过程的示意图,如图4所示,强化学习包括环境部分和碰撞预警模型,该碰撞预警模型可以是多层神经网络模型,其中,环境部分包括前方目标物感知、车辆控制和驾驶员操作。强化学习所涉及的具体名称定义如下:

策略(环境状态到动作的映射):多层神经网络模型根据状态信息输出对应的动作信息;

状态集合s:{ttc,δs,v,μ,α},其中,ttc即为报警时间,δs为相对距离,v为车辆的速度,μ为路面附着系数,α为车辆的加速度;

动作集合a:{报警(权值),不报警(权值)},例如,报警的权值可以为1,不报警的权值为0,当然,1和0仅是权值的一个示例,实际上,权值可以具有更大的数值范围;

最优策略:该策略下得到的回报最大,刹车的时机最为正确;

状态转移概率:如果不及时提醒刹车,有一定概率的ttc增加或下降,该状态转移概率可以应用于强化学习过程。

具体地,利用碰撞预警模型进行碰撞预警的具体过程参见步骤202及后续步骤。

202、将该状态信息输入碰撞预警模型,输出该状态信息对应的动作信息,该碰撞预警模型用于根据输入的状态信息输出动作信息,该动作信息用于指示是否报警。

在一种可能实现方式中,碰撞预警模型的获取过程包括:基于样本状态信息以及对应的动作信息进行训练,得到碰撞预警模型,例如,车辆可以维护一个数据库,该数据库中记录了车辆的历史状态信息以及对应的实际动作信息,也即是,车辆在各个历史时刻的状态信息以及在每种状态信息下车辆进行的实际动作,包括报警和不报警。通过从该数据库中抽取多个历史状态信息作为样本状态信息,并获取该多个历史状态信息对应的实际动作信息,进而基于该多个历史状态信息以及对应的实际动作信息训练得到碰撞预警模型,这样训练得到的碰撞预警模型具有根据输入的状态信息输出动作信息的能力。

本发明实施例中,针对图4所示的强化学习过程,车辆在获取状态信息后,可以将获取的状态信息实时输入到碰撞预警模型中,将该碰撞预警模型的输出结果作为该状态信息对应的动作信息。

203、当该动作信息指示报警时,则进行报警。

在一种可能实现方式中,该动作信息可以包括报警和不报警两种动作,以及每种动作的权值,也即是,报警的权值和不报警的权值。车辆可以根据这两种动作的权值,来确定是否报警。例如,当该动作信息中报警的权值大于不报警的权值时,则进行报警。其中,报警方式可以为发出报警声音,或者控制警示灯闪烁,又或,座椅抖动报警,本发明实施例对报警方式不做限定,只要能起到对驾驶员进行报警的作用即可。

204、当在报警后的目标时间段内接收到目标指令时,获取该目标指令的接收时间点和报警时间点之间的时间差以及车辆的速度信息,该目标指令由驾驶员对本次报警的响应操作触发。

本发明实施例中,如果车辆根据动作信息进行报警后,驾驶员可以根据实际情况,判断当前是否确实存在碰撞危险,如果驾驶员认为确实存在碰撞危险,则可以根据本次报警,对本次报警进行响应操作,触发车辆接收到目标指令。例如,该响应操作可以是刹车操作,该目标指令可以是刹车指令。

在一种可能实现方式中,车辆可以设置有一个目标时间段,每次进行报警后,如果驾驶员在报警后的目标时间段内进行了响应操作,则车辆可以接收到该目标指令,此时,车辆可以获取目标指令的接收时间点tb与报警时间点tw之间的时间差,也即是tb-tw,其中,目标指令的接收时间点也即是驾驶员对本次报警进行响应操作的时间点。

另外,考虑到报警后,如果驾驶员对本次报警进行响应操作,则车辆的速度会发生变化,因此,报警后,除了获取时间差以外,还可以获取车辆的速度信息。该车辆的速度信息可以为该车辆的加速度,或,该车辆的速度信息包括该车辆在该报警时间点的第一速度以及该车辆在该目标指令的接收时间点的第二速度。车辆的速度信息的获取过程在步骤201中已有说明,此处不再赘述。

205、当在报警后的该目标时间段内未接收到该目标指令时,将该时间差赋值为该目标时间段对应的时间差,获取该车辆的速度信息。

本发明实施例中,如果车辆根据动作信息进行报警后,驾驶员认为不存在碰撞危险,则可以忽略本次报警,不对本次报警进行响应操作,如果在报警后的目标时间段内,驾驶员未对本次报警进行响应操作,则车辆不会接收到目标指令,此时,车辆可以获取该目标时间段对应的时间差δtr,将该时间差赋值给目标指令的接收时间点与报警时间点之间的时间差,也即是,取tb-tw=δtr,例如,该δtr可以是3秒。

另外,考虑到报警后,即使驾驶员不对本次报警进行响应操作,也即是,驾驶员不进行刹车操作,但驾驶员可能会进行其他操作,如加速操作,导致车辆的加速度发生变化,则车辆仍然可以执行获取车辆的速度信息的步骤。

206、当该动作信息指示不报警,且在目标时间段内接收到目标指令时,将该时间差赋值为目标数值,获取该车辆的速度信息。

本发明实施例中,针对步骤203中根据两种动作的权值确定是否报警,当该动作信息中报警的权值小于不报警的权值时,则不进行报警。如果车辆未进行报警,但驾驶员可能认为当前存在碰撞危险,因此仍然可能会进行响应操作,使得车辆可以接收到目标指令,此时,车辆可以将目标数值赋值给目标指令的接收时间点与报警时间点之间的时间差,并执行获取车辆的速度信息的步骤。其中,该目标数值可以是针对未报警但接收到目标指令的情况,预先设置的一个经验值,该目标数值可以与步骤204和步骤205中时间差的取值处于同一数量级。

需要说明的是,上述步骤205和步骤206为可选步骤,在执行步骤202后,如果发生步骤203以及步骤204的情况,则无需执行该步骤205和步骤206。

207、根据该时间差以及该车辆的速度信息,得到本次报警的回报值,该回报值用于评价驾驶员对本次报警的认可度。

本发明实施例中,报警时机与车辆与前方目标物的相对距离和相对速度以及车辆的速度和加速度相关。不同驾驶员由于驾驶经验和驾驶习惯的差异,对于报警时机的认可度不一样,过早报警会认为误报警,太晚报警又使驾驶员感到危险。因此,为了提升驾驶体验,每次进行碰撞预警后,可以根据模型输出和驾驶员实际操作的差异获取回报值,进而利用该回报值,矫正报警时机。其中,该回报值反映了驾驶员对本次报警的认可度,回报值越大,表明驾驶员对本次报警的认可度越大,也即是,本次报警的时机与驾驶员的期望越接近;回报值越小,表明驾驶员对本次报警的认可度越小,也即是,本次报警的时机与驾驶员的期望越偏离。

针对该车辆的速度信息为该车辆的加速度的情况,回报值的获取过程可以包括:根据该时间差以及该车辆的加速度,得到本次报警的回报值。

针对该车辆的速度信息包括第一速度和第二速度的情况,回报值的获取过程可以包括:根据该第一速度、该第二速度以及时间差,得到该车辆的加速度,例如,将第一速度与第二速度的速度差除以该时间差,得到车辆的加速度。进一步地,根据该时间差以及该车辆的加速度,得到本次报警的回报值。

本发明实施例中,参见步骤204和步骤205,以驾驶员对报警的响应操作为刹车操作为例,每次进行碰撞预警后,车辆可以获取报警时间点tw和与tw最近的驾驶员踩刹车的时间点tb的差值(tb-tw);在tw时间点一定时间δtr范围内如果没有刹车,则取(tb-tw)=δtr。另外,考虑到驾驶员听到报警声音后,需要一定的反应时间,因此,还需考虑驾驶员对报警的反应时间t0。例如,t0可以通过预先对多个驾驶员的反应时间进行测试,根据测试结果设置t0,如将测试结果的平均值作为t0,当然,t0也可以是一个经验值,如0.5秒,本发明实施例对t0的取值不做限定。

另外,车辆可以根据加速度a判断是否刹车及刹车幅度,用于评价驾驶员对本次碰撞报警的反馈,a>0表示车辆在加速,a<0表示本车正在减速,出现减速需要对本次报警进行奖励,如果继续加速则对本次报警进行惩罚。

综合以上两点,发出报警后,车辆可以根据该时间差以及该车辆的加速度,得到本次报警的回报值,具体地,根据该时间差、该车辆的加速度以及回报函数,得到本次报警的回报值;其中,该回报函数为下式(7)所示:

其中,rt为该回报值,tb为该目标指令的接收时间点,tw为报警时间点,t0为该驾驶员对报警的反应时间,a为车辆的加速度。

由式(7)可知,回报值的影响因素包括目标指令的接收时间点和报警时间点的时间差以及加速度,在车辆报警后,驾驶员越快对本次报警进行响应操作(如刹车),刹车幅度越大,则tb-tw越小,a越小,回报值越大,驾驶员对本次报警的认可度越大;驾驶员越慢对本次报警进行响应操作或不进行响应操作,则tb-tw越大,回报值越小,驾驶员对本次报警的认可度越小。

208、基于该回报值,更新该碰撞预警模型。

本发明实施例中,车辆在获取回报值后,可以将该回报值输入到碰撞预警模型,通过碰撞预警模型计算回报值与本次输出结果之间的误差,也即是,回报值与步骤202的动作信息中报警的权值之间的误差,采用强化学习的方式进行学习,通过误差反向传播算法,更新碰撞预警模型,使得模型产生的报警策略逐渐与期望一致,也即是,模型输出的结果与驾驶员的期望一致。更新后的碰撞预警模型用于根据下一次获取的状态信息进行碰撞预警。

需要说明的是,上述步骤207至步骤208是根据该时间差以及该车辆的速度信息,更新该碰撞预警模型的一种可能实现方式。由于考虑了驾驶员的驾驶习惯,根据驾驶员对本次报警的反馈来更新模型,使得模型的输出结果,也即是报警时机更符合驾驶员的期望。

上述技术方案从驾驶体验的角度,基于强化学习,自动学习合适的报警时机。工作原理是,每次进行碰撞预警后,计算驾驶员踩刹车的时间点和报警时间点的时间差,并根据车辆减速情况,判断刹车幅度。如果驾驶员没有刹车行为,则认为本次报警过于灵敏,对模型进行惩罚。如果驾驶员有刹车行为,则认为本次报警有效,对模型进行奖励。另外,对于驾驶员有刹车行为,而本次没有报警的情况,认为有漏报警,对模型进行惩罚,使下次进入类似情况可以进行提前预警。相比于相关技术设置报警阈值的方式,本发明实施例提供的技术方案减少了对模型本身的逻辑设计和阈值设置,更符合驾驶员的用户体验;并且报警是否符合驾驶体验需要驾驶员在报警后的操作来确认,属于延迟奖励问题,适合于强化学习。相比于传统人工规则的报警策略,报警阈值的设计难以满足不同驾驶员的体验差异,针对一些复杂工况阈值设计相对困难,本发明实施例提供的技术方案使用强化学习的方式,可以针对性的学习驾驶员的驾驶习惯,且在各种复杂情况下都能输出合适的动作信息。另外,通过设计一种回报函数,可以根据当前状态评估对本次报警的奖励或惩罚。

本发明实施例提供的方法,通过获取车辆实时的状态信息,利用碰撞预警模型,获取对应的动作信息,每次报警后,根据报警时间点与驾驶员进行响应操作的时间点之间的时间差,以及报警后车辆的速度信息,来更新碰撞预警模型。上述方案考虑了驾驶员的驾驶习惯,根据驾驶员对本次报警的反馈来更新模型,使得模型的输出结果,也即是报警时机更符合驾驶员的期望,提高了碰撞预警的准确性。

图5是本发明实施例提供的一种碰撞预警装置的结构示意图。参照图5,该装置包括:

获取模块501,用于获取状态信息,,将该状态信息输入碰撞预警模型,输出该状态信息对应的动作信息,该状态信息用于描述车辆与前方目标物的相对运动情况、车辆的行驶状态和当前路面状况中至少一项,该碰撞预警模型用于根据输入的状态信息输出动作信息,该动作信息用于指示是否报警;

报警模块502,用于当该动作信息指示报警时,则进行报警;

该获取模块501还用于当在报警后的目标时间段内接收到目标指令时,获取该目标指令的接收时间点和报警时间点之间的时间差以及车辆的速度信息,该目标指令由驾驶员对本次报警的响应操作触发;

更新模块503,用于根据该时间差以及该车辆的速度信息,更新该碰撞预警模型。

在一种可能实现方式中,该获取模块501用于:

根据该车辆上安装的摄像设备的内参、外参以及目标点在该摄像设备所拍摄的图像中成像的坐标信息,得到相对距离,该内参包括焦距和该图像的中心点的坐标信息,该外参包括该摄像设备的安装高度和俯仰角度;

根据该焦距、该相对距离、该前方目标物的实际尺度、目标时间间隔以及该目标时间间隔内该前方目标物在该图像中成像的尺度变化量,得到该车辆与该前方目标物的相对速度;

根据该相对距离和该相对速度,获取该车辆与该前方目标物发生碰撞所需的时间。

在一种可能实现方式中,该获取模块501用于:

应用下述公式,得到该相对距离:

其中,δs为该相对距离,hc为该摄像设备的安装高度,y为该目标点在该摄像设备所拍摄的图像中成像的纵坐标,v0为该图像的中心点的纵坐标,fy为垂直方向上的焦距,αr为该摄像设备的俯仰角度。

在一种可能实现方式中,该获取模块501用于:

应用下述公式,得到该相对速度:

其中,δv为该相对速度,δs为该相对距离,δw为该尺度变化量,f为该焦距,wg为该车辆的实际尺度,δt为该目标时间间隔。

在一种可能实现方式中,该动作信息包括报警的权值和不报警的权值;

相应地,该报警模块502用于当该动作信息中该报警的权值大于该不报警的权值时,进行报警。

在一种可能实现方式中,该更新模块503用于根据该时间差以及该车辆的速度信息,得到本次报警的回报值,该回报值用于评价驾驶员对本次报警的认可度;基于该回报值,更新该碰撞预警模型。

在一种可能实现方式中,该车辆的速度信息为该车辆的加速度,相应地,该更新模块503用于根据该时间差以及该车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,该车辆的速度信息包括该车辆在该报警时间点的第一速度,以及该车辆在该目标指令的接收时间点的第二速度;

相应地,该更新模块503用于根据该第一速度、该第二速度以及该时间差,得到该车辆的加速度;根据该时间差以及该车辆的加速度,得到本次报警的回报值。

在一种可能实现方式中,该更新模块503用于:

根据该时间差、该车辆的加速度以及回报函数,得到本次报警的回报值;其中,该回报函数为:

其中,rt为该回报值,tb为该目标指令的接收时间点,tw为该报警时间点,t0为该驾驶员对报警的反应时间,a为该车辆的加速度。

在一种可能实现方式中,该获取模块501还用于当在报警后的该目标时间段内未接收到该目标指令时,将该时间差赋值为该目标时间段对应的时间差,执行获取速度信息的步骤;

该更新模块503还用于执行更新碰撞预警模型的步骤。

在一种可能实现方式中,该获取模块501还用于当该动作信息指示不报警,且在目标时间段内接收到该目标指令时,将该时间差赋值为目标数值,执行获取速度信息的步骤;

该更新模块503还用于执行更新碰撞预警模型的步骤。

本发明实施例提供的装置,通过获取车辆实时的状态信息,利用碰撞预警模型,获取对应的动作信息,每次报警后,根据报警时间点与驾驶员进行响应操作的时间点之间的时间差,以及报警后车辆的速度信息,来更新碰撞预警模型。上述方案考虑了驾驶员的驾驶习惯,根据驾驶员对本次报警的反馈来更新模型,使得模型的输出结果,也即是报警时机更符合驾驶员的期望,提高了碰撞预警的准确性。

需要说明的是:上述实施例提供的碰撞预警装置在碰撞预警时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的碰撞预警装置与碰撞预警方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。

图6是本发明实施例提供的一种计算机设备600的结构示意图,该计算机设备600可以配置于车辆中,用于执行上述各个实施例中提供的碰撞预警方法。该计算机设备600可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)601和一个或一个以上的存储器602,其中,该存储器602中存储有至少一条指令,该至少一条指令由该处理器601加载并执行以实现上述各个方法实施例提供的碰撞预警方法。当然,该计算机设备还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该计算机设备还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种存储有至少一条指令的计算机可读存储介质,例如存储有至少一条指令的存储器,上述至少一条指令被处理器执行时实现上述实施例中的碰撞预警方法。例如,该计算机可读存储介质可以是只读内存(read-onlymemory,rom)、随机存取存储器(randomaccessmemory,ram)、只读光盘(compactdiscread-onlymemory,cd-rom)、磁带、软盘和光数据存储设备等。

本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,上述程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

上述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1