基于机器学习的车辆驾驶行为预测方法与流程

文档序号:15463718发布日期:2018-09-18 18:48阅读:757来源:国知局

本发明涉及车联网领域,具体涉及一种基于机器学习的车辆驾驶行为预测方法。



背景技术:

车辆驾驶行为预测主要服务于车联网安全相关的应用,如十字路口车辆防碰撞监测等。现有关于车辆驾驶行为预测的研究,主要考虑车辆的历史行为轨迹以及车辆行驶的路况信息。这些研究对车辆与所在路况信息的建模较为理想化,忽略了车辆自身属性(如车身长宽),车辆到路口距离,交通信号与车道转向允许标志等影响车辆驾驶行为的重要因素,从而导致在现实城市道路中对驾驶行为的预测结果与实际情况有较大偏差。

本发明综合考虑上述影响车辆驾驶行为的多种因素,利用机器学习技术,挖掘车辆属性、道路信息以及行驶环境信息与车辆驾驶行为之间的关系,提高车辆驾驶行为预测的准确性。



技术实现要素:

针对现有车辆驾驶行为预测模型对车身属性,道路信息,以及行驶环境与驾驶行为之间关系挖掘不足的问题,本发明综合考虑车辆属性、道路信息以及行驶环境等重要影响因素,提出一种基于机器学习的车辆驾驶行为预测方法。

本发明技术方案为:

一种基于机器学习的车辆驾驶行为预测方法,其特征在于,采用全连接神经网络预测车辆位移,根据预测的位移,采用高斯混合模型对驾驶行为进行聚类。具体方法包括如下步骤:

步骤1,定义特征集,包括车辆特征定义、道路特征定义、车辆行驶环境特征定义。

步骤11,车辆特征定义

车辆特征包括车身长度L,车身宽度W,车辆速度、加速度,当前行驶方向,路口转向动作,其中t时刻车辆速度、加速如分别标记为v(t)和a(t),其余特征分别定义如下:

定义1车辆行驶方向vDir(t),表示t时刻车辆运动方向,用与正北方向之间顺时针夹角表示,满足:

0≤vDir(t)<360° (4)

定义2车辆路口转向vMov(t),表示t时刻车辆在经过十字路口时的驾驶行为,以向量的形式表征,由于十字路口均不允许调头,目前考虑车辆直行、左转弯、右转弯的情况,如公式(2)。

定义3车辆当前位置P(t),表示t时刻车辆在CA State Plane III in NAD83坐标系中的二维坐标向量,向量各项单位为英尺(ft)。位置信息定义如下:

P(t)=(x(t),y(t)) (3)

CA State Plane III in NAD83坐标系为1983北美洲基准面(NAD)坐标系。

综上,t时刻车辆的特征集featurev(t)定义如下:

featurev(t)={L,W,v(t),a(t),vDir(t),vMov(t),P(t)} (4)

步骤12,道路特征定义

将十字路口或丁字路口抽象为四边形,以其四个顶点坐标从西北方向的角开始按照顺时针方向依次标识,标记如下:

I=(x1,y1,x2,y2,x3,y3,x4,y4) (5)

定义4十字路口集合ISet表示研究区域内,所有十字路口组成的集合。

ISet=(I1,I2,...,Im,...) (6)

定义5道路段指道路在两个相邻十字路口之间的一个路段,由道路段两侧十字路口来标识该道路段。定义道路i的道路段集合如下:

RSegSet(i)=(I1I2,I2I3,...,IkIm,...) (7)

其中Ik(1≤k≤n,n为最大十字路口编号)表示编号为k的十字路口。

每条道路段包含若干车道,定义十字路口Ik,Im之间的道路段车道集合如下:

IkIm=(lid1,lid2,...,lidn) (8)

其中lidk(1≤k≤n)表示车道编号。

定义6车道方向lDir(x,y)表示车道允许的行进方向,其中x,y表示车道内的位置坐标。角度定义同vDir。车辆在当前车道直道的行驶方向vDir与车道方向相同,即若当前车辆处在i车道内,则有

vDir(t)=lDiri(x,y),其中(x,y)=P(t) (9)

定义7车道左侧可变道数量LAL(left available lanes)为在某车道当前位置下,车辆可向左变动的车道数目。由当前车道i的当前位置(x,y)向左侧同向车道搜索,直至遇到实线表示车辆不可向左变道或者搜索到最左侧同向车道为止。搜索到的车道数目即为车道左侧可变道数量LALi(x,y)。

定义8车道右侧可变道数量RAL(right available lanes)为在某车道当前位置下,车辆可向右变动的车道数目。由当前车道i的当前位置(x,y)向右侧同向车道搜索,直至遇到实线表示车辆不可向右变道或者搜索到最右侧同向车道为止。搜索到的车道数目即为车道右侧可变道数量RALi(x,y)。

定义9直行区车道允许驾驶行为包括直行,向左变道和向右变道。定义向量sld表示车道允许的基本驾驶行为如下:

直行区车道允许的驾驶行为SLD有

定义10路口准备区车道允许的驾驶行为包括直行,左转弯,右转弯和调头。定义向量pld表示车道允许的基本驾驶行为如下:

路口准备区车道允许的驾驶行为PLD可以表示为:

PLD(x,y)=β1(x,y)pldst+β2pldtl+β3pldtr+β4pldta+β5pldsp (13)

其中{β1,β2,β3,β4,β5|βi=0∨βi=1,1≤i≤5,i∈N}

βi为某种驾驶行为的概率系数,选中为1,否则为0。

综上,位置(x,y)处的道路特征集featurer(x,y)可以定义如下:

步骤13,车辆行驶环境定义

定义11路口距离,车辆i与前方十字路口Im距离表示以车辆i前边沿与当前车道前方十字路口停止线之间的距离。

定义12t时刻,交通灯TLi信号允许动作使用向量sigi(t)表示。

定义13车辆t时刻的路口允许转向动作表示为IAM(t)。该特征受制于车道允许的驾驶行为PLD和交通灯信号允许动作sigi(t)。表示为矩阵的Hadamard乘积,如公式(16)。

IAM(t)=PLD(P(t))*sigi(t) (16)

综上,t时刻车辆行驶环境特征集featuree(t)定义如下:

featuree(t)={VID(t),IAM(t)} (17)

综合步骤11,步骤12和步骤13,t时刻影响车辆驾驶行为的特征集feature(t)定义为

feature(t)=featurev(t)∪featurer(P(t))∪featuree(t) (18)

步骤2,车辆位移预测模型

步骤21,特征提取与数据预处理

直接获取的车辆特征包括车辆长度L,车辆宽度W,车辆速度v,车辆加速度a,车辆行驶方向vDir,车辆路口转向vMov,车辆当前位置。

直接获取的道路特征包括车道方向lDir,车道左侧可变道数量LAL,车道右侧可变道数量RAL,车道允许的驾驶行为SLD,路口准备区车道允许的驾驶行为PLD。

直接可获取十字路口集ISet,道路段集合RSegSet,交通灯信号允许的驾驶动作sig(t),每辆车所在的车道lane以及每辆车所在的道路段RSeg。

根据步骤1的定义,需要提取的特征包括车辆与前方十字路口距离VID,车辆路口允许转向动作IAM,训练样本标签。

步骤211,车辆与前方路口距离特征提取

在地图上根据车辆所在车道lane以及车辆所在车道方向lDir获取该车道在前方十字路口处停止线AB两个端点的坐标,即A点坐标(xA,yA)和B点坐标(xB,yB)。从车辆前边缘向直线AB做垂线,求得垂线长度length。由于研究的数据集中道路近似直道,可以用length近似替代VID。

AB在二维坐标系中满足公式(19)。

(yA-yB)·x+(xB-xA)·y+(yB·xA-xB·yA)=0 (19)

假设此时车辆位置P(t)=(xC,yC),则车辆到停止线AB的距离length满足公式(20)。

对数据集中每辆车各时刻点的数据按照公式(20)进行计算,得到特征VID。

步骤212,路口允许转向动作特征提取

从数据集中获取十字路口信号灯随时间变化的表格,即对于任意十字路口Ii可以获取sigi(t)。从数据集中的地图车道标记中可以获取车道允许驾驶行为PLD。则IAM特征的提取按照定义13,依次找到每条车道对应的十字路口,然后对sig(t)和PLD做Hadamard乘积得到IAM特征.

步骤213,标签提取

车辆位移记为disP(Δx,Δy),表示车辆在(t+Δt)时刻相对于t时刻的位移,如公式(21)所示。

disP(Δx,Δy)=P(x(t+Δt),y(t+Δt))-P(x(t),y(t)) (21)

坐标系与单位同定义3。

将获取的特征表示为定义的feature(t)向量,将获取的训练样本位移标签定义为label(t),其中t表示时间。采用min-max归一化方法对feature(t)和label(t)进行归一化处理,如公式(22)所示。

其中f表示特征点取值,fmax表示该特征点取值的最大值,fmin表示该特征点取值的最小值,fN表示归一化之后的特征点取值。归一化处理后的feature(t)和label(t)分别记为featureN(t)和labelN(t)。

步骤22,车辆位移预测模型

步骤221,训练样本集定义

前述预处理后的训练样本集记作train,包括训练样本特征集和训练样本标签集。训练样本标签采用位移标签。featureN(t)按照顺序拼接labelN(t)即是神经网络训练样本的结构。训练样本特征集记为train_x,训练样本标签集记为train_y,分别表示为公式(23)和公式(24)。

train_y与train_x按行一一对应。

步骤222,车辆位移预测模型训练

车辆位移预测模型训练步骤如下:

(4)基于全连接神经网络结构(全连接神经网络属于已有算法框架,但输入数据、网络层数、输出层结构由本发明定义),将训练样本集train_x作为输入量,利用前向传播算法(属已有算法)计算各层的激励值。

(5)利用学习所得的网络结构初始化全连接BP神经网络,在最后添加输出层,输出为车辆位移disP(Δx,Δy)。

(6)采用mini-batch梯度下降法(属已有算法),利用训练标签集train_y计算网络误差,反向传播,计算损失函数对权值矩阵和偏执项的梯度,微调每一层的网络参数,直至触发训练的终止条件。(计算方法属已有方法)

步骤3,车辆驾驶行为预测模型

步骤31,高斯分量定义

设定5种驾驶行为,即车辆直行,左转,右转,调头,原地不动,分别对应5个高斯分量。根据本发明对车辆位移的定义,每一个高斯分量均为二元高斯分布。

步骤32,高斯混合模型训练

步骤如下:

(4)对各个高斯分量的均值和协方差矩阵进行随机初始化,每个高斯分量的先验概率设为1/5。

(5)将训练样本位移标签集作为输入量,采用EM算法(属已有算法)对模型进行训练。

(6)得到各个高斯分量的权重,均值和协方差矩阵。

步骤4,车辆驾驶行为预测

(1)首先定义待预测样本特征集,记为test_x,其结构与训练样本特征集train_x相同。

(2)将待预测样本特征向量输入步骤2得到的位移预测模型,得到预测的位移。

(3)把预测所得的位移输入步骤3得到的驾驶行为预测模型,计算样本属于各个高斯分布的概率,概率最高的即为该样本预测所得驾驶行为。

本发明的有益效果

本发明采用机器学习技术,挖掘车辆自身属性、道路信息、行驶环境与驾驶行为之间的关系,提出车辆驾驶行为预测模型,达到提高车辆驾驶行为预测准确性的目的。

附图说明

图1道路区域划分示意图

图2全连接神经网络结构示意图

图3本发明方法流程图

具体实施方式

本发明的具体实施过程如图3所示,包括如下4个方面:

①车辆特征、道路特征、车辆行驶环境特征定义

②车辆位移预测模型

③车辆驾驶行为预测模型

④车辆驾驶行为预测方法

步骤1,定义特征集,包括车辆特征定义、道路特征定义、车辆行驶环境特征定义。

步骤11,车辆特征定义

车辆特征包括车身长度L,车身宽度W,车辆速度、加速度,当前行驶方向,路口转向动作,其中t时刻车辆速度、加速如分别标记为v(t)和a(t),其余特征分别定义如下:

定义1车辆行驶方向vDir(t),表示t时刻车辆运动方向,用与正北方向之间顺时针夹角表示,满足:

0≤vDir(t)<360° (7)

定义2车辆路口转向vMov(t),表示t时刻车辆在经过十字路口时的驾驶行为,以向量的形式表征,由于十字路口均不允许调头,目前考虑车辆直行、左转弯、右转弯的情况,如公式(2)。

定义3车辆当前位置P(t),表示t时刻车辆在CA State Plane III in NAD83坐标系中的二维坐标向量,向量各项单位为英尺(ft)。位置信息定义如下:

P(t)=(x(t),y(t)) (3)

CA State Plane III in NAD83坐标系为1983北美洲基准面(NAD)坐标系。

综上,t时刻车辆的特征集featurev(t)定义如下:

featurev(t)={L,W,v(t),a(t),vDir(t),vMov(t),P(t)} (4)

步骤12,道路特征定义

根据城市道路特点将其分为图1所示的三个部分,包括路口区,直行区和路口准备区。道路直行区距离下一个路口距离较远,道路用虚线标识,车辆可以自由变道。路口准备区临近十字路口或者丁字路口,道路用实线标识,车辆不能变换车道。车道有明确的路口转向限制,车辆只能在车道规定的限制内做路口转向。

将十字路口或丁字路口抽象为四边形,以其四个顶点坐标从西北方向的角开始按照顺时针方向依次标识,如图1所示,标记如下:

I=(x1,y1,x2,y2,x3,y3,x4,y4) (5)

定义4十字路口集合ISet表示研究区域内,所有十字路口组成的集合。

ISet=(I1,I2,...,Im,...) (6)

定义5道路段指道路在两个相邻十字路口之间的一个路段,由道路段两侧十字路口来标识该道路段。定义道路i的道路段集合如下:

RSegSet(i)=(I1I2,I2I3,...,IkIm,...) (7)

其中Ik(1≤k≤n,n为最大十字路口编号)表示编号为k的十字路口。

每条道路段包含若干车道,定义十字路口Ik,Im之间的道路段车道集合如下:

IkIm=(lid1,lid2,...,lidn) (8)

其中lidk(1≤k≤n)表示车道编号。

定义6车道方向lDir(x,y)表示车道允许的行进方向,其中x,y表示车道内的位置坐标。角度定义同vDir。车辆在当前车道直道的行驶方向vDir与车道方向相同,即若当前车辆处在i车道内,则有

vDir(t)=lDiri(x,y),其中(x,y)=P(t) (9)

定义7车道左侧可变道数量LAL(left available lanes)为在某车道当前位置下,车辆可向左变动的车道数目。由当前车道i的当前位置(x,y)向左侧同向车道搜索,直至遇到实线表示车辆不可向左变道或者搜索到最左侧同向车道为止。搜索到的车道数目即为车道左侧可变道数量LALi(x,y)。

定义8车道右侧可变道数量RAL(right available lanes)为在某车道当前位置下,车辆可向右变动的车道数目。由当前车道i的当前位置(x,y)向右侧同向车道搜索,直至遇到实线表示车辆不可向右变道或者搜索到最右侧同向车道为止。搜索到的车道数目即为车道右侧可变道数量RALi(x,y)。

定义9直行区车道允许驾驶行为包括直行,向左变道和向右变道。定义向量sld表示车道允许的基本驾驶行为如下:

直行区车道允许的驾驶行为SLD有

定义10路口准备区车道允许的驾驶行为包括直行,左转弯,右转弯和调头。定义向量pld表示车道允许的基本驾驶行为如下:

路口准备区车道允许的驾驶行为PLD可以表示为:

PLD(x,y)=β1(x,y)pldst+β2pldtl+β3pldtr+β4pldta+β5pldsp (13)

其中{β1,β2,β3,β4,β5|βi=0Vβi=1,1≤i≤5,i∈N}

βi为某种驾驶行为的概率系数,选中为1,否则为0。

综上,位置(x,y)处的道路特征集featurer(x,y)可以定义如下:

步骤13,车辆行驶环境定义

车辆行驶环境如车辆与前方路口距离,交通灯信号属性等对驾驶行为具有直接或者间接影响。

定义11路口距离,车辆i与前方十字路口Im距离表示以车辆i前边沿与当前车道前方十字路口停止线之间的距离。

定义12t时刻,交通灯TLi信号允许动作使用向量sigi(t)表示。

定义13车辆t时刻的路口允许转向动作表示为IAM(t)。该特征受制于车道允许的驾驶行为PLD和交通灯信号允许动作sigi(t)。表示为矩阵的Hadamard乘积,如公式(16)。

IAM(t)=PLD(P(t))*sigi(t) (16)

综上,t时刻车辆行驶环境特征集featuree(t)定义如下:

featuree(t)={VID(t),IAM(t)} (17)

综合步骤11,步骤12和步骤13,t时刻影响车辆驾驶行为的特征集feature(t)定义为

feature(t)=featurev(t)∪featurer(P(t))∪featuree(t) (18)

步骤2,车辆位移预测模型

城市道路中车辆驾驶行为受到车辆自身属性、行驶道路属性以及行驶环境属性等多种因素影响。本发明利用神经网络在挖掘高维非线性数据方面的优势,从多种影响车辆行驶行为的特征中训练出车辆位移预测网络模型。模型训练分为三部分:特征提取,数据预处理,位移预测网络训练。

步骤21,特征提取与数据预处理

直接获取的车辆特征包括车辆长度L,车辆宽度W,车辆速度v,车辆加速度a,车辆行驶方向vDir,车辆路口转向vMov,车辆当前位置。

直接获取的道路特征包括车道方向lDir,车道左侧可变道数量LAL,车道右侧可变道数量RAL,车道允许的驾驶行为SLD,路口准备区车道允许的驾驶行为PLD。

直接可获取十字路口集ISet,道路段集合RSegSet,交通灯信号允许的驾驶动作sig(t),每辆车所在的车道lane以及每辆车所在的道路段RSeg。

根据步骤1的定义,需要提取的特征包括车辆与前方十字路口距离VID,车辆路口允许转向动作IAM。由于本发明在利用机器学习技术训练时,采用有监督学习方式调整网络参数,还需要提取训练样本标签。

步骤211,车辆与前方路口距离特征提取

在地图上根据车辆所在车道lane以及车辆所在车道方向lDir获取该车道在前方十字路口处停止线AB两个端点的坐标,即A点坐标(xA,yA)和B点坐标(xB,yB)。从车辆前边缘向直线AB做垂线,求得垂线长度length。由于研究的数据集中道路近似直道,可以用length近似替代VID。

AB在二维坐标系中满足公式(19)。

(yA-yB)·x+(xB-xA)·y+(yB·xA-xB·yA)=0 (19)

假设此时车辆位置P(t)=(xC,yC),则车辆到停止线AB的距离length满足公式(20)。

对数据集中每辆车各时刻点的数据按照公式(20)进行计算,得到特征VID。

步骤212,路口允许转向动作特征提取

从数据集中获取十字路口信号灯随时间变化的表格,即对于任意十字路口Ii可以获取sigi(t)。从数据集中的地图车道标记中可以获取车道允许驾驶行为PLD。则IAM特征的提取按照定义13,依次找到每条车道对应的十字路口,然后对sig(t)和PLD做Hadamard乘积得到IAM特征.

步骤213,标签提取

车辆位移记为disP(Δx,Δy),表示车辆在(t+Δt)时刻相对于t时刻的位移,如公式(21)所示。

disP(Δx,Δy)=P(x(t+Δt),y(t+Δt))-P(x(t),y(t)) (21)

坐标系与单位同定义3。

将获取的特征表示为定义的feature(t)向量,将获取的训练样本位移标签定义为label(t),其中t表示时间。采用min-max归一化方法对feature(t)和label(t)进行归一化处理,如公式(22)所示。

其中f表示特征点取值,fmax表示该特征点取值的最大值,fmin表示该特征点取值的最小值,fN表示归一化之后的特征点取值。归一化处理后的feature(t)和label(t)分别记为featureN(t)和labelN(t)。

步骤22,车辆位移预测模型

步骤221,训练样本集定义

前述预处理后的训练样本集记作train,包括训练样本特征集和训练样本标签集。训练样本标签采用位移标签。featureN(t)按照顺序拼接labelN(t)即是神经网络训练样本的结构。训练样本特征集记为train_x,训练样本标签集记为train_y,分别表示为公式(23)和公式(24)。

train_y与train_x按行一一对应。

步骤222,车辆位移预测模型训练

本发明技术方案采用全连接神经网络训练位移预测模型,如图2所示,输入层接收形如featureN(t)的特征向量,网络层数4-10层,激活函数采用Relu函数,输出层为一个二维向量,即预测的车辆位移,定义同disP(Δx,Δy)。训练过程包括前向传播和反向传播。前向传播时先将train_x作为输入量,逐层训练。当前层训练结束后,将当前训练出来的隐层作为下一层的可见层继续训练。如此将输入层的数据通过隐藏层中的节点层层传输计算,一直传播到输出层,用最终的输出值和真实值作比较。如果前向传播最终计算出来的误差达不到期望值,则进入反向传播过程。反向传播基于mini-batch梯度下降法,首先利用训练标签集train_y计算网络误差,通过链式法则从后向前逐层求出误差函数对各权值的偏导数,即误差函数对权值的梯度,再结合设置的学习速度,计算出各权值的修改量。一次反向传播结束后,再通过前向传播计算误差,若误差达到期望值,则停止训练,否则继续下一轮的反向传播、前向传播过程,一直迭代下去,直至触发训练的终止条件为止。

车辆位移预测模型训练步骤如下:

(7)基于全连接神经网络结构,将训练样本集train_x作为输入量,利用前向传播算法计算各层的激励值。

(8)利用学习所得的网络结构初始化全连接BP神经网络,在最后添加输出层,输出为车辆位移disP(Δx,Δy)。

(9)采用mini-batch梯度下降法,利用训练标签集train_y计算网络误差,反向传播,计算损失函数对权值矩阵和偏执项的梯度,微调每一层的网络参数,直至触发训练的终止条件。

训练完成的车辆位移预测模型记为H(x)。x的定义同featureN(t),为归一化处理后的特征集。H(x)为预测的车辆位移,定义同disP(Δx,Δy)。

步骤3,车辆驾驶行为预测模型

本发明技术方案采用高斯混合模型,基于步骤2得到的车辆位移预测结果,对车辆驾驶行为进行聚类。

步骤31,高斯分量定义

设定5种驾驶行为,即车辆直行,左转,右转,调头,原地不动,分别对应5个高斯分量N1(μ1,∑1)~N5(μ5,∑5)。其中每一个高斯分量均为二元高斯分布,其均值为二维向量,协方差矩阵为大小为2x2的矩阵。

步骤32,高斯混合模型训练

步骤如下:

(7)对各个高斯分量的均值μ1、μ2、μ3、μ4、μ5和协方差矩阵∑1、∑2、∑3、∑4、∑5进行随机初始化,每个高斯分量的先验概率πi设为1/5,i=1,2,3,4,5。

(8)将训练样本位移标签集作为输入量,采用EM算法对模型进行训练。

(9)得到各个高斯分量的权重,均值和协方差矩阵。

模型训练完成后,计算样本属于某个高斯分布Ni的概率为

其中|∑i|表示∑i的行列式值,Σi-1表示Σi的逆矩阵。

步骤4,车辆驾驶行为预测

(1)首先定义待预测样本特征集,记为test_x,其结构与训练样本特征集train_x相同。

(2)将待预测样本特征集中的每一个特征向量featureN(t)输入步骤2得到的位移预测模型,得到预测的位移H(featureN(t))。

(3)把预测所得的位移H(featureN(t))输入步骤3得到的驾驶行为预测模型,计算样本属于各个高斯分布的概率Pi,概率最高的即为该样本预测所得驾驶行为,即样本预测所得驾驶行为

Ct∈{1、2、3、4、5},分别对应五种驾驶行为。

创新点

提出了一种基于机器学习的车辆驾驶行为预测方法,达到提升车辆驾驶行为预测准确性的目的。针对城市道路中复杂的交通环境,现有预测方法以车辆历史轨迹为主,或者辅以简单的路况信息,预测结果并不精确。本发明专利综合考虑了车辆自身属性、道路信息以及行驶环境信息,创新地将全连接神经网络和高斯混合模型进行组合,利用全连接神经网络解决回归问题的能力和高斯混合模型多类别聚类的能力,从提升车辆驾驶行为预测的准确性。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1