交通诱导统计模型校对方法及装置与流程

文档序号:15690498发布日期:2018-10-16 22:00阅读:240来源:国知局

本发明涉及智能交通技术领域,特别涉及一种交通诱导统计模型校对方法及装置。



背景技术:

交通诱导依托于电子、计算机、网络、移动通信等科技,根据出行者的出发点和目的地向出行者提供最优路径引导指令,或是通过获得实时交通信息帮助道路使用者找到一条从出发点到目的地的最优路径,然后通过诱导led屏将信息传递给出行者。交通诱导系统的信息准确率往往非常高,但是不同城市的私家车驾驶者有着各异的行为惯性,这也反映在对交通诱导的遵循程度的不同上。以美国传统大城市华盛顿或洛杉矶为例,大部分出行者习惯于长距离驾车通勤,对于自己熟悉的通勤路线也有着更高的行为惯性,这使得交通诱导的实际选择概率偏低。为了准确评估交通诱导的效果和可行性,需要建立交通诱导模型,来预测车辆驾驶人员遵循诱导改变走行路径的行为。

如图1所示,i-95和i-895为横跨巴尔的摩(baltimore)港口区的两条交通主干道。两条主干道在进入港口区前十公里处(图中a点所示)分隔开,然后在横跨海港之后再度汇合。由于跨海隧道车道窄限速低,所以极易发生交通拥堵,尤其是车流量偏大的i-95干道。所以交通管理部门在红点所示的分叉处设置了交通诱导显示屏,将车流从已经发生拥堵的路段引向较畅通的路段。

交通规划运营部门会使用数学模型对诱导成功率进行预测,从而分析交通诱导的实施效果。例如,一个通常会使用到的模型是基于效用最大化假设的logit模型。驾驶者n使用主路段(做出的选择cn标记为“+”)或诱导路段(做出的选择cn标记为“-”)的效用值un为该路段平均出行时间和出行时间标准差的函数:

其中,β0,β1,β2为模型参数。基于该模型,驾驶者选择接受诱导的预测概率为:

上述模型为进行诱导预测的一个简单模型实例。类似该logit模型,其他预测模型应用到实时交通诱导时,均会产生预测诱导概率pn(-),作为模型输出。这些模型通常由问卷调查数据、实验室模拟驾驶数据等建模标定,收集数据的情境和实际的交通诱导情境相差较大,而被调查者在问卷或实验室环境中的行为和实际驾驶行为也有明显偏差。这使得大部分预测模型的准确性在实际应用中大打折扣,例如前述的logit模型,应用在巴尔的摩港口区的交通诱导预测中,预测准确性非常低。具体如下表1:

表1

通过实测,可以看出交通诱导的实际诱导率不高。以诱导情况i为例,约10%的蓝牙监测器样本会选择从主路段换到诱导路段。我们基于已有的预测模型(公式(1)及公式(2)),组建模型预测模块,并采用常用于检测机器学习预测准确性的接收者操作特征曲线(receiveroperatingcurve,roc曲线)来检查logit模型的准确性。roc曲线越接近图表左上角表示准确性越高,曲线越接近右下角表示准确性越低。如图2所示,logit模型的准确性较低,甚至低于随机猜测曲线。该模型预测了较多的假正类(falsepositives,fp),意味着模型对交通诱导的预测偏乐观,把大部分不接受诱导的驾驶者预测成了接受诱导。

上述交通诱导模型预测准确率较低,亟待提出一种能提升交通诱导模型预测准确率的方法及模型。



技术实现要素:

有鉴于此,本发明旨在提供一种交通诱导统计模型校对方法,以期提升交通诱导模型预测准确率。

具体而言,本发明一种交通诱导统计模型校对方法,包括步骤:基于预设的交通诱导统计模型,组建模型预测模块;获取车辆的实测路段信息,所属实测路段信息包括车辆的标识信息、对路径的选择信息以及出行时间信息;将所述实测路段信息中的出行时间信息输入至所述模型预测模块,得到模型预测值;根据所述模型预测值以及所述实测路段信息,构建贝叶斯校正模型,得到校正预测值。

进一步地,所述根据所述模型预测值以及所述实测路段信息,构建贝叶斯校正模型,得到校正预测值的步骤包括:将所述模型预测值变换为对数发生比;根据对路径的选择信息,分为拒绝诱导的第一组群以及接受诱导的第二组群;将所述第一组群及第二组群的对数发生比根据预设的统计分布模型分别拟合得到第一似然值及第二似然值;根据所述第一似然值以及预设的拒绝诱导的先验概率,组建第一贝叶斯方程,计算得到校正后的拒绝诱导的第一后验概率;根据所述第二似然值以及预设的接受诱导的先验概率,组建第二贝叶斯方程,计算得到校正后的接受诱导的第二后验概率;所述校正预测值包括所述第一后验概率及第二后验概率。

进一步地,所述将所述模型预测值变换为对数发生比的步骤具体包括:根据如下公式计算得到对数发生比s:

其中,e为所述实测路段信息,p(+|e)为运用所述模型预测模块得到的拒绝诱导的模型预测值,p(-|e)为运用所述模型预测模块得到的接受诱导的模型预测值。

进一步地,所述预设的统计分布模型包括正态分布或广义极值分布。

进一步地,所述第一贝叶斯方程为:

其中,p(s|+)为所述第一似然值,p(+)为预设的拒绝诱导的先验概率;c为所有拒绝诱导及接受诱导的样本;∑c∈{+,-}p(c)·p(s|c)为所有拒绝诱导及接受诱导的样本的先验概率及对应似然值的乘积之和;

所述第二贝叶斯方程为:

其中,p(s|-)为所述第二似然值,p(-)为预设的接受诱导的先验概率。

进一步地,在所述计算得到校正后的接受诱导的第二后验概率的步骤之后还包括:

根据各个样本的所述校正预测值计算对应的对数损失函数,具体计算方式为:

logloss=δ(c,+)logp(+|s)+δ(c,-)logp(-|s)

其中,logloss为对数损失函数,δ函数值等于1;

根据各个样本的所述校正预测值计算对应的方差,具体计算方式为:

se=δ(c,+)(1-p(+|s))2+δ(c,-)(1-p(-|s))2

其中,se为方差,δ函数值等于1。

进一步地,在所述根据所述校正预测值计算方差的步骤之后还包括:根据各个样本的总的对数损失函数,计算每个样本的平均对数损失函数;根据各个样本的总的方差,计算每个样本的平均方差。

具体而言,本发明还提供一种交通诱导统计模型校对装置,包括:信息获取模块,用于获取车辆的实测路段信息,所属实测路段信息包括车辆的标识信息、对路径的选择信息以及出行时间信息;模型预测模块,用于基于预设的交通诱导统计模型组建,并根据所述实测路段信息中的出行时间信息,得到模型预测值;贝叶斯校正模块,用于根据所述模型预测值以及所述实测路段信息,构建贝叶斯校正模型,得到校正预测值。

进一步地,所述贝叶斯校正模块包括:转换单元,用于将所述模型预测值变换为对数发生比;拟合单元,用于根据对路径的选择信息,分为拒绝诱导的第一组群以及接受诱导的第二组群;将所述第一组群及第二组群的对数发生比根据预设的统计分布模型分别拟合得到第一似然值及第二似然值;贝叶斯校正单元,用于根据所述第一似然值以及预设的拒绝诱导的先验概率,组建第一贝叶斯方程,计算得到校正后的拒绝诱导的第一后验概率;根据所述第二似然值以及预设的接受诱导的先验概率,组建第二贝叶斯方程,计算得到校正后的接受诱导的第二后验概率;所述校正预测值包括所述第一后验概率及第二后验概率。

进一步地,所述转换单元具体用于根据如下公式计算得到对数发生比s:

其中,e为所述实测路段信息,p(+|e)为运用所述模型预测模块得到的拒绝诱导的模型预测值,p(-|e)为运用所述模型预测模块得到的接受诱导的模型预测值。

进一步地,所述第一贝叶斯方程为:

其中,p(s|+)为所述第一似然值,p(+)为预设的拒绝诱导的先验概率;c为所有拒绝诱导及接受诱导的样本;∑c∈{+,-}p(c)·p(s|c)为所有拒绝诱导及接受诱导的样本的先验概率及对应似然值的乘积之和;

所述第二贝叶斯方程为:

其中,p(s|-)为所述第二似然值,p(-)为预设的接受诱导的先验概率。

进一步地,所述的交通诱导统计模型校对装置还包括:

评估模块,用于根据各个样本的所述校正预测值计算对应的对数损失函数,具体计算方式为:

logloss=δ(c,+)logp(+|s)+δ(c,-)logp(-|s)

其中,logloss为对数损失函数,δ函数值等于1;

根据各个样本的所述校正预测值计算对应的方差,具体计算方式为:

se=δ(c,+)(1-p(+|s))2+δ(c,-)(1-p(1-|s))2

其中,se为方差,δ函数值等于1。

进一步地,所述评估模块还用于:根据各个样本的总的对数损失函数,计算每个样本的平均对数损失函数;根据各个样本的总的方差,计算每个样本的平均方差。

本发明的交通诱导统计模型校对方法及装置,对常见诱导模型的模型输出(即诱导概率)进行有效地校正,具体地通过构建贝叶斯校正模型,得到校正预测值,极为有效地提升了模型对交通诱导行为的预测精度,并可以广泛地运用于各类交通预测中。

附图说明

并入到说明书中并且构成说明书的一部分的附图示出了本发明的实施例,并且与描述一起用于解释本发明的原理。在这些附图中,类似的附图标记用于表示类似的要素。下面描述中的附图是本发明的一些实施例,而不是全部实施例。对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据这些附图获得其他的附图。

图1为现有技术中导航地图的示意图;

图2为现有技术的诱导模型预测值的准确性评估结果示意图;

图3为本发明实施例提供的一种交通诱导统计模型校对方法的流程示意图;

图4为本发明实施例提供的接受诱导样本和拒绝诱导样本的预测模型对数发生比的拟合曲线;

图5为本发明实施例提供的各样本的校正预测值的准确性评估结果示意图;

图6为本发明实施例提供的一种交通诱导统计模型校对装置的结构框图;

图7为图6所示装置的工作原理图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。

下面结合附图详细说明本发明实施涉及的交通诱导统计模型校对方法及系统。

参见图3所示,本发明实施例提供的一种交通诱导统计模型校对方法包括步骤:

第一步:基于预设的交通诱导统计模型,组建模型预测模块;该预设的交通诱导统计模型的选择可以有多种,比如现有的多项logit,朴素贝叶斯模型等等,在此不做限定。

第二步:获取车辆的实测路段信息,所属实测路段信息包括车辆的标识信息、对路径的选择信息以及出行时间信息;具体可以通过交通线圈、蓝牙监测设备、或者cctv录像监控设备获取平时及交通诱导发生时各路段的路面交通情况,并对车辆信息进行采集和处理。本发明实施例采用蓝牙监测。信息获取后,将信息转化为车辆驾驶者id,每个车辆样本的实际走行时间,和驾驶者基于交通诱导的路径选择。

第三步:将所述实测路段信息中的出行时间信息输入至所述模型预测模块,得到模型预测值;当然具体操作时,可以根据第二步中实测得到的的驾驶者路径选择,评估模型预测值的准确性;

第四步:根据所述模型预测值以及所述实测路段信息(包括驾驶者基于交通诱导的路径选择),构建贝叶斯校正模型,得到校正预测值。

具体操作时,第四步可以包括:

首先,将所述模型预测值变换为对数发生比;具体地,根据如下公式计算得到对数发生比s:

其中,e为所述实测路段信息,p(+|e)为运用所述模型预测模块得到的拒绝诱导的模型预测值,p(-|e)为运用所述模型预测模块得到的接受诱导的模型预测值;

其次,根据对路径的选择信息,分为拒绝诱导的第一组群以及接受诱导的第二组群;

再次,将所述第一组群及第二组群的对数发生比根据预设的统计分布模型分别拟合得到第一似然值及第二似然值;例如,图4为使用正态分布和广义极值分布拟合实测数据得到的曲线。

最后,根据所述第一似然值以及预设的拒绝诱导的先验概率,组建第一贝叶斯方程,计算得到校正后的拒绝诱导的第一后验概率;根据所述第二似然值以及预设的接受诱导的先验概率,组建第二贝叶斯方程,计算得到校正后的接受诱导的第二后验概率;所述校正预测值包括所述第一后验概率及第二后验概率。

具体操作时,所述预设的统计分布模型包括正态分布或广义极值分布。

进一步地,所述第一贝叶斯方程为:

其中,p(s|+)为所述第一似然值,p(+)为预设的拒绝诱导的先验概率;c为所有拒绝诱导及接受诱导的样本;∑c∈{+,-}p(c)·p(s|c)为所有拒绝诱导及接受诱导的样本的先验概率及对应似然值的乘积之和;

所述第二贝叶斯方程为:

其中,p(s|-)为所述第二似然值,p(-)为预设的接受诱导的先验概率。

优选地,在所述计算得到校正后的接受诱导的第二后验概率的步骤之后还包括:

根据各个样本的所述校正预测值计算对应的对数损失函数,具体计算方式为:

logloss=δ(c,+)logp(+|s)+δ(c,-)logp(-|s)

其中,logloss为对数损失函数,δ函数值等于1;

根据各个样本的所述校正预测值计算对应的方差,具体计算方式为:

se=δ(c,+)(1-p(+|s))2+δ(c,-)(1-p(-|s))2

其中,se为方差,δ函数值等于1。

进一步优选地,在所述根据所述校正预测值计算方差的步骤之后还包括:

根据各个样本的总的对数损失函数,计算每个样本的平均对数损失函数;

根据各个样本的总的方差,计算每个样本的平均方差。

以图2所示的数据为例,模型预测值经校正后的评价指标如下表2所示。可以看出,相比于表1,贝叶斯校正显著提升了模型预测的准确性,预测准确度从低于60%提升到高于90%。各类预测统计指标也得到了大幅改善。

表2

此外,经本方法校正之后,模型预测的roc曲线如图5所示,相比校正前的模型的roc曲线(图2)而言,有了大幅的提升。

本实施例通过建立一套交通诱导模型校对方法,对常见诱导模型的模型输出(即诱导概率)进行有效地校正,具体地通过构建贝叶斯校正模型,得到校正预测值,极为有效地提升了模型对交通诱导行为的预测精度,并可以广泛地运用于各类交通预测中。本发明为提高交通运营管理的效率提供了新的理论支持。

参见如图6所示,本发明实施例提供的一种交通诱导统计模型校对装置为图3所示方法对应的装置,图3-图5所示的解释说明可以应用于本实施例,具体地,该装置包括:信息获取模块601、模型预测模块603及贝叶斯校正模块605。其中,获取模块601,用于获取车辆的实测路段信息,所属实测路段信息包括车辆的标识信息、对路径的选择信息以及出行时间信息。

具体操作时,该数据可以通过视频监控、蓝牙监测、线圈检测等方式获得。如本发明实施例可以在图2所示的在主路段和诱导路段设置蓝牙监测器,用来收集路段的实际走行时间以及出行者的路径选择。监测器可以监测出通过仪器一定半径范围内(通常为300英尺,约90米)的蓝牙设备,包括车载蓝牙、手机蓝牙等等,并记录蓝牙设备的机器id(machineaccesscontrolid,macid)及当前时间。与之对应,诱导屏幕数据则可从当地交管部门获取。通过一段时间的持续监测,可以标识出长期通过两条路段的蓝牙机器id,并获取在交通诱导发生时这些机器id所使用的路段,这个信息即蓝牙机器持有者在诱导影响下的实际路径选择行为。

模型预测模块603,用于基于预设的交通诱导统计模型组建,并根据所述实测路段信息中的出行时间信息,得到模型预测值。

贝叶斯校正模块605,用于根据所述模型预测值以及所述实测路段信息,构建贝叶斯校正模型,得到校正预测值。

具体地,所述贝叶斯校正模块605包括:

转换单元605a,用于将所述模型预测值变换为对数发生比;

拟合单元605b,用于根据对路径的选择信息,分为拒绝诱导的第一组群以及接受诱导的第二组群;将所述第一组群及第二组群的对数发生比根据预设的统计分布模型分别拟合得到第一似然值及第二似然值;

贝叶斯校正单元605c,用于根据所述第一似然值以及预设的拒绝诱导的先验概率,组建第一贝叶斯方程,计算得到校正后的拒绝诱导的第一后验概率;根据所述第二似然值以及预设的接受诱导的先验概率,组建第二贝叶斯方程,计算得到校正后的接受诱导的第二后验概率;所述校正预测值包括所述第一后验概率及第二后验概率。

优选地,所述转换单元605a具体用于根据如下公式计算得到对数发生比s:

其中,e为所述实测路段信息,p(+|e)为运用所述模型预测模块得到的拒绝诱导的模型预测值,p(-|e)为运用所述模型预测模块得到的接受诱导的模型预测值。

优选地,所述第一贝叶斯方程为:

其中,p(s|+)为所述第一似然值,p(+)为预设的拒绝诱导的先验概率;c为所有拒绝诱导及接受诱导的样本;∑c∈{+,-}p(c)·p(s|c)为所有拒绝诱导及接受诱导的样本的先验概率及对应似然值的乘积之和;

所述第二贝叶斯方程为:

其中,p(s|-)为所述第二似然值,p(-)为预设的接受诱导的先验概率。

优选地,所述的交通诱导统计模型校对装置还包括:

评估模块607,用于根据各个样本的所述校正预测值计算对应的对数损失函数,具体计算方式为:

logloss=δ(c,+)logp(+|s)+δ(c,-)logp(-|s)

其中,logloss为对数损失函数,δ函数值等于1;

根据各个样本的所述校正预测值计算对应的方差,具体计算方式为:

se=δ(c,+)(1-p(+|s))2+δ(c,-)(1-p(-|s))2

其中,se为方差,δ函数值等于1。

进一步优选地,所述评估模块还用于:根据各个样本的总的对数损失函数,计算每个样本的平均对数损失函数;根据各个样本的总的方差,计算每个样本的平均方差。

如图7所示,交通诱导统计模型校对装置的工作原理具体如下:实测数据用e表示。基于e,运用预测模型(公式2)会得到接受交通诱导和拒绝交通诱导的概率:p(+|e),p(-|e)。本实施例将概率变换为对数发生比(log-odds),记为s。对数发生比s也被称作是置信分数(confidencescore),转换后,模型预测结果从分布于[0,1]区间的概率值变换为了分布在[-∞,+∞]的对数发生比。这样有助于构建贝叶斯校正模型中的概率分布函数。

s越大,表示预测模型更倾向于预测拒绝诱导。对数发生比完全基于预测模型,它和实际观测到的驾驶员行为可能存在偏差。本发明方法通过应用贝叶斯法将s映射到更准确的后验概率分布。针对接受诱导(“-”)和拒绝诱导(“+”)的组群,s的条件分布可以分别拟合统计分布模型得出似然值:p(s|+),p(s|-)。例如,图4实例为使用正态分布和广义极值分布拟合实测数据得到的曲线。贝叶斯校正过程即针对选择接受诱导(“-”)和拒绝诱导(“+”)的组群,分别建立贝叶斯方程(公式(4),(5))得出经过校正的后验概率。公式中,p(+)和p(-)为采集自信息模块的先验概率。

本实施例还可以采用广泛应用于机器学习模型的评价指标:对数损失函数(logloss)和方差(squarederror,se)来量化本发明方法对预测准确性的提升。计算方法见公式(6),(7)。同时,将对数损失函数、方差的总和分别平均到每一个样本,可以得到平均对数损失和平均方差。

logloss=δ(c,+)logp(+|s)+δ(c,-)logp(-|s)(6)

se=δ(c,+)(1-p(+|s))2+δ(c,-)(1-p(-|s))2(7)

其中δ函数值等于1,如果该函数的两个参数相等。

本实施例通过对常见诱导模型的模型输出(即诱导概率)进行有效地校正,具体地通过构建贝叶斯校正模型,得到校正预测值,极为有效地提升了模型对交通诱导行为的预测精度,并可以广泛地运用于各类交通预测中。

本领域普通技术人员可以理解,实现上述实施例的全部或者部分步骤/单元/模块可以通过程序指令相关的硬件来完成,前述程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述实施例各单元中对应的步骤;而前述的存储介质包括:rom、ram、磁碟或者光碟等各种可以存储程序代码的介质。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1