本发明涉及行程时间确定技术领域,特别是涉及一种基于马尔科夫链的路径行程时间确定方法及系统。
背景技术:
路径行程时间是衡量城市道路路径交通状态的最重要参考指标之一。一方面,路径行程时间为城市的交通管理者提供有效的交通信息,便于交通流的诱导与组织,保障安全畅通的交通环境。另一方面,出行者根据路径行程时间的预测值选择当前的最佳行驶路线,避开交通拥挤和事故发生路段,辅助出行决策。因此,路径行程时间估计对解决交通拥堵问题具有重要意义。
研究人员针对路径行程时间的估计进行了深入的研究,建立了许多模型。以数学方法、交通流模型理论、神经网络模型和机器学习理论为基础的预测已经取得了研究成果。(1)数学方法是最早用于行程时间预测的方法,基于已有的行程时间序列,建立时间序列模型、arima等模型进行预测。(2)基于交通流理论的路径行程时间预测方法引入了交通流三参数,流量、速度、占有率,并以此为基础建模识别行程时间的演化过程,预测路径行程时间。(3)神经网络模型构造一个由大量结点组成的复杂的网络系统,通过调整各节点之间的权重构造行程时间预测模型。上述研究多数是从时间或空间角度估计和预测路径行程时间,而如何考虑利用时空相关性推测下一阶段的行程时间分布依然是目前需要解决的难点问题。
技术实现要素:
基于此,本发明的目的是提供一种基于马尔科夫链的路径行程时间确定方法及系统,以提高总路径行程时间确定的准确性。
为实现上述目的,本发明提供了一种基于马尔科夫链的路径行程时间确定方法,所述方法包括:
确定各路段对应的行程时间;
以两个相邻路段的行程时间为一组,构成多个二维数组;
基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态;
基于马尔科夫理论确定各种路径交通状态下的路径状态概率;
基于卷积理论确定各种路径交通状态下的路径行程时间分布;
根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间。
可选的,所述基于马尔科夫理论确定各种路径交通状态下的路径状态概率,具体包括:
将两相邻路段聚类得到的路径交通状态按时间顺序排列,等量分成初始状态数据集和转移状态数据集;
根据所述初始状态数据集和所述转移状态数据集构建马尔可夫模型,获得马尔可夫链;
确定各所述马尔可夫链的状态转移概率;
确定两条马尔可夫链之间的连接概率;
根据所述状态转移概率和所述连接概率确定各种路径交通状态下的路径状态概率。
可选的,所述基于卷积理论确定各种路径交通状态下的路径行程时间分布,具体包括:
确定各路段对应的路段行程时间分布;
基于卷积理论,根据各路段对应的路段行程时间分布确定各种路径交通状态下的路径行程时间分布。
可选的,所述根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间,具体公式为:
其中,rttd为总路径行程时间,rttdq为第q种路径交通状态下的路径行程时间分布,rpq为第q种路径交通状态下的路径状态概率,q为路径交通状态的总种数。
本发明还提供一种基于马尔科夫链的路径行程时间确定系统,所述系统包括:
行程时间确定模块,用于确定各路段对应的行程时间;
二维数组确定模块,用于以两个相邻路段的行程时间为一组,构成多个二维数组;
路径交通状态确定模块,用于基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态;
路径状态概率确定模块,用于基于马尔科夫理论确定各种路径交通状态下的路径状态概率;
路径行程时间分布确定模块,用于基于卷积理论确定各种路径交通状态下的路径行程时间分布;
总路径行程时间确定模块,用于根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间。
可选的,所述路径状态概率确定模块,具体包括:
数据集确定单元,用于将两相邻路段聚类得到的路径交通状态按时间顺序排列,等量分成初始状态数据集和转移状态数据集;
马尔可夫链确定单元,用于根据所述初始状态数据集和所述转移状态数据集构建马尔可夫模型,获得马尔可夫链;
状态转移概率确定单元,用于确定各所述马尔可夫链的状态转移概率;
连接概率确定单元,用于确定两条马尔可夫链之间的连接概率;
路径状态概率确定单元,用于根据所述状态转移概率和所述连接概率确定各种路径交通状态下的路径状态概率。
可选的,所述路径行程时间分布确定模块,具体包括:
路段行程时间分布确定单元,用于确定各路段对应的路段行程时间分布;
路径行程时间分布确定单元,用于基于卷积理论,根据各路段对应的路段行程时间分布确定各种路径交通状态下的路径行程时间分布。
可选的,所述根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间,具体公式为:
其中,rttd为总路径行程时间,rttdq为第q种路径交通状态下的路径行程时间分布,rpq为第q种路径交通状态下的路径状态概率,q为路径交通状态的总种数。
根据本发明提供的具体实施例,本发明公开了以下技术效果:
本发明公开一种基于马尔科夫链的路径行程时间确定方法及系统,所述方法包括:确定各路段对应的行程时间;以两个相邻路段的行程时间为一组,构成多个二维数组;基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态;基于马尔科夫理论确定各种路径交通状态下的路径状态概率;基于卷积理论确定各种路径交通状态下的路径行程时间分布;根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间,进一步提高了总路径行程时间确定的准确性,实现对出行者进行有效的路径诱导,缓解交通压力,改善交通拥堵,助力城市治理。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例基于马尔科夫链的路径行程时间确定方法流程图;
图2为本发明实施例相邻路段行程示意图;
图3为本发明实施例混合高斯聚类图;
图4为本发明实施例基于马尔科夫链的路径行程时间确定系统结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明的目的是提供一种基于马尔科夫链的路径行程时间确定方法及系统,以提高总路径行程时间确定的准确性。
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
图1为本发明实施例基于马尔科夫链的路径行程时间确定方法流程图,如图1所示,本发明提供一种基于马尔科夫链的路径行程时间确定方法,所述方法包括:
步骤s1:确定各路段对应的行程时间;
步骤s2:以两个相邻路段的行程时间为一组,构成多个二维数组;
步骤s3:基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态;
步骤s4:基于马尔科夫理论确定各种路径交通状态下的路径状态概率;
步骤s5:基于卷积理论确定各种路径交通状态下的路径行程时间分布;
步骤s6:根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间。
下面对各个步骤进行详细论述:
步骤s1:确定各路段对应的行程时间,具体包括:
步骤s11:选取起始点和终止点;
步骤s12:城市道路以交叉口为划分点,高速公路或者城市快速路一般每1公里划分一个路段,对所述起始点和所述终止点之间的路径进行划分,获得多个路段;
步骤s13:确定各路段对应的行程时间。
步骤s2:以两个相邻路段的行程时间为一组,构成多个二维数组;图2为本发明实施例相邻路段行程示意图,按照图2中行驶获得的各路段行程时间如表1所示,其中tt表示行程时间,t表示采样时刻,n代表采样间隔总数。
步骤s3:所述基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态,具体包括:
步骤s31:确定初始的聚类数,通过em(expectation-maximizationalgorithm)最大期望算法获取混合高斯模型的相关参数,所述相关参数包括各分项混合高斯模型的均值与方差;在混合高斯模型中,每一个高斯模型代表一类交通状态,其均值与方差代表的是该类路径交通状态中行程时间的概率分布特征。
步骤s32:增加聚类数或路径交通状态数,重复上述过程,根据聚类结果计算采用不同聚类数或路径交通状态数的误差项平方和(sumofsquarederrors,简称sse)。
sse值的计算公式如下:
其中,k是聚类数,ck是第k类的聚类中心,x是属于类别k的相邻路段行程时间组成的二维数组。
步骤s33:选择最小sse值对应的聚类数作为最优聚类数,即路径交通状态;误差项平方和sse值越小说明聚类效果越好。
以图2中的路段1和路段2为例,即x=(tt1(t+n),tt2(t+n)),图3展示了基于相邻路段1和路段2的行程时间数据,在最优聚类数即交通状态数为3时的分类效果。每一个聚类可由分项高斯函数进行描述,其中均值与方差两个参数体现了各高斯函数的分布特征。
步骤s4:基于马尔科夫理论确定各种路径交通状态下的路径状态概率,具体包括:
步骤s41:将两相邻路段聚类得到的路径交通状态按时间顺序排列,等量分成初始状态数据集和转移状态数据集;
步骤s42:根据所述初始状态数据集和所述转移状态数据集构建马尔可夫模型,获得马尔可夫链;
步骤s43:确定各所述马尔可夫链的状态转移概率,具体公式为:
其中,
步骤s44:确定两条马尔可夫链之间的连接概率,具体公式为:
其中,xn(t)为时段t内第n条马尔可夫链的状态变量,
步骤s45:根据所述状态转移概率和所述连接概率确定各种路径交通状态下的路径状态概率,具体公式为:
其中,rpq为第q种路径交通状态下的路径状态概率,1≤q≤q,q为路径交通状态的总数,
步骤s5:基于卷积理论确定各种路径交通状态下的路径行程时间分布,具体包括:
步骤s51:确定各路段对应的路段行程时间分布,具体公式为:
其中,ttdn-1为初始状态数据为
步骤s52:基于卷积理论,根据各路段对应的路段行程时间分布确定各种路径交通状态下的路径行程时间分布,具体公式为:
rttdq=ttd1*ttd2*…*ttdn;
其中,rttdq为第q种路径交通状态下的路径行程时间分布,ttdn为第n个路段对应的路段行程时间分布,*为卷积公式。
步骤s6:根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间,具体公式为:
其中,rttd为总路径行程时间,rttdq为第q种路径交通状态下的路径行程时间分布,rpq为第q种路径交通状态下的路径状态概率,q为路径交通状态的总种数。
图4为本发明实施例基于马尔科夫链的路径行程时间确定系统结构图,如图4所示,本发明还提供一种基于马尔科夫链的路径行程时间确定系统,所述系统包括:
行程时间确定模块1,用于确定各路段对应的行程时间;
二维数组确定模块2,用于以两个相邻路段的行程时间为一组,构成多个二维数组;
路径交通状态确定模块3,用于基于混合高斯模型对所有二维数组进行聚类,获得路径交通状态;
路径状态概率确定模块4,用于基于马尔科夫理论确定各种路径交通状态下的路径状态概率;
路径行程时间分布确定模块5,用于基于卷积理论确定各种路径交通状态下的路径行程时间分布;
总路径行程时间确定模块6,用于根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间。
下面对各个模块进行详细论述:
所述行程时间确定模块1,具体包括:
选取单元,用于选取起始点和终止点;
路段确定单元,用于基于各微波检测器的位置对所述起始点和所述终止点之间的路径进行划分,获得多个路段;
历史速度检测单元,用于利用各所述微波检测器检测各路段对应的历史速度;
行程时间确定单元,用于根据各所述微波检测器获取的历史速度确定各路段对应的行程时间。
所述路径状态概率确定模块4,具体包括:
数据集确定单元,用于将两相邻路段聚类得到的路径交通状态按时间顺序排列,等量分成初始状态数据集和转移状态数据集;
马尔可夫链确定单元,用于根据所述初始状态数据集和所述转移状态数据集构建马尔可夫模型,获得马尔可夫链;
状态转移概率确定单元,用于确定各所述马尔可夫链的状态转移概率;
连接概率确定单元,用于确定两条马尔可夫链之间的连接概率;
路径状态概率确定单元,用于根据所述状态转移概率和所述连接概率确定各种路径交通状态下的路径状态概率。
所述路径行程时间分布确定模块5,具体包括:
路段行程时间分布确定单元,用于确定各路段对应的路段行程时间分布;
路径行程时间分布确定单元,用于基于卷积理论,根据各路段对应的路段行程时间分布确定各种路径交通状态下的路径行程时间分布。
所述根据各种路径交通状态下的路径状态概率和路径行程时间分布确定总路径行程时间,具体公式为:
其中,rttd为总路径行程时间,rttdq为第q种路径交通状态下的路径行程时间分布,rpq为第q种路径交通状态下的路径状态概率,q为路径交通状态的总种数。
本发明综合考虑路径行程时间的时空演化规律,通过利用混合高斯模型对二位数组进行分类,确定路径交通状态,在此基础上基于马尔科夫理论的描述相邻路段行程时间之间的相互关系,运用卷积理论估计路径的总行程时间分布,从而通过精准的总路径行程时间估计对出行者进行有效的路径诱导,缓解交通压力,改善交通拥堵,助力城市治理。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。