基于轨迹数据的OD需求提取及其可靠性分析方法与流程

文档序号：16692818发布日期：2019-01-22 19:05阅读：557来源：国知局

本发明涉及一种基于轨迹数据的od需求提取及其可靠性分析方法。

背景技术：

车辆起-讫点(origin-destination，简称od)流量作为道路交通管控的重要数据依据以及各种中微观交通模型及仿真平台的重要输入参数，od流量的估计问题已逐渐发展为交通领域中的一个重要研究内容。随着智能交通运输系统的快速发展，现代交通运营与管控更加强调精细化、实时性，因此基于路段流量观测值的动态车流od估计已经成为了起讫点流量估计问题中的研究重点。

随着gps定位技术及视频车牌识别技术在道路交通检测中的大规模应用，突破了传统以线圈车检器、微波车检器为代表的“断面型”车检器智能获得交通流三参数的信息，可以获得车辆较为完整的行驶轨迹信息。但由于视频号牌识别技术受限于设备在路网上的覆盖以及设备识别率的影响，未能获得车辆较为完整的行驶轨迹信息，因此需要基于gps数据和视频车牌识别数据进行轨迹分析，得到完整的可观测od点对之间的动态需求量。

同时针对现阶段od可观测需求直接用于估计的情况，应该对观测得到的od需求数值进行合理性分析和数据扩样，从而为路网动态od提供合理化支撑数据。

技术实现要素：

本发明的目的是提供一种基于轨迹数据的od需求提取及其可靠性分析方法解决现有技术中存在的如何基于gps数据和视频车牌识别数据进行轨迹分析，得到完整的可观测od点对之间的动态需求量的问题。

本发明的技术解决方案是：

一种基于轨迹数据的od需求提取及其可靠性分析方法，包括以下步骤，

s1、基于出租车gps定位数据进行空间聚类分析，划分出路网级的交通小区；

s2、基于视频车牌识别设备和车载gps定位设备，提取确定出各交通小区的可观测的动态od需求；

s3、采用历史数据基于概率统计学的方法对步骤s2中提取出的可观测的动态od需求样本数据的可靠性进行分析。

进一步地，步骤s1具体为，

s11、选取出租车车辆为研究对象，提取出设定范围内所有出租车营运车辆的gps数据，确定乘客上下车位置信息；

s12、基于最近邻距离对空间异常位置进行识别与剔除，将每一个空间点映射到相应的栅格单元中，利用arcgis数据空间分析工具，采用全局莫兰指数对空间的自相关性进行描述，对具有统计显著性的高值即热点和低值即冷点进行空间聚类统计，得到出租车乘客上下车冷热点区域；

s13、结合s12步骤得到的上下车冷热点区域以及路网拓扑结构和土地利用性质，构建出路网级的交通小区。

进一步地，步骤s11具体为，依据车载gps设备记录的车辆在运营时段内实时位置信息，车辆的轨迹是将这些位置信息按时间排列序列所形成的时间序列traj＝{p1，p2，…，pi，…，pn}，其中pi＝(lngi，lati，ti)，lngi表示车辆在第i个位置时的经度，lati表示车辆在第i个位置时的纬度，ti表示车辆在第i个位置时的时刻；同时将出租车的载客状态由“空载”变为“载客”时即为该乘客本次出行开始，乘客的上车位置为“空载”时的车辆位置，将车辆状态由“载客”转变为“空载”状态时作为该乘客本次出行结束，乘客的下车位置为“载客”时的车辆位置。

进一步地，步骤s2具体为，

s21、基于视频车牌识别数据提取出可观测的动态od需求；

s22、基于gps轨迹数据提取出完整的行驶轨迹，确定可观测的动态od需求；

s23、确定车牌识别数据中的车辆记录及记过视频车牌识别设备但未识别的车辆，基于时空关系剔除出重复记录部分，合并各交通小区可观测的动态od需求。

进一步地，步骤s21具体为，提取路网中安装在道路上的视频车牌识别设备抓拍到的过车记录，根据捕捉识别出时相应设备位置信息按时间序列排列得到车辆在路网上的行驶轨迹，并根据s1步骤中划分的交通小区，采用号牌匹配算法对视频车牌识别数据进行处理，得到相应的交通小区之间的动态车流需求量。

进一步地，步骤s22具体为，基于车辆车载定位设备提取出车辆的gps数据，并通过地图匹配技术将gps定位点映射到实际道路网中，进一步根据各交通小区对应的路段确定响应的动态od需求。

进一步地，步骤s23具体为，将视频车牌识别设备位置对应到实际道路网中，基于视频车牌识别设备的位置信息确定出经过相应视频车牌识别设备的车辆记录，并根据gps轨迹信息确定起讫点；同时基于车辆号牌信息依据视频车牌匹配的结果，从对应位置的视频车牌识别记录中识别出车辆号牌，从而得到gps轨迹中被视频车牌识别所记录的车牌记录，即剔除重复记录部分。

进一步地，步骤s3具体为，

s31、针对样本od可被不同概率分布模型进行拟合假设情况，采用混合概率分布模型对获取的可观测的动态od需求进行拟合，并采用k-s检验对所拟合出的概率分布的有效性进行分析，同时针对混合概率中的参数估计问题，采用em算法进行相应的参数估计，从而得到拟合的概率分布函数的参数；

s32、在得到样本数据概率分布模型的基础上，通过能够描述样本数据特性的各种统计参数的分析，来检验基于不同概率分布模型所得到的相关统计量是否一致，即分析样本数据的统计特性是否对不同的概率分布模型敏感，以此来检验样本数据的可靠性。

进一步地，步骤s31中，混合概率分布模型的形式及其数据表达和统计参数如下：

式中，x是样本数据，μ，σ，α，β均为相应的概率参数；wi为混合概率分布中第i个组分的权重值。

进一步地，步骤s32具体为，对基于不同概率分布的三种基础的统计量进行分析与比较—包括一阶中心距μ⁽¹⁾即均值、二阶中心距μ⁽²⁾即方差、三阶中心距μ⁽³⁾以及偏度，检验其相互之间是否存在显著性的差异；其中各统计量的计算公式如下：

式中，k为混合概率分布中的混合成分数目；为混合概率分布中第i个组分的k阶中心距；wi为混合概率分布中第i个组分权重。

本发明的有益效果是：

一、该种基于轨迹数据的od需求提取及其可靠性分析方法，在对交通小区划分的基础上，根据gps定位数据和视频号牌识别数据提取出动态od需求，并依托概率统计学的方法对历史样本数据进行可靠性分析，从而为动态od估计提供了准确的动态od可观测需求数值，提高了动态od估计的准确性，提升了估计的精准度。

二、对比现阶段交通小区的划分，本发明将路段虚拟为交通小区，借助arcgis软件中的空间数据分析工具对所选区域内出租车乘客上下热点位置进行分析，对比传统gps轨迹数据聚类分析算法，得到了更为精细的热点区域，划分了更精细的交通小区。

三、针对现阶段用号牌识别数据进行预测规划管理的现状，该种基于轨迹数据的od需求提取及其可靠性分析方法，将号牌识别数据与车辆gps数据进行有效整合，避免了号牌识别设备未能覆盖全路网及gps数据存在偏差等问题，大大提高了动态od估计的准确性，为交通仿真的od估计预测提供了有效支撑。

四、该种基于轨迹数据的od需求提取及其可靠性分析方法，提出将可观测的动态od需求样本数据进行合理性分析，并基于混合概率模型的分布拟合和样本数据的敏感性分析对样本数据进行分析，针对现阶段动态od将样本数据直接用于预测的情况，增设了合理性分析这一步骤，提高了可观测的动态od需求的准确性。

附图说明

图1是本发明实施例基于轨迹数据的od需求提取及其可靠性分析方法的结构示意图。

图2是实施例中具体示例的出租车乘客上下车冷热点分布图。

图3是将实施例中某区域划分为交通小区的说明示意图。

图4是实施例中不同od点对之间的需求观测值变化趋势的示意图。

图5是实施例中case1和case2两种拟合的对数似然函数值(loglikelihood)、赤池信息量准则(akaikeinformationcriterion，aic)以及贝叶斯信息准则(bayesianinformationcriterion，bic)的对比示意图。

图6是实施例中case1和case2的情况下各统计量在不同混合数目k下的变化情况。

具体实施方式

下面结合附图详细说明本发明的优选实施例。

实施例

实施例的一种基于轨迹数据的od需求提取及其可靠性分析方法，基于出租车gps定位数据进行空间聚类分析，划分出路网级的交通小区，进一步根据gps定位数据和号牌识别设备数据提取出可观测的od需求，进一步对可观测od需求样本数据进行合理性分析和“扩样”，从而为动态od需求估计提供有效支撑，提高了动态od估计的准确性和合理性。

一种基于轨迹数据的od需求提取及其可靠性分析方法，包括以下步骤：

s1.基于出租车gps定位数据进行空间聚类分析，划分出路网级的交通小区。

s11.选取出租车车辆为研究对象，提取出范围内所有出租车营运车辆的gps数据，确定乘客上下车位置信息。

一般情况下，由于车载gps设备记录的是车辆在运营时段内实时位置信息，则车辆的轨迹是将这些位置信息按时间排列序列所形成的时间序列traj＝{p1，p2，…，pi，…，pn}。其中pi＝(lngi，lati，ti)，lngi表示车辆在第i个位置时的经度，lati表示车辆在第i个位置时的纬度，ti表示车辆在第i个位置时的时刻。同时将出租车的载客状态由“空载”变为“载客”时即为该乘客本次出行开始，乘客的上车位置为“空载”时的车辆位置，将车辆状态由“载客”转变为“空载”状态时作为该乘客本次出行结束，乘客的下车位置为“载客”时的车辆位置。

s12.基于最近邻距离对空间异常位置进行识别与剔除，将每一个空间点映射到相应的栅格单元中，从而利用arcgis数据空间分析工具，采用全局莫兰指数(globalmoran'si)对空间的自相关性进行描述，对具有统计显著性的高值(热点)和低值(冷点)进行空间聚类统计，得到出租车乘客上下车冷热点区域；

s13.结合出行热点区域、路网拓扑结构和土地利用性质构建出路网级交通小区。

s2.基于视频车牌识别设备和车载gps定位设备，提取确定出可观测的动态od需求。

s21.基于视频车牌识别数据提取出可观测的动态od需求。

具体来说，提取路网中安装在道路上的视频车牌识别设备(电子警察或智能卡口)抓拍到的过车记录，根据捕捉识别出时相应设备位置信息按时间序列排列得到车辆在路网上的行驶轨迹，并根据s1步骤中划分的交通小区，采用号牌匹配算法对视频车牌识别数据进行处理，得到相应的交通小区之间的动态车流需求量。

一般情况下，视频车牌识别设备未能覆盖到路网各个区域，只能获得某一辆车在某一段时间内在到路网上经过一系列交叉口的情况，因此采用时间阈值法定义一次有效合理的车辆出行行为(若相邻点之间时间间隔过大，则无效)。同时将整个路段定义为虚拟的交通小区，将紧邻交通小区的流出路网下一个交叉口进口道处的视频车牌识别设备定义为小区的终点设备，与交通小区直接相邻且进入路网的交叉口进口道位置的设备定义为该小区的起始设备，从而得到动态车流od需求。

s22.基于gps轨迹数据提取出完整的行驶轨迹，确定可观测的动态od需求。

具体来说，基于车辆车载定位设备提取出车辆的gps数据，并通过地图匹配技术将gps定位点映射到实际道路网中，进一步根据各交通小区对应的路段确定响应的动态od需求。

一般情况下，考虑到上下车位置集中靠近无法确定真实起终点位置所在交通小区，将基于设置的交通小区将在地理位置上对应的路段映射到具体的交通小区上，作为提取对应od点对之间需求量的依据，同时在提取可观测od需求时将每一次的乘客出行轨迹作为一个完整的出行链进行处理。

s23.确定车牌识别数据中的车辆记录及记过视频车牌识别设备但未识别的车辆，基于时空关系剔除出重复记录部分，合并可观测od需求。

具体来说，将视频车牌识别设备位置对应到实际道路网中，基于视频车牌识别设备的位置信息确定出经过相应视频车牌识别设备的车辆记录，并根据gps轨迹信息确定起讫点；同时基于车辆号牌信息依据视频车牌匹配的结果，从对应位置的视频车牌识别记录中识别出车辆号牌，从而得到gps轨迹中被视频车牌识别所记录的车牌记录，即剔除重复记录部分。

s3.采用历史数据基于概率统计学的方法对步骤s2中提取出的可观测od需求样本数据的可靠性进行分析。

s31.针对样本od可被不同概率分布模型进行拟合假设情况，采用混合概率分布模型对获取的可观测od需求进行拟合，并采用k-s检验对所拟合出的概率分布的有效性进行分析，同时针对混合概率中的参数估计问题，采用em(expectationmaximizationalgorithm)算法进行相应的参数估计，从而得到拟合的概率分布函数的参数。

一般情况下，常见的混合概率分布模型的形式及其详细的数据表达和统计参数如下表，式中，x是样本数据，μ，σ，α，β均为相应的概率参数；wi为混合概率分布中第i个组分的权重值：

s32.在得到样本数据概率分布模型的基础上，通过能够描述样本数据特性的各种统计参数的分析，来检验基于不同概率分布模型所得到的相关统计量是否一致，即分析样本数据的统计特性是否对不同的概率分布模型敏感，以此来检验样本数据的可靠性。

具体来说，对基于不同概率分布的三种基础的统计量进行分析与比较—包括一阶中心距μ⁽¹⁾(即均值)、二阶中心距μ⁽²⁾(方差)、三阶中心距μ⁽³⁾以及偏度，检验其相互之间是否存在显著性的差异。

其中各统计量的计算公式如下：

式中，k为混合概率分布中的混合成分数目；为混合概率分布中第i个组分的k阶中心距；wi为混合概率分布中第i个组分权重。

实施例的一个具体示例如下：

选取某市某区域为研究对象，提取出租车gps数据，并按时间和号牌排序，确定出行轨迹及乘客上下车信息，进一步将gps数据导出arcgis，依据空间分析工具得到出租车乘客上下车冷热点分布图如图2。

结合路网拓扑结构、视频车牌识别设备位置、出租车上下客热点区域以及区域用地性质将该区域内划分35个交通小区，如图3。

将一天划分为96个时段，每个时段均为15分钟，通过python软件编写具体的车牌匹配算法，给出了依据视频车牌识别数据得到od点对之间的动态需求观测值。部分od观测值如下：

进一步基于s1步骤设置的交通小区，将提取的可观测od需求映射到具体小区上，并采用python语言编写相应算法进行gps数据可观测od需求的提取。部分od观测值如下：

进一步，对某日基于视频车牌识别数据(alpr)、出租车gps数据所提取的od需求进行合并，合并后的部分可观测od需求如下表所示。

同时不同od点对之间的需求观测值变化趋势如图4所示：

采用连续一个月的历史数据并选择部分od点，对其观测值的可靠性进行分析(s31步骤)。这里选取某日某点对(12-2点对)的交通需求进行分析，将样本数据分为高峰时段(case1)和非高峰时段(case2)，分别采用混合gaussian分布和混合gamma分布对其进行拟合，采用k-s检验法对拟合结果的有效性进行分析。

依次将混合数目k设定为2～6分别对两种情况下的样本数据进行拟合，对于混合概率分布拟合的k-s检验结果如下表所示：

注：k-s检验中的置信度取α＝0.05；1代表在给定的置信度下通过假设检验。

进一步对比两种分布的拟合情况，此处对比分析了两种拟合的对数似然函数值(loglikelihood)、赤池信息量准则(akaikeinformationcriterion，aic)以及贝叶斯信息准则(bayesianinformationcriterion，bic)，具体见图5。

综合k-s检验结果以及各分布在不同k值下的loglikelihood、aic和bic值，并结合图5各统计指标的分析，可以发现两种情形(高峰与非高峰时段)在制定的混合数目k下，存在能够同时被上述两种混合概率模型进行拟合的结果，即所得到的od需求的样本观测值满足s31步骤的假设条件。

进一步基于上述两个成分的混合概率分布函数，对不同概率分布下所得的相关统计量进行分析，分布给出case1和case2的情况下各统计量在不同混合数目k下的变化情况，如图6。

在排除了不能被拟合(不能通过k-s检验)的分布后，对所得到的各统计指标的差异性进行假设检验，在置信度为0.05的情况下，两种混合概率分布(混合gaussian分布和混合gamma分布)在混合数目相同的情况下，其各统计指标不存在显著性的差异，即各统计指标对概率分布的类型不敏感，步骤s32的假设成立。

综上可知，按实施例所提取的od需求的样本观测值是可靠的，并可按两种假设条件进行检测分析。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：周东;李璐;吕伟韬;潘阳阳
技术所有人：江苏智通交通科技有限公司
我是此专利的发明人

上一篇：一种用于拉簧的加工机构的制作方法
上一篇：一株金黄色葡萄球菌噬菌体及其用途的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。