一种基于gps数据网格统计的出租车巡航行为分析方法

文档序号:6400808阅读:901来源:国知局
专利名称:一种基于gps数据网格统计的出租车巡航行为分析方法
技术领域
本发明涉及的是一种交通行为研究领域的出租车出行行为分析方法,具体是一种基于GPS数据网格统计的出租车巡航行为分析方法。
背景技术
出租车是一种重要的城市交通工具,出租车的巡航行为分析是交通行为研究领域的一项重要课题。巡航行为指出租车在空载情况下寻找乘客时的运行行为。目前我国大中城市的出租车已普遍安装了车载GPS设备,这为巡航数据的采集提供了方便。借助网格技术和空间点建模分析手段对出租车GPS巡航数据进行处理和分析,总结出租车的巡航行为特点,可以为优化出租车的巡航路线、提高巡航效率,解决巡航导致的道路资源浪费、燃油消耗和环境污染提供有效途径。另外,基于GPS数据的出租车巡航点空间分析方法研究也可以为城市出租车服务区的位置设定以及电话叫车服务系统中出租车集散点的空间布局提供理论基础和技术工具,以提高出租车运营效率和服务水平,降低运营成本。目前国内外应用出租车GPS数据的交通行为研究多数为路网交通量预测研究,对于出租车巡航行为的研究还较少,尤其国内此方面的研究处于起步阶段。在方法上主要借助交通仿真手段,对巡航策略的设置比较简单,即遵循司机的历史载客点信息和路网信息。对于城市的用地、人口分布等对潜在的乘客乘车地点有影响的因素以及巡航点之间在空间上的相互吸引或排斥影响(也称为巡航点的空间自相关影响)等因素,运用交通仿真手段较难考虑。目前相关研究存在的局限性可总结如下:(I)没有考虑城市用地属性、人口分布、巡航点的空间自相关性等因素对出租车巡航点选择行为的影响;(2)缺乏应用实际数据进行的出租车巡航策略的研究,无法验证所设置的巡航策略的有效性;(3)出租车巡航点与相关影响因素点的空间分布的相关性研究是获得出租车巡航策略的基础方法,是进行出租车巡航行为交通仿真等相关研究的基础,但此方面的研究目前还未得到重视。

发明内容
本发明针对现有技术存在的上述不足,提供一种进行出租车巡航行为分析的方法,基于出租车行驶轨迹GPS数据,识别巡航点、载客点,生成代表用地、人口、路网等因素的背景影响点数据,采用网格分析方法,分析巡航点的空间分布特征,建立零膨胀负二项模型(Zero-1nflated Negative binomial, ZINB),分析用地、人口、路网等背景信息、司机的历史载客点信息以及巡航点的空间自相关性对巡航点选择行为的影响,分析出租车的巡航策略。本发明是通过以下技术方案得以实现的,参照图1,本发明至少包括以下步骤:第一步、获取GPS数据获取出租车行驶轨迹GPS数据,选择任意两个连续工作日的数据作为待研究基础数据;
第二步、转换数据格式将基于GPS的地理坐标数据转换为大地坐标数据;第三步、筛选数据设定数据筛选原则,进行数据筛选和清理;第四步、划分网格将研究区域划分为若干正方形网格,网格边长用以下公式计算:a = ^lAI Q其中a为网格边长,A为研究区域面积,Q为平均每台车每日的GPS行驶轨迹点个数;第五步、筛选网格核查研究区域的整体用地属性,识别湖泊、公园等出租车无法驶入区域所在的网格,从网格图中去除这些网格,仅保留有效网格;第六步、生成巡航点数据和载客点数据筛选出GPS数据中载客状态为O (即空载)的数据,生成巡航点数据。筛选出GPS数据中载客状态由O变为I的数据,生成载客点数据;第七步、生成背景点数据

搜集有关城市用地密度、路网布局、人口分布等背景信息,生成背景点数据;第八步、生成网格数据将巡航点数据、载客点数据和背景点数据投射到网格中,计算研究区域内每一网格的如下数据项:后一日全部车辆的巡航点数之和、前一日全部车辆的载客点数之和、背景点数,生成在列方向包括这三项数据、在行方向的记录条数为区域有效网格总数的网格数据库;第九步、计算巡航点的空间自相关影响值对于任意网格(记为网格i),计算除网格i外其他所有网格(记为『)的巡航点数对网格i巡航点的空间影响值,即巡航点的空间自相关影响值,计算方法为:Wi = Di.Tt其中,Wi为其他网格中巡航点对网格i中巡航点的空间自相关影响值,i=l…η,η为网格总数,T为由所有网格的巡航点数组成的向量,Di为其他所有网格对网格i影响的空间权重矩阵,由网格i与任意网格:/ (/el )之间的空间相关权重Dij组成,Dij由下式计算:
M 1l)=—
dU其中Clij为网格i与j之间的空间距离,i, j=l-n,网格i自身的空间自相关影响
值Dii为O。第十步、建立和标定ZINB模型以任意网格i的巡航点数为应变量,以网格i的背景点数、前一日的载客点数和巡航点的空间自相关影响值为自变量,应用网格数据库,建立Zero-1nflated Negativebinomial模型,进行参数标定和检验。第十一步、分析巡航策略
比较分析模型的参数标定值,对比分析历史载客点信息、背景信息、巡航点的空间自相关性三个因素对巡航点空间分布的影响,总结出租车的巡航策略。所述的第三步中数据筛选原则为:I)核查各台车的数据是否有缺项,选择没有缺项的车辆数据;2)确定待研究空间整体区域范围,去除区域范围外的数据;3)如果同一台车连续2分钟以上采集的数据点均为同一经纬度点,则去掉此经纬度点2分钟以外的记录。所述的第七步背景点数据生成方法为:将出租车行驶轨迹GPS数据库中各日所有车辆的载客点数据整合并投射到研究区域中,生成背景点数据,代表城市用地密度、路网布局和人口分布等背景因素对巡航行为的整体影响。所述的第十步中Zero-1nflated Negative binomial 模型由 Count 和 Zero 两部分模型组成,其中主要应用Count模型进行巡航策略分析,Count模型的期望计数μ i按如下函数计算: 1g(Ui) = β + β LLi+ β YYi+ β wffi+ ε μ其中LdP Yi分别为网格i的背景点数和前一日的载客点数%为其他网格中巡航点对网格i中巡航点的空间自相关影响值,也叫巡航点的空间自相关性;T是由所有网格巡航点数组成的向量;β、β L> βγ和β w为待标定参数,ε μ为随机误差。有益效果:与现有技术相比本发明的有益效果是:1.本发明所述的基于GPS数据网格统计的出租车巡航行为分析方法不但考虑了出租车司机的历史载客点信息,而且考虑了土地利用、人口、路网密度等背景因素以及巡航点的空间自相关性对出租车巡航行为的影响;2.本发明所述的基于GPS数据网格统计的出租车巡航行为分析方法应用零膨胀负二项模型实现了出租车巡航点网格分布数据的拟合,解决了出租车巡航点空间分布聚集性强、大部分网格点数记录为O的问题;3.本发明所述的基于GPS数据网格统计的出租车巡航行为分析方法应用网格分析技术化空间点数据为基于网格的点频率数据,化空间点分析问题为数据的模型拟合问题,不但考虑了空间多平面间的相关关系,更实现了应用多条网格记录进行巡航策略拟合的目的。


图1是本发明的总体流程图;图2是本发明的实施例中深圳市区域划分和路网布局图;图3是本发明的背景点密度分布图;图4是本发明的网格、巡航点、载客点和背景点的示意图。
具体实施例方式下面结合附图对本发明作详细的描述:本发明对基于GPS数据网格统计的出租车巡航行为分析方法中的相关概念说明如下:1.巡航点的定义指出租车空载并寻找乘客时的行驶轨迹点。2.载客点的定义指出租车接到乘客时的轨迹点,也即其行驶状态由空载变为满载时的轨迹点。3.历史载客点信息
指出租车司机之前接到过乘客的地点信息,在本发明中用前一日的载客点分布表示 ο4.巡航点的空间自相关性指在研究的空间区域范围内的巡航点自身的观测数据之间存在的空间相关性,可以表现为空间上的相互吸引或排斥。具体指空间内其他所有网格的巡航点数对网格i巡航点数的影响值。例如司机如果愿意在网格i的周边相邻网格巡航则也愿意在网格i巡航,即周边相邻网格对网格i有正的空间自相关影响。一种基于GPS数据网格统计的出租车巡航行为分析方法,至少包括以下步骤:第一步、获取GPS数据:获取出租车行驶轨迹GPS数据,选择任意两个连续工作日的数据作为待研究的基础数据。第二步、转换数据格式:将基于GPS的地理坐标数据转换为大地坐标数据;第三步、筛选数据:设定数据筛选原则,进行数据筛选和清理;所述的数据筛选原则为:I)核查各台车的数据是否有缺项,选择没有缺项的车辆数据;2)确定待研究空间整体区域范围,去除区域范围外的数据;3)如果同一台车连续2分钟以上采集的数据点均为同一经纬度点,则去掉此经纬度点2分钟以外的记录;所述的数据项及数据示例见下表
权利要求
1.一种基于GPS数据网格统计的出租车巡航行为分析方法,其特征在于,包括以下步骤: 第一步、获取GPS数据 获取出租车行驶轨迹GPS数据,选择任意两个连续工作日的数据作为待研究基础数据; 第二步、转换数据格式 将基于GPS的地理坐标数据转换为大地坐标数据; 第三步、筛选数据 设定数据筛选原则,进行数据筛选和清理; 第四步、划分网格 将研究区域划分为若干正方形网格,网格边长用以下公式计算: a = sjlAI Q 其中a为网格边长,A为研究区域面积,Q为平均每台车每日的GPS行驶轨迹点个数; 第五步、筛选网格 核查研究区域的整体用地属性,识别湖泊、公园等出租车无法驶入区域所在的网格,从网格图中去除这些网格,仅保留有效网格; 第六步、生成巡航点数据和载客点数据 筛选出GPS数据中载客状态为O (即空载)的数据,生成巡航点数据。筛选出GPS数据中载客状态由O变为I的数据,生成载客点数据; 第七步、生成背景点数据 搜集有关城市用地密度、路网布局、人口分布等背景信息,生成背景点数据; 第八步、生成网格数据 将巡航点数据、载客点数据和背景点数据投射到网格中,计算研究区域内每一网格的如下数据项:后一日全部车辆的巡航点数之和、前一日全部车辆的载客点数之和、背景点数,生成在列方向包括这三项数据、在行方向的记录条数为区域有效网格总数的网格数据库; 第九步、计算巡航点的空间自相关影响值 对于任意网格(记为网格i),计算除网格i外其他所有网格(记为的巡航点数对网格i巡航点的空间影响值,即巡航点的空间自相关影响值,计算方法为: Wi = Di.Tt 其中,Wi为其他网格中巡航点对网格i中巡航点的空间自相关影响值,i =为网格总数,T为由所有网格的巡航点数组成的向量,Di为其他所有网格对网格i影响的空间权重矩阵,由网格i与任意网格;/ (/£『)之间的空间相关权重Dij组成,Dij由下式计算:
2.根据权利要求1所述的基于GPS数据网格统计的出租车巡航行为分析方法,其特征是,所述的第三步中数据筛选原则为: 1)核查各台车的数据是否有缺项,选择没有缺项的车辆数据; 2)确定待研究空间整体区域范围,去除区域范围外的数据; 3)如果同一台车连续2分 钟以上采集的数据点均为同一经纬度点,则去掉此经纬度点2分钟以外的记录。
3.根据权利要求1所述的基于GPS数据网格统计的出租车巡航行为分析方法,其特征是,所述的第七步背景点数据生成方法为:将出租车行驶轨迹GPS数据库中各日所有车辆的载客点数据整合并投射到研究区域中,生成背景点数据,代表城市用地密度、路网布局和人口分布等背景因素对巡航行为的整体影响。
4.根据权利要求1所述的基于GPS数据网格统计的出租车巡航行为分析方法,其特征是,所述的第十步中零膨胀负二项模型由点数为零模型和计数模型两部分组成,点数为零模型的基本结构为:.^ogiPi) = log—^ = r + YhL.+ YyY1 + YwWi + ε Pi 其中Pi和1-Pi分别为网格i的巡航点数为O或非O的概率(O ^ Pi ^ I), Li和Y1分别为网格i的背景点数和前一日的载客点数,Wi为其他网格中巡航点对网格i中空间自相关影响值,Y为常变量,^和^分别为背景点数、前一日的载客点数和巡航点的空间自相关性三个变量对点数为O的影响参数,ε ρ为随机误差; 计数模型的期望计数μ i按如下函数计算: log ( μ ^ = β + β LLi+ β yYj+ β ^i+ ε μ 其中β为常变量,^^、卜和^分别为背景点数、前一日的载客点数和巡航点的空间自相关性三个变量对网格计数的影响参数,ε μ为随机误差。
全文摘要
本发明公开了一种交通行为研究领域的基于GPS数据网格统计的出租车巡航行为分析方法。基于出租车行驶轨迹GPS数据识别巡航点,分析巡航点的空间分布特征,生成前一日的载客点以及代表用地、人口、路网等因素的背景信息点,采用网格分析技术,化空间点数据为基于网格的点频率数据,构建零膨胀负二项模型(Zero-inflated Negative binomial,ZINB),分析历史载客点信息、背景信息、巡航点的空间自相关性对出租车巡航点选择行为的影响,总结出租车的巡航策略。方便进一步的出租车交通行为仿真,为优化出租车的巡航行为、解决巡航导致的道路资源浪费、燃油消耗和环境污染提供有效途径。
文档编号G06Q50/30GK103218672SQ201310094868
公开日2013年7月24日 申请日期2013年3月24日 优先权日2013年3月24日
发明者宗芳, 王占中, 许洪国, 金凤阁, 贾正锐, 潘嵩岩, 高跃峰, 栾琨 申请人:吉林大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1