基于ARIMA模型的共享单车吸引量和发生量预测方法与流程

文档序号:13861780阅读:2977来源:国知局

本发明涉及共享单车智能管理方法,具体涉及一种基于arima模型的共享单车短时吸引量和发生量预测方法。



背景技术:

2016年末开始,无桩共享单车开始出现在各大城市的街头巷尾,只需要扫码支付车费,即可随时随地使用、停放。共享单车深刻地改变了城市的出行结构,自行车重返城市,大规模投放带来了城市居民出行的便捷性,同时也给政府管理部门与共享单车租赁企业的运营、管理带来了困难。例如,在高峰时段,由于出行的潮汐性,会出现热门出行发生区域共享单车供不应求、一车难求,而热门吸引区域共享单车数量过多、无人使用,占用大量城市空间,影响城市交通系统,尤其是慢行系统的正常运作。国家对共享单车实施鼓励发展政策,将共享单车纳入城市综合交通体系规划,并与城市公共交通规划相衔接;要求积极推进自行车道建设,完善自行车交通网络,推进自行车停车点位设置和建设,纠正占用非机动车道等违法行为,保障自行车通行条件。

新型无桩共享单车集成了物联网技术,具有车载定位装置例如gps模块,这些物联网技术的集成可以供使用者查看可用共享单车的动态位置,也给分析车辆在城市的分布与使用提供了基础。共享单车每时每刻都提供着海量数据,分析与预测区域的全样本发生量与吸引量在数据驱动下成了可能。而目前尚未出现针对共享单车海量数据进行以自然小区为单位的发生量与吸引量的挖掘与预测方法。



技术实现要素:

发明目的:基于以上不足,本发明提出一种基于arima模型预测共享单车短时吸引量和发生量的方法,该吸发量预测方法利用无桩共享单车车载gps模块产生的海量位置数据,针对各类型交通小区进行吸引量与发生量的预测,为共享单车的运营、管理和调度提供数据支撑。

技术方案:一种基于arima模型的共享单车吸引量和发生量预测方法,包括以下步骤:

1)根据城市地理分布特性,划定预测的目标区域,采集区域内共享单车可用车辆的静态停放位置gps定位数据,针对目标区域连续采集目标天数;为包含更多周期性规律,构建较长时间序列,至少采集两周数据;

2)获取目标区域内交通小区地理信息数据,包括小区边界、路网信息、兴趣点(poi)信息、自然环境信息,以各自然交通小区为对象,建立地理信息数据库;

3)将共享单车的地理位置信息匹配至各交通小区内:利用arcgis软件将所有单车位置坐标点数据载入地理信息数据库,建立坐标与小区映射关系,将落在某一闭合区域内的点划归该区域,为坐标增加交通小区属性,使其属性包括单车编号、采集时刻、车辆所在经度、车辆所在纬度及车辆所在自然交通小区;

4)建立共享单车出行总样本:以共享单车编号为遍历对象,以采集时刻为顺序,对一共享单车在采集时间内出现的全部记录进行遍历,若前后两次位置信息发生变化,且移动距离超过指定阈值,视为一次出行产生,记录下单车编号、开始时间、开始位置经度、开始位置纬度、开始自然交通小区、结束时间、结束位置经度、结束位置纬度、结束自然交通小区;若前后两次位置信息未发生变化或移动距离小于指定阈值,则检验下一条记录,直到出行产生,变更起点信息,直到全序列检验完毕停止,由此产生目标区域共享单车出行总样本;其中,共享单车移动距离指定阈值为100m;

5)建立共享单车可用车辆分布时空分布热力图、各小区吸引发生次数空间热力图:将数据导入地理信息软件,利用地理信息软件的核密度分析与色阶可视化,基于目标对象的位置坐标,分别从经纬度坐标量级和自然交通小区量级对可用车辆量、出行产生量、出行吸引量进行热力图绘制,得到目标区域内共享单车总体时空分布规律;

6)以自然交通小区为集计对象,以开始时间为索引,分别以5分钟、10分钟、15分钟、20分钟和30分钟为集计区间,对出行进行计数,构建各交通小区吸引量和发生量的时间序列;

7)利用spss软件对arima模型中的参数进行标定,调整参数使序列满足差分白噪声检验、参数显著性检验:

φ(b)(1-b)dy(t)=θ0+θ(b)ε(t)

其中,y(t)是预测的下一时间集计区间的值,y(t-i)是前第i个时间集计区间的值,ε(t-j)是前第j个时间集计区间的残差值(预测值与真实值之差);

8)预测下一个时间集计区间下各交通小区的共享单车出行量:通过训练模型确定的p,d,q以及θ0,θ(b)计算下一时间集计区间内某自然交通小区内的出行量。

有益效果:本发明的方法通过分析可用车辆的空间分布、出行吸引量发生量的热点区域,预测各区域短时吸发量,为政府管理部门与租赁企业运营部门提供调度、管理和决策的必要信息。本发明具有以下优点:

1、车辆预测精度高。目前的车辆调度是通过人工调查对热门区域进行定性分析,受限于调查人员数量与抽样的局限,会忽略很多无桩共享单车出行的内在规律,本发明对目标区域内无桩单车的全样本、全天候、长周期的数据进行分析,挖掘出更多共享单车出行的工作日与节假日的区别、各区域的特征以及潮汐性变化的规律。

2、本发明的预测过程简单。在本发明中,只需将海量数据与实际自然交通小区匹配,按需求的时间集计进行统计,标定好arima模型的参数p,d,q,θ0,θ(b),即可进行预测。该方法使用简便、实用性强,具有实际的工程运用价值,帮助管理部门和单车租赁公司提高运营管理水平。

附图说明

图1是本发明方法的流程图。

图2是根据本发明实施例的预测区域示例。

图3是根据本发明实施例的各自然交通小区吸发量的色阶图。

具体实施方式

下面结合附图对本发明的技术方案作进一步说明。

如图1所示,本发明的共享单车短时吸引量和发生量的预测方法,包括以下步骤:

步骤1)根据城市地理特性,划定预测的目标区域,采集区域内共享单车可用车辆静态停放位置gps定位数据。收集的车辆信息包括单车编号、采集时刻、车辆所在位置的经度、纬度,样例数据如下:{"025323514","2017/06/2321:37:34","object":{distx":118.73578455079466,"disty":32.04531884191313}}。对目标区域连续收集目标天数,为包含更多周期性规律,构建较长时间序列,至少收集两周数据。

步骤2)获取目标区域内交通小区地理信息数据,包括小区边界、路网信息、兴趣点(poi)信息、自然环境信息,以各自然交通小区为对象,建立地理信息数据库,以地理信息形文件格式储存。

步骤3)将共享单车的地理位置信息匹配至各交通小区内:利用arcgis软件将共享单车的所有位置坐标点数据载入地理信息数据库,建立单车坐标与交通小区的映射关系,将落在某一闭合区域内的点划归该区域,为坐标增加交通小区属性,使其属性包括单车编号、采集时刻、车辆所在经度、车辆所在纬度及车辆所在自然交通小区。

步骤4)建立共享单车出行总样本:以共享单车编号为遍历对象,以采集时刻为顺序,对一共享单车在采集时段内出现的全部记录进行遍历,若前后两次位置信息发生变化,且移动距离超过指定阈值,可视为一次出行产生,记录下单车编号、开始时间、开始位置经度、开始位置纬度、开始自然交通小区、结束时间、结束位置经度、结束位置纬度、结束自然交通小区;若前后两次位置信息未发生变化或移动距离低于指定阈值,则检验下一条记录,直到出行产生,变更起点信息,直到全序列检验完毕停止,由此产生目标区域共享单车出行总样本。在本发明中,共享单车移动距离的指定阈值设为100m。

步骤5)建立共享单车可用车辆分布时空分布热力图、各小区吸引发生次数空间热力图:将数据导入地理信息软件,利用地理信息软件的核密度分析与色阶可视化,基于目标对象的位置坐标,分别从经纬度坐标量级和自然交通小区量级对可用车辆量、出行产生量、出行吸引量进行热力图绘制,反映目标区域共享单车总体时空分布规律。

步骤6)建立各交通小区出行次数时间序列:以自然交通小区为集计对象,以开始时间为索引,以不同集计区间长度为约束对出行进行计数,构建各交通小区吸引量和发生量的时间序列。在本发明中,集计区间长度包括5分钟、10分钟、15分钟、20分钟和30分钟这几种,收集周期以两周为例,各分别可获得4032、2016、1344、1008、672个时间序列量。

步骤7)建立自回归积分滑动平均模型(autoregressiveintegratedmovingaveragemodel,arima),并标定参数。为避免过拟合,将序列数据划分为训练集和验证集,其中训练集数据占总样本量的90%,验证集数据占总样本量的10%,利用spss软件,对arima模型中的参数进行标定,调整参数使序列满足差分白噪声检验、参数显著性检验:

φ(b)(1-b)dy(t)=θ0+θ(b)ε(t)(2)

其中,式(1)是arma模型,式(2)是arima模型,公式计算φi、θj的值,根据结果调整p、d、q的值使其满足模型指标的检验要求。y(t)是预测的下一时间集计区间的值,y(t-i)是前第i个时间集计区间的值,ε(t-j)是前第j个时间集计区间的残差值(预测值与真实值之差)。

步骤8)预测下一个时间集计区间下各交通小区的共享单车出行量:通过训练模型确定的arima模型参数以及当前时间集计区间内的出行量计算下一时间集计区间内某自然交通小区内的出行量。为政府管理部门与租赁企业运营部门提供调度、管理和决策的必要信息,提高共享单车总体管理水平。

如图2所示,下面以南京内环作为目标区域,测试本发明在无桩共享单车数据采集、匹配,吸发量统计、预测方面的性能。采集的数据包括包括单车编号、采集时刻、车辆所在位置的经度、车辆所在位置的纬度。

以新街口自然交通小区十分钟集计区间计数序列为例,现有2016个时间序列数据,从整个样本中抽取前90%个数据作为训练集,共1868条数据,用来标定模型,剩下的148个时间序列数据用来测试预测模型的预测经度,以平均绝对误差、均方误差、平均绝对百分误差作为评价指标。

利用爬取的海量共享单车位置信息数据,根据本发明的步骤1)—步骤6),对共享单车出行空间分布进行简要分析,建立共享单车出行样本,构建各小区共享单车吸发量的时间序列。图3示出了各自然交通小区吸发量的色阶图。

根据步骤7)对模型进行参数标定,使其满足差分白噪声检验、参数显著性检验,参数取值如表1所示:

表1实施例的模型参数标定

利用该模型对各交通小区吸发量不同时间集计下的时间序列进行预测,各集计区间下预测精度如表2所示:

表2实施例模型预测精度

注:mae:平均绝对误差,mape:平均绝对百分误差,mse:均方误差

从表2中可见,15分钟的时间集计区间下吸引量和发生量的误差最小,效果最好,准确率分别达到了34.61%、44.01%,符合实际应用的需求与应用场景。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1