一种基于RFID数据的出行路径与节点流量预测方法与流程

文档序号:19421992发布日期:2019-12-14 01:37阅读:518来源:国知局
一种基于RFID数据的出行路径与节点流量预测方法与流程
本发明涉及深度学习与智能交通大数据在交通流量预测方面的应用,尤其涉及一种基于rfid数据的出行路径与节点流量预测方法。
背景技术
:近年来,智能城市的建设和智能交通系统的发展为研究者提供了新的机遇。为了更有效地获取相关数据以感知城市交通系统的状态,大量的传感设备被安装在了公共场所和交通设施中,例如gps、感应线圈、车辆电子标签等等。这些设备可以为研究者提供更精确、更海量的数据,从而为交通流量预测工作带来许多的便利。在这样的大背景下,交通流量预测方法从传统的四阶段预测方法、时间序列分析法慢慢转变,逐步融合大数据、机器学习等先进的概念。然而,尽管以往的研究已经取得了一些成果,但它们仍然存在着各种的局限性。首先,数据来源不丰富,覆盖范围不够广。感应线圈主要用于计算交通流量,却不能记录车辆的相关信息;目前可用的gps信息通常是从出租车、公共汽车和其他一些非通勤车辆上采集来的,来源于通勤车辆的数据相对较少,因此不便于发掘一些通勤者的内在出行特征。其次,以往的预测方法主要基于历史交通流量数据,在一定程度上忽略了出行者的个人特性,因此局限性较大。此外,近年来的大多数研究集中在对15、30、45、60分钟等短时交通流量的预测上,但是由于实际的交通流量对时间尺度的波动较大,因此这些方法在较长的时间尺度上不能进行很好的预测。另一方面,射频识别(rfid)在我国的交通运输领域中也开始得到应用,rfid基站可以自动识别车辆并记录其信息,包括车牌号、通过时间等。rfid基站在国内的逐渐普及,为交通流量预测提供了新的方法与思路,使得以居民出行路径预测为基础的交通流量预测方法成为可能。技术实现要素:本发明的目的是为了尽可能避免在交通流量预测中因使用集计数据忽略个体出行者差异带来的误差问题,提供一种基于rfid数据的出行路径与节点流量预测方法。为达到上述目的,本发明采用的方法是:一种基于rfid数据的出行路径与节点流量预测方法,包括以下步骤:(1)数据整理与提取:将rfid基站数据进行整理,提取其中字段数据包括:车牌id、日期、通过时间、基站编号;(2)数据划分:按日期划分数据,根据步骤(1)提取的车牌id统计每天的出行人数;(3)出行路径提取:在步骤(2)数据划分的基础上,以车牌id为唯一标识,对每天每一辆车的数据分别处理:将检测数据按照通过时间排序,即可获得个体车辆先后经过的基站列表,即出行路径;(4)路径选择规律总结:利用步骤(3)获取的每天的出行路径,基于神经网络模型,总结出行路径选择规律,具体操作及原理如下:(41)在每条出行路径的结尾添加end字符,作为出行路径结束的标识;(42)分析每一条路径,提取首个基站形成起点基站列表,记录每一个起点基站出现的概率;(43)将相邻两个基站(包含end)记为一个组合,记录每一种组合出现的概率;(5)路径预测:基于步骤(4)的路径选择规律,对未来出行者是否出行及其出行路径进行预测,具体操作过程如下:(51)出行人数预测:分析每天的出行人数,基于时间序列预测未来出行人数;(52)出行起点预测:基于步骤(42)获取的起点基站出现的概率,为每一位出行者分配起点基站;(53)出行路径预测:基于步骤(43)获取的各种组合出现的概率,分配起点之后的下一个基站,依次类推,直至预测到end标签,本条路径预测结束,从下一个起点基站开始继续进行路径预测,直至全部路径预测完成;(6)节点流量预测:统计所有预测出行路径中每一个基站出现的个数,以此获取各个基站的交通流量,实现节点流量预测。作为本发明的一种改进,所述步骤(3)采用循环神经网络rnn,其数据输入为出行路径,通过深度学习获取起点基站出现的概率以及相邻基站组合的概率。有益效果:与现有交通流量预测方法相比,本发明具有以下几点明显优势:首先,基于出行路径预测的节点流量预测方法可以充分地利用每一条rfid基站采集的数据,数据利用效率高,后期可以节省成本;其次,本发明提出的预测方法适用性更广,特别是在节假日等非工作日预测效果较明显地优于现有流量预测方法;第三,该方法细致入微,不仅可以获得节点交通流量,也可以获得居民路径选择信息、路段交通流量与其流量来源,为交通规划与管理提供便利。附图说明图1为本发明基于rfid数据的出行路径与节点流量预测方法的流程图;图2为本发明南京市rfid基站分布示意图;图3为本发明居民出行路径提取示意图;图4为本发明出行起点与出行路径预测流程图;图5为本发明鼓楼区3月8日早高峰节点流量预测对比图;图6为本发明建邺区3月8日早高峰节点流量预测对比图;图7为本发明秦淮区3月8日早高峰节点流量预测对比图;图8为本发明玄武区3月8日早高峰节点流量预测对比图;图9为本发明雨花台区3月8日早高峰节点流量预测对比图。具体实施方式本发明介绍了一种基于rfid数据的出行路径选择预测方法,并统计所有预测出行路径中相同基站出现的个数,实现了节点流量的精准预测。下面结合实例和附图对本发明的技术方案作进一步详细说明。本次实例采用2017年2月25日-2017年3月20日南京市范围内所有基站检测到的车辆rfid数据,通过对数据整理与分析,基于深度学习算法探究出行路径选择规律,实现出行路径选择和节点流量预测。方法流程图见附图1,主要包括以下五个阶段:数据整理与提取:将南京市rfid数据导入到sql数据库,每一条数据均包含基站编号、日期、通过时间、车牌id、车辆类型、车速、行驶车道六个字段。由于本实验聚焦于出行路径提取,因此只保留基站编号、日期、通过时间、车牌id四个字段数据,所得数据表如表1所示。其中通过时间精确到秒,例如20170302072205代表车辆通过时间为2017年3月2日7:22:05,车牌id与车辆唯一对应。表1.rfid数据表基站编号日期通过时间车牌id6517201703022017030207220512fb29ce0c9e55350d4bf75be2dff64522017030220170302072232cd9765f2f0637feccc1ba709cbede6478201703022017030207232214bb4e3d3cfec83095dd3474ba20e60312017030220170302072349ec2dcd39888090098669e12d1abc86334201703022017030207235571067487f2bf9ac94476bf04f183f…………另外为减少数据处理量,并考虑到市区的rfid基站分布更为密集,仅选取鼓楼区、玄武区、秦淮区、建邺区、雨花台区作为数据处理区域,如附图2所示。路径提取:以车牌id为标识,将每辆车每天早高峰时期(7:00-9:00)的数据单独提取出来,并根据通过时间由小到大排序,获取车辆先后经过的基站列表,将基站按顺序沿道路走向连线,即出行路径,如附图3所示,提取南京市所有车辆每天的路径列为表2。表2.车辆路径存储表车辆id日期路径12fb29ce0c9e55350d4bf75be2dffbd4201702256619,6449,6451,6057,6057,6544,6315,6317cd9765f2f0637feccc1ba709cbeded32201703056243,6237,6235,6220,6219,6067,6212,6215fa8ce838db5f641f6059c4ac959c7c74201703086243,6344,6237,6235,6220,6067,621271067487f2bf9ac94476bf04f183f43d201703096619,6449,6805,6805,6516,6517,6087,6154,6153………………规律探寻与路径预测:为了验证预测结果的准确性,本次实验将全部天数(2017.02.25-2017.03.13)的出行路径分为训练集(2017.02.25-2017.03.07)与验证集(2017.03.08-2017.03.13),将训练集的出行路径输入循环神经网络rnn,探究居民的路径选择规律,并对验证集的出行路径进行预测,主要包括以下步骤:(1)出行人数预测:基于每个行政区的历史出行人数,利用时间序列预测验证集日期的出行人数,如表3所示。表3.出行人数预测表区域\日期3月8日3月9日3月10日3月11日3月12日3月13日玄武区20325197202086413228920817803鼓楼区256822475324668149501155823538建邺区913189718806425533647856秦淮区354223580535209215081646432724雨花台区18234183991827410639840215818(2)出行起点与出行路径预测:如附图4所示主要分为以下步骤:在训练集中每条出行路径的结尾添加end字符,作为出行路径结束的标识;分析每一条路径,提取首个基站形成起点基站列表,记录不同起点基站出现的概率;将相邻两个基站(包含end)记为一个组合,记录不同组合出现的概率;出行起点预测:基于步骤获取的不同起点基站出现的概率分配起点基站,起点基站个数与预测未来出行人数保持一致;出行路径预测:基于步骤获取的不同组合出现的概率随机分配起点之后的下一个基站,以此类推,直至预测到end标签,路径预测结束;上述循环神经网络rnn采用试算的方法确定隐藏神经元个数,各行政区分别在区域基站个数的基础上+5,+10…,直至获得最小预测误差。本实例循环神经网络rnn隐藏神经元个数选取如表4所示。表4.模型参数选取表行政区隐藏神经元个数建邺区27+10=37玄武区55+0=55鼓楼区56+20=76秦淮区76+0=76雨花台区32+0=32路径预测结果如表5所示。表5.深度学习与路径预测过程节点流量统计:统计所有预测出行路径中相同基站出现的个数,以此获取各个基站的交通流量,实现节点流量预测。预测结果比对:将预测的节点流量同真实流量比较,选取3月8日的比较结果如附图5-9所示。使用mape指标作为度量:得到不同行政区的mape指标如表5所示,可以看出雨花台预测准确度在90%以上,玄武区、秦淮区预测准确度在85%以上,鼓楼区、建邺区预测准确度在80%以上,由此表明本发明提出的基于rfid数据的出行路径选择与节点流量预测方法切实可行且具有较高的预测准确度。表5.mape指标计算表03.0803.0903.1003.1103.1203.13平均鼓楼区0.1280.1550.2190.1050.1230.2910.170玄武区0.0830.1100.1210.1360.1370.1260.119秦淮区0.1520.1430.1060.1970.1270.1710.149建邺区0.1880.1520.1860.1290.2150.1520.170雨花台区0.0670.0580.1360.0950.0770.0830.086当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1