居民交通出行流量预测系统及其预测方法与流程

文档序号:17072736发布日期:2019-03-08 23:27阅读:386来源:国知局
居民交通出行流量预测系统及其预测方法与流程
本发明属于交通流量预测
技术领域
,特别是涉及一种居民交通出行流量预测系统及其预测方法。
背景技术
:随着城市居民的增加,各种商业化的规模逐渐扩大,给人们的生活带来便利的同时,也造成了一定程度的拥挤,甚至发生过由于人群流量过大带来的安全事故,例如踩踏事故。居民出行流量的预测不仅仅对于缓解交通流量有着积极的作用,更重要的对于城市管理和公共安全具有重要意义,是防止安全事故的发生的重要因素之一。如果我们如果能够预测一个地区的人群流量情况,那么可以通过利用应急机制来缓解或防止这些悲剧,例如进行交通控制,发送警告,撤离人员等,从而给城市带来一个通畅安全的交通出行环境。城市网络通常比高速公路更加复杂,通信中断的可能性相应更大,因此交通控制策略通常不易响应,因为交通数据检测和实施之间存在滞后。由于城市等城市环境复杂的基础设施,需要更灵活的预测方案,但这带来了更多挑战。现有关于流量预测的方法有很多,大体可以分为三类:1)基于时间序列的传统模型(例如arima,sarima等);2)基于非线性变换(例如人工神经网络、支持向量等);3)基于概率的方式(例如贝叶斯网络、马尔科夫链、马尔科夫随机场等);4)基于深度网络(如深度置信网络、卷积神经网络等)。方法1)要求时间序列数据和时间有着很大程度的关系,往往是对呈现季节性的数据比较适用。方法2)最具有代表性的就是人工神经网络,但是人工神经网络结构是浅层结构,不能很好的拟合交通流量的复杂性和多变性,而且人工神经网络全连接的神经元会导致模型参数太多。方法3)建立和求解的模型较为复杂而且模型的稳定性差、不确定性高。方法4)深度网络建立模型较为复杂,模型参数较多,耗费的计算资源较多,时效性较差。综上所述,现有的技术问题为:由于交通数据复杂、多变、不确定、受影响因素较多,时效性较差等特点,大多模型对于现有的交通流量已经不能很好的拟合,传统的模型也不能很好的捕捉互联互通区域相互之间的依赖,而深度网络模型参数较多,计算资源耗费大,时效性不能完全保证。同时传统模型对于输入的数据结构单一,影响交通流量的情况较多,传统的模型不能很好的将这些数据融合输入到模型中。并且以往的卷积神经网络做交通流量划分区域时候只采取主干路的十字路口的测得通过车流量的数据,预测短时交通流量。在现实生活中,城市居民出行很大一部分都是采用城市街道、城市侧路等步行或者骑车出行,传统的研究方法在研究区域中没有考虑到这种情况。而本发明采用预测区域的划分是能够包括这种出行方式的。技术问题不能有效解决的原因为:互联互通区域、不同区域的交通流量流动的这种特征没有被很好的提取,实际交通情况存在不可控性太大,以及预测模型自身存在的缺陷。现有的技术只能尽量缩小与实际情况的误差,不能很好地捕捉到实际情况的规律。不同的地区存在影响交通流量的众多因素,单从流量数据本身建立模型来进行预测并不准确,而实际交通情况还存在一定的偶然性,技术问题只能尽可能缩小与实际的误差。解决的难度在于:对影响交通流量数据因素的不确定性和具体的影响程度,涉及大量的数据类型和不同的数据格式,以及具体地区人群的主观因素和出行的行为特征。同时,交通流量具有复杂的非线性特征,需要分析的交通流量时间序列也多是非线性、非平稳的数据,各种经典的时间序列分析方法遇到非线性、非平稳的数据就会有精确度不够的缺陷,或者得到的结果没有清晰的实际交通情况含义,因此,有必要对交通流量波动中的非线性、非平稳的数据采用新的方法进行分析和研究,考虑特殊情况的影响。解决的意义在于:更加准确地预测交通流量,充分考虑不同地区周边因素和自然因素对其的影响,同时要考虑城市多种数据的融合,不仅仅只靠单一交通流量的数据格式。更进一步的是,可以通过通道的方式,扩充数据。相比于以往卷积神经网络,本文利用反卷积操作替代了全连接操作,对于这种主要由卷积操作反卷积操作构成的网络称之为全卷积网络,不需要接入全连接层操作,而以往卷积神经网络的模型参数主要集中于全连接操作中,以往的反卷积操作主要用于卷积神经网络的特征可视化和表达,使用反卷积操作重构出预测流量图,可以大大减少模型的参数,使得模型简单,速度更快,预测结果为一张图像。技术实现要素:本发明的目的在于提供一种居民交通出行流量预测系统及其预测方法,解决了现有技术中互联互通区域、不同区域的交通流量流动的这种特征没有被很好的提取,实际交通情况不可控性太大,以及预测模型自身存在的缺陷的问题。本发明所采用的技术方案是,居民交通出行流量预测系统,包括:数据收集模块,用于通过居民手机gps收集居民移动的轨迹数据信息;数据预处理模块,用于将居民轨迹清洗、统计计算以及转换成流量图;模型训练模块,用于通过卷积神经网络来提取特征,反卷积操作来预测下一个时间段的预测流量图;通过将预测流量图与实际流量图的误差来反向调节全卷积神经网络,调节全卷积神经网络中卷积核的权重、反卷积核的权重、激活函数权重来拟合出接近于真实情况的预测模型;模型测试模块,用于预测模型的测试,利用均方根误差即rmse测试评价预测模型;模型预测流量图输出模块,用于输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达。本发明所采用的另一种技术方案是,居民交通出行流量预测系统的预测方法,具体按照以下步骤进行:步骤s1、数据收集模块根据居民的手机gps收集居民的轨迹数据集;采用服务器来接收居民手机返回的gps轨迹点信息,服务器接收每一个gps轨迹点的数据格式为:{id,lon,lat,t},id是居民手机的id,lon为gps轨迹点的经度,lat为gps轨迹点的纬度,t为gps轨迹点的时间;gps轨迹点组成gps轨迹数据集,一个居民的gps轨迹数据集表示为tra={(lon1,lat1,t1),(lon2,lat2,t2),(lon3,lat3,t3),...,(lonn,latn,tn)};步骤s2、数据预处理模块清洗居民出行轨迹数据,根据时段计算gps轨迹点落入的栅格区域,统计居民出行流量,做成流量图的数据格式;步骤s3、模型训练模块利用卷积神经网络来对居民出行区域流量图像做卷积,提取特征,用不同大小的卷积核来做卷积,卷积过后进行池化操作,生成多个池化特征图;然后在池化后用反卷积操作来重构预测出下一个时间段的流量图,直到生成与输入流量图像的尺寸大小相等的预测流量图,通过预测流量图与实际流量图差值来反向调节全卷积神经网络,得到预测模型;步骤s4、模型测试模块利用预测模型进行测试,利用rmse测试评价预测模型;步骤s5、利用出流量和入流量来增加流量图像通道,将流量图原有的单通道扩充到2个通道来增加输入数据的维度从而提高预测的准确性,模型预测流量图输出模块输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达。进一步的,所述步骤s2包括:步骤s21、清洗居民出行轨迹数据,居民出行的gps轨迹数据集至少包含三种属性,分别为gps轨迹点的经度、gps轨迹点的纬度、gps轨迹点的时间;清洗三类轨迹数据,第一类为缺失属性的数据即某一条点位信息的部分属性值缺失;第二类为不在研究区域范围内的gps轨迹点,如果居民出行到较为偏僻的区域,则过滤掉这些信息;第三类为居民出行经纬度属性异常的点位信息,即利用两个点经纬度和时间信息,计算居民移动的最大速度,如果速度超过了客观现实居民移动的最大速度,则视为异常属性,将这含有三类异常情况的样本数据剔除;步骤s22、gps轨迹数据集对预测交通流量的区域按照经纬度划分为多个地理栅格,以预测区域的最大和最小经纬度作为划分的边界,采用迭代单位经纬度的方式,直到等于边界的经纬度,将居民出行区域划分为多个方形的地理栅格图;栅格区域定义如下:其中,range1(lat1,lon1,lat1,lon2,lat2,lon1,lat2,lon2)是第一个地理栅格,rangen-1(latn-1,lonn-1,latn-1,lonn,latn,lonn-1,latn,lonn)是第n个地理栅格;步骤s23、gps轨迹数据集对预测交通流量的区域划分预测时段,预测时段为t;步骤s24、利用居民手机gps,根据划分好的预测交通流量的区域的地理栅格图,判断居民所处的栅格区域,当预测时段t内居民再次进入栅格范围内计入一次流量,预测时段t内在栅格区域移动不重复计入流量。进一步的,所述步骤s24每个栅格里面的值代表流量图的像素点的大小,同时也代表改栅格区域内居民出行流量的大小,利用居民手机gps,统计单位时间内的居民交通出行流量,统计完之后得到一个m×n的矩阵,其中,m是矩阵的行,m的值与栅格区域的长相等,n是矩阵的列,n的值与栅格区域的宽相等,将m×n的矩阵转换为一个单通道的流量图,记为m×n×1,其中1是通道数即单通道,即将流量数据转化为流量图或者是张量的数据格式;划分的流量图的长宽是4的偶数倍;居民的手机gps每隔10秒-60秒会向服务器返回一条gps定位信息,服务器收集居民返回的gps轨迹数据。进一步的,所述步骤s3包括:步骤s31、对gps轨迹数据集进行归一化,采用(0,1)归一化,根据gps轨迹数据的均值方差,经过处理的gps轨迹数据符合标准正态分布,即均值为0,标准差为1;具体操作为,数据减去数据的平均值再除以标准差;步骤s32、利用卷积神经网络来对居民出行区域流量图做卷积,卷积操作如下:其中,g(i,j)是卷积特征图第i行第j列的输出像素值,f(i+a,j+l)是流量图第i+a行第j+l列的输入像素值,h(a,l)表示卷积核,a∈(1,2,…,m),l∈(1,2,…,n),m是卷积核长,n是卷积核宽;卷积层最多设置4层,卷积层设置1层时,第一层卷积层的卷积核为64个;卷积层设置2层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个;卷积层设置3层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个;卷积层设置4层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个,第四层卷积层的卷积核为128个或256个;卷积特征图的个数与卷积核的个数相同,64≤h≤256;步骤s33、对卷积特征图进行池化,定义在第k-1层为卷积层,第k层为池化层,则第k层池化公式如下:其中,是池化层的第e个池化特征图,64≤e≤256;是池化层第e个池化特征图的权重,是池化层第e个池化特征图的偏置项,为从进行下采样,下采样分为平均采样和最大值采样,是卷积层的第h个池化特征图。进一步的,所述步骤s4定义均方根误差即rmse作为评估模型来测试评价预测模型;其中,observedi是第i个地理栅格区域人流量的实际值,predictedi为第i个地理栅格区域人流量的预测值,n是地理栅格的数量;模型预测多次,最后取其平均值。本发明的有益效果是,本发明解决了传统神经网络浅层不能很好的拟合交通流量,传统时间序列模型要求交通流量呈现季节性等情况。相比于卷积神经网络预测,全卷积网络不需要接入全连接操作,能够大量减少模型参数,使得在城市人流量预测中可以快速得到一个很好的预测模型。并且利用本发明适当扩充数据维度,将其他相关的数据作为图像的通道加入到预测系统中,以rmse作为模型的评估标准,以某大型城市公布的数据为例,预测系统对比arima(自回归积分滑动平均模型)、sarima(季节性差分自回归滑动平均模型)、nn(神经网络)和cnn(卷积神经网络),效果表现的更优。本发明规避了传统神经网络浅层不能很好的拟合交通流量,传统时间序列模型要求交通流量呈现季节性等情况,利用本发明可以将其他相关的数据作为图像的通道的方式来适当扩充数据维度,捕捉更多的特征,并且本发明去除了传统卷积神经网络全连接的操作,采取反卷积来预测出下一个时间段的交通流量图,不仅可以提高预测精度,而且可以大量减少模型参数和计算消耗。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是居民交通出行流量预测系统的示意图;图2是本发明实施例的经纬度散点图;图3是本发明实施例的截取部分栅格流量的栅格划分图;图4是本发明实施例的预测效果图;图5是本发明实施例的第一层卷积的64张卷积特征图。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。居民交通出行流量预测系统,如图1所示,包括:数据收集模块,用于通过居民手机gps收集居民移动的轨迹数据信息;数据预处理模块,用于将居民轨迹清洗、统计计算以及转换成流量图;模型训练模块,用于通过卷积神经网络来提取特征,反卷积操作来预测下一个时间段的预测流量图;通过将预测流量图与实际流量图的误差来反向调节全卷积神经网络,调节全卷积神经网络中卷积核的权重、反卷积核的权重、激活函数权重来拟合出接近于真实情况的预测模型;模型测试模块,用于预测模型的测试,利用均方根误差即rmse测试评价预测模型;模型预测流量图输出模块,用于输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达。居民交通出行流量预测系统,适用于对城市居民流量整体的把控,只要是手机有gps的居民,都能够作为观测的用户。考虑到服务器的运算速率和承受情况,数据处理完成之后不再保存原来接收到的gps轨迹点,只留下处理好的流量图,在存储数据方面优化了很多,不会存储大量冗余的数据;在数据预处理阶段,清洗居民手机返回的gps轨迹信息,清洗两类gps轨迹信息,一种是居民手机返回的gps轨迹信息不在划分的预测区域内,取决于居民出行总区域划分的范围,本发明划分的范围是城市中心城区,太过偏僻的数据人口居住和出行的密度较小,不是特别具有应用实际价值。在模型训练阶段,要存储每一次训练完成之后的训练的模型,以便于后面增加数据后可继续训练模型,由于全卷积神经网络属于深度学习领域,不能很好的支持增量学习,在实际运用阶段,如果当预测时段划分的很短,历史数据集较大,重新加入实时的训练数据集训练模型需要较长的时间的话,不能完全保证系统的实时性的话,采取利用前一天的历史模型来预测当天的值;然后在夜晚,采取加入当天的数据重新训练模型,夜晚居民基本都休息,预测系统不具有太大的实际应用价值,所以在凌晨3:00-6:00系统不做预测使用,加入当天的数据集重新训练模型,调节好参数更能拟合真实值的参数,为第二天的预测做准备。居民交通出行流量预测系统的预测方法,具体按照以下步骤进行;步骤s1、数据收集模块根据居民的手机gps收集居民的轨迹数据集;采用服务器来接收居民手机返回的gps轨迹点信息,服务器接收每一个gps轨迹点的数据格式为:{id,lon,lat,t},id是居民手机的id,lon为gps轨迹点的经度,lat为gps轨迹点的纬度,t为gps轨迹点的时间;gps轨迹点组成gps轨迹数据集,一个居民的gps轨迹数据集表示为tra={(lon1,lat1,t1),(lon2,lat2,t2),(lon3,lat3,t3),...,(lonn,latn,tn)};步骤s2、数据预处理模块清洗居民出行轨迹数据,根据时段计算gps轨迹点落入的栅格区域,统计居民出行流量,做成流量图的数据格式;步骤s21、清洗居民出行轨迹数据,居民出行的gps轨迹数据集至少包含三种属性,分别为gps轨迹点的经度、gps轨迹点的纬度、gps轨迹点的时间;清洗三类轨迹数据,第一类为缺失属性的数据即某一条点位信息的部分属性值缺失;第二类为不在研究区域范围内的gps轨迹点,如果居民出行到较为偏僻的区域,则过滤掉这些信息;第三类为居民出行经纬度属性异常的点位信息,即利用两个点经纬度和时间信息,计算居民移动的最大速度,如果速度超过了客观现实居民移动的最大速度,则视为异常属性,将这含有三类异常情况的样本数据剔除;步骤s22、gps轨迹数据集对预测交通流量的区域按照经纬度划分为多个地理栅格,以预测区域的最大和最小经纬度作为划分的边界,采用迭代单位经纬度的方式,直到等于边界的经纬度,将居民出行区域划分为多个方形的地理栅格图;划分地理栅格的栅格图如图3所示;栅格区域定义如下:其中,range1(lat1,lon1,lat1,lon2,lat2,lon1,lat2,lon2)是第一个地理栅格rangen-1(latn-1,lonn-1,latn-1,lonn,latn,lonn-1,latn,lonn)是第n个地理栅格;步骤s23、gps轨迹数据集对预测交通流量的区域划分预测时段,预测时段为t;步骤s24、利用居民手机gps,根据划分好的预测交通流量的区域的地理栅格图,判断居民所处的栅格区域,当预测时段t内居民再次进入栅格范围内计入一次流量,预测时段t内在栅格区域移动不重复计入流量;每个栅格里面的值代表流量图的像素点的大小,同时也代表改栅格区域内居民出行流量的大小,利用居民手机gps,统计单位时间内的居民交通出行流量,统计完之后得到一个m×n的矩阵,其中,m是矩阵的行,m的值与栅格区域的长相等,n是矩阵的列,n的值与栅格区域的宽相等,将m×n的矩阵转换为一个单通道的流量图,记为m×n×1,其中1是通道数即单通道,即将流量数据转化为流量图或者是张量的数据格式;划分的流量图的长宽是4的偶数倍;居民的手机gps每隔10秒-60秒会向服务器返回一条gps定位信息,服务器收集居民返回的gps轨迹数据;步骤s3、模型训练模块利用卷积神经网络来对居民出行区域流量图像做卷积,提取特征,用不同大小的卷积核来做卷积,卷积过后进行池化操作,生成多个池化特征图;交通流量区域是一个复杂的动态网络,某一区域的流量的多少与周围区域或者其他区域有着依赖关系,卷积神经网络采用局部感知视野,图像的空间联系也是局部的较为紧密的像素联系,而距离较远的像素相关性则较弱,某一点发生交通拥堵,影响最大的是离它最近的区域,离它越远的区域相关性则比较弱,将居民出行的流量图利用卷积神经网络来提取特征,具体包括:步骤s31、对gps轨迹数据集进行归一化,采用(0,1)归一化,根据gps轨迹数据的均值方差,经过处理的gps轨迹数据符合标准正态分布,即均值为0,标准差为1;具体操作为,数据减去数据的平均值再除以标准差;步骤s32、利用卷积神经网络来对居民出行区域流量图做卷积,卷积操作如下:其中,g(i,j)是卷积特征图第i行第j列的输出像素值,f(i+a,j+l)是流量图第i+a行第j+l列的输入像素值,h(a,l)表示卷积核,a∈(1,2,…,m),l∈(1,2,…,n),m是卷积核长,n是卷积核宽;利用多个卷积核卷积流量图像从不同的角度卷积出不同大小的卷积特征图;不同的卷积核权重不相同,用来表达对不同图片的不同关注点;卷积层最多设置4层,卷积层设置1层时,第一层卷积层的卷积核为64个;卷积层设置2层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个;卷积层设置3层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个;卷积层设置4层时,第一层卷积层的卷积核为64个,第二层卷积层的卷积核为64个或128个,第三层卷积层的卷积核为128个或256个,第四层卷积层的卷积核为128个或256个;卷积特征图的个数与卷积核的个数相同,64≤h≤256;步骤s33、对卷积特征图进行池化,定义在第k-1层为卷积层,第k层为池化层,则第k层池化公式如下:其中,是池化层的第e个池化特征图,64≤e≤256;是池化层第e个池化特征图的权重,是池化层第e个池化特征图的偏置项,为从进行下采样,下采样分为平均采样和最大值采样,是卷积层的第h个池化特征图;然后在池化后用反卷积操作来重构预测出下一个时间段的流量图,直到生成与输入流量图像的尺寸大小相等的预测流量图,通过预测流量图与实际流量图差值来反向调节全卷积神经网络,得到预测模型;反卷积层对池化特征图进行上采样,使它恢复到流量图像相同的尺寸得到实际流量图,并对输出的每个像素都进行一个预测,同时保留了流量图像中的空间信息,得到下一个预测时间段的流量图,通过增加反卷积次数来增加预测流量图的准确性;利用划分好的栅格区域,将生成的实际流量图映射在地图上,直观的看出哪些是居民出行的热点区域,对居民出行流量做地理可视化表达;并计算预测流量图和实际流量图的误差,计算误差采用每一个栅格区域的实际流量图和预测流量图的流量差值作为损失函数;利用反向传播,调整反卷积核的权重和激活函数,重构预测出居民出行流量数据的具体分布;传统的反卷积将特征图还原到流量图的图像大小,特征图从前一层一直向后传播,对于每一层都求出反卷积核然后重构出图像;本文中向前传播的操作有卷积和池化,到指定的层不用卷积和池化操作后,即到了前向传播的最后一层,然后开始连续的反卷积并求出反卷积核,然后重构出图像,本文重构的不是原流量图像,而是下一个时间段的流量图像;步骤s4、模型测试模块是利用预测模型进行测试;定义均方根误差rmse作为评估模型来测试评价预测模型;其中,observedi是第i个地理栅格区域人流量的实际值,predictedi为第i个地理栅格区域人流量的预测值,n是地理栅格的数量;模型预测多次,最后取其平均值;步骤s5、利用出流量和入流量来增加流量图像通道,将流量图原有的单通道扩充到2个通道来增加输入数据的维度从而提高预测的准确性,模型预测流量图输出模块输出预测流量图并根据划分栅格网的经纬度范围将预测流量图映射到地图上,做直观的地理可视化表达;栅格区域的总流量与栅格区域的入流量和出流量相关,利用出流量和入流量来增加流量图像通道,使得预测数据不单一。实施例步骤s1、根据居民的手机gps手机居民的轨迹数据集;步骤s2、清洗居民出行轨迹数据,根据时段计算轨迹点位落入的栅格区域,统计居民出行流量,做成流量图的数据格式;步骤s21、清洗居民出行轨迹数据,居民出行的轨迹数据集至少包含三种属性,分别为gps轨迹点的经度、gps轨迹点的纬度、gps轨迹点的时间;清洗三类轨迹数据,第一类为缺失属性的数据即某一条点位信息的部分属性值缺失;第二类为不在研究区域范围内的gps轨迹点,如果居民出行到较为偏僻的区域,则过滤掉这些信息;第三类为居民出行经纬度属性异常的点位信息,即利用两个点经纬度和时间信息,计算居民移动的最大速度,如果速度超过了客观现实居民移动的最大速度,则视为异常属性,将这含有三类异常情况的样本数据剔除;步骤s22、gps轨迹数据集对预测交通流量的区域按照经纬度划分为多个地理栅格,以预测区域的最大和最小经纬度作为划分的边界,采用迭代单位经纬度的方式,直到等于边界的经纬度,将城市居民出行区域划分为多个方形的地理栅格图;划分地理栅格的栅格图如图3所示;栅格区域定义如下:本身稀疏的区域对城市居民出行流量不具有实际应用价值,划分的流量图的长宽是4的偶数倍,例如16×8,16×16,32×32,更利于做卷积和池化操作;步骤s23、gps轨迹数据集对预测交通流量的区域划分预测时段,预测时段为t;定义预测时段:t=30min;每隔30min统计城市居民出行的流量图像,统计流量如下:if((lat1<=lat1&&lat1<=lat2&&lon1<=lon1&&lon1<=lon2)&&((tx-t1)<=30min))then(grid1flow+=1);一个栅格为一个方形,即有四个经纬度点,如果预测时段为30min,则居民出行的gps点落入该栅格中,则流量加1;t1是小于t时第一次再次进入栅格区域的gps轨迹点对应的时间,tx是小于t时最后一次再次进入栅格区域的gps轨迹点对应的时间,如果轨迹点一直都在该栅格区域不动,则表示按照t的间隔切分轨迹点时该居民的在t时间段最后一条gps点位信息;先判断所有的gps轨迹点属于哪个栅格区域,30min内一个居民如果在栅格区域有很多gps轨迹点,进行去重操作,就相当于只计入一次流量,最后分组统计每个栅格区域在半小时内共有多少流量,并制作成统一的流量图或者张量格式,例如一个24×24的栅格区域,如果是单通道的话,统一转换成24×24×1的格式,图片层面,1就是通道数,24×24表示图像的尺寸,对应在地图上的层面,划分的栅格区域也就是共预测576个居民出行区域,每一个小栅格是1km×1km,则地图上总预测区域面积为24km×24km;一个栅格的具体划分范围,根据实际需求,每个小的栅格区域也可划分为0.3km×0.3km、0.5km×0.5km,1km×1km,预测时间段可采取更小或者更大的时间段,本发明是每隔半小时预测一次;步骤s3、流量图作为卷积神经网络的输入,利用卷积神经网络来对居民出行区域流量图像做卷积,提取特征,用不同大小的卷积核来做卷积,并进行池化操作,生成多个池化特征图;图2经纬度散点图,图3为栅格流量的栅格划分图,将图2和图3结合统计人群的出行流量,根据划分的经纬度栅格和居民出行的经纬度位置,统计计算得到流量矩阵,然后转换为对应的流量图,图2为经纬度散点图,每个地图上的真实区域对应在流量图上就是一个小的栅格,每个栅格里面的值代表流量图的像素点的大小,同时也代表改栅格区域内居民出行流量的大小,如果是一般的灰度图像则像素值最大为255,而本文的流量图的最大像素点不是255,而是实际的流量大小,可能大于255;步骤s31、对gps轨迹数据集进行归一化,采用(0,1)归一化,根据gps轨迹数据的均值方差,经过处理的gps轨迹数据符合标准正态分布,即均值为0,标准差为1;具体操作为,数据减去数据的平均值再除以标准差;步骤s32、利用卷积神经网络来对居民出行区域流量图做卷积,卷积操作如下:其中,g(i,j)是特征图第i行第j列的输出像素值,f(i+a,j+l)是流量图第i+a行第j+l列的输入像素值,h(a,l)表示卷积核,a∈(1,2,…,m),l∈(1,2,…,n),m是卷积核长,n是卷积核宽;卷积特征图的大小为流量图大小的一半;利用tensorflow的tf.layers.conv2d()来实现多个卷积核卷积流量图从不同的角度卷积出不同大小的卷积特征图;不同的卷积核权重不相同,用来表达对不同图片的不同关注点;步骤s33、对卷积特征图进行池化,定义在第k-1层为卷积层,第k层为池化层,,则第k层池化公式如下:其中,是池化层的第e个池化特征图,64≤e≤256;是池化层第e个池化特征图的权重,是池化层第e个池化特征图的偏置项,为从进行下采样,下采样分为平均采样和最大值采样,是卷积层的第h个池化特征图;最大值采样和平均值采样对应在tensorflow中分别是tf.layers.max_pooling2d()和tf.layers.avg_pooling2d(),实施例采用最大值采样来进行池化操作;图5为第一层卷积层卷积后的64张卷积特征图,如果得到的卷积特征图越来越小,分辨率越来越低,得到比较粗略的图像,太小的卷积特征图会破坏空间的依赖性,例如九宫格,中心的宫格的区域与周边八个宫格区域都有依赖关系,太小的卷积特征图会破坏这种依赖关系,如果卷积特征图最后为1×1,网络的深度加深,但是不能很好的捕捉流量区域空间的依赖,可能导致流量预测精度波动,所以卷积层数不能太多,卷积特征图的大小不能太小;池化特征图作为反卷积操作的输入,用反卷积来做预测:多次反卷积得到下一时间段的预测流量图;反卷积层对池化特征图进行上采样,使它恢复到流量图像相同的尺寸得到实际流量图,并对输出的每个像素都进行一个预测,同时保留了流量图像中的空间信息,得到下一个预测时间段的流量图,通过增加反卷积次数来增加预测流量图的准确性,图4为最终反卷积的预测流量图映射在地图上的效果图;利用划分好的栅格区域,将生成的实际流量图映射在地图上,直观的看出哪些是居民出行的热点区域,对居民出行流量做地理可视化表达;并计算预测流量图和实际流量图的误差,计算误差采用每一个栅格区域的实际流量图和预测流量图的流量差值来反向调节全卷积神经网络;步骤s4、模型测试模块是利用预测模型进行测试;定义均方根误差即rmse作为评估模型来测试评价预测模型;其中,observedi是第i个地理栅格区域人流量的实际值,predictedi为第i个地理栅格区域人流量的预测值,n是地理栅格的数量;模型预测多次,最后取其平均值;步骤s5、扩展流量图像数据的通道;通道首先是在数字图像中最开始出现的,单通道是一个像素点只需要一个数值表示,只能表示灰度,单通道是灰度图像,0表示黑色,255表示白色,从图像的角度来讲,最多的会有4个通道,分别是rgba,分别是表示r、g、b三个颜色通道和透明度;将流量矩阵分割成为入流量和出流量,将原有的一个通道扩充为两个通道,相当于细化了特征,某一个栅格区域的总流量其实是与进入栅格区域和从栅格区域出去的流量很相关,而且进入栅格区域的流量是从别的栅格区域流入的,同理从本栅格区域出去的出行流量也将流入其他栅格区域。居民交通出行流量预测系统的输入流量图的格式是m×n×1,一个m×n尺寸单通道的图像,输出为一个m×n尺寸单通道的图像;统计的m×n大小的图像流量为规定时间段总人群流量,具体利用出入流量的方法来扩充方法为数据维度是:在规定时间内统计流入和流出该区域的人群流量,则输入系统输入流量图的格式是个m×n×2,则表示一个m×n尺寸2个通道的图像,2个通道分别代表一个为流入该区域流量,一个流出该区域流量。输出是m×n×1或者是m×n×2,如果是输出为m×n×1则是利用该区域规定时间的出入量的人群流动情况来预测该区域总的流量;如果输出m×n×2则是利用该区域规定时间的出入量的情况来预测该区域的人群出入量。在模型测试阶段,实施例选用2017年的4月1日-2017年7月30日的数据作为训练数据,8月1日-8月31日的数据作为测试数据,数据的格式为(样本量,图像长度,图像宽度,图像通道),预测时间段为30分钟,输入m×n×1输出也为m×n×1,采用rmse测试预测模型,平均每个栅格的流量为97.4,预测的rmse为15.40,均方根误差rmse越小,表示预测模型的精度越高。利用出入量来扩充数据维度,输入m×n×2,输出也为m×n×1,预测得到rmse为15.31。以rmse作为评估标准,不同算法模型人流量预测对比如表1所示:表1不同模型结果对比表算法模型rmsearima23.87sarima22.46nn24.4cnn17.1本文方法15.31在模型预测流量图输出模块中,输出的预测流量图和输入的流量图尺寸大小相同假设测试数据中的输入为t时刻的流量图像,预测输出则为t+1时刻的流量图像。本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1