一种车辆出行量预测模型构建方法及预测方法和系统

文档序号:26584427发布日期:2021-09-10 18:35阅读:84来源:国知局
一种车辆出行量预测模型构建方法及预测方法和系统

1.本发明涉及车辆交通流预测技术,具体涉及一种车辆出行量预测模型构建方法及车辆出行量预测方法。


背景技术:

2.实现未来时段内较为准确的车辆(如出租车、网约车等)需求预测可以帮助车辆运营部门进行科学合理的车辆调度与管理,进一步降低城市范围内车辆的空驶率,节约车辆运营成本,同时有效降低乘客打车时由于候车所付出的时间成本,实现司乘双赢。
3.车辆出行量数据具有复杂的时空依赖关系,现有方法难以有效提取这种高度抽象的非线性关系,并且大多是对经网格划分后的网格内车辆出行量进行预测,这在一定程度上破坏了出行量数据内部潜在的空间关系,在空间粒度上不够精细。在基于图网络的车辆需求预测方法中,构图方式较为单一,不利于充分提取出行量数据的空间关系。


技术实现要素:

4.针对现有技术的缺陷或不足,本发明的一方面提供了一种车辆出行量预测模型构建方法。
5.为此,本发明提供的车辆出行量预测模型构建方法包括:
6.(1)数据预处理,包括:
7.采集目标区域待预测时隙之前(不包括待预测时隙)多个历史时隙内的车辆轨迹数据,并将车辆轨迹数据与目标区域的路段进行匹配,得到原始数据;
8.采集每时间段的外部因素获得外部因素数据,所述外部因素包括星期几、空气质量、温度和天气中一种或两种以上因素,所述最后一个历史时隙之前(不包括最后一个历史时隙)的所有历史时隙被划分为多个所述时间段;
9.(2)利用多个历史时隙内最后一个历史时隙之前的原始数据构建目标区域的路段出行量局部关系图、路段出行量全局关系图和路段出行量od次数关系图;利用多个历史时隙内最后一个历史时隙之前的外部因素数据构建外部因素特征矩阵;
10.所述路段出行量局部关系图包括路段出行量矩阵、第一邻接关系矩阵和目标区域的边集;
11.所述路段出行量矩阵的任一行向量为任一路段i的出行量向量,该路段i的出行量向量由每个历史时隙内该路段i的车辆出行量构成,路段i为目标区域内的任一路段;
12.所述第一邻接关系矩阵的任一元素a
ij
为路段i与路段j的相邻关系,如路段i与路段j互相交叉或首尾相接,则a
ij
=1,否则a
ij
=0,任一行向量由任一路段i与自身及其他路段的相邻关系构成,路段j为目标区域内的任一路段;
13.所述路段出行量全局关系图包括所述路段出行量矩阵、第二邻接关系矩阵和所述目标区域的边集;
14.所述第二邻接关系矩阵的任一元素b
ij
为路段i的出行量向量与路段j的出行量向
量相似度,任一行向量由任一路段i的出行量向量与自身的出行量向量及其他路段的出行量向量的相似度构成;
15.所述路段出行量od次数关系图包括所述路段出行量矩阵、第三邻接关系矩阵和所述目标区域的边集;
16.所述第三邻接关系矩阵的任一元素c
ij
为归一化后的路段i到路段j的od次数,任一行向量由归一化后的路段i到自身的od次数及归一化后的路段i到其他各路段的od次数,
[0017][0018]
x
ij
为目标区域最后一个历史时隙之前路段i与路段j间的od次数或者x
ij
为所有时间段内的路段i与路段j间od次数的平均值,r为目标区域的所有路段集合;
[0019]
所述外部因素特征矩阵由每个时间段的外部因素特征向量构成,任一时间段的外部因素特征向量由该时间段的外部因素构成;
[0020]
(3)以所述路段出行量局部关系图、路段出行量全局关系图和路段出行量od次数关系图和外部因素特征矩阵作为输入,以最后一个历史时隙内各路段车辆出行量为标签,对tcn和gcn混合深度网络进行训练,得到预测模型;
[0021]
所述tcn和gcn混合深度网络由四个通道和卷积层构成,其中三个通道各自均包含依次设置的一层tcn、两层gcn和一层tcn,这三个通道内的一个通道的输入为所述路段出行量全局关系图、一个通道的输入为路段出行量局部关系图、另一个的输入为所述出行量od次数关系图;第四个通道包括全连接层,该第四个通道的输入为外部因素特征矩阵;将所述四个通道的输出进行融合后,输入所述卷积层。
[0022]
可选的,所述多个历史时隙的总时长为数周、数个月或数年。
[0023]
可选的,所述时间段时长为数个小时、半天、一天或多天。
[0024]
可选的,所述每个历史时隙为数秒或数分钟。
[0025]
可选的,所述待预测时隙时长为数分钟、数小时、半天或一天。
[0026]
可选的,对所述各时间段的外部因素中的各因素分别采用独热向量进行编码,之后对各因素的编码进行级联,得到总独热向量,该总独热向量为相应时间段的外部因素特征向量。
[0027]
本发明还提供了一种车辆出行量预测方法。所提供的预测方法是对上述待预测时隙的车辆出行量进行预测,包括
[0028]
(一)数据采集与预处理,包括:
[0029]
采集目标区域待预测时隙之前多个历史时隙内的车辆轨迹数据,并将车辆轨迹数据与目标区域的路段进行匹配,得到原始数据;
[0030]
采集每时间段的外部因素获得外部因素数据,所述外部因素包括星期几、空气质量、温度和天气中一种或两种以上因素,所述多个历史时隙被划分为多个所述时间段;
[0031]
(二)采用上述步骤(2)方法利用多个历史时隙内的原始数据构建目标区域的路段出行量局部关系图、路段出行量全局关系图和路段出行量od次数关系图;利用所述多个历史时隙内的外部因素数据构建外部因素特征矩阵;
[0032]
(三)将步骤(二)构建的路段出行量局部关系图、路段出行量全局关系图、路段出
行量od次数关系图和外部因素特征矩阵输入上述方法构建的模型中,输出待预测时隙内的车辆出行量预测值。
[0033]
又一种车辆出行量预测方法,对上述待预测时隙的下一个待预测时隙内的车辆出行量进行预测,包括:
[0034]
以上述步骤(二)构建的路段出行量局部关系图、路段出行量全局关系图、路段出行量od次数关系图和外部因素特征矩阵作为输入,以待预测时隙内的车辆出行量为输出对上述方法构建的模型进行更新;
[0035]
之后采用上步骤(一)、(二)所述方法及更新后的模型对下一个待预测时隙的车辆出行量进行预测。
[0036]
本发明同时提供了一种车辆出行量预测系统。所提供的预测系统包括数据预处理模块、数据构建模块和预测及更新模块,所述数据预处理模块用于执行上述步骤(一),所述数据构建模块用于执行上所述步骤(二),所述数据预测及更新模块用于对新待预测时隙的预测模型进行更新并利用更新后的模型对新待预测时隙的车辆出行量进行预测。
[0037]
与现有技术相比,本发明的效果是:
[0038]
本发明主要是考虑了车辆出行量数据内在的多种空间特征关系,另外考虑了外部因素对车辆需求的影响,同时设计出一种新的车辆出行量预测网络结构,方法整体在充分考虑了车辆出行量数据内在的多种空间特征关系,联合外部因素对深度网络进行训练,具有预测结果更准确的优点。
附图说明
[0039]
图1为本发明的混合深度网络结构示例图;
[0040]
图2为实施例6中时隙大小对mfgtn网络的影响图;
[0041]
图3为实施例7中预测步长对网络的影响(rmse)图,横坐标1

5分别代表预测步长为5min、10min、15min、20min、25min的对比方案;
[0042]
图4为实施例7中预测步长对网络的影响(mae)图,横坐标1

5分别代表预测步长为5min、10min、15min、20min、25min的对比方案;
[0043]
图5为实施例7中预测步长对网络的影响(mape)图,横坐标1

5分别代表预测步长为5min、10min、15min、20min、25min的对比方案。
具体实施方式
[0044]
除非有特殊说明,本文中的术语或方法根据相关领域普通技术领域人员的常规认识理解或采用已有相应方法实现。
[0045]
本发明方法中的车辆轨迹数据的采集及数据内容对于本领域技术人员来讲是公知的,所采集的数据内容至少包括车牌号、gps采样时间、gps地理位置、载客状态等。本发明所采集的车辆轨迹数据是针对目标区域例如一个城市、一个地区的车辆轨迹数据,并且是其一定历史范围及待预测时隙之前(不包括待预测时隙)多个历史时隙内的数据,该历史时间范围满足预测方法的数据量要求即可,例如一周、多周、半个月、一个月、多个月或一年、多年等。并且,在车辆轨迹数据采集过程中,需对数据进行清洗和校正,数据清洗目的是去除无效数据、格式错误和异常数据、在某个时间段内gps地理位置没有变化以及不在目标区
域内的数据,得到合格数据。校正的目的对数据进行地图匹配,对其中的gps数据的误差进行校正;数据清洗和校正的方法手段对于本领域技术人员来讲是公知的。
[0046]
本发明所述历史时隙大小可取数秒、数分钟,也根据待预测时隙确定,例如:一次待预测时隙取5分钟,送入一周的数据进行训练,一次预测可预测未来一个时隙(5min)的出行量信息。时隙取的越小,预测的准确率就越高;时隙增大,预测准确率降低。
[0047]
本发明的待预测时隙时长即预测步长可根据预测需求来改变,例如:在网络训练好后,可以预测未来一个步长的出行量信息。预测步长取的越小,预测的准确率越高;预测步长取的越大,网络的预测误差均逐渐增大,这是由多次单步预测的误差积累造成的。
[0048]
本发明的对车辆轨迹数据与目标区域的路段进行匹配是将车辆轨迹数据中的坐标信息与路段的地理坐标信息进行匹配,如可采用地图匹配。进一步,对于一定时间范围内车辆流量小于某一特定次数的路段通常不被视为主要路段,这些路段对于车辆流量预测的影响很小,可将其删除。在具体实施方案中,为方便数据分析,对各路段设置id,路段id以取自然数,也可以设置为相应便于数据处理的索引号等。
[0049]
本发明中采集所述历史时间范围内各时间段的外部因素,所述外部因素主要考虑星期几、天气、空气质量、气温四种因素中一种或几种。其中,星期几指星期一至星期七;天气取常见的天气预报中的天气,如晴、多云、阴、小雨、中雨、大雨;气温根据目标区域常年历史温度确定相应温度范围,为更使预测更精确,根据人类对温度的喜好可将温度范围划分为多个区段,也可等间隔划分为对各区段;空气质量可使用空气质量指数(air quality index,aqi)来反映,一般常见aqi范围取0~150,根据空气质量相关标准划分为相应区段,也可等间隔划分为多个区段。考虑到外壁因素变动时长的特点,本发明采集一定时间段的外部因素,所述时间段可以取半天、一天、多天,常见如每天的外部因素。在构建外部因素特征矩阵时,可采用独热向量编码方式构建矩阵,例如对于星期几可以使用7位独热向量进行编码,第几位为1就表示当前向量代表星期几;天气使用6位独热向量进行编码,分别表示晴、多云、阴、小雨、中雨、大雨六种天气状况;空气质量aqi范围取0~150,以10为间隔进行分段,则可用15位独热向量对空气质量指数进行编码;气温范围为10℃~28℃,以2℃为间隔进行分段,则可用9位独热向量对气温进行编码。之后将上述四种编码进行级联,得到相应时间段内的37位的独热向量,之后构建外部因素特征矩阵。
[0050]
本发明所述车辆出行量和od次数是指,若一辆车的上车点位于路段i上,下车点位于路段j上,则认为发生了一次路段i到路段j的出行,在一定时间范围内路段i与路段j之间的总出行次数即为该时间段两条路段之间的od次数,某一路段的出行总次数则视为该时间范围内本路段的车辆出行量。具体可通过上客事件和下客事件检测算法,可提取到上车点与下车点,可分时间段计算各路段之间的od次数。
[0051]
在对数据相似度度量时,为了对样本间的相似程度进行直观的、数量化的描述,通常通过数据间的距离来反映相似度,数据间的距离大小与样本间的相似度成反比关系。本发明的任意两个路段的出行量向量相似度可采用欧氏距离法、余弦相似度法、dtw算法或fastdtw算法计算。
[0052]
本发明所述目标区域边集为目标区域内任一路段与其他路段之间的关系构成的矩阵,其中两条路段(如路段i与路段j)之间的关系至少包括连接方式(单行或双行)、距离(欧氏距离或真实路网中的距离)或是路段之间的相似程度。对于任一目标区域的边集本领
accurate dynamic time warping in linear time and space[j].intelligent data analysis,2007,11(5):561

580.公开的fastdtw算法计算路段i的车辆出行量序列x
i
与路段j间的车辆出行量序列x
j
相似度ω
ij
计算公式如式:
[0063][0064]
其中,为x
i
与x
j
间的欧式距离,ε和σ2为经验值,σ2通常为10的整次幂,该实施例中ε和σ2分别设置为0.5和1000;
[0065]
该实施例的第三邻接关系矩阵的任一元素c
ij

[0066][0067]
其中,x
ij
为目标区域历史时间范围内路段i与路段j间的日均od次数;
[0068]
该实施例的目标区域的边集根据文献:殷剑宏,吴开亚.图论及其算法[m].中国科学技术大学出版社,2003.中公开的内容提取;
[0069]
该实施例所构建的外部因素特征进行提取,主要考虑每天的星期几、天气状况、空气质量和气温四种因素,其中,星期几使用7位独热向量进行编码,第几位为1就表示当前向量代表星期几;天气状况使用6位独热向量进行编码,分别表示晴、多云、阴、小雨、中雨、大雨六种天气状况;空气质量则使用空气质量指数(air quality index,aqi)来反映,表1为研究时段内的空气质量等级示意表,aqi范围取0~150,以10为间隔进行分段,则可用15位独热向量对空气质量指数进行编码;研究时段内气温范围为10℃~28℃,以2℃为间隔进行分段,则可用9位独热向量对气温进行编码;将上述四种编码进行级联,得到37位的独热向量,表示外部因素特征矩阵。
[0070]
表1
[0071][0072]
如表1所示,为外部因素特征矩阵中的一个行向量,其表示信息为当前为星期一、晴天、aqi指数为70~80之间,空气质量为70

80(等级为良)、气温为18~20℃。
[0073]
表2研究时段内的空气质量等级示意表
[0074][0075]
依照步骤(7)所述方法,进行网络训练,该实施例的tcn和gcn混合深度网络由四个通道和一个卷积层构成,其中第四个通道包含两个全连接层,网络结构如图1所示。
[0076]
本实施例中,初始学习率设置为0.0001;
[0077]
本实施例中预测网络基于tensorflow深度学习框架搭建,采用基于自适应学习率的adam梯度下降算法进行网络训练批次大小设置为32,迭代次数设置为100,同样采用了提前终止策略避免过拟合。
[0078]
网络训练的目标是使得各路段车辆出行量的真实值与经过网络处理所得的各路段车辆出行量的预测值间的误差最小化。网络训练过程中所采用的损失函数如式:
[0079][0080]
其中,表示各路段车辆出行量的真实值,y表示网络的预测值,l2表示正则化项,以避免网络发生过拟合,λ为超参数。
[0081]
模型的评价指标为rmse、mae和mape。本实施例中,出租出出行量预测对比实验结果如下表所示:
[0082]
表3对比实验结果
[0083][0084]
mlp:guo x,zhu q.a traffic flow forecasting model based on bp neural network[c]//2009 2nd international conference on power electronics and intelligent transportation system(peits).ieee,2009:311

314.
[0085]
svr:hong w.traffic flow forecasting by seasonal svr with chaotic simulated annealing algorithm[j].neurocomputing,2011,74(12

13):2096

2107.
[0086]
lstm:fu r,zhang z,li l.using lstm and gru neural network methods for traffic flow prediction[c]//2016 31st youth academic annual conference of chinese association of automation(yac).ieee,2016:324

328.
[0087]
gcn:wu z,pan s,chen f,et al.a comprehensive survey on graph neural networks[j].arxiv preprint arxiv:1901.00596,2019.
[0088]
t

gcn:zhao l,song y,zhang c,et al.t

gcn:a temporal graph convolutional network for traffic prediction[j].ieee transactions on intelligent transportation systems,2019,21(9):3848

3858.
[0089]
mgln:multitask learning and gcn

based taxi demand prediction for a traffic road network[j].sensors,2020,20(13):3776.
[0090]
实施例2:
[0091]
该实施例与实施例1不同的是,该实施例所构建的外部因素特征矩阵考虑星期几。
[0092]
实施例3:
[0093]
该实施例与实施例1不同的是,该实施例所构建的外部因素特征矩阵考虑天气状况。
[0094]
实施例4:
[0095]
该实施例与实施例1不同的是,该实施例所构建的外部因素特征矩阵考虑空气质量。
[0096]
实施例5:
[0097]
该实施例与实施例1不同的是,该实施例所构建的外部因素特征矩阵考虑气温。
[0098]
对比例:
[0099]
该对比例与实施例1不同的是:不考虑外部因素,且网络训练为七种策略,即路段出行量全局关系图、路段出行量局部关系图、路段出行量od次数关系图选其一、其二和三者。
[0100]
上述实施例与对比例预测效果对比如表4所示:
[0101]
表4
[0102]
[0103][0104]
表4中,g
local
、g
global
和g
od
分别表示路段出行量全局关系图、路段出行量局部关系图、路段出行量od次数关系图;x
ext
表示实施例1的外部因素特征矩阵表示为;x
d
、x
w
、x
a
和x
t
分别表示星期因素矩阵、天气因素矩阵、空气质量因素矩阵和气温因素矩阵,即对应实施例2

5。
[0105]
结果显示:当输入包括路段出行量全局关系图、路段出行量局部关系图、路段出行量od次数关系图三种图时,网络预测的rmse、mae和mape分别为0.9462、0.6335、7.5553%,可以看出充分考虑车辆出行量数据间的多种空间关系有利于促进网络对空间特征的挖掘,提升网络的预测能力;
[0106]
此外,可以看出,分别将星期因素矩阵、天气因素矩阵、空气质量因素矩阵和气温因素矩阵逐个加入网络输入也可以降低预测误差,其中加入天气因素矩阵的效果最明显。进一步地,实施例1加入了外部因素特征矩阵作为输入,充分考虑了星期几、天气状况、空气质量、气温等外部因素对车辆出行量的影响,从而有效降低了网络预测误差。
[0107]
实施例6:
[0108]
本实施例中,与实施例1的时隙设置大小为5分钟不同的是,分别设置15分钟和30分钟进行时隙划分。图2为时隙大小对本发明网络的影响实验结果图。
[0109]
实施例7:
[0110]
本实施例中,使用实施例1网络实现路段车辆出行量预测,以探究预测步长对网络表现的影响,并与使用mgln网络进行多步预测的结果进行对比,各方案分别设置待预测时隙时长即预测步长为5min、10min、15min、20min、25min进行对比实验。
[0111]
图3、图4和图5分别为使用mgln网络和实施例1网络实现多步预测的rmse、mae和mape结果图,可以看出,由于实施例1网络与mgln网络相比,在不同的预测步长下,实施例1网络的预测误差均低于mgln网络。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1