基于CNN-BiLSTM的城市公交客流短时预测方法与流程

文档序号:34023928发布日期:2023-05-05 06:07阅读:117来源:国知局
基于CNN-BiLSTM的城市公交客流短时预测方法与流程

本技术涉及一种客流预测方法,尤其涉及基于cnn-bilstm的城市公交客流短时预测方法,属于客流预测。


背景技术:

1、城市公交客流预测是优化城市公共交通资源的重要手段,准确的预测城市公交客流对于制定科学合理的线网方案、站点规划具有重要意义。目前,国内外针对城市公交客流预测领域研究成果较少,客流预测方法大多采用机器学习及统计学方法。传统机器学习主要通过单一历史客流进行分析,如卡尔曼滤波模型、经验模态分解及自适应增强等模型,此类模型难以很好地反映出不规律的公交客流状态。为了进一步挖掘影响客流的深层特征,近年来深度学习在公交客流短时预测方面取得了研究进展,深度学习模型通过对多维数据特征结构建立联系,挖掘出数据之间的复杂特征,并通过大量学习弥补了传统预测模型对特征值掌握不足的问题,提高了预测精度。

2、目前,针对城市公交客流预测模型存在以下缺点:

3、1、缺乏充分考虑公交客流的时空关联性;公交出行存在较强的时空关联性,难以基于单一模型进行预测,传统机器学习模型缺乏高维度非线性特征的识别分析能力,仅从单一的时间或空间维度进行预测,难以较好地反映出不规律的公交客流状态;

4、2、影响因素分析不够全面;公交客流预测受公交站点距离、天气情况、公交线路直线系数、乘客出行目的等多种影响因素,特别是受天气、节假日等因素影响时,传统机器学习及深度模型对特征值掌握不足将难以准确的预测公交客流,特别是当客流波动幅度较大的情况下,模型的抗干扰能力较差;

5、3、特征矩阵排列方式并非最优;深度学习模型的输入为特征矩阵,公交客流特征矩阵的结构对客流预测效果具有较大的影响,当前深度学习模型缺乏对特征矩阵结构进行高效优化,仍未挖掘出深度学习对公交客流预测的潜力。


技术实现思路

1、在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

2、鉴于此,为解决现有技术中存在的技术问题,本发明提供基于cnn-bilstm的城市公交客流短时预测方法。

3、方案一、基于cnn-bilstm的城市公交客流短时预测方法,包括以下步骤:

4、s1.分析影响公交客流出行的原因,构建影响公交客流出行的内部特征和外部特征;

5、s2.根据影响公交客流出行的内部特征和外部特征构建客流特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8),其中,x1为天气状况,x2为高峰/非高峰时期,x3为节假日/工作日,x4为站点周边吸引度,x5为历史客流,x6为刷卡时间,x7为乘客刷卡类型,x8为乘客依赖度;

6、s3.对特征矩阵的排列结构进行耦合寻优,量化客流特征矩阵的内部特征和外部特征之间的耦合关系,选择最优排列结构的客流特征矩阵;

7、s4.构建cnn-bilstm公交客流预测模型;

8、s5.将目标公交线路客流特征矩阵输入至训练后的cnn-bilstm公交客流预测模型,输出目标公交线路的客流量,完成短时公交客流预测。

9、优选的,s1具体是包括以下步骤:

10、s11.内部特征包括:乘客刷卡数据、历史客流、刷卡时间和乘客依赖度,构建方法如下:

11、刷卡数据分类为普通卡、老人卡和二维码;

12、历史客流,通过乘客刷卡数据分析目标公交线路的历史客流,构建历史客流特征向量;

13、刷卡时间,通过乘客刷卡数据分析目标公交线路乘客的刷卡时间,构建刷卡时间特征向量;

14、乘客依赖度,将乘客一周内乘车次数及一周内连续乘坐同一公交线路的天数作为评价指标,计算指标之间的支持度、置信度和提升度,将乘客对公交出行的依赖程度聚类为低、中、高3种程度;

15、支持度通过计算乘客一周内的乘车次数及一周内连续乘坐同一公交线路的比例,其计算公式为:

16、;

17、其中,support(a,b)表示a,b之间的支持度,count(a,b)表示同时包含特征a和b的次数;a表示乘客一周内的乘车次数,b表示乘客一周内连续乘坐同一公交线路的次数;

18、置信度是指在所有包含特征a的集合中,同时包含特征b的比例,其计算公式为:

19、;

20、其中,表示特征a与特征b的置信度,support(a)表示包含特征a的支持度;

21、提升度是指特征a的出现对特征b的出现概率提升的程度,其计算公式为:

22、;

23、其中,lift(a→b)表示特征a与特征b的提升度,confidence(a→b)表示特征a与特征b的置信度,support(b)表示特征b的支持度;提升度大于1表示特征a的出现对特征b的出现是正向作用,小于1表示负向作用,等于1表示特征a和特征b之间没有关联;

24、s12.外部特征包括:高峰/非高峰时期、天气情况、节假日及工作日和公交站点吸引度,构建方法如下;

25、高峰/非高峰时期,将城市交通出行的高峰时期定义为7:00-9:00和17:00-19:00,非高峰时期为6:00-7:00、9:00-17:00、17:00-24:00;将客流在高峰时期出行的特征值定义为1,非高峰时段出行的特征值定义为0;

26、天气情况,将降水量小于10mm特征值定义为1、降雨量在10-25mm特征值定义为2、降雨量在25-50mm特征值定义为3、降雨量大于50mm特征值定义为4;

27、节假日及工作日,将工作日特征值定义为1,节假日特征值定义为2;

28、公交站点吸引度,选取站点周边500米范围内居住设施、商业设施、教育设施及休闲场所的poi数据作为公交线路站点的吸引度。

29、优选的,s3具体是:包括以下步骤:

30、s31.通过对客流特征矩阵进行卷积操作提取出每个矩阵点的特征值进行预测;

31、s32.通过互信息量mi度量特征向量之间的相关性,筛选相关性最强的特征矩阵作为最优结构,作为模型预测阶段的特征矩阵排列结构,mi的计算方式如下所示:

32、;

33、式中,p(x,y)为x和y的联合概率密度函数,i(x,y)为互信息量,x,y分别为特征矩阵x(x1,x2,x3,x4,x5,x6,x7,x8)中的特征向量。

34、优选的,s4具体是,cnn-bilstm公交客流预测模型包括输入层、cnn层、bilstm层、全连接层和输出层;

35、其中,输入层为输入特征矩阵,cnn层是由卷积层及最大池化层堆叠组成,将公交客流特征矩阵经过归一化处理输入至卷积层,经过卷积操作后保持特征矩阵的长度和宽度不变,得到新的特征矩阵,卷积层计算公式如下:

36、;

37、式中,表示卷积网络第i层特征矩阵,表示激活函数,表示卷积运算,表示第i层使用的卷积核的权重值,表示偏置项;

38、激活函数选用relu函数,计算公式如下:

39、relu=max(0,x)

40、式中,x表示输入的特征矩阵;

41、最大池化层,计算公式如下:

42、;

43、;

44、式中,h表示输入特征矩阵的长度,w表示输入特征矩阵的宽度,表示池化后输出特征矩阵的长度,表示卷积后输出特征矩阵的宽度,卷积核大小为k,步长为s;

45、bilstm层由前向lstm与后向lstm组成,bilstm层输入为cnn层的输出数据,进入前向lstm和后向lstm,分别将正向输入序列和反向输入序列的输出结果相结合,得到最终的输出结果,计算公式如下:

46、;

47、;

48、;

49、式中,表示前向隐向量,表示后向隐向量,xt表示当前t时刻输入特征向量,表示t时刻输出向量,σ表示激活函数,表示前向权重矩阵,表示前向时间步,表示后向权重矩阵,表示后向时间步,表示偏置向量;

50、全连接层将输出的特征值按照权重进行加权重组,最后输出预测值,计算公式如下:

51、;

52、式中,表示预测值,表示bilstm模型的输出向量,表示权重矩阵,表示偏置矩阵。

53、方案二、一种电子设备,包括存储器和处理器,存储器存储有计算机程序,所述的处理器执行所述计算机程序时实现方案一所述的基于cnn-bilstm的城市公交客流短时预测方法的步骤。

54、方案三、一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现方案一所述的基于cnn-bilstm的城市公交客流短时预测方法。

55、本发明的有益效果如下:

56、1、本发明考虑了影响城市公交客流的时空关联性,分别分析了影响公交客流出行的时间特征及外部特征,能够较好地反映出不规律的公交客流状态;

57、2、本发明通过多源数据分析,引入了公交站点吸引度、节假日、天气情况等外部因素,同时引入了公交乘客依赖度、乘客刷卡类型等内部因素,构建了较为全面的多维公交客流出行特征矩阵,并基于cnn-bilstm的深度学习模型有效的应对复杂的时空特征矩阵,捕捉特征向量之间的信息,提高了公交客流的预测精度。

58、3、本发明通过优化公交客流特征矩阵,互信息量(mi)来度量特征向量之间的相关性,优化特征矩阵结构,通过改变特征矩阵结构的排列方式,对基于cnn-bilstm的深度学习的特征矩阵进行寻优,建立最优特征矩阵结构,进一步提高公交客流预测效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1