一种基于神经网络的公交客流分时段组合预测方法与流程

文档序号:16935345发布日期:2019-02-22 20:38阅读:196来源:国知局
一种基于神经网络的公交客流分时段组合预测方法与流程

本发明涉及公交客流分时段预测技术领域,特别是涉及一种基于神经网络的公交客流分时段组合预测方法。



背景技术:

近些年来,面对日益恶化的交通状况,很多城市都采取了限购、限牌、大力发展公共交通等措施。

人们越来越重视公共交通的发展,公共交通承载量大,能大大提高城市道路利用效率,并且线路、发车频率基本固定,在公交发展到一定程度时还能实现公交专用道路、专用信号等优先权利,运行效率还将大大提高,公共交通法发展有助于缓解城市拥堵,公共交通系统正在不断的完善。比如,出现了快速公交brt系统,brt的出现大大改善了公交系统,为公共交通系统注入了一股新生力量。但是目前brt仅在部分大城市有,并且由于建造成本、道路有限等原因,在城市内的覆盖率较低,不能满足需求。

公共交通以其便捷、低成本、高运载力、低碳环保等原因近些年来越来越受到公众及政府、企业的青睐。而由于传统公交缺乏对市场需求的准确预测,导致路网分配不平衡,出现有的线路人满为患,有的线路人员稀少的情况,并且对客运需求的模糊认识导致线路的重合率过高或者覆盖率过低等现象。这也就阻碍了公交的进一步发展。所以,对公交客流进行准确的预测就显得非常重要。

准确的客流预测使公交运营公司做出合理的运力安排,能提高乘客的乘车体验,有利于提高公交车辆的准点率、运行速度、稳定性。稳定性是评价公共交通的服务水平以及服务效率最重要的因素之一。公交运行的可靠性、突发事件的先知性等服务属性是决定乘客对公交服务满意度最重要的因素。

公交客流常呈现随时段和季节性的波动,其影响因素和变化趋势众多且复杂,不仅包括历史客流、日期的性质,还包括环境天气等状况。目前公交客流预测的研究大多使用时间序列、灰色预测等传统的统计学方法,但此类方法单纯地从数据统计的角度出发,很难捕获客流生成的本质规律和演化机理,因而限制了预测精度和可靠性。另一方面,尽管有少量学者利用机器学习算法进行公交客流预测,但缺乏深入分析公交客流规律及其影响因素,也没有系统地比较不同方法对数据的适应性和普适性,致使其预测精度还没有得到充分释放。近年来,随着智能公交系统的发展和普及,为公交信息采集和处理提供了有利的技术条件,也为实现多源公交信息的融合提供了支持。

研究发现,组合算法在提高模型整体性能方面具有得天独厚的优势,组合算法可以结合不同算法模型的优点,可以弥补单一算法局限性较大的缺陷。本发明考虑将机器学习中的神经网络算法应用到公交客流预测组合算法中,提出了一种基于神经网络的公交客流分时段变权组合预测方法,这将提高公交客流的预测精度和可靠性,有利于决策者和规划人员更加方便、合理有效地进行城市规划,提高公交准点率、降低线路重复率、合理匹配公交运力与客运需求,提高公交服务质量。

本发明引入泛化性更好、预测性能更加稳定的组合算法,并进行比较寻优。组合算法有效地均衡不同输入、不同算法的预测贡献率,并分时段赋予两种神经网络算法各个时段的权重值,结合不同单一算法在不同时间段的预测优势,得到各个时段最优的预测结果,从而提高了模型整体性能,使公交客流预测更加可靠、精确,能提升公交客流预测的整体效果。



技术实现要素:

为了解决以上问题,本发明提供一种基于神经网络的公交客流分时段组合预测方法,是基于神经网络的泛化性更好、预测性能更加稳定的时序可变加权系数组合算法,结合了不同算法在不同时段的优势,弥补了单一算法局限性较大的缺陷问题,提高了客流预测的整体预测性能,为达此目的,本发明提供一种基于神经网络的公交客流分时段组合预测方法,该方法包括依次进行的收集基本相关信息步骤、确定最优的输入数据步骤、确定组合预测模型步骤、确定预测模型性能步骤。

步骤一所述收集基本相关信息步骤中,通过对样本数据分析法,发现公交客流具有时间、空间及人群三方面的分布特性,结合相关文献,收集以下信息:所述相关信息分为两大类,客观影响因素和相关历史数据,客观影响因素包括月份m,星期日变化we,日时间变化d,平峰高峰p,节假日h,最低温度t1,最高温度t2,平均温度t,风力风向wi,降雨量r;相关历史数据包括与预测时段相邻2个时段的客流量q11、q12,相邻3个工作日的客流量q21、q22、q23,相邻3周同一星期日且同一时段的客流量q31、q32、q33,历史数据的对应变量解释如下表所示,同时,需要收集历史数据中客观影响因素和相关历史数据对应的历史公交客流量值q,用来训练预测算法以及检验预测方法的精度;

步骤二所述确定最优的输入数据步骤中,是根据已有的历史数据,从客观影响因素data1、相关历史数据data2、客观影响因素和相关历史数据的组合data3共三种数据中选择最优的数据作为输入;

步骤三所述确定组合预测模型步骤中,确定了两种神经网络算法组合的方法,采用变权的方式组合两种算法的预测结果,即根据不同时段客流特性,赋予两种算法的预测结果不同的权重,从而加和得到最终的输出结果,本方法预测的结果组成为:

yi=k1iy1i+k2iy2i,i=1,...,n

ei=yi-y0i

其中yi为组合算法的预测结果,y1i为bp神经网络的预测结果,y2i为rbf神经网络的预测结果,y0i为第i个时间段的实际客流量值,k1i表示bp神经网络中第i个时间段的预测值所占的权重,k2i表示rbf神经网络中第i个时间段的预测值所占的权重,ei表示第i个时间段组合算法输出的预测值与实际值的残差,权重k1i和k2i的值满足如下二次数学规划:

求得权重k1i和k2i的值后便可确定组合算法,输入上个步骤中得到的data,得到两个训练好的神经网络的预测值,然后根据不同时段两个不同算法得到的预测值对应的权重进行加和,即可得该组合预测模型的预测值。

步骤四所述确定预测模型性能的步骤中,使用mape、rmse、rmspe三个评价指标评价组合算法的预测性能,若预测性能较好,则该模型即为使用本方法得到的适合该区域的公交客流组合预测方法;若预测性能较差,则返回确定最优的输入数据步骤中,使用rbf神经网络算法筛选得到最优的输入数据data,并继续执行至确定组合预测模型步骤,然后评价该种情况下组合算法的预测性能,从两种情况中选出性能较好的一个即为使用本方法得到的适合该区域的公交客流组合预测方法。

作为本发明进一步改进,步骤二使用组合算法中的两种神经网络算法来确定最优输入数据,组合算法由经典的bp神经网络算法和rbf神经网络算法两种神经网络算法构成,所述确定最优的输入数据步骤具体包括:

1)客观影响因素的数据处理

对搜集到的客观影响因素分别进行相关性检验、独立性检验、数据降维处理,得到修正的、互不相关的客观影响因素;

2)使用组合算法中的一种神经网络算法进行客流量预测

首先,使用bp神经网络算法,使用历史数据训练该神经网络后,依次将历史数据中的data1、data2、data3作为bp神经网络的输入,使用训练好的神经网络进行公交客流预测,得到相应的预测值;

3)评价预测结果选出最优的输入数据

将预测结果与相应的历史客流量进行对比,根据算法的预测性能选择预测效果最优的一种数据作为本方法中组合预测模型的输入,其中预测性能的评价指标如下:

平均相对误差均方根误差均方根相对误差

其中n为样本数,为第i个样本的预测值,yi为第i个样本客流量的真实值。根据mape、rmse、rmspe三个误差值的大小,确定预测性能最优的输入数据,最优的输入数据记为data。

本发明与现有技术相比,具有以下优点:

本发明考虑将机器学习中的神经网络算法应用到公交客流预测中,并分时段赋予两种神经网络算法各个时段的权重值,引入泛化性更好、预测性能更加稳定的组合算法,结合了不同算法在不同时段的优势,弥补了单一模型局限性较大的缺陷问题,提高了客流预测的整体预测性能。

本发明充分考虑了不同情况下不同输入数据的优劣性,将数据分类并定义为三种:客观影响因素、相关历史数据、客观影响因素和相关历史数据相结合的数据。使用组合算法中的bp神经网络算法和rbf神经网络算法对数据进行预筛选,从而得到最适合本发明的一种数据,从算法的输入端优化了预测算法的性能,从而为提高组合预测方法的性能提供了保障,优化了公交客流预测方法。

附图说明

图1是本发明方法的流程图。

具体实施方式

下面结合附图与具体实施方式对本发明作进一步详细描述:

本发明提供一种基于神经网络的公交客流分时段组合预测方法,是基于神经网络的泛化性更好、预测性能更加稳定的时序可变加权系数组合算法,结合了不同算法在不同时段的优势,弥补了单一算法局限性较大的缺陷问题,提高了客流预测的整体预测性能。

如图1所示为基于神经网络的公交客流分时段变权组合预测方法的总体流程图。下面结合图1对本发明方法作更进一步的说明。

基于神经网络的公交客流分时段变权组合预测方法,考虑将机器学习中的神经网络算法应用到公交客流预测中,并分时段赋予两种神经网络算法各个时段的权重值,引入泛化性更好、预测性能更加稳定的组合算法,结合了不同算法在不同时段的优势,弥补了单一模型局限性较大的缺陷问题,提高了客流预测的整体预测性能。该方法包括依次进行的四个步骤:步骤一,收集基本相关信息、步骤二,确定最优的输入数据、步骤三,确定组合预测时段算法、步骤四,确定预测模型性能;

下面结合具体案例说明本发明的实施方式:

步骤一为收集基本相关信息,通过对样本数据分析法,发现公交客流具有时间、空间及人群三方面的分布特性,结合相关文献,本发明具体收集以下信息:所述相关信息分为两大类,客观影响因素和相关历史数据。

客观影响因素包括月份m,星期日变化we,日时间变化d,平峰高峰p,节假日h,最低温度t1,最高温度t2,平均温度t,风力风向wi,降雨量r;相关历史数据包括与预测时段相邻2个时段的客流量q11、q12,相邻3个工作日的客流量q21、q22、q23,相邻3周同一星期日且同一时段的客流量q31、q32、q33,历史数据的对应变量解释如下表所示。同时,需要收集历史数据中客观影响因素和相关历史数据对应的历史公交客流量值q,用来训练预测算法以及检验预测方法的精度。

相关历史数据某一时段的数据样本如下表:

步骤二为确定最优的输入数据,是根据已有的历史数据,从客观影响因素data1、相关历史数据data2、客观影响因素和相关历史数据的组合data3共三种数据中选择最优的数据作为输入,本方法使用组合算法中的两种神经网络算法来确定最优输入数据,组合算法由经典的bp神经网络算法和rbf神经网络算法两种神经网络算法构成。所述确定最优的输入数据步骤具体包括:

1)客观影响因素的数据处理

对搜集到的客观影响因素分别进行相关性检验、独立性检验、数据降维处理,得到修正的、互不相关的客观影响因素,处理得到后得到的客观影响因素数据样本如下表:

2)使用组合算法中的一种神经网络算法进行客流量预测

首先,使用bp神经网络算法,使用历史数据训练该神经网络后,依次将历史数据中的data1、data2、data3作为bp神经网络的输入,使用训练好的神经网络进行公交客流预测,得到相应的预测值。其中bp神经网络或rbf神经网络使用matlab程序包实现。

3)评价预测结果选出最优的输入数据

将预测结果与相应的历史客流量进行对比,根据算法的预测性能选择预测效果最优的一种数据作为本方法中组合预测模型的输入。其中预测性能的评价指标如下:

平均相对误差均方根误差均方根相对误差

其中n为样本数,为第i个样本的预测值,yi为第i个样本客流量的真实值。根据mape、rmse、rmspe三个误差值的大小,确定预测性能最优的输入数据,最优的输入数据记为data。针对此案例,使用历史数据训练bp神经网络后进行客流量预测,预测结果性能评价指标如下表:

由上表可知,data3为最优输入数据。

步骤三位确定组合预测模型,确定了两种神经网络算法组合的方法,采用变权的方式组合两种算法的预测结果,即根据不同时段客流特性,赋予两种算法的预测结果不同的权重,从而加和得到最终的输出结果。本方法预测的结果组成为:

yi=k1iy1i+k2iy2i,i=1,...,n

ei=yi-y0i

其中yi为组合算法的预测结果,y1i为bp神经网络的预测结果,y2i为rbf神经网络的预测结果,y0i为第i个时间段的实际客流量值,k1i表示bp神经网络中第i个时间段的预测值所占的权重,k2i表示rbf神经网络中第i个时间段的预测值所占的权重,ei表示第i个时间段组合算法输出的预测值与实际值的残差。权重k1i和k2i的值满足如下二次数学规划:

求得权重k1i和k2i的值后便可确定组合算法,输入上个步骤中得到的data,得到两个训练好的神经网络的预测值,然后根据不同时段两个不同算法得到的预测值对应的权重进行加和,即可得该组合预测模型的预测值。

步骤四为确定预测模型性能,使用mape、rmse、rmspe三个评价指标评价组合算法的预测性能,若预测性能较好,则该模型即为使用本发明得到的适合该区域的公交客流组合预测方法;若预测性能较差,则返回确定最优的输入数据步骤中,使用rbf神经网络算法筛选得到最优的输入数据data,并继续执行至确定组合预测模型步骤,然后评价该种情况下组合算法的预测性能,从两种情况中选出性能较好的一个即为使用本发明得到的适合该区域的公交客流组合预测方法。使用此模型计算所得的预测结果如下:mape为3.20%,rmse为102,rmspe为4.89%,显然,该方法的精度已经达到较好水平,所以所得模型即为求得的该区域的公交客流组合预测方法。

以上所述,仅是本发明的较佳实施例而已,并非是对本发明作任何其他形式的限制,而依据本发明的技术实质所作的任何修改或等同变化,仍属于本发明所要求保护的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1