本发明涉及智能交通领域,更具体的,涉及一种基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法。
背景技术:
客运枢纽,作为交通场站设施的综合体,能够为乘客提供多种服务,以满足乘客的多种需求,致力于让乘客感到便捷和舒适。客运枢纽内的驻留乘客数量直接反映了枢纽内的人群密度和拥挤程度,是客流组织方案和疏运管理方案的最重要参考指标之一,精准的驻留乘客数量短时预测对于紧急实施分级预案与安保管理具有重要意义。
由于客运枢纽乘客驻留人数受多种影响因素综合作用,其间的关系也错综复杂,因而为影响因素的选取带来了一定的困扰。此外,由于在预测过程中某些相关因素本身就具有不确定性,加上每逢节假日与春运,客运枢纽区域人群聚集具有明显的临时性、突发性等特征,因此要进行精确的短时预测具有较大的难度。在此情况下,不分开考虑各个因素对客运枢纽未来驻留人数的影响,而直接利用与待预测日相似的历史数据及其潜在数据关系进行预测,往往能够取得准确度较高的预测效果。因此,本发明提出一种基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法。
knn(k-nearestneighbor)算法,作为一种经典的模式识别统计算法,被广泛应用于分类,同样也可用于预测。knn算法先将待测样本进行归类,再利用类内数据对待测日进行预测,具有较高的运行效率,且在历史数据规律性较明显的情况下能取得较高的预测精度。由于客运班次密度安排相对均匀,乘客的出行习惯也相对稳定,区域驻留人数变化趋势将具有一定的规律性,因此与待预测日变化趋势最接近的样本将能够较好反映待预测日客流量的变化趋势,并且不受枢纽区域人数数值大小的影响。由此可见,基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法能够取得较好的短时预测效果。
技术实现要素:
本发明为了解决客运枢纽乘客驻留人数受多种因素影响,以及各因素之间关系错综复杂,不易精准的预测驻留人数变化的问题,提供了一种基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法,其通过选取与待预测日的特征空间变化趋势相似的历史样本作为邻近样本,对待预测日区域驻留人数的变化趋势进行短时预测,在历史样本有限的情况下消除了历史样本与待预测日数据水平差异的影响,保证了短时预测精度,对于紧急实施分级预案与安保管理具有重要意义。
为实现上述本发明目的,采用的技术方案如下:一种基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法,所述预测方法步骤如下:
s1:通过检测系统实时获取客运枢纽区域驻留情况数据;
s2:根据待预测日的日期特性,选取与待预测日相似的m个历史样本作为预测的样本空间;
s3:对历史样本中的异常数据和噪声进行预处理;
s4:确定待预测日和历史样本对应待预测时间段的特征空间:若预测某天一段短时间内的区域驻留人数x=(x1,x2,…,xl);根据预测时间段之前的n个已知连续驻留人数数据y=(y1,y2,…,yn),计算其差值向量
其中:i=1,2,...,m;xr表示待预测日待预测时段内时间点r的区域驻留人数,r=1,2,…,l;yj表示待预测日待预测时段之前的n个时间点中时间点j的区域驻留人数,j=1,2,…,n;(qj)i表示样本i对应特征向量y时间点j的驻留人数,i=1,2,…,m,j=1,2,…,n;
寻找k邻近样本:根据差值向量
其中:i=1,2,...,m;
s5:计算k邻近样本的增量比系数,根据增量比系数预测区域驻留人数变化趋势:根据步骤s4所选的k邻近样本,得到相应的增量比系数为
其中:t=1,2,...,k;(pr)(t)表示k近邻样本t与待预测数据x中xr的时间点对应的驻留人数,r=1,2,…,l,t=1,2,…,k;
s6:根据上述步骤,以当前区域驻留人数yn为基准,计算区域驻留人数短时预测值
其中:r=1,2,...,l;
优选地,步骤s1所述检测系统包括客流检测器、手机信令,所述检测系统用于采集与估测各个时间间隔内客运枢纽的区域驻留人数,得到历史与当前的区域驻留情况数据;所述驻留情况数据包括区域驻留人数以及对应采集时间。
优选地,步骤s2所述待预测日的日期特性是指客运枢纽一天内区域驻留人数的数值水平和变化趋势在相同日期类型中具有相似性,具体表现在节假日与非节假日驻留人数水平和一天内驻留人数的变化趋势不相同,因此需要对历史样本进行分类,选取与待预测日相同日期类型的历史样本作为样本空间进行预测。
优选地,步骤s3对历史样本中的异常数据,增加数据检查机制,自动判别异常数据并进行报错及修正,以保证数据的可靠性与预测的精度,完成预处理。
对于历史样本中的噪声,使用“五点三次平滑法”对预测数据曲线进行平滑以去除噪声,消除各种干扰所引起的数据突变,以保证预测精度。
本发明的有益效果如下:本发明通过选取m个与待预测日相似的历史样本作为样本空间,对历史样本中的异常数据和噪声进行预处理,提高了历史样本数据的准确性与可靠性;本发明通过计算历史样本与待预测日数据在特征空间上数据的增量比标准差,找出增量比标准差最小的k天数据作为k邻近样本,计算k邻近样本的增量比系数
附图说明
图1是本发明的步骤流程图。
图2是2017年1月1日9:00-10:55某火车站广场以5分钟为数据采集时间间隔的区域驻留人数记录图。
图3是应用本发明对某火车站广场2018年2月13日9:00-11:55的区域驻留人数短时预测结果分析图。
具体实施方式
下面结合附图和具体实施方式对本发明做详细描述。
实施例1
如图1所示,一种基于knn算法的客运枢纽区域驻留人数变化趋势短时预测方法,所述预测方法步骤如下:
s1:通过检测系统实时获取客运枢纽区域驻留情况数据;
本实施例所述检测系统包括客流检测器、手机信令,所述检测系统用于采集与估测各个时间间隔内客运枢纽的区域驻留人数,得到历史与当前的区域驻留情况数据;所述驻留情况数据包括区域驻留人数以及对应采集时间。
本实施例以5分钟作为数据采集间隔时间,通过检测手机信令获取到2017年1月1日至2018年2月12日某火车站广场的区域驻留情况历史数据,记录该火车站广场2017年1月1日9:00-10:55各数据时间点的区域驻留人数如图2所示。由此,为预测某火车站广场2018年2月13日9:00-11:55每5分钟的驻留人数,首先获取自2018年2月13日0:00起某火车站广场每5分钟的驻留情况数据。
s2:根据待预测日的日期特性,选取与待预测日相似的m个历史样本作为预测的样本空间;
所述待预测日的日期特性是指客运枢纽一天内区域驻留人数的数值水平和变化趋势在相同日期类型中具有相似性,具体表现在节假日与非节假日驻留人数水平和一天内驻留人数的变化趋势不相同,因此需要对历史样本进行分类,选取与待预测日相同日期类型的历史样本作为样本空间进行预测。
本实施例中预测日2018年2月13日为春节(2月16日是大年初一)前三天,属于春运期间,与节假日同样具有客流量大的特点。因此,根据日期特性选取春运、节假日样本作为历史样本空间,具体包括2017年春运高峰日(1月13日-1月24日)、元旦假日(1月1日-1月2日)、清明节假日(4月2日-4月4日)、劳动节假日(4月29日-5月1日)、端午节假日(5月28日-5月30日)和国庆中秋假日(10月1日-10月8日),2018年元旦假日(2017年12月30日-2018年1月1日)以及待预测日前同属春运期间的样本(2月1日-2月12日),共46天,进而确定区域驻留人数预测的样本空间。
s3:对历史样本中的异常数据和噪声进行预处理;
为了保证样本数据中数据的准确性与可靠性,因此需要对上述的所选历史样本数据进行数据处理和数据平滑去噪,即缺失值用插值法补全,若连续缺失半个小时及以上数据,则剔除该天数据;将异常值当成缺失值进行处理,从而完成对历史样本中的异常数据的预处理;对于历史样本中的噪声,使用“五点三次平滑法”对预测数据曲线进行平滑以去除噪声,消除各种干扰所引起的数据突变,以保证预测精度。
s4:确定待预测日和历史样本对应待预测时间段的特征空间:为预测2018年2月13日9:00-11:55三个小时的区域驻留数据x=(x1,x2,…,x36),需要选取2018年2月13日9:00之前的24个(7:00~8:55)已知连续驻留人数数据y=(y1,y2,…,y24),计算其差值向量
寻找k邻近样本:由于历史样本与待预测日在特征向量上的相近度将一定程度地反映短时区域驻留人数变化趋势的相近度,因此根据特征向量
其中,
s5:计算k邻近样本的增量比系数,根据增量比系数预测区域驻留人数变化趋势:根据步骤s4所选的k邻近样本,得到相应的增量比系数
其中:(pr)(t)(r=1,2,…,36;t=1,2,3)表示k近邻样本t与待预测数据x中xr的时间点对应的驻留人数。
s6:根据上述步骤,以当前(8:55)区域驻留人数y24为基准,计算区域驻留人数短时预测值
本实施例2018年2月13日9:00-11:55三个小时的短时预测效果如图3所示,从图中可以看出预测值与实际值之间的相对误差很少,预测值与实际值变化趋势基本相同。本实施例的预测结果可以作为制定客运枢纽区域组织分流和疏运管理方案的重要依据,对于实施紧急安保措施具有重要指导意义。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。