一种公交运营车辆实时人数的分析方法、系统和存储介质与流程

文档序号:17010212发布日期:2019-03-02 02:12阅读:294来源:国知局
一种公交运营车辆实时人数的分析方法、系统和存储介质与流程

本发明涉及交通信息领域,尤其是一种公交运营车辆实时人数的分析方法、系统和存储介质。



背景技术:

伴随着我国城镇化的不断发展,与日俱增的城市人口使大中城市的交通压力越来越大,发展大公交既是民众出行的需要,也是建设低碳城市的需要。gps/gprs/4g等技术在公交调度中已经普及应用,可以实时监控车辆的位置及车速等信息,对车辆调度、智能报站、运营安全管理已经发挥了很大的作用。但是公交客流信息的实时采集一直是困扰行业的疑难问题,准确采集公交车辆的实时载客信息及站点上下客信息,从而实现智能公交发展战略、优化公交线路、提高公交营运效率、提升百姓满意度,提高居民出行公交分担率,这将是下一步提升公交信息化的发展方向,也是最终实现智能交通的必由之路。

当前我国各大城市对公交客流信息的采集方法主要有驻点式目测客流调查法和人工跟车统计法以及在上下车门位置增加摄像头判断法,这几种方法都需要人工监测和辅助判断的方法。在调查准备阶段,需对调查人员做大量的组织工作以及人流拥挤情况下的失真程序判断。资料整理的工作量也很大,人工调查的数据在使用之前必须经过编辑整理、数据提炼的过程。另外,人工调查难以保证数据质量,由于需要长时间工作,调查人员必须时刻呆在车上很容易出现疲劳与失误,例如大量乘客上下车时出现计数错误等。人工客流调查是一项非常繁琐和耗费人力、财力的工作,在实际操作过程中,做到经常性、系统性非常困难。但城市公共交通是随客流、道路条件、气候等不断变化的随机服务系统,如果信息不灵或反馈不及时、不准确,调度人员就无法进行有效的指挥调度。因此,公交运营信息是整个公交企业管理业务的基础,而信息采集技术可为公交信息的获得与处理提供支撑和保障。对公交客流的全面、准确把握是公交管理工作的基础,它不仅为日常调度提供依据,也为线网优化提供了重要的参考数据。

现有的针对公交下车人数的判断方法基本上通过加载红外扫描方法、加载视频移动摄像头方式或根据下车刷卡方式及人工点人头方式得到,这些方式一是需要加装硬件支持和设备改造投入,同时由于人员移动及交叉或蜂拥上下等因素,造成对于人数的判断特别不准确,误差较大,现有的公交下车人数主要根据获取上车人数据(上车卡数据、上车门红外扫描、上车门摄像头识别等)和下车门人数据(下车刷卡数据、上车门红外扫描、上车门摄像头识别等)来得到车上人数的实时数据。

现有的方法对实时人数的判断还是根据上下车人数的获取后才能对车上的人数进行分析,基本上处于下一站到站后才能计算出上一站车上的人数,属于事后的分析,不能做到对当前车辆的数据信息进行实时分析。

综上所述,现有技术存在设备投入成本大和人数识别落后于数据需求的问题。



技术实现要素:

为解决上述技术问题,本发明的目的在于:提供一种便宜且能够及时分析运营车辆人数的公交运营车辆实时人数的分析方法、系统和存储介质。

本发明所采取的第一种技术方案是:

一种公交运营车辆实时人数的分析方法,包括以下步骤:

获取历史乘车数据和站点土地性质的数据;

根据历史乘车数据和站点土地性质的数据对乘车模型进行第一次训练,并根据第一次训练的结果得到乘客特征规则库;

实时地获取上车刷卡数据;

根据乘客特征规则库和上车刷卡数据,计算刷卡的用户在各站点的下车概率;

根据刷卡的用户在各站点的下车概率和上车刷卡数据的数量,预测当前车辆的实时人数。

进一步,还包括以下步骤:

以上车刷卡数据和刷卡的用户在各个站点的下车概率作为训练数据,对乘车模型进行第二次训练,并根据第二次训练的结果更新乘客特征规则库。

进一步,还包括以下步骤:

获取站点土地性质的新数据,根据站点土地性质的新数据对乘车模型进行第三次训练,并根据第三次训练的结果更新乘客特征库。

进一步,所述乘车模型由神经网络算法、决策树算法、泊松分布算法和logistic算法中的至少一种所构建。

进一步,所述根据历史乘车数据和站点土地性质的数据对乘车模型进行第一次训练,并根据第一次训练的结果得到乘客特征规则库,这一步骤具体包括:

根据历史乘车数据,得到各站点的刷卡投币比例;

根据站点土地性质的数据,得到各站点的权重数据;

根据各站点的刷卡投币比例、各站点的权重数据和历史乘车数据,对乘车模型进行第一次训练;

根据第一次训练的结果,得到乘客特征规则库。

进一步,所述上车刷卡数据包括公交卡id、上车站点编码、时间、经纬度、车编号和路线编号。

进一步,还包括以下步骤:

根据当前车辆的实时人数,进行实时预警。

本发明所采取的第二种技术方案是:

一种公交运营车辆实时人数的分析系统,包括:

第一获取模块,用于获取历史乘车数据和站点土地性质的数据;

训练模块,用于根据历史乘车数据和站点土地性质的数据对乘车模型进行第一次训练,并根据第一次训练的结果得到乘客特征规则库;

第二获取模块,用于实时地获取上车刷卡数据;

运算模块,根据乘客特征规则库和上车刷卡数据,计算刷卡的用户在各站点的下车概率;根据刷卡的用户在各站点的下车概率和上车刷卡数据的数量,预测当前车辆的实时人数。

本发明所采取的第三种技术方案是:

一种公交运营车辆实时人数的分析系统,包括:

存储器,用于存储程序;

处理器,用于加载所述程序以执行一种公交运营车辆实时人数的分析方法。

本发明所采取的第四种技术方案是:

一种存储介质,所述存储介质上存储有程序,所述程序被处理器执行时实现一种公交运营车辆实时人数的分析方法。

本发明的有益效果是:本发明利用了历史乘车数据以及站点土地性质的数据对乘车模型进行训练,得到一系列的乘客特征规则,形成乘客特征规则库,然后根据乘客特征规则库对实时采集的上车刷卡数据进行处理,得到刷卡的乘客在各个站点下车的概率,并根据刷卡的乘客在各个站点下车的概率和上车刷卡数据的数量,来计算车辆当前的人数,本发明无需对公交车加装设备,实现成本低,并且本发明对车辆实时人数的预测不依赖于下车数据,能够及时地分析当前车辆上的人数,提升数据的价值。

附图说明

图1为本发明一种公交运营车辆实时人数的分析方法的流程图。

具体实施方式

下面结合说明书附图和具体的实施例对本发明进行进一步的说明。

参照图1,一种公交运营车辆实时人数的分析方法,包括以下步骤:

s1、获取历史乘车数据和站点土地性质的数据。所述历史乘车数据应该包含若干个公交卡的历史上车刷卡数据,所述上车刷卡数据包括公交卡id、上车站点编码、时间、经纬度、车编号和路线编号,当然,通过公家卡id可以分辨出公交卡的类型,如普通卡、学生卡和老人卡。站点土地性质的数据是指站点土地的应用类型,如居住用地、工业用地、公共设施用地、教育用地或者商业用地等等。之所以获取占地土地性质的数据,是因为不同用地性质对乘客下车的吸引力不同,例如,商业用地的购物休闲娱乐场比较多,接近商业用地的站点与普通站点相比,接近商业用地的站点的吸引力更强,同时附近有很多交通枢纽,在此类站点下车的人数很多。又例如,针对在早晨的学生卡,在学校附近下车的概率比在其他地方下车的概率高很多,利用这一点可以优化乘车模型。

s2、根据历史乘车数据和站点土地性质的数据对乘车模型进行第一次训练,并根据第一次训练的结果得到乘客特征规则库。本实施例的乘车模型,可以由一个或者多个现有的数据挖掘算法来构建,例如神经网络算法、决策树算法、泊松分布算法和logistic算法(一种广义的线性回归分析模型)。这些算法均为现有技术,本领域技术人员可以根据实际需要灵活选取其中的一种或者多种。并将历史乘车数据和站点土地性质的数据作为训练集合,对建立的乘车模型进行训练,从而得到多个乘客特征规则,并将这些规则存储到一个库中,形成乘客特征规则库。

s3、实时地获取上车刷卡数据。即实时获取当前运营公交车的上车刷卡数据。

s4、根据乘客特征规则库和上车刷卡数据,计算刷卡的用户在各站点的下车概率。本步骤根据用户的刷卡数据,在乘客特征规则库内匹配相应的乘客特征规则,根据乘客特征规则和刷卡数据计算出该乘客在各个站点下车的概率。

s5、根据刷卡的用户在各站点的下车概率和上车刷卡数据的数量,预测当前车辆的实时人数。可以根据刷卡的用户的各站点的下车概率来计算每个站点下车人数的期望值,然后根据实时的刷卡数据的数量得到上车人数,再通过简单的加减法可以得到当前公交车的实时人数。

作为优选的实施例,为了使预测结果更加准确,本实施例还包括以下步骤:

s6、以上车刷卡数据和刷卡的用户在各个站点的下车概率作为训练数据,对乘车模型进行第二次训练,并根据第二次训练的结果更新乘客特征规则库。对模型进行二次训练有助于提升预测结果的准确度。

作为优选的实施例,为了使预测结果更加准确,本实施例还包括以下步骤:

s7、获取站点土地性质的新数据,根据站点土地性质的新数据对乘车模型进行第三次训练,并根据第三次训练的结果更新乘客特征库。

本步骤通过爬虫在网上不断爬取站点周围的土地使用性质的数据,一旦站点周围的土地使用性质发生改变,即可以将新的数据输入到乘车模型中进行训练,并更新乘客特征规则库,形成闭环的自适应算法,从而提升预测结果的准确率。

作为优选的实施例,为了提升模型的精度,所述乘车模型由神经网络算法、决策树算法、泊松分布算法和logistic算法中的至少一种所构建。

作为优选的实施例,所述步骤s2,具体包括:

根据历史乘车数据,得到各站点的刷卡投币比例;由于并不是每个人乘车都会使用交通卡,有的人可能会用投币的形式乘车。因此需要分析各个站点的刷卡投币比例。并将刷卡投币比例作为训练的参数。

根据站点土地性质的数据,得到各站点的权重数据;本步骤中,对于站点土地性质不同的站点,我们可以赋予不同的权重比例,以调节站点土地性质对乘客下车的吸引力。例如,居住用地的权重系数是1.0,教育用地是0.8,商业用地为1.2。

根据各站点的刷卡投币比例、各站点的权重数据和历史乘车数据,对乘车模型进行第一次训练;

根据第一次训练的结果,得到乘客特征规则库。

作为优选的实施例,所述上车刷卡数据包括公交卡id、上车站点编码、时间、经纬度、车编号和路线编号。

作为优选的实施例,为了能够给运营单位和交通管理部门的决策提供依据,本实施例还包括以下步骤:

s8、根据当前车辆的实时人数,进行实时预警。本实施例可以对影响公交安全运行的时间进行监控和预警,为运营单位和交通管理部门提供数据支持。

一种公交运营车辆实时人数的分析系统,包括:

第一获取模块,用于获取历史乘车数据和站点土地性质的数据;

训练模块,用于根据历史乘车数据和站点土地性质的数据对乘车模型进行第一次训练,并根据第一次训练的结果得到乘客特征规则库;

第二获取模块,用于实时地获取上车刷卡数据;

运算模块,根据乘客特征规则库和上车刷卡数据,计算刷卡的用户在各站点的下车概率;根据刷卡的用户在各站点的下车概率和上车刷卡数据的数量,预测当前车辆的实时人数。

作为优选的实施例,为了使预测结果更加准确,所述训练模块还用于:

以上车刷卡数据和刷卡的用户在各个站点的下车概率作为训练数据,对乘车模型进行第二次训练,并根据第二次训练的结果更新乘客特征规则库。

作为优选的实施例,为了使预测结果更加准确,所述训练模块还用于:

获取站点土地性质的新数据,根据站点土地性质的新数据对乘车模型进行第三次训练,并根据第三次训练的结果更新乘客特征库。

本实施例通过爬虫在网上不断爬取站点周围的土地使用性质的数据,一旦站点周围的土地使用性质发生改变,即可以将新的数据输入到乘车模型中进行训练,并更新乘客特征规则库,形成闭环的自适应算法,从而提升预测结果的准确率。

作为优选的实施例,为了提升模型的精度,所述乘车模型由神经网络算法、决策树算法、泊松分布算法和logistic算法中的至少一种所构建。

作为优选的实施例,训练模块具体用于:

根据历史乘车数据,得到各站点的刷卡投币比例;由于并不是每个人乘车都会使用交通卡,有的人可能会用投币的形式乘车。因此需要分析各个站点的刷卡投币比例。并将刷卡投币比例作为训练的参数。

根据站点土地性质的数据,得到各站点的权重数据;本步骤中,对于站点土地性质不同的站点,我们可以赋予不同的权重比例,以调节站点土地性质对乘客下车的吸引力。例如,居住用地的权重系数是1.0,教育用地是0.8,商业用地为1.2。

根据各站点的刷卡投币比例、各站点的权重数据和历史乘车数据,对乘车模型进行第一次训练;

根据第一次训练的结果,得到乘客特征规则库。

作为优选的实施例,所述上车刷卡数据包括公交卡id、上车站点编码、时间、经纬度、车编号和路线编号。

作为优选的实施例,为了能够给运营单位和交通管理部门的决策提供依据,本实施例还包括:

预警模块,用于根据当前车辆的实时人数,进行实时预警。本实施例可以对影响公交安全运行的时间进行监控和预警,为运营单位和交通管理部门提供数据支持。

本实施例公开了一种公交运营车辆实时人数的分析系统,包括:

存储器,用于存储程序;所述存储器可以是u盘、光盘或者硬盘等计算机可读存储介质

处理器,用于加载所述程序以执行与图1对应的公交运营车辆实时人数的分析方法。

本实施例公开了一种存储介质,所述存储介质上存储有程序,所述程序被处理器执行时实现与图1对应的公交运营车辆实时人数的分析方法。所述存储介质可以是u盘、光盘或者硬盘等计算机可读存储介质。

对于上述方法实施例中的步骤编号,其仅为了便于阐述说明而设置,对步骤之间的顺序不做任何限定,实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。

以上是对本发明的较佳实施进行了具体说明,但本发明并不限于所述实施例,熟悉本领域的技术人员在不违背本发明精神的前提下还可做作出种种的等同变形或替换,这些等同的变形或替换均包含在本申请权利要求所限定的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1