基于智能卡数据计算地铁进站时间和换乘时间的方法及系统的制作方法
【专利摘要】本发明公开了一种基于智能卡数据计算地铁进站时间和换乘时间的方法及系统,所述方法包括:S1、数据预处理,包括:智能卡数据质量分析,对不完整、不正确数据的过滤,乘客进站记录和出站记录匹配;S2、基础数据分析,包括计算两站之间最佳路径,计算两站之间最短时间;S3、进站时间计算,通过分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间;S4、换乘时间计算,通过分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。本发明人工成本低,可扩展性强,若增加新的线路或站点,只需要添加线路信息即可。
【专利说明】基于智能卡数据计算地铁进站时间和换乘时间的方法及系统
【技术领域】
[0001]本发明涉及时空数据挖掘及交通【技术领域】,尤其涉及一种基于智能卡数据计算地铁进站时间和换乘时间的方法及系统。
【背景技术】
[0002]无论分析地铁乘客的时空分布,还是模拟地铁的运营状况或者实时预测地铁密度,都会用到两个时间常量,那就是在假设乘客步行速度一定的前提下,从地铁收费闸门到站台的步行时间以及在换乘站换乘步行所消耗的时间。
[0003]目前还没有针对地铁乘客进站时间和换乘时间做计算的方法,但是这两个时间对于模拟地铁运营状况以及乘客的时空分布很重要的,例如已知乘客的进站时间、进站时间、换乘时间、地铁的到站时间可以算出乘客所乘坐的车次,这个是模拟地铁运营状况的基础。
[0004]由于智能卡的方便性、快捷性、省钱等优点,其作为一种付费手段已经广泛应用于公交、地铁等城市内公共交通领域,除了其付费功能外,通过对智能卡收集到的大量数据做有效分析对于营造优质公共交通服务具有重要的研究意义,然而如何计算乘客从闸门到站台的步行时间和换乘站换乘时间,传统的方法主要通过人工测量,其缺点包括:
[0005](I)耗费时间和人力;
[0006](2)不利于扩展,例如开通了新的线路或者新加站点等。
[0007]因此,针对上述技术问题,有必要提供一种基于智能卡数据计算地铁进站时间和换乘时间的方法及系统。
【发明内容】
[0008]有鉴于此,本发明的目的在于提供一种基于智能卡数据计算地铁进站时间和换乘时间的方法及系统。
[0009]为了达到上述目的,本发明实施例提供的技术方案如下:
[0010]一种基于智能卡数据计算地铁进站时间和换乘时间的方法,所述方法包括:
[0011]S1、数据预处理,包括:智能卡数据质量分析,对不完整、不正确数据的过滤,乘客进站记录和出站记录匹配;
[0012]S2、基础数据分析,包括计算两站之间最佳路径,计算两站之间最短时间;
[0013]S3、进站时间计算,通过分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间;
[0014]S4、换乘时间计算,通过分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
[0015]作为本发明的进一步改进,所述步骤SI前还包括:
[0016]获取源数据,所述源数据包括智能卡统计数据、地铁线路数据。
[0017]作为本发明的进一步改进,所述智能卡统计数据包括智能卡卡号、交易的地铁站、交易时间、交易类型,所述交易类型包括进站和出站。
[0018]作为本发明的进一步改进,所述地铁线路数据包括线路名称、站点列表、线路类型,所述线路类型包括上行和下行。
[0019]作为本发明的进一步改进,所述步骤SI具体包括:
[0020]过滤具有缺失字段的交易记录,包括缺失乘车时间字段、卡号字段、站点信息的交易记录;
[0021]以智能卡号作为乘客的唯一标识,匹配乘客的一次乘客的进站和出站记录。
[0022]作为本发明的进一步改进,所述步骤S3具体为:
[0023]计算所有满足从Ai站到&站最佳的乘车方案为直达线路Μ、途径B站条件的所有站点组合(Ai, B, Cj);
[0024]通过公式L21 = (Τ1+Τ2_Τ3+ξ)/2计算每个组合中的L21,其中,Tl、Τ2、Τ3分别表示乘客从Ai站到B站花费的时间、B站到&站花费的时间、Ai站到&站花费的时间,且Tl = L11+L12+L13+L14, Τ2 = L21+L22+L23+L24, Τ3 = L11+L12+L13+ξ +L23+L24, ξ 表示列车在B站停留的时间,L11、L12、L13、L14、L21、L22、L23、L24分别表示乘客从Ai站闸门至IJ站台步行所花费的时间、在Ai站台等车所花费时间、从Ai站到B站的乘车时间、从B站站台到闸门步行时间、从B站闸门到站台所花费的时间、在B站台等车所花费时间、从B站到Cj站的乘车时间、从&站台到闸门的时间;
[0025]计算L21的最小值,得到在B站从进站闸门到站台所花费的进站时间。
[0026]作为本发明的进一步改进,所述步骤S4具体为:
[0027]计算所有满足从Ai站到&站最佳乘车方案需要首先在Ai站乘坐M线路到达B换乘站、然后在B站换乘N线路到达&站条件的所有站点组合(Ai, B, Cj);
[0028]通过公式Llx = T3-T1-T2+L21+L14计算每个组合的Llx,其中,T1、T2、T3分别表示乘客从Ai站到B站花费的时间、B站到&站花费的时间、Ai站到&站花费的时间,且Tl=L11+L12+L13+L14, Τ2 = L21+L22+L23+L24, Τ3 = LI 1+L12+L13+L22+L23+L24+Llx, L11、L12、L13、L14、L21、L22、L23、L24、Llx分别表示乘客从Ai站闸门到站台所花费的时间、在Ai站台等车所花费时间、从Ai站到B站乘车所花费的时间、从M线路B站所在站台到闸门的时间、从B站闸门到M线路所在站台所花费的时间、在B站台等车所花费时间、从B站到Cj站乘车所花费的时间、从M线路在B站站台步行到N线路在B站站台所花费的时间;
[0029]计算Llx的最小值,得到在乘客在换乘站B的换乘时间。
[0030]相应地,一种基于智能卡数据计算地铁进站时间和换乘时间的系统,所述系统包括:
[0031]数据预处理模块,用于智能卡数据质量分析,对不完整、不正确数据的过滤、以及乘客进站记录和出站记录匹配;
[0032]基础数据分析模块,用于计算两站之间最佳路径、以及计算两站之间最短时间;
[0033]进站时间计算模块,用于分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间;
[0034]换乘时间计算模块,用于分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
[0035]本发明具有以下有益效果:
[0036]人工成本低;可扩展性强,若增加新的线路或站点,只需要添加线路信息即可。
【专利附图】
【附图说明】
[0037]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0038]图1为本发明的一种基于智能卡数据计算地铁进站时间和换乘时间的系统模块示意图。
[0039]图2为本发明的一种基于智能卡数据计算地铁进站时间和换乘时间的方法具体流程图。
[0040]图3为本发明一【具体实施方式】中直达线路的示意图。
[0041]图4为本发明一【具体实施方式】中直达线路的乘客乘车时间分解图。
[0042]图5为本发明一【具体实施方式】中换乘线路的示意图。
[0043]图6为本发明一【具体实施方式】中换乘线路的乘客乘车时间分解图。
【具体实施方式】
[0044]为了使本【技术领域】的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
[0045]参图1所示,本发明公开了一种基于智能卡数据计算地铁进站时间和换乘时间的系统,包括:
[0046]数据预处理模块10,用于智能卡数据质量分析,对不完整、不正确数据的过滤、以及乘客进站记录和出站记录匹配;
[0047]基础数据分析模块20,用于计算两站之间最佳路径、以及计算两站之间最短时间;
[0048]进站时间计算模块30,用于分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间;
[0049]换乘时间计算模块40,用于分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
[0050]相应地,参图2所示,本发明的一种基于智能卡数据计算地铁进站时间和换乘时间的方法,包括:
[0051]S1、数据预处理,包括:智能卡数据质量分析,对不完整、不正确数据的过滤,乘客进站记录和出站记录匹配;
[0052]S2、基础数据分析,包括计算两站之间最佳路径,计算两站之间最短时间;
[0053]S3、进站时间计算,通过分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间;
[0054]S4、换乘时间计算,通过分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
[0055]在本发明的一【具体实施方式】中,基于智能卡数据计算地铁进站时间和换乘时间的方法具有以下步骤:
[0056](O)获取源数据
[0057]本实施方式中源数据由2张表组成,分别为:智能卡交易表、地铁线路表。
[0058]智能卡统计表主要包含四个字段,即:CardID、Stat1nID、TrnsctTime、TrnsctyType,其中CardID是智能交通卡的唯一标识;Stat1nID是地铁站的唯一标示;TrnsctTime是交易(刷卡)时间,TrnsctTime有两种类型,进站和出站,分别用21, 22标识。
[0059]地铁线路表包括两个字段,即:RouteID、Stat1nlDlst、Direct1n,其中RouteID为线路名称,例如I号线,Stat1nIDlst为站点列表,Direct1n为线路类型(上、下行),1为上行,2为下行。本发明中的提到站台是有方向的,即(Stat1nID,Direct1n)的组合代表一个站台。
[0060](I)数据预处理
[0061 ] 数据预处理主要包括两步:
[0062]S1:过滤具有缺失字段的交易记录,例如缺失乘车时间字段、卡号字段、站点信息等交易记录。
[0063]S2:以智能卡号作为乘客的唯一标识,匹配乘客的一次乘客的进站和出站记录。
[0064](2)基础数据分析
[0065]基础数据分析主要包括两站之间最佳乘车方案和两站之间最短花费时间计算。
[0066]1、确定的两站之间最佳乘车方案
[0067]几乎所有地铁公司都有公布地铁到站时间表,通过这个公布的到站时间表可以推算出无需换乘站之间地铁运行时间以及只有一次换乘的两站之间的最佳路径。
[0068]2、两站之间最短花费时间
[0069]两站之间最短花费时间不仅仅包括乘客乘车所花费的时间,还包括进站步行时间,换乘时间等。两站之间最短花费时间可以通过分析乘客的进出站刷卡记录来得到,用MinTime (0,D)表示从O站到D站的最短花费时间,可以通过分析所有从O站到D站的乘客的乘车记录,计算出站时间与进站时间的时间差,并取最小值,并假设起点和终点都相同的乘客中,花费时间最短的那位乘客其在站台的等待时间为O。
[0070](3)进站时间计算
[0071]定义1:T1 (Μ, S,D)定义为在S站,从进站闸门步行到M线路D方向列车所在站台所花费的时间。
[0072]假设Ai,B,Cj三个地铁站满足:
[0073]条件1:从Ai站到&站,最佳的乘车方案为直达线路(无需换乘)Μ,途径B站,如图3所示。
[0074]其乘客从Ai站到B站,从B站到站,从Ai站到站的时间划分如图4所示,Ai站到Cj站经过B站,其中L11、L12、L13、L14、L21、L22、L23、L24分别表示乘客从Ai站闸门至IJ站台步行所花费的时间、在Ai站台等车所花费时间、从Ai站到B站的乘车时间、从B站站台到闸门步行时间、从B站闸门到站台所花费的时间、在B站台等车所花费时间、从B站到Cj站的乘车时间、从&站台到闸门的时间。
[0075]即乘客UAi站到B站的时间Tl = L11+L12+L13+L14, B站到Cj站的时间Τ2 =L21+L22+L23+L24,乘客从 Ai 站到 Cj 站的时间 Τ3 = L11+L12+L13+ ξ +L23+L24,其中 ξ 用于表示列车在B站停留的时间,乘客WAi站到B站花费的最短时间、B站到&站花费的最短时间、Ai站到Cj站花费的最短时间分别通过MinTime (Ai, B)、MinTime (B, Cj)、MinTime (Ai,Cj)得到,由两站之间最短花费时间定义可以得到L12,L22等于0,则Tl、Τ2、Τ3三者的关系可以表示为:T1+T2-T3 = (LI 1+L13+L14) + (L21+L23+L24) - (LI 1+L13+L23+L24+ ξ )=L14+L21-l ,由于同一站乘客从闸门到站台的时间等于乘客从站台到闸门的时间,即L14= L21,由于地铁在车站停车的时间相差不会很大,所以假设ξ在每个站都相同且设置为某个经验值,则 L21= (Τ1+Τ2-Τ3+ξ)/2。
[0076]所以计算乘客在站点B从进站闸门到站台所花费的时间可以通过三步完成,
[0077]计算所有满足条件I的所有站点组合(Ai, B, Cj);
[0078]计算每个组合的L21 ;
[0079]计算Min(L21),得到在B站从进站闸门到站台所花费的进站时间。
[0080](4)换乘时间计算
[0081]定义212从队5,01,02)定义为在换乘站S,从M线路Dl方向所在站台到N线路D2方向所在站台步行所花费的时间。
[0082]假设Ai, B,Cj 满足:
[0083]条件2:从Ai站到&站,其最佳乘车方案需要首先在Ai站乘坐M线路到达B换乘站,然后在B站换乘N线路到达站,如图5所示。
[0084]其乘客从Ai站到B站,从B站到站,从Ai站到站的时间划分如图6所示,Ai站到Cj站需要从B站换乘,其中L11、L12、L13、L14、L21、L22、L23、L24、Llx分别表示乘客JAAi站闸门到站台所花费的时间、在Ai站台等车所花费时间、从Ai站到B站乘车所花费的时间、从M线路B站所在站台到闸门的时间、从B站闸门到M线路所在站台所花费的时间、在B站台等车所花费时间、从B站到站乘车所花费的时间、从M线路在B站站台步行到N线路在B站站台所花费的时间。
[0085]即乘客UAi站到B站的时间Tl = L11+L12+L13+L14, B站到Cj站的时间T2 =L21+L22+L23+L24,乘客从 Ai 站到 Cj 站的时间 T3 = Lll+L12+L13+L22+L23+L24+Llx,乘客从Ai站到B站花费的最短时间、B站到&站花费的最短时间、Ai站到&站花费的最短时间分别通过MinTime (Ai, B), MinTime (B, Cj)、MinTime (Ai, Cj)得到,由两站之间最短花费时间定义可以得到L12,L22等于0,则Τ1、Τ2、Τ3三者的关系可以表示为:T1+T2_T3 = (L11+L13+L14) + (L21+L23+L24) - (LI 1+L13+L23+L24+Llx) = L14+L21_Llx,这里 L14 不等于 L21,则Llx = T3-T1-T2+L21+L14。由于L14与L21,即线路M在B站的进站时间与N线路在B站的进站时间已经求得,所以可以直接计算得到换乘时间。
[0086]所以计算乘客在换乘站B的换乘时间可以通过三步完成:
[0087]计算所有满足条件2的所有站点组合(Ai, B, Cj);
[0088]计算每个组合的Llx ;
[0089]计算Min (Llx),得到在乘客在换乘站B的换乘时间。
[0090]本发明一具体实施例中,测试数据的来源为深圳交通智能卡(SZT卡)数据,乘客可以通过刷SZT卡乘坐地铁或者公交,本发明通过:
[0091](I)分析无需换乘乘客间的时间关系计算从闸门到站台的步行时间;
[0092](2)分析换乘一次的乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间换乘步行时间。
[0093]试验分别利用本发明中提到的方法和人工实地测量计算乘客在每个站点进站时间和换乘站的换乘时间,并将两类方法得到的结果比较,发现本发明提到的方法只有7%的误差。
[0094]由以上技术方案可以看出,与现有技术相比本发明具有以下有益效果:
[0095]人工成本低;可扩展性强,若增加新的线路或站点,只需要添加线路信息即可。
[0096]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
[0097]此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
【权利要求】
1.一种基于智能卡数据计算地铁进站时间和换乘时间的方法,其特征在于,所述方法包括: 51、数据预处理,包括:智能卡数据质量分析,对不完整、不正确数据的过滤,乘客进站记录和出站记录匹配; 52、基础数据分析,包括计算两站之间最佳路径,计算两站之间最短时间; 53、进站时间计算,通过分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间; 54、换乘时间计算,通过分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
2.根据权利要求1所述的方法,其特征在于,所述步骤SI前还包括: 获取源数据,所述源数据包括智能卡统计数据、地铁线路数据。
3.根据权利要求2所述的方法,其特征在于,所述智能卡统计数据包括智能卡卡号、交易的地铁站、交易时间、交易类型,所述交易类型包括进站和出站。
4.根据权利要求2所述的方法,其特征在于,所述地铁线路数据包括线路名称、站点列表、线路类型,所述线路类型包括上行和下行。
5.根据权利要求1所述的方法,其特征在于,所述步骤SI具体包括: 过滤具有缺失字段的交易记录,包括缺失乘车时间字段、卡号字段、站点信息的交易记录; 以智能卡号作为乘客的唯一标识,匹配乘客的一次乘客的进站和出站记录。
6.根据权利要求1所述的方法,其特征在于,所述步骤S3具体为: 计算所有满足从Ai站到&站最佳的乘车方案为直达线路Μ、途径B站条件的所有站点组合(Ai, B,Cj); 通过公式L21 = (Τ1+Τ2-Τ3+ξ)/2计算每个组合中的L21,其中,Τ1、Τ2、Τ3分别表示乘客从Ai站到B站花费的时间、B站到&站花费的时间、Ai站到&站花费的时间,且Tl =L11+L12+L13+L14,T2 = L21+L22+L23+L24, T3 = L11+L12+L13+ξ +L23+L24, ξ 表示列车在B站停留的时间,L11、L12、L13、L14、L21、L22、L23、L24分别表示乘客WAi站闸门到站台步行所花费的时间、在Ai站台等车所花费时间、从Ai站到B站的乘车时间、从B站站台到闸门步行时间、从B站闸门到站台所花费的时间、在B站台等车所花费时间、从B站到&站的乘车时间、从G站台到闸门的时间; 计算L21的最小值,得到在B站从进站闸门到站台所花费的进站时间。
7.根据权利要求1所述的方法,其特征在于,所述步骤S4具体为: 计算所有满足从Ai站到&站最佳乘车方案需要首先在Ai站乘坐M线路到达B换乘站、然后在B站换乘N线路到达&站条件的所有站点组合(Ai, B, Cj); 通过公式Llx = T3-T1-T2+L21+L14计算每个组合的Llx,其中,Τ1、Τ2、Τ3分别表示乘客从Ai站到B站花费的时间、B站到&站花费的时间、Ai站到&站花费的时间,且Tl =L11+L12+L13+L14,T2 = L21+L22+L23+L24, T3 = LI 1+L12+L13+L22+L23+L24+Llx, LI UL12,L13、L14、L21、L22、L23、L24、Llx分别表示乘客从Ai站闸门到站台所花费的时间、在Ai站台等车所花费时间、从Ai站到B站乘车所花费的时间、从M线路B站所在站台到闸门的时间、从B站闸门到M线路所在站台所花费的时间、在B站台等车所花费时间、从B站到Cj站乘车所花费的时间、从M线路在B站站台步行到N线路在B站站台所花费的时间; 计算Llx的最小值,得到在乘客在换乘站B的换乘时间。
8.一种基于智能卡数据计算地铁进站时间和换乘时间的系统,其特征在于,所述系统包括: 数据预处理模块,用于智能卡数据质量分析,对不完整、不正确数据的过滤、以及乘客进站记录和出站记录匹配; 基础数据分析模块,用于计算两站之间最佳路径、以及计算两站之间最短时间; 进站时间计算模块,用于分析无需换乘乘客间的时间关系计算从闸门到站台的进站时间; 换乘时间计算模块,用于分析换乘一次乘客与无需换乘乘客乘车时间的关系计算换乘站不同线路间的换乘时间。
【文档编号】G07C9/00GK104331964SQ201410596972
【公开日】2015年2月4日 申请日期:2014年10月29日 优先权日:2014年10月29日
【发明者】赵娟娟, 张帆, 田臣, 须成忠 申请人:深圳先进技术研究院