一种基于手机信令数据的路径识别方法及系统与流程

文档序号:14477714阅读:6236来源:国知局
一种基于手机信令数据的路径识别方法及系统与流程

本发明属于轨道交通技术领域,尤其涉及一种基于手机信令数据的路径识别方法及系统。



背景技术:

“一票换乘”的城市轨道交通网络化运营条件下,afc系统(automaticfarecollectionsystem,城市轨道交通自动售检票系统)仅能获取乘客出行的出发地点和目的地点,而无法获取具体的出行路径。目前无论是分析轨道交通客流出行特征还是挖掘实时动态交通信息,进行票务清分、路径诱导、高峰时段客流监测等问题,都要获取乘客在轨道交通中具体出行路径。

现有的客流采集方法、视频监控系统、射频信号定位技术等客流采集技术只是简单地对客流量进行采集,无法获得乘客出行的时空路径信息。



技术实现要素:

本发明所要解决的技术问题在于提供一种基于手机信令数据的路径识别方法及系统,旨在解决现有技术无法获得乘客出行的时空路径信息的问题。

本发明是这样实现的,一种基于手机信令数据的路径识别方法,包括:

将乘客的手机信令数据映射到地理信息数据库上,获取乘客出行的路径信息,所述地理信息数据库包括轨道交通的基站信息数据库和轨道交通网络的地理信息数据库;

根据所述路径信息进行信息识别,得到包括所述乘客的进站站点、换乘站点和出站站点的路径识别信息;

根据所述路径识别信息、所述手机信令数据中的时间信息和列车运行时刻表进行匹配,得到所述乘客的乘车方案集;

根据所述乘客的乘车方案集和所述手机信令数据进行匹配,得到所述乘客的出行车次信息。

进一步地,还包括:

采集所述乘客的原始手机信令数据,所述原始手机信令数据包括国际移动用户识别号imsi、移动台识别码msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid;

根据所述原始手机信令数据的时间戳time进行出行时间排序,对排序后的所述原始手机信令数据分别进行无效数据剔除、完整性检查和过滤数据的预处理,得到预处理数据;

根据出行用户数据库对所述预处理数据进行缩样,或根据历史出行用户数据库对所述预处理数据进行扩样,得到所述乘客的手机信令数据,所述出行用户数据库和所述历史出行用户数据由城市轨道交通自动售检票系统afc进行采集。

进一步地,对所述原始手机信令数据分别进行无效数据剔除、完整性检查和过滤数据的预处理,得到预处理数据包括:

判断所述原始手机信令数据是否包含两个预置间隔的时间信息;

若不包含,则剔除所述原始手机信令数据,若包含,则将所述原始手机信令数据保留;

表示所述原始手机信令数据中的进站站点时间,以表示所述原始手机信令数据中的出站站点时间,表示进出站时间阈值,若则判断时间有效性完整,若则判断时间有效性不完整,将时间有效性不完整的原始手机信令数据剔除;

根据所述轨道交通的基站信息数据库对保留的原始手机信令数据进行过滤,得到所述预处理数据。

进一步地,所述根据出行用户数据库对所述预处理数据进行缩样,或根据历史出行用户数据库对所述预处理数据进行扩样,得到所述乘客的手机信令数据包括:

判断所述预处理数据的数量是否大于所述出行用户数据库的数量,若大于,则进一步地判断所述预处理数据中是否包含有不同身份的msid号的乘客、且包含有不同身份的msid号的乘客多次在同一时间内出行,则仅保留一个乘客的预处理数据,以缩样后的预处理数据为乘客的手机信令数据;

若所述预处理数据的数量小于所述出行用户数据库的数量,则按照预设扩样比例,根据历史出行用户数据对所述预处理数据进行扩张,得到乘客的手机信令数据。

进一步地,所述地理信息数据库包括轨道交通的基站信息数据库和轨道交通网络的地理信息数据库,所述将乘客的手机信令数据映射到地理信息数据库上,获取乘客出行的路径信息包括:

根据所述乘客的手机信令数据中的位置区码lac和蜂窝小区编码cellid在所述轨道交通的基站信息数据库定位出基站信息;

根据所述基站信息在所述轨道交通网络的地理信息数据库定位得到经纬度,以所述经纬度信息确定所述乘客出行的路径信息。

进一步地,所述乘客的手机信令数据包括国际移动用户识别号imsi、移动台识别码msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid,则所述根据所述路径信息进行信息识别,得到包括所述乘客的进站站点、换乘站点和出站站点的路径识别信息包括:

设乘客的手机在i时刻上传的位置信息为:p(uidp;laci;cii;ti;eventidi),其中uidp为乘客p的用户编号,laci是i时刻位置对应的lac编号,cii是i时刻位置信息对应的基站编号,ti为位置更新时间,eventidi是i时刻对应的事件类型;

按照时间先后顺序对所述乘客p的手机信令数据进行排序;

当所述乘客p的手机信令数据p(uidp;laci;cii;ti;eventidi)中首次出现laci∈set{laclinen}且cii∈set{cik},同时eventidi为跨越位置区更新事件时,则将cii对应的地铁站作为所述乘客p此次出行的进站站点;

当所述乘客p的手机信令数据p(uidp;laci;cii;ti;eventidi)中首次出现p(uidp;laci+m;cii+m;ti+m;eventidi+m),且cii+n-1∈set{cik}laci+m∈set{laclinen}、cii+m∈set{cik},laci+m≠laci,m>0,同时,eventidi为跨越位置区更新事件时,则将cii+n对应的地铁站作为所述乘客p此次出行其中的一个换乘站点;

当所述乘客p的手机信令数据p(uidp;laci;cii;ti;eventidi)中出现p(uidp;laci+n;cii+n;eventidi+n),其中n>m,laci+n-1∈set{laclinen};cii+n-1∈set{cik},同时,eventidi+n为跨越位置区更新时,则将cii+n-1对应的地铁站作为所述乘客p此次出行的出站站点;

根据所述进站站点、换乘站点和出站站点作为所述乘客p的路径识别信息。

进一步地,所述根据所述进站站点、换乘站点和出站站点作为所述乘客p的路径识别信息之后,还包括:

根据所有乘客的路径识别信息建立进出站数据库;

所述进出站数据库中各乘客的信息保存格式为:

其中,uidp为乘客p的用户编号,为乘客p第x次地铁出行的进站时间,为乘客p第x次地铁出行的出站时间,为乘客p进站站点对应的基站编号,为乘客p第x次地铁出行的出站时间点对于基站编号。

进一步地,所述根据所述路径识别信息、所述手机信令数据中的时间信息和列车运行时刻表进行匹配,得到所述乘客的乘车方案集包括:

根据所述路径识别信息,通过所述手机信令数据获取乘客达到站点si的时刻ts1;

通过与列车运行时刻表结合,利用搜索算法在所述列车运行时刻表的线路l上搜索所有车次;

当时刻tsi满足建立可能的乘车方案集p1,则:

p1={train1、train2、train3、…、traini},其中,traini表示列车的车次,其中,表示第k次列车发车时刻,表示第k次列车到达时刻,tsi表示监测到乘客在站点时刻。

进一步地,所述根据所述乘客的乘车方案集和所述手机信令数据进行匹配,得到所述乘客的出行车次信息包括:

从所述手机信令数据中获取所述乘客在下游车站si+1的时刻ts1;

通过所述乘车方案集,根据公式|ts2-ts1|≥ε匹配所述乘客乘坐的具体车次,ε表示列车的区间运行时分;

以tesi表示所述乘客的到站时间,以tir表示换乘通道的走行时间,计算所述乘客的换乘时间则:

根据所述手机信令数据、所述乘客乘坐的具体车次和所述乘客的换乘时间最终匹配得到所述乘客的出行车次信息。

本发明还提供了一种基于手机信令数据的路径识别系统,包括:

映射单元,用于将乘客的手机信令数据映射到地理信息数据库上,获取乘客出行的路径信息;

识别单元,用于根据所述路径信息进行信息识别,得到包括所述乘客的进站站点、换乘站点和出站站点的路径识别信息;

匹配单元,用于根据所述路径识别信息、所述手机信令数据中的时间信息和列车运行时刻表进行匹配,得到所述乘客的乘车方案集,根据所述乘客的乘车方案集和所述手机信令数据进行匹配,得到所述乘客的出行车次信息。

本发明与现有技术相比,有益效果在于:本发明通过将乘客的手机信令数据映射到地理信息数据库上,以获取乘客出行的路径信息,根据该路径信息进行信息识别得到路径识别信息,将识别得到的路径识别信息、手机信令数据和列车运行时刻表进行匹配,得到乘客的乘车方案集,最后根据该乘车方案集和手机信令数据进行匹配,得到乘客的出行车次信息。本发明实施例通过乘客的手机信令数据,并结合列车运行时刻表和基站信息等,匹配出该乘客出行时间和出行车次信息,解决了现有技术无法获取乘客出行的时空路径信息的缺陷,同时匹配得到的出行车次信息为城市轨道交通的票务清分和客流的精确化统计分析提供了精确的数据支持。

附图说明

图1是本发明实施例提供的一种基于手机信令数据的路径识别方法的流程图;

图2是本发明实施例提供的一种基于手机信令数据的路径识别方法的详细流程图;

图3是本发明实施例提供的城市轨道线网示意图;

图4是本发明实施例提供的基于手机信令数据的路径匹配图;

图5是本发明实施例提供的城市轨道交通的乘客乘车方案匹配示意图;

图6是本发明实施例提供的一种基于手机信令数据的路径识别系统的结构示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

目前手机用户数量和手机使用率的不断提高,无线通信网络覆盖区域的不断扩大,为利用手机信令数据获取乘客出行的时空路径信息提供了条件。基于此,本发明提供如图1所示的一种基于手机信令数据的路径识别方法,包括:

s101,将乘客的手机信令数据映射到地理信息数据库上,获取乘客出行的路径信息,所述地理信息数据库包括轨道交通的基站信息数据库和轨道交通网络的地理信息数据库;

s102,根据所述路径信息进行信息识别,得到包括所述乘客的进站站点、换乘站点和出站站点的路径识别信息;

s103,根据所述路径识别信息、所述手机信令数据中的时间信息和列车运行时刻表进行匹配,得到所述乘客的乘车方案集;

s104,根据所述乘客的乘车方案集和所述手机信令数据进行匹配,得到所述乘客的出行车次信息。

下面,通过结合图2对本发明实施例进行进一步地阐述:

步骤1、手机信令数据的采集:

根据全球移动通信的原理,利用手机定位技术和手机切换定位技术,通过移动运营商的手机信令采集系统获取手机信令数据,本实施例中主要采集预置时间内的手机信令数据,如一天内的手机信令数据。采集的手机信令数据中主要包括:国际移动用户识别号imsi、imsi匿名处理后的结果msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid。

步骤2、数据预处理:

一天内的手机信令数据数量巨大,因此需要对手机信令数据进行处理以便于数据的管理和降低数据的处理复杂程度。对采集的手机信令数据进行预处理,首先按照乘客的出行时间排序,对排序后乘客的手机信令数据进行的预处理的主要包括:

一、剔除原始的手机信令数据中的无效信息和缺失数据;无效信息是指在数据的采集过程中,由于信号采集系统和无线通信网络不稳定等系统特性导致乘客的手机信令数据记录不完全和丢失,城市轨道交通出行路径识别不完整,包括无法识别出进站点、出站点或者换成站点等来判断,因为手机信令数据的缺失无法匹配对应的站点。

一条完整的手机信令数据包含多项数据项,为了有效分析手机用户出行行为分析,通过对原始手机信令数据进行简化,即对基于位置分析所需要的数据项进行简化,只保留基于位置分析所需要的数据项。这些数据项包括:国际移动用户识别号imsi、imsi匿名处理后的结果msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid。在数据的收集的过程中可能会有数据采集缺失,因此可根据三点来定位:收集的信令数据至少要包含3个有效时间戳(进站点,中间站,出站点)和一个位置区编号因为在实际中,乘客除经过换乘站等信息,至少要包括进站和出站。无效的数据主要通过:一、缺失数据,数据行中存在字段值为空的数据。二、完全相同的重复数据,在信令事件记录数据库中存在完全重复数据,即所有字段完全相同,这种重复数据的出现存在信令记录生成的过程中以及数据的存储过程中。三、无效eventid数据项过滤,一些触发失败类型的信令中,由于失败原因不明,因此这部分信令记录所反应的位置信息可能并非用户的真实位置。

二、数据完整性检查;进出站的完整性检验是对一次轨道交通出行行为的完整性进行检验,包括:

时间的有效性检验:乘客在一次轨道交通出行中,依据出行距离的大小,总耗费一个合理范围内的时间。利用手机信令数据识别出一次出行中的进站点和出站点,理论上视为一次出行路径。对于一天多次出行的轨道交通乘客通过在换乘站点间设置时间阈值进行判别,如果超过一定的阈值则从本次的出行中剔除,即时间的有效性检验的判断条件为:其中表示监测的乘客的进站点时间,表示监测的乘客的出站点时间,表示根据地铁线路的出行时间来设定的阈值。

空间有限性检验:空间有效性检验主要是对一次轨道交通出行行为的完整性进行检验。一次完整的轨道交通出行至少包括进站行为和出站行为。一方面在数据分析时,轨道交通出行站点的匹配中,无法进行判断进出站点的行为,导致出行站点的匹配遗漏,虽然可以通过其他中间站点进行判别该乘客在本次地铁出行的完整路径中,也判断为路径匹配不完整,根据有效性的原则剔除本次出行。

通过对采集到的手机信令数据进行数据完整性和一致性的检查,可以消除数据噪音,去除与乘客实际活动轨迹不符的信令记录,识别真实反映个人活动的信令记录。噪声数据主要是无效冗余数据和在进行识别路径时的异常数据,该异常数据如漂移数据和乒乓球数据等。。

三、与轨道交通基站数据库相结合,过滤出地铁的出行用户,减少样本的计算工作。

步骤3、扩样与缩样:

由于在实际中利用手机信令数据识别出的乘客的总数与实际的轨道交通乘客总数不一致,一方面可能会有信息采集的缺漏,使数据比实际数据要小;另一方面;目前的智能手机支持双卡双待,或者一个乘客具有两部的手机的情况,使采集到的数据比实际要大。针对数据的扩样可以利用目前的afc数据进行扩样,同时根据采集的历史数据进行数据缩样。

数据缩样是根据历史afc数据进行比较,如果采集的手机信令数据远大于afc数据,则在城市轨道交通的乘客的手机信令数据信息库中进行数据比对,若发现不同身份的msid号的乘客,且在多次出行中都在同一时间,该时间精确到秒,那将不同身份的msid号的乘客视为同一乘客,剔除其他乘客,仅保留一个乘客的手机信令数据。

由于信号采集系统和无线通信网络不稳定等系统特性导致用户信令数据记录不完全和丢失,因此需要对采集到的手机信令数据进行数据扩样。通过将采集到的手机信令数据与城市轨道交通出行用户数据库进行比对,如果采集到的手机信令数据明显少于afc系统采集的用户,那么通过afc的历史数据来增加手机信令数据的数量。可通过afc系统采集的历史数据客流量进行设置扩样的比例来进行数据扩样。

步骤4、建立数据信息库:

在本发明时实施例中,利用手机信令数据提取交通信息,必须借助城市轨道交通通信网络的基站信息数据和轨道交通线网的地理信息数据,通过建立轨道交通基站信息数据库和轨道交通网络的地理信息数据库gis(geographicinformationsystem),将手机信令数据的位置信息映射到实际的地理位置上。该映射的过程包括:根据手机初始的手机信令数据中的位置区码lac的编号和蜂窝小区编号cellid将手机定位在对应的基站辐射范围内,再根据地理信息数据库定位经纬度,从而获取乘客出行的路径信息。该路径信息包括乘客的出行线路,如从a站点进入,并从b站点出,其中经过了c站和d站,该路径信息可以从显示装置上以地图的形式显示出来。

步骤5、轨道交通乘客出行路径识别:

乘客路径的识别主要包括进站点的识别、换乘站点的识别、中间站的识别、出站点的识别。

设手机在i时刻上传的位置信息为:p(uidp;laci;cii;t;eventidi),其中:uidp表示乘客p的用户编号,laci表示i时刻位置对应的lac编号,cii表示i时刻位置信息对应的基站编号,其中,t=ti表示位置更新时间,eventidi表示i时刻对应的事件类型。对路径信息进行识别的步骤包括:

(1)将步骤3中筛选出来的乘客的手机信令数据按照产生的时间先后进行排序;

(2)按乘客的手机信令数据的时间先后顺序依次进行判别,当p(uidp;laci;t;eventidi)首次出现laci∈set{laclinen}且cii∈set{cik},同时eventidi为跨越位置区更新事件时,则将cii对应的地铁站作为乘客的进站站点。

(3)继续对同一乘客的手机信令数据进行判别,若首次出现p(uidp;laci+m;cii+m;ti+m;eventidi+m),其中:cii+n-1∈set{cik},laci+m∈set{laclinen}。cii+m∈set{cik},当laci+m≠laci,m>0,同时,eventidi为跨越位置区更新事件时,则认定cii+n对应的地铁站为此次乘客出行其中的一个换乘站点。

(4)在第(3)步的基础上继续进行判别,若信令p(uidp;laci+n;cii+n;eventidi+n)式中n>m,laci+n-1∈set{laclinen},cii+n-1∈set{cik},同时,eventidi+n为跨越位置区更新时,则认定cii+n-1对应的地铁站为乘客此次出行的出站站点,结束本次路径识别。

(5)以为在实际中,乘客存在多次乘坐地铁的情况,因而重复步骤(2)、(3)、(4)继续对手机信令数据进行识别,直到所有的手机信令数据全部识别完毕。将得到的识别结果建立进出站数据库。

该进出站数据库中进出地铁站点信息的保存格式为:

其中,uidp表示乘客p的用户编号,表示乘客p第x次地铁出行的进站时间,表示乘客p第x次地铁出行的出站时间,表示乘客p进站站点对应的基站编号,表示乘客p第x次地铁出行的出站时间点对于基站编号。

步骤6、地铁路径有效性判别:

通过基站与地铁站点匹配能够初步获取乘客在轨道交通出行的进站点、换乘站点、出站点。但在实际的数据采集的过程中可能会由于信号传输的问题造成数据的丢失,无法匹配出行站点。因此需要对匹配的站点进行有效性检验。

有效性检验主要包括:一、对出行的起讫点完整性的检验,主要在进行路径匹配的过程中发现有进站站点或者是出站站点的缺失则认定此次出行无效,在一次出行的过程中设置进站时间和出站时间存在间隔阈值则判定多次出行行为。二、对换乘站点合理性的检验,主要针对换乘站点的合理性进行检验。

步骤7、基于列车运行图的乘客乘车方案的匹配:

通过步骤3、4、5可以识别出乘客的具体路径,通过手机信令数据可以监测乘客到达站点si的时刻ts1,通过与列车时刻表结合,利用搜索算法在列车运行时刻表的线路l上搜索所有的车次;

当时间tsi满足如下条件:

建立可能的乘车方案集p1,则p1={train1、train2、train3、…、traini},其中,traini表示列车的车次,其中,表示第k次列车发车时刻,表示第k次列车到达时刻,tsi表示监测到乘客在站点时刻。

步骤8,根据步骤7建立的乘车方案集和手机信令数据,获取乘客在下游车站si+1的时刻ts1,通过乘车方案集可以缩小匹配的范围,则将乘次匹配到乘坐的具体车次需满足:|ts2-ts1|≥ε,ε表示列车的区间运行时分。

步骤9,考虑到乘客在出行的过程中,需要换乘。以tesi表示所述乘客的到站时间,以tir表示换乘通道的走行时间,计算所述乘客的换乘时间则:

最后通过步骤8和步骤9进行不断迭代,最终匹配出乘客的出行车次信息。

上述步骤1至步骤9的流程如图2所示。

下面,通过具体的使用例来对本实施例进行进一步地阐述:

步骤a、手机信令数据的采集:

在本发明实施例中,以深圳市轨道交通网络为研究的对象进行验证,乘客具有共同的出发点和到站点,如图3中的2号线景田站到达3号线的老街站,来识别出不同乘客的出行路径。通过采集有效样本200个,景田至老街方向的有效样本为80个,经上述基站与轨道交通站点的匹配可以获取城市轨道交通的出行进出站点。

步骤b、数据的处理;

经手机信令数据的采集、分析,如图4所示,第1条数据为7点30分采集到乘客的进站时刻,通过与地铁基站信息库匹配为2号线景田站,第2条数据在7点33分为福田站,经过不断的迭代匹配到第7条数据发现位置区发生变化为1号线的大剧院站。第8条数据为8点05分采集到乘客到达终点老街站,在地铁信息库中无法匹配到其位置信息。

步骤c、不同的路径识别;

乘客2也是从2号线的景田站出发,经大剧院换乘3号线最后到达老街站。结合图4城市轨道交通乘客乘车方案进行匹配,将识别出乘客出行的路径与列车时刻表结合推定乘客的乘车方案。

步骤d、匹配车次,推定乘车方案:

通过路径的识别后与列车的时刻表结合匹配出乘客的乘车方案,以乘客1为例,在7点47分监测到乘客到达燕南站的时刻,通过与列车的时刻表匹配可以得出其可能的乘车方案为7点48分之后的20055、20056次列车,在7点51分监测到乘客到达下游车站大剧院站。通过乘客乘车方案的匹配可以的出两站点的时间差趋近于列车在两站点的运行时间。在经过大剧院(换乘站),加上通道的走行时间,在重点站监测到乘客的出站时间为8点05分,在通过乘客乘车方案的匹配算法可以得出换乘1号线的10032车次。因此通过乘客乘车方案的匹配可以获取乘客乘坐的车次。

本发明实施例根据城市轨道交通的无线通信网络系统,通过利用手机信令数据识别乘客在轨道交通站点的具体出行路径,主要通过对手机信令数据的处理,提出了城市轨道交通进站点、中间站、换乘站和出站点匹配算法和路径的有效性判别,最终获取乘客在城市轨道交通出行的具体时空路径信息。通过识别出乘客的路径后与列车时刻表方案结合匹配出具体的乘坐车次,通过匹配算法可为城市轨道交通网络客流的实时统计和票款清分提供依据。

如图6所示,本发明实施例还提供了一种基于手机信令数据的路径识别系统,包括:

映射单元601,用于将乘客的手机信令数据映射到地理信息数据库上,获取乘客出行的路径信息,所述地理信息数据库包括轨道交通的基站信息数据库和轨道交通网络的地理信息数据库;

识别单元602,用于根据所述路径信息进行信息识别,得到包括所述乘客的进站站点、换乘站点和出站站点的路径识别信息;

匹配单元603,用于根据所述路径识别信息、所述手机信令数据中的时间信息和列车运行时刻表进行匹配,得到所述乘客的乘车方案集,根据所述乘客的乘车方案集和所述手机信令数据进行匹配,得到所述乘客的出行车次信息。

进一步地,路径识别系统还包括:

采集单元,用于采集所述乘客的原始手机信令数据,所述原始手机信令数据包括国际移动用户识别号imsi、移动台识别码msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid;

预处理单元,用于根据所述原始手机信令数据的时间戳time进行出行时间排序,对排序后的所述原始手机信令数据分别进行无效数据剔除、完整性检查和过滤数据的预处理,得到预处理数据;

数据处理单元,用于根据出行用户数据库对所述预处理数据进行缩样,或根据历史出行用户数据库对所述预处理数据进行扩样,得到所述乘客的手机信令数据,所述出行用户数据库和所述历史出行用户数据由城市轨道交通自动售检票系统afc进行采集。

进一步地,预处理单元具体用于:

判断所述原始手机信令数据是否包含两个预置间隔的时间信息;

若不包含,则剔除所述原始手机信令数据,若包含,则将所述原始手机信令数据保留;

表示所述原始手机信令数据中的进站站点时间,以表示所述原始手机信令数据中的出站站点时间,表示进出站时间阈值,若则判断时间有效性完整,若则判断时间有效性不完整,将时间有效性不完整的原始手机信令数据剔除;

根据所述轨道交通的基站信息数据库对保留的原始手机信令数据进行过滤,得到所述预处理数据。

进一步地,数据处理单元具体用于:

判断所述预处理数据的数量是否大于所述出行用户数据库的数量,若大于,则进一步地判断所述预处理数据中是否包含有不同身份的msid号的乘客、且包含有不同身份的msid号的乘客多次在同一时间内出行,则仅保留一个乘客的预处理数据,以缩样后的预处理数据为乘客的手机信令数据;

若所述预处理数据的数量小于所述出行用户数据库的数量,则按照预设扩样比例,根据历史出行用户数据对所述预处理数据进行扩张,得到乘客的手机信令数据。

进一步地,映射单元601具体用于:

根据所述乘客的手机信令数据中的位置区码lac和蜂窝小区编码cellid在所述轨道交通的基站信息数据库定位出基站信息;

根据所述基站信息在所述轨道交通网络的地理信息数据库定位得到经纬度,以所述经纬度信息确定所述乘客出行的路径信息。

进一步地,所述乘客的手机信令数据包括国际移动用户识别号imsi、移动台识别码msid、时间戳time、位置区码lac、蜂窝小区编号cellid和事件类型eventid,则所述识别单元具体用于:

设乘客的手机在i时刻上传的位置信息为:p(uidp;laci;cii;t;eventidi),其中uidp为乘客p的用户编号,laci是i时刻位置对应的lac编号,cii是i时刻位置信息对应的基站编号,ti为位置更新时间,eventidi是i时刻对应的事件类型;

按照时间先后顺序对所述乘客p的手机信令数据进行排序;

当所述乘客p的手机信令数据p(uidp;laci;t;eventidi)中首次出现laci∈set{laclinen}且cii∈set{cik},同时eventidi为跨越位置区更新事件时,则将cii对应的地铁站作为所述乘客p此次出行的进站站点;

当所述乘客p的手机信令数据p(uidp;laci;t;eventidi)中首次出现p(uidp;laci+m;cii+m;ti+m;eventidi+m),且cii+n-1∈set{cik}laci+m∈set{laclinen}、cii+m∈set{cik},laci+m≠laci,m>0,同时,eventidi为跨越位置区更新事件时,则将cii+n对应的地铁站作为所述乘客p此次出行其中的一个换乘站点;

当所述乘客p的手机信令数据p(uidp;laci;t;eventidi)中出现p(uidp;laci+n;cii+n;eventidi+n),其中n>m,laci+n-1∈set{laclinen};cii+n-1∈set{cik},同时,eventidi+n为跨越位置区更新时,则将cii+n-1对应的地铁站作为所述乘客p此次出行的出站站点;

根据所述进站站点、换乘站点和出站站点作为所述乘客p的路径识别信息。

进一步地,识别单元602还用于:

根据所有乘客的路径识别信息建立进出站数据库;

所述进出站数据库中各乘客的信息保存格式为:

其中,uidp为乘客p的用户编号,为乘客p第x次地铁出行的进站时间,为乘客p第x次地铁出行的出站时间,为乘客p进站站点对应的基站编号,乘客p第x次地铁出行的出站时间点对于基站编号。

进一步地,匹配单元603具体用于:

根据所述路径识别信息,通过所述手机信令数据获取乘客达到站点si的时刻ts1;

通过与列车运行时刻表结合,利用搜索算法在所述列车运行时刻表的线路l上搜索所有车次;

当时刻tsi满足建立可能的乘车方案集p1,则:

p1={train1、train2、train3、…、traini},其中,traini表示列车的车次,其中,表示第k次列车发车时刻,表示第k次列车到达时刻,tsi表示监测到乘客在站点时刻。

进一步地,匹配单元603还用于:

从所述手机信令数据中获取所述乘客在下游车站si+1的时刻ts1;

通过所述乘车方案集,根据公式|ts2-ts1|≥ε匹配所述乘客乘坐的具体车次,ε表示列车的区间运行时分;

以tesi表示所述乘客的到站时间,以tir表示换乘通道的走行时间,计算所述乘客的换乘时间则:

根据所述手机信令数据、所述乘客乘坐的具体车次和所述乘客的换乘时间最终匹配得到所述乘客的出行车次信息。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1