一种公交乘客客流数据采集与分析方法与流程

文档序号:12368031阅读:1368来源:国知局
本发明属于道路交通信息服务与运营管理领域,涉及一种数据采集与分析方法,尤其是一种乘客客流数据采集与分析方法。
背景技术
:目前,公交公司、交通管理部门所需的乘客站点上下客与站间断面客流信息的主要数据来源有人工抽样、交通IC卡以及车门视频数据。其中,人工抽样具有高精准度、人力成本大、样本过小的特点;交通IC卡则具有用户多、数据量大、使用频率高等特点,但由于大量公交只需上车刷卡,导致IC卡无法准确获知乘客的下车站点;视频数据能够较准确地识别各车门的上下客人数,但人流高峰时识别精度会明显下降,且无法获知乘客的出行OD(起讫点)。公开号为CN105096601A的中国专利申请“基于公交移动WiFi热点的线路满载率实时计算方法”中,根据公交车牌ID数据提取对应该公交车牌ID的链接WiFi的实时手机用户数目,从而计算单个公交车车辆上的实际乘客总数,结合承载定员人数计算单个公交车车辆满载率。该方法通过满载率来判断线路设计合理性,最终达到公交车辆分配调度的最优化平衡目的。公开号为CN103700174A的中国专利申请“一种基于WiFi身份识别的公交客流数据采集及OD分析方法”中,通过公交AP热点读取乘客所持有WiFi设备的MAC地址,识别乘客身份再通过对列表中MAC地址的统计获取公交车上下车及断面持有WiFi乘客总人数。该方法建立乘客信息数据库,得到整个城市所有公交站点之间的OD矩阵。但上述技术都没有考虑公交车,包括小汽车、公交车等临近车辆的干扰,同时城区与郊区的道路交通流存在很大差异,不同的公交上下客流也存在不同分布的误差,具体的修正或扩样方法不可一概而论。技术实现要素:本发明的目的在于提供一种能够极大地排除干扰,有效修正的公交乘客客流数据采集与分析方法。为了达到上述目的,本发明的解决方案是:一种公交乘客客流数据采集与分析方法,包括以下步骤:(1)初步采集:追踪用户在公交无线网络接入点的出现时刻ts与消失时刻te;(2)匹配:将公交车GPS数据与站点信息进行匹配,得到公交车在各站点的停靠时刻,构建公交车在各站点的停靠信息,至少包括公交车在各站点的停靠时刻和对应站点的名称;(3)筛除干扰:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和所述步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客;剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到作为公交车乘客的用户的上车站点和下车站点;(4)客流推导:根据所述步骤(3)得到的作为公交车乘客的用户的上车站点和下车站点,计算得到各站点的客流,并按线路行驶方向累加得到站点间的断面客流;(5)数据修正:将所述步骤(4)得到的客流与人工实际统计的客流进行比较,计算客流误差;对客流误差的分布进行假设检验,建立客流误差修正算法对所述步骤(4)中得到的客流进行修正。所述步骤(1)基于IEEE802.11的通信机制,用户的移动终端通过WIFI方式传输信息帧,公交车AP终端对用户的移动终端进行无认证感知并采集,记录用户信息,并进行帧类型的识别。优选地,所述用户信息包括用户MAC地址、信息传输时间、信息帧类型和信号强度。所述步骤(2)中将公交车GPS数据与站点信息进行匹配的方法为:(21)查询目标线路每个站点的经纬度坐标;(22)换算每条GPS数据记录的经纬度坐标与每个站点的经纬度坐标换对应位置的距离djw;每条GPS数据均至少包括记录时刻、在所述记录时刻公交车所处的经纬度坐标以及公交车的速度;(23)筛选出每个站点半径阈值dr范围内的所有GPS数据,从中筛选出公交车的速度最小且最小的速度小于速度阈值的记录点作为公交车在该站点的停车点,记录停靠时刻tb;半径阈值dr和所述速度阈值均为设定的;(24)将各站点的站点名称、站点的经纬度坐标、对应的停车点处的经纬度坐标、站点和对应的停车点的距离、对应的最小的公交车的速度构成匹配结果。优选地,所述距离djw的计算公式为:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180其中:LonA和LatA为站点的经纬度坐标;LonB和LatB为GPS记录点的经纬度坐标;R为地球半径;Mlon表示对东经取正,对西经取负后得到的新经度。优选地,所述速度阈值为10km/h。所述步骤(3)中的时间阈值Δt的计算方法为:根据上一部公交车GPS数据与站点信息匹配的结果,计算所在线路各站点之间公交车的行驶时间集合TI;再提取所述行驶时间集合TI的85%分位数tI85,把大于tI85的行驶时间剔除,保留剩余的行驶时间得到行驶时间集合TI’,并求得TI’的均值则时间阈值Δt根据下式计算得到:所述步骤(3)中的距离阈值Δs为:Δs=db2其中,db2为若乘客下车后往与公交车的行驶方向相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站点的距离。所述步骤(3)包括以下步骤:(31)对每个用户,计算消失时刻te与出现时刻ts之差得到持续时间Tse;(32)若持续时间Tse小于时间阈值Δt,则认定对应的用户不是公交车乘客,直接删除对应的用户的数据;否则,进入步骤(33);(33)在公交车GPS数据中,寻找在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;(34)基于所述步骤(2)匹配得到的公交车在各站点的停靠信息,将离出现时刻ts公交车的经纬度坐标最近的同方向的站点设定为用户的上车站点,将离消失时刻te公交车的经纬度坐标最近的同方向的站点设定为用户的下车站点;(35)计算出现时刻ts公交车的经纬度坐标与设定的上车站点之间的距离d1,以及消失时刻te公交车的经纬度坐标与设定的下车站点之间的距离d2;当所述距离d1和所述距离d2均小于所述距离阈值Δs时,判定对应的用户为公交车乘客,所述步骤(34)中设定的上车站点和下车站点为用户实际的上车站点和下车站点。所述步骤(5)中对客流误差进行假设检验和修正包括:假设客流误差服从正态分布,对样本进行参数估计,拟合得到客流误差的正态分布,称为拟合正态分布;通过正态假设检验判断所述拟合正态分布的合理性;将通过检验的拟合正态分布的期望值作为客流的修正值,将所述修正值加上所述步骤(4)推断得到的客流,得到修正后的客流。优选的,所述拟合采用MATLAB软件进行。所述检验的方法为利用T检验进行显著性水平为0.05的假设检验。所述检验的方法为皮尔逊卡方检验。优选地,所述检验的方法包括以下步骤:将需要检验的数据分为等量的m组;依次计算以下各式:pi=φ(Xmax-μα)]]>npi=Xmax*piχ2=Σi=0m(ni-npi)2npi]]>其中:pi为正态概率;npi为理论频数;n表示所用于检验的样本量;Xmax表示分成m组中,每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值;如果算得的χ2趋向于自由度为l-k-1的χ2分布,则假设检验成立,样本数据符合假设的正态分布;如果算得的χ2大于自由度为l-k-1的χ2分布时,假设检验不成立;其中,l表示检验的分组数量,等于上述的m;k表示需要估计的未知参数的个数,此处等于2。所述步骤(5)中,对客流误差的分布进行假设检验前,对客流误差进行分段,且后续假设检验和修正针对分段后的各段客流误差及所对应的客流进行。优选地,所述分段根据线路的不同、和/或时间段的不同、和/或公交站点群的不同进行。由于采用上述方案,本发明的有益效果是:本发明提出了一种基于公交车内无线局域网数据传输和公交车GPS数据融合的公交车乘客客流数据采集与分析方法,该方法自动化程度高,操作简单;能够采集的数据量大,用户多,范围广;同时,能够综合考虑临近行人、车辆等多方面的干扰,所得结果更贴合实际情况,精度高。该方法不仅适用于人流密集的城区,同样适用于人流稀疏的郊区,适用范围广,能够作为当前公交客流采集的有效的补充方法。附图说明图1为本发明一实施例中乘客客流数据采集与分析方法的流程图;图2为该实施例中所采用的IEEE802.11通信协议数据包格式;图3为本发明实施例中用户往公交车行驶相反方向运行示例;图4为本发明实施例中用户往公交车行驶相同方向运行示例;图5a为本发明实施例中算法推导的站点上下客流;图5b为本发明实施例中算法推导的站间断面客流与实际断面客流对比图;图5c为本发明实施例中修正过后的断面客流与实际断面客流对比图;图6a-图6f为本发明实施例中修正前后的断面客流误差对比图(包含6个班次)。具体实施方式以下结合附图所示实施例对本发明作进一步的说明。本发明提出了一种乘客客流数据采集与分析方法。本实施例中,该方法充分利用公交车的WIFI覆盖,在设置有AP终端(AP即WirelessAccessPoint,表示访问接入点)的公交车上,利用乘客无线移动终端例如手机开启WIFI功能后,基于IEEE802.11的通信机制,对用户的WIFI设备(即前述无线移动终端,在本实施例中为乘客手机)进行无认证感知并采集,结合公交车GPS等信息,实现公交线路与站点的客流采集与分析。首先当用户出现在公交车AP终端覆盖范围内且手机WIFI功能开启时,公交车AP终端能够嗅探到用户手机;根据WIFI无认证感知技术获取用户的WIFI信息;利用算法推导(当前现有公交AP终端已经具有记录用户手机(终端)收发WIFI信息帧的帧头的功能,即前述嗅探功能)出用户的出现时刻与消失时刻,根据用户上下车的行为,建立用户上下车的数据模型;当用户满足上下车应有的行为特征时,认为该用户确实是乘车的乘客;根据得到的乘客上下站信息推算公交车客流,并建立客流修正模型,即用于修正客流的模型,并利用该客流修正模型对此次得到的乘客客流数据进行修正。本实施例中,该利用公交车WIFI数据与GPS数据融合的客流采集与分析方法(图1为其流程图),主要可分为以下四个阶段:(1)初步采集阶段:公交车AP终端利用IEEE802.11的通信机制,抓取周边用户手机通过WIFI方式传输的信息帧头并进行解析,记录用户MAC地址mac、信息传输时间datetime、信息帧类型type、信号强度rssi等信息,并进行帧类型的识别。根据IEEE802.11通信协议,数据结构如附图2,根据控制帧FrameControl字节来解析用户传输的信息类型。2个字节为:4bit(Subtype)+2bit(Type)+2bit(ProtocolVersion,默认为00)。在本发明中,主要解析的信息帧类型为0x40、0x48、0x88,得到用户出现时刻ts与消失时刻te。图2中,该数据包只用第一帧,即FrameControl控制帧,其余帧为加密报文;本发明仅获取信息帧中的控制帧,图2中从左到右分别为:控制帧、报文标识ID、地址1,地址2、地址3、序列控制、地址4、QoS(QualityofService服务质量)控制、HT(HighThroughput频宽控制)、信息报文、FCS(FrameCheckSequence)报文校验位。(2)公交车GPS数据与站点信息的匹配阶段:将公交车GPS数据与站点信息进行匹配。公交车在行驶时,GPS设备每隔一定时间间隔就会记录下公交车所处经纬度、速度以及对应的时刻。根据公交车距离站点的距离djw与实时速度v来作为判别公交车是否到站的条件,得到每趟公交车在各站点的停靠时刻tb,构建公交车在各站点停靠信息。上述公交车在各站点停靠信息包括公交车在各站点的停靠时刻、对应站点的名称、对应站点的经纬度等;在本实施例中,可将其制作为公交车到站时刻表。(3)筛除干扰阶段:结合用户的出现时刻ts与消失时刻te、公交车GPS数据和步骤(2)匹配得到的公交车在各站点的停靠信息,以设定的时间阈值Δt和距离阈值Δs为约束条件,判断用户是否为公交车乘客。剔除不是公交车乘客的用户信息,保留判断为公交车乘客的用户信息,并得到用户的上车站点和下车站点。(4)客流推导阶段:根据步骤(3)得到的各用户的上车站点与下车站点,计算得到各站点的上下车客流;更进一步,并按线路行驶方向累加得到站点间的断面客流。(5)数据修正:根据推算的客流与人工实际统计的客流进行比较,计算客流误差;分析不同条线路、不同时间段、不同公交站点群的误差情况,对误差分布进行假设检验,建立误差分段修正算法对推算得到的客流进行修正。上述步骤(2)中,公交车GPS数据与站点信息匹配的具体方法如下:GPS设备每一秒钟进行一次关于公交车的记录,记录包括当前日期与时刻(精确到秒)、公交车所处的经度、纬度、朝向、当前速度、海拔等。其中,当前对应的时刻、经度、纬度、当前速度是本发明所需的关键数据。GPS设备采集数据时在其内部实时存储,可在采集结束后将数据由常规数据文件格式(如CSV格式)导出,数据格式如表1所示。表1表1中,INDEX表示数据编号、TRACKNUMBER表示线路编号、UTCDATE与UTCTIME表示协调世界时间中的日期与时间、LOCALDATE与LOCALTIME表示北京时区日期与时间、LATITUDE表示纬度、N/S表示南/北半球、LONGITUDE表示经度、E/W表示东/西半球、ALTITUDE表示海拔,SPEED表示速度。将公交车GPS数据与公交车站点信息进行匹配时,首先,在线查询目标线路每一站的真实经纬度;然后,计算每一条GPS数据记录的经纬度坐标与每个站点的经纬度坐标对应地点之间的距离djw(单位为KM);计算公式如下:C=sin(LatA)*sin(LatB)+cos(LatA)*cos(LatB)*cos(MLonA-MLonB);djw=R*Arccos(C)*π/180;式中第一点A的经纬度为(LonA,LatA),第二点B的经纬度为(LonB,LatB),R代表地球半径。A和B分别为站点以及GPS记录点。MLon是对经度进行处理后得到的新经度,具体为对东经取正,对西经取负。接着筛选出每一个站点半径阈值dr范围内的所有GPS数据记录(本实施例中,dr取30m,这是因为:对于港湾式停靠站而言,站台长度至少要有两个车位长(大约30米));再从中筛选出速度最小且该最小的速度小于速度阈值(本实施例中,该速度阈值为10km/h)的记录点作为车辆在该站点的停车点,停靠时刻为tb。之后将站点名称、站点经纬度坐标、停车点处的经纬度坐标、站点和停车点间的距离、最小速度构成一张新的表作为匹配结果,如表2所示。表2中,longitude表示匹配时刻的车辆经度、latitude表示匹配时刻的车辆纬度、stop表示匹配的停靠站点名、s_longitude表示站点经度、s_latitude表示站点纬度、date_time表示匹配时刻、speed表示车辆瞬时速度、dis表示车辆距离站点距离。表2longitudelatitudestops_longitudes_latitudedate_timespeeddis121.21887231.289391老宅121.218840931.289257812016/5/1608:17:030.0011160.015102183121.21758331.304266马南121.217562431.304497932016/5/1608:20:2920.2977350.02586357121.21771231.310661东赵巷121.217612431.310544932016/5/1608:22:080.1290560.016003578121.21221231.321674方泰121.212161931.321481362016/5/1608:26:560.0415430.02194342121.20227131.333355三里桥121.202005731.333443742016/5/1608:31:3957.9951970.027063072121.19569431.340294沙港桥121.195883731.340101742016/5/1608:34:2020.8879010.027955843121.20034831.345905桃园121.200514331.34599932016/5/1608:36:240.2120230.01895952121.20941231.353659六里桥121.209544731.353748572016/5/1608:38:1430.7931180.016064005121.22411331.366531现龙121.223939631.366333272016/5/1608:41:5317.7638530.027468328121.22744831.368883嘉安公路胜辛路121.227170131.368827232016/5/1608:43:1414.7817190.027098682121.23449731.37418塔城路沪宜公路121.23444431.374431752016/5/1608:45:475.6982740.028442291121.24208831.380753塔城路梅园路121.24218331.380655752016/5/1608:48:260.1461630.014079269121.24164631.386711城中路清河路121.241800831.386535342016/5/1608:53:580.044460.024440646121.2346531.391605嘉定中心医院121.234342731.391620382016/5/1609:01:154.5831050.029218506121.2321731.393064招呼站19121.231959431.393129332016/5/1609:02:040.1959590.021265096121.23236131.394772公交嘉定北站121.232081431.394758332016/5/1609:03:1329.8126950.02657817上述步骤(3)中,用户公交乘车行为判别阈值界定的具体方法如下:时间阈值Δt的大小与公交车各站之间行驶时间密切相关。根据上一部公交车GPS的匹配结果,计算在该条线路各站点之间公交车的行驶时间集合TI。再提取该时间集合的85%分位数tI85,把大于tI85的行驶时间剔除,得到剩余的行驶时间集合为TI’,并求得TI’的的均值根据乘客出行习惯以及大量跟车试验的观察,绝大多数乘客会乘坐两站及两站以上,极少部分乘客只乘坐一站。因此Δt根据下式计算得到:距离阈值Δs的作用在于筛选掉一些通过时间阈值Δt无法排除的长时间跟车干扰,即公交车周围长时间跟车的车辆,如果这些长时间跟车的车辆中手机开启WIFI功能,会对采集产生干扰。若手机用户确实存在乘车行为,那么用户WIFI数据出现与消失时,该公交车的位置应处在距离站点的一定范围Δs内。因为公交车AP终端存在一个约100m的嗅探范围,WIFI数据集中用户手机最后一条信息帧的发送或接收时间并不能完全等同于该用户的下车时间,上车时同理。假如一乘客下车后往与公交相反的方向步行,示意图如图3。图3表示的是一种最极端情况。假设乘客行走速度为vp1,本实施例中为1.5m/s,公交车辆行驶速度为vb,本实施例中为5m/s。则经过一段时间(本实施例中为15s)后,公交车与该乘客相距100米,乘客走出公交车AP终端的嗅探范围。此刻公交车AP终端获取到该乘客所携移动设备的最后一条广播帧,乘客离站台dp1米,本实施例中为22.5m,公交车离站台db1米,本实施例中为77.5m。假如一乘客下车后往与公交相同的方向步行,示意图如图4。图4表示的也是一种最极端情况。假设乘客行走速度为vp,本实施例中为1.5m/s,公交车辆行驶速度为vb,本实施例中为5m/s。则经过一段时间(本实施例中为29s)后,公交车与该乘客相距100米,乘客走出公交车AP终端的嗅探范围。此刻公交车AP终端获取到该乘客所携移动设备的最后一条广播帧,此时乘客离站台dp2米,本实施例中为43m,公交车离站台db2米,本实施例中为143m。那么应有:dp1+db1=100;db2-dp2=100;那么Δs的推算方法如下:Δs=max(db1,db2);其中,100指的是WIFI嗅探范围为100m;db1为若乘客下车后往与公交车相反的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站台的距离;db2为若乘客下车后往与公交车相同的方向行走,公交车AP终端最后一次接收到乘客的数据时,公交车距离站台的距离。显然,db2大于db1,因此Δs=db2。时间阈值Δt与距离阈值Δs的作用如下:(1)将mac地址随机跳变的用户从数据源中筛除。一般功能上能够实现跳变的用户,在其手机设备锁定或唤醒的时候,会产生跳变,在设备锁定两分钟之后,也会跳变。其跳变间隔时间多在两分钟及以下。(2)将车外静止行人干扰设备和车外运动行人的干扰设备从数据源中剔除。无论车外行人是静止还是运动,它在公交车AP终端扫描范围内的持续被扫描时间都小于一分钟。(3)将车外跟车的其他车辆内的干扰设备从数据源中剔除。对于跟车时间较短的干扰车辆,通过设定时间阈值Δt可直接剔除;而对于跟车时间较长的干扰车辆,相关数据可结合设定距离阈值Δs剔除。上述步骤(3)中,进行筛选的具体方法如下:首先获取公交车AP终端所探测的用户携带设备的mac地址、信号强度、扫描时间等,即公交车AP终端捕获的源数据;其次获取用户mac出现时刻ts和消失时刻te,相减计算持续时间Tse。接着,判断持续时间Tse是否大于或等于时间阈值Δt。如果小于,则认定该用户不是该趟公交车的乘客,直接删除其数据。如果大于或等于,则根据该用户mac的出现时刻和消失时刻,在公交车GPS数据中找到在出现时刻ts公交车的经纬度坐标和在消失时刻te公交车的经纬度坐标;再根据步骤(2)得到的公交车站点停靠信息,即前文提到的公交站点停靠时刻表,匹配最近的同方向站点为设定的上车站点和设定的下车站点。最后,若在出现时刻ts公交车的位置与设定的上车站点的距离d1与在消失时刻te公交车的位置与设定的下车站点的距离d2均小于距离阈值Δs,则表示上下车站点匹配有效,即该用户为该趟公交车的乘客,设定的上车站点为其实际的上车站点,设定的下车站点为其实际的下车站点。否则,则认定该用户不是该趟公交车的乘客,该用户的数据为干扰数据,将其删除。上述步骤(4)中,进行客流推导的具体方法如下:基于上述得到的各用户的上车站点与下车站点,累计得到各站点的上下车客流,更进一步地,累计得到任意两个站点之间的断面客流。例如,第一站的上车人数为A1,下车人数为B1,则第一站与第二站间的断面客流为A1-B1。同理,若第n-1站到第n站的断面客流为Dn-1,第n站上车人数为An,下车人数为Bn,则可推算第n站到第n+1站的推导断面客流为Dn=Dn-1+An-Bn。上述步骤(5)中,进行客流修正的具体方法如下:基于已有线路及班次的原始数据,利用各线路推导的断面客流与真实断面客流(通过人工调研得到真实断面客流)之差,探求客流误差的统计规律,从而对探测断面客流进行分阶段修正。上述人工调研的总采样量中包含的班次越多,修正结果越准确。假设客流误差整体服从正态分布,对样本进行参数估计,通过MATLAB软件拟合得到客流误差符合均值为μ和方差为α的正态分布。再通过正态假设检验该正态分布的合理性。检验方法有两种:一种是利用T检验进行显著性水平为0.05的假设检验。一种是将需检验的数据分为大致等量的m组,通过正态概率pi和理论频数npi算得χ2值,从而验证服从正态分布的均值μ的合理性。具体公式如下:pi=φ(Xmax-μα)]]>npi=Xmax*piχ2=Σi=0m(ni-npi)2npi]]>其中:n表示所用于检验的样本量(即样本的个数);m表示将n个样本分成组的组数;Xmax表示每组的上限;μ表示利用样本计算的均值;α表示利用样本计算的标准差;ni表示每组中的样本数;χ2表示计算的卡方值。如果算得的χ2趋向于自由度为l-k-1(其中,l表示检验的分组数量,即上述的m值,k表示有几个需要估计的未知参数,此处未μ与α即2个)的χ2分布时,假设检验成立,样本数据符合正态分布。如果χ2大于自由度为l-k-1的χ2分布时,假设检验不成立。在针对误差分布进行假设检验时,需要对推导的客流进行分段,不同线路区段、不同时段、不同的推导客流对应的误差会有不同分布,对于公交线路首末段,一般客流较小,可将一定范围内的几个站点进行合并,以减小推导客流存在误差的可能变化范围,利于后期修正。本实施例中,选取一条上海市郊区线路作为本发明的检验对象,测试时间为工作日上午早高峰至午间,共采集了12趟公交WIFI数据。共采集到约18万条WIFI数据记录,平均每趟公交为1.5万条。对公交车GPS数据与公交站点信息进行匹配,对于dr的确定,因为公交大多采取港湾式停靠站,站台长度至少要有两个车位长(大约30米),取±15米。再加上车站所查询到的经纬度坐标与真实坐标间有15米左右的误差,所以,在此选择dr=30m作为阈值,即离某一站真实经纬度坐标30米之内的速度最小且该最小速度小于速度阈值的点为公交停靠点,匹配结果如表2所示。之后根据计算得到站点间时长的85分位数tI85为4分47秒,小于等于85分位数的剩余时间集合的均值为2分23秒,因此时间阈值Δt为4分46秒;距离阈值Δs设为200米(由于实际测试中,WIFI嗅探达不到高频率采样(小于等于10s),所以导致距离计算会产生误差,实际实施时距离阈值需要放大,故设为200m)。通过时间阈值和距离阈值对WIFI数据进行筛选,得到的公交站点OD出行表如表3所示。推算得到的公交线路站点上下客流与断面客流如图5a和图5b所示。由于目前乘客的手机WIFI功能不会高频率向周边广播信息(一般时间大于30s),所以通过该时间戳对用户的出现与消失时间进行定位有一定误差,会对最终的匹配结果产生影响,且公交上不同客流时的误差比例相差较大,故通过实地采集的数据与推导断面客流结果的差值对其进行分段修正,分别为[0,10]、(10,20]、(20,30]以及(30,∞),修正结果如图5c示。(本实施例中假设检验时,利用了6个班次的断面客流推导结果与人工调研结果,对上述4个分段分别进行客流误差分布的假设检验,可求得各分段客流误差正态分布函数,并将该正态分布的期望值作为各分段断面客流数据的修正值,采取推断值加上修正值的操作完成修正。)修正后的误差与修正前的误差对比如图6a-图6f所示(图6a-图6f中,每个图显示一个班次的修正情况),由图6a-图6f可知修正后的线路中部断面客流数据误差明显减小,准确度达70~80%。图6a-图6f中,横坐标表示站点序号,纵坐标表示客流。表3综上所述,本发明提出了一种基于公交车内无线局域网数据传输和公交车GPS数据融合的公交车乘客客流数据采集与分析方法,该方法自动化程度高,操作简单;能够采集的数据量大,用户多,范围广;同时,能够综合考虑临近行人、车辆等多方面的干扰,所得结果更贴合实际情况,精度高。该方法不仅适用于人流密集的城区,同样适用于人流稀疏的郊区,适用范围广,能够作为当前公交客流采集的有效的补充方法。上述的对实施例的描述是为便于该
技术领域
的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对这些实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于这里的实施例,本领域技术人员根据本发明的揭示,不脱离本发明范畴所做出的改进和修改都应该在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1