一种基于IC卡数据测定地铁站点公共自行车接驳半径的方法与流程

文档序号:13472508阅读:164来源:国知局
一种基于IC卡数据测定地铁站点公共自行车接驳半径的方法与流程
本发明属于公共自行车ic卡和地铁ic卡数据挖掘领域,具体涉及一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法。
背景技术
:在机动化交通发展面临一系列问题和低碳交通发展需求的大背景下,公共交通系统可以缓解交通供需矛盾、提高交通运行效率。为了减轻道路交通压力,许多城市采取了优先发展公共交通的政策,并提出了一系列的引导措施。轨道交通作为公共交通的一种,能够显著提高城市交通出行运输能力和运输效率。诸多城市轨道交通的运营经验表明,大力发展轨道交通不仅可以有效的缓解交通拥堵难题,其强大的扩散效应和人口内聚效应也为站点周边地段带来了巨大商机和稳定客流。但是,轨道交通不能解决出行的“最后一公里”问题,轨道交通的吸引力也会由于覆盖率不够高而降低。因此,为了引导公共交通出行,缓解交通问题,需要有效的末端交通方式与轨道交通相配合。公共自行车换乘轨道交通一方面借助自行车“门到门”的特性扩大了个体对轨道站点或目的地的选择范围,同时利用轨道的优势规避了地面交通的干扰,极大地提高了个体的出行时间可靠性。因此,整合轨道交通与自行车网络,鼓励并倡导发展自行车接驳公共交通出行模式,让更多的居民采用公共交通方式出行是缓解城市交通拥堵、改善城市环境的关键所在,公共自行车换乘轨道交通的研究具有重要意义。技术实现要素:发明目的:本发明提出一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法。该方法具有较强的实用性与推广价值,为公共自行车换乘轨道交通方面的研究奠定了坚实的基础。技术方案:一种基于ic卡数据测定地铁站点公共自行车接驳半径的方法,包括以下步骤:(1)获取公共自行车ic卡与地铁ic卡原始数据,并从原始数据中提取有效数据信息;(2)对公共自行车ic卡和地铁ic卡的有效数据进行预处理,筛除无用数据;(3)基于不同的换乘行为模式,将预处理之后的ic卡数据分别融合到不同的数据库中,并对数据按卡号进行排序,使得一张ic卡对应着多条刷卡记录,这些刷卡记录以时间先后顺序依次排列;(4)对融合之后的数据进行过滤,筛选出可能的换乘数据对;(5)针对每张卡的可能换乘数据对,计算还车进站时间间隔和出站借车时间间隔以及地铁站点与公共自行车站点之间距离,并确定最大换乘时间间隔与最大换乘距离,识别出地铁换乘公共自行车的ic卡数据;(6)基于识别出的地铁换乘公共自行车的ic卡数据,统计地铁站点所有识别出的换乘数据,计算该地铁站点应对的换乘数据中公共自行车的骑行距离,将骑行距离升序排列;(7)计算每个骑行距离对应的累积频率,绘制“公共自行车骑行距离-累计频率”散点曲线,并用最小二乘法拟合该曲线,运用求拟合函数反函数的方法测定地铁站点的公共自行车接驳半径。进一步的,本发明方法中,步骤(1)中的公共自行车ic卡有效信息包括:刷卡日期、ic卡卡号、借车时间、还车时间、借车站点编号、还车站点编号、借车站点经度、借车站点纬度、还车站点经度、还车站点纬度;所述地铁ic卡有效信息包括:刷卡日期、ic卡卡号、出站时间、进站时间、进站站点编号、出站站点编号、进站站点经度、进站站点纬度、出站站点经度、出站站点纬度。进一步的,本发明方法中,步骤(2)中对公共自行车ic卡和地铁ic卡有效数据进行预处理包括:2.1)筛除无效刷卡记录,包括有残缺项的刷卡记录、有逻辑性错误的刷卡记录、用车时间少于2分钟的公共自行车刷卡记录、进出站时间间隔少于5分钟的地铁刷卡记录;2.2)删除所有的公共自行车专卡的刷卡数据;2.3)删除仅存在于地铁ic卡数据中以及仅存在于公共自行车ic卡数据中的卡号对应的刷卡数据,保留同一天内同一卡号在地铁ic卡数据中和公共自行车ic卡数据中都出现的刷卡数据。进一步的,本发明方法中,步骤(3)中换乘行为模式包括出站借车和还车进站两种地铁与公共自行车换乘行为模式,其中,出站借车换乘行为指的是乘客出地铁站后,在一定的换乘时间和距离内,找到公共自行车站点租借公共自行车;还车进站换乘行为指的是乘客将公共自行车还至公共自行车站点,在一定的换乘时间和距离内,找到地铁站点进站乘坐地铁。步骤(3)中,对ic卡数据进行融合和排序具体包括:针对出站借车行为模式,选取同一天内的地铁ic卡数据出站信息与公共自行车ic卡数据借车信息,将选取数据融合至出站借车数据库,并对数据进行两轮排序:先按ic卡卡号进行升序排列,然后针对同一卡号的多条记录按照出站时间和借车时间的先后进行升序排序;针对还车进站行为模式,选取同一天内的公共自行车ic卡数据还车信息与地铁ic卡数据进站信息,将选取数据融合至还车进站数据库,并对数据进行两轮排序:先按ic卡卡号进行升序排列,然后针对同一卡号的多条记录按照还车时间和进站时间的先后进行升序排列。进一步的,本发明方法中,所述出站信息包括刷卡日期、卡号、出站时间、出站站点编号、出站站点经度、出站站点纬度;所述借车信息包括刷卡日期、卡号、借车时间、借车站点编号、借车站点经度、借车站点纬度;所述还车信息包括刷卡日期、卡号、还车时间、还车站点编号、还车站点经度、还车站点纬度;所述进站信息包括刷卡日期、卡号、进站时间、进站站点编号、进站站点经度、进站站点纬度。进一步的,本发明方法中,步骤(4)中,可能的换乘数据对指的是:过滤之后的“还车进站”数据库中的数据结构为:同一张卡的刷卡记录的排列顺序为公共自行车还车数据-地铁进站数据-公共自行车还车数据-地铁进站数据这样的形式,每相邻的一对公共自行车还车数据-地铁进站数据称为还车进站数据对;过滤之后的“出站借车”数据库中的数据结构为:同一张卡的刷卡记录的排列顺序为地铁出站数据-公共自行车借车数据-地铁出站数据-公共自行车借车数据这样的形式,每相邻的一对地铁出站数据-公共自行车借车数据称为出站借车数据对。进一步的,本发明方法中,步骤(5)中,使用以下公式计算地铁站点与公共自行车站点之间的距离:其中,d1为地铁站点与公共自行车站点之间的距离,r为地球的半径,φ1、φ2分别为地铁站点和公共自行车站点的纬度,λ1、λ2分别为地铁站点和公共自行车站点的经度。进一步的,本发明方法中,步骤(5)中,确定的最大换乘时间间隔为10分钟,最大换乘距离为300米。进一步的,本发明方法中,步骤(6)中,使用以下公式计算地铁站点应对的换乘数据中公共自行车的骑行距离:其中,d2为公共自行车借车站点与公共自行车还车站点之间的距离,r为地球的半径,φ1′、φ2′分别为公共自行车借车站点与公共自行车还车站点的纬度,λ1′、λ2′分别为公共自行车借车站点与公共自行车还车站点的经度。进一步的,本发明方法中,步骤(7)中,将取累积频率85百分位数对应的拟合函数反函数的公共自行车骑行距离,作为地铁站点的公共自行车接驳半径。有益效果:本发明相对于现有技术,具有以下优点:目前业内针对地铁站点公共自行车接驳半径方面的研究,研究手段比较单一,主要通过问卷调查来获取公共自行车的骑行距离等信息,不仅在调查时间跨度上有局限性,而且存在调查问卷精度无法保证、调查成本高、得到的调查样本量少等缺陷。本发明基于ic卡数据,将地铁换乘公共自行车行为具体分为“出站借车”和“还车进站”两种换乘模式,首次运用公共自行车与地铁ic卡数据中的卡号对应关系以及对应卡号下刷卡记录的时空关系进行换乘行为识别,得到换乘的ic卡数据,其样本量大,准确度高,无需大量的人力物力进行问卷调查。基于换乘ic卡数据,本发明可以计算出地铁站点的公共自行车接驳半径,为公共自行车站点的选址、配置、调度以及共享单车在地铁站点附近的投放地点选址等研究奠定了坚实的基础。附图说明图1是本发明方法的流程图。图2为“公共自行车骑行距离-累计频率”散点图。图3为“公共自行车骑行距离-累计频率”曲线拟合结果图。具体实施方式下面结合附图对本发明的技术方案作进一步说明。在本发明的实施例中,采用的ic卡数据由南京市公共自行车公司和南京市地铁公司提供。本实施例中,以2016年3月9日的地铁ic卡数据与公共自行车ic卡数据为例,对本发明的方法作进一步说明。参照图1,首先,获取公共自行车ic卡和地铁ic卡原始数据,并分别从两类原始数据中提取有效信息。原始数据中,一条完整的公共自行车刷卡记录包含15个部分:刷卡日期、卡号、借车站点名称、借车站点编号、借车站点经度、借车站点纬度、借车时间、借车桩位号、公共自行车车辆编号、还车站点名称、还车站点编号、还车站点经度、还车站点纬度、还车时间、还车桩位号。其中,借、还车站点编号与借、还车站点名称一一对应;根据本发明的需要,提取ic卡有效数据信息,其结构如表1所示:表1公共自行车ic卡有效信息结构一条完整的地铁刷卡记录包含13个部分:刷卡日期、卡号、卡种、进站站点名称、进站站点编号、进站站点经度、进站站点纬度、进站时间、出站站点名称、出站站点编号、出站站点经度、出站站点纬度、出站时间。根据本发明的需要,提取ic卡有效数据信息,其结构如表2所示:表2地铁ic卡有效信息结构然后,对公共自行车ic卡与地铁ic卡有效数据进行预处理,筛除无用数据,可以排除干扰,提高数据挖掘效率及识别准确度。预处理包括:1)筛除无效刷卡记录,包括:筛除有残缺项的刷卡记录,例如缺少刷卡时间的记录;筛除有逻辑性错误的刷卡记录,例如还车时间早于借车时间的记录或者出站时间早于进站时间的记录;筛除用车时间少于2分钟的公共自行车刷卡记录,认为这样的记录并没有产生骑行公共自行车行为;筛除进出站时间间隔少于5分钟(地铁站点间的最短到站时间间隔为3分钟,加上进站出站各1分钟)的地铁刷卡记录,认为这样的记录并没有产生乘坐地铁行为。2)由于目前刷卡使用公共自行车时,刷卡系统支持一卡通卡和非一卡通卡(即公共自行车专卡)两种卡,其中公共自行车一卡通卡指的是可以使用该卡进出地铁站也可以使用该卡租借公共自行车的ic卡;公共自行车专卡指的是只可用来租借公共自行车的ic卡。公共一卡通与非一卡通可由ic卡卡号进行识别,其中以数字9开头的公共自行车ic卡为一卡通,以字母n开头的为公共自行车ic卡为专卡。本发明只针对使用一卡通ic卡进行公共自行车和地铁换乘的行为进行识别,故删去所有的公共自行车专卡的刷卡数据。下文所称公共自行车ic卡和公交ic卡指的都是一卡通ic卡,但是为了区分数据来源,描述时仍然称为公共自行车ic卡和公交ic卡。3)因为本发明针对换乘行为进行识别,因此删除只在地铁ic卡数据库中或只在公共自行车ic卡数据库中出现的卡号对应的刷卡数据,保留同一天内同一卡号在地铁ic卡数据库中和公共自行车ic卡数据库中都出现的刷卡数据。接下来,基于不同的换乘行为模式,将预处理之后的ic卡数据融合到不同的数据库中。公共自行车与地铁换乘方式分两种,一种方式是“出站借车”:乘客出地铁站后,在一定的换乘时间和距离内,找到公共自行车站点租借公共自行车;另一种方式是“还车进站”:乘客将公共自行车还至公共自行车站点,在一定的换乘时间和距离内,找到地铁站点进站乘坐地铁。本发明通过对以上刷卡数据的分析和整合,识别出相应的换乘行为。选取同一天内的地铁ic卡数据出站信息(包括刷卡日期、卡号、出站时间、出站站点编号、出站站点经度、出站站点纬度)与公共自行车ic卡数据借车信息(包括刷卡日期、卡号、借车时间、借车站点编号、借车站点经度、借车站点纬度),将两类数据融合至出站借车数据库,并对数据进行两轮排序:先按ic卡卡号进行升序排列,然后针对同一卡号的多条记录按照出站时间和借车时间的先后进行升序排序,得到融合后的出站借车数据库,其结构如表3所示:表3融合之后的出站借车数据库结构注:“-”表示该单元格对应项目不存在数据。表3中,刷卡类型为“地铁”,表示该条数据来自地铁ic卡刷卡数据,刷卡类型为“公共自行车”表示该条数据来自公共自行车ic卡刷卡数据。当刷卡类型为地铁时,对应的站点经度和站点纬度分别表示地铁出站站点的经度和纬度;当刷卡类型为公共自行车时,对应的站点经度和站点纬度分别表示借车站点的经度和纬度。以下针对出站借车的数据结构表中相同字段含义相同,不再赘述。类似地,选取同一天内的公共自行车ic卡数据还车信息(包括刷卡日期、卡号、还车时间、还车站点编号、还车站点经度、还车站点纬度)与地铁ic卡数据进站信息(包括刷卡日期、卡号、进站时间、进站站点编号、进站站点经度、进站站点纬度),将两类数据融合至还车进站数据库,并进行两轮排序:先按ic卡卡号进行升序排列,然后针对同一卡号的多条记录按照还车时间和进站时间的先后进行升序排列,得到融合后的还车进站数据库,其结构如表4所示:表4融合之后的还车进站数据库结构注:“-”表示该单元格对应项目不存在数据。表4中,刷卡类型的含义同表3。当刷卡类型为地铁时,对应的站点经度和站点纬度分别表示地铁进站站点的经度和纬度;当刷卡类型为公共自行车时,对应的站点经度和站点纬度分别表示还车站点的经度和纬度。以下针对还车进站的数据结构表中相同字段含义相同,不再赘述。经过以上处理并且从表3和表4可以看出,一个卡号对应着多条刷卡记录,这些刷卡记录以时间先后顺序依次排列。下面对数据进行过滤,筛选出可能的换乘数据对,即同一张卡的刷卡类型为先地铁后公共自行车或者先公共自行车后地铁,如针对出站借车行为,同一张卡的刷卡记录为“地铁出站数据-公共自行车借车数据-地铁出站数据-公共自行车借车数据”顺序排列的形式;针对还车进站行为,同一张卡的刷卡记录为“公共自行车还车数据-地铁进站数据-公共自行车还车数据-地铁进站数据”顺序排列的形式。具体地,针对融合之后的出站借车数据库的数据,首先取前两条记录,判断其组合形式是否为“地铁出站数据-公共自行车借车数据”,如果是,则保留两条记录,继续下一对记录的判断;如果不是,有三种情况,分别是“地铁出站数据-地铁出站数据”组合形式、“公共自行车借车数据-地铁出站数据”组合形式以及“公共自行车借车数据-公共自行车借车数据”组合形式,针对前两种形式,删除第一条记录,继续取新的前两条记录进行判断,对于第三种形式,删除两条记录,继续至下一对记录进行判断。直到针对一个卡号的所有刷卡记录都已经过上述判断。如果刷卡记录是奇数次,最后一次判断时只有一条记录,则删除该条记录。最终得到“地铁出站数据-公共自行车借车数据-地铁出站数据-公共自行车借车数据”的形式,其结构如表5所示:表5过滤之后的出站借车数据库结构注:“-”表示该单元格对应项目不存在数据。类似地,将融合之后的还车进站数据库的数据过滤成“公共自行车借车数据-地铁进站数据-公共自行车借车数据-地铁进站数据”的形式,其结构如表6所示:表6过滤之后的还车进站数据库结构注:“-”表示该单元格对应项目不存在数据。根据地铁站点与公共自行车站点的经纬度信息,计算地铁站点与公共自行车站点之间的距离;用地铁出站时间减去公共自行车借车时间得到站借车时间间隔;用公共自行车还车时间减去地铁进站时间得到还车进站时间间隔。将计算得到的地铁站点与公共自行车站点之间的距离以及出站借车时间间隔添加到表5,形成新的出站借车数据结构,如表7所示:表7计算出t出站借车与站点之间距离之后的出站借车数据库结构注:“-”表示该单元格对应项目不存在数据。将计算得到的地铁站点与公共自行车站点之间的距离以及还车进站时间间隔添加到表6,形成新的还车进站数据结构,如表8所示:表8计算出t还车进站与站点之间距离之后的还车进站数据库结构注:“-”表示该单元格对应项目不存在数据。针对每张卡的可能换乘数据对计算还车进站时间间隔和出站借车时间间隔以及站点之间距离,并统计两种换乘模式下的时间间隔分布与站点距离分布。根据时间间隔累计分布得出:91.64%的出站借车时间间隔在10分钟之内,90.77%的出站站点与借车站点之间距离在300米之内;96.40%的还车进站时间间隔在10分钟之内,93.79%的还车站点与进站站点之间距离在300米之内。因此,本发明中的最大换乘时间间隔取10分钟,最大换乘距离取300米。若出站借车换乘行为或还车进站换乘行为同时满足本发明提出的最大换乘时间间隔10分钟与最大换乘距离300米,则该换乘行为将被成功识别,以2016年3月9日的地铁ic卡数据库与公共自行车ic卡数据库为例,共识别出出站借车换乘行为577个,还车进站换乘行为560个。基于识别出的换乘数据,本实施例以南京地铁2号线兴隆大街地铁站为例,计算该站点公共自行车接驳半径。统计兴隆大街地铁站一周的公共自行车ic卡与地铁ic卡的匹配数据(2016年3月9日至2016年3月15日),该站点的地铁换乘公共自行车行为共59次,共涉及36个公共自行车站点。表9展示了其中10条示例数据,其中兴隆大街地铁站站点编号为20,位于该地铁站300米之内的有两个公共自行车站,站点编号分别为12002和12003,其他公共自行车站点编号为12002和12003另一端的公共自行车站点的编号,公共自行车骑行距离由借还车站点的经纬度得出。表9兴隆大街站公共自行车借还车数据示例具体计算该站点的公共自行车接驳半径的步骤如下:1)将兴隆大街站公共自行车借还车59条数据按公共自行车骑行距离升序排列,去除3条骑行距离为0的数据,合并骑行距离相等的数据,随后计算每个骑行距离下的累积频率,统计结果如表10所示。表10累积频率表骑行距离/m224.22404.41441.17556.39591.52601.50691.84累积频率3.57%7.14%10.71%14.29%17.86%21.43%25.00%骑行距离/m693.36694.51703.83759.44785.47836.19838.39累积频率28.57%32.14%35.71%39.29%42.86%46.43%50.00%骑行距离/m881.011007.441050.391101.561113.301180.621236.01累积频率53.57%57.14%60.71%64.29%67.86%71.43%75.00%骑行距离/m1244.361548.431556.791669.641982.261990.422346.26累积频率78.57%82.14%85.71%89.29%92.86%96.43%100.00%2)绘制“公共自行车骑行距离-累计频率”散点曲线如图2所示,横坐标为公共自行车骑行距离,纵坐标为累积频率。3)采用最小二乘法拟合该曲线,曲线的拟合结果如图3所示。拟合曲线表达式为:y=-7×10-11x3+10-8x2+0.0009x-0.2693。其中,r2=0.9753,拟合可靠性较高,拟合结果较好。4)取累积频率85百分位数对应的公共自行车骑行距离,即当y=0.85时,x=1463.82m。兴隆大街站的公共自行车的接驳半径约为1464m。本发明提出方法能够准确有效的识别地铁与公共自行车的换乘行为,并且能够基于识别出的换乘数据得出地铁站点的自行车接驳半径,方法具有较强的推广价值,为公共自行车接驳轨道交通的一系列研究奠定了坚实的基础。尽管本发明的实施例已公开如上,但还应该解释的是,以上实施例仅用于说明并非局限于本发明所描述的技术方案,本领域的普通技术人员应当理解,仍然可以对本发明提及的相关规则或方法进行修改和填充;而一切不脱离本发明精神的技术方案及其改进,均应涵盖在本发明的权利要求保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1