一种基于大数据的交通出行特征数据提取方法_2

文档序号:9751963阅读:来源:国知局
的判断,结合上传时间可得到出行者一天内的出行链,通过对所有手机用 户一天内的所有出行进行统计分析,可得出以持有手机的出行者为样本的两个小区间的日 出行数量,即出行0D,以及各小区出行总产生量及吸引量。具体做法如下:
[0028]步骤3.1,将每个正常用户的手机位置数据按照时间排序,得到每个正常用户一天 的交通出行链;
[0029] 步骤3.2,针对每条交通出行链,根据出行链中每相邻的两个手机位置数据时间差 判断停留点:对每个正常用户,按照交通出行链顺序,依次处理每相邻的两个手机位置数据 时间差,当时间差大于1小时,则判断该位置为停留点;
[0030] 步骤3.3,按信号类型判断停留点:手机待机状态下同一基站位置上每隔1-2小时 上报一次信息,此为周期位置更新,事件类型为周期位置更新,因本发明中将停留时间大于 1小时的点视为用户停留点。因此对按时间顺序连续仅有一次通信的位置点,若其上传事件 类型为1,则该点也判断为用户停留点;
[0031] 步骤3.4,交通出行链中识别出的停留点后剩余的其他点就是经过点。
[0032] 步骤4:交通小区间起讫点出行量及小区产生吸引量的计算
[0033] 步骤4.1,将计算得到的所有停留点按照时间顺序排序,两个连续停留点所属两小 区间起讫点出行量计1次。前一小区出行产生量计1次,后一小区出行吸引量计1次,最后将 所有用户小区间起讫点出行数量、小区出行产生量、小区出行吸引量进行总计,得出以持有 手机的出行者为样本的小区间起讫点出行量及各小区总出行数据。
[0034] 步骤4.2,采用所有交通小区的交通小区人口数、手机保有量和手机市场占有率计 算扩样比例的基础上,借助GPS数据、基于视频、线圈断面交通流数据在内的现有的城市交 通运输静态、动态数据扩样比例的校准优化,获取准确的交通小区间起讫点出行量及小区 产生吸引量。扩样比例计算方法:交通小区人口数/(手机保有量/手机市场占有率)。
[0035]步骤5,居住地与工作地判别
[0036]步骤5.1,基于匹配后的所有交通出行链,提取某用户连续一个月的数据,统计介 于居住地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用户的居 住地;
[0037] 步骤5.2,基于匹配后的所有交通出行链,提取某用户连续一个月工作日的数据, 统计介于工作地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用 户的工作地;
[0038] 步骤5.3,结合人们实际生活的惯常行为,即夜间休息时间,关机行为较常见;白天 工作时间,通话行为应该较多。因此,在判断居住地时,将手机信令中关机信令的条数和其 他类型的信令条数进行加权,同一地点夜间数据一周内出现的比例大于50%的,为居住地; 判断工作地时,则将通话信令的条数和其他类型的信令条数进行加权,同一地点白天数据 一周内出现的比例大于50%的,为工作地。从而提高系统的工作地和居住地识别精确度。
[0039] 加权计算公式为
[0040] 其中,b表示在一周内出现在某交通小区的比例,A表示某手机信令事件类型的权 重,N表示手机信令数据的事件类型。
【附图说明】
[0041] 图1为本发明居民出行特征数据的获取方法流程图 [0042]图2为本发明交通小区划分流程图
[0043]图3为本发明手机数据预处理流程图
[0044] 图4为本发明交通出行链识别流程图
[0045] 图5为本发明交通小区间出行量(0D矩阵数据)计算流程图
[0046] 图6为本发明居住地、工作地判定流程图 具体实施方案
[0047] 以下结合附图对本发明的特征及其它相关特征作进一步详细说明。
[0048] 步骤1,交通小区划分
[0049] 本发明采取的交通小区划分方法是结合行政区划以及基站地理属性等进行交通 小区划分。具体做法如下:
[0050] 步骤1.1,以基站经炜度信息与基础交通地理信息进行位置匹配,将基站匹配到道 路网上;
[0051] 步骤1.2,从数据库中读入以行政区划分为基础的交通小区的多边形地理信息; [0052]步骤1.3,根据各交通小区和基站的地理位置关系,即平面上多边形与点的包含关 系,将各个基站匹配到其所属的各交通小区内,建立基站和交通小区的隶属关系;
[0053]步骤1.4,对于基站处于交通小区边缘的情况,采用面积折算法确定基站和交通小 区的隶属关系,即确定边缘基站在各个交通小区内的面积与其覆盖面积的比例,将边缘基 站占比最大的小区扩大,把边缘基站全部包含入该小区。
[0054]步骤2,数据采集、处理、融合
[0055]本发明采用的大数据包括手机信令数据(手机信令数据信息包括用户编号、事件 类型、基站编号、基站经炜度坐标、上传时间)、GPS数据、基于视频、线圈断面流量等数据,具 体采集、处理和融合的方法如下:
[0056]步骤2.1,收集数据库手机用户的事件类型信息数据,手机用户的事件信息按用户 分类筛选;
[0057]步骤2.2,收集GPS数据、视频数据、线圈断面流量数据等现有的交通动态、静态数 据;
[0058]步骤2.3,对于所收集的手机数据进行过滤,过滤掉事件信息异常的非正常用户数 据和由于经炜度重叠的基站及相邻基站信号发生"乒乓切换"的用户。以用户为单位,采用 连续点距离判断的方法,将经炜度重叠的基站合并,同时通过设定阀值对因信号漂移导致 多个在相邻基站之间往复跳跃的位置点进行整合;具体而言,对每个用户从位置点0开始连 续两两计算前后位置点的距离,如果距离小于所设定阈值,则将后一个位置点合并到前一 个位置点,将位置点对应的基站编号改为上一个位置点的基站编号,并将上一位置点通信 次数加1;
[0059] 步骤2.4,对过滤完的正常用户为单位重新排列事件信息,按时间排序,提取其通 信所对应的基站地理位置数据;
[0060] 步骤2.5,将整理好的手机数据和GPS数据、视频数据、线圈断面流量数据进行多源 数据融合管理。
[0061 ]步骤3,交通出行链识别,分析经过点和停留点
[0062]出行者在一天内会经过或停留在不同的空间位置,这些位置数据会由手机位置数 据反映出。对于任意用户,一天内经过或停留的位置点被划分为两类(经过点、停留点),来 描述用户在其上所处的状态。经过点为出行者空间移动过程中短暂经过的点,停留点是指 出行者停留时间较长的点(本发明中将停留时间大于1小时的点视为用户停留点,并将其起 视为出行者某次出行的一个出发地或目的地)。通过对手机信令数据的处理,可进行停留点 及所在交通小区的判断,结合上传时间可得到出行者一天内的出行链,通过对所有手机用 户一天内的所有出行进行统计分析,可得出以持有手机的出行者为样本的两个小区间的日 出行数量,即出行0D,以及各小区出行总产生量及吸引量。具体做法如下:
[0063]步骤3.1,将每个正常用户的手机位置数据按照时间排序,得到每个正常用户一天 的交通出行链;
[0064] 步骤3.2,针对每条交通出行链,根据出行链中每相邻的两个手机位置数据时间差 判断停留点:对每个正常用户,按照交通出行链顺序,依次处理每相邻的两个手机位置数据 时间差,当时间差大于1小时,则判断该位置为停留点;
[0065] 步骤3.3,按信号类型判断停留点:手机待机状态下同一基站位置上每隔1-2
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1