一种基于大数据的交通出行特征数据提取方法

文档序号:9751963阅读:1475来源:国知局
一种基于大数据的交通出行特征数据提取方法
【技术领域】
[0001] 本发明涉及一种交通出行特征数据提取方法,尤其涉及一种基于大数据的交通出 行特征数据提取方法,属于交通大数据的分析应用领域。
【背景技术】
[0002] 近年来,随着我国经济的快速发展,城市基础设施建设蓬勃开展,土地利用性质变 化也随之加快。随着各种先进的交通运输工具以及各种信息化的交通管理手段的应用,交 通基础设施与交通运行模式都在迅速地发生变化。在这种情况下,通过传统居民出行调查 来获取居民出行特征数据的方法,无论在经济性上,还是在成果准确性、时效性上,都无法 满足新时代交通规划和管理的需要。因此,迫切需要能够高频度、低成本、自动化获取居民 出行特征数据的新技术。
[0003] 随着交通大数据的日益积累和大数据技术的迅猛发展,使得在合理保护隐私的前 提下,从多源数据中融合获取居民出行数据成为可能,如何利用大数据手段替换传统调查 方法来分析交通出行特征成为近年来研究的主要方向。
[0004] 目前国内对基于手机数据、浮动车数据等进行交通出行分析的理论研究方面已经 有了一定的探索,其中,对0D矩阵数据获取的研究成果主要有:通过手机及其基站数据与道 路的匹配,自动的识别区域和基站的属性,快速划分出城市交通小区;通过手机数据提取个 人出行轨迹链信息,经扩样,得到一定区域范围的人员通勤出发地和目的地的矩阵;通过手 机数据来判断样本的位移状态,获得样本出行的起点和终点,分组统计形成出行0D矩阵数 据;通过上传手机信息的时间差及事件类型判断用户的停留点,进而通过两两连续停留点 计算交通小区间的出行量和各小区的交通产生吸引量。
[0005] 而对其他居民出行特征数据的分析上,有通过将地图数据、手机定位数据、浮动车 辆数据进行组织管理,建立基于手机定位数据及浮动车辆数据的人口出行特征空间分析模 型,获得人口出行特征综合信息;也有通过手机定位数据及交通小区匹配,判断驻留点、出 行距离、出行速度以及所有用户的出行记录表,统计得到居住地与工作地结果表,从而得到 用户出行特征参数。
[0006] 以上获取出行0D矩阵数据等其他交通出行特征数据的方法存在以下缺点:
[0007] 1)没有结合各类数据的特点建立交通出行分析的基础单元,仍采用传统的交通小 区划分方法,采用手机数据分析的交通小区划分,对交通分析的需求考虑不足,与传统调查 方法比较,在高频度、低成本上面优势明显,但是数据可用性方面存在不足。
[0008] 2)没有考虑单一来源的手机数据在精度不高、筛选误差大等方面的不足,得到的 出行链识别结果是交通小区级的,无法满足交通出行分析中道路交通分配的需求。
[0009] 3)手机数据不能直接对应到实际人口的出行分析上,需要经过相关性分析的模型 处理,但是经过简单手机保有率扩样,存在误差较大。
[0010] 4)根据工作地和居住地的判断方法,考虑实际工作和居住行为的因素不多,例如 判断居住地时,只是设定夜间时间,在该时间段内,某个基站小区的信令条数的比例大于 50%,为居住地,这种方法虽然简单易操作,但没有将手机数据中的事件类型与人们的实际 行为联系起来,无法进一步挖掘工作地和居住地信息。

【发明内容】

[0011] 针对上述现有技术存在的缺陷,本发明公开了一种基于大数据的交通出行特征数 据提取方法,采用以手机数据为核心,GPS数据、线圈数据、视频数据等为辅助,基于数据融 合后的居民出行特征数据获取方法。其中交通出行分析包括:交通小区的划分、出行路径的 识别、0D分析(各小区间起讫点出行量,各小区出行总产生量及吸引量)以及交通小区的职 住比分析。主要包括以下几个步骤:步骤1,交通出行分析的基本单元划分。结合行政区划以 及基站地理属性等进行交通小区划分;步骤2,数据采集、处理、融合。包括手机信令数据(手 机信令数据信息包括用户编号、事件类型、基站编号、基站经炜度坐标、上传时间)、GPS数 据、基于视频、线圈断面流量等数据的采集,手机数据的信息处理以及多源数据的融合;步 骤3,交通出行链识别,分析经过点和停留点。以手机数据为核心,通过多源不同数据优化交 通出行信息,识别交通出行链,并在此基础上分析经过点和停留点;步骤4,交通0D分析。手 机数据结合人口数据等进行0D结果输出;步骤5,职住分析。分析一周内所有的交通出行链, 结合开关机数据和通话数据,判别居住地与工作地,并进行职住分析。
[0012] 本发明的具体技术方案如下:
[0013] 步骤1,交通小区划分
[0014] 本发明采取的交通小区划分方法是结合行政区划以及基站地理属性等进行交通 小区划分。具体做法如下:
[0015] 步骤1.1,以基站经炜度信息与基础交通地理信息进行位置匹配,将基站匹配到道 路网上;
[0016] 步骤1.2,从数据库中读入以行政区划分为基础的交通小区的多边形地理信息; [0017]步骤1.3,根据各交通小区和基站的地理位置关系,即平面上多边形与点的包含关 系,将各个基站匹配到其所属的各交通小区内,建立基站和交通小区的隶属关系;
[0018]步骤1.4,对于基站处于交通小区边缘的情况,采用面积折算法确定基站和交通小 区的隶属关系,即确定边缘基站在各个交通小区内的面积与其覆盖面积的比例,将边缘基 站占比最大的小区扩大,把边缘基站全部包含入该小区。
[0019 ]步骤2,数据采集、处理、融合
[0020] 本发明采用的大数据包括手机信令数据(手机信令数据信息包括用户编号、事件 类型、基站编号、基站经炜度坐标、上传时间)、GPS数据、基于视频、线圈断面流量等数据,具 体采集、处理和融合的方法如下:
[0021] 步骤2.1,收集数据库手机用户的事件类型信息数据,手机用户的事件信息按用户 分类筛选;
[0022] 步骤2.2,收集GPS数据、视频数据、线圈断面流量数据等现有的交通动态、静态数 据;
[0023] 步骤2.3,对于所收集的手机数据进行过滤,过滤掉事件信息异常的非正常用户数 据和由于经炜度重叠的基站及相邻基站信号发生"乒乓切换"的用户。以用户为单位,采用 连续点距离判断的方法,将经炜度重叠的基站合并,同时通过设定阀值对因信号漂移导致 多个在相邻基站之间往复跳跃的位置点进行整合;具体而言,对每个用户从位置点0开始连 续两两计算前后位置点的距离,如果距离小于所设定阈值,则将后一个位置点合并到前一 个位置点,将位置点对应的基站编号改为上一个位置点的基站编号,并将上一位置点通信 次数加1;
[0024]步骤2.4,对过滤完的正常用户为单位重新排列事件信息,按时间排序,提取其通 信所对应的基站地理位置数据;
[0025]步骤2.5,将整理好的手机数据和GPS数据、视频数据、线圈断面流量数据进行多源 数据融合管理。
[0026] 步骤3,交通出行链识别,分析经过点和停留点
[0027] 出行者在一天内会经过或停留在不同的空间位置,这些位置数据会由手机位置数 据反映出。对于任意用户,一天内经过或停留的位置点被划分为两类(经过点、停留点),来 描述用户在其上所处的状态。经过点为出行者空间移动过程中短暂经过的点,停留点是指 出行者停留时间较长的点(本发明中将停留时间大于1小时的点视为用户停留点,并将其起 视为出行者某次出行的一个出发地或目的地)。通过对手机信令数据的处理,可进行停留点 及所在交通小区
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1