基于手机定位数据的居民出行特征参数的获取方法

文档序号:6366622阅读:290来源:国知局
专利名称:基于手机定位数据的居民出行特征参数的获取方法
技术领域
本发明涉及交通信息采集及处理技术领域,具体地说是一种基于手机定位数据的居民出行特征参数的获取方法。
背景技术
居民出行调查,是指在调查区域内,抽取一定比例的市民进行一天出行情况全面调查,以便掌握城市交通出行总量、主要发生吸引源、出行目的、方式结构、时空分布、出行时耗、出行距离等居民出行特征。居民出行调查是城市综合交通规划的一项重要基础性工作,是掌握城市交通特征和规律的主要手段,可为科学制定交通发展战略、政策、技术法规提供重要依据,对分析城市总体布局、交通演化规律起到关键作用,对社会经济发展研究具有广泛的应用价值。传统的居民出行调查实施步骤一般包括,首先成立专门机构统一负责,并进行调查前的资料准备(如人口分布、行政区划、土地利用等),然后进行调查方案设计(如拟定调查区域、交通小区划分、抽样、表格设计等),之后是进行调查人员培训,最后是人工调查的全面实施(如家访、电话询问、明信片、职工查询和月票调查等)。居民出行调查的每一个步骤都很关键,如果疏忽大意或考虑不周,将直接影响调查的最终结果。综合来看,传统居民出行调查方法的缺点主要包括(I)需要耗费大量的人力、物力,开展周期长(从筹划到实施)。(2)由于耗费巨大,因而调查间隔时间大(一般为5年以上),数据更新不够及时。(3)成果的精度受到多因素制约,其中包括样本量(样本率一般在城市人口 5%以内)、样本偏差、调查人员责任心、样本用户配合程度、录入数据与校核数据准确性等,往往得到的结果精度较低。随着全球定位系统(GPS)技术的发展,近年来交通研究人员将GPS设备应用于交通出行调查,利用GPS设备提供的精确位置信息和时间信息,对调查人群开展出行特征分析。然而,利用GPS设备开展交通调查仍然有诸多劣势(I)需要额外购置GPS设备。(2)在室内、桥下、地铁等环境下无法采集数据。(3)样本量较小,无法大规模开展。近年来,手机普及率日益提高,据国家工业和信息化部统计,截至2011年底我国手机普及率已达到73. 6%,从而为利用手机定位数据开展交通出行分析提供了基础。现有的利用手机定位数据提取部分出行特征参数的技术如申请号为 200910092031. 3的中国发明专利,其只获得出行起讫点,而不能从全方位体现居民出行调查的整体特征参数,其方法需要使用“事件类型”信息,而在实际通信过程中丢失数据时有发生,严重影响分析结果质量,使得其方法在实际应用中受到很大限制。还有申请号为 200910048300. 6的中国发明专利,其关注于进行检测交通状态,即实时道路交通速度,应用于交通信息服务的领域。
鉴于上述现有的技术存在的问题和缺陷,本发明人积极加以研究和创新,以发明一种低成本、样本量大、精度高、时效性强、数据结果更为客观的基于手机定位数据的居民出行特征参数的获取方法。

发明内容
为了解决现有技术中存在的上述问题,本发明提供了一种基于手机定位数据的居民出行特征参数的获取方法。本发明方法具有低成本、样本量大、精度高、时效性强的特点。为了解决上述技术问题,本发明采用了如下技术方案基于手机定位数据的居民出行特征参数的获取方法,包括如下步骤(I)手机定位数据收集;(2)数据预处理对手机定位数据进行过滤,删除定位失败的数据,根据手机定位数据的经度和纬度将手机定位数据匹配到相应的交通小区内,建立各条手机定位数据与交通小区的隶属关系,得到匹配后手机定位数据;(3)基于匹配后手机定位数据,以用户为单位,将一日的匹配后手机定位数据按照时间戳字段由小到大进行排序;自第I条匹配后手机定位数据开始处理,将连续的若干条位于同一交通小区的匹配后手机定位数据合并为一条数据,得到手机定位预处理数据,直至最末I条匹配后手机定位数据;其中,手机定位预处理数据中分别记录与合并的匹配后手机定位数据对应的进入该交通小区的进入时刻、离开该交通小区的离开时刻、平均经度、平均纬度和合并的匹配后手机定位数据的条数,还分别记录每一交通小区的前影响时刻和后影响时刻,以及该交通小区的影响时长;其中,平均经度和平均纬度分别取该若干条匹配后手机定位数据的经度和纬度的平均值;前影响时刻取该手机定位预处理数据的进入时刻与上一条手机定位预处理数据离开时刻的中间时刻;第I条手机定位预处理数据所在交通小区的前影响时刻赋值为最初进入该交通小区的时刻;后影响时刻取该条手机定位预处理数据的离开时刻与下一条手机定位预处理数据的进入时刻的中间时刻;最末I条手机定位预处理数据所在交通小区的后影响时刻赋值为最终离开该交通小区的时刻;影响时长取后影响时刻与前影响时刻的差值;按上述方法处理所有用户的匹配后手机定位数据,得到手机定位预处理数据表;(4)出行链识别基于手机定位预处理数据表,以用户为单位,将一日的手机定位预处理数据按照进入时刻字段由小到大进行排序;自该用户的第I条手机定位预处理数据开始处理,若第I条手机定位预处理数据的进入时刻>早上时刻阈值,则将第I条数据对应的交通小区作为一个驻留点;继续向下处理,若合并的匹配后手机定位数据的条数>驻留记录数阈值且影响时长>驻留时长阈值,则将该数据对应的交通小区作为一个驻留点;按时间顺序,将上一驻留点到下一驻留点,视为一次出行,记录起点交通小区、讫点交通小区和中间的经过点以及出行时耗的相关信息,其中,上一驻留点为起点交通小区,下一驻留点为讫点交通小区;出行时耗取讫点交通小区的进入时刻减去起点交通小区的离开时刻;基于已有道路网络,计算连续经过一次出行的起点交通小区、各经过点和讫点交通小区之间的最短路径,其中起点交通小区和讫点交通小区分别以平均经度和平均纬度确定地理位置,基于最短路径的连续经过的路段端点号信息,统计得到出行距离;计算出行速度,出行速度=出行距离/出行时耗;按上述方法处理所有用户的手机定位预处理数据,得到所有用户的出行记录表;(5)居住地与工作地判别基于匹配后手机定位数据表,提取某用户连续一周的数据,统计介于居住地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用户的居住地;基于匹配后手机定位数据表,提取某用户连续一周工作日的数据,统计介于工作地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用户的工作地;得到居住地与工作地结果表;(6)出行特征参数的获取将出行记录表和居住地与工作地结果表联合分析,得到用户出行特征参数。进一步,记录居住地判别比例,即居住地交通小区出现次数与判断时段内总次数的比值。记录工作地判别比例,即工作地交通小区出现次数与判断时刻内总次数的比值。居住地判别比例和工作地判别比例,作为表征判别结果可信度的指标。与现有技术相比,本发明的有益效果在于本发明的基于手机定位数据的居民出行特征参数的获取方法的数据来源是基于手机定位数据,获取的居民出行特征参数可以包括城市交通出行总量、时空分布、出行时耗、出行距离、出行路径选择等。本发明方法具有低成本、样本量大、精度高、时效性强等优点。面对快速的城市化进程,需要实时掌握居民出行特征,以满足城市交通规划的需求。本发明方法为居民出行调查提供了一种全新的技术手段,充分利用海量的大样本手机定位数据,通过建立持续观测机制,不断跟踪居民出行规律的演变。本发明提出的基于手机定位数据的居民特征获取方法,是指基于手机定位数据 (移动通信系统内部产生并记录的),结合交通基础地理信息,开展居民出行特征的提取, 从而为居民出行调查提供一种新的技术手段。该方法能够体现以人为探测单元的移动情况,样本率高,能够给出调查区域内用户分布与交通出行的“全景图”。本发明提出的基于手机定位数据的居民特征参数获取方法,基于城市手机定位数据和交通基础地理信息,能够处理得到城市交通出行总量、时空分布、出行时耗、出行距离、 出行路径选择等居民出行特征。本发明提出的基于手机定位数据的居民特征参数获取方法,具有以下显著优势(I)不需要额外购置设备,充分利用移动通信基础设施,综合调查费用相对较低。(2)自动化实现方式,需要较少的人力。(3)属于被动数据采集,且调查区域基本信号全覆盖,分析结果更加客观、准确。(4)样本量大,基本可以覆盖城市调查区域内每一个人。(5)数据更新周期短,更加灵活地支持动态交通规划、组织与管理,实现更加人性化的城市服务。本发明方法系统地解决了利用手机定位数据开展居民出行特征参数提取的问题。 该方法具有实用性强、算法效率高、结果精度高等显著优势,能够推动居民出行调查向更加客观、较低成本、更新周期缩短的方向发展。适宜于各城市的推广应用,前景广阔。


图I为本发明的基于手机定位数据的居民出行特征参数的获取方法的流程图;图2为使用本发明方法对用户A原始定位位置的分布示意图;图3为使用本发明方法对用户A出行链识别结果示意图。
具体实施例方式下面结合附图和具体实施例对本发明作进一步详细描述,但不作为对本发明的限定。本发明中的手机定位数据是指,在手机通信过程中,利用蜂窝基站方式实现对手机实时位置的获取,通常以经纬度方式记录。手机定位数据采集,往往采用事件触发机制, 如拨打或接听电话、收发短信、跨LAC区域、特定时长强制定位等方式,因此,时间间隔往往不能保证很规范。图I为本发明的基于手机定位数据的居民出行特征参数的获取方法的流程图。如图I所示,基于手机定位数据的居民出行特征参数的获取方法,包括如下步骤(I)手机定位数据收集。数据字段通常包括手机伪码、时间戳、经度、纬度、状态等,其中,状态字段为I表示定位成功,状态字段为O表示定位失败。本发明中认为,一部手机对应一个用户,根据手机伪码来确定手机定位数据是否属于同一用户。下表I为用户A的部分手机定位数据。表I
权利要求
1.基于手机定位数据的居民出行特征参数的获取方法,其特征在于,包括如下步骤(1)手机定位数据收集;(2)数据预处理对手机定位数据进行过滤,删除定位失败的数据,根据手机定位数据的经度和纬度将手机定位数据匹配到相应的交通小区内,建立各条手机定位数据与交通小区的隶属关系,得到匹配后手机定位数据;(3)基于匹配后手机定位数据,以用户为单位,将一日的匹配后手机定位数据按照时间戳字段由小到大进行排序;自第I条匹配后手机定位数据开始处理,将连续的若干条位于同一交通小区的匹配后手机定位数据合并为一条数据,得到手机定位预处理数据,直至最末I条匹配后手机定位数据;其中,手机定位预处理数据中分别记录与合并的匹配后手机定位数据对应的进入该交通小区的进入时刻、离开该交通小区的离开时刻、平均经度、平均纬度和合并的匹配后手机定位数据的条数,还分别记录每一交通小区的前影响时刻和后影响时刻,以及该交通小区的影响时长;其中,平均经度和平均纬度分别取该若干条匹配后手机定位数据的经度和纬度的平均值; 前影响时刻取该手机定位预处理数据的进入时刻与上一条手机定位预处理数据离开时刻的中间时刻;第I条手机定位预处理数据所在交通小区的前影响时刻赋值为最初进入该交通小区的时刻;后影响时刻取该条手机定位预处理数据的离开时刻与下一条手机定位预处理数据的进入时刻的中间时刻;最末I条手机定位预处理数据所在交通小区的后影响时刻赋值为最终离开该交通小区的时刻;影响时长取后影响时刻与前影响时刻的差值;按上述方法处理所有用户的匹配后手机定位数据,得到手机定位预处理数据表;(4)出行链识别基于手机定位预处理数据表,以用户为单位,将一日的手机定位预处理数据按照进入时刻字段由小到大进行排序;自该用户的第I条手机定位预处理数据开始处理,若第I条手机定位预处理数据的进入时刻>早上时刻阈值,则将第I条数据对应的交通小区作为一个驻留点;继续向下处理, 若合并的匹配后手机定位数据的条数>驻留记录数阈值且影响时长>驻留时长阈值,则将该数据对应的交通小区作为一个驻留点;按时间顺序,将上一驻留点到下一驻留点,视为一次出行,记录起点交通小区、讫点交通小区和中间的经过点以及出行时耗的相关信息,其中,上一驻留点为起点交通小区,下一驻留点为讫点交通小区;出行时耗取讫点交通小区的进入时刻减去起点交通小区的离开时刻;基于已有道路网络,计算连续经过一次出行的起点交通小区、各经过点和讫点交通小区之间的最短路径,其中起点交通小区和讫点交通小区分别以平均经度和平均纬度确定地理位置,基于最短路径的连续经过的路段端点号信息,统计得到出行距离;计算出行速度,出行速度=出行距离/出行时耗;按上述方法处理所有用户的手机定位预处理数据,得到所有用户的出行记录表;(5)居住地与工作地判别基于匹配后手机定位数据表,提取某用户连续一周的数据,统计介于居住地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用户的居住地;基于匹配后手机定位数据表,提取某用户连续一周工作日的数据,统计介于工作地判断时段内在各交通小区出现的次数;该出现次数最多的交通小区为该用户的工作地; 得到居住地与工作地结果表;(6)出行特征参数的获取将出行记录表和居住地与工作地结果表联合分析,得到用户出行特征参数。
2.根据权利要求I所述的基于手机定位数据的居民出行特征参数的获取方法,其特征在于,分别记录作为居住地和工作地的交通小区的出现次数占各自总次数的比值,以该比值作为表征判别结果可信度的指标。
全文摘要
本发明公开了一种基于手机定位数据的居民出行特征参数的获取方法,包括如下步骤(1)手机定位数据收集;(2)对手机定位数据过滤,并匹配到交通小区,得到匹配后手机定位数据;(3)以用户为单位,将一日的匹配后手机定位数据按时间排序,并将同一交通小区内连续的数据合并为一条,得到手机定位预处理数据;(4)根据合并的条数及影响时长判断驻留点;还原两驻留点之间的出行路径,得到出行距离、出行速度;得到所有用户的出行记录表;(5)基于匹配后手机定位数据,统计得到居住地与工作地结果表;(6)将出行记录表和居住地与工作地结果表联合分析,得到用户出行特征参数。本发明方法具有低成本、样本量大、精度高、时效性强的特点。
文档编号G06F17/30GK102595323SQ20121007450
公开日2012年7月18日 申请日期2012年3月20日 优先权日2012年3月20日
发明者张彭, 扈中伟, 温慧敏, 邓小勇, 郭继孚 申请人:北京交通发展研究中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1