一种基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法与流程

文档序号:15145822发布日期:2018-08-10 20:26阅读:893来源:国知局

本发明涉及一种基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法,属于交通管理统计技术领域。



背景技术:

居民出行调查是解决如何获取当前各大城市交通问题基础数据的重要措施。主要目的是为了掌握城市居民的出行特征,为城市交通规划模型的建立提供基础数据,其工作成果直接应用于交通规划、建设、运营、管理和决策制定等各项实际工作中,从而为科学合理的城市交通规划和政策制定,引导城市交通良性发展提供支撑。居民出行调查最常用的方法为入户调查,其工作方法为调查员提前预约被访户,在约定时间入户进行访问,被访者通过详细回忆记录入户前一天24小时的出行信息来完成调查。调查主要内容包括家庭信息、个人信息、个人出行信息。其中,家庭信息调查即家庭表通常包括家庭编号、调查日期、行政区、街道、社区、家庭坐标、总人口、不满六岁人口、家庭汽车情况等;由于入户调查组织困难,其抽样率一般较低,为此必须对调查样本数据进行传统扩样。

传统扩样方法包括:1)直接扩样;2)组合扩样;3)现状模型校核。通过传统扩样方法中的直接扩样、组合扩样最终使得家庭汽车情况的调查形成较为精确的车辆拥有分布。传统的组合扩样中采用的机动车拥有母体数据为交通管理部分统计数据,该数据普遍性存在三个问题:一是车辆登记地址与使用地址并不完全一致,二是城市里大量外地车无法统计,三是根据登记部门管辖范围限制,分布数据颗粒度较粗,大部分城市为片区级或整个城市仅一组数据。



技术实现要素:

针对现有传统扩样方法中采用的机动车拥有母体统计数据中存在的缺陷,本发明的目的在于提供一种更加精确、高效地基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法。

本发明的技术方案如下:

一种基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法,所述校核修正方法的实施步骤如下:

1)通过居民出行入户调查得到户表、人表和出行表;所述户表包括家庭编号、调查日期、行政区、街道、社区、家庭坐标、总人口、不满六岁人口、家庭汽车情况;

2)直接扩样:根据样本和母体的差异对所述户表进行基于调查抽样率的直接扩样;在入户调查中,按户和人分别计算户扩样系数和人口扩样系数,其中,户扩样系数=实际户数÷抽样样本户数;人口扩样系数=实际常住人口÷抽样样本常住人口;

3)组合扩样:根据外部数据源对直接扩样后数据的分类进行修正,使得加权后的总体结构和外部数据提供的总体结构相一致;具体组合扩样时,先对户表进行扩样,户扩样系数继承到人表中,然后对人表进行扩样,人口扩样系数再继承到出行表中,然后对出行表进行扩样;

其中,所述户表的组合扩样具体为:

a)基于户表的直接扩样结果,得到户分布;

b)然后对有车户按小汽车拥有量进行扩样得到车辆拥有分布;

c)利用大数据对所述车辆拥有分布进行校核修正,所述大数据包括手机信令数据及卡口检测数据等;所述利用大数据对所述车辆拥有分布进行校核修正的具体步骤如下:

第一步:利用大数据得到一个区域的实际使用车辆总量;一个区域的实际使用车辆总量为经常性本地化使用的外地车辆和本地家庭拥有车辆的数量总和;所述经常性本地化使用的外地车辆的数量主要利用卡口数据计算;本地家庭拥有车辆的数量从交管部门原始统计数据中取得;

第二步:利用所述手机信令数据中车主信息中是否拥有车辆的标签,得到细颗粒度层级的车辆拥有分布,即得到各个细分中区;然后将一个区域的实际使用车辆总量分摊到各个细分中区得到各个细分中区的车辆拥有量;

第三步:根据居民出行入户调查的户表中车辆拥有情况进行扩样,计算各个细分中区的扩样系数,所述各个细分中区的扩样系数=各个细分中区的车辆拥有量/各细分中区的入户调查各车辆拥有数量。

第四步:利用所述各个细分中区的扩样系数计算得到初步校核修正后的车辆拥有分布;

d)调整无车户数量,保证总户数一致;最终得到校核修正后的车辆拥有分布。

优选地,所述区域可以是一个市、县或区的行政区划。

优选地,所述利用卡口数据计算经常性本地化使用的外地车的数量是指通过交通管理部门对卡口长时间监测的数据来识别外地车。

优选地,所述手机信令数据具有实时位置信息,通过所述手机信令数据得到的所述细颗粒度层级的车辆拥有分布为实际使用地址的车辆分布。

本发明与现有技术相比,优点在于:

1)本发明引入卡口数据和手机信令数据进行数据修正,可以更加有效的识别外地车辆,有效解决了车辆登记地址与使用地址并不完全一致、城市里大量外地车无法统计、登记部门管辖范围限制等技术问题,使得一个区域的实际使用车辆总量更加准确,从而使得最终得到的车辆分布情况更加精确。

2)本发明利用手机信令数据中车主信息中是否拥有车辆的标签,得到细颗粒度层级的车辆拥有分布,有效解决了现有技术中分布数据颗粒度较粗,大部分城市为片区级或整个城市仅一组数据的技术瓶颈。

3)本发明利用手机信令数据的实时位置信息,使得获取的车辆分布情况更加实时精确。

附图说明

图1基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法

具体实施方式

下面结合具体实施例来对本发明进行进一步说明,但并不将本发明局限于这些具体实施方式。本领域技术人员应该认识到,本发明涵盖了权利要求书范围内所可能包括的所有备选方案、改进方案和等效方案。

下面结合附图对本发明的实施方式作详细说明。本方法是一种基于大数据和传统扩样方法相结合的车辆拥有分布校核修正方法,其修正方法的实施步骤如下:

1)通过居民出行入户调查得到户表、人表和出行表;所述户表包括家庭编号、调查日期、行政区、街道、社区、家庭坐标、总人口、不满六岁人口、家庭汽车情况;

2)直接扩样:根据样本和母体的差异进行总量的扩样,对所述户表进行基于调查抽样率的直接扩样;在入户调查中,按户和人分别计算户扩样系数和人口扩样系数,其中,户扩样系数=实际户数÷抽样样本户数;人口扩样系数=实际常住人口÷抽样样本常住人口;

3)组合扩样:根据外部数据源对直接扩样后数据的分类进行修正,使得加权后的总体结构和外部数据提供的总体结构相一致;具体组合扩样时,先对户表进行扩样,户扩样系数继承到人表中,然后对人表进行扩样,人口扩样系数再继承到出行表中,然后对出行表进行扩样;

其中,户表组合扩样具体为:

a)基于户表的直接扩样结果,得到户分布;

b)然后对有车户按小汽车拥有量进行扩样得到车辆拥有分布;

c)利用大数据对所述车辆拥有分布进行校核修正,所述大数据包括手机信及卡口检测数据等;所述校核修正的具体步骤如下:

第一步:利用大数据得到一个区域实际使用车辆总量;所述区域可以是一个市、县或区的行政区划;区域实际使用车辆总量为经常性本地化使用的外地车辆和本地家庭拥有车辆的数量总和;所述经常性本地化使用的外地车辆主要利用交通管理部门通过长时间检测数据来识别外地车,如利用卡口数据计算出经常性本地化使用的外地车辆的数量;本地家庭拥有车辆的数量从交管部门原始统计数据中取得。

第二步:利用所述手机信令数据中车主信息中是否拥有车辆的标签,得到细颗粒度层级的车辆拥有分布,即得到各个细分中区;然后将一个区域实际使用车辆总量分摊到各个细分中区得到各个细分中区的车辆拥有总量;所述手机信令数据具有实时位置信息,因此该数据得到的车辆拥有分布实际上为实际使用地址的车辆分布。

第三步:根据居民出行入户调查的户表中车辆拥有情况进行扩样,计算各细分中区的扩样系数=各细分中区的车辆拥有总量/各细分中区的入户调查各车辆拥有数量。

第四步:利用所述各细分中区的扩样系数计算得到修正后的车辆拥有分布;

d)最后调整无车户数量,保证总户数一致。

如上所示,本发明虽然已参照有限的实施例和附图进行了说明,但在本发明所属领域中具备通常知识的人均可以从此记载中进行各种修改和变形。由此,其他实施例及权利要求书与等同物均属于权利要求的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1