一种职住空间信息提取方法及装置、计算机可读存储介质与流程

文档序号:13619734阅读:288来源:国知局

本发明属于数据提取技术领域,尤其涉及一种职住空间信息提取方法及装置、计算机可读存储介质。



背景技术:

城市居民的工作地和居住地是城市空间的重要组成部分,城市居民的工作地与居住地的空间布局和匹配程度对城市通勤交通、空气质量以及居民个体的生活质量具有不同程度影响,居民的工作地和居住地的确定是计算居民通勤距离和职住平衡指标的前提。现有的职住空间的信息提取,主要是通过利用居民的出行数据,直接确定居民的工作地与居住地,或者通过手机信令数据进行居民职住地的识别,通过抽样的方式调查个体的居住地和工作地,从而获取城市居民的职住信息,其数据量最多为城市居民总量的1%-5%,然而由于居民的出行数据量有限,提取到的居民的职住信息准确度不高且不全面。

综上所述,现有的职住空间信息提取方法存在信息准确度不高且不全面的问题。



技术实现要素:

有鉴于此,本发明提供了一种居民职住空间信息提取方法及装置、计算机可读存储介质,旨在解决现有的职住空间信息提取方法存在信息准确度不高且不全面的问题。

本发明实施例的第一方面提供了一种居民职住空间信息提取方法,所述居民职住空间信息提取方法包括:

根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;

根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;

根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;

根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

本发明实施例的第二方面提供了一种居民职住空间信息提取装置,所述居民职住空间信息提取装置包括:

居住地获取模块,用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置;

工作地获取模块,用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置;

匹配模块,用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;

计算模块,用于根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

本发明实施例的第三方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;

根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;

根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;

根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,其中,所述居住地数据包括全样本人口数据、房屋基础数据、建筑普查数据以及空间基础网格数据;

根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,其中,所述工作地数据包括社保数据和商事主体数据;

根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;

根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

本发明提供的一种居民职住空间信息提取方法及装置、计算机可读存储介质,通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例一提供的一种职住空间信息提取方法的实现流程图;

图2是本发明实施例二提供的一种职住空间信息提取装置的结构框图;

图3是本发明实施例三提供的一种终端设备的结构示意图。

具体实施方式

以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。

为了解决现有的职住空间信息提取方法存在信息准确度不高且不全面的问题,本发明实施例提供的一种居民职住空间信息提取方法及装置、计算机可读存储介质,能够通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。

为了说明本发明的技术方案,下面通过具体实施例来进行说明。

实施例一:

图1示出了本发明实施例一提供的一种职住空间信息提取方法的流程图,详述如下:

如图1所示,在步骤s101中,根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,居住地数据包括全样本人口数据。

需要说明的是,上述居住地数据除了包括全样本人口数据之外,还可以包括房屋基础数据、建筑普查数据和空间基础网格数据等信息,全样本人口数据包括城市每个居民个体的居住个体编号、姓名、年龄、性别、行业、房屋编码等信息,房屋基础数据包括房屋编码和所处建筑的建筑编码、建筑编码等信息,建筑普查数据包括每栋建筑的建筑编码和建筑用途等信息,空间基础网格数据是通过空间基础网格将城市划分为最小的空间基础单元。

根据居住地数据获取每个居民个体的居住地网格编码,首先通过关键字将上述全样本人口数据、房屋基础数据以及建筑普查数据进行匹配连接,然后通过空间关系叠加将每个居民个体的居住地落位于空间基础网格之中,从而获取每个居民个体的居住地网格编码,进而确定每个居民个体的居住地位置,具体的,根据全样本人口数据的房屋编码与房屋基础数据的房屋编码进行关键字匹配,使得全样本人口数据与房屋基础数据进行匹配连接,能够得到每个居民个体的居住房屋信息,根据房屋基础数据的建筑编码和建筑普查信息的建筑编码进行关键字匹配,使得房屋基础数据与建筑普查信息进行匹配连接,由于全样本人口数据与房屋基础数据已经匹配,因此,能够得到每个居民个体的居住建筑信息,再通过空间关系叠加的方式,将建筑普查数据中的每栋建筑落位于空间基础网格之中,进而可以得到每栋建筑的空间网格编码,由于已经获得了每个居民个体的居住建筑信息,因而能够进一步地得到每个居民个体的居住地网格编码,确定每个居民个体的居住地位置。需要说明的是,上述空间关系叠加是指将建筑普查数据与空间基础网格根据空间位置进行连接,以使每栋建筑确定对应一个空间网格编码。

示例性的,以深圳市为例,深圳市空间基础网格是深圳市目前划分最细的空间基础单元,目前深圳市的空间基础网格共有9459个,上述全样本人口数据为深圳市2014年的人口数据,上述房屋基础数据为2014年深圳市的房屋数据,上述建筑普查数据为深圳市2014年的建筑普查数据。

优选地,作为本实施例的一种实现方式,上述步骤s101包括以下步骤s1011至s1014:

s1011,将全样本人口数据和房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息;

s1012,将房屋基础数据和建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息;

s1013,将建筑普查数据和空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码;

s1014,根据居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。

在步骤s102中,根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,工作地数据包括社保数据。

需要说明的是,上述工作地数据除了包括社保数据之外,还可以包括商事主体数据,社保数据包括社保缴纳人的工作个体编码和工作单位数据(组织机构代码、地址、名称等),商事主体数据包括工作单位数据(组织机构代码、地址、名称等)。还需要说明的是,上述工作地数据也包括空间基础网格数据,空间基础网格数据是通过空间基础网格将城市划分为最小的空间基础单元。

根据工作地数据获取每个具名个体的工作地网格编码,首先通过空间关系叠加将商事主体中工作单位数据的地址与空间基础网格进行对应,然后通过关键字匹配将上述社保数据和商事主体数据进行匹配连接,进而使得每个具名个体工作地落位与空间基础网格之中,从而获取每个居民个体的工作地网格编码,进而确定每个居民个体的工作地位置,具体的,通过空间关系叠加,将具有空间位置信息的商事主体数据与空间基础网格数据建立连接,使得商事主体数据中的工作单位落位在空间基础网格之中,然后根据社保数据的工作单位数据和商事主体数据的工作单位数据进行关键字匹配,使得社保数据与商事主体数据进行匹配连接,由于商事主体数据已经与空间网络数据建立了连接,因而能够得到每个居民个体的工作地网格编码,确定每个居民个体的工作地位置。需要说明的是,上述空间关系叠加是指将建筑普查数据与空间基础网格根据空间位置进行连接,以使每栋建筑确定对应一个空间网格编码。

优选地,作为本实施例的一种实现方式,上述步骤s102包括以下步骤s1021至s1023:

s1021,将商事主体数据与空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码;

s1022,将社保数据和商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息;

s1023,根据工作单位信息以及工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。

在步骤s103中,根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配。

由于全样本人口数据中的居住个体编号和社保数据中的工作个体编号是每个具名个体的唯一编码,由于涉及数据隐私保护,居住个体编号和工作个体编号均经过加密处理,需要通过加密映射文件将两者进行匹配。通过确定每个居民个体的居住地网格编码和每个居民个体的工作地网格编码,由于居住个体编码和工作个体编码已经进行匹配,因此能够将每个居民个体的居住地网格编码和工作地网格编码一一对应。

优选地,作为本实施例的一种实现方式,上述步骤s103包括以下步骤s1031至s1033:

s1031,根据全样本人口数据获取每个居民个体的居住个体编号;

s1032,根据社保数据获取每个居民个体的工作个体编号;

s1033,将居住个体编号和工作个体编号一一进行匹配,以使每个居民个体的居住地网格编码和工作地网格编码一一匹配。

在步骤s104中,根据匹配后的每个居民个体的居住地网格编码和每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

需要说明的是,计算每个居民个体的实际通勤距离需要基于实际路网进行计算,基于路网数据,再提取空间基础网格数据的质心作为起讫点,具体的,通过提取每个居民个体的居住地空间基础网格的质心作为起点,再通每个居民个体的工作地空间基础网格的质心作为讫点,再根据路网数据构建交通网络计算每个居民个体的实际通勤距离。

优选地,作为本实施例的一种实现方式,上述步骤s104包括以下步骤s1041至s1044:

s1041,根据路网数据构建交通网络;

s1042,提取每个居民个体的居住地空间基础网格的质心作为起点;

s1043,提取每个居民个体的工作地空间基础网格的质心作为讫点;

s1044,根据起点、讫点和交通网络计算每个居民个体的实际通勤距离。

本实施例提供的职住空间信息提取方法,通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。

实施例二:

对应于图1所示的实施例一提供的一种职住空间信息提取方法,图2示出了本发明实施例二提供的职住空间信息提取装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。

参照图2,上述一种职住空间信息提取装置20,包括居住地获取模块21、工作地获取模块22、匹配模块23以及计算模块24。

居住地获取模块21用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,居住地数据包括全样本人口数据。

工作地获取模块22用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,工作地数据包括社保数据。

匹配模块23用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配。

计算模块24用于根据匹配后的每个居民个体的居住地网格编码和每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

优选地,作为本实施例的一种实现方式,上述居住地获取模块21包括房屋信息获取单元、建筑信息获取单元、第一空间关系叠加单元以及第一网格编码获取单元。

房屋信息获取单元,用于将全样本人口数据和房屋基础数据通过房屋编码进行匹配连接,以获取每个居民个体的居住房屋信息。

建筑信息获取单元,用于将房屋基础数据和建筑普查数据通过建筑编码进行匹配连接,以获取每个居民个体的居住建筑信息。

第一空间关系叠加单元,用于将建筑普查数据和空间基础网格数据进行空间关系叠加,以获取居住建筑的空间基础网格编码。

第一网格编码获取单元,用于根据居住建筑的空间基础网格编码获取每个居民个体的居住地网格编码。

优选地,作为本实施例的一种实现方式,上述工作地获取模块22包括第二空间关系叠加单元、工作单元信息获取单元以及第二网格编码获取单元。

第二空间关系叠加单元,用于将商事主体数据与空间基础网格数据进行空间关系叠加,以获取工作单位的空间基础网格编码。

工作单元信息获取单元,用于将社保数据和商事主体数据进行匹配连接,以获取每个居民个体的工作单位信息。

第二网格编码获取单元,用于根据工作单位信息以及工作单位的空间基础网格编码获取每个居民个体的工作地网格编码。

优选地,作为本实施例的一种实现方式,上述匹配模块23包括第一编号获取单元、第二编号获取单元以及匹配单元。

第一编号获取单元,用于根据全样本人口数据获取每个居民个体的居住个体编号。

第二编号获取单元,用于根据社保数据获取每个居民个体的工作个体编号。

匹配单元,用于将居住个体编号和工作个体编号一一进行匹配,以使每个居民个体的居住地网格编码和工作地网格编码一一匹配。

优选地,作为本实施例的一种实现方式,上述计算模块24包括交通网络构建单元、起点提取单元、讫点提取单元以及计算单元。

交通网络构建单元,用于根据路网数据构建交通网络。

起点提取单元,用于提取每个居民个体的居住地空间基础网格的质心作为起点。

讫点提取单元,用于提取每个居民个体的工作地空间基础网格的质心作为讫点。

计算单元,用于根据起点、讫点和交通网络计算每个居民个体的实际通勤距离。

本领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将应用程序的安装方法的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。

需要说明的是,本发明实施例提供的职住空间信息提取装置,由于与本发明图1所示方法实施例基于同一构思,其带来的技术效果与本发明图1所示方法实施例相同,具体内容可参见本发明图1所示方法实施例中的叙述,此处不再赘述。

因此,本实施例提供的一种职住空间信息提取装置,同样能够通过全样本人口数据获取每个居民个体的居住地位置,通过社保缴纳数据和商事主体数据获取每个居民个体的工作地位置,并将居住地位置和工作地位置落位于空间基础网格中,通过加密的关键字将每个居民个体的居住地位置和工作地位置进行连接,根据连接后的居住地位置和工作地位置计算出每个居民个体的实际通勤距离,信息覆盖全面,能够准确的提取出每个居民个体的工作地和居住地信息,有效地提高职住空间信息提取的准确性。

实施例三:

图3是本发明一实施例提供的终端设备的示意图。如图3所示,该实施例的终端设备3包括:处理器30、存储器31以及存储在所述存储器31中并可在所述处理器30上运行的计算机程序32,例如上述卸载应用程序的方法的程序。所述处理器30执行所述计算机程序32时实现上述各个卸载应用程序的方法实施例中的步骤,例如图1所示的步骤s101至s104。或者,所述处理器30执行所述计算机程序32时实现上述各装置实施例中各模块/单元的功能,例如图2所示模块21至24的功能。

示例性的,所述计算机程序32可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器31中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序32在所述终端设备3中的执行过程。例如,所述计算机程序32可以被分割成居住地获取模块、工作地获取模块、匹配模块以及计算模块,各模块具体功能如下:

居住地获取模块,用于根据居住地数据获取每个居民个体的居住地网格编码,以确定每个居民个体的居住地位置,所述居住地数据包括全样本人口数据;

工作地获取模块,用于根据工作地数据获取每个居民个体的工作地网格编码,以确定每个居民个体的工作地位置,所述工作地数据包括社保数据;

匹配模块,用于根据全样本人口数据和社保数据将每个居民个体的居住地网格编码和工作地网格编码进行匹配;

计算模块,用于根据匹配后的每个居民个体的居住地网格编码和所述每个居民个体的工作地网格编码计算每个居民个体的实际通勤距离。

所述终端设备3可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器30、存储器31。本领域技术人员可以理解,图3仅仅是终端设备3的示例,并不构成对终端设备3的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。

所称处理器30可以是中央处理单元(centralprocessingunit,cpu),还可以是其他通用处理器、数字信号处理器(digitalsignalprocessor,dsp)、专用集成电路(applicationspecificintegratedcircuit,asic)、现成可编程门阵列(field-programmablegatearray,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

所述存储器31可以是所述终端设备3的内部存储单元,例如终端设备3的硬盘或内存。所述存储器31也可以是所述终端设备3的外部存储设备,例如所述终端设备3上配备的插接式硬盘,智能存储卡(smartmediacard,smc),安全数字(securedigital,sd)卡,闪存卡(flashcard)等。进一步地,所述存储器31还可以既包括所述终端设备3的内部存储单元也包括外部存储设备。所述存储器31用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器31还可以用于暂时地存储已经输出或者将要输出的数据。

在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用程序和设计约束条件。专业技术人员可以对每个特定的应用程序来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。

所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。

其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括是电载波信号和电信信号。

以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1