时空分析方法、装置和存储介质与流程

文档序号:17090139发布日期:2019-03-13 23:21阅读:207来源:国知局
时空分析方法、装置和存储介质与流程

本发明涉及数据处理技术领域,尤其涉及一种时空分析方法、装置和存储介质。



背景技术:

在零售、房产、规划、统计等不同行业,均存在着对复杂时空理解的诉求。现阶段,时空分析类产品多是对指定区域内的数据按照某一分析目标进行分析,具有局限性,且无法满足用户从小范围的细致分析,到大范围的宏观把控的需求。另外,多数时空分析类产品的数据基础来自于手机信令的定位数据,数据形式单一。



技术实现要素:

本发明实施例提供一种时空分析方法、装置和存储介质,以解决现有技术中的一个或多个技术问题。

第一方面,本发明实施例提供了一种时空分析方法,包括:

从多个维度采集时空数据;

按照多个层级的地理区域对所述时空数据进行划分,得到每个地理区域所包括的时空数据;

按照多个分析目标对所述时空数据进行分类,得到每个分析目标所包括的时空数据;

按照所选择的地理区域和分析目标,对所述时空数据进行分析。

在一种实施方式中,按照多个层级的地理区域对所述时空数据进行划分,得到每个地理区域所包括的时空数据,包括:

按照预先划分的多个层级的地理区域,为所述时空数据添加对应的地理标签,每个地理区域具有对应的地理标签;

对各地理区域所包括的时空数据进行去重处理。

在一种实施方式中,按照多个分析目标对所述时空数据进行分类,得到每个分析目标所包括的时空数据,包括:

按照所述多个分析目标,对去重后的时空数据进行分类,得到每个分析目标所包括的时空数据。

在一种实施方式中,按照所选择的地理区域和分析目标,对所述时空数据进行分析,包括:

获取框选的地理区域;

将所述框选的地理区域划分为多个预设大小的网格;

对各网格所述包括的时空数据进行去重处理;

按照所述框选的地理区域和所选择的分析目标,对所述框选的地理区域中的去重后的时空数据进行分析。

在一种实施方式中,所述分析目标包括常驻人口分析目标、职住分析目标、客流分析目标、人口流动分析目标、用地类型分析目标、od分析目标和交通分析目标中的多个。

在一种实施方式中,所述地理区域包括职能区域、街道区域、行政区域和自定义区域中的多个。

在一种实施方式中,所述时空分析方法还包括:

如果所选择的地理区域为所述多个层级的地理区域,则在所述地理区域的选择页面可视化展示分析后的时空数据;

如果所选择的地理区域为框选的地理区域,则保存所述地理区域,并在新的页面可视化展示分析后的时空数据。

第二方面,本发明实施例提供一种时空分析装置,包括:

采集模块,用于从多个维度采集时空数据;

划分模块,用于按照多个层级的地理区域对所述时空数据进行划分,得到每个地理区域所包括的时空数据;

分类模块,用于按照多个分析目标对所述时空数据进行分类,得到每个分析目标所包括的时空数据;

分析模块,用于按照所选择的地理区域和分析目标,对所述时空数据进行分析。

在一种实施方式中,所述划分模块包括:

添加子模块,用于按照预先划分的多个层级的地理区域,为所述时空数据添加对应的地理标签,每个地理区域具有对应的地理标签;

第一去重子模块,用于对各地理区域所包括的时空数据进行去重处理。

在一种实施方式中,所述分析模块包括:

分类子模块,用于按照所述多个分析目标,对去重后的时空数据进行分类,得到每个分析目标所包括的时空数据。

在一种实施方式中,所述分析模块包括:

获取子模块,用于获取框选的地理区域;

划分子模块,用于将所述框选的地理区域划分为多个预设大小的网格;

第二去重子模块,用于对各网格所述包括的时空数据进行去重处理;

分析子模块,用于按照所述框选的地理区域和所选择的分析目标,对所述框选的地理区域中的去重后的时空数据进行分析。

在一种实施方式中,所述分析目标包括常驻人口分析目标、职住分析目标、客流分析目标、人口流动分析目标、用地类型分析目标、od分析目标和交通分析目标中的多个。

在一种实施方式中,所述地理区域包括职能区域、街道区域、行政区域和自定义区域中的多个。

在一种实施方式中,所述时空分析装置还包括:

第一可视化模块,用于如果所选择的地理区域为所述多个层级的地理区域,则在所述地理区域的选择页面可视化展示分析后的时空数据;

第二可视化模块,用于如果所选择的地理区域为框选的地理区域,则保存所述地理区域,并在新的页面可视化展示分析后的时空数据。

第三方面,本发明实施例提供了一种时空分析装置,所述装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括一个或多个与上述功能相对应的模块。

在一个可能的设计中,所述装置的结构中包括处理器和存储器,所述存储器用于存储支持所述装置执行上述方法的程序,所述处理器被配置为用于执行所述存储器中存储的程序。所述装置还可以包括通信接口,用于与其他设备或通信网络通信。

第四方面,本发明实施例提供了一种计算机可读存储介质,用于存储时空分析装置所用的计算机软件指令,其包括用于执行上述方法所涉及的程序。

上述技术方案通过从多个维度采集时空数据,并将采集到的时空数据按照多个层级的地理区域进行划分,并提供多种分析目标,可以为用户提供多维、深层、丰富的数据展现形式,方便用户深度理解时空数据。

上述概述仅仅是为了说明书的目的,并不意图以任何方式进行限制。除上述描述的示意性的方面、实施方式和特征之外,通过参考附图和以下的详细描述,本发明进一步的方面、实施方式和特征将会是容易明白的。

附图说明

在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本发明公开的一些实施方式,而不应将其视为是对本发明范围的限制。

图1示出根据本发明实施例的时空分析方法的流程图。

图2示出根据本发明实施例的时空分析方法的应用示例图。

图3示出根据本发明实施例的一种实施方式的时空分析方法的流程图。

图4示出根据本发明实施例的另一种实施方式的时空分析方法的流程图。

图5示出根据本发明实施例的又一种实施方式的时空分析方法的流程图。

图6示出根据本发明实施例的时空分析方法的可视化展示页面图。

图7示出根据本发明实施例的时空分析方法的可视化展示页面图。

图8示出根据本发明实施例的时空分析方法的应用示例图。

图9示出根据本发明实施例的时空分析装置的结构框图。

图10示出根据本发明实施例的时空分析装置的结构框图。

具体实施方式

在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本发明的精神或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的而非限制性的。

图1示出根据本发明实施例的时空分析方法的流程图。如图1所示,该方法可以包括以下步骤:

步骤s10,从多个维度采集时空数据;

步骤s20,按照多个层级的地理区域对所述时空数据进行划分,得到每个地理区域所包括的时空数据;

步骤s30,按照多个分析目标对所述时空数据进行分类,得到每个分析目标所包括的时空数据;

步骤s40,按照所选择的地理区域和分析目标,对所述时空数据进行分析。

为了满足不同用户,对不同层级和不同维度的时空数据分析的需求,本发明实施例可以从多个维度采集时空数据,并将采集到的时空数据按照多个层级的地理区域进行划分,并可以提供多种分析目标。

在一个示例中,可以基于百度定位大数据采集时空数据。百度定位大数据可以覆盖全球,且每天定位点超过900亿,以为时空分析提供海量数据基础。

在一个示例中,如图2所示,在时空数据采集过程中可以包括多种途径。例如:离线采集人口定位数据;通过诸如交管部门等第三方提供的交通路况数据;通过互联网爬取或购买商场或景区等职能区域信息;实时采集用户定位日志。其中,用户可以包括以本实施例方法为基础的产品使用者。采集到的原始时空数据可以存储至分布式文件系统(hadoopdistributedfilesystem,hdfs)中。

本实施例方法的分析对象即为地理区域。地理区域的划分在横向(类别)和纵向上均可以表现为多个层级。例如:地理区域可以包括但不限于职能区域、街道区域、行政区域和自定义区域。另外,某一地理区域可以涵盖一个或多个其他地理区域。其中,职能区域可以是以功能不同划分的区域。例如:商场、住宅小区、景区、医院等。自定义区域可以是用户根据自己实际需求而定义的固定区域。

本实施例中,对于采集到的时空数据除了可以进行多个层级的地理区域的划分,还可以按照多个分析目标进行分类。举例而言,分析目标包括但不限于:

(1)常驻人口分析目标。例如:区域常驻人口数量分析,包括但不限于在该区域住的人口数量分析以及在该区域工作的人口数量分析;按性别、年龄、教育水平检索的热力图信息的提供;区域内人口画像数据的提供等。

(2)职住分析目标。例如:居住人口工作地分析、工作人口居住地分析和区域通勤方式分析等。

(3)客流分析目标。例如:区域内客流量按时间的汇总信息的提供;区域内全部客流以及外来客流的热力图信息的提供;外来客流来源地分析;外来客流画像分析。此外,对于区县级别的行政区域,客流分析目标还可以包括外来客流热门聚集地分析,且可以涵盖景区、医院、商场等职能区域。

(4)人口流动分析目标。例如:按照城市、区县、乡镇等不同级别的行政区域中的常驻人口(包括居住人口和工作人口)的流动分析。

(5)用地类型分析目标。

(6)起点-终点(origin-destination,od)分析目标。例如:基于地理区域内的定位点数据进行聚类算法分析,以实现按工作日-周末的区域迁入迁出分析。

(7)交通分析目标。例如:区域拥堵指数分析、区域拥堵道路排行和区域交通站点分析等。

请参阅图2,在一个示例中,可以按照以上分析目标对将采集到的时空数据进行初步分析,以将时空数据划分为常驻人口、客流、用户画像、职住、地块路网、交通路况、业态、od、通勤、商场等不同类别的数据,并存储在后端数据库(例如离线数据库)中。

其中,初步分析的方式包括但不限于统计分析、数据挖掘和机器学习。例如:通过hive做基础统计类分析;通过聚类等算法对常驻人口信息挖掘;通过xgboost、随机森林等算法对通勤方式信息挖掘;通过改造文档主题生成模型算法(latentdirichletallocation,lda)对土地用地类型分类挖掘;通过分析式计算(hadoop)和实时流计算(streaming)的方式进行各种算法分析。这些人工智能(artificialintelligence,ai)技术的使用,可以提高数据质量。

如图2所示,可以基于抽取-交互转换-加载(extract-transform-load,etl)模块进行数据转储。例如:按照预设的时间条件,如每月、每季度或预设时间段,通过异构转储技术将离线数据库中的时空数据转储至web端的各种存储介质中。其中,转储技术可以是基于异构数据的转储框架datax插件或sqoop转储技术或自定义数据转储框架(自定义脚本)。web端的存储介质包括但不限于mysql、redis和elasticsearch。其中,mysql可以用于存储时空数据;elasticsearch可以用于对选择的地理区域中的时空数据进行检索;redis可以用于缓存时空数据;异构数据可以包括hdfs数据、elasticsearch数据以及redis数据。

在一种实施方式中,如图3所示,在步骤s20中,可以包括:

步骤s21,按照预先划分的多个层级的地理区域,为所述时空数据添加对应的地理标签,每个地理区域具有对应的地理标签;

步骤s22,对各地理区域所包括的时空数据进行去重处理。

进一步地,在步骤s40中,可以包括:

步骤s41,按照所述多个分析目标,对去重后的时空数据进行分类,得到每个分析目标所包括的时空数据。

本实施例中,不同层级的地理区域(分析对象)中的时空数据均可以具有地理标签,每个地理标签对应有地理区域,进而划分时空数据。对每个地理区域所包括的时空数据进行去重处理,进而在地理区域中仅保留一个相同的定位点(如人的定位),以去除冗余数据,提高分析结果的准确性。

在一种实施方式中,如图4所示,在步骤s40中可以包括:

步骤s42,获取框选的地理区域;

步骤s43,将所述框选的地理区域划分为多个预设大小的网格;

步骤s44,对各网格所述包括的时空数据进行去重处理;

步骤s45,按照所述框选的地理区域和所选择的分析目标,对所述框选的地理区域中的去重后的时空数据进行分析。

本实施例中,分析对象可以包括用户直接框选的地理区域。对于框选的地理区域,可以以预设大小的网格为单位,进行去重操作。例如,将框选地理区域划分为100*100像素的网格,并对每个网格所包括的时空数据进行去重操作,以在每个网格中仅保留一个相同的定位点。

在一种实施方式中,如图5所示,本实施例的时空分析方法还可以包括:

步骤s50,如果所选择的地理区域为所述多个层级的地理区域,则在所述地理区域的选择页面可视化展示分析后的时空数据;

步骤s60,如果所选择的地理区域为框选的地理区域,则保存所述地理区域,并在新的页面可视化展示分析后的时空数据。

可视化展示的数据类型包括但不限于:(1)数值型数据,可以用于表征数值类,如人数、面积等信息;(2)曲线、柱状等数据,可以用于表征趋势类数据,如月级变化、小时级变化等;(3)热力图数据,用于表征区域热力分布。同时,用户可对不同形态数据按模块组合批量下载,如图6所示。

在可视化分析后的时空数据时,不同层级的地理区域略有差异。其中,预先划分的地理区域,如职能区域、街道区域、行政区域和自定义区域,通常为固定块。可视化固定块中的数据时,可以单独选择一个地理区域,进而查看不同分析目标的结果;也可以通过选择多个地理区域,查看组合分析的结果。对于任意地理区域,可以先框选地理区域,并保存该区域,进而在详情页查看各项分析,如图7所示。

在一种实施方式中,如图2所示,本实施例的方法可以根据用户权限,为用户开放不同的功能。该功能可以包括地理区域的层级或范围;分析目标的种类等。例如,在规划、交通、地产、零售等不同领域,用户关心的数据类型并不相同,通过权限设置,可以使不同用户使用不同功能。

在一个应用场景中,如图8所示,基于本实施例的时空分析方法,可以根据用户的不同需求(如城市规划、房地产、零售选址、政府管理),采集多种类型的时空数据,例如:兴趣点(pointofinterest,poi)数据、路况数据、定位数据和画像数据。通过多种ai技术对时空数据进行统计分析分类,获得不同类别的行业数据,例如:人口分布、人口画像、迁徙od、职住通勤、交通路况、用地识别、品牌分析和业态分析。

综上所述,本实施例的时空分析方法,可以从多个维度采集时空数据,并为不同层级的分析对象提供不同分析目标的结果;通过多种技术进行数据分析、存储、转储和可视化,可以为用户提供丰富的数据展现形式,方便用户深度理解时空数据;通过面向用户和功能点的权限设置,可以向不同行业开放不同能力的功能,提高不同行业对时空数据的理解。

图9示出根据本发明实施例的时空分析装置的结构框图。如图9所示,该装置可以包括:

采集模块10,用于从多个维度采集时空数据;

划分模块20,用于按照多个层级的地理区域对所述时空数据进行划分,得到每个地理区域所包括的时空数据;

分类模块30,用于按照多个分析目标对所述时空数据进行分类,得到每个分析目标所包括的时空数据;

分析模块40,用于按照所选择的地理区域和分析目标,对所述时空数据进行分析。

在一种实施方式中,划分模块20可以包括:

添加子模块21,用于按照预先划分的多个层级的地理区域,为所述时空数据添加对应的地理标签,每个地理区域具有对应的地理标签;

第一去重子模块22,用于对各地理区域所包括的时空数据进行去重处理。

在一种实施方式中,分析模块40可以包括:

第一分析子模块41,用于按照所述多个分析目标,对去重后的时空数据进行分类,得到每个分析目标所包括的时空数据。

在一种实施方式中,分析模块40可以包括:

获取子模块42,用于获取框选的地理区域;

划分子模块43,用于将所述框选的地理区域划分为多个预设大小的网格;

第二去重子模块44,用于对各网格所述包括的时空数据进行去重处理;

第二分析子模块45,用于按照所述框选的地理区域和所选择的分析目标,对所述框选的地理区域中的去重后的时空数据进行分析。

在一种实施方式中,所述分析目标包括常驻人口分析目标、职住分析目标、客流分析目标、人口流动分析目标、用地类型分析目标、od分析目标和交通分析目标中的多个。

在一种实施方式中,所述地理区域包括职能区域、街道区域、行政区域和自定义区域中的多个。

在一种实施方式中,本实施例的时空分析装置还可以包括:

第一可视化模块50,用于如果所选择的地理区域为所述多个层级的地理区域,则在所述地理区域的选择页面可视化展示分析后的时空数据;

第二可视化模块60,用于如果所选择的地理区域为框选的地理区域,则保存所述地理区域,并在新的页面可视化展示分析后的时空数据。

本发明实施例各装置中的各模块的功能可以参见上述方法中的对应描述,在此不再赘述。

图10示出根据本发明实施例的时空分析装置的结构框图。如图10所示,该装置包括:存储器1010和处理器1020,存储器1010内存储有可在处理器1020上执行的计算机程序。所述处理器1020执行所述计算机程序时实现上述实施例中的时空分析方法。所述存储器1010和处理器1020的数量可以为一个或多个。

该装置还包括:

通信接口1030,用于与外界设备进行通信,进行数据交互传输。

存储器1010可能包含高速ram存储器,也可能还包括非易失性存储器(non-volatilememory),例如至少一个磁盘存储器。

如果存储器1010、处理器1020和通信接口1030独立实现,则存储器1010、处理器1020和通信接口1030可以通过总线相互连接并完成相互间的通信。所述总线可以是工业标准体系结构(isa,industrystandardarchitecture)总线、外部设备互连(pci,peripheralcomponentinterconnect)总线或扩展工业标准体系结构(eisa,extendedindustrystandardcomponent)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图10中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。

可选的,在具体实现上,如果存储器1010、处理器1020及通信接口1030集成在一块芯片上,则存储器1010、处理器1020及通信接口1030可以通过内部接口完成相互间的通信。

本发明实施例提供了一种计算机可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述实施例中任一所述的方法。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。

流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施例所属技术领域的技术人员所理解。

在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(ram),只读存储器(rom),可擦除可编辑只读存储器(eprom或闪速存储器),光纤装置,以及便携式只读存储器(cdrom)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。

应当理解,本发明的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(pga),现场可编程门阵列(fpga)等。

本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。

此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读存储介质中。所述存储介质可以是只读存储器,磁盘或光盘等。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到其各种变化或替换,这些都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1