网格数据处理方法、装置、计算机设备和存储介质与流程

文档序号:17696375发布日期:2019-05-17 21:34阅读:276来源:国知局
网格数据处理方法、装置、计算机设备和存储介质与流程
本申请涉及计算机应用
技术领域
,特别是涉及一种网格数据处理方法、装置、计算机设备和存储介质。
背景技术
:在信息学中,网格是一种用于集成或共享地理上分布的各种资源,包括计算机系统、存储系统、通信系统、文件、数据库和程序等,使之成为有机的整体,共同完成各种所需任务的机制。目前人们研究空间上的人口或者资源分布等情况时,为方便地进行分析和可视化展示,多采用网格作为基本的分析单元,将人口或资源的属性置于网格中,并利用网格作为基本的分析单元。然而,目前的网格数据分析,存在分析准确性不高的问题。技术实现要素:基于此,有必要针对网格数据分析存在准确性不高的技术问题,提供一种网格数据处理方法、装置、计算机设备和计算机存储介质,能够提高网格数据处理的准确性。一种网格数据处理方法,所述方法包括:获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;根据莫兰指数进行显著性检验;将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。在其中一个实施例中,将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分之后,还包括:当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。在其中一个实施例中,将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分之后,还包括:当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。在其中一个实施例中,根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格的空间相关性,包括:根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。在其中一个实施例中,根据莫兰指数进行显著性检验,包括:根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;根据切比雪夫不等式,得到标准差;当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。在其中一个实施例中,在获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据之前,还包括:获取坐标原点的位置、网格的长度和网格的宽度;根据点的选择指令获取选取的点的位置;根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据。在其中一个实施例中,根据网格标识获取空间权重矩阵,包括:根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。一种网格数据处理装置,所述装置包括:获取模块,用于获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;分析模块,用于根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;检验模块,用于根据莫兰指数进行显著性检验;网格分配模块,用于将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;根据莫兰指数进行显著性检验;将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;根据莫兰指数进行显著性检验;将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。上述网格数据处理方法、装置、计算机设备和存储介质,通过网格数量、网格数据和空间权重矩阵得到莫兰指数,并进行显著性检验,将呈正空间自相关且通过显著性检验的第一网格作为板块的组成部分,使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性。附图说明图1为一个实施例中网格数据处理方法的应用环境图;图2为一个实施例中网格数据处理方法的流程示意图;图3为一个实施例中样本的某一区域的网格及网格数据示意图;图4为一个实施例中样本的某一区域的板块组成部分的示意图;图5为一个实施例中剔除第一网格后的网格及网格数据的示意图;图6为一个实施例中加入第二网格后的网格及网格数据的示意图;图7为一个实施例中剔除第一网格和加入第二网格后的网格及对应的网格数据的示意图;图8为一个实施例中网格标识的示意图;图9为一个实施例中网格数据处理装置的结构框图;图10为一个实施例中计算机设备的内部结构图。具体实施方式为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。本申请实施例中提供的网格数据处理方法,可以应用于如图1所示的应用环境中。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。在一个实施例中,如图2所示,提供了一种网格数据处理方法,以该方法应用于图1中的终端为例进行说明,包括以下步骤:步骤202,获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据。其中,网格标识是指为区分网格所作的标识,可由数字、字母或符号中的一种或多种形成。空间权重矩阵可根据网格是否相邻或者网格之间的距离来确定。网格数据是指可根据网格划分的数据,也是网格对应的属性值。例如,网格数据可用于商圈和街区等的划分,也可以是人口数量、国内生产总值、动物数量、植物数量和建筑数量等但不限于此。具体地,终端获取样本的网格总数量,并根据网格标识对应的网格之间的位置关系或者网格之间的距离获取空间权重矩阵,终端获取网格标识对应的网格数据。步骤204,根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性。其中,莫兰指数是指一种空间相关性的度量方式,可视为属性值与其空间之后的相关系数,取值范围为[-1,+1],+1表示完全正空间相关,-1表示完全负空间自相关,为0表示空间呈随机性。莫兰指数包括全局莫兰指数和局部莫兰指数,全局莫兰指数主要用来分析整个研究区域的空间自相关程度,局部莫兰指数用来计算每一个空间单元与邻近单元就某一属性的相关程度,本申请实施例中以局部莫兰指数为例。空间相关性指的是网格的属性值即网格数据在空间上相关,或者网格数据的相关性是由网格的地理次序或地理位置造成的,目的是确定网格数据是否在空间上相关,其相关程度如何,包括正空间自相关、负空间自相关和不相关。具体地,终端根据样本的网格数量,网格标识对应的网格数据和空间权重矩阵得到每个网格标识对应的网格的莫兰指数,并根据莫兰指数的值分析每个网格数据的空间相关性。步骤206,根据莫兰指数进行显著性检验。其中,显著性检验是指事先对网格数据或网格的分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否有显著性差异。具体地,终端根据莫兰指数对每一个网格标识对应的网格数据进行显著性检验,避免当莫兰指数呈空间正相关时,网格数据之间的空间相关性呈虚假相关。步骤208,将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。其中,正空间自相关是指如果网格数据随着测定距离的缩小而变得更相似,那么该网格数据呈正空间自相关,也可以指莫兰指数的值为正的情况;也表示较大的网格数据都聚集在一起,或者较小的网格数据都聚集在一起,例如高于平均网格数据的网格数据为较大的网格数据,低于平均网格的网格数据为较小的网格数据。具体地,终端将莫兰指数的值为正的网格数据对应的第一网格作为板块的组成部分。即,板块是由呈正空间自相关且通过显著性检验的网格数据对应的第一网格构成的。本实施例中,呈正空间自相关且通过显著性检验的网格数据,表示该网格数据为高值网格数据且被其他高值网格数据包围;或者表示该网格数据为低值网格数据且被其他低值网格数据包围。其中,高值网格数据表示网格数据大于平均网格数据,低值网格数据表示网格数据小于平均网格数据。本实施例中,如图3所示,图3为样本的某一区域的网格及网格数据示意图。其中每个长方形代表一个网格,长方形中的数字代表网格数据,为原始的网格及网格数据展示。当将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分时,如图4所示,图4为一个实施例中样本的某一区域的板块组成部分的示意图,其中采用加粗和下划线的方式展示的网格数据为呈正空间自相关并且通过显著性检验的网格数据,对应的长方形框为第一网格,那么加粗和下划线展示的网格数据对应的第一网格则作为板块的组成部分。上述网格数据处理方法中,通过网格数量、网格数据和空间权重矩阵得到莫兰指数,并进行显著性检验,将呈正空间自相关且通过显著性检验的第一网格作为板块的组成部分,使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性。在一个实施例中,将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分之后,还包括:当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。其中,预设数量可以小于或等于与第一网格的相邻网格数量。具体地,当与第一网格相邻的第二网格的数量达到预设数量时,终端将第一网格从板块的组成部分中剔除。其中,第二网格为未通过显著性检验的网格数据对应的网格。本实施例中,如图5所示,为一个实施例中剔除第一网格之后的网格及网格数据的示意图。其中每个长方形代表一个网格,长方形中的数字代表网格数据,采用加粗和下划线的方式展示的网格数据为呈正空间自相关并且通过显著性检验的网格数据,对应的长方形框为第一网格。与图4中的示意图相比,图5的第11行第5列的网格为从板块的组成部分中剔除的网格。该网格对应的网格数据为143,与第11行第5列的网格相邻的未通过显著性检验的网格数据对应的网格也达到了预设数量。上述网格数据处理方法中,当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,能减少零散的板块,使板块的边界更加清楚,能使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性。在一个实施例中,将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分之后,还包括:当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。其中,预设数量可以小于或等于与第二网格的相邻网格数量。平均网格数据是指样本内的所有网格数据的平均值。第二网格为未通过显著性检验的网格数据对应的网格。具体地,当与未通过显著性检验的网格数据对应的网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据和第一网格的网格数据均高于平均网格数据,或者第二网格的网格数据和第一网格的网格数据均低于平均网格数据时,将第二网格作为板块的组成部分,即将第二网格加入板块中。其中,可用颜色、阴影和标记等区分第二网格数据和第一网格数据均高于平均网格数据的板块和第二网格数据和第一网格数据均低于平均网格数据的板块。本实施例中,如图6所示,图6为一个实施例中加入第二网格后的网格及网格数据的示意图。其中,图6中采用加粗和下划线的方式展示的网格数据为呈正空间自相关并且通过显著性检验的网格数据,对应的长方形框为第一网格,加粗斜体的网格数据对应的网格为第二网格。已知样本的网格数据的平均值为1097。与图4相比,其中第5行第8列的网格、第5行第9列的网格、第7行第9列的网格、第7行第10列和第8行第10列的网格均为加入板块的第二网格。并且,与第二网格相邻的第一网格的数量已达到预设数量,且第5行第8列的网格数据、第5行第9列的网格数据、第7行第9列的网格数据、第7行第10列的网格数据和第8行第10列的网格和相邻的第一网格的网格数据均高于平均网格数据1097。上述网格数据处理方法中,当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,能增加与第一板块有较多相似特征的第二板块,使板块的边界更加清楚,避免当使用板块进行其他数据分析时的繁琐计算,也能提高网格数据分析的准确性。在一个实施例中,如图7所示,图7为一个实施例中剔除第一网格和加入第二网格后的网格及对应的网格数据的示意图。其中,图7中采用加粗和下划线的方式展示的网格数据为呈正空间自相关并且通过显著性检验的网格数据,对应的长方形框为第一网格,加粗斜体的网格数据对应的网格为第二网格。与图4相比,剔除的第一网格为第11行第5列的网格。则通过剔除第一网格和加入第二网格,能将特点相同的板块聚集在一起,在进行其他数据分析时,能提高分析的准确性。在一个实施例中,根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格的空间相关性,包括:根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。其中,预设阈值可以是0至1中的任意值。具体地,终端根据网格数量、网格数据和空间权重矩阵确定每个网格标识对应的网格的局部莫兰指数,局部莫兰指数可用如下公式计算:其中,n为网格数量,wij是指空间权重矩阵内的各个元素或者行标准化后的空间权重矩阵内的各个元素,i为当前计算的网格对应的网格标识,zi为网格i对应的网格数据,j为区域内其他网格对应的网格标识,zj为区域内其他网格对应的网格数据,为样本内网格数据的平均值。当网格的局部莫兰指数大于预设阈值时,终端确定网格数据呈正空间自相关。上述网格数据处理方法中,根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关,则高值网格与高值网格聚集在一起,低值网格与低值网格聚集在一起,能使板块的边界更加清楚,板块内部的差异较小,提高网格数据分析的准确性。在一个实施例中,根据莫兰指数进行显著性检验,包括:根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;根据切比雪夫不等式,得到标准差;当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。其中,切比雪夫不等式是指任意分布形态的数据集中,至少有(1-1/s2)的数据位于平均数s个标准差内,其中s为大于1的任意正数。具体地,终端根据莫兰指数的期望值和莫兰指数的方差,计算得出检验统计量的观察值。终端再根据切比雪夫不等式,得到标准差,即s值。终端将统计量观察值与标准差进行对比,当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。本实施例中,统计量观察值可用如下公式计算:其中,莫兰指数的期望值为:方差为:v[ii]=e[ii2]-e2[ii]=a+b-e2[ii]其中,ii为莫兰指数,n为网格的数量,i为当前计算的网格对应的网格标识,j为样本中其余网格的标识,zi为网格i对应的网格数据,为样本中网格数据的平均值,k和h是两个参数,都为取值范围为1至n的自然数。原假设为网格i对应的网格数据不存在空间自相关,则在选定的显著性水平下,例如0.01和0.05等,本实施例中采用0.05作为选定的显著性水平,根据小概率事件在一次试验中基本不发生为原则,利用检验统计量观察值及切比雪夫不等式来决定是否接受原假设。若观察值位于接受域,则接受原假设,网格i对应的网格数据不存在空间自相关;若观察值位于拒绝域,则拒绝原假设,网格i对应的网格数据通过显著性检验。那么根据切比雪夫不等式,则有1-1/s2=1-0.05,则|s|约为4.5。当统计量观察值的绝对值大于4.5时,观察值位于拒绝域,网格i对应的网格数据通过显著性检验。上述网格数据处理方法中,通过比对检验量观察值的绝对值与切尔夫不等式的标准差进行显著性检验,能检测出网格数据之间的差异是否由抽样或者偶然的因素且是否存在虚假相关,那么不通过显著性检验的网格不作为板块的组成部分,能提高网格数据分析的准确性,避免偶然情况发生。在一个实施例中,在获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据之前,还包括:获取坐标原点的位置、网格的长度和网格的宽度;根据点的选择指令获取选取的点的位置;根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据。其中,坐标原点的位置可以是任意一点的位置,例如可以是定位点的经纬度,也可以是随机获取的某一点的经纬度。网格的长度和网格的宽度也可以根据终端的设定进行修改。具体地,终端获取坐标原点的位置、网格的长度和网格的宽度,则可以划分出整个样本中的各个网格。终端再获取点的选择指令,根据点的选择指令获取选取的点的位置,即当前在终端选择的网格。终端根据坐标原点的位置、网格的宽度和选取的点的位置,例如选取点的经纬度,确定当前网格的网格标识。其中,该网格标识配置有对应的网格数据。本实施例中,在预设的区域内选取一点作为坐标原点,网格的长度为l,宽度为r,单位为米,其中l和r的值可以相同,也可以不同。例如网格长度为250m,宽度也为250m。设网格标识为xayb格式,则有如下表达式:其中,lng1为坐标原点的经度、lat1为坐标原点的纬度、lnga为选取点坐标的经度、latb为选取点坐标的纬度。本实施例中,当确定了当前网格标识之后,还可以得出当前网格标识的相邻网格。例如,计算网格xayb的相邻网格的方法为:x编号相同,y编号加减1,即网格标识为xayb-1、xayb+1;y编号相同,x编号加减1,即网格标识为xa-1yb、xa+1yb;x、y编号同时加1或减1,即网格标识为xa-1yb-1、xa+1yb+1;x编号加1,y编号减1,即网格标识为xa+1yb-1;x编号减1,y编号加1,即网格标识为xa-1yb+1。如图8所示,图8为一个实施例中网格标识的示意图,其中,图中的长方形框代表一个网格,xayb等文字部分为网格标识。上述网格数据处理方法中,根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据,能使网格划分方法灵活多变,也能自定义网格的大小,更加方便快捷地确定网格标识和网格数据。在一个实施例中,根据网格标识获取空间权重矩阵,包括:根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。具体地,终端根据网格标识对应的网格之间的位置关系确定空间权重矩阵。当两个网格相邻时,即有共同的边界或者顶点时,空间权重矩阵中两个网格对应的权重为1;当两个网格不相邻时,空间权重矩阵中两个网格对应的权重为0。例如网格标识为1的网格与网格标识为2的网格相邻,网格标识为1的网格与网格标识为4的网格有共同的顶点,而网格标识为1的网格与网格标识为3的网格不是相邻网格的位置关系,则网格1与网格2、网格1与网格4相邻,而网格1与网格3不相邻,根据位置关系确定空间权重矩阵。或者,终端根据网格标识对应的网格之间的距离是否满足预设距离从而确定空间权重矩阵。例如当两个网格之前的距离小于预设距离时,两个网格对应的空间权重矩阵为1;当两个网格之间的距离大于预设距离时,两个网格对应的空间权重矩阵为0。终端可对得到的空间权重矩阵进行行标准化,则行标准化后的空间权重矩阵内元素为其中,w0ij指的是原空间权重矩阵内的各个元素。本实施例中,以最简单的空间权重矩阵,即邻接矩阵为例,并以9个网格为例,分为3行3列,则有网格1网格2网格3网格4网格5网格6网格7网格8网格9对应的空间权重矩阵为010110000101111000010011000110010110111101111011010011000110010000111101000011010上述网格数据处理方法中,根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵,能消除在样本边缘的网格缺少相邻网格的数量的影响,提高网格数据分析的准确性。在一个实施例中,网格数据处理方法,包括以下步骤:步骤(a1),获取坐标原点的位置、网格的长度和网格的宽度。步骤(a2),根据点的选择指令获取选取的点的位置。步骤(a3),根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,网格标识配置有对应的网格数据。步骤(a4),获取网格数量和网格标识对应的网格数据。步骤(a5),根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;步骤(a6),对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。步骤(a7),根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数。步骤(a8),当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。步骤(a9),根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;步骤(a10),根据切比雪夫不等式,得到标准差;步骤(a11),当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。步骤(a12),将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为块的组成部分。步骤(a13),当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。步骤(a14),当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。虽然上述步骤(a1)至步骤(a14)是按照标号依次显示,但是这些步骤并不是必然按照标号指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。上述网格数据处理方法中,网格划分方法灵活多变,能自定义网格的大小,更加方便快捷地确定网格标识和网格数据;得到行标准化后的空间权重矩阵,能消除在样本边缘的网格缺少相邻网格的数量的影响;通过比对检验量观察值的绝对值与切尔夫不等式的标准差进行显著性检验,能检测出网格数据之间的差异是否由抽样或者偶然的因素且是否存在虚假相关,避免偶然情况发生;通过网格数量、网格数据和空间权重矩阵得到莫兰指数,并进行显著性检验,将呈正空间自相关且通过显著性检验的第一网格作为板块的组成部分,使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性;将第一网格从板块的组成部分中剔除,能减少零散的板块,使板块的边界更加清楚,能使满足条件的网格聚集在一起成为板块;将第二网格作为板块的组成部分,能增加与第一板块有较多相似特征的第二板块,避免当使用板块进行其他数据分析时的繁琐计算。应该理解的是,虽然图2的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。在一个实施例中,如图9所示,提供了一种网格数据处理装置,包括:获取模块902、分析模块904、检验模块906和网格分配模块908,其中:获取模块902,用于获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据。分析模块904,用于根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性。检验模块906,用于根据莫兰指数进行显著性检验。网格分配模块908,用于将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。上述网格数据处理装置中,通过网格数量、网格数据和空间权重矩阵得到莫兰指数,并进行显著性检验,将呈正空间自相关且通过显著性检验的第一网格作为板块的组成部分,使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性。在一个实施例中,网格分配模块908还用于当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。上述网格数据处理装置中,当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,能减少零散的板块,使板块的边界更加清楚,能使满足条件的网格聚集在一起成为板块,则板块内部的差异较小,能提高网格数据分析的准确性。在一个实施例中,网格分配模块908还用于当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。上述网格数据处理装置中,当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,能增加与第一板块有较多相似特征的第二板块,使板块的边界更加清楚,避免当使用板块进行其他数据分析时的繁琐计算,也能提高网格数据分析的准确性。在一个实施例中,分析模块904用于根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。上述网格数据处理装置中,根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关,则高值网格与高值网格聚集在一起,低值网格与低值网格聚集在一起,能使板块的边界更加清楚,板块内部的差异较小,提高网格数据分析的准确性。在一个实施例中,检验模块906用于根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;根据切比雪夫不等式,得到标准差;当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。上述网格数据处理装置中,通过比对检验量观察值的绝对值与切尔夫不等式的标准差进行显著性检验,能检测出网格数据之间的差异是否由抽样或者偶然的因素且是否存在虚假相关,那么不通过显著性检验的网格不作为板块的组成部分,能提高网格数据分析的准确性,避免偶然情况发生。在一个实施例中,该网格数据处理装置还包括数据准备模块,数据准备模块用于获取坐标原点的位置、网格的长度和网格的宽度;根据点的选择指令获取选取的点的位置;根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据。上述网格数据处理装置中,根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据,能使网格划分方法灵活多变,也能自定义网格的大小,更加方便快捷地确定网格标识和网格数据。在一个实施例中,获取模块902用于根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。上述网格数据处理装置中,根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵,能消除在样本边缘的网格缺少相邻网格的数量的影响,提高网格数据分析的准确性。关于网格数据处理装置的具体限定可以参见上文中对于网格数据处理方法的限定,在此不再赘述。上述网格数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种网格数据处理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:一种网格数据处理方法,所述方法包括:获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;根据莫兰指数进行显著性检验;将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。在一个实施例中,处理器执行计算机程序时还实现以下步骤:当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。在一个实施例中,处理器执行计算机程序时还实现以下步骤:当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;根据切比雪夫不等式,得到标准差;当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。在一个实施例中,处理器执行计算机程序时还实现以下步骤:获取坐标原点的位置、网格的长度和网格的宽度;根据点的选择指令获取选取的点的位置;根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据。在一个实施例中,处理器执行计算机程序时还实现以下步骤:根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:获取网格数量,并根据网格标识获取空间权重矩阵和网格标识对应的网格数据;根据网格数量、网格数据和空间权重矩阵得到网格标识对应的网格的莫兰指数,并分析网格数据的空间相关性;根据莫兰指数进行显著性检验;将呈正空间自相关且通过显著性检验的网格数据对应的第一网格作为板块的组成部分。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当与第一网格相邻的第二网格的数量达到预设数量时,将第一网格从板块的组成部分中剔除,其中,第二网格为未通过显著性检验的网格数据对应的网格。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:当与第二网格相邻的第一网格的网格数量达到预设数量,且第二网格的网格数据与第一网格的网格数据均高于或均低于平均网格数据时,将第二网格作为板块的组成部分,其中,第二网格为未通过显著性检验的网格数据对应的网格。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据网格数量、网格数据和空间权重矩阵确定网格标识对应的网格的局部莫兰指数;当网格的局部莫兰指数大于预设阈值时,确定网格数据呈正空间自相关。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据莫兰指数的期望值和莫兰指数的方差,得到统计量观察值;根据切比雪夫不等式,得到标准差;当统计量观察值的绝对值大于标准差时,确定网格数据通过显著性检验。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:获取坐标原点的位置、网格的长度和网格的宽度;根据点的选择指令获取选取的点的位置;根据坐标原点的位置、网格长度、网格的宽度和选取的点的位置确定网格的网格标识,该网格标识配置有对应的网格数据。在一个实施例中,计算机程序被处理器执行时还实现以下步骤:根据网格标识对应的网格之间的位置关系,或者网格标识对应的网格之间的距离确定空间权重矩阵;对空间权重矩阵进行行标准化,得到行标准化后的空间权重矩阵。本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1