地理信息系统联机分析数据模型与属性数据关联方法

文档序号:6619038阅读:487来源:国知局
专利名称:地理信息系统联机分析数据模型与属性数据关联方法
技术领域
本发明涉及地理信息系统,尤其涉及地理信息系统联机分析数据模型与属性数据关联方法。
地理数据地理数据分为两种,空间数据和属性数据。
空间数据也称之为几何数据,它用来表现地理空间实体的位置、大小、形状、方向以及拓扑几何关系。
属性数据也称之为非空间数据,它用来描述与地理实体相联系的地理特征。
GIS作为一种信息系统,是以现实世界为研究目标,以计算机内部的二进制数字世界作为存储载体的。它将人们对于客观世界的理解,经过一系列处理后变成数字形式储存于计算机之中。
现实世界极其复杂,一方面人们希望GIS包含充足的数据,另一方面又期望从中能方便地选择所需要的相关数据而撇开其它不需要的数据(Freksa andBarkowsky,1996)。这就要求人们以一种高效的数据组织方式,将两方面的要求兼顾,既尽可能地包含信息(包括对未来潜在有用的信息),又能方便快速地选取所需数据。在这其中,人们对于客观世界的理解及其表达——GIS的空间数据模型(概念、逻辑和物理模型)起着至关重要的作用。目前两种比较典型的空间数据模型是拓扑关系数据模型和面向实体的数据模型。
早期的商品化GIS软件大都采用了以“结点—弧段—多边形”拓扑关系为基础的数据模型,我们称这种数据模型为拓扑关系数据模型。如Arc/Info软件。
拓扑关系数据模型以拓扑关系为基础组织和存储各个几何要素,其特点是以点、线、面间的拓扑连接关系为中心。该模型的主要优点是数据结构紧凑,拓扑关系明晰,系统中预先存储的拓扑关系可以有效提高系统在拓扑查询和网络分析方面的效率。
拓扑关系数据模型的具体组织和存储1)8.0版以前的Arc/Info将位置坐标数据存放在文件系统中,而将拓扑属性存放在关系数据库系统的二维表格中;2)另一些软件将坐标数据和拓扑关系都存放在关系数据库的各种表格中,一条记录对应一个点、线或面类型的几何要素(不一定为完整独立的地理要素)。
与上述拓扑模型相反,面向实体空间数据模型是以独立、完整、具有地理意义的实体为基本单位对地理空间进行表达。该模型能够很好地克服拓扑关系数据模型的几个缺点,具有实体管理、修改方便,查询检索、空间分析容易的优点,更重要的是它能够方便地构造用户需要的任何复杂地理实体,而且这种模式符合人们看待客观世界的思维习惯,便于用户理解和接受。同时,面向实体的数据模型自然地具有系统维护和扩充方便的优点。例如MapInfo、Intergraph等。
面向实体空间数据模型的具体组织和存储1)可将实体的坐标数据和属性数据(如建立了部分拓扑,拓扑关系也放在表中保存)分别存放在文件系统和关系数据库中。
2)也可以将二者统一存放在关系数据库中。
属性数据是用来描述与地理实体相联系的地理特征。可以理解为没有显式空间特征的数据,但这些数据与空间地理实体有着紧密的联系,可以通过某种机制联系在一起的。这也正是地理信息系统(GIS)的基础与精髓所在。
一般来说,属性数据采用的是传统数据模型,即层次、网状和关系数据模型,其中层次和网状数据模型仅有少数用户在使用,绝大多数用户和数据库厂商采用的是占主流的关系型数据模型。在GIS领域,属性数据大都存储在关系数据库中,同时,关系数据库又为GIS提供了比较完备的数据索引方法和信息查询手段。
目前流行的空间数据与属性数据的关联方式地理数据的组织与管理是建立GIS系统的重要步骤。其中,最为关键的是如何将空间数据与属性数据融为一体,也就是空间数据与属性数据的关联问题。
目前大多数现行系统都是将空间数据和属性数据分开存储,分别用文件和数据库来管理,通过公共项(一般定义为地物标识码)来连接,即在空间数据库和属性数据库中建立公共字段,如地块码、门牌号等,来建立空间数据和属性数据关联,从而实现空间数据和属性数据的互相查询。具体来说,现阶段流行的空间数据和属性数据的关联方式有三种1)混合型2)集成型3)面向对象型混合型关联方式混合型(Hybrid Data Model)关联方式是目前最广泛、最流行、且最成功的空间数据和属性数据关联的数据模型,它采用文件形式来存储地理空间数据及其拓扑关系数据,采用通用关系数据库RDBMS来存储、管理属性数据,两者之间通过一个唯一的标识码来建立它们的互联关系。
集成型关联方式集成型(Integrated Data Model)也称之为综合型,它是一种纯关系型数据模型,无论是空间数据,还是属性数据都采用关系数据库的表来存储(可以将空间数据和属性数据存放在一起,也可以分空间数据和属性数据分别独立存放),两者之间通过使用标准关系连接机制来建立关联关系。
面向对象的关联方式面向对象型(Object-oriented Data Model)是对集成型的扩展[6],它对地理对象的属性数据和对这些属性数据进行操作的方法进行统一建模,并永久存储。它有两种趋势一是建造纯面向对象数据存储,二是在关系数据库基础上建立存储对象机制。
下面描述现有空间数据模型的缺陷。
拓扑关系空间数据模型的缺陷1)对单个地理实体的操作效率不高由于拓扑数据模型面向的是整个空间区域,强调的是各几何要素之间的连接关系,在另一方面对具有完整、独立意义的地理实体作为个体存在的事实没有足够的重视,因此增加、删除、修改某一地理实体时,将会牵涉到一系列文件和关系数据库表格,这样不仅使程序管理工作变得复杂,而且会降低系统的执行效率。
2)难以表达复杂的地理实体复杂地理实体由多个简单实体组合而成,拓扑数据模型的整体组织特性注定了它不可能有效地表达这一由多个独立实体构成的有机集合体。
3)难以实现快速查询和复杂的空间分析由于在拓扑数据模型中,地理实体被分解为点、线、面基本几何要素存储在不同的文件和关系表中,因而凡涉及到独立地理实体的操作、查询和分析都将花费较多的CPU时间,在大区域的复杂空间分析方面表现尤为明显。
4)局部更新困难,系统难于维护与扩充由于地理空间的数据组织和存储是以基本几何要素(点、弧段和多边形)为单元进行的,系统中存储的复杂拓扑关系是GIS工作的数据基础,当局部一些实体发生变动时,整层拓扑关系将不得不随之重建,因而这样的系统在维护和扩充方面需要更多的精力,并且容易出错。
面向实体空间模型的缺陷虽然,面向对象空间数据模型是目前流行GIS软件采用的新数据模型,但这种数据模型也存在很大的缺陷,具体表现为1)拓扑关系需临时构建由于面向实体的数据模型是以地理实体为中心的,并未以拓扑关系为基础组织、存储地理实体,表达地理空间,因此拓扑关系并不是一开始就存在,而是在需要时才临时导出各种拓扑关系,这需要消耗一定的系统资源和时间。
2)动态分段、网络分析效率降低面向实体的数据模型由于要根据需要临时构建拓扑关系,会使拓扑查询和分析的效率降低。
根据本发明的上述目的,本发明的地理信息联机分析数据模型包括空间数据文件,用于存储基本实体对象的空间关系,并且,在所述空间数据文件末尾加入有辅助信息,所述辅助信息包括对空间数据的投影、连接、分组等预处理结果以及由此产生新的空间关系;属性数据文件,用于存储属性数据,该属性数据文件包含视图集,通过对属性数据进行分析、分类、建立临时索引等处理而建立;二维关系表,用于表示所述空间数据文件中的辅助信息与所述属性数据中的视图集的至间关系与网络关系。
在GISOLAP数据模型中,实体对象是数据模型的基础,它是对地理实体的抽象,并且都是自包含的。
在GISOLAP数据模型中,基本实体对象的空间关系存储在空间数据文件中。但不同的是,在空间数据文件末尾加入了辅助信息,这些辅助信息包括对空间数据的投影、连接、分组等预处理结果以及由此产生新的空间关系(如拓扑关系)。这样既克服了空间实体模型重复存储公共结点造成数据冗余的缺点,而且大大改善了拓扑关系模型的脆弱性。(这里脆弱性指的是当数据修改时,原先的拓扑关系就被破坏,必须重建拓扑关系才能进行空间分析)在GISOLAP数据模型中,属性数据针对OLAP可能的查询情况预先进行分析、分类、建立临时索引等处理,建立了许多“视图集”(materialized view),结合这些“视图集”,系统可以加速完成空间数据和属性数据的双向查询及空间分析操作。
在GISOLAP数据模型中,空间数据末尾的辅助信息和属性数据中的“视图集”相连接,以二维关系表的形式来表示复杂的空间关系和网络关系,当用户进行空间分析或查询时,系统就会先扫描这些二维关系表来快速捕捉空间关系和网络关系,在最短时间内提供给用户准确的查询和分析结果。
下面先描述GISOLAP与属性数据在混合型关联方式中的技术实现。
混合型以ArcInfo(显式保存拓扑关系)和MapInfo(隐式保存拓扑关系)为代表,虽然这种模式可以较好地处理地理实体数据,并且具有合理的访问机制和较为高效的空间分析能力,但面对日益增多的海量数据以及人们对信息数量和质量要求的日益提高,这种模式在数据冗余、数据完整性、数据维护与更新以及处理效率等方面表现出了不足。
采用GISOLAP数据模型可以较好地解决这些不足之处。如

图1所示,坐标、地形文件等空间信息存储在二进制的空间数据文件中,属性信息存储在关系型数据库中的属性表中,二者通过标示码MAPIDD连接。但不同的是,空间数据与属性数据又增加了关联的通道,一是通过空间数据的辅助信息而产生的一系列视图集,二是通过地理实体对象的自包含特征,即地理实体可由称为对象类的多边形说明,并给出每个多边形的属性和特征(Michael N.Demers,2000)。这样,空间数据与属性数据的连接通道更为宽敞,互查速度明显提高。
混合型关联方式基于以下认识虽然图形数据结构和模型足以处理实体数据,但由于不能进行复杂的运算,所以在处理属性数据时就不那么卓有成效了(MichaelN.DeMers,2000)。相反,数据库管理系统善于处理属性数据,但对图形实体就显得异常困难了。如果将两种技术通过软件相融合,就会在两方面都得到增强。
要实现这样的融合,需要将表示图形的坐标和地形数据存储为独立文件,将属性表独立存储在商业数据库管理系统(DBMS)中,通过标识码(如多边形标识码)就可以实现其连接。
混合型以ArcInfo(显式保存拓扑关系)和MaoInfo(隐式保存拓扑关系)为代表,虽然这种模式可以较好地处理地理实体数据,并且具有合理的访问机制和较为高效的空间分析能力,但面对日益增多的海量数据以及人们对信息数量和质量要求的日益提高,这种模式在数据冗余、数据完整性、数据维护与更新以及处理效率等方面表现出了不足。
采用GISOLAP数据模型可以较好地解决这些不足之处。
GISOLAP数据模型的应用框架图如图1所示。
说明1)坐标文件由经纬度坐标(x,y)经过地图投影变换转换为地图投影坐标,然后进行二维笛卡尔坐标转换,最终以顺序文件方式来存储;如......P1143,256;P2157,298;P3176,268......
2)地形文件由大地控制点的标识信息、精度、坐标、高程等信息组成的文件如
......H1level3,0.04m,1982;H2level4,0.07m,1975;......
3)地块现实的地理实体;多边形等即用来表示地理实体的几何要素,其中多边形是最重要的一类数据(韦中亚,2000),多用于表示行政区、土地类型等;4)辅助信息即对空间数据进行投影、连接、分组等预处理操作的结果信息;5)属性表即用于存储地理实体的属性描述信息的表。如

正如图1所示,坐标、地形文件等空间信息存储在二进制的空间数据文件中,属性信息存储在关系型数据库中的属性表中,二者通过标示码MAPIDD连接。但不同的是,空间数据与属性数据又增加了关联的通道,一是通过空间数据的辅助信息而产生的一系列视图集,二是通过地理实体对象的自包含特征,即地理实体可由称为对象类的多边形说明,并给出每个多边形的属性和特征(Michael N.Demers,2000)。这样,空间数据与属性数据的连接通道更为宽敞,互查速度明显提高。
下面以地图定位(即由属性数据→空间位置)为例,详细说明如下将业务数据正确体现到地图的相应地理位置上。即当用户选择了业务表并得到该表的一个或多个信息之后,通过一定的编码规则,将编码与地图编码进行比较,当二者相同时,进行定位。
编码规则如下1.门牌号IDD=路段号(6位)+弄号(4位)+门牌号(4位);2.段、居委IDD=警署编号(10位)+段号或居委号(2位)。
所涉及到的业务数据表DWJBQK(即单位基本情况业务表)、RK_WJRK(即境外人口业务表)等等。
相关的控制表GIS_IDD_ALLHH(即MAPIDD与HH对应参照表)。表结构如下

其中PCSBH——派出所编号;HH——户号;HHLDH——路段号;HHXZ——详址;HHNH——弄号;HHMPH——门牌号;MAPIDD——标示码。
GISOLAP与属性数据在集成型关联方式中的技术实现集成数据模型的优点在于具有了关系数据库查询、检索以及数据完整性等一系列机制,可利用大二进制数据类型(BLOBS)存储可变长的空间数据[9],但同时存在用户不能自定义数据字段、缺乏空间SQL等缺点。
采用GISOLAP数据模型可以较好地解决这些不足之处。如图3所示,地理实体的空间数据和属性数据均由关系型数据库管理系统RDBMS来管理,系统充分利用RDBMS(如Oracle)的数据挖掘功能,根据OLAP可能的查询预先生成一系列视图集,这些视图集和OLAP的辅助信息共同组成快速空间分析的基础。
集成型关联方式与数据库系统结合得比混合型更为紧密,它将坐标数据存放为相关表,地形数据存放在同一库中的另一个表中(如图2所示)。属性数据可以与空间数据一起存放,也可以独立存放,通过相关连接访问(Healey,1991)。
集成型关联方式的优点在于具有了关系数据库查询、检索以及数据完整性等一系列机制,可利用大二进制数据类型(BLOBS)存储可变长的空间数据,但同时存在用户不能自定义数据字段、缺乏空间SQL等缺点。
采用GISOLAP数据模型可以较好地解决这些不足之处。
GISOLAP数据模型的应用框架图如图3所示。
其中空间信息表中,存储的是记录地块的多边形信息,包括标识号、弧段排列等位置信息;后面的分组信息、连接信息即上述辅助信息。
属性信息表中存储的是空间信息所对应的描述信息,视图集是利用RDBMS的数据挖掘功能所产生的索引信息,如图4
拓扑关系,即点(结点)、线(弧段)、面(多边形)之间的关联关系,在上图中“多边形——弧段”拓扑关系表(如下表所示)定义了多边形的空间特征拓扑关系;

正如图中所示,地理实体的空间数据和属性数据均由关系型数据库管理系统RDBMS来管理,系统充分利用RDBMS(如Oracle)的数据挖掘功能,根据OLAP可能的查询预先生成一系列视图集,这些视图集和OLAP的辅助信息共同组成快速空间分析的基础。
下面以点图查询(即由空间位置→属性数据)为例,详细说明如下点图查询实现的是通过点击图中某个区域,查询到业务数据的一种方法。即当用户点击某个区域或地块的某个点,显示给用户的是该点的属性信息。
编码规则如下1.门牌号IDD=路段号(6位)+弄号(4位)+门牌号(4位);2.段、居委IDD=警署编号(10位)+段号或居委号(2位)。
所涉及到的业务数据表DWJBQK(即单位基本情况业务表)、RK_WJRK(即境外人口业务表)等等。
相关的控制表GIS_IDD_ALLHH(即MAPIDD与HH对应参照表)。表结构如下其中

HH——户号;HHLDH——路段号;HHXZ——详址;HHNH——弄号;HHMPH——门牌号;MAPIDD——标示码。
GISOLAP与属性数据在面向对象关联方式中的技术实现面向对象数据模型是一种新型的GIS技术,虽然被人们看好,但就目前来说,还存在认识方面的分歧[10],处在进一步研究阶段。众恒公司根据开发PSGIS系统的实践,提出了GISOLAP数据模型在面向对象关联方式中的解决方案。如图5。
如图5所示,地理实体是一种对象,每个对象被认为是集合的一员,对象的每一类属于更高一级的类并继承其特性(如对象-多边形类-多边形1...)。空间数据与属性数据的关联通过联机分析OLAP来实现空间数据末尾的辅助信息和属性数据中的“视图集”相连接,并以二维关系表的形式来存储,用它表示复杂的空间关系和网络关系;当用户进行空间分析或属性查询时,系统就会先扫描这些二维关系表来快速捕捉空间关系和网络关系,在最短时间内将查询结果在空间数据集合、属性数据集合中定位,然后提供给用户准确的查询和分析结果。
本发明是将数据仓库技术与OLAP技术引入到GIS的数据模型中,实现GIS的联机分析并加强GIS对海量数据的分析功能,从而拓宽了GIS的研究领域。
GISOLAP数据模型充分利用了现有完善的大型数据库技术和先进的面向对象思想,加宽了空间数据与属性数据关联的通道,充分发挥了GIS的空间分析功能,提高了处理效率。
权利要求
1.一种地理信息联机分析数据模型包括空间数据文件,用于存储基本实体对象的空间关系,并且,在所述空间数据文件末尾加入有辅助信息,所述辅助信息包括对空间数据的投影、连接、分组等预处理结果以及由此产生新的空间关系;属性数据文件,用于存储属性数据,该属性数据文件包含视图集,通过对属性数据进行分析、分类、建立临时索引等处理而建立;二维关系表,用于表示所述空间数据文件中的辅助信息与所述属性数据中的视图集的空间关系与网络关系。
全文摘要
本发明提供一种地理信息联机分析数据模型与属性数据关联方法。所述数据模型包括空间数据文件,用于存储基本实体对象的空间关系,并且,在所述空间数据文件末尾加入有辅助信息,所述辅助信息包括对空间数据的投影、连接、分组等预处理结果以及由此产生新的空间关系;属性数据文件,用于存储属性数据,该属性数据文件包含视图集,通过对属性数据进行分析、分类、建立临时索引等处理而建立;二维关系表,用于表示所述空间数据文件中的辅助信息与所述属性数据中的视图集的空间关系与网络关系。
文档编号G06F19/00GK1435790SQ0211069
公开日2003年8月13日 申请日期2002年1月30日 优先权日2002年1月30日
发明者高建强, 王占宏, 金笑天, 黎治华, 范大凯 申请人:上海众恒信息产业有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1