基于多源信息的不同时期空间实体层次式匹配方法及系统的制作方法

文档序号:6624868阅读:162来源:国知局
基于多源信息的不同时期空间实体层次式匹配方法及系统的制作方法
【专利摘要】本发明涉及一种基于多源信息的不同时期空间实体层次式匹配方法及系统,属于数据处理【技术领域】。本发明首先通过判断参考实体和目标实体是否满足属性匹配,若满足,则说明其为匹配实体,否则,需要对其进行几何匹配,判断是否满足几何匹配,若满足,则说明其为匹配实体,否则需要对其进行拓扑匹配,若满足,则说明其为匹配实体,通过上述三个层次判断,从而实现对不同时期空间实体层次式匹配。同时,为了提高匹配效率,本发明在正式匹配之前为待匹配的目标数据集建立索引。通过上述方案,本发明能够实现不同时期土地利用数据空间实体的快速高效匹配,为土地利用数据一致化处理、变化追溯与统计分析、趋势预测与模拟提供了可靠的技术支撑。
【专利说明】基于多源信息的不同时期空间实体层次式匹配方法及系统

【技术领域】
[0001]本发明涉及一种基于多源信息的不同时期空间实体层次式匹配方法及系统,属于数据处理【技术领域】。

【背景技术】
[0002]随着土地利用现状调查及变更调查的开展与实施,目前我国各级土地管理部门已积累拥有了一系列不同时期的土地利用现状空间数据集(如图1所示)。然而,由于每次调查在时代背景、法律依据、分类体系、技术标准、作业规范等方面的不同,加上采集误差、现实变化等原因,致使不同时期数据集中的同一土地利用空间实体(通常表示为面、线或点)在几何形状、属性语义等方面存在多种差异。为了综合利用这些数据对土地利用变化、发展规律及趋势进行准确分析、评价与预测,前提条件就是通过实体匹配技术识别发现不同数据集中代表现实世界同一土地利用实体(如地块、道路等)的数据记录,判别分析对应实体记录是否存在差异以及造成差异的原因,并对非变化引起的伪差异进行一致化处理,形成协调兼容的数据序列。
[0003]针对实体匹配问题,目前大多数空间信息处理系统(如ArcGIS、SuperMap、MApGIS等等)所采用的解决方案都是人工手动处理,即先将待匹配的两个数据集叠置在一起,然后赋予数据集中空间实体不同的显示属性(如符号、颜色、图案、透明度等),最后在一定缩放比例下通过目视判别逐屏识别建立同一实体的对应关系。但是人工手动匹配方案人机交互频繁、效率低,随着实体数量的增加,作业处理时间将成倍增加;匹配质量常常受到作业员熟练程度、劳动强度等不确定因素的影响与干扰,容易产生错配、漏配现象;匹配结果(即实体对应匹配关系)往往靠作业员手动记录,增加了匹配的处理时间,不便于对结果进行检核与纠正。
[0004]针对常用人工手动匹配方案的不足,一些专家学者针对不同类型的空间数据集尝试设计了相应的实体自动(或半自动)匹配方法。如:张桥平等人(2004)针对城市地图数据集中的面状实体提出了基于模糊拓扑关系分类的匹配方法;郭黎等人(2008)针对面实体提出了基于空间方向相似性的匹配方法;赵东保等人(2010)针对线状道路弧段实体提出了基于概率松弛算法的匹配方法;刘继宝等人(2011)针对点实体提出了基于距离概率可信度的匹配方法;田原等人(2011)针对地籍宗地图斑实体提出了基于局部相似的匹配方法,等等。而现有实体自动匹配方法主要依据实体在属性、几何、拓扑等某一特征的相同或相似程度来确定其是否匹配,一般只能应用于时相相同或间隔较小的数据集。对于时相跨度比较大的数据集而言,由于现实变化造成的实体特征差异较大,直接应用该方法则容易产生漏配现象。现有方案大多强调匹配结果的直接应用,匹配规则定制、结果检核纠正等处理环节的交互性与灵活性相对较低。现有方案一般采用不同数据集中实体两两比较的策略加以实施,其中往往涉及大量试探性的对比计算与复杂处理,总体执行效率相对较低。
[0005]由于空间实体匹配受实体语义、几何特征、应用目的等多种因素的影响,现在还没有一种通用的方法,能够解决所有情况下的实体匹配问题。因此,需要根据具体应用背景,选择或设计可行的实体匹配方法。


【发明内容】

[0006]本发明的目的是提供一种基于多源信息的不同时期空间实体层次式匹配方法及系统,以解决目前不同时期空间实体匹配过程中产生的漏配以及匹配效率低的问题。
[0007]本发明为解决上述技术问题提供了一种基于多源信息的不同时期空间实体层次式匹配方法,该匹配方法包括以下步骤:
[0008]I)提取参考实体及其信息,通过在目标数据集中查找与参考实体属性相同的实体进行属性匹配,并记录与参考实体属性相同的实体作为目标实体;
[0009]2)如果通过属性匹配没有发现与参考实体匹配的目标实体,则在目标数据集中查找与参考实体几何相同的实体,记录几何相同实体作为目标实体;
[0010]3)如果通过几何匹配没有发现与参考实体匹配的目标实体,则在目标数据集中查找与参考实体拓扑关联的实体,记录拓扑关系相同的实体作为目标实体;
[0011]4)将步骤I)-步骤3)中的匹配结果通过实体唯一标识ID与不同背景颜色相结合的方式记录在匹配结果表中。
[0012]该方法还包括在匹配之前根据待匹配的目标数据创建数据集索引的步骤。
[0013]所述的数据集索引包括属性索引和空间索引,所述属性索引用于提高属性匹配的效率,所述空间索引用于提高几何和或拓扑匹配的效率。
[0014]所述步骤2)中几何匹配的具体判别规则随实体的几何类型的不同而不同,对于点状参考实体和目标实体,如果其位置相同,则认为其为匹配实体;对于线状或面状参考实体与目标实体,如果其形状和位置相同,则认为其为匹配实体。
[0015]所述步骤3)中拓扑匹配的具体判别规则随实体的集合类型的不同而不同,对于点状参考实体和目标实体,如果两者彼此相离并且距离小于给定阈值,则认为其为匹配实体;对于线状参考实体与目标实体,以设定半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则认为其为匹配实体;对于面状参考实体与目标实体,如果彼此间存在重叠相交区域,则认为其为匹配实体。
[0016]所述经过上述三种匹配方式进行匹配后,未发现与参考实体相匹配的目标实体,将其记录在匹配结果中,从参考数据集提取下一个参考实体,通过三个层次的判别比较识别发现其匹配实体;这样循环往复,直到参数数据集中的所有实体被提取。
[0017]所述对于数据集之间“多对多”情形的匹配实体,可采用交换数据集角色,重新执行匹配,并对两次匹配结果融合分析的方式加以获得。
[0018]本发明为解决上述技术问题还提供了一种基于多源信息的不同时期空间实体层次式匹配系统,该匹配系统包括数据集索引创建模块、匹配结果校验模块、点状实体匹配模块、线状实体匹配模块和面状实体匹配模块,
[0019]所述数据集索引创建模块用于在匹配之前根据待匹配的目标数据创建数据集索弓I ;
[0020]所述点状实体匹配模块用于对点状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与点状参考实体匹配的目标实体;
[0021]所述线状实体匹配模块用于对线状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与线状参考实体匹配的目标实体;
[0022]所述面状实体匹配模块用于对面状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与面状参考实体匹配的目标实体;
[0023]所述匹配结果校验模块用于依据不同信息产生的匹配结果,通过实体唯一标识ID与不同背景颜色相结合的方式记录在匹配结果表中,通过单击表格相应行的方式,查看检验匹配实体及其相关信息,并对错误匹配关系进行修改校正。
[0024]其特征在于,所述点状实体匹配模块在进行几何匹配时,如果点状参考实体和目标实体的位置相同,则认为其为匹配实体,所述点状实体匹配模块在进行拓扑匹配时,如果点状参考实体和目标参考实体彼此相离并且距离小于给定阈值,则认为其为匹配实体;
[0025]所述线状实体匹配模块在进行几何匹配时,如果线状参考实体和目标实体的形状和位置相同,则认为其为匹配实体,所述线状实体匹配模块在进行拓扑匹配时,以设定半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则认为其为匹配实体;
[0026]所述面状实体匹配模块在进行几何匹配时,如果面状参考实体和目标实体的形状和位置相同,则认为其为匹配实体,所述面状实体匹配模块在进行拓扑匹配时,如果面状参考实体和目标实体彼此间存在重叠相交区域,则认为其为匹配实体。
[0027]所述经过上述三种方式进行匹配后,如果未发现与参考实体相匹配的目标实体,仍将其记录在匹配结果中,从参考数据集提取下一个参考实体,通过三个层次的判别比较识别发现其匹配实体,循环往复,直到参数数据集中的所有实体被提取。
[0028]本发明的有益效果是:本发明采用层次式的匹配方法,首先通过判断参考实体和目标实体是否满足属性匹配,若满足,则说明其为匹配实体,否则,需要对其进行几何匹配,判断是否满足几何匹配,若满足,则说明其为匹配实体,否则需要对其进行拓扑匹配,若满足,则说明其为匹配实体,通过上述三个层次判断,从而实现对不同时期空间实体层次式匹配。同时,为了提高匹配效率,本发明在正式匹配之前为待匹配的目标数据集建立索引,以提高属性匹配、几何匹配和拓扑匹配的效率。通过上述方案,本发明能够实现不同时期土地利用数据空间实体的快速高效匹配,为土地利用数据一致化处理、变化追溯与统计分析、趋势预测与模拟提供了可靠的技术支撑。

【专利附图】

【附图说明】
[0029]图1是不同使其土地利用现状空间数据示例图;
[0030]图2是本发明空间实体层次式匹配的基本流程图;
[0031]图3是点状实体匹配模块界面示意图;
[0032]图4是线状实体匹配模块界面示意图;
[0033]图5是面状实体匹配模块界面示意图;
[0034]图6是数据集索引创建模块界面示意图;
[0035]图7是匹配结果检验模块界面示意图。

【具体实施方式】
[0036]下面结合附图对本发明的【具体实施方式】作进一步的说明。
[0037]本发明的基于多源信息的不同时期空间实体层次式匹配方法的实施例
[0038]本发明针对现有技术方案的不足以及不同时期土地利用现状空间数据的特点,对本发明所提供的基于多源信息的不同时期空间实体层次式匹配方法的实施过程进行说明,该方法具体包括以下步骤:
[0039]1.创建数据集索引。为提高匹配执行效率,正式匹配之前应根据接下来的匹配需要为待匹配的目标数据集建立索引。所建索引主要分为属性索引和空间两大类,其中属性索引能够提闻属性匹配的效率;空间索引则能够提闻几何或拓扑匹配的效率。效率提闻的基本原理是通过索引从目标数据集中提取与参考实体可能匹配的候选实体,排除不可能匹配的实体,以减少后续的实体对比判断次数。
[0040]2.基于属性的匹配。通过比较参考实体与目标实体的属性值确定其是否匹配。设参考实体为S,目标实体为T,参与比较的实体共同属性集为{A1; A2,…,AJ (η彡1),如果两实体的对应属性值均相等,即S.A1 = Τ.A1, S.A2 = Τ.A2,…,S.An = Τ.An,则S和T为匹配实体。
[0041]3.基于几何的匹配。如果通过属性匹配没有发现与参考实体匹配的目标实体,则执行几何匹配。几何匹配主要通过比较参考实体与目标实体的几何图形特征确定其是否匹配,随实体几何类型的不同其具体判别规则略有不同。对于点状参考实体与目标实体,如果其位置相同,则认为其为匹配实体;对于线状或面状参考实体与目标实体,如果其形状与位置相同,则认为其为匹配实体。
[0042]4.基于拓扑的匹配。如果通过几何匹配也没有发现与参考实体匹配的目标实体,则进一步执行拓扑匹配。拓扑主要依据参考实体与目标实体之间的拓扑关系(相离、相交、重叠、包含等)来确定其是否匹配。对于点状参考实体与目标实体,如果其彼此相离并且距离小于给定阈值,则认为其为匹配实体;对于线参考实体与目标实体,先以预设半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则认为其为匹配实体;对于面状参考实体与目标实体,如果彼此间存在重叠相交区域,则认为其为匹配实体。根据上述规则,可能会产生一个参考实体与多个目标实体相匹配(即“I对多”)的情况,为排除到其中非正常的匹配实体,可以通过比较实体的属性对匹配实体做进一步的过滤筛选。
[0043]依据上述三种方式进行匹配后,如果未发现与参考实体相匹配的目标实体,则为“I对O”的匹配情况,仍需将其记录在匹配结果中。然后,从参考数据集提取下一个参考实体,通过三个层次的判别比较识别发现其匹配实体;这样循环往复,直到参数数据集中的所有实体被提取。对于数据集之间“多对多”情形的匹配实体,可采用交换数据集角色,重新执行匹配,并对两次匹配结果融合分析的方式加以获得。
[0044]5.匹配结果检核与校正。依据不同信息产生的匹配结果,将通过实体唯一标识(ID)与不同背景颜色相结合的方式记录在匹配结果表中。用户可通过单击表格相应行的方式,查看检验匹配实体及其相关信息,并对错误匹配关系进行修改校正。
[0045]采用上述基于多源信息的不同时期空间实体层次式匹配方法,以武汉市汉南区、琼海市大路镇、长沙县黄花镇等地提供的土地利用二次调查及变更调查数据为例对该方法进行实验验证,实验结果表明,该方法在匹配规则定制、匹配结果检验与纠正等方面的灵活性明显优于现有方案,匹配结果的召回率和正确率较现有方案平均提高11.6个百分点,匹配效率较现有方案平均提高2.5倍。通过该方法能够实现不同时期土地利用数据空间实体的快速高效匹配,为土地利用数据一致化处理、变化追溯与统计分析、趋势预测与模拟提供了可靠的技术支撑。
[0046]本发明的基于多源信息的不同时期空间实体层次式匹配系统的实施例
[0047]本实施例中匹配系统是在C#2010开发平台上编码实现的,具体包括数据集索引创建模块、匹配结果校验模块、点状实体匹配模块、线状实体匹配模块和面状实体匹配模块。
[0048]其中数据集索引创建模块的界面如图6所示,该模块用于在正式匹配之前根据接下来的匹配需要为待匹配的目标数据集建立索引,所建索引主要分为属性索引和空间两大类,其中属性索引能够提高属性匹配的效率;空间索引则能够提高几何或拓扑匹配的效率。该模块能够使效率提高的基本原理是通过索引从目标数据集中提取与参考实体可能匹配的候选实体,排除不可能匹配的实体,以减少后续的实体对比判断次数。
[0049]点状实体匹配模块的界面如图3所示,该模块是针对点状参考实体和目标实体而言,该模块首先在点状参考数据集中提取点状参考实体及其信息;然后对点状参考实体和目标实体依据属性是否相同进行匹配,如果点状参考实体和目标实体的对应属性值均相等,则说明参考实体和目标实体匹配,如果通过属性匹配没有发现与点状参考实体匹配的目标实体,需要对该点状目标实体和参考实体依据位置是否完全重合进行几何匹配,如果其位置完全相同,则说明该点状参考实体和目标实体匹配,如果通过几何匹配没有发现与参考实体匹配的目标实体,则需要对其拓扑匹配,即依据这两个实体的距离是否小于给定阈值,如果是,则说明该点状参考实体和目标实体匹配,从而完成点状实体的匹配过程。
[0050]线状实体匹配模块的界面如图4所示,该模块是针对线状参考实体和目标实体而言,该模块首先在线状参考数据集中提取线状参考实体及其信息;然后对线状参考实体和目标实体依据属性是否相同进行匹配,如果线状参考实体和目标实体的对应属性值均相等,则说明参考实体和目标实体匹配,如果通过属性匹配没有发现与线状参考实体匹配的目标实体,需要对该线状目标实体和参考实体依据形状和位置是否完全相同进行几何匹配,如果完全相同,则说明该线状参考实体和目标实体匹配,如果通过几何匹配没有发现与参考实体匹配的目标实体,则需要对其拓扑匹配,以预设半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则说明该线状参考实体和目标实体匹配,从而完成线状实体的匹配过程。
[0051]面状实体匹配模块的界面如图5所示,该模块是针对面状参考实体和目标实体而言,该模块首先在面状参考数据集中提取面状参考实体及其信息;然后对面状参考实体和目标实体依据属性是否相同进行匹配,如果面状参考实体和目标实体的对应属性值均相等,则说明该参考实体和目标实体匹配,如果通过属性匹配没有发现与面状参考实体匹配的目标实体,需要对该面状目标实体和参考实体依据形状和位置是否完全相同进行几何匹配,如果完全相同,则说明该面状参考实体和目标实体匹配,如果通过几何匹配没有发现与参考实体匹配的目标实体,则需要对其拓扑匹配,如果面状参考实体和目标实体彼此间存在重叠相交区域,则说明该面状参考实体和目标实体匹配,从而完成面状实体的匹配过程。
[0052]匹配结果校验模块用于依据不同信息产生的匹配结果,通过实体唯一标识ID与不同背景颜色相结合的方式记录在匹配结果表中,通过单击表格相应行的方式,查看检验匹配实体及其相关信息,并对错误匹配关系进行修改校正。
【权利要求】
1.一种基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,该匹配方法包括以下步骤: 1)提取参考实体及其信息,通过在目标数据集中查找与参考实体属性相同的实体进行属性匹配,并记录与参考实体属性相同的实体作为目标实体; 2)如果通过属性匹配没有发现与参考实体匹配的目标实体,则在目标数据集中查找与参考实体几何相同的实体,记录几何相同实体作为目标实体; 3)如果通过几何匹配没有发现与参考实体匹配的目标实体,则在目标数据集中查找与参考实体拓扑关联的实体,记录拓扑关系相同的实体作为目标实体; 4)将步骤I)-步骤3)中的匹配结果通过实体唯一标识ID与不同背景颜色相结合的方式记录在匹配结果表中。
2.根据权利要求1所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,该方法还包括在匹配之前根据待匹配的目标数据创建数据集索引的步骤。
3.根据权利要求2所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,所述的数据集索引包括属性索引和空间索引,所述属性索引用于提高属性匹配的效率,所述空间索引用于提高几何和或拓扑匹配的效率。
4.根据权利要求3所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,所述步骤2)中几何匹配的具体判别规则随实体的几何类型的不同而不同,对于点状参考实体和目标实体,如果其位置相同,则认为其为匹配实体;对于线状或面状参考实体与目标实体,如果其形状和位置相同,则认为其为匹配实体。
5.根据权利要求3所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,所述步骤3)中拓扑匹配的具体判别规则随实体的集合类型的不同而不同,对于点状参考实体和目标实体,如果两者彼此相离并且距离小于给定阈值,则认为其为匹配实体;对于线状参考实体与目标实体,以设定半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则认为其为匹配实体;对于面状参考实体与目标实体,如果彼此间存在重叠相交区域,则认为其为匹配实体。
6.根据权利要求4或5所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,所述经过上述三种匹配方式进行匹配后,未发现与参考实体相匹配的目标实体,将其记录在匹配结果中,从参考数据集提取下一个参考实体,通过三个层次的判别比较识别发现其匹配实体;这样循环往复,直到参数数据集中的所有实体被提取。
7.根据权利要求6所述的基于多源信息的不同时期空间实体层次式匹配方法,其特征在于,所述对于数据集之间“多对多”情形的匹配实体,可采用交换数据集角色,重新执行匹配,并对两次匹配结果融合分析的方式加以获得。
8.一种基于多源信息的不同时期空间实体层次式匹配系统,其特征在于,该匹配系统包括数据集索引创建模块、匹配结果校验模块、点状实体匹配模块、线状实体匹配模块和面状实体匹配模块, 所述数据集索引创建模块用于在匹配之前根据待匹配的目标数据创建数据集索引; 所述点状实体匹配模块用于对点状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与点状参考实体匹配的目标实体; 所述线状实体匹配模块用于对线状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与线状参考实体匹配的目标实体; 所述面状实体匹配模块用于对面状的参考实体和目标实体按照设定顺序进行属性匹配、几何匹配和拓扑匹配,记录与面状参考实体匹配的目标实体; 所述匹配结果校验模块用于依据不同信息产生的匹配结果,通过实体唯一标识ID与不同背景颜色相结合的方式记录在匹配结果表中,通过单击表格相应行的方式,查看检验匹配实体及其相关信息,并对错误匹配关系进行修改校正。
9.根据权利要求8所述的基于多源信息的不同时期空间实体层次式匹配系统,其特征在于,所述点状实体匹配模块在进行几何匹配时,如果点状参考实体和目标实体的位置相同,则认为其为匹配实体,所述点状实体匹配模块在进行拓扑匹配时,如果点状参考实体和目标参考实体彼此相离并且距离小于给定阈值,则认为其为匹配实体; 所述线状实体匹配模块在进行几何匹配时,如果线状参考实体和目标实体的形状和位置相同,则认为其为匹配实体,所述线状实体匹配模块在进行拓扑匹配时,以设定半径生成参考实体的缓冲区,如果目标实体被缓冲区分割的子线段长度之和大于预定阈值,则认为其为匹配实体; 所述面状实体匹配模块在进行几何匹配时,如果面状参考实体和目标实体的形状和位置相同,则认为其为匹配实体,所述面状实体匹配模块在进行拓扑匹配时,如果面状参考实体和目标实体彼此间存在重叠相交区域,则认为其为匹配实体。
10.根据权利要求9所述的基于多源信息的不同时期空间实体层次式匹配系统,其特征在于,所述经过上述三种方式进行匹配后,如果未发现与参考实体相匹配的目标实体,仍将其记录在匹配结果中,从参考数据集提取下一个参考实体,通过三个层次的判别比较识别发现其匹配实体,循环往复,直到参数数据集中的所有实体被提取。
【文档编号】G06Q50/26GK104317793SQ201410427020
【公开日】2015年1月28日 申请日期:2014年8月27日 优先权日:2014年8月27日
【发明者】王育红, 张合兵, 郭增长, 徐君 申请人:河南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1