一种stroke特征约束的树状河系层次关系构建及简化方法与流程

文档序号:12863961阅读:500来源:国知局
一种stroke特征约束的树状河系层次关系构建及简化方法与流程

本发明涉及地图制图与地图综合领域,具体是一种stroke特征约束的树状河系层次关系构建及简化方法。



背景技术:

河系描述了自然河流的网络连通与分布情况,是主要的基础地理信息要素之一,在地图表达时是不可或缺的骨架。河系通常包括树枝状、格状、羽毛状等类型,其中树状河系具有明显的层次结构和密度特征,主流、支流蕴含着空间上的“父子关系”,既无环路,河网密度又存在区域性差异。因此,当对树状河系进行综合选取时,必须保持这些主干河流,而且能够反映河系的空间结构特征和河网的密度差异,实际选取过程中主观经验判断处理较多,致使自动化水平不高,也直接导致了该领域的研究演变为热点和难点。

河流选取模型通常包括一元回归、多元回归、开方根等简单选取模型及模糊数学、综合指标等结构化综合模型。其中,一元回归模型、多元回归模型分别依据单位面积内河流长度、河流长度与条数关联实现河流的选取;方根模型则依据地物要素选取数量与地图比例尺之间的关系,通过计算确定新比例尺下的河流数量进行选取。简单选取模型往往缺少对于河流空间结构的考虑。结构化综合是指顾及地图要素分布特点及规律的综合。河系结构化综合通常包括模糊数学模型和综合指标模型等。其中,模糊数学模型考虑了河流的长度、密度、相对重要性和河网类型等因素,从而建立模糊综合评判矩阵进行河流选取;综合指标模型则分析河系简化涉及的多种因素,以河流长度为主要依据,并辅以河网密度和河流所处层次等标准,从而将河流等级、长度、层次组合起来进行河流选取。然而,结构选取模型能够顾及河系密度差异确定河流选取标准,但是处理过程复杂,难以自动化实现。概括有关以上两类模型的现有研究,鲜见综合应用河系数量、语义、几何、拓扑、结构特征来进行河系选取的方法,更缺乏特征智能识别的研究,这也是容易导致简化后河系的空间分布特征遭到破坏的重要原因。

基于层次关系的河系简化方法为综合集成应用河流选取多项指标提供了一种较好的解决思路,其本质是依据河系树来确定河系的层次关系,进而对其进行逐层选取。河系树结构的构建基于paiva提出的两个重要角度假设:“180°假设”和“锐角假设”,结合河段之间的父子关系,以河源向下游追踪的方式构建河系树,与此同时确定河流的层次关系。毋河海较早研究了河系树结构的建立方法,并提出了河系递归特征的树结构模型,但主流干流仍靠长度识别或者人工指定;郭庆胜等根据子河系呈现的空间特征,提出利用空间推理的方法确定水流流向和主支流层次关系,丰富扩展了“180°假设”和“锐角假设”的应用范围;thomson等提出基于知觉组织原则构建河流stroke方法,却仅涉及到建立河系树某些环节的处理,并未形成完整的解决方案;张园玉等结合树状河系自身的结构特点和图论思想,提出了基于图论的河系结构模型,尽管简化了人工操作,自动化程度仍有欠缺。



技术实现要素:

本发明的目的在于提供一种stroke特征约束的树状河系层次关系构建及简化方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:

一种stroke特征约束的树状河系层次关系构建及简化方法,包括以下步骤:

a、根据实际空间数据库中树状河系的组织方式,研究基于树状河系有向拓扑树(dtt)的河系特征智能识别方法;

b、依据树状河系的有向拓扑树,综合stroke对象语义、几何特征及拓扑特征,从河口出发,采取下游向上游追踪方法构建树状河系层次关系;

c、依据树状河系层次关系自动识别包括河流间距与河网密度的结构特征,提出整体数量确定和分层选取等算法,实现树状河系的自动简化。

作为本发明进一步的方案:构建树状河系层次关系的具体过程包括:

步骤1,以河系河口作为追踪起始结点,河口关联弧段作为追踪弧段,得到弧段的另一个结点,将其作为追踪结点;

步骤2,追踪结点关联弧段作为stroke候选集r{aop,aor,…},并计算弧段夹角{∠aop,∠aor,…};

步骤3,依据河流名称、河流类别、夹角值的优先级顺序依次建立stroke,且保证一个弧段只能在一个stroke结构中,直至r=φ;

步骤4,重复步骤2、步骤3,直至无法得到追踪弧段;

步骤5,上面的追踪弧段构成rivstroke,同时记录下rivstroke中所有的追踪结点,将追踪结点作为河系河口,迭代步骤1到步骤4,直到没有追踪结点。

作为本发明进一步的方案:构建时,选择有向拓扑树中高等级河数量最多的或者长度最长的结点作为该河系河口,且保证一个河系只有一个河口。

作为本发明进一步的方案:在建立树状河系层次关系时,连接的判断原则包括以下两大类:

(1)语义一致性:首先将河流名称相同的河流弧段连接为同一stroke,然后将河流类别相同的河流弧段连接为同一stroke;

(2)方向一致性:相连弧段符合良性延续性原则,连接过渡自然,同时夹角越接近180°,越可能连接为同一stroke;流向相反的河流不能连接为同一stroke。

作为本发明进一步的方案:树状河系层次关系的简化方法包括以下步骤:

步骤100:确定整体选取数量

整体选取数量用方根模型确定,方根模型如(1)式所示:

式中:nf为新编地物数量;na为原始地物数量;ma为原始地图比例尺分母;mf为新编地图比例尺分母,x为经验系数,x的取值范围通常为1-5;

步骤200:由外及内分层剔除叶结点

确定河系的选取数量后,通过河流剔除方式实现河流的选取。

河流的选取通过由外及内分层河流剔除的方法。

作为本发明进一步的方案:由外及内分层河流剔除选取方法是一种循环处理方法,每一次循环包括四个步骤:

步骤1:遍历整条河系,根据河系层次,统计各个层次的子悬挂弧;

步骤2:将剔除数量分配到各个层次;

步骤3:在各个层次的剔除数量分配到各个子流域;

步骤4:在子流域内部同一个层次上依据河流长度和河流间距剔除河流;

如此循环,直至剔除的河段数量满足根据方根模型确定的整体剔除总数,循环结束。

作为本发明进一步的方案:步骤2中,选取数量非均等分配,将整体的剔除指标分配到各个层次的河流,各个河流分配到的数量按下述公式计算:

式中,nci为第i层河流的剔除数量;nc为总的剔除数量;nmi为第i层子悬挂数量;nm为各个层次的子悬挂弧总数。

作为本发明进一步的方案:步骤4中,应用式(3)采用加权求和的方式计算每一条河流的重要性指数ir:

ir=αl+βd(3)

式中,α、β分别为河流长度l和河流间距d的权重系数,介于0-1之间且累加和为1。

作为本发明进一步的方案:当存在两条河流的重要性指数ir相同时,选择max(α、β)对应的指标进行判断;若权重系数α、β相等,默认按河流长度指标进行选取;若长度指标也相等,则随机任选其一。

与现有技术相比,本发明的有益效果是:

本发明首先依据树状河系的有向拓扑树进行河系特征自动识别,然后综合考虑stroke对象语义、几何及拓扑等特征,构建stroke特征约束的河系层次关系,最后依据河系层次关系识别河流间距、河网密度等结构特征,设计提出河系自动简化方法。本发明提出的河系简化方法自动化程度高,简化结果准确率、精确度较已有算法都有所提高,同时能够很好的顾及河网空间分布及密度差异,保留河系骨架。

附图说明

图1为本发明提供的stroke特征约束的树状河系层次关系构建及简化方法的流程示意图;

图2为本发明提出的树状河系有向拓扑示意图;

图3为本发明树状河系河口识别示意图;

图4为本发明构建stroke特征约束的树状河系方法示意图;

图5为本发明stroke特征约束下生成的河系层次关系示意图;

图6为本发明实施例提供的基于层次关系的河系简化方法流程示意图;

图7为本发明河流间距值的计算方法;

图8为本发明河系选取实验结果对比图,其中,图8(a)为1:20万资料图,图8(b)为1:50万手工简化图,图8(c)为逐层分解选取指标编绘1:50万简化图,图8(d)为分层河流剔除选取1:50万简化图。

图9为河流重要性指数公式中参数α、β部分取值及相应选取结果图,其中,图9(a)为α=1.0、β=0.0时的河系选取结果图,图9(b)为α=0.8、β=0.2时的河系选取结果图,图9(c)为α=0.4、β=0.6时的河系选取结果图,图9(d)为α=0.0、β=1.0时的河系选取结果图。

具体实施方式

下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

图2所示为树状河系有向拓扑示意图。拓扑简而言之是通过把空间实体抽象为与其大小、形状无关的“点”,而把连接实体的线路抽象成为“线”,并进而以图的形式来表示这些点与线之间关系的数学方法,旨在研究这些点、线之间的相连接关系。表示点和线之间关系的图通常被称为拓扑结构图。树状河系带有流向的拓扑结构图也称有向拓扑树(directedtopologytree,简称dtt),该ddt是结点和结点之间弧段的集合,弧段(边)的方向定义为从流经起始结点到终止结点时的方向。一个结点的“出度”表示为所有以该结点为起始结点的弧段的数量,“入度”则是所有以该结点为终止结点的弧段的数量,结点的度则是其出度和入度的总和。河源是出度为1、入度为0的结点,如图2中结点l所示;河口是出度为0、入度为1的结点,如图2中结点a所示;汇入点是出度等于大于1、入度等于大于1的结点,如图2中结点o所示;汇入点中有两种特殊的结点,连通点是出度为1、入度为1的结点,如图2中结点y所示;分岔点是出度大于1、入度等于大于1的结点,如图2中结点r所示。

在实际空间数据库中,一条河流因与其他河流交汇,被打散成多条弧段,但它的图层、要素、名称等语义信息,长度、角度、流向等几何信息均融入至弧段中,如弧段的图层名称(layerid)、要素名称(featureid)、河流名称(nameid)蕴含了河流语义属性;弧段的geometry蕴含了河流的几何形状;弧段的首结点到尾结点的方向则代表着河流从起点流向终点。河流汇入其他河流的汇入关系则融入到汇入点对应之结点中,用结点的关联弧段表示。河流的语义特征、流向等几何特征、出入度等拓扑特征构成了树状河系的有向拓扑树,基于这一带有语义信息的有向拓扑树,可智能识别特征,并推理河系层次关系。建立树状河系层次关系,首先将基线数据导入,分河流(弧段)和结点(河源河口、汇入点)组织数据;其次,根据河系的有向拓扑树,自动识别河系河口,设置树状河系的stroke约束规则,确定整个河系的主流;然后,智能迭代,追踪主流的汇入点,一级河流的汇入点追踪出来的为二级河流,依次类推,判断出各等级支流。河口是出度为0、入度为1的结点,如图2中结点a所示。已有大多文献根据河流流向,采用从河源开始,由上游向下游逐渐追踪的方式建立河系树,然而,仔细探究树状水系的结构特征可以发现,上游河段通常结构较为复杂,存在多个汇入点形成多个主支流交汇处,但下游河段的河口往往只有一个。河系河口是河流汇入湖泊水系或其他水系面的地方,一般是整个河系最宽的地方,也是河系中的主流的必经结点。河口拓扑特征明显,易于识别,且数量极少,可以提高计算效率及准确率。因此,本发明在已有河系正确流向方向的基础上,从河口出发,采取下游向上游追踪构建stroke特征约束的树状河系。

图3所示为树状河系河口识别示意图。通常一个树状河系只有一个河口,但由于数据采集质量问题或者实际确实存在多个河口的情况,因此需要对这些河口结点进行探索计算,追踪出stroke特征约束的树状河系(以下简称rivstroke),如图3所示。构建时,应选择有向拓扑树中中高等级河数量最多的或者长度最长的结点作为该河系河口,保证一个河系只有一个河口。若出现两个河口,如图3中的河口a与河口b,从河口a、河口b分别追踪出rivstroke_a(aopqrl)、rivstroke_b(byr),分别计算rivstroke_a和rivstroke_b中高等级河流数量,并选择数量多的结点作为河口;如果数量一样,则通过比较rivstroke_a和rivstroke_b的长度,选择长度较长的结点作为河系河口。

图4所示为构建树状河系stroke方法示意图。在建立树状河系stroke时,连接的判断原则一般包括以下两大类:

(1)语义一致性。首先将河流名称相同的河流弧段连接为同一stroke,然后将河流类别相同的河流弧段连接为同一stroke,如常年河、干涸河、时令河等类别。

(2)方向一致性。相连弧段符合良性延续性原则,连接过渡自然,同时夹角越接近180°,越可能连接为同一stroke;流向相反的河流不能连接为同一stroke。

根据已经确定的河口,以及上述连接原则,树状河系stroke以图4为例,构建的方法与过程如下:

步骤1,河系河口作为追踪起始结点(点a),河口关联弧段作为追踪弧段(弧段ao),得到弧段的另一个结点(点o),将其作为追踪结点;

步骤2,追踪结点关联弧段作为stroke候选集r{aop,aor,…},并计算弧段夹角{∠aop,∠aor,…};

步骤3,依据河流名称、河流类别、夹角值的优先级顺序依次建立stroke,且保证一个弧段只能在一个stroke结构中,直至r=φ;

步骤4,重复步骤2、步骤3,直至无法得到追踪弧段;

步骤5,上面的追踪弧段构成rivstroke,同时记录下rivstroke中所有的追踪结点,将追踪结点作为河系河口,迭代步骤1到步骤4,直到没有追踪结点。

图5所示为stroke特征约束下生成的河系层次关系示意图。河系层次关系隐藏在构建rivstroke的迭代过程中,所有由河系河口追踪出来的rivstroke为一级河流。由一级河流中汇入点(其中不包含分岔点)分出去的支流可以看做是二级河流,故一级河流的汇入点追踪出来的rivstroke为二级河流。依次类推,汇入点在哪个等级上追踪出来的河流就是下一等级的河流。从河流分岔点分出去的河流认为是河系的另一个分支,也可以看作为另外一个河系,因此,从分岔点分出去的河流被认为是与分岔点其他河流同一等级,视为二级河流。图5中,一级河流有河流1(l1~l5),二级河流有河流3(l6l9)、河流5(l11l12)、河流9(l14l15l16l17l18)、河流13(l24l25)、河流2(l7l8),三级河流有河流4(l10)、河流6(l13)、河流7(l19)、河流8(l20)、河流11(l21l22)、河流12(l26),四级河流有河流10(l23)。

图6所示为基于层次关系的河系简化方法流程示意图。

简化河系过程中通常需要考虑多种因素,如河流长度、河网密度、河网类型、等级、层次等,其中河流长度是最基本的选取指标,但河流长度不能全面准确衡量河流的重要性。顾及stroke特征约束的河流层次关系综合考虑了河流的语义特征、几何特征、拓扑特征,标识了河流的重要性。层次关系反映了主支流的关系,一般说来,某一主流拥有支流数量越多,则等级越高,当然处在上层的河流就具有相对重要的位置;另一方面,按层次关系确定的河流层次深度与以某河流为主流的子流域的河流总数成正比,在主流长度一定的情况下,子流域的河流总数越大,则河网密度越大,空间分布特征越复杂,或者说对于长度相似的两条河流而言,支流数量较多的河流(既层次越深的河流)所流经区域的河网密度越大。基于河系层次关系的简化方法包括以下两个主要步骤:

步骤100:确定整体选取数量

整体选取数量可以用方根模型确定,方根模型如(1)式所示:

式中:nf为新编地物数量;na为原始地物数量;ma为原始地图比例尺分母;mf为新编地图比例尺分母,x为经验系数,x的取值受河流密度、新编图的制图目的等因素影响,取值范围通常为1-5。

步骤200:由外及内分层剔除叶结点

确定河系的选取数量后,河流的选取可通过“河流保留”与“河流剔除”两种方式实现。张青年等根据河系层次关系,采取“由上及下”(由第1层到第n层)的河流逐层保留选取方法,通过逐层保留主干河系完成河流选取,尽管这可以较好地保留河系比较重要、层次较高的主要河流,但在选取过程中经常出现删除整条河系的情况,从而破坏了河流的空间分布形态,且无法保证河系边缘的连通性,会造成河系边缘的断流。

本发明提出了一种根据河系拓扑关系进行“由外及内”分层河流剔除的选取方法。河流的选取重点集中在树结构的叶结点集合中。通过观察树状河系拓扑特征可以发现,树状河系主要由“悬挂弧”和“主干弧”组成。悬挂弧是指弧段(河段)的某一端点未与其他任意一条弧段的端点相连的弧,处在河系外部边缘,主要是无支流的小河系;主干弧是指连接各个弧段的中间弧段。河系分层之后,悬挂弧可分为两类:与同层次弧段相连的悬挂弧;与不同层次弧段相连的悬挂弧。其中与不同层次弧段相连的悬挂弧连接的都是上层弧段,与相连弧段相比,具有相对低一级的重要性,称为“子悬挂弧”,子悬挂弧是需要剔除的弧段对象。

分层河流剔除选取方法是一种循环处理方法,每一次循环包括四个步骤:

步骤1:遍历整条河系,根据河系层次,统计各个层次的子悬挂弧;

步骤2:将剔除数量分配到各个层次;

步骤3:在各个层次的剔除数量分配到各个子流域;

步骤4:在子流域内部同一个层次上依据河流长度和河流间距剔除河流。

如此循环,直至剔除的河段数量满足根据方根模型确定的整体剔除总数,循环结束。

下面分为数量分配和河流选取两个方面阐明。

(1)选取数量非均等分配

首先,将整体的剔除指标分配到各个层次的河流,各个河流分配到的数量按下述公式计算:

式中,nci为第i层河流的剔除数量;nc为总的剔除数量;nmi为第i层子悬挂数量;nm为各个层次的子悬挂弧总数。选取数量按四舍五入处理为整数。然后,将各个层次的剔除数量分配到各个子流域(河系的一级支流)仍按公式(2)计算,但各个符号的含义略有变化。nci为该子流域第i层河流的剔除数量;nc为整条河系第i层总的剔除数量;nmi为该子流域第i层子悬挂数量;nm为该河系总的子悬挂弧总数。按公式(2)计算,子流域若是含支流少或无支流的小河系,剔除数量可能是0,对此如果存在许多小河系,则将这些小河系进行统计相加作为一个整体,按照式(2)计算得到该整体的剔除数量。

(2)顾及河系分布差异的河流选取

河流的选取需要顾及河流的空间特征,而河流的长度和密度对于维持河流的空间特征具有直接的影响,故本发明在子流域内部同一个层次上依据河流长度和河流间距剔除河流。为保存化简后河系的空间分布特征不变,长度更大、间隔更远的河流应该得到保留;相反长度较小、间隔较近的河流应该予以删除。但实际情况中,对于长度小、间隔大或者长度大、间隔小的河流尚无明确办法进行区别选取,所以本发明应用式(3)采用加权求和的方式计算每一条河流的重要性指数ir:

ir=αl+βd(3)

式中,α、β分别为河流长度(l)和河流间距(d)的权重系数,介于0-1之间且累加和为1,实际使用时可在对研究区域进行反复选取试验基础上确定一个合适的经验值。

图7所示为河流间距值的计算方法。

河流间距主要指某一主流同侧河流的间距,本发明将某一河流与主流的交点与其前后两条河流与主流的交点的距离之和作为该条的河流的间距值。如图7所示,河流r2的间距值为l2(n2与n3之间的距离)与l3(n3与n4之间的距离)之和。这种方法计算河流的间距,可以充分考虑河流的上下文环境。当存在两条河流的重要性指数ir相同时,选择max(α、β)对应的指标进行判断;若此时α、β相等,默认按长度指标进行选取;若长度指标也相等,说明长度、间距、长度权重系数、间距权重系数全部相等,则随机任选其一。

实施例1

依托中国测绘科学研究院研制的wj-iii地图工作站,嵌入本发明提出的河系简化方法,在c++环境下实现了河系层次关系的自动构建和河流的分层选取。实验数据取自湖北省西部部分1:20万水系图,共有68条河流,如图8a所示。图8b是手工缩编制作的1:50万水系图,共选取了27条河流,图8c是已有学者按层次分解选取指标的方法编制的1:50万水系图。与以上3幅图相对应,图8d是按照本发明方法编制的1:50万水系图。依据制图经验,将公式(1)中的指数x取2,得到选取指标为27,与图8b、8c的选取额度相同。采用目视比较方法评价河流选取结果,可以看出,图8d选取的河流与图8a、8b基本一致,河系中心弧段和边缘弧段的选取数量分配较为合理,河流密度的区域差异及河系的空间结构特征在缩编后的图上保持得较好,选取的河流很好的照顾了河流长度和间距的平衡,不存在间隔较密、长度较短的河流,选取效果较好。图8d在河系密集的子流域a中选取的河段数量比图8b、图8c多2(河段e、f),在保持河系的整体空间分布结构方面效果良好,同时图8d剔除了图8b、图8c中较短的河段(河段b、c),保证了简化后图形选取均为较长的河流,实现了河系的基本轮廓的保持;然而图8d在子流域b中选取的河段数量比图8b、图8c少1(河段a、d),此处选取不尽合理,原因在于文中提出的算法剔除了同侧间距较小且河长较短的河段,但对于分布异侧平衡的计算考虑不足。

为了确定公式(3)中的参数α和β,以0.1为增量,对0-1之间的11个值进行了试验,共得到11个选取结果,部分数据见图9。图9中可以看到,当α>β(长度权重较大,图9a、9b)时,实验数据区域b、区域c中选取的弧段均为长度相对较大的河流,相比图9c、9d,河系分布比较密集,河流间距较小;随着α的减小、β的增大,河系整体逐渐稀松,当α<β(间距权重较大,图9c、9d)时部分长度较短但与其他河流间距较大的弧段得到保留(图9c、9d中的b1),河流较长但间距较近的河流被剔除(图9a、9b中的b2、b3;图9a、9b、9c中的c1)。通过将这些选取结果挑选出的方案与图8b对照,选出最接近图8b的方案是α=0.8,β=0.2(图9b、8d)。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。

此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1