一种自适应的矢量数据增量更新的方法_3

文档序号:9750842阅读:来源:国知局
[0100] S601、基于网格搜索的方法快速定位到具体的要素;
[0101] 基于要素的更新是对新旧数据的要素进行变化检测,只更新变化了的要素。这里 首先要找到变化的要素,这里为了快速查找到具体的要素,通过格网搜索的方法,可以快速 定位到具体的要素,方便进行更新信息的识别。这里首先介绍格网搜索定位方法。
[0102] 传统的矢量数据的要素变化检测方法是通过对要素进行逐一比较来发现变化信 息,需要进行大量的空间查询与属性对比。本文提出了一种基于格网划分的变化信息快速 定位方法,可以对新旧数据中的空间信息和属性信息变化进行快速而准确的定位具体流程 如图7 (基于格网的变化信息快速定位流程图)所示:
[0103] (1)通过检测确保新旧数据是同一比例尺及采用同一坐标系,分别对新旧数据增 加特征点坐标属性字段(Cent er_X、Center_Y)及存储要素属性汇总信息的属性字段 (TotalStr)。
[0104] (2)分别对新旧数据进行全局查询,计算要素特征点坐标、要素属性汇总信息、并 确定新旧数据对比的范围(Xmin,Xmax,Ymin,Ymax)。特征点坐标代表要素所处的位置,点要 素直接取其坐标,线要素取其中点,面要素取其质心。要素属性汇总信息是将要素属性字段 的字段值按字段名的字符串匹配排序进行拼接,每个字段值之间用特殊符号分隔如公式 (7)所示。
[0105] Totalstr · value = Fields(0) · value+" | "+Fields( 1) · value+" | "+......+" | " Fields(n).value+"|" (7)
[0106] (3)将变化检测范围按统一的宽度和高度划分为m X n个规则的格网按公式(8)计 算,格网的宽度根据检测范围和要素总数由系统自动确定。格网的宽度记为Gwidth,高度记 为Gh i ght。根据格网的总数定义数组变量来存储格网中要素的汇总信息。
[0107]
[01 08] (4)分别对新旧数据按特征点坐标(Center_X、Center_Y)进行排序查询,并按特征 点坐标将要素匹配到相应的格网。格网编号与特征点坐标匹配方法按公式(9)计算,其中 INTO为向下取整。按公式(10)对格网内要素的特征点坐标(Center_X、Center_Y)、几何值 信息、属性汇总信息按排序结果依次累加到相应的网格变量。线要素和面要素的几何值信 息为要素的弧段长度,点要素不需要累加几何值信息。
[0109]
[0110]
[0?11 ] gridcenxO、gridceny()分别表示网格中要素特征点X坐标及Y坐标的和,gridlen ()表示网格中要素的弧段长度和,gridstr()表示网格中要素属性值字符串拼接, gridcountO为行号网格中要素个数。k为格网中要素的数量。
[0112] (5)对新旧数据中编号相同网格中的特征点X坐标、特征点Y坐标、弧段长度、属性 值拼接字符串进行对比。
[0113]
[0114]按公式(11)计算网格中几何特征的变化率,changecenx为格网中要素特征点X坐 标和的变化率,changeceny为格网中要素特征点y坐标和的变化率,changelen为格网中弧 段长度的变化率,N()与0()分别代表新旧数据。当新旧数据中的对应网格满足以下条件之 一,该网格中的要素存在变化情况,需要对网格内的要素逐一做变化检测。
[0115] 1、要素特征点X坐标和的变化率Changecenx大于指定阈值或要素特征点y坐标和 的变化率changeceny大于给定阈值,阈值由测量点坐标误差许可范围确定。
[0116] 2、要素弧段长度和变化率changelen大于给定阈值,阈值由边长测量误差许可范 围确定。
[0117] 3、要素数量不同。
[0118] 4、要素属性值拼接字符串gridstr不同。
[0119]变化要素的发现方法是在目标数据中搜索与源数据的面积,弧段长度、方向、重心 等空间特征与语义特征相同(差异小于阈值)的对象,当搜索结果为空时说明要素发生了变 化。在做新旧要素逐一变化对比时,需要通过大量的空间查询,当数据范围较大时,花费时 间较多。由于本方法已对查询空间进行了格网划分,且要素属性中记录了该要素的重心坐 标,进行要素空间查询时通过属性过滤(〇611丨61^> = 61^(1?(左4冊〇611丨61^〈 = 61^(1?(右八冊 Center_Y> = GridY下AND Center_Y〈 = GridY上),只对要素所在格网内的要素进行,大大缩 小了查询的范围,提高了查询的效率。
[0120] S602、采用人工神经网络的模式识别方法以新旧要素的匹配特征为依据,通过神 经网络决策树实现变化信息的识别;
[0121] 本发明采用了基于格网搜索定位方法,可以快速定位到具体的要素,但还需要进 行要素变化的检测。这里提供了一种基于人工神经网络的模式识别方法,采用该方法以新 旧要素的匹配特征为依据,通过神经网络决策树实现变化信息的识别,兼顾了决策树实现 效率高和神经网络的自适应处理的特征,该方法计算效率高、能够准确快速地识别出变化 信息、有助于提高数据库的动态更新的自动化与智能化水平。具体方法介绍如下:
[0122] 人工神经网络是模式识别的一种重要方法,具有自适应的特征。本研究以新旧要 素的匹配特征为切入点,通过神经决策树(基于模式识别的更新信息检测方法)的方法实现 更新信息的识别,兼顾了决策树实现效率高的优点和神经网络的自适应处理特征。
[0123] 更新信息检测的基本思路为图7中所示,其包括如下步骤:
[0124] S701、选取已实现更新信息检测的对象组合作为训练样本。
[0125] S702、计算训练样本的变化特征:新旧对象的距离差异、方向差异、语义差异等。
[0126] S703、把变化特征参数作为输入层,变化分类信息(新增、消失、合并)等作为输出 层,进行神经网络训练,并验证模型的准确性与可靠性,以获得模型的阈值与权重矩阵。
[0127] S704、对更新数据与原数据进行空间叠加操作,获取候选的测试更新对象组合,并 计算其变化特征参数。
[0128] S705、把变化特征参数作为输入量,使用建立的神经网络模型进行更新信息的模 式判别,以获取更新信息的分类结果。
[0129] 在更新信息的识别中,对于"消失"、"新增"的类别,在决策树中按匹配特征直接进 行判断。对于其他难以按匹配特征直接判断的类型(如分解、合并、聚合、几何变化、语义变 化),则通过构建不同的神经网络节点(P1,P2,P3)进行识别。神经网络节点的输入层为对象 组合的距离特征、几何特征等变化特征指标,输出层为更新信息的分类。激活函数选用 Sigmoidal函数,隐藏层与输出层的节点输出可分别表示为:
[0130]
[0131]
[0132] 公式(12)表示隐藏层,oj为隐藏层的第j个节点的输出,Μ为输入节点数,bi为偏置 值(bias),wi j是输入-隐藏的权重值,Xi是第i个输入节点的值。表示输出层,yk为输出层 的第k个节点的输出,N为隐藏节点数,bj为偏置值(bias),wjk是隐藏-输出的权重值,oj是 第j个输入节点的值。
[0133] 训练方法以每一个新旧对象组的变化特征指标作为一个样本,设Ω={ω1,……, ωΜ}为问题集(Μ = 6,为变化特征指标),训练集表示为Tr= {trl,tr2,tr3,......,trq},q表 示训练样本的数目。通过基于判断规则的变化检测与人工检查相结合方法可生成大量的训 练数据。神经网络决策树的训练步骤如下:
[0134] 1)初始化神经网络节点中的输入-隐藏权重矩阵W1及隐藏-输出权重矩阵W2。
[0135] 2)把训练样本集Tr加入到神经网络决策树根节点。通过分裂节点中的规则剔除0: 1匹配和1:0匹配的样本,只保留需要神经网络训练的样本。并根据1:1匹配判断规则,把样 本分为两个子集Trl,Tr2。
[0136] 3)分别遍历训练集Trl,Tr2分别对应神经网络节点PI,P2进行神经网络训练,计算 网络输出值。对于发生变化的要素,在Trl中分出样本集Tr3,对节点P3进行神经网络训练。
[0137] 4)结束历遍子样本集后,进行误差计算和自适应的权重矩阵与偏置值调整。设在 神经网络节点Pi中,输出节点数目为N(N为分类数),对于第k个样本,误差可表示为:
[0138]
[0139]
[0140] 公式(14)中,i为分类数,y是神经网络的输出矩阵,ta是样本的目标矩阵,表示分 类的信息。当样本k属于第
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1