一种网络地理信息更新方法及系统的制作方法

文档序号:10687135阅读:398来源:国知局
一种网络地理信息更新方法及系统的制作方法
【专利摘要】本发明公开了一种网络地理信息更新方法及系统,包括如下步骤:建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件;根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息;分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息,若包含,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据;根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。本发明中,提高了地理信息数据库更新变化信息发现的效率,以及及时对网络地理信息数据库的更新。
【专利说明】
一种网络地理信息更新方法及系统
技术领域
[0001]本发明涉及地理信息科学技术领域,特别是涉及一种网络地理信息更新方法及系统。
【背景技术】
[0002]I)地形数据库更新步伐加快
[0003]我国目前已基本建成了覆盖全国的从1:100万到1:1万的地形数据库,为了不断提升维持数据的现势性,更好地满足国民经济建设与社会发展对基础地理信息现势性的要求,需要对已建成的地形数据库进行快速更新。
[0004]“十二五”期间,国家1: 5万地形数据库重点要素实现年度更新,每年更新一次。部分省级1:1万地形数据库也实现了年度更新,少数发达地区每年对I: I万地形数据库更新两次。
[0005]2)持续动态更新对更新信息变化发现与收集提出了更高的要求
[0006]当前的更新技术系统仍然架构在初始建库和全面更新的基础上,其数据生产手段仍以静态方式为主,无法满足动态更新生产的技术需要,尤其是在地理信息搜集与变化发现方面,缺少先进有效的技术手段,难以满足数据更新生产所需要的变化信息快速搜集与分析的需求,导致变化发现不够及时,生产成本高等问题,严重制约着动态更新生产效率及其更新完整性的提高。

【发明内容】

[0007]本发明提供一种网络地理信息更新方法及系统,以提高地理信息数据库更新变化信息发现的效率,以及及时对网络地理信息数据库的更新。
[0008]为了达到上述目的,本发明提供一种网络地理信息更新方法,包括如下步骤:
[0009]建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件;
[0010]根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息;
[0011]分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息,若包含,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据;
[0012]根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。
[0013]进一步地,所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息,具体包括:
[0014]根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。
[0015]进一步地,所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息之后,还包括:
[0016]提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或,
[0017]提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点信息。
[0018]进一步地,所述整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到网络地理信息的属性数据,具体包括:
[0019]将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。
[0020]进一步地,所述对所述属性数据空间化标注在地图中,具体包括:
[0021 ]根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。
[0022]本发明还提供了一种网络地理信息更新系统,包括:
[0023]建立模块,用于建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件;
[0024]检索获取模块,用于根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息;
[0025]分析模块,用于分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息;
[0026]结构处理模块,用于在所述分析模块分析确定出所述网页信息中包含更新的网络地理信息时,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据;
[0027]标注模块,用于根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。
[0028]进一步地,
[0029]所述检索获取模块,具体用于根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。
[0030]进一步地,还包括:
[0031]提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或,
[0032]提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点?目息O
[0033]进一步地,
[0034]所述结构处理模块,具体用于将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。
[0035]进一步地,
[0036]所述标注模块,具体用于根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。
[0037]与现有技术相比,本发明至少具有以下优点:
[0038]提高了地理信息数据库更新变化信息发现的效率,以及及时对网络地理信息数据库的更新。
【附图说明】
[0039]图1是本发明所提供的网络地理信息更新方法的步骤示意图。
【具体实施方式】
[0040]本发明提出一种网络地理信息更新方法及系统,下面结合附图,对本发明【具体实施方式】进行详细说明。
[0041]如图1所示,具体的包括如下步骤:
[0042]步骤101,建立筛选数据库。
[0043]其中,该所述筛选数据库中包含有网络地理信息的特征条件。
[0044]由于网络地理信息的变化发现不同于常规性的网络信息变化发现,其变化发现的对象主要是地理要素,地理要素除了具有属性信息的变化,同时还具有空间信息的变化,为此,构建了筛选数据库,也即规则数据库,对网络地理信息变化的发现至关重要。
[0045]网络地理信息变化发现的规则数据库主要包括以下两个规则:
[0046](I)网络变化发现网址源筛选规则
[0047]I)网页规则
[0048]搜索网页主要来源于区域各级政府的新闻网以及政府机构网,比如搜索网页主要来源于区域各级政府的新闻网以及政府机构网,比如测绘、规划、国土等政府机构网站。这样可以在很大程度上限定了目标搜索范围(按照政府网站按照行政区域划分),不会得到跨地域相同地名的搜索结果,同时,政府网站具有的权威性与时效性也为搜索结果的真实可靠提供了保证;最后有针对性的搜索也确保了搜索的效率。
[0049]2)专题规则
[0050]由于网页里的信息繁多,为了更加快速的查找到所需要的地理信息要素发现的内容,因此需要对网页上版面信息中的各项专题信息进行筛选和确定,如:新闻专题,时事专题,重大工程专题等,这些专题确定,可以更有针对性地确定搜索到所需要的地理信息变化的信息。
[0051 ] 3)时效规则
[0052]由于搜索的网页较多,为了确保寻找到最新的地理要素变化信息,而不是已经失去时效性的搜索结果,因此对搜索的网页的时效进行筛选,结合1:50000更新需求,只对当年的网页信息进行搜索,保证搜索到的结果能满足1:50000更新工程的需要。
[0053](2)网络变化发现关键词库规则
[0054]I)地理要素分类关键词
[0055]地理要素是变化发生的主体,其要素种类多、涉及范围广,且不同用途的要素分类方法也不相同。此外,网页中阐述的地理信息要素尺度也存在很大差异。本技术方法中通过调研大量网页文本中地理信息要素出现的频率和语言表述特点,最终确定参照《基础地理信息要素分类与代码》(GB/T13923-2006)中大类分类标准的基础上,结合1:50000动态更新项目的更新需求选取水系及其附属要素、居民地及设施、交通、管线四个大类,对各类别中对应的要素关键词和典型要素进行了总结和归纳。在检索时,利用这些关键词进行检索,可大大提高检索效率。但要素关键关键词只能表明某一类具有相同关键词汇的要素,当要素本身分属不同类别时,便无法进行区别。因而设计的地理信息要素关键关键词分为两个等级,当检测范围较小时,典型要素关键词对应的要素实体数目相对较少,这时还可以将地名中与地理信息要素相关的地名作为第三级添加到地理信息要素关键词汇中,以提高检索的精准度。
[0056]2)地理要素变化关键词
[0057]要素变化关键词用于表达要素发生了何种类型的变化,一般以动词形式存在,所以又可以称为要素变化动词。要素变化动词很多,一个要素关键词可以对应多个变化动词,不同地理信息要素关键词汇既可能对应完全相同的变化动词,也可以对应不完全相同或完全不相同的变化动词。此外,某些语境下变化动词之间也存在语义关系上的相似性,因此参照地理要素分类关键词,本技术方法总结了要素变化动词15个,并从事物发展角度,将要素变化关键词汇划分为创建、变更、消失三种类型;根据要素变化关键词和要素分类关键词之间的关联关系,将两者之间的对应关系进行了映射,并依据词语之间的语义相似性,将某些语境下语义相近的变化动词进行了归纳。地理信息要素变化关键词的三个类别中,很多词汇既可以隶属于一个变化类型,也可以隶属于多个变化类型。此外,地理信息要素变化关键词与地理信息要素共同作为检索关键字,还可以消除要素关键字在所属类别上的歧义。
[0058]3)空间关系关键词
[0059]空间关系词汇包括拓扑关系词汇、距离关系词汇和方向关系词汇,在判断变化地理信息要素与检索区域的空间关系时具有十分重要的作用。现有的相关研究已经对空间关系词汇进行了系统的总结和归纳,但这些研究成果只是词汇的简单罗列,并没有将地理要素之间的关联关系考虑在内,本技术方法中充分考虑地理要素之间所存在的各种空间关系,并对这些空间关系的表述进行了提炼和总结,形成了一套空间关系的关键词。
[0060]步骤102,根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息。
[0061 ]其中,所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息,具体包括:
[0062]根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。
[0063]所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息之后,还包括:
[0064]提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或,
[0065]提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点信息。
[0066]具体的,变化发现检索主要是基于海量的网络数据开展数据抓取工作,因此,按照指定的网络地理信息变化发现规则知识库,从互联网中检索和获取所需网页信息,并将网页信息抓取并保存到数据库中。数据检索的实现主要需要支持规则配置,能够检索不同类型的网页信息,并且只抓取地理信息变化发现需要的信息,减少噪音。
[0067]变化检索系统实现功能如下:
[0068](I)种子解析,生成抓取列表。
[0069](2)分布式网页采集,保存为网页快照。
[0070](3)分布式网页分析,提取进一步抓取的URL,过滤掉重复URL网页。
[0071](4)抓取规则配置,针对不同的URL可以配置不同的抓取规则。抓取规则可以控制在指定站点内延伸抓取的方向,避免抓取无用信息。
[0072](5)过滤规则配置,针对不同的站点,设置过滤规则。根据过滤规则对抓取到的无用信息进行过滤,如过滤掉广告,引用连接等。
[0073](6)支撑增量抓取,可以判断同一 URL内容是否更新,不重复抓取同一内容页面。
[0074]变化检索工作主要包括种子站点编辑管理,抓取规则配置管理。
[0075](I)种子站点管理
[0076]I)添加种子站点
[0077]发现有新的种子站点或者通过对已抓取页面链接信息的分析,能够发现一些频繁被引用,但未在种子站点库中登记的网站,可以对这些网站作进一步的甄别,从中发现新的相关种子站点,并存入种子站点库,纳入新的抓取任务中。
[0078]2)修改/更新种子站点
[0079]某些种子站点发生变更后需要修改或者更新种子站点来确保种子站点的有效性。
[0080]3)浏览查询种子站点
[0081]依据关键字,分类,状态单一条件或者多条件组合进行种子网站的查询浏览。
[0082](2)抓取规则配置
[0083]抓取规则主要分为两类:网页抓取规则和搜索引擎抓取规则。网页的抓取规则主要指对对抓取链接的规定;搜索引擎的抓取规则主要指关键词的分类整理。抓取规则是通过正则表达式来进行配置的。系统运维阶段需要专门人员来对种子网站的抓取规则进行维护和更新。
[0084]步骤103,分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息。
[0085]其中,若包含,转到步骤104,否则转到步骤106。
[0086]步骤104,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据。
[0087]其中,所述整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到网络地理信息的属性数据,具体包括:
[0088]将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。
[0089]具体的,信息分析抽取是对变化发现检索到的网页数据进行进一步分析抽取,获取到地理要素变化的信息。处理抓取到的目标网页数据,判断网页信息是否包含更新信息,过滤掉不具有地理要素更新信息的网页;对含更新信息的网页内容进行定位,找到信息点在整个网页中的位置;通过地名识别,找出更新实体对应的地区;通过文档相似度及关键词,找到不同信息源的重复网页,对内容不同的部分进行归并,删除重复的内容;将网页信息进行结构化,标示出各个属性,存储到数据库。
[0090]信息分析抽取系统实现功能如下:
[0091 ] (I)分析抓取页面的内容,查找是否包含有效变化信息。过滤掉无地理要素更新变化信息的页面。
[0092](2)定位变化信息在标题及正文中的位置,并标记。
[0093](3)分析变化信息对应的行政区域。
[0094](4)利用文档相似度模型,将内容重复的网页URL归并,去除内容重复的网页信息。
[0095](5)分析网页内容的标题、正文、发布时间、地理要素类别、变化属性,将信息结构化并保存到数据库。
[0096]步骤105,根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。
[0097]其中,所述对所述属性数据空间化标注在地图中,具体包括:
[0098]根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。
[0099]具体的,信息空间化标注是对信息分析抽取后得到的文本信息进行空间化,通过与地名地址数据库的匹配搜索等方法,将变化的地理要素文本信息在天地图或者googlemap上标注显示,从而形成一套更为直观可见的地理要素变化数据。
[0100]通过该网络地理信息更新方法的运用,可有效提升各比例尺地形数据库快速更新的能力和水平,缩短地形数据库更新的周期和效率,降低了成本,同时提高了地形数据库管理和服务水平。
[0101]步骤106,结束本流程。
[0102]基于与上述本发明所提供的网络地理信息更新方法相同或相似的设计,本发明还提供了一种网络地理信息更新系统,包括:
[0103]建立模块,用于建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件。
[0104]检索获取模块,用于根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息;具体用于根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。
[0105]提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或,
[0106]提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点?目息O
[0107]分析模块,用于分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息;
[0108]结构处理模块,用于在所述分析模块分析确定出所述网页信息中包含更新的网络地理信息时,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据;具体用于将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。
[0109]标注模块,用于根据所述属性数据将所述更新的网络地理信息空间化标注在地图中;具体用于根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。
[0110]其中,本发明装置的各个模块可以集成于一体,也可以分离部署。上述模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0111]本领域技术人员可以理解附图只是一个优选实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0112]本领域技术人员可以理解实施例中的装置中的模块可以按照实施例描述进行分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0113]上述本发明序号仅仅为了描述,不代表实施例的优劣。
[0114]以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
【主权项】
1.一种网络地理信息更新方法,其特征在于,包括如下步骤: 建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件; 根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息; 分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息,若包含,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据; 根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。2.如权利要求1所述的网络地理信息更新方法,其特征在于,所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息,具体包括: 根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。3.如权利要求1或2所述的网络地理信息更新方法,其特征在于,所述根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息之后,还包括: 提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或, 提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点信息。4.如权利要求1所述的网络地理信息更新方法,其特征在于,所述整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到网络地理信息的属性数据,具体包括: 将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。5.如权利要求1所述的网络地理信息更新方法,其特征在于,所述对所述属性数据空间化标注在地图中,具体包括: 根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。6.一种网络地理信息更新系统,其特征在于,包括: 建立模块,用于建立筛选数据库,所述筛选数据库中包含有网络地理信息的特征条件; 检索获取模块,用于根据所述筛选数据库检索,获取符合所述筛选数据库的网页信息; 分析模块,用于分析所述网页信息,确定所述网页信息中是否包含更新的网络地理信息; 结构处理模块,用于在所述分析模块分析确定出所述网页信息中包含更新的网络地理信息时,整理所述包含更新的网络地理信息的网页信息并做结构化处理,得到更新的网络地理信息的属性数据; 标注模块,用于根据所述属性数据将所述更新的网络地理信息空间化标注在地图中。7.如权利要求6所述的网络地理信息更新系统,其特征在于, 所述检索获取模块,具体用于根据所述筛选数据库进行检索,筛选出符合网络地理信息的特征条件的网页,获取所述网页的网页信息。8.如权利要求7所述的网络地理信息更新系统,其特征在于,还包括: 提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中未存储有所述网页信息对应的种子站点信息,将所述符合所述筛选数据库的网页信息中的种子站点信息存储在所述种子站点库中;和/或, 提取处理模块,用于提取符合所述筛选数据库的网页信息中的种子站点信息,根据所述符合所述筛选数据库的网页信息确定预设的种子站点库中是否存储有所述网页信息对应的种子站点信息,若预设的种子站点库中已存储有所述网页信息对应的种子站点信息,进一步确定所述符合所述筛选数据库的网页信息对应的种子站点信息与所述种子站点库中所述网页信息对应的种子站点信息是否相同,若不同,则将所述种子站点库中所述网页信息对应的种子站点信息更新替换为所述符合所述筛选数据库的网页信息的种子站点信息。9.如权利要求6所述的网络地理信息更新系统,其特征在于, 所述结构处理模块,具体用于将包含相同的更新的网络地理信息且其余部分内容相同的网页信息合并,得到具有不同更新的网络地理信息的网页信息,定位具有不同更新的网络地理信息在所述网页中的位置并标记,确定所述具有不同更新的网络地理信息所属行政区域,根据得到的位置信息和行政区域进行结构化分类并存储。10.如权利要求6所述的网络地理信息更新系统,其特征在于, 所述标注模块,具体用于根据所述属性数据对所述更新的网络地理信息做空间化定位,根据定位位置将所述更新的网络地理信息标注在地图上。
【文档编号】G06F17/30GK106055638SQ201610371047
【公开日】2016年10月26日
【申请日】2016年5月30日
【发明人】刘建军, 张元杰, 刘剑炜, 杜晓, 杨眉
【申请人】国家基础地理信息中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1