一种面向多数据类型信息资源元数据的共享方法

文档序号:6429479阅读:176来源:国知局
专利名称:一种面向多数据类型信息资源元数据的共享方法
技术领域
本发明涉及一种面向多数据类型信息资源元数据的共享方法,属于信息技术处理领域。
背景技术
信息资源是指由信息业务系统采集、加工、处理的数据资源;典型的信息资源主要以矢量数据、栅格数据和统计数据三种典型的形式存储,它们存储结构和描述方式存在许多差异,利用卫星图像来描述地理信息的遥感影像信息一般存储在FTP服务器上;利用矢量几何要素来描述地理信息的矢量图层通常通过ArcSDE管理,统计信息则主要存放在关系数据库中。信息资源的上述差异使得采用统一的方式来管理这三种数据的信息资源成为一个技术难点。目前面向信息资源元数据的共享方法主要有朱星明等提出的基于数据元的水利科学数据交换方法,阐述了水利科学数据的数据源标准体系结构,为实现水利信息共享提供了很好的基础(朱星明,耿庆斋,王冠华,徐海卿.数据元技术在水利信息资源管理中的应用初探[J]水利技术监督,2007,5,1-3)。陈尹军等在分析了空间元数据格式技术要求的基础上引入网络环境中XML管理元数据,分析了基于XML的元数据的表达和解析,并通过 XML Schema及XSL定义XML文档的模式及输出样式,应用DOM解析元数据XML文档,获取元数据项进行数据更新、添加、删除等管理操作(陈尹军,卞正富,王一冒.基于XML的地理空间元数据管理[J].海洋测绘,2009,四(5) :64-66.),该方法仅实现了。张立等提出了基于“吉奥之星”GIS软件的地理空间元数据管理模型,并将该模型应用于国家地理空间数据交换中心地理空间元数据的生产、管理和使用流程(张立,龚健雅.地理空间元数据管理的研究与实现[J].武汉测绘科技大学学报,2000,25 O) :127-131) 0王卷乐等提出了一种以元数据的集中存储与管理取代了数据集的集中存储与管理,较好地解决了地球系统科学数据共享中的异地、异构数据共享难题;该方法主要用于解决具有地理信息的数据资源的元数据管理。目前,涉及信息资源元数据共享的方法主要是针对单一数据类型的水利信息资源,且以地理空间数据较多,还未对关系数据库(含关系数据表)、遥感影像和矢量图层的等这三种典型的信息资源元数据进行提供统一的共享服务;且对信息资源元数据的共享机制没有严格的质量保证。

发明内容
本发明所要解决的技术问题是针对上述背景技术的不足,提供了一种面向多数据类型信息资源元数据的共享方法。本发明为实现上述发明目的采用如下技术方案一种面向多数据类型信息资源元数据的共享方法,包括如下步骤
步骤1,首先判断信息资源的数据类型,所述信息资源的数据类型包括关系数据、 遥感影像数据、矢量图层数据、通用资源;然后注册数据源,方法如下若信息资源的数据类型为关系数据、遥感影像数据、矢量图层数据,注册信息资源的数据源,然后进入步骤2;若信息资源的数据类型为通用资源,人工录入元数据项,然后进入步骤4 ;所述关系数据包括关系数据库和关系数据表;步骤2,实时自动抽取信息资源的元数据;对于关系数据的信息资源,抽取数据量信息和结构信息;对于遥感影像数据,抽取时空范围信息、坐标系和投影信息、波段信息;对于矢量图层数据,抽取几何对象和数目信息、坐标系和投影信息;步骤3,注册元数据,更新元数据,具体包括如下步骤步骤3-1,判断已注册数据源中信息资源的元数据是否注册;若元数据未注册,进入步骤3-2 ;若元数据已注册,进入步骤3-3 ;步骤3-2,根据信息资源的数据类型注册元数据;若信息资源的数据类型为关系数据库,选择需要注册关系数据库的对象,人工录入元数据项;若信息资源的数据类型为关系数据表、遥感影像数据或者矢量图层数据,先选择数据源,再选择需要录入注册元数据的信息资源,自动生成元数据录入界面并录入元数据项;步骤3-3,更新元数据;若比较信息资源的最后修改时间大于信息资源对应元数据中的资源最后修改时间,更新元数据;否则,进入步骤6 ;步骤4,审核元数据;步骤5,发布元数据,生成不同数据类型信息资源的元数据核心目录服务模式,为不同数据类型的信息资源元数据的核心目录服务模式建立相应的索引;
步骤6,选择资源发现方法,检索索引文件,返回信息资源元数据的核心可返回目录服务模式,对步骤1所述四种数据类型的信息资源统一发现。所述面向多数据类型信息资源元数据的共享方法中,步骤5中所述不同数据类型信息资源的元数据核心目录服务模式的生成方法如下对于关系数据库类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、数据量、资源分类、时空范围、信息资源联系信息、维护信息;对于关系数据表类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、数据量、表结构信息、资源分类、时空范围、信息资源联系信息、维护信息;对于遥感影像数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、快试图,时空范围、卫星、传感器、资源分类、信息资源联系信息、维护信息;对于矢量图层数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、几何要素对象、几何要素对象数量、资源分类、时空范围、信息资源联系信息、维护信肩、ο
所述面向多数据类型信息资源元数据的共享方法中,步骤6所述选择资源发现方法包括选择目录浏览方法、选择联想查询方法、选择组合查询方法、选择时空查询方法,其中若选择目录浏览方法,包括如下步骤步骤6-1-1,点击目录树节点,获取节点编号;步骤6-1-2,检索元数据索引文件,返回与目录树节点及其子节点关联的信息资源数据的核心可返回目录服务模式;若选择联想查询方法,包括如下步骤步骤6-2-1,输入查询关键词,对关键词进行分词解析;步骤6-2-2,检索索引文件,以输入查询的关键词为检索项进行全文查询,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列; 步骤6-2-3,根据信息资源分类目录树进行路径提示,若分类目录树的节点与关键词匹配,则返回给节点的路径以及该节点的直接父节点路径作为联想查询路径,返回匹配节点的父节点作为联想查询关键词;若选择组合查询方法,包括如下步骤步骤6-3-1,输入查询关键词,对关键词进行分词解析;步骤6-3-2,检索索引文件,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列;若选择时空查询方法,包括如下步骤步骤6-4-1,选择地图上的空间查询区域,输入时间范围与查询关键词;步骤6-4-2,检索索引文件,以输入查询的关键词为检索项进行全文检索,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列。本发明采用上述技术方案,具有以下有益效果规范了信息资源共享“注册-审核-发布-发现”的严格质量保证机制,保证了信息资源元数据的动态更新,通过检索信息资源元数据实现了对不同数据类型信息资源的多途径统一发现。


图1为面向多数据类型信息资源共享方法的流程图。
具体实施例方式下面结合附图对发明的技术方案进行详细说明信息资源进行元数据共享的最小对象为一个关系数据库、一张关系数据表、一幅遥感影像、一张矢量图层。按照如图1所示的流程图,实现面向多数据类型信息资源元数据的共享方法,包括如下步骤步骤1,注册数据源;步骤1-1,判断信息资源的数据类型,如为关系数据则执行步骤1-2,若为FTP遥感影像数据则执行步骤1-3,若为ArcSde矢量图层则执行步骤1_4 ;若为通用资源,无需注册
6数据源,直接注册元数据项,然后进入步骤4 ;步骤1-2,关系数据类型(关系数据包括关系数据库和关系数据表)的信息资源数据源,注册数据源的名称、数据库实例名、服务地址、服务端口、方案名、用户名和密码,注册数据源的资源分发单位信息(单位名称、负责人、电话、E-Mail、地址),设置数据源类型标识为0 ;步骤1-3,FTP的遥感影像数据,注册遥感影像数据源的名称、服务地址、服务端口、主目录、用户名和密码,注册数据源的资源分发单位信息(单位名称、负责人、电话、 E-Mail、地址),设置数据源类型标识为1 ;步骤1-4,ArcSde矢量图层,注册矢量图层数据源的名称、服务地址、ArcSde服务名、服务端口、用户名和密码,注册数据源的资源分发单位信息(单位名称、负责人、电话、 E-Mail、地址),设置数据源类型标识为2 ;步骤2,元数据的实时自动抽取,在步骤1中注册数据源的基础上进行对元数据进行定时抽取,生成信息自动抽取元数据,为注册元数据和更新元数据服务。步骤2-1,判断数据源类型标识,如为0则执行步骤2-2,若为1则执行步骤2_3,若为2则执行步骤2-4。步骤2-2,关系数据,对需要共享元数据的关系数据信息资源,采用ORACLE关系数据的接口函数抽取数据库和数据表的模式信息、数据量信息、关系数据最后修改时间。步骤2-3,遥感影像数据,对需要共享元数据的遥感影像信息资源,抽取遥感影像的描述信息,包括影像名称、卫星、传感器、波段、坐标系统、投影系统、遥感影像最后修改时间。步骤2-4,ArcSde矢量图层,对需要共享元数据的矢量图层信息资源,抽取矢量图层的描述信息,包括图层名称、几何要素对象、几何对象要素数目、坐标系统、投影系统、矢量图层最后修改时间等信息。步骤3,元数据注册与更新步骤3-1,在步骤2自动抽取元数据的基础上,判断信息资源的元数据注册状态标识,若为0 (未注册元数据),则执行步骤3-2步骤;若为1 (已注册元数据),则执行步骤3-3步骤。步骤3-2,该信息资源的元数据未注册,进行元数据注册,具体实施如下若信息资源的数据类型为关系数据库,选择需要注册关系数据库的对象,导入自动抽取的元数据,通过元数据自动注册标识建立元数据预分类,并生成元数据录入界面;若信息资源的数据类型为关系数据表、遥感影像数据或者矢量图层数据,先选择数据源,再选择需要录入注册元数据的信息资源,自动生成元数据录入界面并录入元数据项;步骤3-3,更新源数据,针对已经注册的元数据进行更新,比较信息资源的最后修改时间T1与该信息资源对应元数据中的资源最后修改时间T2 ;若T1 > τ2,则利用最新抽取的原始元数据项替换已注册元数据中的相应元数据项,并设置元数据审核状态标识为 1(表示待审核);否则,进入步骤6;其中,人工通过界面录入相关元数据项;录入过程通a^hema进行局部验证,若未通过验证,则定位错误;否则,生成一条信息资源的完整元数据,并设置元数据审核状态标识为1 (表示待审核),设置信息资源的元数据注册状态标识为1 (已注册元数据);步骤4,元数据审核,对于元数据审核状态标识为1的元数据,采用语法校验和语义校验结合进行元数据审核;先通过khema校验元数据的格式,若元数据未通过khema语法验证,则定位错误;管理员通过查看信息资源元数据项进行语义校验;若元数据通过语法校验与语义校验,则设置元数据审核状态标识为2 (表示通过审核),否则,设置元数据审核状态标识为3 (表示未通过审核);步骤5,元数据发布,将元数据审核状态标识为2的元数据发布成目录服务,以支持资源统一发现;包含如下步骤步骤5-1,对于关系数据库类型的信息资源,生成的核心目录服务模式为标题、 摘要、关键词、数据量、资源分类、时空范围、信息资源联系信息、维护信息;对于关系数据表类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、数据量、表结构信息、资源分类、时空范围、信息资源联系信息、维护信息;对于遥感影像数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、快试图,时空范围、卫星、传感器、资源分类、信息资源联系信息、维护信息;对于矢量图层数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、几何要素对象、几何要素对象数量、资源分类、时空范围、信息资源联系信息、维护信息等步骤5-2,为不同数据类型的信息资源元数据的核心目录服务模式(包括核心可查询目录服务模式与核心可返回目录服务模式)建立相应的索引。步骤6,资源统一发现,选择资源发现方法,若选择目录浏览方法,进入步骤6-1 ; 若选择联想查询方法,进入步骤6-2 ;若选择组合查询方法,进入步骤6-3 ;若选择时空查询方法,进入步骤6-4;步骤6-1,目录浏览方法的具体实施包括如下步骤步骤6-1-1,点击目录树节点,获取节点编号;步骤6-1-2,检索元数据索引文件,返回与目录树节点及其子节点关联的信息资源数据的核心可返回目录服务模式;步骤6-2,联想查询方法的具体实施包括如下步骤步骤6-2-1,输入查询关键词,对关键词进行分词解析;步骤6-2-2,检索索引文件,以输入查询的关键词为检索项进行全文查询,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列;步骤6-2-3,根据信息资源分类目录树进行路径提示,若分类目录树的节点与关键词匹配,则返回给节点的路径以及该节点的直接父节点路径作为联想查询路径,返回匹配节点的父节点作为联想查询关键词;步骤6-3,组合查询方法的具体实施包括如下步骤步骤6-3-1,输入查询关键词,对关键词进行分词解析;步骤6-3-2,检索索引文件,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列;步骤6-4,时空查询方法的具体实施包括如下步骤
步骤6-4-1,选择地图上的空间查询区域,输入时间范围与查询关键词;步骤6-4-2,检索索引文件,以输入查询的关键词为检索项进行全文检索,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列。可见,本发明能够实现关系数据、遥感影像、矢量图层三种数据类型信息资源元数据的共享,提供了一套“注册-审核-发布-发现”严格的元数据质量保证机制,支持元数据多级联动更新,提供了对上述三种数据类型信息资源的四种发现方法,并支持查询关键词按照资源分类目录树进行联想查询提示。这样即实现多数据类型的信息资源元数据共享, 又支持信息资源的多途径发现,是信息共享领域的一大突破。
权利要求
1.一种面向多数据类型信息资源元数据的共享方法,其特征在于包括如下步骤 步骤1,首先判断信息资源的数据类型,所述信息资源的数据类型包括关系数据、遥感影像数据、矢量图层数据、通用资源;然后注册数据源,方法如下若信息资源的数据类型为关系数据、遥感影像数据、矢量图层数据,注册信息资源的数据源,然后进入步骤2;若信息资源的数据类型为通用资源,人工录入元数据项,然后进入步骤4; 所述关系数据包括关系数据库和关系数据表;步骤2,实时自动抽取信息资源的元数据; 对于关系数据的信息资源,抽取数据量信息和结构信息; 对于遥感影像数据,抽取时空范围信息、坐标系和投影信息、波段信息; 对于矢量图层数据,抽取几何对象和数目信息、坐标系和投影信息; 步骤3,注册元数据,更新元数据,具体包括如下步骤 步骤3-1,判断已注册数据源中信息资源的元数据是否注册; 若元数据未注册,进入步骤3-2 ; 若元数据已注册,进入步骤3-3 ; 步骤3-2,根据信息资源的数据类型注册元数据;若信息资源的数据类型为关系数据库,选择需要注册关系数据库的对象,人工录入元数据项;若信息资源的数据类型为关系数据表、遥感影像数据或者矢量图层数据,先选择数据源,再选择需要录入注册元数据的信息资源,自动生成元数据录入界面并录入元数据项; 步骤3-3,更新元数据;若比较信息资源的最后修改时间大于信息资源对应元数据中的资源最后修改时间,更新元数据;否则,进入步骤6; 步骤4,审核元数据;步骤5,发布元数据,生成不同数据类型信息资源的元数据核心目录服务模式,为不同数据类型的信息资源元数据的核心目录服务模式建立相应的索引;步骤6,选择资源发现方法,检索索引文件,返回信息资源元数据的核心可返回目录服务模式,对步骤1所述四种数据类型的信息资源统一发现。
2.根据权利要求1所述的面向多数据类型信息资源元数据的共享方法,其特征在于步骤5中所述不同数据类型信息资源的元数据核心目录服务模式的生成方法如下对于关系数据库类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、数据量、资源分类、时空范围、信息资源联系信息、维护信息;对于关系数据表类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、数据量、表结构信息、资源分类、时空范围、信息资源联系信息、维护信息;对于遥感影像数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、 快试图,时空范围、卫星、传感器、资源分类、信息资源联系信息、维护信息;对于矢量图层数据类型的信息资源,生成的核心目录服务模式为标题、摘要、关键词、 几何要素对象、几何要素对象数量、资源分类、时空范围、信息资源联系信息、维护信息。
3.根据权利要求1所述的面向多数据类型信息资源元数据的共享方法,其特征在于步骤6所述选择资源发现方法包括选择目录浏览方法、选择联想查询方法、选择组合查询方法、选择时空查询方法,其中若选择目录浏览方法,包括如下步骤 步骤6-1-1,点击目录树节点,获取节点编号;步骤6-1-2,检索元数据索引文件,返回与目录树节点及其子节点关联的信息资源数据的核心可返回目录服务模式;若选择联想查询方法,包括如下步骤步骤6-2-1,输入查询关键词,对关键词进行分词解析;步骤6-2-2,检索索引文件,以输入查询的关键词为检索项进行全文查询,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列;步骤6-2-3,根据信息资源分类目录树进行路径提示,若分类目录树的节点与关键词匹配,则返回给节点的路径以及该节点的直接父节点路径作为联想查询路径,返回匹配节点的父节点作为联想查询关键词;若选择组合查询方法,包括如下步骤步骤6-3-1,输入查询关键词,对关键词进行分词解析;步骤6-3-2,检索索引文件,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列; 若选择时空查询方法,包括如下步骤步骤6-4-1,选择地图上的空间查询区域,输入时间范围与查询关键词; 步骤6-4-2,检索索引文件,以输入查询的关键词为检索项进行全文检索,返回信息资源元数据的核心可返回目录服务模式,采用余弦距离进行查询结果的相似性度量,并按照相似性递减的顺序排列。
全文摘要
本发明涉及一种面向多数据类型信息资源元数据的共享方法,属于信息技术处理领域。本方法公开了资源数据的发现方法,根据信息资源数据类型的不同,分别对信息资源的元数据数据进行注册、抽取、更新、审核、发布,再结合选择的发现方法发现信息资源。本发明不仅规范了信息资源元数据共享的“注册—审核—发布—发现”质量保证机制,同时保证了信息资源元数据的动态更新,还通过检索信息资源的元数据实现了对不同数据类型信息资源的多途径统一发现。
文档编号G06F17/30GK102254022SQ20111021164
公开日2011年11月23日 申请日期2011年7月27日 优先权日2011年7月27日
发明者冯钧, 卞一路, 唐志贤, 常志华, 成建国, 曾焱, 朱跃龙, 蔡阳, 韦冕, 顾忠国 申请人:水利部水利信息中心, 河海大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1