基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质与流程

文档序号:34733718发布日期:2023-07-12 17:33阅读:23来源:国知局
基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质与流程

本发明涉及信息编码及大数据,并且更具体地涉及一种基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质。


背景技术:

1、当前,数据已经成为社会生产要素之一,推进数据开放共享已经成为各行业、各领域的共识。随着信息化技术的广泛应用,数据的产生源头迅速增多,造成业务开展过程中数据种类繁杂、格式不一、定义不清等现象,难以高效利用和交互共享。

2、元数据(metadata),又称中介数据、中继数据,为描述数据的数据(data aboutdata),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。元数据是关于数据的组织、数据域及其关系的信息,简言之,元数据就是关于数据的数据。

3、元数据发挥着数据识别和交换的“中继”作用,借助于对元数据的采集和管理,可实现对不同数据的标识、定义和映射转换,为建立不同来源数据之间的关联关系提供有效支撑,从而实现数据的集成汇聚、融合计算,发挥数据的深层价值。元数据同时为数据治理提供标准支撑,支撑数据质量管理。由此可见,元数据在数据治理和集成领域发挥着关键的作用。

4、在实际数据治理或数据融合集成实施过程中,元数据承载着核心业务、技术和管理信息,因此元数据信息的完整性、规范性和准确性很大程度上影响着企业数据治理的质量和数据交互的效率。现有技术中,元数据的采集工作一般会采用直接引接数据库的形式,因此目前元数据的治理工作通常仅在单一信息系统范围内进行,无法满足不同系统之间的数据集成交互。

5、特别地,在当前航空产品领域中,往往会涉及复杂业务模式下的跨部门、跨领域、跨层级的数据集成交互,完整、规范的元数据属性信息是航空产品领域中数据互认的基础。因此,当前在航空产品领域中亟需基于统一属性数据模型的元数据全量信息采集技术,从而一方面可以解决不同系统间元数据描述不统一的问题,规范全局共用元数据的表达,另一方面可以使得元数据的管理及应用基于统一的数据模型框架,避免信息不同步而造成的数据无法交互。


技术实现思路

1、本发明各示例性实施例提供了一种基于属性数据模型的元数据采集方法、装置、计算机程序产品、以及计算机可读存储介质,以解决现有技术中的以上技术问题以及其他潜在技术问题中的至少一项技术问题。

2、本发明各示例性实施例第一方面提供了一种基于属性数据模型的元数据采集方法,其特征在于,包括:建立用于航空产品的元数据属性数据模型,所述元数据属性数据模型将元数据的属性信息划分为标识属性、定义属性、表示属性、管理属性、以及关系属性;引接所述航空产品在全寿命周期内产生的数据资源,并按照所述元数据属性数据模型提取所述元数据的第一属性关联信息;所述第一属性关联信息包括所述元数据的标识属性、定义属性、表示属性、以及与申请相关联的管理属性;按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息;利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,并在唯一性校验通过后获得所述元数据的第二属性关联信息,所述第二属性关联信息包括所述元数据的与审核相关联的管理属性;以及按照元数据标识规则向所述元数据赋予唯一的元数据标识符,并根据所述元数据标识符建立所述元数据之间的关联关系,从而获得所述元数据的第三属性关联信息,所述第三属性关联信息包括所述元数据的关系属性。

3、根据本发明示例性实施例,所述标识属性用于标识和区分所述元数据,包括标识符、中文名称、同义名称、英文名称、字母标识、以及表达符号。

4、根据本发明示例性实施例,所述定义属性用于确定和解释所述元数据的含义,包括定义、参考来源名称、以及参考来源密级。

5、根据本发明示例性实施例,所述表示属性用于规定所述元数据所描述数据的表示形式,包括数据类型、长度、值域、以及计量单位。

6、根据本发明示例性实施例,所述管理属性用于所述元数据在全寿命周期过程中的管理,包括所属分类、描述对象、申请人姓名、申请人联系方式、申请单位名称、申请时间、审核人姓名、审核单位名称、审核时间、审核意见、数据状态、发布时间、更新时间、以及废止时间。

7、根据本发明示例性实施例,所述与申请相关联的管理属性包括申请人姓名、申请人联系方式、申请单位名称、以及申请时间;所述与审核相关联的管理属性包括所属分类、描述对象、审核人姓名、审核单位名称、审核时间、以及审核意见。

8、根据本发明示例性实施例,所述关系属性用于确定所述元数据之间的关系,包括基本元数据标识符、以及替代元数据标识符。

9、根据本发明示例性实施例,所述按照与所述元数据的属性信息相对应的约束条件,将提取的所述元数据的所述第一属性关联信息整编为标准格式的第一属性关联信息,包括:按照元数据命名规则将所述第一属性关联信息中标识属性的中文名称整编为标准格式的中文名称;其中,所述元数据命名规则为:所述中文名称为表达所述元数据含义的中文词组或短语,其由对象词、特性描述词、表示类词、限定词组成;其中对象词和表示类词为必选词汇,特性描述词和限定词为可选词汇。

10、根据本发明示例性实施例,所述利用整编后的标准格式的第一属性关联信息对所述元数据进行唯一性校验,包括:通过判断整编后的标准格式的所述第一属性关联信息中标识属性的中文名称是否相同、以及计算整编后的标准格式的所述第一属性关联信息中定义属性的相似度高低,来进行唯一性校验。

11、根据本发明示例性实施例,所述元数据标识符作为所述标识属性中的标识符;所述元数据标识规则为:所述元数据标识符由数据标识符和版本标识符两部分构成;其中所述数据标识符是根据所述元数据采集的先后顺序生成的无含义流水码;所述版本标识符是所述元数据的版本号。

12、根据本发明示例性实施例,所述元数据之间的关联关系包括继承关系和/或替代关系。

13、根据本发明示例性实施例,所述的方法还包括:在赋予唯一的元数据标识符之后,发布所述元数据的属性信息,并在所述元数据的使用过程中持续更新和维护所述元数据的与维护相关联的管理属性。

14、根据本发明示例性实施例,所述与维护相关联的管理属性包括数据状态、发布时间、更新时间、以及废止时间。

15、本发明各示例性实施例第二方面提供了一种基于属性数据模型的元数据采集装置,其特征在于,包括:处理器;存储器,耦合至所述处理器并且存储有指令,所述指令在由所述处理器执行时使所述处理器执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。

16、本发明各示例性实施例第三方面提供了一种计算机程序产品,被有形地存储在非瞬态计算机可读介质上并且包括计算机可读程序指令,当所述计算机可读程序指令在设备上被执行时使得所述设备执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。

17、本发明各示例性实施例第四方面提供了一种计算机可读存储介质,具有存储在其上的计算机可读程序指令,所述计算机可读程序指令用于执行根据以上第一方面所述的基于属性数据模型的元数据采集方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1