衍生元数据构建方法及装置与流程

文档序号:29571558发布日期:2022-04-09 04:05阅读:233来源:国知局
衍生元数据构建方法及装置与流程

1.本发明实施例涉及元数据技术领域,尤其涉及一种衍生元数据构建方法及装置。


背景技术:

2.元数据可以是描述数据的数据,衍生元数据为无法直接获取,即不直接存在于数据库中,需要根据业务需求衍生出来的元数据。在原始医疗业务软件数据库中,提供了以患者为中心的多维度数据。用户基于科研或者其他目的获取数据后,往往需要由用户自行进行整理,计算出符合当前场景需求的数据。
3.比如,首次术前血红蛋白值,在元数据中本不存在这样的概念,因此,无法直接提取到首次术前血红蛋白值对应的详细数据,需要用户自定义并完成相应计算工作量。然而,这种人为定义并计算衍生元数据对应的被描述数据的方式,当不同用户需要获取同样的衍生元数据时,可能会由于主观认知的偏差,导致存在不同的衍生元数据结果,进而影响后续相关业务的开展。


技术实现要素:

4.本发明实施例提供了一种衍生元数据构建方法及装置,以解决主观原因所导致的衍生元数据的创建结果存在偏差的技术问题。
5.第一方面,本发明实施例提供了一种衍生元数据构建方法,所述方法包括:
6.确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;
7.获取衍生元数据对应的预设衍生策略;
8.基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
9.可选的,所述方法还包括:
10.获取衍生元数据对应的衍生配置信息;
11.基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略。
12.可选的,所述基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略,包括:
13.确定样本数据源以及从所述样本数据源中选择的各样本元数据,其中,所述样本数据源包括各所述样本元数据对应的被描述数据;
14.基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息;
15.获取所述预览信息的校验结果,若所述校验结果为校验通过,则将所述衍生配置信息确定为所述衍生元数据对应的预设衍生策略。
16.可选的,所述基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息,包括:
17.基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句;
18.基于所述数据操作语句以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息。
19.可选的,所述基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句,包括:
20.获取用户在技术视图界面中针对操作关键词配置的关键词信息,将所述关键词信息确定为衍生配置信息;
21.基于所述衍生配置信息生成所述衍生元数据对应的数据操作语句。
22.可选的,所述方法还包括:
23.确定各所述衍生元数据对应的预设衍生策略的调用次数;
24.基于各所述调用次数,在各所述衍生元数据中确定沉淀元数据;
25.将所述沉淀元数据作为原生元数据添加至技术视图界面中。
26.可选的,所述基于各所述调用次数,在各所述衍生元数据中确定沉淀元数据,包括:
27.针对各所述衍生元数据,将所述调用次数满足预设次数阈值的衍生元数据确定为沉淀元数据;或者,
28.按照各所述调用次数从大到小的顺序,对各所述衍生元数据进行排序,基于排序结果确定沉淀元数据。
29.可选的,所述确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,包括:
30.在技术视图界面中展示各预设数据源,获取用户在所述技术视图界面中执行的拖拽操作或创建操作,基于所述拖拽操作或创建操作确定衍生数据源;
31.在所述技术视图界面中展示所述衍生数据源包含的各原生元数据,获取所述用户在所述技术视图界面中执行的选定操作,基于所述选定操作确定所述用户从所述衍生数据源中选择的各原生元数据。
32.可选的,所述在所述技术视图界面中展示各预设数据源,包括:
33.在所述技术视图界面中,展示至少一种逻辑层所包含的各预设数据源;
34.其中,所述逻辑层为数据湖层、数据中心层、数据领域层或数据集市层。
35.第二方面,本发明实施例还提供了一种衍生元数据构建装置,所述装置包括:
36.元数据确定模块,用于确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;
37.策略获取模块,用于获取衍生元数据对应的预设衍生策略;
38.策略执行模块,用于基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
39.第三方面,本发明实施例还提供了一种电子设备,所述电子设备包括:
40.一个或多个处理器;
41.存储装置,用于存储一个或多个程序,
42.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本发明任意实施例提供的衍生元数据构建方法。
43.第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例提供的衍生元数据构建方法。
44.上述发明中的实施例具有如下优点或有益效果:
45.通过确定衍生数据源,以及从衍生数据源中选择的各原生元数据,并获取衍生元数据对应的预设衍生策略,进而基于该预设衍生策略以及衍生数据源中各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据,实现了衍生元数据的自动构建,该方法通过预设衍生策略实现衍生元数据对应的被描述数据的确定,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。
附图说明
46.为了更加清楚地说明本发明示例性实施例的技术方案,下面对描述实施例中所需要用到的附图做一简单介绍。显然,所介绍的附图只是本发明所要描述的一部分实施例的附图,而不是全部的附图,对于本领域普通技术人员,在不付出创造性劳动的前提下,还可以根据这些附图得到其他的附图。
47.图1a为本发明实施例一所提供的一种衍生元数据构建方法的流程示意图;
48.图1b为本发明实施例一所提供的一种显示界面的示意图;
49.图2为本发明实施例二所提供的一种衍生元数据构建方法的流程示意图;
50.图3为本发明实施例三所提供的一种衍生元数据构建方法的流程示意图;
51.图4为本发明实施例四所提供的一种衍生元数据构建方法的流程示意图;
52.图5为本发明实施例五所提供的一种衍生元数据构建装置的结构示意图;
53.图6为本发明实施例六所提供的一种电子设备的结构示意图。
具体实施方式
54.下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
55.实施例一
56.图1a为本发明实施例一提供的一种衍生元数据构建方法的流程示意图,本实施例可适用于根据用户选择的衍生数据源,以及用户在衍生数据源中选择的各原生元数据,确定衍生元数据对应的被描述数据的情况,尤其适用于针对每一种衍生元数据,预先构建衍生元数据对应的预设衍生策略,进而在用户选择衍生数据源以及各原生元数据时,通过衍生元数据对应的预设衍生策略构建衍生元数据,即确定衍生元数据对应的被描述数据,该方法可以由衍生元数据构建装置来执行,该装置可以由硬件和/或软件来实现,该方法具体包括如下步骤:
57.s110、确定衍生数据源以及从衍生数据源中选择的各原生元数据,其中,衍生数据源包括各原生元数据对应的被描述数据。
58.其中,衍生数据源可以是创建衍生元数据所需要用到的原生数据的数据库或数据集。示例性的,衍生数据源可以由临床数据中心、科研数据中心、运营数据中心或指标数据
中心提供。具体的,衍生数据源中存储有各原生元数据对应的被描述数据;原生元数据对应的被描述数据可以是被原生元数据描述的数据,例如,原生元数据为患者姓名,则原生元数据对应的被描述数据为衍生数据源中存储的各个实际患者姓名,如张三、李四等。
59.在本实施例中,确定衍生数据源,可以是:监听用户在显示界面上的操作事件或用户在显示界面上的触发控件,基于监听到的操作事件或触发控件确定衍生数据源。即,本实施例可以将用户当前创建或选择的数据源确定为衍生数据源。示例性的,如图1b所示,展示了一种显示界面的示意图,在该显示界面的左侧可以显示已有的各个数据源对应的控件,如检验报告数据源、手术记录数据源、住院信息数据源、患者信息数据源、缴费记录数据源等,显示界面的右侧可以显示当前选择的衍生数据源所包含的各个原生元数据。具体的,可以监听用户触发的控件,根据用户触发的控件确定衍生数据源,如用户选择了检验报告数据源。当然,还可以监听用户在显示界面上的创建操作,基于用户的创建操作生成衍生数据源,例如,当前显示的已有的各个数据源不能满足用户的选择需求,则用户可以通过触发创建控件,生成新的衍生数据源。
60.在确定出衍生数据源后,进一步的,可以确定用户从衍生数据源中选择的各原生元数据。示例性的,若确定出衍生数据源,即确定出用户选择或创建衍生数据源,则可以向用户展示该衍生数据源所包括的全部原生元数据,进而确定用户在展示的全部原生元数据中选择的原生元数据。其中,在衍生数据源中选择的原生元数据可以是创建衍生元数据所需要用到的元数据。参见图1b,图1b的右侧显示了检验报告数据源(用户选择的衍生数据源)所包含的各个原生元数据,如校验子项目名称=白细胞、白细胞检验值、检验时间、检验子项目名称=血小板、血小板检验值等,用户在展示的各原生元数据中选择了校验子项目名称=白细胞、白细胞检验值以及检验时间。
61.需要说明的是,衍生数据源的个数可以为一个或多个,即,本实施例对用户选择的衍生数据源的个数不作限定。例如,用户当前需要创建的衍生元数据为术前白细胞计数,然而,现有的各数据源中均不存在“术前白细胞计数”这一元数据,因此,可以基于本实施例提供的衍生元数据构建方法,依次选择检验报告数据源以及手术记录数据源作为衍生数据源,并从检验报告数据源中选取检验子项目名称为白细胞、白细胞检验值、检验时间等元数据,从手术记录数据源中选择手术时间等元数据,进而基于选择的各元数据构建衍生元数据。
62.s120、获取衍生元数据对应的预设衍生策略。
63.其中,预设衍生策略可以是预先定义的衍生元数据的计算规则。具体的,针对每一个衍生元数据,均可以预先为衍生元数据制定对应的预设衍生策略,并将各个衍生元数据对应的预设衍生策略存储至策略数据库中,若需要创建衍生元数据,则可以从策略数据库中读取该衍生元数据对应的预设衍生策略。
64.在本实施例中,预设衍生策略具体可以是数据操作语句,如,sql(structured query language,结构化查询语言)语句。通过预先建立各个衍生元数据对应的预设衍生策略,可以实现在构建衍生元数据时,用户仅需选择衍生数据源以及原生元数据即可实现衍生元数据的自动构建。
65.需要说明的是,本实施例对s110以及s120的执行顺序不进行限定。即,s110和s120可以是同时执行,也可以是s120在s110之前执行,等。
66.s130、基于预设衍生策略以及各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据。
67.具体的,本实施例可以通过衍生元数据对应的预设衍生策略中的计算规则,对各原生元数据对应的被描述数据进行数据处理,得到衍生元数据对应的被描述数据,实现衍生元数据的构建。
68.示例性的,可以在获取到衍生数据源、衍生数据源中选择的各原生元数据、以及衍生元数据对应的预设衍生策略后,从该衍生数据源中读取各原生元数据对应的被描述数据,并对读取到的数据执行衍生元数据对应的sql语句,得到执行sql语句后返回的结果集,其中,该结果集包括衍生元数据对应的被描述数据。又或者,还可以直接在衍生数据源中执行sql语句,通过sql语句中的计算规则,针对衍生数据源中选择的各原生元数据对应的被描述数据进行处理,得到返回的结果集,即衍生元数据对应的被描述数据。
69.其中,计算规则可以是指对选择的各个原生元数据对应的被描述数据进行处理以生成衍生元数据对应的被描述数据的规则。示例性的,衍生元数据可以是患者就诊总费用,衍生数据源为患者检验数据源、患者挂号数据源以及患者住院数据源,原生元数据包括患者检验费用、患者挂号费用以及患者住院费用等元数据,预设衍生策略中的计算规则可以是将各衍生数据源中,患者检验费用、患者挂号费用以及患者住院费用等元数据对应的被描述数据相加,即将各个患者的患者检验费用、患者挂号费用以及患者住院费用等实际数值相加,得到各个患者的就诊总费用的实际数值,即衍生元数据对应的被描述数据。
70.如,衍生元数据为术前凝血酶原检验值,则该衍生元数据对应的预设衍生策略(sql语句)可以如下:
71.select"empiid"as empiid,patientname as valuecol,lastimportdttm as createtime,lastupdatedttm as lastupdatetime,"empiid"as primarycol
72.from pa_patientinfo
73.where sexname='凝血常规'
74.or sexname='凝血酶原时间'
75.又例如,衍生元数据为住院期间自费患者,则该衍生元数据对应的预设衍生策略(sql语句)可以如下:
76.select a.medicalrecordno as vkey,a."empiid"as empiid,a.ybname as valuecol,a.lastimportdttm as createtime,a.lastupdatedttm as lastupdatetime
77.,a."empiid"as primarycol
78.from pa_patientinfo a
79.where a.ybname='住院自费'
80.在本实施例中,s110-s130可以由衍生数据配置组件执行。具体的,衍生数据配置组件可以包括衍生数据源对接功能、数据源拖拽功能、衍生策略生成功能、衍生策略查找功能以及衍生元数据生成功能等。其中,数据源拖拽功能可以是获取用户拖拽操作选择的衍生数据源以及原生元数据;衍生数据源对接功能可以是连接衍生数据源;衍生策略生成功能可以是获取用户配置的预设衍生策略;衍生策略查找功能可以是查找用户当前需要生成的衍生元数据对应的预设衍生策略;衍生元数据生成功能可以是根据衍生数据源、原生元数据以及预设衍生策略生成衍生元数据对应的被描述数据。
81.即,本实施例可以提供一种衍生数据配置组件,该组件可以获取用户选择的衍生数据源以及从衍生数据源中选择的各原生元数据,并且,根据衍生元数据对应的预设衍生策略计算衍生元数据对应的被描述数据,将衍生元数据对应的被描述数据进行反馈。
82.本实施例的技术方案,通过确定衍生数据源,以及从衍生数据源中选择的各原生元数据,并获取衍生元数据对应的预设衍生策略,进而基于该预设衍生策略以及衍生数据源中各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据,实现了衍生元数据的自动构建,该方法通过预设衍生策略实现衍生元数据对应的被描述数据的确定,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。
83.实施例二
84.图2为本发明实施例二提供的一种衍生元数据构建方法的流程示意图,本实施例在上述实施例的基础上,可选的,所述方法还包括:获取衍生元数据对应的衍生配置信息;基于衍生配置信息确定衍生元数据对应的预设衍生策略。其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图2,本实施例提供的衍生元数据构建方法包括以下步骤:
85.s210、获取衍生元数据对应的衍生配置信息,基于衍生配置信息确定衍生元数据对应的预设衍生策略。
86.其中,衍生配置信息可以是预先定义的生成衍生元数据所需的配置信息。可选的,衍生配置信息可以是sql语句;或者,衍生配置信息可以是用于生成sql语句的关键词信息,关键词包括但不限于select、from、where、having、orderby以及groupby。
87.需要说明的是,在本实施例中,用户可以针对每一个衍生元数据进行预先配置,以为每一个衍生元数据构建对应的预设衍生策略。即,可以获取每一个衍生元数据对应的衍生配置信息,基于每一个衍生元数据对应的衍生配置信息确定每一个衍生元数据对应的预设衍生策略。
88.在一种实施方式中,可以获取用户录入的衍生元数据对应的衍生配置信息,将衍生配置信息对应的数据操作语句(如sql语句),直接确定为衍生元数据对应的预设衍生策略。
89.在另一种实施方式中,还可以在获取到用户录入的衍生配置信息后,对衍生配置信息进行校验,若校验通过则将衍生配置信息对应的数据操作语句确定为预设衍生策略。示例性的,所述基于衍生配置信息确定衍生元数据对应的预设衍生策略,包括:确定样本数据源以及从样本数据源中选择的各样本元数据,其中,样本数据源包括各样本元数据对应的被描述数据;基于衍生配置信息以及各样本元数据对应的被描述数据,确定衍生元数据对应的预览信息;获取预览信息的校验结果,若校验结果为校验通过,则将衍生配置信息确定为衍生元数据对应的预设衍生策略。
90.其中,样本数据源可以是用户在选取或构建的样本原生数据的数据库或数据集,样本元数据可以是用户从样本数据源中选择的元数据。示例性的,所述基于衍生配置信息以及各样本元数据对应的被描述数据,确定衍生元数据对应的预览信息,包括:基于衍生配置信息确定衍生元数据对应的数据操作语句;基于数据操作语句以及各样本元数据对应的被描述数据,确定衍生元数据对应的预览信息。
91.具体的,可以根据数据操作语句对样本数据源中选择的样本元数据对应的被描述数据进行处理,将处理的结果确定为衍生元数据对应的被描述数据,即衍生元数据对应的预览信息。其中,衍生配置信息可以是数据操作语句或关键词信息。可选的,所述基于衍生配置信息确定衍生元数据对应的数据操作语句,可以是:获取用户在技术视图界面中针对操作关键词配置的关键词信息,将关键词信息确定为衍生配置信息;基于衍生配置信息生成衍生元数据对应的数据操作语句。
92.其中,操作关键词包括但不限于select、from、where、having、orderby、groupby。技术视图界面可以对各个关键词进行显示,用户可以针对至少一个关键词进行配置;进一步的,将用户配置的关键词信息作为衍生配置信息,并根据衍生配置信息(关键词信息)自动生成数据操作语句。
93.进一步的,基于数据操作语句对样本数据源中选择的各样本元数据对应的被描述数据的处理结果,得到衍生元数据对应的被描述数据,即衍生元数据对应的预览信息,将该预览信息进行展示,并获取用户反馈的预览信息的校验结果,在校验结果为校验通过时,表明该衍生配置信息符合衍生元数据的计算规则,可以根据其确定预设衍生策略。
94.通过上述可选的实施方式,还可以实现:若不具备用户当前需要构建的衍生元数据对应的预设衍生策略,则可以获取用户录入的衍生配置信息,基于用户当前录入的衍生配置信息确定衍生元数据对应的被描述数据;并且,还可以将衍生元数据对应的被描述数据进行展示,获取用户反馈的校验结果,若校验结果为校验通过,则可以根据该衍生配置信息确定预设衍生策略。
95.即,用户可以在构建衍生元数据的过程中,通过选择衍生数据源、选择原生元数据、设置衍生配置信息,实现衍生元数据的构建,若衍生元数据的构建结果无误,则可以根据衍生配置信息生成预设衍生策略。该预设衍生策略可以被提供给第三方应用(如大数据搜索引擎、医院平台等),第三方应用可以通过调用预设衍生策略快速实现衍生元数据的构建,使得用户无需再对衍生元数据的计算规则进行手动配置。
96.在该可选的实施方式中,通过衍生配置信息生成衍生元数据对应的预览信息,即衍生元数据对应的被描述数据,进而基于预览信息的校验结果生成预设衍生策略,实现了预设衍生策略的自动校验;并且,还可以根据用户实时定义的衍生配置信息确定预设衍生策略,实现了预设衍生策略的自动生成,进而实现了后续针对衍生元数据的快速构建。
97.s220、确定衍生数据源以及从衍生数据源中选择的各原生元数据,其中,衍生数据源包括各原生元数据对应的被描述数据。
98.s230、获取衍生元数据对应的预设衍生策略,基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
99.本实施例的技术方案,通过衍生元数据对应的衍生配置信息,确定衍生元数据对应的预设衍生策略,实现了预设衍生策略的预先构建,通过本实施例提供的方法,可以预先生成各个衍生元数据对应的预设衍生策略,进而可以通过各个预设衍生策略实现衍生元数据的快速构建,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。
100.实施例三
101.图3为本发明实施例三提供的一种衍生元数据构建方法的流程示意图,本实施例在上述实施例的基础上,可选的,所述方法还包括:确定各衍生元数据对应的预设衍生策略的调用次数;基于各调用次数,在各衍生元数据中确定沉淀元数据;将沉淀元数据作为原生元数据添加至技术视图界面中。其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图3,本实施例提供的衍生元数据构建方法包括以下步骤:。
102.s310、获取衍生元数据对应的衍生配置信息,基于衍生配置信息确定衍生元数据对应的预设衍生策略。
103.s320、确定衍生数据源以及从衍生数据源中选择的各原生元数据,其中,衍生数据源包括各原生元数据对应的被描述数据。
104.s330、获取衍生元数据对应的预设衍生策略,基于预设衍生策略以及各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据。
105.s340、确定各衍生元数据对应的预设衍生策略的调用次数,基于各调用次数,在各衍生元数据中确定沉淀元数据,将沉淀元数据作为原生元数据添加至技术视图界面中。
106.具体的,在本实施例中,可以在预先为各个衍生元数据生成对应的预设衍生策略后,统计各个预设衍生策略的调用次数。若预设衍生策略的调用次数越多,则表明该预设衍生策略对应的衍生元数据在业务需求中的应用场景较多(如临床业务的应用场景、科研业务的应用场景等)。
107.在本实施例中,根据各个预设衍生策略的调用次数,可以对各个衍生元数据进行数据沉淀处理。具体的,可以将调用次数较多的预设衍生策略对应的衍生元数据,确定为沉淀元数据,其中,沉淀元数据可以是作为原生元数据被添加至技术视图界面的衍生元数据。换言之,本实施例可以将调用次数较多的预设衍生策略对应的衍生元数据,确定为原生元数据,并将其在技术视图界面中作为原生元数据进行展示,以便用户可以采用该原生元数据进行其他衍生元数据的构建。
108.示例性的,所述基于各调用次数,在各衍生元数据中确定沉淀元数据,包括:针对各衍生元数据,将调用次数满足预设次数阈值的衍生元数据确定为沉淀元数据;或者,按照各调用次数从大到小的顺序,对各衍生元数据进行排序,基于排序结果确定沉淀元数据。
109.其中,预设次数阈值可以是预先设置的用于沉淀衍生元数据的阈值,如10次、15次等,本技术对此不作限定。可以将调用次数大于或等于预设次数阈值的衍生元数据确定为沉淀元数据;或者,可以根据调用次数从大到小的顺序对各衍生元数据进行排序,取排序结果中的前n名衍生元数据作为沉淀元数据。
110.在本实施例中,在将沉淀元数据作为原生元数据添加至技术视图界面的同时,还可以自定义沉淀元数据的保存位置,将沉淀元数据的关联数据库或关联数据表保存到用户指定的库表中。
111.本实施例的技术方案,通过统计各衍生元数据对应的预设衍生策略的调用次数,基于各调用次数在各衍生元数据中确定沉淀元数据,将沉淀元数据作为原生元数据添加至技术视图界面中,实现了应用场景较多的衍生元数据的转化,通过将应用场景较多的衍生元数据沉淀为原生元数据,使得用户无需再对此类衍生元数据进行构建,用户可以快速使用该类衍生元数据,如选择该类衍生元数据进行其他衍生元数据的构建。
112.实施例四
113.图4为本发明实施例四提供的一种衍生元数据构建方法的流程示意图,本实施例在上述实施例的基础上,可选的,所述确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,包括:在技术视图界面中展示各预设数据源,获取用户在技术视图界面中执行的拖拽操作或创建操作,基于拖拽操作或创建操作确定衍生数据源;在技术视图界面中展示衍生数据源包含的各原生元数据,获取用户在技术视图界面中执行的选定操作,基于选定操作确定用户从衍生数据源中选择的各原生元数据。其中与上述各实施例相同或相应的术语的解释在此不再赘述。参见图4,本实施例提供的衍生元数据构建方法包括以下步骤:
114.s410、在技术视图界面中展示各预设数据源,获取用户在技术视图界面中执行的拖拽操作或创建操作,基于拖拽操作或创建操作确定衍生数据源。
115.其中,预设数据源可以是已预先创建的各个数据源。技术视图界面可以是诸如图1b所示的显示界面,其可以显示各个预设数据源以及各预设数据源所包含的各原生元数据,本实施例对技术视图界面的展示形式不进行限定。具体的,本实施例可以在技术视图界面中展示已有的各个预设数据源,并根据用户在技术视图界面中针对各个预设数据源的拖拽操作,或创建操作,确定衍生数据源。
116.可选的,所述在技术视图界面中展示各预设数据源,包括:在技术视图界面中,展示至少一种逻辑层所包含的各预设数据源;其中,逻辑层为数据湖层、数据中心层、数据领域层或数据集市层。数据湖层中的预设数据源可以是各个医院现场实时业务库的完整复制数据;数据中心层中的预设数据源可以是对数据湖层中的预设数据源初步整合后的数据;数据领域层中的预设数据源可以是根据预设标准对不同逻辑层的预设数据源进行加工后,将数据中心层中的预设数据源整合在一起后的数据;数据集市层中的预设数据源可以是医院项目使用时产生的衍生数据。
117.在本实施例中,示例性的,可以将用户在技术视图界面中的拖拽操作所针对的预设数据源确定为衍生数据源;或者,将用户创建操作生成的预设数据源确定为衍生数据源。
118.s420、在技术视图界面中展示衍生数据源包含的各原生元数据,获取用户在技术视图界面中执行的选定操作,基于选定操作确定用户从衍生数据源中选择的各原生元数据。
119.具体的,在确定出衍生数据源后,可以在技术视图界面展示该衍生数据源包含的全部原生元数据,并监听用户在技术视图界面的操作事件,以获取用户在技术视图界面中执行的选定操作,根据选定操作确定用户从该衍生数据源中选择的各原生元数据。
120.s430、获取衍生元数据对应的预设衍生策略,基于预设衍生策略以及各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据。
121.本实施例的技术方案,通过在技术视图界面中展示各预设数据源,并获取用户在技术视图界面中执行的拖拽操作或创建操作,基于拖拽操作或创建操作确定衍生数据源,进一步的,在技术视图界面中展示衍生数据源包含的各原生元数据,获取用户执行的选定操作,基于选定操作确定用户从衍生数据源中选择的各原生元数据,实现了构建衍生元数据所需的衍生数据源以及原生元数据的确定,进而实现了根据用户选择的衍生数据源以及原生元数据即可实现衍生元数据的自动构建。
122.实施例五
123.图5为本发明实施例五提供的一种衍生元数据构建装置的结构示意图,本实施例
可适用于根据用户选择的衍生数据源,以及用户在衍生数据源中选择的各原生元数据,确定衍生元数据对应的被描述数据的情况,尤其适用于针对每一种衍生元数据,预先构建衍生元数据对应的预设衍生策略,进而在用户选择衍生数据源以及各原生元数据时,通过衍生元数据对应的预设衍生策略构建衍生元数据,即确定衍生元数据对应的被描述数据,该装置具体包括:元数据确定模块510、策略获取模块520以及策略执行模块530。
124.元数据确定模块510,用于确定衍生数据源以及从所述衍生数据源中选择的各原生元数据,其中,所述衍生数据源包括各所述原生元数据对应的被描述数据;
125.策略获取模块520,用于获取衍生元数据对应的预设衍生策略;
126.策略执行模块530,用于基于所述预设衍生策略以及各所述原生元数据对应的被描述数据,确定所述衍生元数据对应的被描述数据。
127.可选的,所述装置还包括策略生成模块,所述策略生成模块包括配置获取单元和策略生成单元;所述配置获取单元,用于获取衍生元数据对应的衍生配置信息;所述策略生成单元,用于基于所述衍生配置信息确定所述衍生元数据对应的预设衍生策略。
128.可选的,所述策略生成单元包括获取单元、预览单元以及校验单元,其中,所述获取单元,用于确定样本数据源以及从所述样本数据源中选择的各样本元数据,其中,所述样本数据源包括各所述样本元数据对应的被描述数据;所述预览单元,用于基于所述衍生配置信息以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息,所述校验单元,用于获取所述预览信息的校验结果,若所述校验结果为校验通过,则将所述衍生配置信息确定为所述衍生元数据对应的预设衍生策略。
129.可选的,所述预览单元包括语句生成单元和预览生成单元,所述语句生成单元,用于基于所述衍生配置信息确定所述衍生元数据对应的数据操作语句;所述预览生成单元,用于基于所述数据操作语句以及各所述样本元数据对应的被描述数据,确定所述衍生元数据对应的预览信息。
130.可选的,所述语句生成单元,具体用于获取用户在技术视图界面中针对操作关键词配置的关键词信息,将所述关键词信息确定为衍生配置信息;基于所述衍生配置信息生成所述衍生元数据对应的数据操作语句。
131.可选的,所述装置还包括沉淀模块,所述沉淀模块包括次数统计单元、沉淀单元以及添加单元;其中,所述次数统计单元,用于确定各所述衍生元数据对应的预设衍生策略的调用次数;所述沉淀单元,用于基于各所述调用次数,在各所述衍生元数据中确定沉淀元数据;所述添加单元,用于将所述沉淀元数据作为原生元数据添加至技术视图界面中。
132.可选的,所述次数统计单元,具体用于针对各所述衍生元数据,将所述调用次数满足预设次数阈值的衍生元数据确定为沉淀元数据;或者,按照各所述调用次数从大到小的顺序,对各所述衍生元数据进行排序,基于排序结果确定沉淀元数据。
133.可选的,所述元数据确定模块510包括第一确定单元和第二确定单元;其中,所述第一确定单元,用于在技术视图界面中展示各预设数据源,获取用户在所述技术视图界面中执行的拖拽操作或创建操作,基于所述拖拽操作或创建操作确定衍生数据源;所述第二确定单元,用于在所述技术视图界面中展示所述衍生数据源包含的各原生元数据,获取所述用户在所述技术视图界面中执行的选定操作,基于所述选定操作确定所述用户从所述衍生数据源中选择的各原生元数据。
134.可选的,所述第一确定单元,具体用于在所述技术视图界面中,展示至少一种逻辑层所包含的各预设数据源;其中,所述逻辑层为数据湖层、数据中心层、数据领域层或数据集市层。
135.在本实施例中,通过元数据确定模块,确定衍生数据源,以及从衍生数据源中选择的各原生元数据,并通过策略获取模块获取衍生元数据对应的预设衍生策略,进而通过策略执行模块,基于该预设衍生策略以及衍生数据源中各原生元数据对应的被描述数据,确定衍生元数据对应的被描述数据,实现了衍生元数据的自动构建,该方法通过预设衍生策略实现衍生元数据对应的被描述数据的确定,使得衍生元数据的构建满足预先定义的计算规则,解决了人为构建衍生元数据时由于主观原因所导致的结果偏差,提高了衍生元数据的创建精度,保证了衍生元数据的一致性。
136.本发明实施例所提供的衍生元数据构建装置可执行本发明任意实施例所提供的衍生元数据构建方法,具备执行方法相应的功能模块和有益效果。
137.值得注意的是,上述系统所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明实施例的保护范围。
138.实施例六
139.图6是本发明实施例六提供的一种电子设备的结构示意图。图6示出了适于用来实现本发明实施方式的示例性电子设备12的框图。图6显示的电子设备12仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。设备12典型的是承担确定衍生元数据创建功能的电子设备。
140.如图6所示,电子设备12以通用计算设备的形式表现。电子设备12的组件可以包括但不限于:一个或者多个处理器或者处理单元16,存储器28,连接不同组件(包括存储器28和处理单元16)的总线18。
141.总线18表示几类总线结构中的一种或多种,包括存储器总线或者存储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业标准体系结构(industry standard architecture,isa)总线,微通道体系结构(micro channel architecture,mca)总线,增强型isa总线、视频电子标准协会(video electronics standards association,vesa)局域总线以及外围组件互连(peripheral component interconnect,pci)总线。
142.电子设备12典型地包括多种计算机可读介质。这些介质可以是任何能够被电子设备12访问的可用介质,包括易失性和非易失性介质,可移动的和不可移动的介质。
143.存储器28可以包括易失性存储器形式的计算机装置可读介质,例如随机存取存储器(random access memory,ram)30和/或高速缓存存储器32。电子设备12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机存储介质。仅作为举例,存储装置34可以用于读写不可移动的、非易失性磁介质(图6未显示,通常称为“硬盘驱动器”)。尽管图6中未示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器,以及对可移动非易失性光盘(例如只读光盘(compact disc-read only memory,cd-rom)、数字视盘(digital video disc-read only memory,dvd-rom)或者其它光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或者多个数据介质接口与总线18相连。存储器28
rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
156.计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
157.计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括——但不限于无线、电线、光缆、rf等等,或者上述的任意合适的组合。
158.可以以一种或多种程序设计语言或其组合来编写用于执行本发明实施例操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言——诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
159.注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1