元数据自动化系统的制作方法

文档序号:9925317阅读:439来源:国知局
元数据自动化系统的制作方法
【专利说明】元数据自动化系统发明领域
[0001]发明的实施例总体上涉及计算机数据库,并且更加特别地,有利于对数据结构的管理,包括其定义和创建、修改、转换和填充(populat1n)。
【背景技术】
[0002]信息的自动处理对商业而言已经是极大的好处,因为在决策路径的每个点上这都大大提高了决策制定者的有效性和效率。每个企业,无论是政府、商用业务还是非盈利组织,都有管理信息的运营的必要性。
[0003]例如,在商用业务的情况下,该信息用于治疗病人、获得客户、输入订单、运送产品、向客户开账单、收集发票、向员工和供应商付款、订购产品、审计存货并且保存雇员、用户和供应商之间的交易记录。
[0004]在正常的事件的过程中,根据每个组织的内部的运营模型,利用软件、计算机硬件、以及数字网络来获取、处理、和整合信息。不幸的是,信息的自动处理充满许多性能不佳的问题,这些问题阻止了可用的、及时的、并且成本有效的数据集成、标准化、以及报告。
[0005]之前的一个方法专注于构建企业数据仓库以从整个组织中收集整合的和标准化的数据。一般的企业数据仓库要求来自许多源的运营数据被提取、转换、并且加载到第三范式的运营数据存储数据库中,其被再一次提取、转换、并且加载到星形和雪花数据仓储(vault)数据库中。数据仓储数据库然后可以被加载到数据集市中,每个专用于特定的部门或功能。
[0006]企业数据仓库构造和运作处理中的每个数据库都必须被设计、维护、并且填充有定制提取转换加载(ETL)功能。此外,在组织能够生成报告并且开始从企业数据仓库中实现收益之前,开发和使用中的所有阶段都必须以某种形式被完成。
[0007]尽管企业数据仓库实现了针对整个组织集中管理的标准化数据,但是这产生非常高的成本。实现全面的企业数据仓库所要求的资源可能对于除了极少数之外的所有的都是难以负担的,因为货币成本可能是天文数字。甚至当货币、资源不是限制因素时,用于建立和实现企业数据仓库的时间通常也是以年来度量的。
[0008]企业数据仓库的另一个缺点起源于企业数据仓库对决策支持应用的专注,其强调摘要信息。这些系统的固有缺点是与客户的标识有关的交易细节丢失。当被应用到诸如客户数据分析等的应用时,企业数据仓库显示出缺点。客户数据分析是将数据与客户的动作、事件、交易、状态等相关联的决策支持分析。摘要信息通常丢失与客户标识有关的细节层面的信息,限制了在这些应用中的企业数据仓库方法的有用性。
[0009]其它方法专注于直接从组织运营数据来创建部门集中的数据集市。部门集中的数据集市仅需要包含与单个部门相关的数据。由于这点,部门集中的数据集市可能小得多。
[0010]由于较小的规模,部门集中的数据集市在时间和金钱方面通常花费较少的资源来建立;然而,这些益处也产生过高的成本。部门集中的数据集市不是集中管理的,并且在质量或数据格式方面不具有一致的标准。
[0011]当部门集中的数据集市被创建时,不一致的标准阻止跨组织的集成。此外,由于每个部门集中的数据集市都是在没有贯穿性的计划的情况下被创建的,因此,要具有数据集市针对每个部门所投资的资源的总量会极大地高于创建单个的计划周详的企业数据仓库。用于维护不一致的部门集中的数据集市的资源也会大大高于维护单个企业数据仓库。
[0012]当前,没有用于解决提供可用的、及时的、并且成本有效的数据集成、标准化、以及报告的问题的全面的解决方案。在工业中一直以来都感受到这样的需求。
[0013]之前的发展没有教导或提出任何解决方案来克服上文中所描述的所有的限制,并且因此,本领域技术人员长期没有得到用于克服这些限制的解决方案。

【发明内容】

[0014]所要求保护的发明针对利用模式定义语言的方法、制品、以及系统,所述模式定义语言具有用于定义链接到实体的特性的元数据并且使所述特性在模块中分组在一起。可以预期,利用模式定义语言来生成针对其间具有链接的模块和实体的并且基于所述特性的物理表。该物理表可以填入符合元数据的数据。
[0015]还可以预期,可以引用模式定义语言以定位物理表并且确定针对模块或实体的物理表是否包括所选择的特性。同样地,仅在物理表包括所选择的特性的情况下,可以引用模式定义语言来定位物理表并且确定物理表是否包括后续选择的特性。
[0016]还可以预期,如果特性与所选择的特性被分组在同一个模块内,则可以根据模式定义语言来确定单跳(one-hop)链接。还可以预期,可以基于临床模式是否和与实体相关联的特性相匹配,将实体分类到相匹配的队列或不相匹配的队列中。
[0017]还可以预期,如果与模块相关联的特性被包括在报告数据定义中,则报告数据定义可以引用模式定义语言以包括该模块。还可以预期,物理表可以分别包括与模块和实体相关联的长度数据和非长度数据。
【附图说明】
[0018]为了便于可以获得并详细理解本发明的上述特征、优点和目标的方式,可以参照附图中示出的本发明的实施例来得到上文简要概述的本发明的更特别的描述。
[0019]然而,应当注意的是,附图仅仅示出了该发明的典型的实施例,并且因此不被认为限制本发明的范围,因为本发明可以承认其它同样有效的实施例。在附图内,相同的附图标记想要指代相同或相对应的部件,并且其中:
[0020]图1呈现了根据本发明的实施例的示例性分布式计算机系统。
[0021]图2呈现了根据本发明的实施例的数据处理系统的示例性框图。
[0022]图3呈现了根据本发明的实施例的示例性元数据表。
[0023]图4呈现了根据本发明的实施例的示例性模式定义模型。
[0024]图5呈现了根据本发明的实施例的示例性模式定义模型表。
[0025]图6呈现了根据本发明的实施例的示例性物理模式表。
[0026]图7呈现了根据本发明的实施例的用于实现和填充运营数据存储的示例性控制流程。
[0027]图8呈现了根据本发明的实施例的用于生成提取转换加载功能的示例性控制流程。
[0028]图9呈现了根据本发明的实施例的用于过滤队列的示例性控制流程。
[0029]图10呈现了如在商业智能工具中所实现的过滤器的屏幕截图。
[0030]图11呈现了根据本发明的实施例的用于利用模式来过滤队列的示例性控制流程。
[0031]图12呈现了如在商业智能工具中所实现的过滤器的屏幕截图。
[0032]图13呈现了根据本发明的实施例的用于生成报告的示例性控制流程。
[0033]图14呈现了如在商业智能工具中实现的报告数据定义的屏幕截图。
[0034]图15呈现了根据本发明的实施例的用于分析报告的控制流程。
【具体实施方式】
[0035]在本发明的实施例的以下的描述中,参照了作为本发明的一部分的附图,并且在附图中,以示例的方式示出了其中可以实现本发明的示例性实施例。应当理解的是,可以利用其它实施例并且可以做出结构上的改变,而不偏离本发明的范围。
[0036]以足够的细节描述了以下的实施例,以使本领域技术人员能够做出和使用本发明。应当理解的是,基于本公开,其它实施例将会显而易见,并且可以做出系统、过程、或者机械改变,而不偏离本发明的范围。
[0037]在以下的说明书中,给出了大量具体的细节以提供对发明的充分理解;然而,显而易见的是,可以没有这些具体细节的情况下实践本发明。为了避免使本发明难以理解,没有详细地公开一些公知的电路、系统配置、和过程步骤。
[0038]此外,为了对本发明的说明、描述、和理解的清楚和方便,公开并且描述多个实施例的地方有一些公共的特征,相似和相同的特征彼此通常用相同的附图标记来描述。实施例已经被编号为第一实施例、第二实施例等,这是为了描述方便而不是要具有任何其它意义或者提供对本发明的限制。
[0039]出于说明的目的,本文中所使用的术语“元数据”被定义为关于数据的数据。本文中所使用的术语“系统”表示或指代根据在其中使用该术语的上下文的本发明的方法和装置。
[0040]本发明的实施例提供了这样一种技术,其应用唯一的模式定义语言并且在构建、生成和填入数据库或数据存储中利用模式定义语言;自动地生成提取-转换-加载功能;启用参考模式定义语言从数据或数据存储中拉取数据的商业智能工具。如在本文中所使用的,商业智能工具一般是指被配置为报告、分析、和呈现数据的软件应用。数据可以存储在数据仓库、数据库、数据存储、数据集市、或其组合中。
[0041]根据一个方面,模式定义语言可以以呈现由模式定义语言定义的特性、实体和模块的关系的模式定义模型来实现或由模式定义模型来表示。模式定义语言定义了运营数据存储的物理表的结构和框架。模式定义语言可以包括用于将模式定义模型映射到物理数据的一个或多个物理实体的关系和位置。因此,模式定义语言定义并且可以被用于访问包含物理数据的特定集合的物理数据的字段。
[0042]有利地,本发明的实施例提供了这样的技术,其用于提供较高抽象层次的模式定义语言,并且提供用于与模式定义语言相接以使得商业智能工具能够以较低的成本、以及更短的时间帧来利用运行数据存储的平台。模式定义语言使得商业智能工具能够在较高的抽象层次操作,因此当底层数据库演进时,工具不再需要被改变。当利用本发明的模式定义语言时,数据库演进是容易的并且是不被中断的
[0043]有利地,通过提供涉及在之前的步骤中所选择的特性类型的选项,利用模式定义语言来访问和查询物理表的商业智能工具向用户提供直观的体验。模式定义语言还可以被用于向物理表提供简单的结构,实现对运营数据存储进行建模和设计的简单并且高效的解决方案。此外,利用模式定义语言允许提取、转换、和加载功能的自动化,以基于模式定义语言结构和被包含在模式定义模型内的元数据来快速地填充运营数据存储。
[0044]在下文中,参照了本发明的实施例和具体的示例;然而,应当理解的是,本发明不限于所描述的具体的实施例或示例。相反,以下的特征和元素的任何组合,无论是否与不同的实施例有关,都被预期为实现和实施本发明。此外,尽管本发明的实施例与其它可能的解决方案和/或现有技术相比可能取得优点,但无论特定的优点是否由给定的实施例实现都不会限制本发明。因此,以下的方面、特征、实施例和优点仅仅是说明性的,并且不被认为是所附权利要求的元素或限制,除非在权利要求中明确记载。同样地,对“本发明”的引用将不被解释为对在本文中所公开的任何创造性的主题的概括,并且不应该被解释为所附权利要求的元素或限制,除非在权利要求中明确记载。
[0045]当所附权利要求中的任何一项被解读为覆盖纯软件和/或固件实现时,至少一个示例中的元素的至少一个由此明确地被定义为包括存储了该软件和/或固件的有形的计算机可读介质。
[0046]本发明的一个实施例被实现为利用计算机系统来使用的程序产品。程序产品的程序定义了实施例(包括在本文中所描述的方法)的功能,并且可以被包括在各种计算机可读存储介质上。计算机可读存储介质在本文中被定义为制品。示例性的计算机可读存储介质包括但不限于:(i)其上永久地存储有信息的不可写的存储介质(例如,计算机内的只读存储器设备,例如可以由CD-ROM驱动器读取的CD-ROM盘其上存储有可改变的信息的可写存储介质(例如,盘式驱动器内的软盘或硬盘驱动器)。当承载着指导本发明的功能的计算机可读指令时,这样的计算机可读存储介质是本发明的实施例。其它介质包括可以通过其来将信息传递到计算机(例如,通过计算机或电话网络,包括无线通信网络)的通信介质。后来的实施例具体地包括将信息传输到互联网和其它网络或者从互联网和其它网络传输信息。当承载着指导本发明的功能的计算机可读指令时,这样的通信介质是本发明的实施例。宽泛地,计算机可读存储介质和通信介质在本文中都被称为计算机可读介质。
[0047]一般而言,被执行以实现本发明的实施例的例程可以是操作系统的一部分或者是具体的应用、部件、程序、模块、对象、或者指令的序列。本发明的计算机程序一般包括将由本机计算机转换成机器可读的格式并且因此转化成可执行指令的大量指令。同样,程序包括或者本地地驻留在程序中、或者在存储器中或存储设备上找到的变量和数据结构。此外,在下文中所描述的各种程序可以基于在本发明的具体的实施例中实现它们所针对的应用而被标识;然而,应当认识到,以下任何特定的程序术语都仅仅出于方便而使用,并且因此本发明不应当限于唯一地在由这样的术语标识和/或暗示的任何特定的应用中使用。
[0048]现在参考图1,其中示出了根据本发明的实施例的示例性分布式计算机系统100。一般地,分布式计算机系统100被不出为分布式环境并且包括计算机系统102和多个网络设备104。计算机系统102可以表示任何类型的计算机、计算机系统或其它可编程的电子设备,包括客户端计算机、服务器计算机、便携式计算机、嵌入式计算机、基于PC的服务器、微型计算机、中型计算机、大型计算机、适用于支持本发明的方法、装置、和制品的其它计算机。
[0049]示例性地,计算机系统102包括网络系统。然而,计算机系统102还可以包括独立设备。在任何情况下,应当理解的是,图1仅仅是计算机系统100的一个配置。本发明的实施例可以应用于任何相当的配置,无论计算机系统102是复杂的多用户装置、单用户工作站、还是本身不具有非易失性存储的网络设备。
[0050]还可以在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实现本发明的实施例。在分布式计算环境中,程序模块可以位于本地和远程的存储器存储设备两者中。就这一点而言,计算机系统102和/或网络设备104中的一个或多个可以是几乎不执行处理的瘦客户端。
[0051]计算机系统102可以包括多个操作者和外部系统,例如由可操作地连接到直接存取存储设备108的大容量存储接口 106、由可操作地连接到显示器112的视频接口 110、以及由可操作地连接到多个网络设备104的网络接口 114所示出。显示器112可以是用于输出可查看的信息的任何视频输出设备。
[0052]计算机系统102被示出为包括经由总线118从主存储器120中获取指令和数据的至少一个处理器116。处理器116可以是适用于支持本发明的方法的任何处理器。
[0053]主存储器120是足够大来保存必要的程序和数据结构的任何存储器。主存储器120可以是包括随机存取存储器、非易失性或备份存储器(例如,可编程或闪速存储器、只读存储器等)在内的存储器设备中的一个或组合。此外,存储器120可以被认为包括物理地位于计算机系统102的其它位置的存储器(例如,被用作虚拟存储器或被存储在大容量存储设备(例如,直接访问存储设备108)上的任何存储容量)或者经由总线118耦合到计算机系统102的另一个计算机上的存储器。
[0054]存储器120被示出为配置有操作系统122。操作系统122是用于管理计算机系统102的操作的软件。
[0055]存储器120还包括访问层122、模式定义语言126、过滤器128、报告数据定义130、一个或多个应用132、以及多个商业智能工具134。应用132、商业智能工具134以及访问层124是包括在各种时间驻留在计算机系统102的各种存储器和存储设备中的多个指令的软件产品。当
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1