建立多维模型和数据仓库模式的映射的方法及相关系统的制作方法

文档序号:6608552阅读:257来源:国知局

专利名称::建立多维模型和数据仓库模式的映射的方法及相关系统的制作方法
技术领域
:本发明总体上涉及信息处理,特别地,涉及用于建立多维模型和数据仓库机制的映射的方法及相关系统。
背景技术
:对于数据仓库而言,成功的操作和使用很大程度上取决于对于大量元数据的有效管理。在数据仓库系统中,存在两类用户技术用户和业务用户。技术用户通常是数据仓库的管理员,他们主要关注关于技术实施层面的元数据。业务用户通常不熟悉诸如数据库结构化查询语言(SQL)等的技术,他们关注对于数据的商业舍义的理解,从而需要数据仓库数据的结构和内容是面向业务而表达的。因此,基于其针对的用户,数据仓库中的元数据可以分为两类业务元数据旨在提供对于数据和过程的面向业务的描述。在数据仓库的环境中,重要的业务元数据包括业务概念模型,其是用于以一种语义的方式对业务知识进行组织的概念模型,通过业务概念、概念属性以及概念之间的关系表示了业务如何运行;多维模型,其是用于为商务智能(BI)应用定义完备要求的概念模型,通过指标(measure)、维度(dimension)和维度层次化表示了如何衡量业务。技术元数据技术元数据提供了在IT基础设施之内对于数据的描述,例如数据所处的位置、数据的名称和服务器访问方法、存储的数据类型种类以及其他属性。例如,技术元数据可以是数据仓库的模式、操作数据源的模式等。从业务元数据到技术元数据的语义映射是构建业务友好的数据仓库的关键。因为这种映射有利地支持以下各项的实现对于数据仓库或者数据集市中的数据进行面向业务的导航;在业务概念层面上进行ad-hoe查询而无需了解查询语言(例如,SQL)的技术细节;基于由业务元数据所表达的联机分析处理(OLAP)要求自动部署数据集市。在现有技术中,多维模型是由业务用户从业务角度出发来限定的,数据仓库模式是由一组或者多组技术用户开发的,而从多维模型到数据仓库(DW)模式(星型模式)的映射,即多维模型的路径表达式到数据仓库模式的路径表达式的映射需要通过手动进行创建。这里,路径表达式包括所关注类的直接属性,以及通过属性链连接两个类的间接属性。创建多维模型的路径表达式到数据仓库模式的路径表达式的映射十分复杂、耗时而且容易出错,因为在多维模型中指标和维度总是彼此相关联的,而对于数据仓库模式来说其语义是隐含的。而且,对于类似的维度很难重新利用原来已经建立的映射。例如,如果在对于保险公司的索赔分析中存在三个维度,投保方教育水平、投保方收入、参保人收入,则对于其中一个维度的映射很难在任何其他维度上重新利用,这是因为对于概念"投保人,,和"参保人,,不存在独立的映射,而且也不存在对于属性"收入,,的独立映射。可见,利用现有技术的方案,建立多维模型和数据仓库模式的映射的是非常复杂的,需要即熟悉业务本身又通晓IT基础设施的专业人员进行大量的工作才能准确的完成。业务用户无法独立地根据其在具体应用中需求,自主便捷而又保证一定正确度的建立各种映射。这使得数据仓库的管理和使用效率大打折扣。
发明内容为了解决现有技术中存在的问题,本发明提出一种能够在很大程度上降低建立多维模型和数据仓库模式的映射的复杂度的方案,而且该方案可以辅助用户创建多维模型的路径表达式到数据仓库模式的路径表达式的复杂映射。这一点对于业务用户来说尤其有利。根据本发明的第一方面,提供一种用于建立多维模型和数据仓库模式的映射的系统,包括多维模型编辑器,用于基于概念模型定义多维模型;映射推理器,用于通过基于概念模型进行推理从基本映射生成更多的简单映射,以便为多维模型中本体路径的相应元素提供映射;数据仓库模式分析器,用于通过对数据仓库模式的信息进行分析,生成能够表达数据仓库模式信息的数据结构;映射合成引擎,用于依据多维模型中本体路径的相应元素的映射通过在数据结构中寻找对应于多维模型中本体路径的相应元素的路径来生成结果映射。根据本发明的第二方面,提供一种用于建立多维模型和数据仓库模式的映射的方法,包括以下步骤基于概念模型定义多维模型;通过基于概念模型进行推理从基本映射生成更多的简单映射,以便为多维模型中本体路径的相应元素提供映射;通过对数据仓库模式的信息进行分析,生成能够表达数据仓库模式信息的数据结构;依据多维;溪型中本体路径的相应元素的映射,通过在tt据结构中寻找对应于多维模型的本体路径的相应元素的路径,生成结果映射。根据本发明的第三方面,提供一种计算机程序产品,用于在由计算设备对其进行执行时,实现根据本发明的方法。通过本发明,能够实现对于现有的基本映射在不同的本体路径中的重用。基于对现有基本映射的重用,在建立多维模型到数据仓库模式的映射时,能够利用表达数据仓库模式的信息辅助用户更加简便和高效地创建其中的复杂映射。并且,通过提供结果映射并允许用户在友好界面中对结果映射进行选择和细化的方式,降低了在创建复合本体路径到数据仓库模式的映射中出现差错的机率。结合附图阅读本发明实施方式的详细描述后,本发明的其它特点和优点将变得更加清楚。为了对本发明实施例的特征和优点进行详细说明,将参照以下附图。如果可能的话,在附图和描述中使用相同或者类似的参考标号以指代相同或者类似的部分。其中图1示出了根据本发明一个实施例的用于建立多维模型到数据仓库模式的映射的系统;图2示意性示出了以本体语言表示的概念模型的示例;图3示意性示出了数据仓库的结构的示例;图4示意性示出了函数依赖图的示例;图5示出了根据本发明一个实施例中的映射合成引擎所采用的生成复合映射的处理流程图;图6示意性示出了函数依赖图中所找到的最短路径;图7示出了根据本发明一个实施例用于建立多维模型到数据仓库模式的映射的方法的处理流程图;图8示意性示出了其中可以实现根据本发明的实施例的计算设备。具体实施方式图1示出了实现本发明一个实施例的用于建立本体路径和数据仓库模式的映射的系统。如图1所示,参考标号100表示根据本发明一个实施例的用于建立多维模型和数据仓库模式的映射的系统。该系统包括四个主要部件,其中参考标号101表示多维模型编辑器;参考标号102表示数据仓库模式分析器;参考标号103表示映射推理器;参考标号104表示映射合成引擎。图1中还示出了作为该系统100的数据信息输入的本体10、数据仓库11、基本映射12,以及作为该系统100的输出信息的结果映射13。根据本发明的一个实施例,用户利用多维模型编辑器101定义符合特定的业务分析要求的多维模型,其中该多维模型依据本体10所表示的概念模型来定义的。例如,本体10是Web本体语言。映射推理器103的输入包括来自多维模型编辑器101的多维模型、本体10以及基本映射12。基本映射12包括本体10所表示的概念模型中的每个元素(概念、关系、属性)到数据仓库模式的映射,并且该基本映射12属于已知的(预先建立的)信息。映射推理器103通过基于概念模型进行推理从基本映射生成更多的简单映射。优选地,映射推理器103在推理时还可以调用本体推理器1031。数据仓库模式分析器102对数据仓库11的模式信息进行分析,生成能够表达数据仓库模式信息的数据结构,并将其输出到映射合成引擎104。映射合成引擎104通过在表达数据仓库模式信息的数据结构中寻找对应于相应本体元素的路径生成从复合本体路径到数据仓库模式的结果映射。优选地,映射合成引擎104可以通过最短路径解析器1041在表达数据库模式信息的数据结构中执行最短路径的查找。映射合成引擎104可以进一步优选地将生成的结果映射进行排序,并输出排序的结果映射列表。由此,用户可以基于系统100输出的结果映射列表,所需的本体路径到数据仓库模式的映射的进行选择或者细化。以下详细阐述系统IOO的工作原理。多维模型编辑器101用于由用户定义多维模型。如前所述,多维模型限定了商务智能(BI)应用定义完备要求,通过指标、维度和维度层次化表示了如何衡量业务。根据本发明的多维模型编辑器101所定义的多维模型的特征在于,其完全使用由本体IO所表示的概念模型中的业务术语来定义。在一个实现中,本体10以OWL语言表达概念模型,则在多维模型编辑器101中多维模型定义语言的核心即为具有路径表达式的OWL语言的扩展。一条本体路径表达式广义上讲可以仅为单个类或属性,即基本本体路径表达式;以及多个属性的链,即复合本体路径表达式。复合本体路径表达式用于指示从一个类(class)到另一类或者数据域(datarange)的关系。以下以BNF范式的形式示出了在多维模型编辑器101本体路径的定义。其中,操作符".,,表示从一个类通过对象属性(objectProprety)到另一个类的遍历,并且访问数据类型属性(datatypeProprety)。由于对象属性可以;坡应用到多个类,所以定义i或类(DomainClass)和值域类(RangeClass)为该属性所施用的类。OntPathExprClassIdatatypeProperty|objectProperty|DomainClass'.,objectProperty['[,RangeClass']']|DomainClass'.,datatypeProperty|OntPathExpr'.,objectProprety['[,RangeClass'],]|OntPathExpr'.'dataytypePropertyobjectProperty::=R|R::=objectpropertynameinontologydataytypeProperty::-datatypepropertynameinontologyDomainClassclassnameinontologyRangeClass::=classnameinontologyClass::=classnameinontology例如,在多维模型编辑器101中,依据图2所示的概念模型(由OWL所表示),为了考察代理的级别与教育程度与签单保费的关系,可能定义一个简单保费分析的多维模型是指标所收保费维度签单代理的级別,签单代理的教育程度这些指标和维度可用从类"保单,,开始的复合本体路径表达式表示为..所收保费::-保单.金额签单代理的级别:=保单.售出[代理].级别签单代理的教育程度:=保单.售出[代理].作为[个人].教育程度由于在本发明中,用户是根据概念模型(本体)来定义多维模型的,因此可以理解,从多维模型到DW模式的映射的关键在于从本体路径表达式到数据库仓库模式的映射。映射规则的源为本体路径表达式,而映射规则目标为数据仓库模式路径表达式,例如数据仓库11的关系数据库(RDB)路径表达式。类似于本体路径表达式,在RDB路径表达式中,表对应于本体中的类,外键对应于本体中的对象属性,而列对应于数据类型属性。应注意,在RDB中,外键仅连接到一个目标表,这一点与本体中的值域不同。以下以BNF范式的形式示出了RDB路径的定义。RDBPathExpr::=Table'.,Rlsp|Tabe'.,column|RDBPathExpr',Rlsp|RDBPathExpr'.'columnRlsp::=FK|'A,Fjq'('Table'.'columncompOpTable'.'column')'Table::=tablenameinRDBschemacolumn::=columnnameinRDBschemaFK::=foreignkeycolumnnameinRDBschemacompOp::='=,|'<=,|'<,|'〉=,|'〉,例如,在数据仓库11存储有如图3所示的关系数据。图3示出了三张表,表301名称为DV—AGT—DEMO,包括AGT_DEMO_ID等列;表302名称为D—AGT—LVL,包括AGT—LVL—ID、AGT—LVL_DESC等列,其中AGT—LVL—ID为主键(PK);表303名称为F—PLCY—EVT,包括PLCY—EVT—ID、LOAD—DAYJD、PROD—CAT等列,其中PLCY—EVT—ID、LOAD—DAY—ID为主键(PK),PROD—CAT、PROD一ID、AGT一LVL一ID为外键。图3的RDB^各径例如包4舌F—PLCY—EVT.AGTLVL一ID.AGT—LVLF—PLCY_EVT.(F—PLCY—EVT.AGT—DEMO—ID=D—AGT—DEMO.AGT—DEMO—ID).AGT—EDU在本发明中,从依据概念模型的多维模型到DW模式的映射是具有4元组<源,目标,条件,翻译>的映射规则。其中,根据本发明,"源"表示本体路径表达式;"目标"表示RDB路径表达式;"条件"表示在目标的何种条件下该映射是正确的,其对应于SQL中的WHERE语句;"转换"表示值转换函数,可以将用于本体属性的值转换为用于RDB模式的列中的数据值。以下以BNF方式的形式表示出了映射规则的语义。MappingRule::=ruelD':'src_pathtgt—path['Condition:,condition]['Translation:{,translation'}']:=OntPathExpr::-RDBPathExpr:-SQIXondition{translationPair';'}translationPair::=constant'=,constant::=uri|literalURIreference::=Stringsrc一pathtgt—pathconditiontranslationtranslationPairconstanturiruleID由于本体路径表达式包括基本本体路径表达式,即单个的类或属性;以及复合本体路径表达式,即表示多个属性的链的间接属性,因此在本发明中所应用的映射规则可以分为两类基本映射和复合映射。在基本映射中,源是本体的单个的类、对象属性或者数据类型属性。根据本发明的实施例,由于多维模型是根据表示为本体的概念模型创建的,所以技术人员可以预先(例如在进行系统开发时)为本体中每个元素(包括类、对象属性、数据类型属性)建立到DW模式的映射。在图l所示的实施例中,基本映射12是预先建立的数据信息,作为映射推理器103的数据输入之一。在复合映射中,复合本体路径表达式,而不是单个的类、对象属性或者数据类型属性。根据本发明的实施例,复合本体路径表达式到DW模式的映射是通过映射合成引擎104在表达数据仓库模式路径到数据仓库模式的结果映射。为了在映射合成引擎104中生成候选引擎,需要两个信息输入,即表达本体路径信息的输入以及表达DW模式信息的数据结构。首先,分别对这两个信息输入进行描述。表达本体路径信息的输入由映射推理器103来提供。映射推理器103通过基于概念模型进行推理从基本映射生成更多的简单映射。具体推理^L则例如可以包括类继承其子类的所有映射属性继承其子属性的所有映射<formula>formulaseeoriginaldocumentpage13</formula>其中M表示映射操作,C表示类,p表示属性。该推理过程中,获取类的所有子类和属性的所有子属性的过程例如可以通过调用位于系统100内部本体推理器(如图I所示的本体推理器1031)或者外部的本体推理器(未示出)来实现。表达DW模式信息的数据结构由数据仓库模式分析器102来提供。数据仓库模式分析器102对数据仓库11的模式信息进行分析,生成能够表达数据库模式信息的数据结构。能够表达数据仓库模式信息的数据结构可以是函数依赖(FD)图。如果数据仓库11是3-NF范式形式的,则数据仓库模式分析器102生成的函数依赖信息是平凡的,即所有的非主键列依赖于主键列。如果数据仓库11不是3-NF范式形式的,则需要预先输入不能从表中导出的函数依赖信息,即在非主键列之间的函数依赖关系。类似于,基本映射12,数据仓库的非主键之间的函数依赖关系是预先建立的已知信息,作为数据仓库模式分析器102的输入(图1未单独示出)。假定数据仓库11的每张表具有作为主键的列,则函数依赖可以表示为以下形式X今Y,其中X可以为一个列并且Y可以为列的集合。接'、5日、",、。、'日'、、'、X+Y,Y,+Z,且<Y,Y,>是<外键,主键>对,则X+Z,对于关系数据库来说,对应的函数依赖图的节点是每个表的列,边表示函数依赖关系或者在<外键,主键>对之间的连接(join)。优选地,如果函数依赖图的边的类型是连接的,则其权重为1,否则权重为0。这样,在数据仓库模式分析器102中的函数依赖图是具有权重的、有向图。如果在关系数据库中具有指向其自身的外键,则该函数依赖图可能具有环。作为一个示例,图3所示的表303的函数依赖信息的子图如图4所示。映射合成引擎104通过在表达数据仓库模式信息的数据结构中寻找对应于相应本体元素的路径生成从复合本体路径到数据仓库模式的结果映射。具体来说,映射合成引擎104的输入包括本体路径表达式Cl.Pl[C2]…Pn-l[Cn].Pa,由映射推理器103输入的已知映射(包括基本映射和经过推理的简单映射。根据本发明的一种实施,例如,可以输入对应CI的映射M(C1)和对于属性Pa的映射M(Pa)。映射合成引擎104的输入还包括由数据仓库模式分析器102输入的函数依赖图G。由于如前所述,映射合成引擎104还可以通过最短路径解析器1041在表达数据库模式信息的数据结构中执行最短路径的查找,因此。映射合成引擎104的输入还可以包括用于进行排序的结果映射的最大返回数目。图5示出了根据本发明一个实施例中的映射合成引擎所采用的生成复合映射的处理流程图。在步骤S500,该处理开始。在步骤S501,获取本体路径Cl.Pl[C2]…Pn-l[Cn].Pa在函数依赖图G中对应的开始节点Ns,即获取C1所映射的外键并且找到其在函数映射图G中的对应节点。在数据仓库的函数依赖图中Ns可能是多个节点。考虑如下示例,经过映射推理器103的推理,映射合成引擎104得到如下映射信息输入代理:-F—PLCY—EVT.AGT一ID[D—AGT]级别-D—AGTLVL.AGT—LVL并且通过数据仓库模式分析器102的分析,映射合成引擎104得到如图4所示的函数依赖图,则对于复合本体路径"代理.级别",在步骤中所获取的针对"代理"所映射的外键的对应节点为Ns={F—PLCY一EVT.AGT一ID}在步骤S502,获取本体路径Cl.Pl[C2]…Pn-l[Cn].Pa在函数依赖图G中对应的结束节点Nt,即获取Pa所映射的列并且找到其在函数映射图G中的对应节点。在数据仓库的函数依赖图中Nt可能是多个节点。例如在上述示例中,所获取的针对"级别"所映射的列的对应节点为Nt={D—AGT—LVL.AGT—LVL}.优选地,在步骤S503中,对函数依赖图G的各个边的权重进行调整,以便得到G,。例如,可以找到映射M(Pl),…,M(Pn)在图G中的对应边,并且将这些边的权重调整为0.3。这样可以使得K最短路径算法在查找最短路径时优先考虑本体路径表达式中类和属性对应的节点。在步骤S504中,针对Ns和Nt在图G,中找到最大返回数目为K个的最短路径。具体地,当Ns和Nt分别为节点的集合时,则针对Ns中的每一个节点s和Nt中的每一个节点t在图G,中找到最大返回数目为K个的最短路径。该步骤例如可以调用位于系统内部的最短路径解析器(例如,图1中所示的最短路径解析器1041)或者位于系统外部的最短路径解析器(未示出)来实现。其中,最短路径解析器例如可以通过任何已知算法例如double-sweep算法、通用Floyd算法等,来实现在具有非负权重有向图中对K个最短路径的查找。例如在上述示例中,在函数依赖图中所找到的最短路径如图6所示。在步骤S505中,将所获得的依赖函数图中的K个最短路径转换为映射表达式。其中映射是通过由标记有"join"的边连接表来建立的,并且应忽略具有权重为"0"的边,除非该边为到达Nt的最后一条边。在步骤S506中,返回结果映射M(P)。例如在上述示例中,为用户提供的结果映射可以为路径1:代理.级别:-F—PLCY—EVT.AGT—LVL—ID[D—AGT—LVL].AGT_LVL路径2:代理.级别:画F—PLCY—EVT.AGT一ID[D—AGT].AGT—LVL一ID[D一AGT—LVL].AGT—LVL在步骤S507中,该处理结束。优选地,映射合成引擎104还可以对所获得的结果映射进行排序,以供用户选择。根据本发明的一个实现,可以按照以下表达式对所获得的结果映射进行排序Rank(p)=weight(p)+otx(l-|SmnSp|/|Sm|),0<a<l其中p为所获得的最短路径,Sm为在函数依赖图中除开始类(CI)和结束属性以外的类和属性所对应的节点的集合,Sp为路径p所包括的节点的集合。所计算的Rank(p)的值越小则该映射与本体路径的相关度越高。当然本领域的技术人员还可以根据具体需求采用任何方式对结果映射进行排序。图7示出了根据本发明一个实施例用于建立多维模型到数据仓库模式的映射的方法的处理流程图。在步骤S700中,该处理开始。在步骤S701中,基于例如由本体所表示的概念模型来定义符合特定业务分析要求的多维模型。用户可以通过图形用户界面选择已经建立的多维模型中的本体路径,作为建立映射的源。在步骤S702中,输入预先建立的基本映射。该基本映射是指概念模型中的每个元素到数据仓库模式的映射。优选地,还可以在基本映射的基础上进行简单推理以得到更多的简单映射。在步骤S703中,生成并输入能够表达数据仓库模式信息的数据结构。该数据结构例如可以是表示数据仓库的函数依赖信息的函数依赖图。在步骤S704中,通过在表达数据仓库模式信息的数据结构中寻找对应于相应本体元素的路径,为复合本体路径生成可能的结果映射。才艮据本发明的一个实现,可以通过在函数依赖图中执行最短路径查找来生成可能的结果映射。优选地,在步骤S705中,对所获得的结果映射进行排序,以供用户选择。根据本发明的一个实现,可以按照以下表达式对所获得的结果映射进行排序Rank(p)=weight(p)+ax(l-|SmDSp|/|Sm|),0<a<l其中p为所获得的最短路径,Sm为在函数依赖图中除开始类(CI)和结束属性以外的类和属性所对应的节点的集合,Sp为路径p所包括的节点的集合。所计算的Rank(p)的值越小则该映射与本体路径的相关度越高。果映^进行排-。'、-。、、"'。,.在步骤S706中,该处理结束。图8示意性示出了可以实现根据本发明的实施例的计算设备。图8中所示的计算机系统包括CPU(中央处理单元)801、RAM(随机存取存储器)802、ROM(只读存储器)803、系统总线804,硬盘控制器805、键盘控制器806、串行接口控制器807、并行接口控制器808、显示器控制器809、硬盘810、键盘8U、串行外部设备812、并行外部设备813和显示器814。在这些部件中,与系统总线804相连的有CPU801、RAM802、ROM803、硬盘控制器805、键盘控制器806,串行接口控制器807,并行接口控制器808和显示器控制器809。硬盘810与硬盘控制器805相连,键盘81]与键盘控制器806相连,串^f亍外部设备812与串^f亍接口控制器807相连,并行外部设备813与并行接口控制器808相连,以及显示器814与显示器控制器809相连。图8中每个部件的功能在本
技术领域
内都是众所周知的,并且图8所示的结构也是常规的。这种结构不仅用于个人计算机,而且用于手持设备,如PalmPC、PDA(个人数据助理)、移动电话等等。在不同的应用中,例如用于实现包含有根据本发明的客户端模块的用户终端或者包含有根据本发明的网络应用服务器的服务器主机时,可以向图8中所示的结构添加某些部件,或者图8中的某些部件可以被省略。图8中所示的整个系统由通常作为软件存储在硬盘810中、或者存储在EPROM或者其它非易失性存储器中的计算机可读指令控制。软件也可从网络(图中未示出)下栽。或者存储在硬盘810中,或者从网络下载的软件可被加载到RAM802中,并由CPU801执行,以便完成由软件确定的功能。尽管图8中描述的计算机系统能够支持根据本发明的提供网络内容以供脱机使用的方案,但是该计算机系统只是计算机系统的一个例子。本领域的熟练技术人员可以理解,许多其它计算机系统设计也能实现本发明的实施例。本发明还可以实现为例如由图8所示计算机系统所使用的计算机程序产品,其可以包含有用于实现根据本发明的提供网络内容以供脱机使用的网络应用服务器的代码;其还可以包含有用于实现根据本发明的用于获取网络内容以供脱机使用的客户端模块的代码。在使用之前,可以把代码存储在其它计算机系统的存储器中,例如,存储在硬盘或诸如光盘或软盘的可移动的存储器中,或者经由因特网或其它计算机网络进行下载。虽然结合附图描述了本发明的实施方式,但是本领域技术人员可以在所附权利要求的范围内做出各种变形或修改。权利要求1.一种用于建立多维模型和数据仓库模式的映射的系统,包括多维模型编辑器,用于基于概念模型定义多维模型;映射推理器,用于通过基于所述概念模型进行推理从基本映射生成更多的简单映射,以便为所述多维模型中本体路径的相应元素提供映射;数据仓库模式分析器,用于通过对所述数据仓库模式的信息进行分析,生成能够表达所述数据仓库模式信息的数据结构;映射合成引擎,用于依据所述多维模型中本体路径的相应元素的映射通过在所述数据结构中寻找对应于所述多维模型中本体路径的相应元素的路径来生成结果映射。2.根据权利要求1所述的系统,包括用户接口,用于支持对所述结果映射进行选择。3.根据权利要求1所述的系统,其中所述基本映射包括概念模型中的每个元素到数据仓库模式的映射,并且所述基本映射是预先建立的。4.根据权利要求1所述的系统,其中所述映射推理器所采用的推理规则包括类继承其子类的所有映射;属性继承其子属性的所有映射。5.根据权利要求1所述的系统,其中所述数据仓库模式分析器通过函数依赖图来表达所述数据仓库模式信息。6.根据权利要求5所述的系统,其中映射合成引擎进一步被配置用于获取所述本体路径在所述函数依赖图中对应的开始节点集合和结束节点集合;针对所述开始节点集合和所迷结束节点集合搜索所述函数依赖图中的最短路径。7.根据权利要求5所述的系统,其中所述函数依赖图是具有权值的有向图,并且所述有向图中各边的权值是可调的,所述映射合成引擎还用于依据函数依赖图的当前权值对所述结果映射进行排序,以供用户选择。8.根据权利要求7所述的系统,其中所述映射合成引擎依据以下表达式对所述结果映射进行排序Rank(p)=weight(p)+ax(l-|SmflSp|/|Sm|),0<a<l其中p为所获得的最短路径,Sm为在函数依赖图中除开始类(CI)和结束属性以外的类和属性所对应的节点的集合,Sp为路径p所包括的节点的集合。9.一种用于建立多维模型和数据仓库模式的映射的方法,包括以下步骤基于概念模型定义多维模型;通过基于所述概念模型进行推理从基本映射生成更多的简单映射,以便为所述多维模型中本体路径的相应元素提供映射;通过对所述数据仓库模式的信息进行分析,生成能够表达所述数据仓库模式信息的数据结构;依据所述多维模型中本体路径的相应元素的映射,通过在所述数据结构中寻找对应于所述多维模型的本体路径的相应元素的路径,生成结果映射。10.根据权利要求9所述的方法,包括以下步骤对所述结果映射进行选择。11.根据权利要求9所述的方法,其中所述基本映射包括概念模型中的每个元素到数据仓库模式的映射,并且所述基本映射是预先建立的。12.根据权利要求9所述的方法,其中从所述基本映射生成更多的简单映射的推理规则包括类继承其子类的所有映射;属性继承其子属性的所有映射。13.根据权利要求9所述的方法,其中所述数据仓库模式信息是通过函数依赖图来表达的。14.根据权利要求13所述的方法,进一步包括以下步骤获取所述本体路径在所述函数依赖图中对应的开始节点集合和结束节点集合;针对所述开始节点集合和所述结束节点集合搜索所述函数依赖图中的最短路径。15.根据权利要求13所述的方法,其中所述函数依赖图是具有权值的有向图,并且所述有向图中各边的权值是可调的,所述方法还包括依据函数依赖图的当前权值对所述结果映射进行排序,以供用户选择。16.根据权利要求15所述的方法,包括依据以下表达式对所述结果映射进行排序Rank(p)-weight(p)+ax(l-|SmDSp|/|Sm|),0<a<l其中p为所获得的最短路径,Sm为在函数依赖图中除开始类(CI)和结束属性以外的类和属性所对应的节点的集合,Sp为路径p所包括的节点的集合。全文摘要本发明提供一种用于建立多维模型和数据仓库模式的映射的系统。该系统包括多维模型编辑器,用于基于概念模型定义多维模型;映射推理器,用于通过基于概念模型进行推理从基本映射生成更多的简单映射;数据仓库模式分析器,用于通过对数据仓库模式的信息进行分析,生成能够表达数据仓库模式信息的数据结构;映射合成引擎,用于通过在数据结构中寻找对应于多维模型的本体路径的相应元素的路径生成结果映射,其中对多维模型的本体路径的相应元素的映射由映射推理器提供。本发明还提供相应的方法和计算机程序产品。通过本发明,基于对现有基本映射的重用,在建立多维模型到数据仓库模式的映射时,能够辅助用户更加简便和高效地创建其中的复杂映射。文档编号G06F17/30GK101286151SQ20071009635公开日2008年10月15日申请日期2007年4月13日优先权日2007年4月13日发明者刘升平,洋杨,裘照明,谢国彤申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1