一种基于XML的电网多维数据建模方法与流程

文档序号:28429149发布日期:2022-01-12 00:51阅读:106来源:国知局
一种基于xml的电网多维数据建模方法
技术领域
:1.本发明涉及电网维度建模,特别是一种基于xml的电网多维数据建模方法。
背景技术
::2.随着电网行业信息化的迅猛发展,各种数据资源不断积累,对不同业务系统间的数据共享要求紧迫。而各个系统之间缺乏统一的工作流管理和数据标准,出现了数据孤岛、标准困局、共享难题等问题,造成数据壁垒,阻碍数据赋能。数据仓库技术可以很好的解决上述问题,数据仓库的建设中最重要的一个工作是建立适合决策分析的数据模型。而维度模型适合应对大规模数据量的数据处理,并且更好的支持基于数据仓库挖掘和olap(onlineanalyticalprocessing,联机分析处理)操作,可以对大量的业务数据进行多角度、多层次的分析,帮助分析人员更深入理解数据。3.随着电网行业中业务系统的异构数据源越来越多、数据量越来越大、需求分析越来越复杂,构建数据模型的难度也不断上升。技术实现要素:4.发明目的:本发明的目的是提供一种基于xml的电网多维数据建模方法,以满足快速、准确、灵活地构建电网维度模型的需求。5.技术方案:本发明所述的一种基于xml的电网多维数据建模方法,包括以下步骤:6.(1)将olap的多维数据模型抽象为一个包含多维空间的立方体;7.在立方体内部的多维空间中,存在多个维度的轴,每个维度的轴都相互垂直(多维空间的垂直概念已超越一般的三维垂直)。用户关心的数据分布于所有维度组成的多维坐标系中。8.主题:所要分析的某一方面的数据的名称,它可以有多个立方体;立方体:是一个多维数据集,由一个事实表和多个维组成,一个维可以是一个维表;指标:或称为事实,与一个具体的事实表相对应,对应于决策支持中心,是星型模型的中心,它包含着用户所关注的所有度量值;维:维定义了事实研究的中心轴,维需要与一个维表相对应,该维表包含了这个维所能取到的各种聚集方式的值;维层次:维的值往往具有不同层次粒度,维层次是从其它更详细的维中分割出来的一个维,在维层次中,每个递减的级都对应着细节中更详细的级。维层次中的级数对应着查询中的间隔尺寸的有效级;度量:度量是一个对应于研究中心点的变量或测度。度量是一个数值,被赋给事实表中的列;属性:属性是用来限定一个维的对象,属性通常被赋给维表中的列。9.一个主题可以有多个立方体,每个立方体中一个事实、多个维和多个度量组成,维下面可以有多个维层次,而每个主题、立方体事实、维、维层次都可能有多个属性。10.(2)存储层建模,建立符合多维特性的数据存储构,为上层提供数据支持;11.(2.1)分析企业的历史业务数据,发现和提取其中的多维数据对象;12.(2.2)以多维方式对数据存储结构进行调整和改造,最终得到符合多维特性的存储层数据模型。13.使用星型图方法建立基于关系数据库的多维数据模型。按照星型图方法,多维数据模型设计的过程,就是建立指标表、维度表这两种最重要的关系表,并定义指标表与维度表之间的关联,最终得到一个呈星型分布的关系模型。14.(3)应用层建模,建立逻辑上的多维数据立方体;多维数据立方体面向多维操作和多维处理,为联机分析和决策提供对象支持。15.(3.1)定义多维数据立方体的各种数据对象,并规定各个数据对象的物理映射;16.(3.2)将一个结构良好的多维数据立方体与存储层的数据绑定在一起,组成一个完整的olap多维数据模型。17.基于xml的应用层的多维数据模型,也就是多维数据立方体,是通过模型元数据来定义的。模型元数据包括了立方体内各种多维数据对象的定义,还规定了立方体如何映射到存储层的关系模型之上,或称物理映射。通过使用xml,多维数据立方体的元数据可被设计为一个xmlschema。应用层通过xmlschema来定义和存储完整的多维数据立方体,系统借助这个xmlschema来实现模型元数据的组织和存储。建立多维数据立方体schema,需要首先设计一系列xml标签,使用自定义的标签描述各种多维数据对象及其物理映射;然后通过xml标签逐级嵌套的方式,将各种多维数据对象组成完整的多维数据立方体。18.一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于xml的电网多维数据建模方法。19.一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于xml的电网多维数据建模方法。20.有益效果:与现有技术相比,本发明具有如下优点:21.1、解决了电网行业中异构数据源多、数据量大、需求分析复杂和数据模型难以构建的问题;22.2、该基于xml的olap建模方案,针对电网业务中数据存在的问题,分别针对存储层和应用层的多维数据建模提出了行之有效的建模方法,具有高效、准确、灵活的特点;23.3、根据不同的数据需求建立起各类多维数据模型,打破数据标准不统一、数据孤岛等问题;24.4、为olap建模的理论研究和在电网中的应用提供了有意义的参考,能够为电网公司不同业务应用场景的数据需求建立起各类多维数据模型,供不同的应用场景使用,并从不同维度为电网公司业务人员、分析决策人员提供数据支撑;25.5、快速实现了数据的融通共享,为电网公司业务应用提供数据支撑,进一步提高和完善电网公司的管理水平,为电网公司带来更大的竞争力。附图说明26.图1是多维数据模型立方体构建;27.图2是存储层建模;28.图3是应用层建模。具体实施方式29.下面结合附图对本发明的技术方案作进一步说明。30.实施例1:31.一种基于xml的电网多维数据建模方法,包括以下步骤:32.(1)将olap的多维数据模型抽象为一个包含多维空间的立方体;33.在立方体内部的多维空间中,存在多个维度的轴,每个维度的轴都相互垂直(多维空间的垂直概念已超越一般的三维垂直)。用户关心的数据分布于所有维度组成的多维坐标系中。34.主题:所要分析的某一方面的数据的名称,它可以有多个立方体;立方体:是一个多维数据集,由一个事实表和多个维组成,一个维可以是一个维表;指标:或称为事实,与一个具体的事实表相对应,对应于决策支持中心,是星型模型的中心,它包含着用户所关注的所有度量值;维:维定义了事实研究的中心轴,维需要与一个维表相对应,该维表包含了这个维所能取到的各种聚集方式的值;维层次:维的值往往具有不同层次粒度,维层次是从其它更详细的维中分割出来的一个维,在维层次中,每个递减的级都对应着细节中更详细的级。维层次中的级数对应着查询中的间隔尺寸的有效级;度量:度量是一个对应于研究中心点的变量或测度。度量是一个数值,被赋给事实表中的列;属性:属性是用来限定一个维的对象,属性通常被赋给维表中的列。35.如图1所示,一个主题可以有多个立方体,每个立方体中一个事实、多个维和多个度量组成,维下面可以有多个维层次,而每个主题、立方体事实、维、维层次都可能有多个属性。36.(2)存储层建模,建立符合多维特性的数据存储构,为上层提供数据支持;37.(2.1)分析企业的历史业务数据,发现和提取其中的多维数据对象;38.(2.2)以多维方式对数据存储结构进行调整和改造,最终得到符合多维特性的存储层数据模型。39.如图2所示,使用星型图方法建立基于关系数据库的多维数据模型。按照星型图方法,多维数据模型设计的过程,就是建立指标表、维度表这两种最重要的关系表,并定义指标表与维度表之间的关联,最终得到一个呈星型分布的关系模型。40.指标表由指标列和维度外键两个部分构成。指标列用来存储指标数据,除指标列外的其余列都用来存储维度外键。维度外键指向各个维度表的主键,是指标表和维度表相互联系的关键。指标表位于星型图的正中央,用矩形表示。每个维度表都代表数据对象的某一个维度,用于存储维度数据。维度表的主键和指标表的外键一一对应。每个维度表都包含了该维度的全部维度层次。每个维度层次占据维度表中的一个列。每个维度表都分布于星型模型的某一个角上,用菱形表示。建立指标表和维度表之后,利用指标表与各个维度表的主键与外键的关联进行模型组合,由此可得到完整的星型模型。41.本发明以电网中常用的关于电量电费分析分析主题的星型模型来分析。如图2所示,位于其中心的是电量电费的事实表,分布于星型图边上的是六个维度表,分别是时间维表、地区维表、用户属性维表、用户类别维表、行业属性维表和线路台区维表。各维度表的主键与指标表的对应外键相关联。42.(3)应用层建模,建立逻辑上的多维数据立方体;多维数据立方体面向多维操作和多维处理,为联机分析和决策提供对象支持。43.(3.1)定义多维数据立方体的各种数据对象,并规定各个数据对象的物理映射;44.(3.2)将一个结构良好的多维数据立方体与存储层的数据绑定在一起,组成一个完整的olap多维数据模型。45.如图3所示,基于xml的应用层的多维数据模型,也就是多维数据立方体,是通过模型元数据来定义的。模型元数据包括了立方体内各种多维数据对象的定义,还规定了立方体如何映射到存储层的关系模型之上,或称物理映射。46.通过使用xml,多维数据立方体的元数据可被设计为一个xmlschema。应用层通过xmlschema来定义和存储完整的多维数据立方体,系统借助这个xmlschema来实现模型元数据的组织和存储。建立多维数据立方体schema,需要首先设计一系列xml标签,使用自定义的标签描述各种多维数据对象及其物理映射;然后通过xml标签逐级嵌套的方式,将各种多维数据对象组成完整的多维数据立方体。47.针对不同的多维数据对象,以电量电费分析主题为例,设计了以下xml标签:48.《cube》:《cube》定义了整个多维数据立方体,立方体是一系列维度和指标的集合。cube一般是多维数据模型schema最顶层的标签。在物理映射方面,由于指标表处于立方体的核心地位,因此指标表的映射被直接定义在《cube》标签内部,称为table属性。49.《measure》:《measure》就是指标数据,是立方体中用户最关心的度量型数据。指标数据的物理映射通过measure标签的column属性来定义。50.《dimension》:《dimension》代表某一个维度。各个维度将指标数据划分为了更小的分类。对于物理层映射方面,一个维度即对应一个维度表,同时对应一个指向该维度表的外键。dimension标签的内层标签《table》属性用来定义该维度映射的维度表;dimension标签的foreignkey属性定义了该维度表关联的指标表外键。51.《level》:《level》位于《dimension》内部,代表某一维度中的一个维度层次。一个维度可能在概念上分为多个层次。每一个维度层次在物理存储上都映射到维度表中的某一列,物理映射通过column属性来定义。将以上各个xml标签按照逐级嵌套的方式组合到一起,就得到了完整的xmlschema。基于xml的多维数据建模方案在电网中具有广泛的应用,以下给出一个描述电网业务情况的xmlschema。52.实施例2:53.一种计算机存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的一种基于xml的电网多维数据建模方法。54.实施例3:55.一种计算机设备,包括储存器、处理器及存储在存储器上并可再处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述的一种基于xml的电网多维数据建模方法。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1