一种数据仓库中复杂多维层次的连接和聚集方法

文档序号:6474989阅读:366来源:国知局

专利名称::一种数据仓库中复杂多维层次的连接和聚集方法
技术领域
:本发明涉及一种数据仓库中联机分析处理技术中的查询方法,尤其是涉及一种低粒度数据的连接和聚集处理来生成高效的物化视图方法,属于计算机
技术领域

背景技术
:通过对数据仓库中的低粒度数据的预聚集处理来生成高效的物化视图是联机分析处理(OLAP)的一个重要技术,而OLAP操作一般都是涉及大量数据的即席复杂查询。用户通过提交OLAP查询对数据进行分析,辅助决策,通常需要较快的查询响应速度。提高OLAP查询处理的性能是数据仓库领域的关键性研究问题。目前主要有MOLAP(multi-dimensional0LAP)和ROLAP(relational0LAP)两种方式可用于OLAP查询的实现。近几年,人们在ROLAP方面开展了大量的研究工作,并且提出了若干技术来提高ROLAP查询的响应速度,如新的索引技术、实物化视图技术、采样(sampling)优化技术等,但是很多方法使用这些技术解决OLAP查询操作时都存在不支持分组聚集操作、只能应用于简单特定模型等不足之处。
发明内容本发明所要解决的技术问题是提供一种数据仓库中的数据处理方法,可实现复杂的多维层次上的连接和聚集操作转化成事实表上的区域查询,从而在处理多维层次聚集的同时,提高连接和聚集的效率。为解决上述技术问题,本发明提供一种数据仓库中复杂多维层次的连接和聚集方法。本发明中,OLAP操作结合多个维的属性,将某一具体维的层次联合代理扩展为能够适用于多个维的情况。复杂多维层次的一棵层次树H-Tree是一个以ALL为根节点的DAG(directedacyclicgraph),可用二元组Γ=(π,表示。其中π={ALL,^1,π2,…,πη}是Γ中节点集合,礼表示Γ中有瓜―π」}是Γ中有向连线集合。设维D的值域为识={σι,σ2,…,at},对应层次树H-Tree的深度记为Y,则它有Y+1层的有序集族,记为Π={ξ°,ξ1,…,ξγ}。如果λ=(Xl,χ2,…,xffl)满足下列条件,则称λ为层次树H-Tree的第i层(0彡i彡γ)ξ1的成员组①depth(χj)=i;(1彡j彡m)②义工识;③Ii=UOSjSmxj;④对νχρ,Xqe€1且乂1)乒乂(1,则χΡΠ心=0;其中Cbpth(Xj)为X的深度,第i层的第j个成员(1彡j彡m)简记为χ)。显Si^=U(XiSiKjSmx)。处于同一层次上的各成员所表示的实体集不相互重叠。3成员χ丨的子成员集定义为权利要求一种数据仓库中复杂多维层次的连接和聚集方法,其特征在于,包括以下步骤1)把多维层次每个维上的约束通过层次联合代理转换成区域查询,并把满足条件的属性值集放入临时表中;2)根据分组属性排序结果集;3)根据位图连接索引,获得每个分组的位图;4)根据每个分组的位图中的置1位,选取事实表中的记录,并通过期望的聚集函数来计算它们;5)删除临时表。2.根据权利要求1所述的一种数据仓库中复杂多维层次的连接和聚集方法,其特征在于,在所述步骤1)中,对于事实表FT,维表DT1,…,DTm,分组属性GA1,…,GAm,层次树H-Tree的联合代理编码文件CS1,…,CSm,位图连接索引p1,pn,聚集属性Aggr(A),将初始查询Q分解成单维查询Ql,…,Qm,其中Qj(1彡j彡m)为对维表DTj的简单查询,仅包含原查询Q中与维表DTj有关的查询条件和相关字段。3.根据权利要求2所述的一种数据仓库中复杂多维层次的连接和聚集方法,其特征在于,在所述步骤2)中,Forj=1tom1)对于查询Qj得查询条件Cqj,查找编码文件CSj得该条件字段所对应的联合代理编码ω;2)Fori=1to(l_m(CSj)_l_o(CSj))21)ω#=ωII“0";22)ω##=ωII〃I";3)选择所有编码在(0#和ω##之间的记录插入到临时表Tempj中;4)根据查询Qj中的分组属性GAj,使用K_ary合并算法来分组排序临时表Tempj;5)Fork=1toCompj//Comp等于Tempj中分组的组数,51)根据位图连接索引Pj对各组中每条记录所对应的在Pj中的列执行OR操作,从而得到各分组的位图Bmjk;52)将分组属性GAj的各分组值和各分组的位图Bmjk构成的元组(GAj,Bmjk)插入到临时表#Temj中。4.根据权利要求3所述的一种数据仓库中复杂多维层次的连接和聚集方法,其特征在于,在所述步骤3)中,根据PsJoin连接算法对m个临时表#切!111,…,#temm中的分组属性进行连接,并把它们所对应的位图执行AND操作,并删除那些位图矢量全为O的元组,得到一新表Grp—Agg—tab(GA1,…,GAm,Grp—Bitmap)。5.根据权利要求4所述的一种数据仓库中复杂多维层次的连接和聚集方法,其特征在于,在所述步骤4)中,根据每个分组的位图中的置1位,选取事实表中的记录,并通过期望的聚集函数来计算它们,并将将结构插入到聚集度量表Agg_Mes_table中。全文摘要本方法涉及一种数据仓库中降低连接和聚集操作的方法,包括以下步骤,1)把多维层次每个维上的约束通过层次联合代理转换成区域查询,并把满足条件的属性值集放入临时表中;2)根据分组属性排序结果集;3)根据位图连接索引,获得每个分组的位图;4)根据每个分组的位图中的置1位,选取事实表中的记录,并通过期望的聚集函数来计算它们。本方法可以在处理多维层次聚集的同时,连接和聚集的效率性能有显著的提高。文档编号G06F17/30GK101944116SQ20101028686公开日2011年1月12日申请日期2010年9月20日优先权日2010年9月20日发明者张波,沈益东,黄震华申请人:常州伊冉科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1