用于兴趣驱动的商业智能系统中的兴趣驱动的数据共享的系统和方法

文档序号:8501131阅读:422来源:国知局
用于兴趣驱动的商业智能系统中的兴趣驱动的数据共享的系统和方法
【技术领域】
[0001]本发明涉及商业智能系统,具体而言,涉及利用兴趣驱动的商业智能系统生成的数据的共享。
【背景技术】
[0002]商业智能指用于识别、处理和分析商业数据的技术。商业智能系统可以提供商业操作的历史、当前和预测视图。依赖于围绕数据的上下文和知识,在商业操作过程中生成的包括从商业方法生成的数据以及由员工和消费者创建的附加数据的商业数据可以是结构化的、半结构化的或者非结构化的。在许多情况下,从商业方法生成的数据是结构化的,而从消费者与企业交互生成的数据是半结构化或非结构化的。由于在商业操作过程中一般生成的数据量,商业智能系统通常构建在数据仓库之上并且利用数据仓库。
[0003]数据仓库被用来存储、分析和报告数据,例如,商业数据。数据仓库以生产和成本有效的方式利用数据库存储、分析和利用数据。各种数据库是常用的,诸如关系数据库管理系统(RDBMS),诸如来自位于加州Santa Clara的Oracle公司的Oracle数据库,或者大规模并行处理分析数据库,诸如来自位于俄亥俄州Miamisburg的Teradata公司的Teradata。商业智能(BI)和分析工具,诸如来自位于North Carolina的Cary的SAS软件研宄院的SAS,被用来访问存储在数据库中的数据并提供让开发人员生成报告、管理和挖掘所存储的数据、执行统计分析、商业计划、预测和其它商业功能的接口。大部分利用BI工具创建的报告是由数据库管理员创建的,并且底层数据库可以被调整,用于预期的访问模式。数据库管理员可以对具体的关系加索引、预先融合(aggregate)或者约束访问,允许自组织(ad-hoc)报告和探索。
[0004]雪花模式(snowflake schema)是RDBMS中表的布置,其中中心事实表连接到一个或多个维度表。雪花模式中的维度表被规格化到多个相关的表中-对于复杂的模式,将在维度表之间存在许多关系,从而导致看起来像雪花的模式。星形模式(star schema)是雪花模式的特殊形式,其中事实表引用一个或多个维度表。但是,在星形模式中,维度表被规格化到单个表中-事实表是中心并且维度表是星的“点”。
[0005]在线事务处理(OLTP)系统被设计为方便并管理基于事务的应用。OLTP可以指各种事务,诸如数据库管理系统事务、商业或商务事务。OLTP系统通常对用户请求具有低延迟响应。
[0006]在线分析处理(OLAP),OLTP的修改,是回答多维分析查询的方法。OLAP工具使用户能够利用如下三个基本的分析操作分析多维数据:合并(融合数据)、向下钻取(导航数据的细节),以及切割(从多个角度取得具体的数据和视图集合)。任何OLAP系统的基础都是OLAP立方体。OLAP立方体是允许利用从多个角度操纵和分析数据的能力对数据进行快速分析的数据结构。OLAP立方体通常由通过维度分类的被称为量度的数值事实组成。这些事实和量度通常是根据RDBMS中表的星形模式或雪花模式创建的。

【发明内容】

[0007]举例说明了根据本发明实施例的用于兴趣驱动的商业智能系统中的兴趣驱动的数据共享的系统和方法。在一种实施例中,兴趣驱动的数据共享服务器系统包括处理器,连接到处理器并且配置为存储兴趣驱动的数据共享应用的存储器,配置为存储原始数据的原始数据存储器,其中原始数据的一部分包括非结构化的数据,配置为存储描述原始数据的数据描述元数据的元数据存储器,以及配置为存储先前生成的报告的报告存储器,该先前生成的报告包括先前的报告数据和先前的报告数据需求的,其中,兴趣驱动的数据共享应用把处理器配置为:接收报告规范,其中该报告规范包括至少一个报告数据需求;利用先前的报告数据需求和所述至少一个报告数据需求来找出在报告存储器中存储的至少一个先前生成的报告;利用数据描述元数据和所述至少一个报告数据需求来识别在原始数据存储器中存储的原始数据;利用所找出的先前生成的报告和所识别出的原始数据来计算冗余数据元数据,其中该冗余数据元数据标识出所识别出的原始数据与所找出的先前生成的报告中先前的报告数据共用的数据;确定修改后的报告数据需求,其中该修改后的报告数据需求排除由冗余数据元数据标识出的共用数据;利用修改后的报告数据需求从原始数据存储器取回更新的源数据;以及基于更新的源数据和包含在所述至少一个先前生成的报告当中的至少一个中的先前的报告数据来生成报告数据。
[0008]在本发明的另一种实施例中,兴趣驱动的数据共享应用把处理器配置为利用兴趣驱动的数据管道(pipeline)来生成报告数据,其中该兴趣驱动的数据管道被配置为基于报告规范来融合更新的数据和先前的报告数据。
[0009]在本发明的附加实施例中,原始数据存储器与兴趣驱动的数据共享服务器系统分开并远离,并且兴趣驱动的数据共享应用把处理器配置为生成数据源任务,该数据源任务被配置为从原始数据存储器取回更新的源数据。
[0010]在本发明的还有一种附加实施例中,数据源任务把原始数据存储器配置为基于原始数据来生成融合数据,其中原始数据的一部分包括非结构化的数据。
[0011]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享服务器系统还包括数据维度目录,其中该数据维度目录包括与先前生成的报告关联的多个数据维度,其中所述至少一个报告数据需求包括至少一个报告数据维度,并且其中兴趣驱动的数据共享应用把处理器配置为基于数据维度目录和所述至少一个报告数据需求来计算冗余元数据。
[0012]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享应用把处理器配置为基于所生成的报告数据来更新数据维度目录。
[0013]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享应用把处理器配置为利用修改后的报告数据需求来从原始数据存储器取回更新的源数据,其中该更新的源数据满足修改后的报告数据需求的一部分;基于更新的源数据和包含在所述至少一个先前生成的报告当中的至少一个中的先前的报告数据来生成部分报告数据;从原始数据存储器取回补充源数据,其中补充源数据满足修改的报告数据需求的剩余部分;以及利用部分报告数据和补充源数据来生成报告数据。
[0014]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享服务器系统包括被配置为存储融合数据的融合数据存储器,其中更新的源数据包括融合数据,并且其中兴趣驱动的数据共享应用把处理器配置为利用融合数据存储器存储更新的源数据。
[0015]在本发明的还有另一种附加实施例中,所述至少一个报告数据需求当中的至少一个包括标识出至少一个数据源的数据源元数据,其中所述至少一个数据源被配置为存储原始数据并且兴趣驱动的数据共享应用把处理器配置为从所述至少一个数据源取回更新的源数据。
[0016]在本发明的还有另一种附加实施例中,报告数据存储器与兴趣驱动的数据共享服务器系统分开并且兴趣驱动的数据共享应用把处理器配置为:生成数据映射元数据,其中该数据映射元数据利用数据描述元数据来标识出先前的报告数据需求与所接收的报告规范之间的对应关系;基于数据映射元数据,利用所找出的先前生成的报告和所识别出的原始数据来计算冗余数据元数据;以及基于数据映射元数据,基于更新的源数据和包含在所述至少一个先前生成的报告当中的至少一个中的先前的报告数据来生成报告数据。
[0017]本发明还有另一种附加实施例包括用于兴趣驱动的数据共享的方法,包括:利用兴趣驱动的数据共享服务器系统来接收报告规范,其中该报告规范包括至少一个报告数据需求;利用兴趣驱动的数据共享服务器系统,基于先前的报告数据需求和所述至少一个报告数据需求来找出在报告存储器中存储的至少一个先前生成的报告;利用兴趣驱动的数据共享服务器系统,基于数据描述元数据和至少一个报告数据需求来识别在原始数据存储器中存储的原始数据;利用兴趣驱动的数据共享服务器系统,基于所找出的先前生成的报告和所识别出的原始数据来计算冗余数据元数据,其中该冗余数据元数据标识出所识别出的原始数据与所找出的先前生成的报告中先前的报告数据共用的数据;利用兴趣驱动的数据共享服务器系统,确定修改后的报告数据需求,其中该修改后的报告数据需求排除由冗余数据元数据标识出的共用数据;利用兴趣驱动的数据共享服务器系统,基于修改后的报告数据需求来取回更新的元数据;以及利用兴趣驱动的数据共享服务器系统,基于更新的元数据和包含在所述至少一个先前生成的报告当中的至少一个中的先前的报告数据来生成报告数据。
[0018]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的数据共享服务器系统中的兴趣驱动的数据管道来生成报告数据,其中该兴趣驱动的数据管道被配置为基于报告规范来融合更新的数据和先前的报告数据。
[0019]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享还包括把兴趣驱动的数据管道配置为生成数据源任务,该数据源任务被配置为利用兴趣驱动的数据共享服务器系统来从与兴趣驱动的数据共享服务器系统分开并远离的原始数据存储系统取回更新的源数据。
[0020]在本发明的还有另一种附加实施例中,数据源任务把原始数据存储器配置为基于原始数据来生成融合数据,其中原始数据的一部分包括非结构化的数据。
[0021]在本发明的还有另一种实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的数据共享服务器系统来基于数据维度目录和所述至少一个报告数据需求计算冗余元数据,其中该数据维度目录包括与先前生成的报告关联的多个数据维度并且所述至少一个报告数据需求包括至少一个报告数据维度。
[0022]在本发明的还有另一种实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的数据共享服务器系统来基于所生成的报告数据更新数据维度目录。
[0023]在本发明的还有另一种实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的数据共享服务器系统来基于修改后的报告数据需求取回更新的源数据,其中更新的源数据满足修改后的报告数据需求的一部分;利用兴趣驱动的数据共享服务器系统来基于更新的源数据和包含在所述至少一个先前生成的报告当中的至少一个中的先前的报告数据生成部分报告数据;利用兴趣驱动的数据共享服务器系统来取回补充源数据,其中该补充源数据满足修改后的报告数据需求的剩余部分;以及利用兴趣驱动的数据共享服务器系统来基于部分报告数据和补充源数据生成报告数据。
[0024]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的数据共享服务器系统来存储更新的源数据。
[0025]在本发明的还有另一种附加实施例中,兴趣驱动的数据共享还包括利用兴趣驱动的
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1