数据仓库建模中面向业务的金字塔模型设计方法

文档序号:6560335阅读:221来源:国知局
专利名称:数据仓库建模中面向业务的金字塔模型设计方法
技术领域
本发明涉及电信运营商数据仓库应用,尤其是涉及面向业务的电信行业数据仓库多层数据模型设置方法。
背景技术
电信运营商在建设企业数据仓库时,数据仓库建模是其中最重要的一个工作。数据仓库的结构设计与传统数据库设计有所不同。这是因为数据仓库是面向决策支持的,它具有数据量大、更新不很频繁等特点。所以,必须对数据仓库进行精心的优化设计,才能满足数据量快速增加而查询性能并不下降的需求。另外,电信行业的数据仓库的设计必须符合电信运营商现在的业务需求。也就是说,在数据仓库的设计过程中,必须与企业的业务人员、IT人员以及管理人员密切配合,摸清可利用的现有的业务数据、外部数据,以及真正的决策需求。其次,由于数据仓库的建设是一个长期的过程,同时电信业务的变化又是非常快的,如何保证数据仓库模型能够满足不断发展变化的电信业务的需要,也是数据仓库建模需要考虑的一个重要问题。再次,电信运营商用户量大,数据量巨大,需要注意数据仓库粒度和在线存储时间长短,以满足前端应用的响应时间要求,同时也使得初期的投入比较合理。
目前,电信行业比较流行的建模方法,大多数是采用面向主题的建模方法来进行数据仓库建模。IBM、NCR等国外数据仓库厂商的都是采用的面向主题的方法。由于受到这些国外厂商的影响,国内的很多数据仓库实施厂商在进行数据仓库建模时,也会不约而同地选择这种根据业务部门或业务功能进行划分的面向主题的建模方法。
面向主题的数据建模方法,不可否认有其优点。但由于电信业务的行业特殊性,在构建数据仓库时有两个难以解决的问题1)应用及数据集市的生成效率由于电信行业业务的特殊性,及电信市场竞争的激烈性,电信行业运营商对于数据集市的生成效率有着非常高的要求,根据面向主题的建模方法构建的数据仓库,由于没有中间粒度数据的存放,所有的数据集市,都需要从底层的细力度数据生成,生成效率不能完全满足电信行业的这一要求;2)变化频繁的业务分析功能由于国内电信行业市场竞争激烈,以及目前电信运营商的经营管理水平所限,在业务开展的过程中,运营商会根据其自身需求,不断要求数据仓库提供新的业务分析。如何及时响应这些灵活变化的需求,是电信行业数据仓库建模需要解决的一个重要问题。面向主题的建模方法,由于是面向主题进行建模,一旦电信运营商调整业务模式,增加新的业务,原有的主题就不能再覆盖这部分新增的业务,因此要通过改变仓库模型来实现这一要求。
CN03801953.1用数据控制用户界面属性的系统和方法,应用程序被分为独立的部分,一个逻辑部分和一个用户界面部分。逻辑部分操作应用程序中的数据值。用户界面部分负责显示用户界面属性。一个绑定规范描述了用户界面属性与数据值之间的关系。当数据值经历变化时,系统级别代码使用该绑定规范来决定被通知的方式以及决定指导用户界面部分反映用户界面属性中的变化的方式。该绑定规范确定一个源数据项,源数据项中到数据值的一个路径,一个目标用户界面元素,和该目标用户元素上的用户界面属性。可以使用代码或标记语言指定该绑定。
CN03818034.0分层数据格式的数据库模型,涉及将分层数据格式映射到关系数据库管理系统的方法。包括描述符(1,10,11)的分层数据格式映射到关系数据库管理系统的方法,该方法包括如下步骤将描述符(1,10,11)分离成公用格式的部分;和将公用格式的部分存储在关系数据库中的关系(20,21,22...)中。
CN200510049748.1实现信息系统数据自动交换的方法在分析关系数据模型与XML模型的基础上,建立两者之间的映射模型,定义基本的映射函数,建立映射函数库。在分析关系数据库模式与数据交换需求的基础上,根据XML(可扩展标记语言)模型,定义XML模式(XML Schema),并根据映射模型,确立关系数据模式与XML模式之间的映射关系,从映射函数库中选取基本的映射函数,以此建立映射模式。
ETL工具数据仓库的架构大体可以分为三部分后台是数据存储和计算引擎,前端是数据展现分析的用户界面,还有一个重要的部分就是ETL。ETL在数据仓库和业务系统之间搭建起一座桥梁,确保新的业务数据源源不断地进入数据仓库;其次,用户的分析和应用也能反映出最新的业务动态。ETL工具就是对操作数据库中的业务数据进行抽取、转换并将其载入数据仓库存储库的数据集成工具,其主要作用在于对各类业务数据进行清理、标准化和汇总,为基于数据仓库的决策分析应用提供高质量的数据。越来越多的企业正在构建数据仓库来满足其战略决策需要,而采用ETL工具进行数据集成,也已成为企业实施数据仓库项目的首选方案。包括OLAP(联机分析处理)与DM(数据挖掘)都是数据库(数据仓库)的分析工具,重在发现隐藏在数据深层次的对人们有用的模式(Patterns),包括DM(Data Mining),或者说KDD,是从大量原始数据中抽取模式的一个处理过程,抽取出来的模式。
随着企业信息化程度的不断提高,企业内部积累了大量的业务数据。对这些相互独立、分散的数据进行统一处理以满足企业高层决策与分析需要,成为企业信息化建设面临的重大挑战。现有技术未涉及电信业务的行业特殊性,在构建数据仓库时有针对性的解决问题。

发明内容
本发明目的是为了提高应用及数据集市的生成效率针对电信行业业务的特殊性;满足变化频繁的业务分析功能及时响应这些灵活变化的需求,提出数据仓库建模中面向业务的金字塔模型设计方法。
本发明的技术解决方案是数据仓库建模中面向业务的金字塔模型设计方法,在数据仓库中按企业信息模型,将电信企业的实体分为两类业务基本要素以及业务活动要素,并将其归纳为“两个产品、三个流”。两个产品是指电信行业的流量类产品和时长类产品;三个流是指工单流、帐单流、服务保障流。在数据仓库建模过程中,考虑在数据仓库中存放不同粒度数据,从而使得数据仓库满足不同分析应用需要,将工单流、帐单流、服务保障流三个流对应于客户域、服务域、资源域、服务使用域、帐务域、结算域、客服域建立对应的实体关系模型。
数据仓库建模中面向业务的金字塔模型设计方法,是在建设电信企业的数据仓库时,首先,以电信业务及其业务流程为基础,构建基本数据模型;然后,根据电信行业数据仓库的应用不同,对于数据仓库的数据,划分不同的粒度,分层进行存放。从而实现一方面满足业务开展的灵活需要,另一方面满足应用及数据集市的生成效率要求。从而使电信企业的数据仓库能更好地为其业务开展及企业运营服务,提高服务质量,增强企业核心竞争力和决策能力。
模型对应过程基本要素域包括客户、产品、资源、参与成员等类别。这是电信企业进行业务活动的基本要素。基本业务要素发生的活动,我们用业务活动来描述。客户购买产品,即产生订单流;客户使用资源,即产生帐单流;客户投诉、咨询,即产生服务保障流。
为了进一步细化,增强模型的使用性,我们将模型按照不同的业务功能需要进行了划分业务基本要素客户域、服务域、资源域业务活动服务使用域、帐务域、结算域、客服域不同域中的实体中,可以按照时间、地域或客户类型等维度,存放不同粒度级别的数据。如通话语音清单,在时间维上,按照小时——日——周——月等粒度上分别存放了不同粒度的数据。这样就使得前端的应用,在访问数据时,可以有针对性的访问特定粒度级的数据,大大提高了数据仓库的访问效率,即席查询可以访问底层细粒度数据;话务量趋势分析可以访问细粒度数据;日报、周报可以访问中等粗度、粗粒度数据。从而使报表、OLAP分析、即席查询、数据挖掘等应用,可以根据其不同的应用特征,快速提取应用所需要粒度层次的数据,从而大大加快应用及集市的响应的时间,使电信企业能更快地根据市场情况,采取相应的措施,更好地支撑了电信企业对决策支持的业务需要。
根据以上原则就形成了如下图所示的金字塔型数据模型


图1是本发明数据仓库建模中面向业务的金字塔模型图2是本发明业务基本要素和业务活动域框3是本发明业务活动域框图的细化具体实施方式
这里我们以通话清单为例说明该方法的实施方式通话清单是电信行业数据仓库中存储量最大的数据,而电信行业的经营分析系统的相当一部分需求,都与通话清单相关,如通话波动分析、通话量分析、收入分析、客户行为分析、客户价值分析等等,以及各类的报表都离不开对通话清单数据的访问。这就给我们在建模时提出了要求,一、如何保证各类需求的实现;二、如何保证应用对数据的访问效率。按照上面数据仓库建模中面向业务的金字塔模型设计方法,我们将通话清单是服务使用域中的一个实体,也就是客户通过使用电信运营商的网络资源而产生的服务使用记录。除了保存原始清单外,另外还特别设计了基于时段、日、月等的细粒度、中等粗度和粗粒度数据的数据实体。与通话清单相关的应用在访问通话清单时,会根据应用需要,选择访问需要层次上的数据,如基于数据挖掘的客户行为分析,就需要访问到底层的细节数据;日通话波动分析则访问基于时段的细粒度级数据,从而得到一天内话务繁忙的时段;通话量分析则访问基于日的中等粒度级数据,从而能得到一段时间内,日通话量的反展变化趋势,以及与往月(年)的同期对比分析等;月收入分析则可访问基于月的粗粒度级数据。这样,一方面使得同一份数据不需要在数据仓库或数据集市中,存放多份,减少了数据仓库以及数据集市的存储,从而降低了电信运营商,经营分析系统投资;另一方面,也使得不同类型的应用可以根据需要访问不同粒度级别的数据,从而减少了应用对数据的处理工作,减少了网络上的数据交换量,大大缩短的应用的响应时间。
以某电信运营商的情况来看

权利要求
1.面向业务的电信行业数据仓库多层数据模型设置方法,其特征是在数据仓库中按企业信息模型建立客户资料和客户详单信息,将电信企业的实体分为两类业务基本要素以及业务活动要素,两个产品是指电信行业的流量类产品和时长类产品;三个流是指,工单流、帐单流、服务保障流;在数据仓库建模过程中,考虑在数据仓库中存放不同粒度的数据,从而使得数据仓库满足不同分析应用的需要,将工单流、帐单流、服务保障流三个流对应于客户域、服务域、资源域、服务使用域、帐务域、结算域、客服域建立对应的。
2.根据权利要求1所述的面向业务的电信行业数据仓库多层数据模型设置方法,其特征是以电信业务及其业务流程为基础,构建基本数据模型;然后,根据电信行业数据仓库的应用不同,对于数据仓库的数据,划分不同的粒度,分层进行存放。
3.根据权利要求1所述的面向业务的电信行业数据仓库多层数据模型设置方法,其特征是模型对应的基本要素域包括客户、产品、资源、参与成员类别,作为电信企业进行业务活动的基本要素;基本业务要素发生的活动,用业务活动来描述;客户购买产品,即产生订单流;客户使用资源,即产生帐单流;客户投诉、咨询,即产生服务保障流。
4.根据权利要求1所述的面向业务的电信行业数据仓库多层数据模型设置方法,其特征是不同域中的实体中,按照时间、地域或客户类型维度,存放不同粒度级别的数据。
全文摘要
面向业务的电信行业数据仓库多层数据模型设置方法,在数据仓库中按企业信息模型建立客户资料和客户详单信息,将电信企业的实体分为两类业务基本要素以及业务活动要素,两个产品是指电信行业的流量类产品和时长类产品;三个流是指,工单流、帐单流、服务保障流;在数据仓库建模过程中,考虑在数据仓库中存放不同粒度的数据,从而使得数据仓库满足不同分析应用的需要,将工单流、帐单流、服务保障流三个流对应于客户域、服务域、资源域、服务使用域、帐务域、结算域、客服域建立对应的。
文档编号G06Q50/00GK1897026SQ20061010655
公开日2007年1月17日 申请日期2006年7月12日 优先权日2006年4月27日
发明者赵懿敏, 李捷, 曹小华, 郭景东, 张宇闻, 杨璟, 陈松乐 申请人:南京联创科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1