一种对消息类业务数据进行多维分析的方法和系统的制作方法

文档序号:7973036阅读:208来源:国知局
专利名称:一种对消息类业务数据进行多维分析的方法和系统的制作方法
技术领域
本发明属于电信技术领域,涉及一种对消息类增值业务数据进行分析的方法 和系统。
背景技术
增值业务是电信业一个重要的利润支撑点,消息类业务是电信增值业务中的 重要收入组成部分。对增值业务的各类数据进行有效分析,将有助于指导业务开 展、提高服务质量、提供决策支持、最终实现持续的利润增长,因此数据分析的 重要性毋庸置疑。
现阶段增值业务的数据分析手段,通常包括两大类
一类是增值业务设备厂商提供的0&M (运维系统)的分析手段,通过本地操 作维护系统可以实现特定业务流程的信令跟踪、业务观察、性能计数器、统计报
表等功能,这些功能主要用于进行问题定位、原始数据收集与汇总;
一类是增值业务的KPI数据采集及上报,比如通过SNMP (简单网管协议)、 FTP、 FTAM (文件传输访问和管理)等接口提供必要的规范化设备侧信息,交由 运营商或者第三方进行后续汇总分析处理,这一类总的说来属于增值业务的北向 数据接口。对于这种情况,通常是运营商制定统计指标规范,并由设备提供商按 规范进行实现。
现实的情况是,0&M系统虽然可以深入到业务流程的内部,获得最详细的业 务数据,但0&M更多关注的是特定的业务流程性信息,而北向数据接口由于受到 运营商规范制定的限制,往往提供的是硬性裁剪后的二维数据,偏重于宏观的 KPI指标数值,不足以揭示业务的各种丰富的内在联系。即使运营商通过BOSS 系统或其它第三方系统对采集的原始CDRs进行后续处理,例如经营分析系统, 也通常会缺失业务系统中有价值的原始信息。
总的来讲,现有的消息类增值业务的数据统计分析系统和方法具有以下弊

1. 相似的增值业务系统缺少统一的数据分析模型,系统重复建设,增大了开 发工作量。
2. 基于二维的RDBMS (关系型数据库),业务数据的内在复杂的关联无法很 好的体现,不利于实现联机事务分析和决策支持。

发明内容
为解决所述技术问题,本发明提供一种对消息类业务数据进行多维分析的方 法和系统,该方法和系统能够建立简洁、快速的数据分析模型,减少开发工作量, 并有利于联机支持。
本发明的另一个目的在于提供一种对消息类业务数据进行多维分析的方法 和系统,该方法和系统通过星形架构的数据组织模式建立多维数据模型,从而能 够快速地进行数据分析。
本发明所涉及的一种对消息类业务数据进行多维分析的方法包括如下步骤
1、 数据采集,数据采集模块负责将业务系统中分散在各个网元节点上的生 产数据采集到统计分析服务器上的一个中间数据库中;
2、 数据整合,数据转换与装载模块负责将中间数据库的数据转换处理到一 个具有星型架构特征的关系型数据库中,并根据需要进一步处理到数据中;整合 包括对消息类业务的各种待分析数据进行整理,将具有共同或相近特性的数据 进行归类,并纳入到一个统一的维度层次结构中;对中间数据库的数据进行进一 步的清洗、转换以处理到另一个多维数据库中;
3、 数据分析与呈现,通过数据分析与呈现模块负责对数据仓库或关系型数 据库中具有多维特征的业务数据进行分析和呈现。
在数据采集步骤中,首先定义针对不同数据源的数据抽取标准方法,完成异 构数据源(各类数据库、话单文件和业务日志文件)的原始数据采集工作,并保 存到本地的一个中间数据库中,该中间数据库包含了业务系统所有经初步清洗的 待分析数据。在原始数据采集过程中通过配置文件的方式定义待抽取库表的详细 信息,包括表名、字段名、字段类型等。
在数据整合步骤中,需要创建消息业务的多维数据模型,实现业务数据的整 合。设计星型架构作为数据组织的基本方式,即以事实数据表为中心,多个维度
表通过各自的键列联接到事实数据表上。
根据星型架构设计与之对应的数据仓库架构,将该多维数据库采用增量更新 和按分区刷新相结合的方式装载到数据仓库的Cube (多维立方体)中。
星型架构所包含的事实表包含条数、字节流量和费用字段,且每个星型架构 所包含的维度表都有且仅有一个键列联接到事实数据表。
根据该方法建立的一种对消息类业务数据进行多维分析系统,包括以下模

数据采集模块,负责将业务系统中分散在各个网元节点上的生产数据采集到 统计分析服务器上的一个中间数据库中。所述的网元节点包括多台业务处理机、 话单服务器、日志服务器、操作维护服务器。所述的生产数据是放置于网元节点 上的以文件和数据库方式保存的业务系统原始数据。
数据转换与装载模块,负责将中间数据库stagedb的数据转换处理到一个具 有星型架构特征的关系型数据库olapdb中,并根据需要进一步处理到数据仓库 中。
数据分析与呈现模块,负责对数据仓库或关系型数据库中具有多维特征的业 务数据进行分析和呈现。所述的分析与呈现是指通过B/S的方式展现预定义报 表、根据分析主题定制査询和报表、对数据仓库的数据实现多维分析等。
所述的数据转换处理包括三个主要模块维度表处理模块、事实表处理模块 和异常数据处理模块。维度表处理模块负责完成维度数据的收集和更新,以及对 维度的属性数据进行预先计算处理;事实表处理模块负责完成事实数据的收集和
更新,以及通过维护与维度表的主外键关系实现与维度表的关联;异常数据处理
模块负责对系统异常数据进行额外处理。所述的数据装载是指将olapdb的星型 架构数据增量或刷新处理到数据仓库,以便于后续分析的过程。
数据分析与呈现模块包括预定义报表、定制查询与报表和多维分析子模块。 采用本发明,能在相似的增值业务系统中共享多维数据模型,减少系统的开 发周期和成本。应用该模型建立的系统所具有的多维度数据分析的功能,可为运 营商和设备制造商提供更为灵活方便的数据统计方法及决策支持。


图1是本发明业务数据分析系统的模块构成与其它元件的连接示意图2是本发明业务数据分析系统的业务数据星型架构示意图3是本发明业务数据分析系统的数据转换与装载模块工作原理示意图。
具体实施例方式
如图l所示,本发明的业务统计分析系统主要有以下三个模块组成,包括数 据采集模块、数据转换与装载模块、数据分析与呈现模块。
数据采集模块负责将业务系统各业务处理机的话单文件、日志文件和配置文 件等获取到统计服务器上并入库,同时也将业务系统各节点数据库的用户信息、 原始配置、计数器数据获取到统计服务器的数据库中。
数据转换与装载模块负责将已经入库的各类原始数据进行进一步清洗和转 换,使之符合星型架构的库表结构,并根据需要按照预先设计的规则将星型架构 的关系型数据装载入数据仓库。
设计星型架构(图2所示)作为数据组织的基本方式,即以事实数据表为中 心,多个维度表通过各自的键列联接到事实数据表上。根据业务数据自身特点及 方便后续分析的考虑,为消息类业务设计多个这样的星型架构。
各星型架构的事实表的数据不重复,以保证整个业务系统数据的一致性,维 度表则为所有事实表所公用。该多维数据模型覆盖业务系统中所有具有统计分析 价值的数据。
通过对消息类业务的各种待分析数据进行整理,将具有共同或相近特性的数 据进行归类,并纳入到一个统一的维度层次结构中。消息类业务至少可以归纳出 以下维度用户终端号码、用户终端型号、时间、服务提供商信息、业务应用类 型、业务计费类型、0T话单类型、地区信息、业务状态码信息等。
对于每一个维度,进一步设计其层次结构级别和维度的成员属性,例如对于 用户终端号码维度,设计为包括归属省份代码、地区代码、服务品牌代码等三个 级别,在每一个级别上根据需要再设计出省份描述、地区描述、品牌编码和品牌 描述等维度成员的属性。
星型架构所包含的事实表包含条数、字节流量和费用字段,且每个星型架构 所包含的维度表都有且仅有一个键列联接到事实数据表。条数、字节流量和费用等作为业务多维分析的最重要的度量值,后续的统计分析都在计算它们的具体数 值、研究数值的变化规律、影响因素、未来走向等。
对中间数据库的数据进行进一步的清洗、转换以处理到另一个多维数据库 中,该多维数据库符合前述的星型架构模型。
根据星型架构设计与之对应的数据仓库架构,将该多维数据库采用增量更新 和按分区刷新相结合的方式装载到数据仓库的Cube (多维立方体)中。
数据分析与呈现模块负责对装载入数据仓库的数据和某些原始关系型数据 进行分析和呈现,该模块为用户提供统计报表、即时查询和多维分析的人机界面。
并根据每个Cube所装载的业务数据的特点,定制不同主题的统计报表。
再根据联机分析主题设计B/S界面,完成界面分析主题翻译成数据仓库操作 指令,进而将査询返回结果以报表或图表的形式进行展现。
以上三个模块可以放置于一台计算机上,也可以根据系统业务量负荷分设在 不同的计算机上。
以下分别对业务统计分析系统各个模块的工作原理进行说明
1、数据采集模块
数据采集模块负责将业务系统中分散在各个节点上的生产数据收集到上。分 析服务器这里所指的节点包括多个具有同等业务处理功能的业务处理机,以及话 单服务器、日志服务器和操作维护服务器等。无论是MMS彩信业务还是SMS短消 息业务,从功能划分上都具有这些服务器,其操作系统包括Unix、 Limix和 Windows等主流操作系统。各节点的数据存放的形式包括数据库 (Oracle/Sybase/SQL Server)、文件(话单文件、业务日志文件、配置文件等)。
数据采集模块由独立的一组进程和基于数据库的一组任务来完成数据的采 集。数据收集的手段包括文件获取及入库、基于链接服务器和数据库复制技术的 数据库间数据传送。对于文件类的生产数据由该组独立进程负责采集,对于数据 库类的生产数据由该组基于数据库的任务负责采集。该模块包括文件类生产数据 处理子模块和数据库类生产数据处理子模块,文件类生产数据采用两个独立进程 分别完成文件获取与入库工作,进程间不进行通讯。
以下说明文件类生产数据的采集处理过程-
统计服务器上包括两个独立的与文件生产数据采集相关的进程,一个是文件获取进程, 一个是文件解析入库进程。
文件获取进程首先读取包括各节点IP地址、口令、文件存放路径等配置信 息,之后启动FTP的客户端,将各业务节点的文件收集到统计服务器的指定目录 下。文件获取进程所依赖的服务器地址信息、日志及话单文件的存放路径信息、 文件的格式(文本或者二进制)、字段分隔符、文件的命名规则及扩展名信息、 统计分析服务器上日志文件的存放路径等众多的信息都是可配置的。本进程的不 同线程完成不同类型文件的处理。对于同类文件的处理又主要分为两个阶段,首 先是将文件获取到本地一个用于中转的文件夹"中间数据库(Stagedb)"(以下 均称为"中间库")中,然后根据配置文件对本类文件进行初步分拣和信息完整 性检査,对于不符合规范的错误日志将筛选并保存到独立的文件中以备后续进行 额外处理。经过以上处理的文件按照文件的不同种类被放置于指定文件夹"关系 型数据库(olapdb)"。
文件解析入库进程负责将已获取到分析服务器上的文件写入数据库。入库过 程对于不同的目标数据库类型具有相似的处理方式。 一个处理循环包括读取各 类配置信息、将待入库数据读入内存、对源文件进行改名、创建对指定目标数据 库的数据库连接、组装SQL语句、完成批量入库、对已处理文件改名、重新载入 新文件。
对于存放在各业务节点数据库中的数据,由于生产数据库包括0racle、 Sybase和SQL Server等,因此数据抽取方法不一样,本系统定义了两种数据抽 取标准,对于Oracle和Sybase,采用链接服务器的方式;对于SQL Server,则 采用数据库复制和DTS(数据转换服务)的方式。
无论是文件方式还是数据库方式,生产数据最终都被综合到stagedb中,该 中间库包含了所有的经初步抽取和格式转换后的原始业务信息,也包括所有有用 的系统配置信息。
对于系统注册用户数据、手机号段配置信息、SP业务信息、终端型号配置 等信息,数据分布在业务系统的各个节点数据库中,其数据导入的基本过程以系 统注册用户数据为例,包括
1).制定对生产数据库的访问通道。读取配置文件和数据配置表以确定用户 数据所在的服务器局号、节点号、IP地址、数据库名称、访问方式等,保存为
中间变量。如果生产库位于多个节点,则循环读入上述信息。根据中间变量动态 创建链接服务器以链接至对应的数据库,并测试链接的可用性;此处链接服务器 根据源数据库的类型不同,设定不同的创建参数,包括使用不同数据库提供程序 如Oracle Provider for OLE DB或Microsoft OLE DB Provider for ODBC等。 2).完成对生产数据库的数据采集和初步整理。建立好对各生产库的数据库 访问通道后,对待抽取生产库表进行顺序读取。不同特性的生产库表在数据量上 差别很大,根据待抽取数据库表的id主键取值确定本条记录是否为新增记录, 根据最后更新时间字段确定本条记录是否进行过更新,并通过DTS (数据转换服 务)或者存储过程完成新增及修改记录向中间库的同步。 2、 数据转换与装载模块
图3是数据转换与装载模块的示意图。本模块的基本功能是对已经统一写入 中间数据库stagedb的数据进行进一步清洗转换处理,处理的结果数据存放在 olapdb的数据库中,该数据库的多表间具有星型架构(如图2所示)的特点, 为装载入数据仓库做好准备。之后,按照已经设计完成的数据仓库架构,定时任 务会触发从星型架构的olapdb表往数据仓库装载多维数据的过程。
从stagedb到olapdb的数据转换处理主要包含以下过程
1)维度表数据同步更新;
stagedb库包含了业务系统各种维度的原始数据,但这些数据是零散的,且 通常不符合维度设计的层次结构要求,因此通过DTS (数据转换服务)和存储过 程来实现生产表到维度表的转换。考虑到每次维度数据同步更新涉及到的数据量 可能较大,加上维度表与事实表数据之间有主外键关联关系,维度表数据不采用 每次重建的方式,而是增量更新的方式。以用户号码维度的转换过程为例,处理 流程依次为在DTS包里完成配置信息的初始化;建立到中间库的连接;读取中 间库号码表的标志列确定本次待处理行;通过数据库基本操作指令实现维度数据
的同步;将原始维度表异常数据写入异常维度信息表;更新olapdb维度表的属 性字段信息。
处理流程中所述的维度数据的同步包括
A新增维度数据处理根据源表的最新id值将本次新增维度数据插入到
olapdb维度表;
B维度信息更新处理根据源表的id值确定本行不是新增维度信息,根据 源表的标志列确定本行的部分信息发生了更新,在对olapdb数据库中的维度表 进行更新操作中关联已确定发生了信息更新的记录以更新维度表数据;
维度表属性字段信息通过一组存储过程来实现,以完成诸如注册用户数、新 增注册用户数等维度成员属性的计算。
经过以上处理,将stagedb库的新增及变化了的原始维度数据以较小的计算 量更新到olapdb的维度表中。
2) 事实表数据抽取与转换;
一个事实表数据抽取与转换的过程包括
首先将stagedb中分散在多表的原始事实数据进行规整处理,汇集到olapdb 的一个临时表中,该临时表具备对应的星型架构事实表和维度表在最细粒度下的 聚合信息,之后对该临时表所包含的所有维度信息进行处理,以使其与olapdb 的维度表在最低的层次(Level)上发生关联,并经过若干中间转换,最后增量更 新到olapdb的事实表中。例如, 一个话单原始事实表中包含了一个日期类型的 时间字段,而在话单事实表中表示该时间的字段是一个Int型字段,该字段与时 间维度表的Id字段具有外键关联关系。从原始事实表转换为事实表后,原来的
datetime类型的时间信息就变为对应时间维度表的一个外键值。通过一系列处 理将原始事实表中所有具体的维度取值转换为维度表中对应的键值。规整处理的
方法主要包括库表之间的关联更新和聚合操作(group by)。 Stagedb中零散的 事实数据在多次转换后填充到星型架构的事实表中。
由于业务数据的数据量设计为忙时500条/秒或更多,因此在按星型架构组 织的数据库olapdb中,事实表数据采用按月分表存储。
3) 质疑数据处理;
对于原始事实表中某些无法与对应的维度表产生主外键关联关系的记录,称 为质疑数据。这类数据将一直被保存在异常数据表中,并在每次的事实表数据抽 取与转换处理的最后阶段进行额外处理,重新试图与维度表进行匹配。若匹配上, 则重新处理到事实表中,否则一直被保留在异常数据表中。
数据装载主要包括以下过程
基于星型架构的事实表和维度表构建Cube (数据仓库立方体),根据后续
0LAP (联机分析与处理)分析的热点设计聚合度,增量处理维度更新和维度属性 值,根据processed标识字段增量装载事实表数据至Cube的对应分区。 数据装载具有以下特点
A、 Cube所依赖的事实表不是基于表,而是基于由多个分表所组成的联合视图。
B、 Cube采用MOLAP (多维0LAP)的存储方式,同时由于大量的数据分析通 常发生在少数几个连续的自然月时间粒度里,因此Cube按月进行自动分区,以 加快后续0LAP分析时的相应速度。
3、 数据分析与呈现模块
数据分析与呈现模块直接面向最终用户,为用户提供直观、方便的B/S界面 来分析业务系统的数据。该模块所基于的数据以数据转换与装载模块中生成的数 据仓库为主,也可以包括关系型数据库的数据。
数据分析与呈现模块包括预定义统计报表子模块、定制查询报表子模块以及 多维分析子模块。其中,报表子模块根据数据仓库Cube的划分,又分为多个报 表大类,包括综合类、终端类和SP (服务提供商)类等。预定义报表可以支持 众多数据的统计分析,可采用小时报表、日报表和月报表的形式进行展现,提供 几大类、几十个小类和数百个统计项,典型的统计报表如
A、 综合类增值业务KPI统计、业务分省地区统计、业务各类成功率统计、 业务流量统计、业务流量分布统计、业务量的用户分布统计等
B、 终端类系统注册终端型号数据排名、终端收发消息条数及成功率排名、 终端收发SP消息条数排名及分布统计等
C、 增值业务提供商类SP业务量及成功率统计、SP上下行消息条数综合统计与排名等
预定义报表的工作流程为通过浏览器界面选择查询统计报表的条件,程序 根据査询条件拼装针对Cube和关系型数据库的查询指令,该查询指令通过预定 义的数据库/数据仓库访问接口传递给数据源,界面根据返回的数据集按照设定 的呈现样式展现统计报表。所述的呈现样式包括html、 excel、 csv、 pdf和xml 等。
本模块中,定制査询与报表的工作流程与预定义报表的流程区别在于定制査询与报表的行列字段定义都是在界面中设定的,程序获取定制报表的行列字段
定义进行语法分析,并进一步组装对于Cube和关系型数据库的査询指令。而预 定义报表的査询主体中行列定义、字段具体含义均预先定义为报表定义文件,査 询过程只传递时间、地区或业务名称等少量参数。
多维分析与预定义报表、定制报表的区别在于
A、 预定义和定制报表的査询条件和字段定义确定后,查询结果将以一张二 维报表的方式进行展现。而多维分析中,界面展现所有Cube维度及度量值的要 素。用户首先选定某些维度的取值,之后在界面上设置一个或多个维度作为分析 列、 一个或多个维度作为分析行、 一个或多个度量值作为数据项。通过动态展开 分析行及分析列可以获得在不同维度取值影响下的度量值数据,分析行及分析列 维度在不同层次(level)上自动进行数据的聚合。
B、 预定义和定制报表的数据源既包括关系型数据库,也包括数据仓库,而
多维分析模块的数据源只基于数据仓库的Cube。具体地,本模块的多维分析模
块针对的数据源包括ISDNCube (用户立方体)、KpiCube (KPI立方体)和SPCube
(服务提供商立方体)等(如图3所示)。
下面以一个典型的实例来描述业务数据多维分析的工作过程。
原始需求系统用户为提升服务质量,需要分析近两月以来彩信业务的所有 终端到终端应用类型中,彩信终端手机收发彩信的OT话单条数、成功率变化趋 势,并对成功率低于设定数值的情况,进一步分析其状态码(用于标识本条业务 流程状态的编码,据此了解业务失败的原因等)的分布情况。
工作过程-1、界面设定。
A、 在用户界面中设定某些特定维度的具体取值或取值范围。包括设定终端 类型维度取值为"彩信终端"、设定业务应用类型维度取值为"终端到终端";
B、 选定待分析的维度为OT话单类型维度、时间维度和状态码维度,同时设
定该时间维度的起始和结束时间;
C、 选定业务条数作为本次分析所关注的量化指标;
D、 在界面上定义临时计算成员"成功率"及其计算公式。
2、点击分析后,B/S页面首先将界面的各种设定情况传递到统计分析的服务器端,在服务器端完成多维査询语句的封装,并送交数据仓库进行即时査询,
査询结果数据不保存在服务器端,而是直接在用户界面的指定区域以多维报表或
图表的方式进行呈现。
3、如果需要分析其它指标,将重新进行步骤l、 2的工作流程。 综上,在完成消息类业务的数据采集、数据转换与装载后,系统具备了业务 系统的多维数据模型,进而通过分析和呈现模块,提供用户预定义报表、定制査 询和报表以及多维分析的方法和手段。通过这些分析和呈现手段,可为运营商和 设备制造商提供更为灵活方便的数据统计方法及决策支持。
权利要求
1、一种对消息类业务数据进行多维分析的方法,其特征在于,该方法包括如下步骤1)数据采集,数据采集模块负责将业务系统中分散在各个网元节点上的生产数据采集到统计分析服务器上的一个中间数据库中;2)数据整合,数据转换与装载模块负责将中间数据库的数据转换处理到一个具有星型架构特征的关系型数据库中,并根据需要进一步处理到数据库中,整合包括对消息类业务的各种待分析数据进行整理,将具有共同或相近特性的数据进行归类,并纳入到一个统一的维度层次结构中;对中间数据库的数据进行进一步的清洗、转换以处理到另一个多维数据库中;3)数据分析与呈现,通过数据分析与呈现模块负责对数据仓库或关系型数据库中具有多维特征的业务数据进行分析和呈现。
2、如权利要求1所述的对消息类业务数据进行多维分析的方法,其特征在于 在数据采集步骤中,首先定义针对不同数据源的数据抽取标准方法,完成异构数 据源的原始数据釆集工作,并保存到本地的一个中间数据库中,该中间数据库包 含了业务系统所有经初步清洗的待分析数据;在原始数据采集过程中通过配置文 件的方式定义待抽取库表的详细信息,包括表名、字段名、字段类型。
3、 如权利要求1所述的对消息类业务数据进行多维分析的方法,其特征在 于在数据整合步骤中,设计星型架构作为数据组织的基本方式,即以事实数据表 为中心,多个维度表通过各自的键列联接到事实数据表上。
4、 如权利要求3所述的对消息类业务数据进行多维分析的方法,其特征在 于根据星型架构设计与之对应的数据仓库架构,将该多维数据库采用增量更新和 按分区刷新相结合的方式装载到数据仓库的Cube(多维立方体)中。
5、 如权利要求4所述的对消息类业务数据进行多维分析的方法,其特征在 于星型架构所包含的事实表包含条数、字节流量和费用字段,且每个星型架构所 包含的维度表都有且仅有一个键列联接到事实数据表。
6、 如权利要求5所述的对消息类业务数据进行多维分析的方法,其特征在 于,所述中间库中维度数据转换处理包括维度报数据同步更新在DTS(数据转换服务)包里完成配置信息的初始化;建立到中间库的连接;读取中间库号码表的标志列确定本次待处理行;通过数据库基本操作指令实现维度数据的同步;将原始维度表异常数据写入异常维度信息表;更新关系型数据库维度表的属性字段信息;中间库中事实表数据抽取与转换将中间库中分散在多表的原始事实数据进行规整处理,汇集到关系型数据库 的一个临时表中,该临时表具备对应的星型架构事实表和维度表在最细粒度下的聚合信息;对该临时表所包含的所有维度信息进行处理,以使其与关系型数据库 的维度表在最低的层次上发生关联,并经过中间转换;增量更新到关系型数据库 的事实表中,通过处理将原始事实表中所有具体的维度取值转换为维度表中对应 的键值;规整处理的方法主要包括库表之间的关联更新和聚合操作;中间库中零 散的事实数据在多次转换后填充到星型架构的事实表中。
7、 如权利要求6所述的对消息类业务数据进行多维分析的方法,其特征在 于,所述维度数据的同步包括A新增维度数据处理根据源表的最新id值将本次新增维度数据插入到关 系型数据库维度表;B维度信息更新处理根据源表的id值确定本行是不是新增维度信息,根 据源表的标志列确定本行的部分信息发生了更新,在对关系型数据库中的维度表 进行更新操作中关联已确定发生了信息更新的记录以更新维度表数据;C维度表属性字段信息通过一组存储过程来实现,以完成维度成员属性的计算。
8、 一种对消息类业务数据进行多维分析的系统,其特征在于该系统包括独立设置的以下模块数据采集模块,负责将业务系统中分散在各个网元节点上的生产数据采集到 统计分析服务器上的一个中间数据库中;数据转换与装载模块,负责将中间数据库的数据转换处理到一个具有星型架 构特征的关系型数据库中,并根据需要进一步处理到数据仓库中;数据分析与呈现模块,负责对数据仓库或关系型数据库中具有多维特征的业 务数据进行分析和呈现。
9、 如权利要求8所述的对消息类业务数据进行多维分析的系统,其特征在 于数据采集模块包括文件类生产数据处理子模块和数据库类生产数据处理子模块,文件类型的生产数据采用两个独立进程分别完成文件获取与入库工作;数据 库类生产数据采用链接服务器、DTS和数据库复制三种方式同步数据;所述的数 据转换处理包括三个主要模块维度表处理模块、事实表处理模块和异常数据处 理模块;维度表处理模块负责完成维度数据的收集和更新,以及对维度的属性数 据进行预先计算处理;事实表处理模块负责完成事实数据的收集和更新,以及通 过维护与维度表的主外键关系实现与维度表的关联;异常数据处理模块负责对系 统异常数据进行额外处理;数据分析与呈现模块包括预定义统计报表、定制查询 与报表以及多维分析子模块;预定义报表子模块是将査询主体中行列定义、字段 具体含义均预先定义为报表定义文件,定制查询子模块是将与报表的行列字段定 义在界面中预定义,报表子模块储存各种报表文件,多维分析子模块,其是展现 所有Cube维度及度量值的要素,用户首先选定某些维度的取值,之后在界面上 设置一个或多个维度作为分析列、 一个或多个维度作为分析行、 一个或多个度量 值作为数据项,通过动态展开分析行及分析列可以获得在不同维度取值影响下的 度量值数据,分析行及分析列维度在不同层次(level)上自动进行数据的聚合; 定制报表的数据源既包括关系型数据库,也包括数据仓库,而多维分析模块的数 据源只基于数据仓库的Cube 。
全文摘要
本发明是一种对消息类业务数据进行多维分析的方法和系统,其步骤包括、数据采集步骤、数据整合步骤,数据转换与装载模块负责将中间数据库的数据转换处理到一个具有星型架构特征的关系型数据库中,对消息类业务的各种待分析数据进行整理,将具有共同或相近特性的数据进行归类,并纳入到一个统一的维度层次结构中;对中间数据库的数据进行进一步的清洗、转换以处理到另一个多维数据库中;及数据分析与呈现步骤。对应的该系统,包括独立设置数据采集模块,数据转换与装载模块及数据分析与呈现模块,采用本发明,能在相似的增值业务系统中共享多维数据模型,减少系统的开发周期和成本。应用该模型建立的系统所具有的多维度数据分析的功能,可为运营商和设备制造商提供更为灵活方便的数据统计方法及决策支持。
文档编号H04M3/24GK101197876SQ20061015741
公开日2008年6月11日 申请日期2006年12月6日 优先权日2006年12月6日
发明者岩 丁, 杨淑艳, 柯 蒋, 俊 陈 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1