业务影响分析方法和系统的制作方法

文档序号:7944840阅读:153来源:国知局
专利名称:业务影响分析方法和系统的制作方法
技术领域
本发明涉及通讯领域中业务管理领域,更具体地说,是涉及对业务影响分析的方 法和系统。
背景技术
传统的电信运维管理,更多地强调资源的管理,着重从事件管理和性能管理两大 功能入手对资源的状态进行监控。随着以“客户与服务为中心”理念逐渐深入,eTOM等电信 业的标准越来越重视资源层和业务服务层之间的关联关系。其目的在于不仅能够检测到管 理资源上出现的事件,乃至故障,还应该通过自动化的分析,告诉用户该特定资源发生的故 障对哪些业务产生了影响,影响有多大。进一步地,还可以找到收到影响的客户有哪些,影 响有多大,从而通过主动去发现问题,加快问题响应速度来进一步提供客户的满意度。客户满意度来自于所购买的服务的质量,而服务的质量取决于以流程为核心的业 务的提供能力。业务流程组织起了各个资源所提供的服务,因此业务的提供能力取决于资 源的运行状态。按照这个层次,任何一个客户可以享受的服务都可以被映射到具体的资源 运行状态上,从而建立从资源到业务,再到服务的模型。这个模型被称为业务影响模型,它 反应了具体资源到业务服务的依赖关系。服务级别协议(SLA)是用来刻画某一特定用户 对服务质量的要求的,根据业务影响模型,SLA可以被分解为多个具体资源的关键性能指标 (KPI)或典型事件,通过运算,最后得到SLA是否被违反的结论。资源之间也存在着关联性。表现为一般的连接(双向依赖)关系,或者承载(单 向依赖)关系等等。资源之间的关系是由它们的部署情况决定的,而部署的依据来自于业 务的需要。资源之间的关系由业务而定,不同的业务,对于相同的资源可能产生不同的资源 依赖关联关系。进行业务影响分析,目前的做法主要是根据所得到的事件找到特定的问题资源, 根据资源之间的关联性,得到与问题资源相关联的资源;最后,遍历所有的SLA,找到包含 了这些资源,且因为资源KPI计算或者典型事件发生而产生违反行为的SLA。公开于2007 年4月4日的CN101309218C的用于实时服务级别协议影响分析的方法和系统,就是按照以 上的处理流程对SLA进行实时的评估,从而可以获得实时的业务运行状态。但是,这样的处理方式存在一些问题(1)上报事件的数量可能是巨大的,从而占用大量计算资源。(2) SLA是对业务服务质量的度量,对于任何一个业务,对不同的客户,可能存在完 全不一样的SLA。因此,随着客户和业务的不断增加,所签订的SLA数量急速膨胀,每次对上 报事件的业务影响计算都去遍历一次SLA的做法,也需要耗费大量的计算资源,效率不高。

发明内容
本发明要解决的技术问题是提供一种业务影响分析方法和系统,以提高业务影响 分析的效率,准确并比较及时的发现受影响业务,以及受影响的程度。
为解决上述技术问题,本发明提供了一种业务影响分析方法,该方法包括(a)采集业务相关的资源所产生的事件;(b)根据事件相关资源及资源间关联关系对采集的事件进行相关性分析,确定根源事件;(c)确定所述根源事件对业务的影响情况。进一步地,步骤(b)中进行相关性分析的事件包括新采集事件及先于所述新采集 事件指定时间内采集的事件。进一步地,步骤(b)中,所述根源事件是指在指定时间内未被其他事件抑制的事 件。进一步地,步骤(b)中,进行所述相关性分析后,去除由其他事件引起的衍生事 件,保留所述根源事件。进一步地,步骤(a)中,所述事件是合并相似事件及去除重复事件后的事件。进一步地,步骤(C)包括(cl)根据所述根源事件找到第一个对应的业务影响模型,所述业务影响模型是预 先构建的,包括资源检测点到资源IT服务KPI的映射关系、资源IT服务KPI与业务指标的 映射关系,以及业务指标与服务级别协议的映射关系,所述根源事件包括相关的资源检测占.
^ \\\ (c2)根据所述业务影响模型明确对所述业务指标产生的影响及影响程度,进而评 估是否违反与客户签订的关于该业务的服务级别协议;(c3)通知所述业务影响模型对应的业务的受损情况,并依次对根据所述根源事件 找到的其他业务影响模型进行分析。为解决上述技术问题,本发明还提供一种业务影响分析系统,该系统包括事件采 集模块、事件相关性分析模块及业务影响分析模块,其中,所述事件采集模块,用于采集业务相关资源产生的事件,并将所述事件上报给所 述事件相关性分析模块;所述事件相关性分析模块,用于根据上报事件相关资源及资源间关联关系对所述 事件采集模块上报的事件进行相关性分析,还用于确定根源事件,以及上报所述根源事件 给所述业务影响分析模块;所述业务影响分析模块,用于根据所述根源事件确定对业务的影响情况。进一步地,所述事件相关性分析模块进行相关性分析的事件包括新上报事件及先 于所述新上报事件指定时间内上报的事件。进一步地,所述根源事件是指在指定时间内未被其他事件抑制的事件。进一步地,所述系统还包括预先构建的业务影响模型,所述业务影响模型包括资 源检测点到资源IT服务KPI的映射关系、所述资源IT服务KPI与业务指标的映射关系,以 及所述业务指标与服务级别协议的映射关系;所述业务影响分析模块还用于根据所述根源 事件找到对应的业务影响模型,进而确定受影响的所述业务指标及所述服务级别协议,所 述根源事件包括相关的资源检测点。与现有技术相比,本发明业务影响分析方法和系统根据资源间关联关系对事件进 行相关性分析,资源之间关联关系不再作为影响性分析的依据,而是作为事件相关性分析的依据之一,提高了影响分析的准确性,并根据相关性分析找到根源事件,大大压缩了进行 影响性分析的输入量,节省了计算资源。进一步地,在事件相关性分析中,所引入的时间窗 口关联方法,不但使单一事件具有向前的分析能力,且通过增加事件的“耐受期”,使根源事 件的查找更加准确,有效。再配合以简单的事件压缩过程,使最终上报的根故障数量仅仅为 原始上报事件总数的5%,大大减轻了业务影响分析的计算量。


图1是本发明具体实施方式
中基于根源事件的业务影响分析方法流程示意图。图2是根据本发明被配置为执行基于根源事件的业务影响分析系统示意图。图3是本发明具体实施方式
中事件相关性分析方法的流程示意图。图4是本发明具体实施方式
中业务影响分析方法的流程示意图。图5是本发明中业务影响模型的架构示意图。
具体实施例方式在业务影响分析过程中,上报的事件之间可能存在某种关联关系。例如,在业务一 中,资源A产生的事件a,可能引起了资源B产生事件b,就问题的根本而言,事件a是根源 性的,是解决问题的突破口。如果不对事件进行加工处理,没有根据资源相关性对事件进行 处理,从而形成根源事件,就会使得根源与衍生事件都到达系统进行业务服务分析计算,造 成计算资源的大量浪费。此外,因为大多数资源都是复用的,资源A还可能被业务二使用, 如果问题资源定位不准将造成无法及时、准确发现其它受影响业务。鉴于此,本发明业务影响分析方法和系统的主要思想是根据资源间关联关系对事 件进行相关性分析以找到根源事件,从而根据根源事件对业务影响进行分析,从而提高业 务影响分析的效率,准确并比较及时的发现受影响业务,以及受影响的程度。图1为本发明业务影响分析方法流程示意图,该方法包括以下步骤步骤11 业务影响模型构建;根据业务所提供的功能服务,以及客户对服务质量的要求(SLA),建立起从服务级 别协议、到业务指标,最后到资源检测点的关键性能指标一KPI的映射关系。除现有的业务影响模型的构建方法外,还可以采用以下构建过程(a)根据业务流程组织资源,把业务所提供服务的SLA拆分为具体业务指标;(b)把业务指标按照业务功能拆分为具体资源检测点的关键性能指标KPI ;(c)根据各资源检测点对业务功能的影响大小,对KPI设定不同的阈值,如果超过 KPI阈值则产生事件上报,以作为进行影响性分析的触发点。通过以上步骤,最终针对特定一个业务形成从资源的检测点到业务所提供服务质 量的影响关系模型,如图5所示。步骤12 根据业务功能和流程,构建资源间的关联关系库;根据业务流程所涵盖的资源范围确定业务所需的资源;根据业务的端到端过程, 确定资源的组织关系,进一步地明确资源之间的关联关系。构建资源间关联关系库的过程包括(a)根据业务需求,整理业务流程,再根据业务流程划定资源的范围;
(b)根据业务的端到端业务关系,组织所有的资源,配合物理连接拓扑图,发现并记录各资源之间的关系。具体关系可能包括连接(双向依赖),承载(单向依赖),组成部 件(单向依赖)等关系。通过以上步骤,最终形成资源之间关联关系库。步骤13 采集各资源产生的事件,根据资源间关联关系对采集的事件进行相关性 分析,确定根源事件,以减少进行业务影响分析的事件;采集的事件包括根据业务所涵盖的资源范围进行KPI越限事件,以及其它上报事 件(如系统根据性能信息计算上报的信息)。在进行相关性分析前,对采集的事件进行“合 并相似事件”、“去掉重复事件”等简单处理过程以去除冗余的事件。所述事件的属性包括类型、严重程度、发生时间以及发生事件的资源及资源检测
点ο为了获得更好的处理效果和更高的处理效率,与当前上报事件进行相关性分析的 事件是早于当前上报事件指定时间Tl内上报的事件,该时间窗口 Tl是一个经验值,是根 据事件上报的频率、系统处理能力、业务系统所在网络的状况等条件进行设置的,比如5分 钟。设定的适当的时间窗口 Tl是当前上报事件与较早上报事件进行关联分析的判断依据, 凡在该设定的时间窗口内且较早上报事件,都需要和该当前上报事件进行相关性分析。对事件进行相关性分析的过程就是把业务相关的资源所产生的事件集中起来的 过程,在此过程中,以新上报的事件为触发点,找出较早指定时间窗口 Tl内未被抑制的事 件,进行相关性分析。分析的过程包括,首先确定事件发生所在资源,然后根据资源之间的 关联关系(单向、双向依赖)和事件的属性(如类型、严重程度、发生时间等)确定事件之 间是否存在关联,是否由一个事件引起了另一个事件。最后,把由其它事件引起而衍生出的 事件抑制,保留根源性的事件作为临时根源事件。步骤14 查看是否存在指定时间T2内未被后续事件抑制的临时根源事件,如果 有,认为满足该条件的临时根源事件为根源事件,否则转执行步骤13 ;设定指定时间T2也是为了获得更好的处理效果和更高的处理效率,T2也是一个 经验值,也是根据事件上报的频率、系统处理能力、业务系统所在网络的状况等条件进行设 置的,在具体应用时,Tl和T2可以默认简化设置为相同的时间窗口。步骤15 通过业务影响模型,逐级计算根源事件所造成的业务指标变化,和SLA的 违反情况,该步骤进一步包括(a)根据根源事件定位问题资源。(b)根据问题资源所扮演的业务功能角色,以及根源事件的级别,上报时间等因 素,明确对业务指标产生的影响及影响的程度;(c)根据业务指标的变化,进一步评估给客户提供服务的质量,各客户SLA是否发 生违背,如果是,则发起通知到业务部门。同时,资源管理部门可根据对业务影响的大小对 故障设定优先级。优先处理对业务影响较大的故障。步骤16 判断问题资源是否对业务服务的质量产生了影响,如果产生影响,则执 行步骤17,否则转执行步骤13;步骤17 通知维护人员哪些业务受损,受损程度多大,根源事件在哪里,以便采取 进一步的措施恢复受损服务,跳转步骤13。
本发明利用根据业务所提供的功能服务,建立的从客户SLA到具体资源的业务影 响模型及根据业务流程的组织建立的资源间关联关系库。把采集到的在指定时间内的事件 按照事件所在资源的关联关系进行分析,从而找到可能的根 源事件。将在指定时间内,未被 后续到达事件抑制的根源事件作为业务影响分析的出发点,找到出问题的资源,最后根据 业务影响模型和故障的内容、性质和级别的信息,最终评估出故障对业务和客户SLA的影 响。本发明利用根源事件进行业务影响分析,大大节省了影响性分析的计算资源。通过调 整资源相关性的使用位置,提高了业务影响分析的效果和效率。图2为执行以上业务影响分析方法的系统示意图,该系统包括资源模型构建模块 202、资源关联关系库203、事件采集模块204、事件相关性分析模块205、临时根源事件库 206、业务模型构建模块208及业务影响模型209,其中,资源构建模块202用于构建资源间关联关系,并形成资源关联关系库203 ;事件采集模块204,用于采集业务相关资源201所产生的事件,并上报给事件相关 性分析模块205 ;事件相关性分析模块205用于根据事件相关的资源以及资源关联关系库203中的 资源关联关系对事件采集模块上报的新事件211,与临时根源事件库206中临时根源事件 210进行相关性分析,确定根源事件;具体地,如上方法所述,新事件与先于新事件指定时间T1内的所有临时根源事件 210进行相关性分析,如果该新事件为某一临时根源事件的根源事件,则从临时根源事件库 206中删除该临时根源事件;如果该新事件是由于前面某一临时根源事件所引起的,则抛 弃掉该新事件;否则,新事件和前面的临时根源事件无关联关系,须把该新事件新增到临时 根源事件库206中。临时根源事件库206,用于保存事件相关性分析模块的确定的临时根源事件。既是事件相关性分析的临时结果存放处,也是事件分析所需的临时根源事件来 源。业务影响分析模块207,用于根据临时根源事件库206中的根源事件定位问题资 源,还用于确定问题资源所影响的业务,具体地,还用于找到包含问题资源的业务及该业务 对应的业务影响模型,进而确定受影响的所述业务指标及所述服务级别协议SLA。如前所述,业务影响模型包括资源检测点到资源信息技术服务关键性能指标(简 称资源IT服务KPI)的映射关系、资源IT服务KPI与业务指标的映射关系,以及业务指标 与服务级别协议的映射关系。事件包括发生时间、相关资源及资源检测点。业务影响分析模块207所依据的根源事件是指在指定时间T2内未被后续事件抑 制的临时根源事件。如上所述业务模型构建模块208用于构建业务影响模型209,资源关联关系库203 和业务影响模型209都是在系统开始采集事件之前根据业务的功能、流程和用户需求预先 构建的。上述提到的指定时间T,存在两个用途其一是当新的资源上报事件211到达后, 要与早于它T1时间内到达的可能临时根源事件210进行关联性分析;其二是只有在临时库 206中停留了 T2时间且未被其它事件抑制的根源事件才能成为业务影响分析的触发点。T的值可根据事件211的上报频率、需要实际测试方能使系统获得更高的处理效果和效率。以下结合图3对新事件到达后进行事件相关性分析的过程进行详细描述,该过程 包括以下步骤步骤31:新事件到达;此处的新事件是指各资源上报的事件经过消除重复和事件合并等简单处理过程 后剩余的事件。步骤32 事件相关性分析;具体地,新事件到达后,获得该事件的到达时间t,再取出临时根源事件库206中 所有到达时间在t-T2到t之间的临时根源事件进行分析,分析的依据为各事件相关的资源 之间的关联关系。如果该新事件为某一临时根源事件的根源事件,则从临时根源事件库206中删除 该临时根源事件。步骤33 判断新到事件是否被抑制,若被抑制(即删除),则转执行步骤35 ;在步骤32的处理后,如果新到事件与前面的事件无关,或是前面某事件的根源, 则不会被抑制,被抑制的事件是某事件的衍生事件。例如,假设存在数据库应用和服务器两个资源。根据业务功能的需求,数据库应 用需要利用服务器在内的资源与其它应用交互,因此可建立数据库应用到服务器的依赖关 系。存在一个数据库连接断开事件a,在a到达之前T时间内,又存在一个服务器网卡工作 异常事件b (此时,事件b已成为临时根源事件存放在临时根源事件库中),那么根据两个资 源的依赖关系,可知事件b可能为事件a的根源事件,事件a将被抑制(删除),b将作为可 能的根源事件继续留在临时根源事件库中。步骤34 把该事件作为可能的根源事件放入临时根源事件库中;步骤35 等待下一个新的事件到达,以激活下一轮的处理周期。以下结合图4对根据根源事件进行业务影响分析的过程进行说明,该过程包括以 下步骤步骤41 取出第一个在临时根源事件库中停留时间到达T2的事件,该事件即时间 段T2内未被后续到达事件抑制的临时根源事件,是进行业务影响分析的根源事件;步骤42 根据根源事件的监测点属性定位问题资源,进而找出所有可能被影响的 业务的业务影响模型,并查看第一个业务的影响模型步骤43 根据业务影响模型和事件级别、类型等信息,明确对业务指标产生的影 响及影响程度,判断业务所提供的服务的质量变化,进而评估是否违反了与客户签订的关 于该业务的SLA ;步骤44 通知维护人员该特定业务受损,受损程度多大,根源事件在哪里,受影响 的客户SLA有哪些等等,以便采取进一步的措施恢复受损服务。步骤45 判断是否还有包含该问题资源的是否存在其它业务受影响;步骤46 加载下一个业务影响模型;把找到的尚未分析的,且包含了该问题资源的业务的影响模型加载,准备进行新 一轮的分析工作。步骤47 当所有包含了该问题资源的业务都被分析之后,有关该根源事件的业务
8影响分析结束。与现有技术相比,应用本发明,通过增加了事件相关性分析环节,大大压缩了进行 影响性分析的输入量,节省了计算资源。资源之间关联关系库不再作为影响性分析的依据, 而是作为事件相关性分析的依据之一,提高了影响分析的准确性。改变了遍历SLA的方法, 不需要遍历所有的SLA,而是采用从事件到资源,再到业务指标,最后到SLA的方法,提高了 效率,表现更加直观。业务影响模型的建立丰富了单靠SLA关联业务和资源的手段,细化了 两者之间的关系,通过层次化使得业务服务和资源的关系更加符合逻辑,为客户提供了一 套行之有效的建模方法论,按照业务服务、业务流程、业务指标、资源、资源检测点五个层次 对业务进行分析,制作出符合实际的业务影响模型。进一步地,在事件相关性分析中,所引入的时间窗口关联方法,不但使单一事件具 有向前的分析能力,且通过增加事件的“耐受期”,使业务影响的查找更加准确,有效。再配 合以简单的事件压缩过程,使最终上报的根故障数量仅仅为原始上报事件总数的5%,大大 减轻了业务影响分析的计算量。综上,本发明提供了一种准确、快速、全面的了解业务运行 状态方法和系统。以上所述,仅为本发明较佳的具体实施方式
,但本发明的保护范围并不局限于此, 任何熟悉该技术的人在本发明所揭露的技术范围内,可轻易想到的变化或替换,都应涵盖 在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
权利要求
一种业务影响分析方法,其特征在于,该方法包括(a)采集业务相关的资源所产生的事件;(b)根据事件相关资源及资源间关联关系对采集的事件进行相关性分析,确定根源事件;(c)确定所述根源事件对业务的影响情况。
2.如权利要求1所述的方法,其特征在于步骤(b)中进行相关性分析的事件包括新 采集事件及先于所述新采集事件指定时间内采集的事件。
3.如权利要求1所述的方法,其特征在于步骤(b)中,所述根源事件是指在指定时间 内未被其他事件抑制的事件。
4.如权利要求1至3中任一项所述的方法,其特征在于步骤(b)中,进行所述相关性 分析后,去除由其他事件引起的衍生事件,保留所述根源事件。
5.如权利要求1至3中任一项所述的方法,其特征在于步骤(a)中,所述事件是合并 相似事件及去除重复事件后的事件。
6.如权利要求1至3中任一项所述的方法,其特征在于,步骤(c)包括(cl)根据所述根源事件找到第一个对应的业务影响模型,所述业务影响模型是预先 构建的,包括资源检测点与资源信息技术服务关键性能指标的映射关系、所述资源信息技 术服务关键性能指标与业务指标的映射关系,以及所述业务指标与服务级别协议的映射关 系,所述根源事件包括相关的资源检测点;(c2)根据所述业务影响模型明确对所述业务指标产生的影响及影响程度,进而评估是 否违反与客户签订的关于该业务的服务级别协议;(c3)通知所述业务影响模型对应的业务的受损情况,并依次对根据所述根源事件找到 的其他业务影响模型进行分析。
7.—种业务影响分析系统,其特征在于,该系统包括事件采集模块、事件相关性分析模 块及业务影响分析模块,其中,所述事件采集模块,用于采集业务相关资源产生的事件,并将所述事件上报给所述事 件相关性分析模块;所述事件相关性分析模块,用于根据上报事件相关资源及资源间关联关系对所述事件 采集模块上报的事件进行相关性分析,还用于确定根源事件,以及上报所述根源事件给所 述业务影响分析模块;所述业务影响分析模块,用于根据所述根源事件确定对业务的影响情况。
8.如权利要求7所述的系统,其特征在于所述事件相关性分析模块进行相关性分析 的事件包括新上报事件及先于所述新上报事件指定时间内上报的事件。
9.如权利要求7所述的系统,其特征在于所述根源事件是指在指定时间内未被其他 事件抑制的事件。
10.如权利要求7至9中任一项所述的系统,其特征在于所述系统还包括预先构建的 业务影响模型,所述业务影响模型包括资源检测点与资源信息技术服务关键性能指标的映 射关系、所述资源信息技术服务关键性能指标与业务指标的映射关系,以及所述业务指标 与服务级别协议的映射关系;所述业务影响分析模块还用于根据所述根源事件找到对应的 业务影响模型,进而确定受影响的所述业务指标及所述服务级别协议,所述根源事件包括 相关的资源检测点。
全文摘要
本发明提供了一种业务影响分析方法和系统,该方法包括(a)采集业务相关的资源所产生的事件;(b)根据事件相关资源及资源间关联关系对采集的事件进行相关性分析,确定根源事件;(c)确定所述根源事件对业务的影响情况。本发明方法和系统,可以提高业务影响分析的效率,准确并比较及时的发现受影响业务,以及受影响的程度。
文档编号H04W24/04GK101808351SQ20091000725
公开日2010年8月18日 申请日期2009年2月17日 优先权日2009年2月17日
发明者孙明忠, 张建, 梁可心 申请人:中兴通讯股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1