基于告警信息发现功能拓扑的方法及装置与流程

文档序号:14350954阅读:310来源:国知局
基于告警信息发现功能拓扑的方法及装置与流程
本申请要求于2016年10月13日提交中国专利局、申请号为201610894440.5、发明名称为“基于告警信息发现功能拓扑的方法及装置”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。本发明涉及移动通信网络
技术领域
,更具体地说,涉及一种基于告警信息发现功能拓扑的方法及装置。
背景技术
:网络拓扑是网络管理的基础,网管人员通过拓扑结构能够快速定位网络故障、发现网络瓶颈,从而优化网络运行。目前,最常用的获得网络拓扑结构的方法是定期采集网络中网元配置信息以获取网络拓扑信息。然而,随着移动通信网络规模的不断扩大和移动互联网时代的到来,新的业务网络通常基于多种新技术实现,使得网络结构升级变化越来越频繁,网络的拓扑关系变得异常复杂,因此,通过定期采集网元配置信息来获取网络拓扑信息的方法难以保持网络拓扑数据及时更新,若不能及时更新网络拓扑数据,会导致网管人员无法快速准确定位网络故障,而缩短采集周期一般缩短到一天周期就几乎是极限了,难以从根本上解决网络拓扑及时更新的问题。因此,如何使得网管人员能够及时准确地定位网络故障成为亟待解决的问题。技术实现要素:本发明的目的是提供一种基于告警信息发现功能拓扑的方法及装置,以及时准确地定位网络故障。为实现上述目的,本发明提供了如下技术方案:一种基于告警信息发现功能拓扑的方法,包括:获取预设时长内的若干条告警数据;对所述若干条告警数据进行去周期处理,去除所述若干条告警数据中的周期性告警数据;基于去周期处理后的告警数据,计算任意两个网元的相关告警数据的条数;计算所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值;基于所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值;若所述任意两个网元的相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。上述方法,优选的,所述对所述若干条告警数据进行去周期处理,去除所述若干条告警数据中的周期性告警数据包括:对于所述若干条告警数据中的属于同一网元的同一类型的告警数据,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间;计算提取的n个告警发生时间中相邻时间的时间间隔和这些时间间隔的平均值;基于所述时间间隔和所述时间间隔的平均值判断所述n条告警数据是否是周期性告警数据;若所述n条告警数据是周期性告警数据,则删除所述n条告警数据中非时间最早的n-1条告警数据;对于告警发生时间位于所述n条告警数据之后的属于同一网元的同一类型的告警数据,逐条判断是否为所述n条告警数据的周期性告警数据;若所述n条告警数据之后的第i条告警数据是所述n条告警数据的周期性告警数据,则删除所述第i条告警数据;若所述第i条告警数据不是所述n条告警数据的周期性告警数据,则从所述第i条告警数据开始,执行所述按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间的步骤;若所述n条告警数据是非周期性告警数据,则从所述n条告警数据之后的第一条告警数据开始,执行所述按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间的步骤。上述方法,优选的,所述基于所述时间间隔和所述时间间隔的平均值判断所述n条告警数据是否是周期性告警数据包括:计算每一个相邻告警数据的时间间隔与所述时间间隔的平均值的差值;若所有差值均在预置的阈值区间内,则确定所述n条告警数据是周期性告警数据,否则,确定所述n条告警数据是非周期性告警数据。上述方法,优选的,所述对于所述n条告警数据之后的告警数据,逐条判断是否为所述n条告警数据的周期性告警数据包括:计算所述第i条告警数据与第i-1条告警数据的时间间隔,并计算该时间间隔与所述时间间隔的平均值的差值;若计算得到的差值在预置的阈值区间内,则确定所述第i条告警数据为所述n条告警数据的周期性告警数据;否则,确定所述第i条告警数据不是所述n条告警数据的周期性告警数据。上述方法,优选的,所述预设时长被划分为若干时间段;所述计算任意两个网元的相关告警数据的条数包括:基于告警数据中的网元标识和告警数据发生时间统计各个网元在所述预设时长内发生告警的时间段;对于任意两个网元,将该任意两个网元发生告警的相同时间段的个数确定为该任意两个网元的相关告警数据的条数。上述方法,优选的,所述基于所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值包括:按照可能的相关告警数据的条数从小到大的顺序,计算对应概率值的累计值;确定第一个大于预置累计阈值的累计值,将得到该累计值所应用的概率值对应的最大的可能的相关告警数据的条数确定为所述任意两个网元对应的相关条数阈值。上述方法,优选的,所述获取预设时长内的若干条告警数据包括:获取预设时长内的所有告警数据;基于预设字段信息对获取的告警数据进行初始处理,剔除告警数据中不完整的告警数据,以及重复的告警数据;对进行初始处理后的告警数据的告警发生时间进行时间粗粒化,得到所述若干条告警数据。一种基于告警信息发现功能拓扑的装置,包括:获取模块,用于获取预设时长内的若干条告警数据;去周期处理模块,用于对所述若干条告警数据进行去周期处理,去除所述若干条告警数据中的周期性告警数据;第一计算模块,用于基于去周期处理后的告警数据,计算任意两个网元的相关告警数据的条数;第二计算模块,用于计算所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值;第一确定模块,用于基于所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值;第二确定模块,用于若所述任意两个网元的相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。上述装置,优选的,所述去周期处理模块包括:第一获取单元,用于对于所述若干条告警数据中的属于同一网元的同一类型的告警数据,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间;第一计算单元,用于计算提取的n个告警发生时间中相邻时间的时间间隔和这些时间间隔的平均值;第一判断单元,用于基于所述时间间隔和所述时间间隔的平均值判断所述n条告警数据是否是周期性告警数据;删除单元,用于若所述n条告警数据是周期性告警数据,则删除所述n条告警数据中非时间最早的n-1条告警数据;逐条处理单元,用于对于告警发生时间位于所述n条告警数据之后的属于同一网元的同一类型的告警数据,逐条判断是否为所述n条告警数据的周期性告警数据;若所述n条告警数据之后的第i条告警数据是所述n条告警数据的周期性告警数据,则删除所述第i条告警数据;若所述第i条告警数据不是所述n条告警数据的周期性告警数据,则触发所述第一获取单元,从所述第i条告警数据开始,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间;触发单元,用于若所述n条告警数据是非周期性告警数据,则触发所述第一获取单元,从所述n条告警数据之后的第一条告警数据开始,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间。上述装置,优选的,所述第一判断单元包括:第一计算子单元,用于计算每一个相邻告警数据的时间间隔与所述时间间隔的平均值的差值;第一确定子单元,用于若所有差值均在预置的阈值区间内,则确定所述n条告警数据是周期性告警数据,否则,确定所述n条告警数据是非周期性告警数据。上述装置,优选的,所述逐条处理单元包括:第二计算子单元,用于计算所述第i条告警数据与第i-1条告警数据的时间间隔,并计算该时间间隔与所述时间间隔的平均值的差值;第二确定子单元,用于若计算得到的差值在预置的阈值区间内,则确定所述第i条告警数据为所述n条告警数据的周期性告警数据;否则,确定所述第i条告警数据不是所述n条告警数据的周期性告警数据;删除子单元,用于若所述n条告警数据之后的第i条告警数据是所述n条告警数据的周期性告警数据,则删除所述第i条告警数据;触发子单元,用于若所述第i条告警数据不是所述n条告警数据的周期性告警数据,则触发所述第一获取单元,从所述第i条告警数据开始,按照时间先后顺序获取n条未进行去周期处理的告警数据。上述装置,优选的,所述预设时长被划分为若干时间段;所述第一计算模块包括:统计单元,用于基于告警数据中的网元标识和告警数据发生时间统计各个网元在所述预设时长内发生告警的时间段;第一确定单元,用于对于任意两个网元,将该任意两个网元发生告警的相同时间段的个数确定为该任意两个网元的相关告警数据的条数。上述装置,优选的,所述第第一确定模块包括:第二计算单元,用于按照可能的相关告警数据的条数从小到大的顺序,计算对应概率值的累计值;第二确定单元,用于确定第一个大于预置累计阈值的累计值,将得到该累计值所应用的概率值对应的最大的可能的相关告警数据的条数确定为所述任意两个网元对应的相关条数阈值。上述装置,优选的,所述获取模块包括:第二获取单元,用于获取预设时长内的所有告警数据;初始处理单元,用于基于预设字段信息对所述第二获取单元获取的告警数据进行初始处理,剔除告警数据中不完整的告警数据,以及重复的告警数据;粗粒化单元,用于对进行初始处理后的告警数据的告警发生时间进行时间粗粒化,得到所述若干条告警数据。通过以上方案可知,本申请提供的一种基于告警信息发现功能拓扑的方法及装置,获取预设时长内的若干条告警数据;对所述若干条告警数据进行去周期处理,去除所述若干条告警数据中的周期性告警数据;基于去周期处理后的告警数据,计算任意两个网元的相关告警数据的条数;基于任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值;若该任意两个网元的相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。由于告警数据一般为实时流式数据,数据及时性好,因此,通过本发明实施例提供的基于告警信息发现功能拓扑的方法及装置,可以更为及时的获取拓扑信息,而且由于告警数据通常是提示网络故障的,所确定的网元功能拓扑对为发生故障的网元,也就是说,判定为功能拓扑对的网元的故障相关联,因而能够方便网管人员更快捷地定位网络故障。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本发明实施例提供的基于告警信息发现功能拓扑的一种实现流程图;图2为本发明实施例提供的对若干条告警数据进行去周期处理的一种实现流程图;图3为本发明实施例提供的获取预设时长内的若干条告警数据的一种实现流程图;图4为本发明实施例提供的基于告警信息发现功能拓扑的装置的一种结构示意图;图5为本发明实施例提供的去周期处理模块的一种结构示意图;图6为本发明实施例提供的第一计算模块的一种结构示意图;图7为本发明实施例提供的第一确定模块的一种结构示意图;图8为本发明实施例提供的获取模块的一种结构示意图。说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”“第四”等(如果存在)是用于区别类似的部分,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示的以外的顺序实施。具体实施方式下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。本发明实施例基于告警信息发现功能拓扑的方法的一种实现流程图如图1所示,可以包括:步骤s11:获取预设时长内的若干条告警数据;针对网络中的每个网元,若该网元出现故障,网管系统都会产生一条告警数据。不同的故障,所产生告警数据会不同。每一条告警数据都包括若干个字段,例如,一条告警数据可以包括但不限于表1中列举的字段。该预设时长可以是一个月,该一个月可以是任意一个自然月,也可以从任意时刻开始的一个月。当然,本发明实施例中,预设时长不一定是一个月,也可以是其它时长,例如,一周,或者是半个月等。步骤s12:对上述若干条告警数据进行去周期处理,去除上述若干条告警数据中的周期性告警数据;发明人在实现本发明的过程中研究发现,对于某个网元,它在某个时间点产生了一次告警,接下来的一段时间内,会以某种规律持续报警,这种告警属于周期性告警。对于周期性告警,除了第一条告警数据(即产生时间最早的告警数据)外,其它告警数据会干扰对网元间相关性的判断,对于故障源识别,也是种干扰,因此,需要去除周期性告警数据中,除第一次告警数据外的其它告警数据。步骤s13:基于去周期处理后的告警数据,计算任意两个网元的相关告警数据的条数;对于任意两个网元,这两个网元相关告警数据的条数可以为:这两个网元的告警数据的发生时间相关的告警数据的条数。本发明实施例中,若两个网元的告警数据的发生时间具有预置的关联关系,则可以确定这两个网元的告警数据的发生时间相关。例如,假设网元a的a告警数据的发生时间和网元b的b告警数据的发生时间具有预置的关联关系,则网元a的a告警数据和网元b的b告警数据的发生时间相关。需要说明的是,这里计算的是上述任意两个网元实际的相关告警数据的条数。步骤s14:计算上述任意两个网元的所有可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值;若用t表示两个网元的可能的相关告警数据的条数,则该两个网元的可能的相关告警数据的条数t有多个取值,t的取值范围为[0,m],其中,m为该两个网元的告警条数中的较小值。也就是说,两个网元的相关条数的最小值为0,最大值为该两个网元的告警数量的最小值。例如,假设网元a的告警条数为100条,网元b的告警条数为104条,则网元a和网元b的可能的相关告警数据的条数为:0,1,2,3,……,100。对于两个网元的相关告警数据的条数的每一个可能取值,计算该两个网元具有该取值的相关告警数据的条数的概率值,即计算该两个网元具有t条相关告警数据的概率值。基于上述示例,t的取值为:0,1,2,3,……,100。步骤s15:基于上述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值;本发明实施例中,该任意两个网元对应的相关条数阈值根据该两个网元的告警数据计算得到。为便于描述,将两个网元定义为一个网元组,则本发明实施例中,由于两个网元对应的相关条数阈值是根据该两个网元的告警数据计算得到,而不同的网元对应的告警数据可能相同,也可能不同,因此,不同的网元组对应的相关条数阈值可能相同,也可能不同。步骤s16:若上述任意两个网元的相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。也就是说,若上述任意两个网元的实际相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。由于告警数据通常是网元的功能出现故障时才会产生的数据,因此,若确定两个网元为功能拓扑对,说明这两个网元的功能是相关联的。更具体的说,若两个网元为功能拓扑对,说明这两个网元的故障是相关联的。若上述任意两个网元的实际相关告警数据的条数小于或等于与该任意两个网元对应的相关条数阈值,则该任意两个网元不为功能拓扑对。即若两个网元不为功能拓扑对,说明这两个网元的故障是不相关联的。由于告警数据一般为实时流式数据,数据及时性好,因此,通过本发明实施例提供的基于告警信息发现功能拓扑的方法,可以更为及时的获取网元的功能拓扑信息,而且由于告警数据通常是提示网络故障的,所确定的网元功能拓扑对为发生故障的网元,也就是说,判定为功能拓扑对的网元的故障相关联,因而能够方便网管人员更快捷地定位网络故障。可选的,本发明实施例提供的对上述若干条告警数据进行去周期处理的一种实现流程图如图2所示,可以包括:步骤s21:对于上述若干条告警数据中的属于同一网元的同一类型的告警数据,按照告警数据发生时间的先后顺序提取n条告警数据中的告警发生时间。也就是说,上述n条告警数据是同一网元的同一类型的告警数据。n的取值根据告警数据的数量以及经验确定,可选的,n的取值可以为5。当然,本申请实施例中,n的取值并不限于5,也可以取其它值,如4、6等。本发明实施例中,是对上述若干条告警数据中的属于同一网元的同一类型告警进行去周期处理。告警数据中包括网元识别标识字段和告警类型字段,请参见表1,本发明实施例是对网元识别标识(如表1中int_id)和告警类型(如表1中standard_alarm_id)均相同的告警数据进行去周期处理。每条告警数据中都记载有该条告警发生的时间,根据告警发生时间的先后顺序确定n条告警数据,从该n条告警数据中提取告警发生时间,得到一个记录有n个时间值的时间序列。步骤s22:计算提取的n个告警发生时间中相邻时间的时间间隔和这些时间间隔的平均值。基于上述n个时间值,可以确定n-1个时间间隔,并计算这n-1个时间间隔的平均值。步骤s23:基于上述时间间隔和上述时间间隔的平均值判断上述n条告警数据是否是周期性告警数据;若该n条告警数据是周期性告警数据,则进入步骤s24;若该n条告警数据是非周期性告警数据,则从该n条告警数据之后的第一条告警数据开始,返回执行步骤s21。若上述n条告警数据是非周期性告警数据,说明该n条告警数据不需要进行去周期处理,按照告警发生时间的先后顺其提取另外n条告警数据中的告警发生时间,并进行后续步骤。步骤s24:删除上述n条告警数据中非时间最早的n-1条告警数据。若上述n条告警数据是周期性告警数据,则只保留该n条告警数据中告警时间最早的告警数据即可,删除该n条告警数据中其它n-1条告警数据。步骤s25:对于告警发生时间位于该n条告警数据之后的属于同一网元的同一类型的告警数据,逐条判断是否为上述n条告警数据的周期性告警数据,具体的:若上述n条告警数据之后的第i条告警数据是上述n条告警数据的周期性告警数据,则进入步骤s26;若第i条告警数据不是上述n条告警数据的周期性告警数据,则从第i条告警数据开始,返回执行步骤s21。i为正整数,即i=1,2,3,……。也就是说,对于告警时间在该n条告警数据之后的属于同一网元的同一类型的告警数据,按照告警发生时间的先后顺序逐条判断该条告警数据是否为上述n条告警数据的周期性告警数据。若第i条告警数据不是上述n条告警数据的周期性告警数据,则按照告警数据发生时间的先后顺序提取n条新的告警数据中的告警发生时间,该n条新的告警数据中告警发生时间最早的告警数据是上述第i条告警数据。步骤s26:删除上述第i条告警数据,并判断下一条告警数据是否是上述n条告警数据的周期性告警数据。也就是说,在去周期处理的过程中,先对n条告警数据判断是否是周期性告警,若该n条告警数据是周期性告警,则不是直接对新的n条告警数据判断是否是周期性告警,而是对该已经判断出是周期性告警的数据的n条告警数据之后的告警数据逐条判断是否是该n条告警数据的周期性告警,若是则删除,只有在已经判断出是周期性告警的数据的n条告警数据之后的告警数据不是该n条告警数据的周期性告警时,才对新的n条告警数据判断是否是周期性告警,依次类推,直至对所有告警数据都处理完成。举例说明,假设上述若干条告警数据中某个网元的某一类型的告警数据有100条(为方便描述,按照时间先后顺序对这100条告警数据从1-100进行编号,告警发生时间早的告警数据的编号较小,告警发生时间较晚的告警数据的编号较大),n取值为10,则对这100条告警数据进行去周期处理的具体过程为:先提取1-10号告警数据中的告警发生时间,计算提取的10个告警发生时间的相邻时间的时间间隔,共9个时间间隔值,并计算该9个时间间隔的平均值;基于1-10号告警数据的9个时间间隔和时间间隔的平均值判断上述1-10号告警数据是否是周期性告警数据;若是,则删除2-10号告警数据,只保留1号告警数据,然后判断11号告警数据是否是1-10号告警数据的周期性告警数据。若11号告警数据不是1-10号告警数据的周期性告警数据,则提取11-20号告警数据中的告警发生时间,计算提取的10个告警发生时间的相邻时间的时间间隔,共9个时间间隔值,并计算该9个时间间隔的平均值;基于11-20号告警数据的9个时间间隔和时间间隔的平均值判断上述11-20号告警数据是否是周期性告警数据;若是,则删除12-20号告警数据,只保留11号告警数据,然后判断21号告警数据是否是11-20号告警数据的周期性告警数据。若21号告警数据不是11-20号告警数据的周期性告警数据,则提取21-30号告警数据中的告警发生时间,计算提取的10个告警发生时间的相邻时间的时间间隔,共9个时间间隔值,并计算该9个时间间隔的平均值;基于21-30号告警数据的9个时间间隔和时间间隔的平均值判断上述21-30号告警数据是否是周期性告警数据……依此类推。若11号告警数据是1-10号告警数据的周期性告警数据,则删除11号告警数据,然后判断12号告警数据是否是1-10号告警数据的周期性告警数据。若12号告警数据不是1-10号告警数据的周期性告警数据,则提取12-21号告警数据中的告警发生时间,计算提取的10个告警发生时间的相邻时间的时间间隔,共9个时间间隔值,并计算该9个时间间隔的平均值;基于12-21号告警数据的9个时间间隔和时间间隔的平均值判断上述12-21号告警数据是否是周期性告警数据;若是,则删除13-21号告警数据,只保留12号告警数据,然后判断22号告警数据是否是1-10号告警数据的周期性告警数据……依此类推。上述实施例中,可选的,基于上述时间间隔和时间间隔的平均值判断n条告警数据是否是周期性告警数据的一种实现方式可以为:计算每一个相邻告警数据的时间间隔与时间间隔的平均值的差值;以上述示例中9个时间间隔为例,则分别将每个时间间隔与上述9个时间间隔的平均值做差,得到9个差值。若所有差值均在预置的阈值区间内,则确定上述n条告警数据是周期性告警数据,否则,确定上述n条告警数据是非周期性告警数据。上述示例中,若9个差值均在预置的阈值区间内,则确定上述9个时间间隔对应的10条告警数据是周期性告警数据,否则,确定上述9个时间间隔对应的10条告警数据是非周期性告警数据。上述实施例中,可选的,对于上述n条告警数据之后的告警数据,逐条判断是否为上述n条告警数据的周期性告警数据包括:计算第i条告警数据与第i-1条告警数据的时间间隔,并计算该时间间隔与上述n条告警数据的时间间隔的平均值的差值;若计算得到的差值在预置的阈值区间内,则确定第i条告警数据为上述n条告警数据的周期性告警数据;否则,确定第i条告警数据不是上述n条告警数据的周期性告警数据。可选的,本发明实施例中,上述预设时长被平均划分为若干时间段;则本发明实施例提供的计算任意两个网元的相关告警数据的条数的一种实现方式可以为:基于告警数据中的网元标识和告警数据发生时间统计各个网元在上述预设时长内发生告警的时间段;对于任意两个网元,将该任意两个网元发生告警的相同时间段的个数确定为该任意两个网元的相关告警数据的条数。对于任意两个网元a和b,假设网元a有四条告警数据,发生告警的时间所属的时间段分别为时间段1、时间段2、时间段5和时间段8,而网元b有5条告警数据,发生告警的时间所属的时间段分别为时间段2、时间段4、时间段6、时间段8和时间段10,则网元a和b同时在两个时间段(时间段2和时间段8)发生告警,则网元a和b相关告警的条数为2。可选的,本发明实施例中,基于上述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值的一种实现方式可以为:按照可能的相关告警数据的条数从小到大的顺序计算对应概率值的累计值;每计算一次累计值,判断该累计值与累计阈值进行比较,若累计值小于或等于该累计阈值,则将累计值累加下一个可能的相关告警数据的条数对应的概率值得到新的累计值,将该新的累计值与累计阈值进行比较,若该新的累计阈值大于累计阈值,则停止累加,将得到该累计值所应用概率值对应的最大的可能的相关条数确定为这两个网元对应的相关条数阈值。若该新的累计值小于或等于该累计阈值,则继续累加下一个可能的相关告警数据的条数对应的概率值,……,依此类推。确定第一个大于预置累计阈值的累计值(为方便叙述,将该累计值记为第一累计值),确定得到该第一累计值所应用的概率值对应的最大的可能的相关告警数据的条数(为方便叙述,将所确定的条数记为第一条数),将该第一条数确定为该任意两个网元对应的相关条数阈值。举例说明,假设上述网元a和网元b所有的可能的相关的告警数据的条数(0,1,2,3,……,100)的概率值依次为p0,p1,p2,p3,……,p100,则确定相关条数阈值的过程为:先将p0与累计阈值进行比较,若p0大于累计阈值,则确定该网元a和网元b的相关告警数据的条数为0,并停止计算;若p0小于或等于累计阈值,则计算p0与p1的和值,将p0与p1的和值与累计阈值进行比较,若p0与p1的和值大于累计阈值,则确定该网元a和网元b的相关告警数据的条数为1(即p1对应的相关告警数据的条数),并停止计算;若p0与p1的和值小于或等于累计阈值,则计算p0、p1和p2的和值,将p0、p1和p2的和值与累计阈值进行比较,若p0、p1和p2的和值大于累计阈值,则确定该网元a和网元b的相关告警数据的条数为2(即p2对应的相关告警数据的条数),并停止计算;若p0、p1和p2的和值小于或等于累计阈值,则计算p0、p1、p2和p3的和值……依此类推。可选的,本发明实施例中,两个网元有n条告警数据相关的概率pn可以通过如下公式进行计算:其中,s表示上述预设时长被平均划分为s个时间段;m1表示上述两个网元中第一网元的告警数据的条数,m2表示上述两个网元中第二网元的告警数据的条数,这里假设m1≤m2。例如,假设上述预设时长为30天,在这30天的时间长度内,把时间按十分钟等分,一天24小时,一天就144个十分钟,30天就4320个十分钟,则s=4320。可选的,本发明实施例提供的获取预设时长内的若干条告警数据的一种实现流程图如图3所示,可以包括:步骤s31:获取预设时长内的所有告警数据;可以从网管系统中获取预设时长内的全量告警数据。步骤s32:基于预设字段信息对获取的告警数据进行初始处理,剔除告警数据中不完整的告警数据,以及重复的告警数据;由于原始告警数据含有一百多个字段,而对于功能拓扑发现来说,不是所有字段都是必须的,考虑到算法的效率问题,需要提取出功能拓扑发现算法必要的字段。因此,从全量告警数据中提取若干字段,基于该若干字段实现本发明实施例的方案。本发明实施例中,所提取的若干字段可以包括但不限于表1所列举内容:表1可以根据表1中能否为空的标识,判定告警数据是否完整,当标识为“否”时,说明该字段不能为空,而若告警数据的该字段为空,则说明该告警数据为不完整告警数据,需要剔除。重复的告警是指同一告警出现至少两次,则对于重复告警,只保留一条告警即可。其中,“设备网元id”是指粗粒度网元,属于设备级别的网元;而“网元id”表示细粒度网元,属于设备内部的部件级的网元。例如,“板卡”属于细粒度网元,而板卡所属的设备“交换机”则属于粗粒度网元。需要说明的是,表1只是一种可选的实现方式,根据实际需要,可以删减或增加字段。步骤s33:对进行初始处理后的告警数据的告警发生时间进行时间粗粒化,得到若干条告警数据。为了减少告警数据量,提高处理效率,本发明实施例中,按照预置窗口长度对预设时长划分窗口,将告警时间在窗口内的告警数据的告警时间粗粒化到该窗口的开始点时间,即将告警时间在窗口内的告警数据的告警时间记录为该窗口的开始点时间。需要说明的是,本发明实施例中,在计算网元的相关告警数据的条数时按照第一方式将预设时长划分为若干时间段,在对进行初始处理后的告警数据的告警发生时间进行时间粗粒化时按照第二方式将预设时长划分为若干时间段,其中,第一方式和第二方式不同。通常,按照第一方式对预设时长进行划分得到的时间段的长度(如10分钟)大于按照第二方式对预设时长进行划分得到的时间段的长度(如1分钟)。下面举例说明时间粗粒化的具体实现过程。表2为简化后的告警数据片段(即只包含告警发生时间和告警id,实际告警数据包含更多字段,但时间粗粒化阶段不需要,只是为了说明时间粗粒化的具体操作形式)。表2event_timestandard_alarm_id2015/9/250:00:08601-075-00-0750022015/9/250:00:21601-075-00-0750022015/9/250:00:22601-075-00-0750022015/9/250:00:26601-075-00-0750022015/9/250:00:28601-075-00-0750222015/9/250:00:29601-075-00-0750232015/9/250:00:56601-075-00-0750232015/9/250:01:00601-075-00-0750772015/9/250:01:12601-075-00-0751042015/9/250:01:16601-075-00-0751042015/9/250:02:01601-075-00-0750022015/9/250:02:21601-075-00-0751852015/9/250:02:25601-075-00-0750022015/9/250:02:57601-075-00-075239该示例中,窗口的长度为1分钟,则基于表2的记载,窗口的划分为[2015/9/250:00:00,2015/9/250:00:59],[2015/9/250:01:00,2015/9/250:01:59],[2015/9/250:02:00,2015/9/250:02:59]。表3为对表2所示数据进行分窗后的结果。表3对表2中的数据进行时间分窗后,可能存在重复数据,对于重复的数据,表3中只示出其中一条。基于表3所示数据,进行时间粗粒化的结果如表4所示。表4event_timestandard_alarm_id2015/9/250:00:00601-075-00-0750022015/9/250:00:00601-075-00-0750222015/9/250:00:00601-075-00-0750232015/9/250:01:00601-075-00-0750772015/9/250:01:00601-075-00-0751042015/9/250:02:00601-075-00-0750022015/9/250:02:00601-075-00-0751852015/9/250:02:00601-075-00-075239在对时间进行粗粒化后,若告警数据除了时间字段相同外,其它字段也相同,说明告警数据重复,此时可以进行去重复处理,可以只保留重复的告警数据中的一条告警数据即可。与方法实施例相对应,本发明实施例还提供一种基于告警信息发现功能拓扑的装置,本发明实施例提供的基于告警信息发现功能拓扑的装置的一种结构示意图如图4所示,可以包括:获取模块41,去周期处理模块42,第一计算模块43,第二计算模块44、第一确定模块45和第二确定模块46;其中,获取模块41,用于获取预设时长内的若干条告警数据;去周期处理模块42,用于对所述若干条告警数据进行去周期处理,去除所述若干条告警数据中的周期性告警数据;第一计算模块43,用于基于去周期处理后的告警数据,计算任意两个网元的相关告警数据的条数;第二计算模块44,用于计算所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值;第一确定模块45,用于基于所述任意两个网元的可能的相关告警数据的条数,以及各个可能的相关告警数据的条数对应的概率值,确定与该任意两个网元对应的相关条数阈值;第二确定模块46,用于若所述任意两个网元的相关告警数据的条数大于与该任意两个网元对应的相关条数阈值,确定该任意两个网元为功能拓扑对。由于告警数据通常是网元的功能出现故障时才会产生的数据,因此,若确定两个网元为功能拓扑对,说明这两个网元的功能是相关联的。更具体的说,若两个网元为功能拓扑对,说明这两个网元的故障是相关联的。由于告警数据一般为实时流式数据,数据及时性好,因此,通过本发明实施例提供的基于告警信息发现功能拓扑的装置,可以更为及时的获取网元的功能拓扑信息,而且由于告警数据通常是提示网络故障的,所确定的网元功能拓扑对为发生故障的网元,也就是说,判定为功能拓扑对的网元的故障相关联,因而能够方便网管人员更快捷地定位网络故障。可选的,本发明实施例提供的去周期处理模块42的一种结构示意图如图5所示,可以包括:第一获取单元51,第一计算单元52,第一判断单元53,删除单元54,逐条处理单元55和触发单元56;其中,第一获取单元51,用于对于所述若干条告警数据中的属于同一网元的同一类型的告警数据,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间;第一计算单元52,用于计算提取的n个告警发生时间中相邻时间的时间间隔和这些时间间隔的平均值;第一判断单元53,用于基于所述时间间隔和所述时间间隔的平均值判断所述n条告警数据是否是周期性告警数据;删除单元54,用于若所述n条告警数据是周期性告警数据,则删除所述n条告警数据中非时间最早的n-1条告警数据;逐条处理单元55,用于对于告警发生时间位于所述n条告警数据之后的属于同一网元的同一类型的告警数据,逐条判断是否为所述n条告警数据的周期性告警数据;若所述n条告警数据之后的第i条告警数据是所述n条告警数据的周期性告警数据,则删除所述第i条告警数据;若所述第i条告警数据不是所述n条告警数据的周期性告警数据,则触发所述第一获取单元51,从所述第i条告警数据开始,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间;触发单元56,用于若所述n条告警数据是非周期性告警数据,则触发所述第一获取单元51,从所述n条告警数据之后的第一条告警数据开始,按照告警发生时间的先后顺序提取n条告警数据中的告警发生时间。可选的,本发明实施例提供的第一判断单元53可以包括:第一计算子单元,用于计算每一个相邻告警数据的时间间隔与所述时间间隔的平均值的差值;第一确定子单元,用于若所有差值均在预置的阈值区间内,则确定所述n条告警数据是周期性告警数据,否则,确定所述n条告警数据是非周期性告警数据。可选的,本发明实施例提供的逐条处理单元54可以包括:第二计算子单元,用于计算所述第i条告警数据与第i-1条告警数据的时间间隔,并计算该时间间隔与所述时间间隔的平均值的差值;第二确定子单元,用于若计算得到的差值在预置的阈值区间内,则确定所述第i条告警数据为所述n条告警数据的周期性告警数据;否则,确定所述第i条告警数据不是所述n条告警数据的周期性告警数据;删除子单元,用于若所述n条告警数据之后的第i条告警数据是所述n条告警数据的周期性告警数据,则删除所述第i条告警数据;触发子单元,用于若所述第i条告警数据不是所述n条告警数据的周期性告警数据,则触发所述第一获取单元,从所述第i条告警数据开始,按照时间先后顺序获取n条未进行去周期处理的告警数据。可选的,上述预设时长被划分为若干时间段;本发明实施例提供的第一计算模块43的一种结构示意图如图6所示,可以包括:统计单元61和第一确定单元62;其中,统计单元61用于基于告警数据中的网元标识和告警数据发生时间统计各个网元在所示预设时长内发生告警的时间段;第一确定单元62用于对于任意两个网元,将该任意两个网元发生告警的相同时间段的个数确定为该任意两个网元的相关告警数据的条数。可选的,本发明实施例提供的第一确定模块45的一种结构示意图如图7所示,可以包括:第二计算单元71和第二确定单元72;其中,第二计算单元71用于按照可能的相关告警数据的条数从小到大的顺序计算对应概率值的累计值;第二确定单元72用于确定第一个大于预置累计阈值的累计值,将得到该累计值所应用的概率值对应的最大的可能的相关告警数据的条数确定为所述任意两个网元对应的相关条数阈值。可选的,本发明实施例提供的获取模块41的一种结构示意图如图8所示,可以包括:第二获取单元81,初始处理单元82和粗粒化单元83;其中,第二获取单元81用于获取预设时长内的所有告警数据;初始处理单元82用于基于预设字段信息对所述第二获取单元获取的告警数据进行初始处理,剔除告警数据中不完整的告警数据,以及重复的告警数据;粗粒化单元83用于对进行初始处理后的告警数据的告警发生时间进行时间粗粒化,得到所述若干条告警数据。本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统(若存在)、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1