监控性能数据相似性度量的告警方法和系统与流程

文档序号:11829357阅读:237来源:国知局
本发明属于性能数据告警
技术领域
,尤其涉及一种监控性能数据相似性度量的告警方法和系统。
背景技术
:现有性能监控系统的监控数据告警策略主要有以几种:1、监控数据变化告警:监控指标一般不变化,但凡有变化都可能是系统异常触发;2、监控数据无变化告警:监控指标一般处于不断变化中,但凡有长时间无变化都可能是系统异常导致;3、监控数据阈值告警:监控指标值在一个或几个值域范围内,但凡超出值域范围都可能是系统异常导致;4、动态基线告警:监控指标值在不同时点处于不同值域范围,动态基线数据按照时点构建一系列值域范围,在特定的时间点使用特定的阈值范围判断指标是否异常。以上1、2、3告警策略满足管理人员对系统中运行特性较稳定的指标值告警处理,而对于运行特征异变的复杂系统,以上告警策略往往不能胜任性能告警的职责,第4策略解决了1、2、3告警策略对异变系统的适应问题,却带来了动态基线数据计算复杂,基线阈值设置麻烦的问题。上述问题亟待解决。技术实现要素:针对对于运行特征异变的复杂系统,现有告警策略往往不能胜任性能告警的职责或者计算复杂,设置麻烦的缺陷,本发明实施例提供一种监控性能数据相似性度量的告警方法和系统。本发明提供一种监控性能数据相似性度量的告警方法,包括:根据本周期的性能数据通过离散小波变换构建本周期时间序列;查询对应所述本周期时间序列的上周期时间序列;判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围,若否,返回继续根据本周期的性能数据通过离散小波变换构建本周期时间序列;若是,触发告警信息。优选的,所述根据本周期的性能数据通过离散小波变换构建本周期时间序列之前包括:从监控系统和指标性能数据缓冲区中获取当前时间点的性能数据;查询本周期到当前时间点的历史性能数据。优选的,所述判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围之前包括:指定目标时间序列中需进行统计的有效时间段;提取所述有效时间段内具有相同指标的所有有效时间序列;获取所述提取出的所有有效时间序列之间的序列两两相似性;根据所述序列两两相似性设定相似性变化范围。优选的,所述序列两两相似性具体包括:相似性标准差以及相似性平均值。优选的,所述根据所述序列两两相似性设定相似性变化范围还包括:根据监控运行策略设定变化范围。本发明还提供一种监控性能数据相似性度量的告警系统,包括:构建模块,用于根据本周期的性能数据通过离散小波变换构建本周期时间序列;查询模块,用于查询对应所述本周期时间序列的上周期时间序列;判定模块,用于判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围,若否,返回继续根据本周期的性能数据通过离散小波变换构建本周期时间序列;告警模块,用于触发告警信息。优选的,所述系统还用于:从监控系统和指标性能数据缓冲区中获取当前时间点的性能数据;查询本周期到当前时间点的历史性能数据。优选的,所述系统还用于:指定目标时间序列中需进行统计的有效时间段;提取所述有效时间段内具有相同指标的所有有效时间序列;获取所述提取出的所有有效时间序列之间的序列两两相似性;根据所述序列两两相似性设定相似性变化范围。优选的,所述序列两两相似性具体包括:相似性标准差以及相似性平均值。优选的,所述根据所述序列两两相似性设定相似性变化范围还包括:根据监控运行策略设定变化范围。有益效果:本发明将时间序列数据表示算法及相似性度量算法引入到监控数据告警领域,丰富了性能数据告警策略,通过简便配置即可实现性能时间序列数据动态特征异常的告警。时间序列相似性策略在传统策略的基础之上,丰富了系统异常事件检测手段,填补了传统策略在系统动态特征监控上的不足。附图说明图1为本发明实施例提供的监控性能数据相似性度量的告警方法步骤图;图2为本发明另一实施例提供的监控性能数据相似性度量的告警方法步骤图;图3为本发明另一实施例提供的监控性能数据相似性度量的告警方法步骤图;图4为本发明另一实施例提供的某设备一周的CPU利用率的时间序列曲线;图5为本发明实施例提供的监控性能数据相似性度量的告警系统结构图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。监控系统负载情况往往具备时间周期特性,这一特征使得大量监控性能时间序列数据在特定周期内按相同的图形特征变化,若此周期内性能时间序列与上一周期性能时间序列相似性超出相似性变化范围,则表明性能时间序列在本周期内未按照固有的周期特征运行,同时也就表面本周期内有异常事件发生。本发明根据监控系统负载情况具备时间周期特性,如图1所示,提供一种监控性能数据相似性度量的告警方法,包括:S100、根据本周期的性能数据通过离散小波变换构建本周期时间序列;具体的,相似性度量是衡量两个序列相似性的依据,时间序列相似性度量主要分为两步完成:(1)从时间序列中收集用以度量的特征,然后表示为一定的形式;(2)设计公式去度量两个序列表示之间的距离。现有的特征表示方法主要完成第一步工作,而第二步主要通过距离度量方法完成。目前典型的时间序列数据特征表示形式主要有离散傅里叶变换(DFT)、奇异值分解(SVD)、离散小波变换(DWT)、分段线性表示(PLR,包括PLA、PAA、APCA)、符号表示法(SA)以及界标模型(Landmarks)等。为了实现相似度计算首先需选择合适的性能数据表示算法,根据性能数据的时间序列各指标采集频率不一致的特征,选择离散小波变换(DWT)算法来实现性能数据的图形特征提取,完成对性能时间序列特征向量的构建。在具体实施离散小波变换(DWT)算法时选取了标准化的Haar小波算法,具体算法描述如下:设{x1,x2,x3,x4}是一个时间序列。定义它的平均和细节:a1,0=(x1+x2)/2d1,0=(x1-x2)/2]]>这里,a1,0是原信号前两个值x1、x2的平均。又叫低频成分,反映前两个值x1、x2的基本特征或粗糙趋势;d1,0反映了x1、x2的差别,即细节信息,又叫高频成分。找出了x3、x4和a1,1、d1,1的关系。同样,a1,1是原信号后两个值x3、x4的平均,d1,1反映了x3、x4的细节。把{a1,0,a1,1,d1,0,d1,1}看作是对{x1,x2,x3,x4}实施了一次变换的结果。变换还可以往下进行:a0,0=(a1,0+a1,1)/2=((x1+x2)/2+(x3+x4)/2)/2=(x1+x2+x3+x4)/4a0,0是对4个信号元素最终的平均,它是原信号最基本的信息;d0,0=(a1,0-a1,1)/2。经过二次变换,得到了原时间序列的另一种表示:{a0,0,d0,0,d1,0,d1,1}这就是经过离散小波变换后的时间序列特征向量,具体实施中需根据具体情况选择步长及变换次数。进一步的,离散小波变换(DWT)算法在时间序列特征提取上能充分的表达时间序列的图形特征,在降低距离计算纬度的同时,保留了足够的时间序列图形信息。离散傅里叶变换(DFT)作为最早提出的降维方法,在本方案中实施也可以达到良好的效果。S200、查询对应所述本周期时间序列的上周期时间序列;S300、判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围,若否,返回继续根据本周期的性能数据通过离散小波变换构建本周期时间序列;S400、若是,触发告警信息。优选的,如图2所示,所述根据本周期的性能数据通过离散小波变换构建本周期时间序列之前包括:S400、从监控系统和指标性能数据缓冲区中获取当前时间点的性能数据;S500、查询本周期到当前时间点的历史性能数据。优选的,如图3所示,所述判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围之前包括:S600、指定目标时间序列中需进行统计的有效时间段;S700、提取所述有效时间段内同一监控指标的所有有效时间序列数据;具体的,针对同一监控指标的性能时间序列数据在采集时按固有频率进行,且使用了能保证时间序列数据特征数据长度相等,因此选择了计算较为简单又能三角不等性的欧式距离作为性能时间序列相似性度量方法。1)欧氏距离:将长度为n的时间序列的特征向量看作是n维欧氏空间中的一个点,它的坐标值分别是时间序列在各个时刻的取值,那么两条长度为n的时间序列之间的欧几里德距离就是n维空间中两个点之间的距离。其数学形式描述如下:给定两条时间序列X={x1,x2,…,xn},Y={y1,y2,…,yn},它们之间的欧几里德距离定义为:D(X,Y)=Σi=1n|xi-yi|2.]]>它的推广形式也称为Miknowksi距离,也称为Lp距离,公式为:当p=1时,称为曼哈顿距离;当p=∞时,称之为最大距离。欧氏距离的优点是计算简单、容易理解,并且满足距离三角不等式,但不支持时间序列的线性漂移和时间轴伸缩;获取所述提取出的所有有效时间序列之间的序列两两相似性;S800、根据所述序列两两相似性设定相似性变化范围。具体的,性能时间序列的相似性统计信息,发现相似性的变化也具备正态分布特征,基于此原则可方便的选取性能时间序列相似性变化范围,并基于此范围实现时间序列相似性的异常检验,对超范围的性能指标实现监控告警处理。优选的,所述序列两两相似性具体包括:相似性标准差以及相似性平均值。设同一指标的时间序列数据如下:2016-07-11:t2016-07-11:t22016-07-11:t32016-07-11:t42016-07-11:t5使用小波变换后得到的特征向量为:p1,p2,p3,p4,p5。使用欧氏距离计算得到的相似性度量为:D1,2,D1,3,D1,4,D1,5,D2,3,D2,4,D2,5,D3,4,D3,5,D4,5。相似性度量平均值:u=D1,2+D1,3+D1,4+D1,5+D2,3+D2,4+D2,5+D3,4+D3,5+D4,510.]]>相似性度量标准差:将距离值重新规整下表为:D1,D2,D3,D4,D5,D6,D7,D8,D9,D10。则标准差表示为:s=Σt=110(Dt-u)292.]]>具体的,监控系统性能数据中心基于上述离散小波变换及欧氏距离计算方实现了性能时间序列数据的相似性索引及查询,通过查询同一指标历史数据的相似性计算结果,可以获取到目标性能时间序列与历史各性能时间序列相似性数据,从而得到性能时间序列的相似性统计信息(相似性标准差以及相似性平均值)。优选的,所述根据所述序列两两相似性设定相似性变化范围还包括:根据监控运行策略设定变化范围。实际运行中也可以简单的设定经验值作为变化范围,在系统运行中逐步调整变化范围设置。如图4所示,为某设备一周的CPU利用率的时间序列曲线。开始时按经验设置两倍的标准差作为正常阈值范围,面对第五天明显出现运行异常的情况,系统未给出告警信息,经检查,系统有两段时间为掉线状态,未采集到CPU利用率数据,其他时间段采集到的数据与日常运行一致,检查到这一状况后将阈值改为一倍标准差,测试使用防火墙关闭目标设备采集端口20分钟,重新打开端口连续4到5个采集周期后,系统发出CPU利用率动态特征异常告警。本发明实施例提供的方法将时间序列数据表示算法及相似性度量算法引入到监控数据告警领域,丰富了性能数据告警策略,通过简便配置即可实现性能时间序列数据动态特征异常的告警。时间序列相似性策略在传统策略的基础之上,丰富了系统异常事件检测手段,填补了传统策略在系统动态特征监控上的不足。本发明还提供一种监控性能数据相似性度量的告警系统,如图5所示,包括:构建模块100,用于根据本周期的性能数据通过离散小波变换构建本周期时间序列;查询模块200,用于查询对应所述本周期时间序列的上周期时间序列;判定模块300,用于判定所述本周期时间序列和上周期时间序列的相似性是否超出变化范围,若否,返回继续根据本周期的性能数据通过离散小波变换构建本周期时间序列;告警模块400,用于触发告警信息。优选的,所述系统还用于:从监控系统和指标性能数据缓冲区中获取当前时间点的性能数据;查询本周期到当前时间点的历史性能数据。优选的,所述系统还用于:指定目标时间序列中需进行统计的有效时间段;提取所述有效时间段内具有相同指标的所有有效时间序列;获取所述提取出的所有有效时间序列之间的序列两两相似性;根据所述序列两两相似性设定相似性变化范围。优选的,所述序列两两相似性具体包括:相似性标准差以及相似性平均值。优选的,所述根据所述序列两两相似性设定相似性变化范围还包括:根据监控运行策略设定变化范围。需要说明的是,本发明实施例提供的上述系统中各个模块,由于与本发明方法实施例基于同一构思,其带来的技术效果与本发明方法实施例相同,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。本发明实施例提供的系统将时间序列数据表示算法及相似性度量算法引入到监控数据告警领域,丰富了性能数据告警策略,通过简便配置即可实现性能时间序列数据动态特征异常的告警。时间序列相似性策略在传统策略的基础之上,丰富了系统异常事件检测手段,填补了传统策略在系统动态特征监控上的不足。以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1