一种告警同步方法和系统与流程

文档序号:13985255
一种告警同步方法和系统与流程

本发明涉及监控技术领域,尤其涉及一种告警同步方法和系统。



背景技术:

随着动力环境视频监控技术的发展,部署动力环境监控网管系统的电信运营商、电网公司越来越多,实际中每个大的区域都会部署多个网管系统。很多情况下需要把基层采集数据与告警数据收集汇总以便进行数据分析挖掘,进而出现了对基层采集数据以及告警数据进行实时监控分析的需求。

目前通常的做法是基层采集数据和告警数据分别进行同步,使用不同的机制对基层采集数据与告警数据进行同步。这种做法要求有两套同步机制来分别保证基层采集数据与告警数据的完整性与实时性,处理逻辑比较复杂。同步机制实现方式主要通过数据库中间表的方式,子站把收集到的基层采集数据或告警消息,定时写入指定数据库中间表中,主站定时扫描数据库中间表来同步告警消息。这种方式简单可靠,但是对消息的同步有不小的延时;另外需要分别保证数据与告警的完整性与实时性,部分场景要求数据与告警的一致性,处理逻辑上比较复杂。



技术实现要素:

本发明的主要目的在于提出一种告警同步方法和系统,旨在解决现有方案存在的问题。

为实现上述目的,本发明实施例第一方面提供一种告警同步方法,所述方法包括步骤:

接收子站网管上报的子站告警统计结果;其中所述子站告警统计结果,为子站网管根据生成的实时告警信息按照时间片段T2进行统计的;

按照时间顺序接收子站网管上报的实时采集数据,根据告警策略对子站网管上报的实时采集数据进行判断生成告警信息,并将该告警信息存入历史告警数据库;

将子站告警统计结果按照时间片段T1并以时间顺序进行统计,其中T1>T2;

合并所有的时间片段T1的统计结果,生成预设时间T的告警统计结果;其中预设时间T=N*T1,N>0。

此外,为实现上述目的,本发明实施例第二方面提供一种告警同步系统,所述系统包括:子站网管和主站网管;

所述子站网管,用于获取设备的实时采集数据;根据告警策略对实时采集数据进行告警判断,生成实时告警信息;对生成的实时告警信息按照时间片段T2进行统计,生成子站告警统计结果;将实时采集数据和实时告警统计结果上报给主站网管;

所述主站网管,用于接收子站网管上报的子站告警统计结果;按照时间顺序接收子站网管上报的实时采集数据,根据告警策略对子站网管上报的实时采集数据进行判断生成告警信息,并将该告警信息存入历史告警数据库;将子站告警统计结果按照时间片段T1并以时间顺序进行统计,其中T1>T2;合并所有的时间片段T1的统计结果,生成预设时间T的告警统计结果;其中预设时间T=N*T1,N>0。

本发明实施例提供的告警同步方法和系统,通过同步数据与告警策略,并根据数据与告警策略生成告警的方式,实现了多级网管下数据与告警的同步,节省了网络流量,简化了处理方式;通过主站网管直接与子站网管的数据采集节点获取数据的方式,避免了子站业务中心不可用时,无法进行数据同步的情况,提高了主站数据同步业务的可靠性;通过对基于实时告警的业务按照时间片段统计,子站上报实时统计的结果,在主站合并结果的方式,提高了基于实时告警业务的响应时间。

附图说明

图1为本发明实施例的告警同步方法流程示意图;

图2为本发明实施例的告警同步系统结构示意图;

图3为本发明实施例的告警同步系统中的主站网管结构示意图。

本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

现在将参考附图描述实现本发明各个实施例的。在后续的描述中,使用用于表示元件的诸如“模块”、“部件”或“单元”的后缀仅为了有利于本发明的说明,其本身并没有特定的意义。

如图1所示,本发明第一实施例提出一种告警同步方法,该方法包括步骤:

10、接收子站网管上报的子站告警统计结果。

在本实施例中,子站告警统计结果,为子站网管根据生成的实时告警信息按照时间片段T2进行统计的,该统计为实时告警统计。T2的值可由用户进行设置,例如:T2可以为30秒。

具体地,子站网管获取设备的实时采集数据;对获取的实时采集数据进行清洗和过滤;根据告警策略对清洗与过滤后的实时采集数据进行告警判断,生成实时告警信息;对生成的实时告警信息按照时间片段T2进行统计,生成子站告警统计结果。

在本实施例中,子站网管获取的设备的实时采集数据可根据存储策略进行历史数据的计算和保存;历史数据可以保存在关系型数据库也可以保存在非关系型数据库中,为以后深度分析使用。

在本实施例中,告警信息包括告警产生消息和告警消除消息。子站网管的告警判断可以根据阈值判断的方法,例如可以分别设定四级告警上下限的告警阈值,当获取到的设备的数据值在阈值区间的时候产生对应级别的告警。告警信息可存储在子站网管中的历史告警数据库中。

在本实施例中,子站网管的数量不进行限制,可以为多个。

需要说明的是,子站网管的告警策略需要进行配置。

11、按照时间顺序接收子站网管上报的实时采集数据,根据告警策略对子站网管上报的实时采集数据进行判断生成告警信息,并将该告警信息存入历史告警数据库。

在本实施例中,主站网管汇集所有子站网管上报的实时采集数据。需要说明的是,该实时采集数据为主站网管需要进行存储和告警判断的数据。

在一种可能的实施方式中,汇集的数据不仅包括子站网管上报的实时采集数据,还可以包括离线方式导入的数据,通过离线的日志文件、数据库等方式导入到主站网管。汇集的时候可以采用直接定时轮询,也可以采用订阅的方式。

子站网管向主站网管发送数据,为了保证数据完整性,一般在发送完数据消息后需要等待确认消息,如果没有收到确认消息会多次尝试发送。

在本实施例中,主站网管还可包括历史数据库;主站网管汇集的数据可根据存储策略进行历史数据的计算和保存到该历史数据库中,为以后深度分析使用。历史数据库可以为关系型数据库也可以为非关系型数据库中。

在本实施例中,告警信息包括告警产生消息和告警消除消息。主站网管的告警判断可以根据阈值判断的方法,例如可以分别设定四级告警上下限的告警阈值,当获取到的设备的数据值在阈值区间的时候产生对应级别的告警。告警信息可存储在主站网管中的历史告警数据库中。

需要说明的是,主站的告警策略需要与子站网管进行同步并得到该告警策略。具体地,主站网管可判断子站网管告警策略是否有变化,变化包括策略的增加、删除与修改。若有变化,子站网管发送消息给主站网管,消息中包括修改的策略以及对应设备的身份识别号。

在一种可能的实施方式中,接收子站网管上报的实时采集数据可包括步骤:

获取子站网管数据采集节点的地址信息;

根据子站网管数据采集节点的地址信息,获取子站网管数据采集节点的实时采集数据。

在一种可能的实施方式中,可根据判断生成的告警信息,进行告警联动处理。

具体地,告警联动时,判断告警时间与主站的系统时间是否超过给定的阈值,小于阈值则不进行告警联动。

12、将子站告警统计结果按照时间片段T1并以时间顺序进行统计。

在本实施例中,时间片段T1>时间片段T2。主站把要统计的当前时间到之前某一时间段T按照时间先后顺序先进行分割成多个T1(其中,T1<T)的时间片段,即T=N*T1,N>0。T1时间片段可根据子站网管上报的时间片段T2累加而成,例如:T1可为1小时。主站网管保存时间片段T1的统计值是为了减少主站网管的统计计算量,不直接保存子站网管上报的时间片段T2的统计值是因为,T2的值比较小,需要保存的值太多。后续进行合并后以T1时间片段为单位进行保存。统计需要按照时间先后顺序来进行统计。

在一种可能的实施方式中,该步骤之后可包括步骤:

若时间片段T1内没有统计结果,根据历史告警数据库的历史告警信息重新进行统计并得到该时间片段T1的统计结果。

具体地,主站搜集并记录各个时间段内T1的统计结果,如果主站存在T1时段的统计结果,则直接使用;如果不存在,即当前时间以前的时间片不存在(可能是子站网管掉线、重启等没有上报或者之前上报的还没有统计完成),那么可根据历史告警数据重新进行统计并得到该时间片段T1的统计结果。

13、合并所有的时间片段T1的统计结果,生成预设时间T的告警统计结果。

在一种可能的实施方式中,该步骤之前可包括步骤:

判断预设时间T内所有时间片段T1的统计结果是否完成,若完成则合并所有的时间片段T1的统计结果。

若没有完成,则继续将子站告警统计结果按照时间片段T1并以时间顺序进行统计。

本发明实施例提供的告警同步方法,通过同步数据与告警策略,并根据数据与告警策略生成告警的方式,实现了多级网管下数据与告警的同步,节省了网络流量,简化了处理方式;通过主站网管直接与子站网管的数据采集节点获取数据的方式,避免了子站业务中心不可用时,无法进行数据同步的情况,提高了主站数据同步业务的可靠性;通过对基于实时告警的业务按照时间片段统计,子站上报实时统计的结果,在主站合并结果的方式,提高了基于实时告警业务的响应时间。

本发明进一步提供一种系统。

参照图2和图3,图2为本发明第二实施例提出的一种告警同步系统,该系统包括:子站网管21和主站网管20。

其中,子站网管21不进行限定,可以为多个。

子站网管21,用于获取设备的实时采集数据;根据告警策略对实时采集数据进行告警判断,生成实时告警信息;对生成的实时告警信息按照时间片段T2进行统计,生成子站告警统计结果;将实时采集数据和实时告警统计结果上报给主站网管20。

具体地,子站网管21获取设备的实时采集数据;对获取的实时采集数据进行清洗和过滤;根据告警策略对清洗与过滤后的实时采集数据进行告警判断,生成实时告警信息;对生成的实时告警信息按照时间片段T2进行统计,生成子站告警统计结果。

在本实施例中,子站网管21获取的设备的实时采集数据可根据存储策略进行历史数据的计算和保存;历史数据可以保存在关系型数据库也可以保存在非关系型数据库中,为以后深度分析使用。

在本实施例中,告警信息包括告警产生消息和告警消除消息。子站网管21的告警判断可以根据阈值判断的方法,例如可以分别设定四级告警上下限的告警阈值,当获取到的设备的数据值在阈值区间的时候产生对应级别的告警。告警信息可存储在子站网管21中的历史告警数据库(附图未示出)中。

需要说明的是,子站网管21的告警策略需要进行配置。

主站网管20,用于接收子站网管21上报的子站告警统计结果;按照时间顺序接收子站网管21上报的实时采集数据,根据告警策略对子站网管21上报的实时采集数据进行判断生成告警信息,并将该告警信息存入历史告警数据库208;将子站告警统计结果按照时间片段T1并以时间顺序进行统计,其中T1>T2;合并所有的时间片段T1的统计结果,生成预设时间T的告警统计结果;其中预设时间T=N*T1,N>0。

在本实施例中,主站网管20汇集所有子站网管21上报的实时采集数据。需要说明的是,该实时采集数据为主站网管20需要进行存储和告警判断的数据。

在一种可能的实施方式中,汇集的数据不仅包括子站网管21上报的实时采集数据,还可以包括离线方式导入的数据,通过离线的日志文件、数据库等方式导入到主站网管20。汇集的时候可以采用直接定时轮询,也可以采用订阅的方式。

子站网管21向主站网管20发送数据,为了保证数据完整性,一般在发送完数据消息后需要等待确认消息,如果没有收到确认消息会多次尝试发送。

在本实施例中,主站网管20还可包括历史数据库206;主站网管20汇集的数据可根据存储策略进行历史数据的计算和保存到该历史数据库206中,为以后深度分析使用。历史数据库206可以为关系型数据库也可以为非关系型数据库中。

在本实施例中,告警信息包括告警产生消息和告警消除消息。主站网管20的告警判断可以根据阈值判断的方法,例如可以分别设定四级告警上下限的告警阈值,当获取到的设备的数据值在阈值区间的时候产生对应级别的告警。告警信息可存储在主站网管20中的历史告警数据库208中。

需要说明的是,主站网管20的告警策略需要与子站网管21进行同步并得到该告警策略。具体地,主站网管20还可包括同步模块205;该同步模块205用于与子站网管21进行同步并得到所述告警策略。主站网管20可判断子站网管21告警策略是否有变化,变化包括策略的增加、删除与修改。若有变化,子站网管21发送消息给主站网管20,消息中包括修改的策略以及对应设备的身份识别号。

在一种可能的实施方式中,主站网管20可包括地址信息查询模块201和数据汇集模块202;

地址信息查询模块201,用于查询并获取子站网管21数据采集节点(附图未示出)的地址信息;

数据汇集模块202,用于根据子站网管21数据采集节点的地址信息,获取子站网管21数据采集节点的实时采集数据。

在一种可能的实施方式中,主站网管20还可包括告警联动处理模块207;告警联动处理模块207,用于根据判断生成的告警信息,进行告警联动处理。

具体地,告警联动时,判断告警时间与主站的系统时间是否超过给定的阈值,小于阈值则不进行告警联动。

在本实施例中,时间片段T1>时间片段T2。主站网管20把要统计的当前时间到之前某一时间段T按照时间先后顺序先进行分割成多个T1(其中,T1<T)的时间片段,即T=N*T1,N>0。T1时间片段可根据子站网管21上报的时间片段T2累加而成,例如:T1可为1小时。主站网管20保存时间片段T1的统计值是为了减少主站网管20的统计计算量,不直接保存子站网管21上报的时间片段T2的统计值是因为,T2的值比较小,需要保存的值太多。后续进行合并后以T1时间片段为单位进行保存。统计需要按照时间先后顺序来进行统计。

在一种可能的实施方式中,主站网管20还包括第一判断模块203;

第一判断模块203,用于若时间片段T1内没有统计结果,根据历史告警数据库的历史告警信息重新进行统计并得到该时间片段T1的统计结果。

具体地,主站网管20搜集并记录各个时间段内T1的统计结果,如果主站网管20存在T1时段的统计结果,则直接使用;如果不存在,即当前时间以前的时间片不存在(可能是子站网管21掉线、重启等没有上报或者之前上报的还没有统计完成),那么可根据历史告警数据重新进行统计并得到该时间片段T1的统计结果。

在一种可能的实施方式中,主站网管20还可包括第二判断模块204;

第二判断模块204,用于判断预设时间T内所有时间片段T1的统计结果是否完成,若完成则合并所有的时间片段T1的统计结果。

若没有完成,则继续将子站告警统计结果按照时间片段T1并以时间顺序进行统计。

本发明实施例提供的告警同步系统,通过同步数据与告警策略,并根据数据与告警策略生成告警的方式,实现了多级网管下数据与告警的同步,节省了网络流量,简化了处理方式;通过主站网管直接与子站网管的数据采集节点获取数据的方式,避免了子站业务中心不可用时,无法进行数据同步的情况,提高了主站数据同步业务的可靠性;通过对基于实时告警的业务按照时间片段统计,子站上报实时统计的结果,在主站合并结果的方式,提高了基于实时告警业务的响应时间。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

工业实用性:

本发明实施例提供的告警同步方法和系统,通过同步数据与告警策略,并根据数据与告警策略生成告警的方式,实现了多级网管下数据与告警的同步,节省了网络流量,简化了处理方式;通过主站网管直接与子站网管的数据采集节点获取数据的方式,避免了子站业务中心不可用时,无法进行数据同步的情况,提高了主站数据同步业务的可靠性;通过对基于实时告警的业务按照时间片段统计,子站上报实时统计的结果,在主站合并结果的方式,提高了基于实时告警业务的响应时间。具有工业实用性。

再多了解一些
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1