一种设备倒换状态获取方法及装置与流程

文档序号:28596945发布日期:2022-01-22 10:34阅读:72来源:国知局
一种设备倒换状态获取方法及装置与流程

1.本发明涉及通信技术领域,特别涉及一种设备倒换状态获取方法及装置。


背景技术:

2.在电信业务的管理过程中,需要实时关注具体业务的运行状态。当主用业务发生故障切换至备用业务时,网管需实时获知并反馈该业务已发生倒换。通常在设备发生倒换后,设备与网管系统是通过专门的事件通道将相应事件上报至网管系统处理,并将处理后的倒换状态结果进行展示。在此过程中,设备发生告警也会向网管上报告警信息,网管接收到告警信息后进行展示。
3.伴随着运营商的设备网络日益庞大,电信网管所管理的设备数量也激增,随之而来的是设备上报的事件、告警数量也成级数增长,从而导致网管软件系统对这成级数增长的事件、告警的处理效率降低,反馈至展示界面的延时也越来越大,直接影响到用户体验。因此,网管系统如何能更快速处理这些事件、告警,以快速反馈出业务的倒换状态,成了亟待解决的重要问题。


技术实现要素:

4.本发明实施例提供一种设备倒换状态获取方法及装置,以解决相关技术中的问题。
5.第一方面,本发明实施例提供一种设备倒换状态获取方法,其特征在于,网管系统用于根据从设备获取的当前告警获取设备倒换状态,所述设备倒换状态获取方法包括步骤:
6.从当前告警中筛选出参与设备倒换状态分析的告警;
7.将一个时间周期内筛选出的告警按照定位源分组后获取每组告警的业务倒换结果;
8.将当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果进行比较以确定最终的倒换状态结果并上送网管系统。
9.一些实施例中,从当前告警中筛选出参与设备倒换状态分析的告警,包括步骤:
10.将告警项中包含业务倒换相关信息的告警作为参与设备倒换状态分析的告警;
11.所述业务倒换相关信息用于反映引发告警的原因,其包括主用倒备用、倒换失败、倒收以及等待恢复。
12.一些实施例中,将一个时间周期内筛选出的告警按照定位源分组后获取每组告警的业务倒换结果,包括步骤:
13.将来自同一定位源的告警分为一组,并按照告警发生时间进行排序;
14.根据发生时间在后的告警获取该组告警的业务倒换结果。
15.一些实施例中,根据时间在后的告警获取该组告警的业务倒换结果,包括步骤:
16.若告警级别相同,则以在后发生的告警确定该组告警的业务倒换结果;
17.若告警级别不同,则从最后发生的两个告警中选择其中级别高的告警并以此确定该组告警的业务倒换结果;
18.所述告警级别用于反映告警的紧急程度和/或重要程度,其包括紧急、重要、次要以及提示。
19.一些实施例中,将来自同一定位源的告警分为一组,并按照告警发生时间进行排序,包括步骤:
20.对一组内的告警,将告警项信息相同的告警进行合并。
21.一些实施例中,将当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果进行比较以确定最终的倒换状态结果并上送网管系统,包括步骤:
22.若当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果不同,则以当前时间周期获取的业务倒换结果为最终的倒换状态结果并上送网管系统。
23.第二方面,本发明实施例提供一种设备倒换状态获取装置,其特征在于,其用于根据从设备获取的当前告警获取设备倒换状态,其包括:
24.告警筛选模块,其用于从当前告警中筛选出参与设备倒换状态分析的告警;
25.告警分析模块,其用于将一个时间周期内筛选出的告警按照定位源分组后获取每组告警的业务倒换结果;
26.倒换状态获取模块,其用于将当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果进行比较以确定最终的倒换状态结果并上送网管系统。
27.一些实施例中,所述告警筛选模块还用于:
28.将告警项中包含业务倒换相关信息的告警作为参与设备倒换状态分析的告警;
29.所述业务倒换相关信息用于反映引发告警的原因,其包括主用倒备用、倒换失败、倒收以及等待恢复。
30.一些实施例中,所述告警分析模块还用于:
31.将来自同一定位源的告警分为一组,并按照告警发生时间进行排序;
32.根据发生时间在后的告警获取该组告警的业务倒换结果。
33.一些实施例中,所述告警分析模块还用于:
34.若告警级别相同,则以在后发生的告警确定该组告警的业务倒换结果;
35.若告警级别不同,则从最后发生的两个告警中选择其中级别高的告警并以此确定该组告警的业务倒换结果;
36.所述告警级别用于反映告警的紧急程度和/或重要程度,其包括紧急、重要、次要以及提示。
37.本发明的有益效果在于网管系统只根据当前告警进行分析处理即可实现倒换展示和告警展示。在一个时间周期内,网管仅处理n个告警,利用n中的一部分告警(参与设备倒换状态分析的告警),以获取倒换状态结果。网管处理的任务少了m个,设备无需再额外上报倒换事件,针对海量事件处理情况时,可有效减少内存消耗、降低系统处理压力。因此,对于网管系统、传输设备而言,是一种简洁高效的处理方案,无应用场景限制,易于开发、易于维护。
附图说明
38.为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
39.图1为本发明实施例提供的一种设备倒换状态获取方法的流程示意图;
40.图2为现有技术中倒换事件上报流程示意图;
41.图3为本发明实施例提供的一种设备倒换状态获取方法的流程示意图;
42.图4为本发明实施例提供的一种设备倒换状态获取方法的流程示意图;
43.图5为本发明实施例提供的一种设备倒换状态获取装置示意图。
具体实施方式
44.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明的一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
45.相关技术中,如图2所示,网管系统连接多端设备,接收各设备上报的倒换事件;将收到的倒换事件放入接收队列中,并开线程分析处理;最终得出端到端业务的倒换状态结果,推送至网管界面。同时,网管系统也会接收各设备上报的告警,实时处理这些告警,并将当前告警实时显示至网管界面。假若在某段时间内,网管接收的倒换事件数量为m个,接收的告警数量为n个,则这段时间内网管系统要处理的倒换事件+告警总数为m+n个。
46.为了减少网管系统处理设备的倒换类事件数量,本发明实施例提供了一种设备倒换状态获取方法,网管系统用于根据从设备获取的当前告警获取设备倒换状态,如图1所示,设备倒换状态获取方法包括步骤:
47.s100:从当前告警中筛选出参与设备倒换状态分析的告警;
48.s200:将一个时间周期内筛选出的告警按照定位源分组后获取每组告警的业务倒换结果;
49.s300:将当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果进行比较以确定最终的倒换状态结果并上送网管系统。
50.通过本实施例,网管系统只根据当前告警进行分析处理即可实现倒换展示和告警展示。如图3所示,在一个时间周期内,网管仅处理n个告警,利用n中的一部分告警(参与设备倒换状态分析的告警),以获取倒换状态结果。网管处理的任务少了m个,设备无需再额外上报倒换事件,针对海量事件处理情况时,可有效减少内存消耗、降低系统处理压力。因此,对于网管系统、传输设备而言,是一种简洁高效的处理方案,无应用场景限制,易于开发、易于维护。
51.进一步地,一些实施例中,s100包括步骤:
52.s110:将告警项中包含业务倒换相关信息的告警作为参与设备倒换状态分析的告警;
53.其中,业务倒换相关信息用于反映引发告警的原因,其包括主用倒备用、倒换失
败、倒收以及等待恢复。
54.需要说明的是,一般告警的告警项中包含有告警编号、告警名称、告警级别、定位源信息、告警状态等。其中告警名称包含的信息可用于反映是否为业务倒换相关的告警。
55.在一个具体的实施例中,厂家通信设备上报告警项的列表显示如下:
56.{
57.告警1(编号:1743,中文名称:主用倒备用,英文名称:w_to_p,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
58.告警2(编号:192,中文名称:输入信号丢失,英文名称:r_los,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
59.告警3(编号:1962,中文名称:风扇失常,英文名称:fan_fail,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
60.告警4(编号:226,中文名称:倒换失败,英文名称:sw_fail,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
61.告警5(编号:2668,中文名称:防雷失效,英文名称:lightning_protect_fail,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
62.告警6(编号:80,中文名称:倒收,英文名称:swr,级别:次要(60),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
63.告警7(编号:190,中文名称:等待恢复,英文名称:swtr,级别:次要(60),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
64.}
65.通过步骤s110,将告警项中包含业务倒换相关信息的告警作为参与设备倒换状态分析的告警,则可筛选出:
66.参与设备倒换状态分析的告警:
67.{
68.告警1(编号:1743,中文名称:主用倒备用,英文名称:w_to_p,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
69.告警4(编号:226,中文名称:倒换失败,英文名称:sw_fail,级别:紧急(50),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
70.告警6(编号:80,中文名称:倒收,英文名称:swr,级别:次要(60),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
71.告警7(编号:190,中文名称:等待恢复,英文名称:swtr,级别:次要(60),定位源信息:xx板卡-yy槽位-zz端口,状态:发生/结束(0/1)),
72.}
73.可以理解的是,通常每条业务会经过n端设备,业务路由经过每端设备上的具体xx板卡-yy槽位-zz端口。这样由告警项中的定位源信息就可以找到某条具体的端到端业务,也可由告警项映射到某条端到端业务。即告警计算出的倒换结果,可以映射到端到端业务上。
74.可优选地,将该类告警作为配置文件写入脚本(可随时调整修正),作为程序接收全量告警的筛选过滤条件。
75.进一步地,一些实施例中,s200包括步骤:
76.s210:将来自同一定位源的告警分为一组,并按照告警发生时间进行排序;
77.s220:根据发生时间在后的告警获取该组告警的业务倒换结果。
78.通过本实施例,将同一定位源上的告警(通常一个时间周期可设置为2s内),按设备告警发生的时间顺序做严格排序,是为了防止由设备上报至网管后,由于网络通信原因造成的告警收发时间顺序不一致的现象(如设备较先发生告警,网管较后收到的现象)。
79.一些实施例中,s220包括步骤:
80.s221:若告警级别相同,则以在后发生的告警确定该组告警的业务倒换结果;
81.s222:若告警级别不同,则从最后发生的两个告警中选择其中级别高的告警并以此确定该组告警的业务倒换结果。
82.其中,告警级别用于反映告警的紧急程度和/或重要程度,其包括紧急、重要、次要以及提示。
83.需要说明的是,通常级别的排序为:紧急》重要》次要》提示。
84.一些实施例中,s210包括步骤:
85.s211:对一组内的告警,将告警项信息相同的告警进行合并。
86.本实施例考虑到由于网络原因,导致同一告警源的同一告警项发送重复上报的问题。通过步骤s211的去重处理,避免报给用户无用的计算结果。
87.在一些实施例中,考虑到震荡告警发生时,由于其告警状态不停的切换,如在2s内上报了20次(其中10次是告警发生,10次为告警结束,上报一次发生,紧接着上报一次结束)。因此可在识别出震荡告警之后,对这类告警进行压制,以最后一次的状态为准,过滤掉其他多余的震荡告警,使在2s内仅计算一次倒换结果。
88.一些实施例中,s300包括步骤:若当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果不同,则以当前时间周期获取的业务倒换结果为最终的倒换状态结果并上送网管系统。
89.需要说明的是,若当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果相同,则不需要再通知上层用户感知。即用户侧不需要接收该倒换结果的消息,以保证用户收到的数据都是有效的。
90.在一个具体的实施例中,网管系统是一直运行的状态,内(外)存存储了上一个时间周期内所有业务倒换的结果,其中结果值可用三种表示:在主用、在备用以及等待恢复,且没有告警时默认结果为:在主用。
91.假设1,上一个时间周期内,业务a存储的结果为:在主用,
92.1)若当前时间周期获取的业务倒换结果:在备用,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:在备用;
93.2)若当前时间周期获取的业务倒换结果:在主用,此时表示业务a的当前计算结果与上一个时间周期存储的结果一致。因此无需再更新内(外)存数据。可认为是重复告警上报导致。
94.3)若当前时间周期获取的业务倒换结果:等待恢复,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:等待恢复。
95.其中,内(外)存是一种数据存储容器,分程序内存存储与持久化外存存储(小型数
据库)。本实施例采用类似leveldb/sqllite的数据库,数据存取效率较高,可以动态平衡内存与外存的数据存放,来满足数据查询效率。
96.假设2,上一个时间周期内,业务a存储的结果为:在备用,
97.1)若当前时间周期获取的业务倒换结果:在备用,此时表示业务a的当前计算结果与上一个时间周期存储的结果一致。因此无需再更新内(外)存数据。可认为是重复告警上报导致。
98.2)若当前时间周期获取的业务倒换结果:在主用,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:在主用;
99.3)若当前时间周期获取的业务倒换结果:等待恢复,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:等待恢复。
100.假设3,上一个时间周期内,业务a存储的结果为:等待恢复,
101.1)若当前时间周期获取的业务倒换结果:在备用,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:在备用;
102.2)若当前时间周期获取的业务倒换结果:在主用,此时表示业务a有了新的结果,将该计算结果更新至内(外)存,使业务a存储的结果更新为:在主用;
103.3)若当前时间周期获取的业务倒换结果:等待恢复,此时表示业务a的当前计算结果与上一个时间周期存储的结果一致。因此无需再更新内(外)存数据。可认为是重复告警上报导致。
104.如图4所示,在一些实施例中,设备告警变化时,将告警上报至网管系统,网管系统从上报的告警中筛选出倒换相关告警(即参与设备倒换状态分析的告警),并进行倒换状态结果计算(如前述步骤s200或s210),后更新至内(外)存(内部对象和/或外存数据)。同时,还考虑到业务数据变化可能引起倒换状态变化的情况,增加了业务数据更新通道,内(外)存接收更新业务路由的基础数据对存储的倒换结果信息进行。例如原来某条业务有倒换发生,若用户直接把该条业务删除掉,原来通过告警计算出来的倒换结果也随之清除掉。
105.另一方面,如图5所示,本技术实施例还提供了一种设备倒换状态获取装置,其用于根据从设备获取的当前告警获取设备倒换状态,其包括:
106.告警筛选模块,其用于从当前告警中筛选出参与设备倒换状态分析的告警;
107.告警分析模块,其用于将一个时间周期内筛选出的告警按照定位源分组后获取每组告警的业务倒换结果;
108.倒换状态获取模块,其用于将当前时间周期获取的业务倒换结果与前一时间周期获取的业务倒换结果进行比较以确定最终的倒换状态结果并上送网管系统。
109.一些实施例中,所述告警筛选模块还用于:
110.将告警项中包含业务倒换相关信息的告警作为参与设备倒换状态分析的告警;
111.所述业务倒换相关信息用于反映引发告警的原因,其包括主用倒备用、倒换失败、倒收以及等待恢复。
112.一些实施例中,所述告警分析模块还用于:
113.将来自同一定位源的告警分为一组,并按照告警发生时间进行排序;
114.根据发生时间在后的告警获取该组告警的业务倒换结果。
115.一些实施例中,所述告警分析模块还用于:
116.若告警级别相同,则以在后发生的告警确定该组告警的业务倒换结果;
117.若告警级别不同,则从最后发生的两个告警中选择其中级别高的告警并以此确定该组告警的业务倒换结果;
118.所述告警级别用于反映告警的紧急程度和/或重要程度,其包括紧急、重要、次要以及提示。
119.可以理解的是,基于前述实施例可达到的相同技术效果,相对于现有的技术方案,本发明实施例的有益效果在于:
120.a、减少网管系统处理设备的倒换类事件数量;
121.在大容量网管系统所管理的设备时,业务相应的倒换事件数量也随之增大,本发明可摒弃设备上报的倒换事件,改为直接利用设备发生的当前告警进行处理分析以获取设备倒换状态结果,可减少大量的倒换事件,使得网管可以不需要再处理倒换事件的内存消耗,大大提高了设备的效率。
122.b、通过要筛选出与倒换相关的告警,并且同一定位源告警,按本端设备定位信息的告警时序收集,进行告警分析,最终得出相应的倒换状态结果,使网管在减少了设备数据源(倒换类事件)情况下,保证最终计算出的倒换状态的准确性。
123.在本发明的描述中,需要说明的是,术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
124.需要说明的是,在本发明中,诸如“第一”和“第二”等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
125.以上所述仅是本发明的具体实施方式,使本领域技术人员能够理解或实现本发明。对这些实施例的多种修改对本领域的技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所申请的原理和新颖特点相一致的最宽的范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1