数据监控系统、设备和方法与流程

文档序号:28163048发布日期:2021-12-24 20:56阅读:188来源:国知局
数据监控系统、设备和方法与流程

1.本发明涉及计算机技术领域,具体而言,涉及一种数据监控系统、设备和方法。


背景技术:

2.目前数据中心分布式机柜监控设备群的网络通信采用网络交换机汇聚的方式,单一故障造成通信影响较大,部分监控设备虽然采用网络环路方式来提高通信链路可靠性,但该方式导致网络回路设备复杂度剧增的同时降低了链路可靠性,这些方法无法解决机柜级分布式监控互联通信链路可靠性问题。
3.现有数据中心分布式机柜监控设备群的架构包括如下方式:
4.方式一:监控设备网络交换机汇聚,上层监控设备通过交换机组与各机柜连接,各机柜通过对应的监控设备与交换机连接,图1a是现有技术中监控设备网络交换机汇聚网络的示意图;如图1a所示,该连接方式在部署时大量网线汇聚,梳理标识工作量大,后期运维难度较大;当发生故障点1时,会影响整个网络回路,影响关键数据的接收和指令下发;当发生故障点2时,将会影响级联扩展交换机下所有的设备通信,造成多个设备数据接收和指令下发异常。综上,故障点1和故障点2产生时,都将会导致该链路后续多个设备的关键告警丢失,关键控制指令下发失败,造成设备损失或者延误关键操作。
5.方式二:监控设备网络环路,各机柜之间通过网络首尾相连,上层监控设备通过网络分别连接各机柜的第一个机柜和最后一个机柜,图1b是现有技术中监控设备网络环路的示意图;如图1b所示,该连接方式有产生网络风暴的风险;网络环路为避免网络风暴需要使用复杂环路控制协议和检测算法,复杂度提高后将导致网络交换可靠性降低;支持复杂协议和控制算法的硬件将产生较高的成本;使用网络交换方式,数据的传输依赖于沿途通信节点设备的正常工作,不适合大量设备级联使用,一旦沿途多点异常,数据链路将形成孤岛,无法比拟物理总线的可靠性;当故障点1和故障点2同时发生(某一个或多个设备掉电、芯片异常、设备网络交换软件异常)时,由于设备掉电或网络交换软件异常将会导致网络交换回路失效,此时机柜2将会处于孤岛,无法与整个链路通信,仍然存在丢失关键告警和关键控制指令的风险。
6.方式一和方式二分别存在部署维护复杂度高,存在设备本身复杂度高的问题,并且在关键领域上下行的告警数据和关键指令下发存在丢失风险,方式一和方式二无法解决机柜级分布式监控互联通信链路可靠性问题。
7.针对上述由于现有机柜级分布式监控互联通信链路可靠性低的问题,目前尚未提出有效的解决方案。


技术实现要素:

8.本发明实施例提供了一种数据监控系统、设备和方法,以至少解决由于现有机柜级分布式监控互联通信链路可靠性低的技术问题。
9.根据本发明实施例的一个方面,提供了一种数据监控系统,包括:数据监控设备和
至少两个数据中心监控设备,其中,至少两个数据中心监控设备之间分别通过网络和物理总线连接,数据监控设备分别通过网络和物理总线与至少两个数据中心监控设备中的至少一个数据中心监控设备连接。
10.可选的,每个数据中心监控设备包括:主控、至少两个网络信号的接口、至少两个物理总线的接口和功能接口,其中,每个数据中心监控设备之间的物理总线的接口通过物理线缆连接;其中,主控包括交换模块,交换模块用于实现多端口交换。
11.进一步地,可选的,数据中心监控设备与对应的机柜连接。
12.可选的,数据监控设备包括:至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口,其中,通过至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,以及,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;每个数据中心监控设备之间分别通过网络和物理总线依次连接。
13.可选的,数据监控设备包括:至少两个数据监控设备网络信号的接口和至少两个数据监控设备物理总线的接口。进一步地,可选的,数据监控设备通过至少一个数据监控设备物理总线的接口中的第一接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;通过至少一个数据监控设备物理总线的接口中的第二接口与至少两个数据中心监控设备中最后一个数据中心监控设备的物理总线的接口连接;其中,每个数据中心监控设备之间分别通过网络和物理总线依次连接。
14.可选的,该系统还包括:至少两列数据中心监控设备,其中,每列数据中心监控设备包括至少两个数据中心监控设备,每列数据中心监控设备中每个数据中心监控设备之间分别通过网络和物理总线依次连接;数据监控设备通过至少一个数据监控设备物理总线的接口中的第一接口与第一列数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;通过至少一个数据监控设备物理总线的接口中的第二接口与第二列数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接;第一列机柜阵列中最后一个数据中心监控设备通过网络信号接口与第二列机柜阵列中最后一个数据中心监控设备的网络信号接口连接。
15.可选的,数据监控设备与数据中心监控设备的结构相同。
16.根据本发明实施例的另一方面,还提供了一种数据监控设备,应用于上述系统,包括:主控、至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口,其中,通过至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与至少两个数据中心监控设备中第一个数据中心监控设备的网络信号的接口连接;主控分别与至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口连接。
17.根据本发明实施例的又一方面,还提供了一种数据监控方法,应用于上述系统,包括以下步骤:分别通过至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备进行通信;通过至少一个数据监控设备物理总
线的接口检测至少两个数据中心监控设备中是否存在网络状态异常的设备;在检测结果为是的情况下,通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取探测结果,并输出探测结果;在检测结果为否的情况下,输出检测结果。
18.可选的,通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取探测结果,并输出探测结果包括以下步骤:匹配节点池中网络通讯异常节点得到探测列表,根据探测列表通过至少一个数据监控设备物理总线接口对探测列表中的数据中心监控设备进行探测,获取存在网络状态异常的数据中心监控设备的网络状态的探测数据;将预存数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取存在网络状态异常的设备的故障信息;其中,预存数据为数据监控设备提前预存的检测正常工作数据中心监控设备的网络状态数据;依据故障信息确定探测结果,并输出探测结果。
19.进一步地,可选的,将预存的数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取存在网络状态异常的设备的故障信息包括以下步骤:将预存的数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取不同的比对结果;根据不同的比对结果,分别启动物理探测,通过至少一个数据监控设备物理总线的接口获取网络状态异常的数据中心监控设备的运行参数;依据运行参数确定数据中心监控设备的故障位置和故障类型;依据故障位置和故障类型生成故障信息。
20.可选的,依据故障信息确定探测结果,并输出探测结果包括以下步骤:依据故障信息生成告警信息,并将告警信息确定为探测结果;输出探测结果。
21.根据本发明实施例的再一方面,还提供了一种存储介质,其中,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述数据监控方法。
22.根据本发明实施例的再一方面,还提供了一种处理器,其中,处理器用于运行程序,其中,程序运行时执行上述数据监控方法。
23.在本发明实施例中,通过数据监控设备和至少两个数据中心监控设备,其中,至少两个数据中心监控设备之间分别通过网络和物理总线连接,数据监控设备分别通过网络和物理总线与至少两个数据中心监控设备中的至少一个数据中心监控设备连接,达到了降低部署和维护难度的目的,从而实现了提升机柜级分布式监控互联通信链路可靠性的技术效果,进而解决了由于现有机柜级分布式监控互联通信链路可靠性低的技术问题。
附图说明
24.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
25.图1a是现有技术中监控设备网络交换机汇聚网络的示意图;
26.图1b是现有技术中监控设备网络环路的示意图;
27.图2是根据本发明实施例的数据监控系统的示意图;
28.图3是根据本发明实施例的数据监控系统中数据监控设备与至少两个数据中心监控设备连接结构的示意图;
29.图4是根据本发明实施例的数据监控系统中数据监控设备或数据中心监控设备的
示意图;
30.图5是根据本发明实施例的一种数据监控系统的示意图;
31.图6是根据本发明实施例的另一种数据监控系统的示意图;
32.图7是根据本发明实施例的又一种数据监控系统的示意图;
33.图8是根据本发明实施例的数据监控方法的流程示意图;
34.图9是根据本发明实施例的一种数据监控方法的流程示意图。
具体实施方式
35.为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
36.需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
37.实施例1
38.根据本发明实施例的一个方面,提供了一种数据监控系统,图2是根据本发明实施例的数据监控系统的示意图,如图2所示,包括:数据监控设备22和至少两个数据中心监控设备24,其中,至少两个数据中心监控设备24之间分别通过网络和物理总线连接,数据监控设备22分别通过网络和物理总线与至少两个数据中心监控设备24中的至少一个数据中心监控设备连接。
39.具体的,本技术实施例提供的数据监控系统是由数据监控设备22、至少两个数据中心监控设备24组成,其中,每个数据中心监控设备24分别与对应的机柜连接,图3是根据本发明实施例的数据监控系统中数据监控设备与至少两个数据中心监控设备连接结构的示意图。如图3所示,每个数据中心监控设备24分别与对应的机柜连接,每个数据中心监控设备24之间通过网络和物理总线连接,数据监控设备22通过网络和物理总线与每列第一个数据中心监控设备连接。
40.例如,如图3所示,在数据中心监控设备24包括多个数据中心监控设备的情况下,标记为:设备1、设备2、设备3、
……
设备n,每个设备分别与机柜连接,即,设备1与机柜1连接、设备2与机柜2连接、设备3与机柜3连接、
……
设备n与机柜n连接;数据监控设备22通过网络和物理总线与设备1连接,设备1、设备2、设备3、
……
设备n之间通过网络和物理总线连接。
41.其中,数据监控设备22和数据中心监控设备24中通过内部主控中的交换模块实现网络硬件交换,网络级联(即,每个数据中心监控设备之间的连接,以及数据中心监控设备
与数据监控设备之间的连接)采用网络硬件交换实现,不涉及软件,单个设备自身网络节点可靠性高;并且通过物理总线实现备份,依靠物理线缆的存在确保高可靠性,不会因单个设备掉电、硬件异常、网络模块软硬件异常而导致链路断开;
42.网络硬交换级联和物理总线级联备份存在,确保正常时数据高效,异常时紧急数据可通过物理总线收发,兼顾高速特性和高可靠性的特性;
43.通过本技术实施例提供的数据监控系统能够实现故障精确定位,网络硬交换和物理总线级联备份存在,精确定位通信链路异常原因(监控设备掉电、硬件异常、通信线缆异常、网络异常等故障)。如图3所示,当故障点1发生时,物理总线依然可以保障上下行数据可靠传递;当故障点2为数据中心监控设备自身掉电或硬件异常,此时物理总线不依赖于任何设备,仅依赖于物理连接,因此物理总线依然保障整个通信链路的完整性;当故障点1和故障点3发生时,物理总线依旧可以保障通信链路可正常工作。
44.本技术实施例提供的数据监控系统确保关键业务通信上下行持续在线的同时可以精确区分设备以及通信链路的故障类型,告警通知给运维人员具体故障点和故障原因,便于尽快定位解决,在保障关键业务通信可靠性领域具有极强的竞争力。
45.在本发明实施例中,通过数据监控设备和至少两个数据中心监控设备,其中,至少两个数据中心监控设备之间分别通过网络和物理总线连接,数据监控设备分别通过网络和物理总线与至少两个数据中心监控设备中的至少一个数据中心监控设备连接,达到了降低部署和维护难度的目的,从而实现了提升机柜级分布式监控互联通信链路可靠性的技术效果,进而解决了由于现有机柜级分布式监控互联通信链路可靠性低的技术问题。
46.需要说明的是,本技术实施例中数据中心监控设备与数据监控设备可以为相同类型的设备。
47.可选的,每个数据中心监控设备24包括:主控、至少两个网络信号的接口、至少两个物理总线的接口和功能接口,其中,每个数据中心监控设备之间的物理总线的接口通过物理线缆连接;其中,主控包括交换模块,交换模块用于实现多端口交换。
48.具体的,图4是根据本发明实施例的数据监控系统中数据监控设备或数据中心监控设备的示意图。数据中心监控设备或数据监控设备包括:主控、至少两个网络信号的接口、至少两个物理总线的接口和功能接口;如图4所示,主控中包含有交换模块,该交换模块与至少两个网络信号的接口连接,至少两个物理总线的接口之间通过物理总线互联,并与主控连接,在图4中,交换模块标记为网络硬交换,至少两个网络信号的接口标记为lan1和lan2,至少两个物理总线的接口标记为com_bus。
49.需要说明的是,本技术实施例中的数据监控设备或数据中心监控设备的外部端口包含至少2组用于传输网络信号的接口,同时包含至少两个物理总线的接口,物理总线使用纯物理线缆连接,物理总线不经过任何电路或信号处理,内部通过类似rs485、rs422、can等总线的部署方式,监控设备具备如下接口形式。
50.本技术实施例中的数据中心监控设备自身实现多端口交换机,采用简单的硬件网络交换实现上下游设备的网络级联,无需软件算法的逻辑控制。同时,使用物理总线实现上下游设备的级联通信。网络和物理总线采用双物理连接,确保通信链路物理冗余的同时可精确提供通信故障类型告警便于高效定位解决。
51.可选的,数据监控设备22包括:至少一个数据监控设备网络信号的接口和至少一
个数据监控设备物理总线的接口,其中,通过至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,以及,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;每个数据中心监控设备之间分别通过网络和物理总线依次连接。
52.具体的,图5是根据本发明实施例的一种数据监控系统的示意图,如图5所示,仍以图2中的数据中心监控设备24中的示例为例,即,设备1与机柜1连接、设备2与机柜2连接、设备3与机柜3连接、
……
设备n与机柜n连接;
53.数据监控设备22通过至少一个数据监控设备网络的接口和至少一个数据监控设备物理总线的接口分别与设备1的网络信号的接口和物理总线的接口连接,设备1、设备2、设备3、
……
设备n之间通过网络信号的接口和物理总线的接口依次连接。
54.可选的,数据监控设备22包括:至少两个数据监控设备网络信号的接口和至少两个数据监控设备物理总线的接口。
55.进一步地,可选的,数据监控设备22通过至少一个数据监控设备物理总线的接口中的第一接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;通过至少一个数据监控设备物理总线的接口中的第二接口与至少两个数据中心监控设备中最后一个数据中心监控设备的物理总线的接口连接;其中,每个数据中心监控设备之间分别通过网络和物理总线依次连接。
56.具体的,图6是根据本发明实施例的另一种数据监控系统的示意图,如图6所示,数据监控设备22通过至少一个数据监控设备网络的接口和至少一个数据监控设备物理总线的接口中的第一接口分别与设备1的网络信号的接口和物理总线的接口连接,以及,通过至少一个数据监控设备物理总线的接口中的第二接口与设备n的物理中线的接口连接,设备1、设备2、设备3、
……
设备n之间通过网络和物理总线依次连接(多个数据中心监控设备标记为设备1、设备2、设备3、
……
设备n)。
57.其中,通过图6所示的连接结构可以将物理总线调整为环路方式来加强物理总线可靠性。
58.本技术实施例中的多个数据中心监控设备通过网络和物理总线方式相互连接后连接至数据监控设备,整体构成网络级联和物理总线级联的备份。物理总线是全线物理连接,总线回路没有经过任何信号处理。图5和图6的连接方式可以是两组连接线缆,也可以是一种连接器同时连接两组通信线缆,其中,两组传输介质分别对应网络传输和物理总线传输,可以确保从物理链接媒介上实现独立可靠的备份。
59.可选的,本技术实施例提供的数据监控系统还包括:至少两列数据中心监控设备,其中,每列数据中心监控设备包括至少两个数据中心监控设备,每列数据中心监控设备中每个数据中心监控设备之间分别通过网络和物理总线依次连接;数据监控设备通过至少一个数据监控设备物理总线的接口中的第一接口与第一列数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与第一个数据中心监控设备的网络信号的接口连接;通过至少一个数据监控设备物理总线的接口中的第二接口与第二列数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接;第一列机柜阵列中最后一个数据中心监控设备通过网络信号接口与第二列机柜阵列
中最后一个数据中心监控设备的网络信号接口连接。
60.具体的,图7是根据本发明实施例的又一种数据监控系统的示意图,如图7所示,a列机柜阵列(由于每个数据中心监控设备与对于的机柜连接,因此每列数据中心监控设备与每列机柜阵列意思等同)中每个机柜都与对应的数据中心监控设备连接,数据监控设备22通过至少一个数据监控设备网络信号的接口和通过至少一个数据监控设备物理总线的接口中的第一接口分别与a列机柜1中的数据中心监控设备1的网络信号的接口和物理总线的接口连接;a列数据中心监控设备1与a列数据中心监控设备2之间通过网络和物理总线连接,a列数据中心监控设备2与a列数据中心监控设备3之间通过网络和物理总线连接,
……
,a列数据中心监控设备n-1与a列数据中心监控设备n之间通过网络和物理总线连接;a列数据中心监控设备n与b列数据中心监控设备n之间通过网络连接(如图7所示,a列数据中心监控设备1,2,3,
……
n,标记为:a列设备1,2,3,
……
n);
61.数据监控设备22通过至少一个数据监控设备物理总线的接口中的第二接口与b列机柜1的b列数据中心监控设备1的物理总线的接口连接,b列数据中心监控设备1与b列数据中心监控设备2之间通过网络和物理总线连接,b列数据中心监控设备2与b列数据中心监控设备3之间通过网络和物理总线连接,
……
,b列数据中心监控设备n-1与b列数据中心监控设备n之间通过网络和物理总线连接(如图7所示,b列数据中心监控设备1,2,3,
……
n,标记为:b列设备1,2,3,
……
n)。
62.可选的,数据监控设备22与数据中心监控设备24的结构相同。
63.需要说明的是,本技术实施例中数据监控设备22与数据中心监控设备24可以为相同的设备,区别在于功能位置上,数据监控设备22通过网络信号和物理总线与每列第一个机柜的数据中心监控设备24连接,每个机柜中的数据中心监控设备24用于在发生网络故障时,通过物理总线将网络故障点和故障原因返回值数据监控设备22,进而通过各个机柜通过数据中心监控设备的级联关系,通过物理总线进行数据传输,保障整个链路通信的正常运行。
64.实施例2
65.根据本发明实施例的另一方面,还提供了一种数据监控设备,应用于上述实施例1中的系统,包括:
66.主控、至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口,其中,通过至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备中第一个数据中心监控设备的物理总线的接口连接,通过至少一个数据监控设备网络信号的接口与至少两个数据中心监控设备中第一个数据中心监控设备的网络信号的接口连接;主控分别与至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口连接。
67.具体的,数据监控设备包括:主控、至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口;主控中包含有交换模块,该交换模块与至少一个数据监控设备网络信号的接口连接,并且该交换模块与至少一个数据监控设备物理总线的接口,以及每个数据监控设备物理总线的接口之间通过物理总线互联,交换模块标记为网络硬交换,至少一个数据监控设备网络信号的接口标记为lan,至少一个数据监控设备物理总线的接口标记为com_bus。
68.需要说明的是,本技术实施例中的数据监控设备的外部端口包含至少一个用于传输网络信号的接口,同时包含至少一个物理总线的接口,数据监控设备与数据中心监控设备之间使用的物理总线使用纯物理线缆连接,物理总线不经过任何电路或信号处理,内部通过类似rs485、rs422、can等总线的部署方式。
69.本技术实施例中至少一个数据监控设备物理总线的接口仅以上述规格示例,以实现本技术实施例提供的数据监控设备为准,具体不做限定。
70.实施例3
71.根据本发明实施例,提供了一种数据监控方法的方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
72.图8是根据本发明实施例的数据监控方法的流程示意图,如图8所示,应用于上述实施例1中的系统,在数据监控设备侧,本技术实施例提供的数据监控方法包括如下步骤:
73.步骤s802,分别通过至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备进行通信;
74.本技术上述步骤s802中,在数据监控设备侧,数据监控设备与至少两个数据中心监控设备分别通过网络信号的接口和物理总线的接口进行通信,在至少两个数据中心设备中存在网络状态异常的情况下,通过物理总线的接口获取至少两个数据中心设备的网络状态。
75.步骤s804,通过至少一个数据监控设备物理总线的接口检测至少两个数据中心监控设备中是否存在网络状态异常的设备;
76.本技术上述步骤s804中,在不占用至少一个数据监控设备网络信号的接口与至少两个数据中心监控设备通信的前提下,通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备的网络状态进行检测,并通过至少一个数据监控设备物理总线的接口检测至少两个数据中心监控设备中是否发生网络状态异常,在至少两个数据中心监控设备中发生网络状态异常的情况下,执行步骤s806;在未发生网络状态异常的情况下,执行步骤s808。
77.步骤s806,在检测结果为是的情况下,通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取探测结果,并输出探测结果;
78.本技术上述步骤s806中,基于步骤s804中对至少两个数据中心监控设备的网络状态的检测,当至少两个数据中心监控设备发生网络状态异常时,数据监控设备通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取至少两个数据中心监控设备中存在网络状态异常的设备;
79.其中,本技术实施例中的探测结果可以包括:网络状态异常的设备的位置和/或网络故障类型;
80.当发生网络状态异常时,除了将探测结果以告警信息的方式发送至运维人员外,为了维持当前业务所需的服务器数量,触发调度机制将网络状态异常的设备所处的服务器中的业务迁移至备用服务器中,从而保障在运维人员解决网络状态异常之前,当前业务的顺利执行;和/或,在数据中心监控设备的网络状态异常为网络信号的接口故障的情况下,
通过物理总线的接口与数据监控设备以及其他数据中心监控设备进行通信,直至运维人员解决网络状态异常,进而保障当前业务的正常进行。
81.步骤s808,在检测结果为否的情况下,输出检测结果。
82.基于步骤s804的检测,在至少两个数据中心监控设备没有网络状态异常的情况下,输出检测结果可以为当前至少两个数据中心监控设备网络状态正常。
83.在本发明实施例中,通过分别通过至少一个数据监控设备网络信号的接口和至少一个数据监控设备物理总线的接口与至少两个数据中心监控设备进行通信;通过至少一个数据监控设备物理总线的接口检测至少两个数据中心监控设备中是否存在网络状态异常的设备;在检测结果为是的情况下,通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取探测结果,并输出探测结果;在检测结果为否的情况下,输出检测结果,达到了实现故障定位和确定故障类型的目的,从而实现了基于数据监控系统提升机柜级分布式监控互联通信链路可靠性的技术效果,进而解决了由于现有机柜级分布式监控互联通信链路可靠性低的技术问题。
84.可选的,步骤s806中通过至少一个数据监控设备物理总线的接口对至少两个数据中心监控设备进行探测,获取探测结果,并输出探测结果包括以下步骤:
85.步骤s8061,匹配节点池中网络通讯异常节点得到探测列表,根据探测列表通过至少一个数据监控设备物理总线接口对探测列表中的数据中心监控设备进行探测,获取存在网络状态异常的数据中心监控设备的网络状态的探测数据;
86.其中,节点池包含了至少一个数据中心监控设备,每个数据中心监控设备作为各个节点存在于节点池中,将该节点池中存在网络通信异常的数据中心监控设备生成探测列表。
87.步骤s8062,将预存数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取存在网络状态异常的设备的故障信息;其中,预存数据为数据监控设备提前预存的检测正常工作数据中心监控设备的网络状态数据;
88.其中,本技术实施例中基于实施例1中的系统,数据监控设备会获取每个数据中心监控设备的运行状态,即,本技术实施例中的预存数据,其中该运行状态包括网络运行状态,通信状态,设备物理状态(例如,老化程度,运行年限,所在位置)等信息,当至少一个数据中心监控设备发生网络状态异常时,数据监控设备通过将预存数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取存在网络状态异常的设备的故障信息。
89.在一种可实现的方式中,将预存的数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取存在网络状态异常的设备的故障信息包括以下步骤:将预存的数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态的探测数据进行对比,获取不同的比对结果;根据不同的比对结果,分别启动物理探测,通过至少一个数据监控设备物理总线的接口获取网络状态异常的数据中心监控设备的运行参数;依据运行参数确定数据中心监控设备的故障位置和故障类型;依据故障位置和故障类型生成故障信息。
90.其中,通过获取故障位置,并确定处于网络状态异常的数据中心监控设备的故障类型,即,数据中心监控设备可能存在软件故障、掉电故障或数据中心监控设备硬件故障中
至少一种。
91.步骤s8063,依据故障信息确定探测结果,并输出探测结果。
92.在一种可实现的方式中,依据故障信息确定探测结果,并输出探测结果包括以下步骤:依据故障信息生成告警信息,并将告警信息确定为探测结果;输出探测结果。
93.当确定存在网络状态异常的数据中心监控设备时,依据故障信息中存在网络状态异常的数据中心监控设备的故障类型和故障位置生成告警信息,进而将告警信息确定为探测结果进行输出。
94.综上,结合步骤s802至步骤s808,本技术实施例提供的数据监控方法可以适用于实施例1中的数据监控系统,在数据监控设备侧,当多个数据中心监控设备所属的机柜中存在网络故障(即,本技术实施例中的网络状态异常)的情况下,匹配节点池中网络通讯异常节点得到探测列表,数据监控设备根据探测列表通过所述至少一个数据监控设备物理总线接口对所述探测列表中的数据中心监控设备进行探测,获取存在网络状态异常的数据中心监控设备的网络状态的探测数据,从而确定发生网络故障的数据中心监控设备所在位置和故障类型,最终将故障位置和故障类型(含故障原因)发送至运维人员。
95.综上,图9是根据本发明实施例的一种数据监控方法的流程示意图,如图9所示,本技术实施例提供的数据监控方法具体如下:
96.本技术实施例提供的数据监控方法在实施时包括三部分:第一部分,网络异常检测部分;第二部分,网络链路数据上下行传输;第三部分,物理总线数据上下行传输(确保告警和控制指令执行畅通)。
97.其中,第一部分中网络异常节点将持续使用物理总线进行通信;
98.step1,检测链路组内设备网络通信是否异常;
99.其中,链路组内设备包含每列的数据中心监控设备;
100.step2,在检测结果为是的情况下,匹配节点池中网络通信异常节点构成探测列表;
101.其中,节点池包含每列的数据中心监控设备,若节点池中每列的数据中心监控设备网络通信异常,则将节点池中的每列的数据中心监控设备生成探测列表;
102.step3,将预存数据与探测列表中存在网络状态异常的数据中心监控设备的网络状态数据进行对比,获取存在网络状态异常的设备的故障信息,依据故障信息确定探测结果,并输出探测结果;
103.其中,若探测结果中的故障类型为1类故障,则反馈result==1,同理,通过探测结果中的故障类型为n类故障,则反馈对应的故障类型,反馈result==n。
104.本技术实施例提供的数据监控方法基于网络和物理总线双链路的硬件通信机制,确保上下行持续在线的同时可以精确区分设备以及通信链路的故障类型,基于此可准确定位具体问题设备特征及故障类型,多进程通信备份机制及故障定位机制如图9所示。
105.图9中定位的故障类型可以指示常见的单点或多点网络传输介质异常、单点或多点设备掉电或硬件异常、单点或多点设备软件异常、单点或多点设备网卡异常等多种故障类型。综上描述,在确保关键业务上下行通信正常的同时,检测物理链路异常将精确的问题告警提供给运维人员,便于尽快定位解决。
106.实施例4
107.根据本发明实施例的再一方面,还提供了一种存储介质,其中,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述实施例3中的数据监控方法。
108.实施例5
109.根据本发明实施例的再一方面,还提供了一种处理器,其中,处理器用于运行程序,其中,程序运行时执行上述实施例3中的数据监控方法。
110.上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
111.在本发明的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
112.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,可以为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
113.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
114.另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
115.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
116.以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1