交换机及交换机系统的制作方法

文档序号:22119159发布日期:2020-09-04 15:57阅读:228来源:国知局
交换机及交换机系统的制作方法

本发明涉及网络通信,尤其涉及一种交换机及交换机系统。



背景技术:

随着网络技术的发展,网络的规模越来越大,设备数量越来越多,这给网络的管理工作带来了极大的困难。数目众多的设备需要分配不同的网络地址,每台可以管理的设备需要经过配置之后才能满足应用要求。

相关技术中,往往通过集群将多台设备物理连接起来,形成逻辑上的单一实体来管理,其中,有一台设置为命令交换机,其余的称为成员交换机,用户可以通过命令交换机管理所有的成员交换机,从而便于网络的管理。各交换机均设有管理板和多个业务板,管理板用于在交换机中负责整机的硬件管理,并进行复杂协议处理,业务板用于在交换机中负责数据流量转发、汇聚及互联。

为了避免交换机集群中交换机分裂,这里,交换机分裂是指当交换机集群中的命令交换机或者成员交换机因无法同步本机的硬件信息,无法实现硬件管理就会导致无法维持集群状态而分裂,需要对各交换机的管理板进行异常监测。相关技术中,一般使用独立的监控板和can(controllerareanetwork,控制器局域网络)总线技术,在管理板异常的情况下,将本机的硬件管理信息重传到集群中的其他命令交换机中。但使用独立的监控板,往往无法快速感应到交换机的管理板的异常,只能通过软件心跳等方式告知,故障响应级别在秒级别。此外,布置独立的监控板,会带来额外的成本。



技术实现要素:

有鉴于此,本发明实施例提供了一种交换机及交换机系统,旨在降低管理板异常监测的成本并提高异常监测的响应速度,从而降低交换机系统的交换机分裂的风险。

本发明实施例的技术方案是这样实现的:

本发明实施例提供了一种交换机,包括:

管理板,用于所述交换机的硬件管理,所述管理板包括:监控单元和第一中央处理器(cpu)模块,所述监控单元与所述第一cpu模块分别单独供电,所述监控单元用于获取所述交换机的硬件信息,所述监控单元还用于监测所述第一cpu模块是否运行异常;

业务板,连接所述管理板,用于所述交换机的流量转发;

所述监控单元用于响应于所述第一cpu模块的运行异常,变更所述交换机的硬件信息对应的目的地址,并将所述交换机的硬件信息发送至变更后的目的地址。

本发明实施例还提供了一种交换机系统,包括至少两个前述实施例所述的交换机,其中,一个所述交换机为命令交换机,其余所述交换机为成员交换机,所述命令交换机与所述成员交换机连接,构成交换机集群。

本发明实施例提供的技术方案,交换机的管理板包括监控单元,即监控单元集成于管理板上,该监控单元与管理板的第一cpu模块分别单独供电,该监控单元用于响应于第一cpu模块的运行异常,变更交换机的硬件信息对应的目的地址,并将所述交换机的硬件信息发送至变更后的目的地址,可以在管理板的第一cpu模块运行异常时,将交换机的硬件信息发送至变更后的目的地址,从而避免交换机集群的交换机分裂,通过集成设置的监控单元,可以降低交换机的维护成本,并提高异常监测的响应速度,利于提高交换机系统的运行可靠性。

附图说明

图1为本发明实施例交换机的结构示意图;

图2为本发明实施例中监控soc获取硬件的结构示意图;

图3为本发明实施例中第一电源、第二电源及第三电源的结构示意图;

图4为本发明实施例中管理板的结构示意;

图5为本发明一实施例交换机集群的结构示意图;

图6为本发明另一实施例交换机集群的结构示意;

图7为本发明实施例cpld处理逻辑的流程示意图;

图8为本发明实施例监控soc处理逻辑的流程示意图。

附图标记说明:

10、管理板;11、监控单元;111、监控soc;112、cpld;

12、第一cpu模块;13、第一mac;14、l2mac;

15、第一电源;16、第二电源;17、第三电源;

20、业务板;21、第二cpu模块;22、第二mac;23、前端口。

具体实施方式

下面结合附图及实施例对本发明再作进一步详细的描述。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

本发明实施例提供了一种交换机,如图1所示,该交换机包括:管理板10及业务板20;其中,管理板10连接至少一个业务板20,管理板10用于交换机的硬件管理,并可以进行复杂协议处理;各业务板20用于交换机的流量转发,还可以用于流量汇聚及互联。管理板10包括:监控单元11和第一cpu(centralprocessingunit,中央处理器)模块12。监控单元11与第一cpu模块12分别单独供电。这里,第一cpu模块12用于执行硬件管理及复杂协议处理,监控单元11用于获取交换机的硬件信息,监控单元11还用于监测第一cpu模块12是否运行异常,监控单元11用于响应于第一cpu模块12的运行异常,变更交换机的硬件信息对应的目的地址,并将交换机的硬件信息发送至变更后的目的地址。监控单元11与第一cpu模块12分别单独供电,可以使得二者互相独立运行,可以通过对管理板的电源域进行划分,实现监控单元11与第一cpu模块12分别单独供电。

本发明实施例的交换机,监控单元11集成于管理板10上,通过集成设置的监控单元11,相较于相关技术中使用独立的监控板和can总线来传递管理板运行异常时的硬件信息,可以节省交换机的维护成本。此外,监控板需要通过软件心跳等方式来告知管理板的运行异常,故障感知时间一般为秒级别,本实施例通过监控单元监测第一cpu模块12的运行异常,并响应第一cpu模块12的运行异常,可以提高异常监测的响应速度,利于提高交换机系统的运行可靠性。

在一些实施例中,监控单元11包括:监控soc(system-on-a-chip,片上系统)111和逻辑控制器。本发明实施例中,逻辑控制器可以为cpld(complexprogrammablelogicdevice,复杂可编程逻辑控制器)112,其中,监控soc111连接以下至少之一:交换机的供电电源、交换机的风扇盘、交换机的背板、业务板,用于获取交换机的硬件信息,硬件信息包括以下至少之一:电源信息、风扇盘的转速、背板信息、业务板信息;cpld112连接第一cpu模块及监控soc,用于监测第一cpu模块的运行异常,运行异常包括:第一cpu模块硬件故障和/或第一cpu模块的软件故障;监控soc111还用于响应于第一cpu模块的硬件故障和/或软件故障,变更交换机的硬件信息的目的地址,并将交换机的硬件信息发送至变更后的目的地址。如此,可以使得该交换机的管理板上的第一cpu模块运行异常时,通过变更后的目的地址的管理板基于硬件信息对该交换机进行硬件管理,避免了交换机分裂。

如图2所示,在一应用示例中,监控soc用于负责交换机整体的硬件信息收集,监控soc可以通过i2c总线连接交换机上的开关电源、风扇盘、业务板及背板,从而获得交换机的电源信息、风扇盘的转速、背板信息、业务板信息等硬件信息。当然,本发明实施例并不限定监控soc对应总线的类型,只要监控soc能够采集到交换机的硬件信息即可。比如,以机架式交换机为例,监控soc可以通过pmbus(powermanagementbus,电源管理总线)获取电源信息,通过i2c总线获取风扇盘的转速或设定转速,通过i2c总线获取业务板等硬件信息,通过访问背板总线进行机箱识别。

这里,cpld112可以监测第一cpu模块12的硬件故障和/或软件故障。第一cpu模块12的硬件故障可以包括:cpu最小系统的硬件故障,例如电源故障、时钟异常、芯片损坏等。第一cpu模块12的软件故障可以包括:运行软件bug导致的宕机,无法在规定时间内喂狗。

实际应用中,cpld112可以在监测到第一cpu模块12存在硬件故障和/或软件故障时,生成中断请求,监控soc111响应于该中断请求,变更交换机的硬件信息的目的地址,并将交换机的硬件信息发送至变更后的目的地址,即确定第一cpu模块12存在运行异常,则不再将用于硬件管理的硬件信息发送给第一cpu模块12,而是切换传递路径,将该交换机的硬件信息发送给交换机集群中的其他交换机的管理板。如此,多台交换机的管理板出现硬件或者软件故障,只要保证整个交换机集群环境中有一台交换机的管理板能够正常运行,则整个交换机集群就不会分裂,且由于cpld112可以在监测到第一cpu模块存在运行异常时生成中断请求,并上传中断请求给监控soc111,监控soc111响应于中断请求,变更管理信息的目的地址,并发送管理信息至变更后的目的地址,响应速度可以从传统的秒级提高到毫秒级,从而降低了交换机集群的交换机分裂的概率。

在一些实施例中,管理板还包括:第一通信模块、供电电源,其中,供电电源包括:第一电源、第二电源及第三电源,第一电源供电给第一cpu模块,第二电源供电给第一通信模块,第三电源供电给监控soc及cpld;第一通信模块连接第一cpu模块,用于与交换机的外部通信;cpld还监测第一电源及第二电源的供电故障;监控soc还用于响应于第一电源的供电故障和/或第二电源的供电故障,变更交换机的硬件信息的目的地址,并将交换机的硬件信息发送至变更后的目的地址。

如此,cpld还可以在监测到第一电源和/或第二电源的供电故障时,生成中断请求,监控soc111响应于该中断请求,变更交换机的硬件信息的目的地址,并将交换机的硬件信息发送至变更后的目的地址,即确定第一cpu模块12存在供电故障和/或第一通信模块存在供电故障时,则不再将用于硬件管理的硬件信息发送给第一cpu模块12,而是切换传递路径,将该交换机的硬件信息发送给交换机集群中的其他交换机的管理板。如此,可以避免交换机因管理板的供电电源出现故障而分裂,提高了交换机集群的运行可靠性。

在一些实施例中,第三电源采用支持冗余备份的供电电路,供电电路上设置用于防倒灌的保护装置。

如图3所示,第一电源包括多个dc/dc电源,用于给第一cpu模块供电,并负责符合第一cpu模块的上电时序控制;第二电源包括多个dc/dc电源,用于给第一通信模块供电,并负责符合第一通信模块的上电时序控制;第三电源包括多个dc/dc电源,主要给监控soc供电,并负责符合监控soc的上电时序控制。其中,监控soc的输入电源(即第三电源)进行了冗余备份,并且使用二极管进行防倒灌功能,确保双供电冗余备份。同时每个dc/dc电源都产生一个pg(powergood)信号给到cpld,以指示各dc/dc电源的完整性。这里,dc/dc电源是指将某一电压等级的直流电源变换为其他电压等级的直流电源的装置。

cpld可以通过扩展的io,接收各dc/dc电源的pg信号,从而可以根据各dc/dc电源的pg信号判断各dc/dc电源是否出现供电故障。此外,cpld还可以通过扩展的io访问第一cpu模块,从而监测第一cpu模块12是否存在硬件故障和/或软件故障。如此,cpld可以实现对第一cpu模块的运行异常及各dc/dc电源的供电故障的监测。

在一些实施例中,管理板还包括:第二通信模块,连接监控soc及第一cpu模块;

业务板包括:第二cpu模块及第三通信模块,第二cpu模块连接第二通信模块,用于接收监控soc经第二通信模块发送的交换机的硬件信息;第三通信模块,连接第二cpu模块及第一通信模块,用于接收第二cpu模块传递的交换机的硬件信息,并将交换机的硬件信息经第一通信模块传递至交换机的外部或者直接经第三通信模块传递至交换机的外部。

如此,监控soc可以在其所处的管理板工作未出现前述的电源故障及第一cpu运行异常时,将交换机的硬件信息发送给第一cpu,由第一cpu实现交换机的硬件管理,监控soc监测到前述的电源故障和/或运行异常时,可以将交换机的硬件信息经第二通信模块、第二cpu模块、第三通信模块及第一通信模块传递至交换机集群的其他交换机的管理板中,或者经第二通信模块、第二cpu模块及第三通信模块传递至交换机集群的其他交换机的管理板中,从而避免交换机分裂。

在一些实施例中,第一通信模块及第三通信模块为媒体介入控制(mediaaccesscontrol,mac)模块;第二通信模块为二层交换芯片(l2mac)。

如图4所示,管理板10包括:监控soc111、cpld112、第一cpu模块12、第一mac13(对应前述的第一通信模块)、l2mac14(对应前述的第二通信模块)、第一电源15、第二电源16及第三电源17。在cpld112未监测到管理板的运行异常时,监控soc111可以通过serdes与l2mac14互联并转发获取的硬件信息至本管理板的第一cpu模块12,便于管理板进行硬件管理。

如图5及图6所示,业务板20包括:第二cpu模块21、第二mac22(对应前述的第三通信模块)及前端口23,当cpld112监测到第一cpu模块的运行异常或者第一cpu模块存在供电故障,监控soc111可以通过serdes与l2mac14互联,并经l2mac14、第二cpu模块21、第二mac22及第一mac13连通交换机集群的其他交换机的管理板(如图5所示),或者经l2mac14、第二cpu模块21、第二mac22及前端口23连通交换机集群的其他交换机的管理板(如图6所示),从而可以将交换机的硬件信息传递至其他交换机的管理板,避免交换机分裂。

本发明实施例交换机,通过将监控单元集成在管理板上,既提高了异常监测的响应速度,又避免了独立设置监控板导致的额外成本。

本发明实施例还提供一种交换机系统,包括至少两个前述实施例的交换机,其中,一个交换机为命令交换机,其余交换机为成员交换机,命令交换机与成员交换机连接,构成交换机集群。

在一些实施例中,命令交换机与成员交换机之间经管理板通信连接组网,构成交换机集群。

在一些实施例中,命令交换机与成员交换机之间经业务板通信连接组网,构成交换机集群。

在一些实施例中,命令交换机的监控单元响应于第一cpu模块的运行异常,对命令交换机进行切换,变更目的地址为切换后的命令交换机的地址,并将交换机的硬件信息发送至切换后的命令交换机。

在一些实施例中,成员交换机的监控单元响应于第一cpu模块的运行异常,变更目的地址为命令交换机的地址,并将交换机的硬件信息发送至命令交换机。

在一些实施例中,如图5所示,crossbar架构使用管理板10上的第一mac13进行集群互联,交换机a为命令交换机,交换机b为成员交换机。若交换机a中的第一cpu模块12或者第一电源15出现故障被探测后,监控soc111获取的硬件信息通过l2mac14发送到业务板20的第二cpu模块21中,并通过mac管理总线,通过数据平面转发至管理板的第一mac13中,然后通过集群互联转发到交换机b中,交换机b根据原命令主机交换机a的状态决定是否要进行角色转换。实现原命令交换机的第一cpu模块12或者电源故障隔离,保证集群状态不被分裂。

如图6所示,crossbar架构或clos架构的交换机中,使用业务板20上的前端口23进行集群互联,交换机a为命令交换机,交换机b为成员交换机。若交换机a中的第一cpu模块或者第一电源出现故障后被监控soc探测到后,监控soc的硬件信息同的转发路径修改为通过l2mac14转发至业务板的第二cpu模块21,再经第二mac22、前端口23实现集群互联,经过端口的集群互联将硬件信息转发到成员交换机b的业务板中,再通过带宽管理通道转发至交换机b管理板的第一cpu模块中。实现原命令交换机的第一cpu模块或者电源故障隔离,保证集群状态不被分裂。

在一些实施例中,如图7所示,cpld的处理逻辑包括:

步骤701,cpld初始化;

cpld上电后,进行初始化设置。

步骤702,检测各电源的pg信号是否正常,若是,则表明对应的电源正常,跳转至步骤703,若否,则表明对应的电源出现异常,跳转至步骤705;

这里,cpld并行检测每路dc/dc电源的pg信号是否为0,若为1表示对应的电源正常,跳转至步骤703,若为0表示对应的电源出现异常,跳转至步骤705。

步骤703,看门狗逻辑模拟;

cpld启动看门狗逻辑模拟,并执行步骤704;

步骤704:判断是否喂狗超时;

cpld判断管理板的第一cpu模块是否喂狗超时,若没出现表示正常,返回步骤702,并一直循环。

步骤705:生成中断请求。

步骤704检测到喂狗超时或者步骤702检测到pg信号异常,则cpld生成中断请求,并上报给监控soc。

在一些实施例中,交换机形成交换机集群后,如图8所示,命令交换机中的监控soc的处理逻辑包括:

步骤801,监控soc启动;

监控soc进入正常运行状态。

步骤802,监控soc将管理报文的目的地址设置为本管理板的第一cpu模块;

步骤803,监控soc不停的轮询本管理板的硬件信息,并执行相应的硬件控制策略;

步骤804,监控soc将获取到的硬件信息组装成管理报文;

步骤805,监控soc将管理报文发往目的地址;

监控soc将组装的管理报文发送目的地址,并跳转至步骤803,循环执行步骤803至805。

步骤806,处理cpld上报的中断请求;

监控soc在执行上述步骤803至805的过程中,响应于cpld上报的中断请求,监控soc将管理报文的目的地址设置为成员交换机b中的第一cpu模块,然后返回步骤803至805的执行过程。如此,监控soc可以响应于cpld的中断请求,变更命令交换机的地址,从而及时将硬件信息传递至切换后的命令交换机的管理板,能够有效防止交换机集群的交换机分裂,且响应速度快,提高了交换机集群的运行可靠性。

需要说明的是:“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。

另外,本发明实施例所记载的技术方案之间,在不冲突的情况下,可以任意组合。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1