一种具有高可靠性和灵活性的集群网管系统及方法

文档序号:7751653阅读:265来源:国知局
专利名称:一种具有高可靠性和灵活性的集群网管系统及方法
技术领域
本发明涉及计算机网络通讯领域,特别是指一种在以太网交换机上实现具有高可 靠性和灵活性的集群网管系统及方法。
背景技术
集群技术,是以太网交换机上通过用少量的处理能力强的交换机管理大量的分散 在不同位置的接入层交换机,它能方便地对一个交换机群组进行集中管理。这种管理方式 能代替有物理位置和物理连接限制的堆叠管理方式,而且能够使各种不同厂家不同型号的 交换机形成集群。集群管理的主要目的是解决大量分散的网络设备的集中管理问题。集群 管理具有以下优点1、节省公网IP地址;2、简化配置管理任务管理员只需在一台设备上配置公网IP地址就可对集群中 所有设备进行管理,而无需登录到每台设备上进行配置管理;3、能够显示网络拓扑结构,有助于监控和调试网络;4、可同时对多台设备进行软件升级和配置,且不受网络拓扑和距离的限制。集群的建立过程1、集群管理通过集群协议来实现,集群协议有三种报文类型,分别是 DP (Discovery Packet,拓扑发现报文)、DR(Di scovery Reply,拓扑发现报文的回应报 文)、CP (Command Packet,集群配置报文)。这三种报文使用SNAP (sub network access protocol)协议进行封装。其中DP和DR报文的目的mac (Media Access Control,介质访 问控制)为指定的单播mac,CP报文的目的mac为目的交换机的cpu mac。2、一个集群中一般会有三种角色,分别是命令交换机、成员交换机和候选交换 机。其中,命令交换机是整个集群的管理接口,负责对成员交换机进行配置管理;成员交换 机是加入集群,通过命令交换机对其进行管理的交换机;候选交换机是未加入集群的具有 集群功能的交换机。图1举例说明了具有上述三种角色的集群管理结构图。3、集群通过以上三种协议报文对集群内部的设备进行配置和管理。其工作过程包 括拓扑的发现、集群的建立和维护。具体的运行过程如下A)、首先命令交换机周期性的在启动集群的VLAN内广播DP报文,收到DP报文的 交换机一方面回应DR报文,另外,向其接收DP报文的端口所在的VLAN内的其它端口中继 DP报文。其中DR报文中会携带交换机的一些拓扑信息,比如mac、h0Stname、p0rtSpeed等。 命令交换机接收到DR报文后建立拓扑关系,其它交换机成为其候选交换机。B)、命令交换机可以手动或自动通过向某候选交换机发送CP报文,请求其加入集 群,候选交换机收到加入集群的CP报文后回送确认报文,命令交换机收到确认报文后,添 加其为成员交换机。命令交换机会为每一个成员交换机从IP池中分配一个集群内部使用 的私有IP地址,并与之建立TCP连接,同时为其分配一个集群成员序列号member id。C)、命令交换机可以通过CP报文来对成员交换机进行配置同步。
集群的管理和维护集群的管理和维护主要包括集群协议状态机的维护,确保集群的状态正常运转, 比如集群成员的正确加入和删除,配置的同步更新,集群成员的配置管理。首先,集群建立起来后需要维持命令交换机和成员交换机之间的集群关系,一般 厂家在集群建立起来后会每隔一段时间发送一种独立的心跳报文,在成员交换机连续几次 收不到心跳包或者命令交换机收不到心跳回应包的情况下集群关系会结束,等集群状态正 常后会重新建立集群关系。其次,命令交换机可以通过发送CP报文将候选交换机加为成员交换机或者将成 员交换机从集群中删除,变为候选交换机,也可以重启某成员交换机。另外,当命令交换机 修改了集群的一些配置时,比如心跳包发送间隔,心跳包最大丢失次数,会把修改后的配置 同步到各个成员交换机。最后,集群建立起来后最重要的是,管理员可以通过各种方式对集群的成员进行 管理,一般厂家都会提供SNMP、Telnet、HTTP的访问方式。这些方式一般都是通过集群内部 的私有IP建立TCP或者UDP通道来完成对成员交换机的访问。当从外部访问某集群内部 的成员交换机时,命令交换机一般都会提供一个公网的IP地址和端口号,外部访问时首先 访问命令交换机的公网IP地址,然后根据不同的应用来提供不同的访问成员交换机的方 式,以Telnet访问为例,当用户需要登录成员交换机的Telnet时,因为成员交换机为私网 地址,无法直接登录,需要首先登录到命令交换机的Telnet上,在命令交换机的Telnet上 通过特定的命令,启动一个TelnetClient,通过私网地址登录到成员交换机上,然后对成员 交换机进行操作。SNMP的访问方式是SNMP客户端通过公有的IP地址与命令交换机进行路由,命令 交换机和成员交换机之间通过私有的IP地址进行路由,通过命令交换机对SNMP报文的处 理和转发,完成SNMP客户端和成员交换机之间的通信。图2举例说明了现有技术中SNMP报文通过集群内部UDP封装方式访问成员交 换机的报文转发流程。其具体步骤为客户端构造SNMP代理请求报文,并将该请求报文 发送给命令交换机,其中代理请求报文中的community字段的格式需要包含转发所需的 附加信息,以反映要访问的成员交换机,比如可以在命令交换机的community后加上 SKmember id>”以反映要访问的成员交换机。当命令交换机收到请求报文后,根据请求报 文中的community字段信息,得到要访问的成员交换机信息,构造新的SNMP请求报文,即去 掉community后的“ iSKmember id> ”,然后通过使用集群私有地址建立的UDP通道,将其转 发到成员交换机上,成员交换机沿原路径向命令交换机返回SNMP回应报文,命令交换机恢 复回应报文中的原始信息,将其转发到对应的SNMP客户端上。HTTP的访问方式和SNMP的访问方式类似,客户端在通过命令交换机访问某成员 交换机时需要在URL中加上转发所需的附加信息,比如可以在URL中的公网IP地址后面 加上〈member id>,以反映要访问的成员交换机,当命令交换机收到HTTP请求报文后,通过 URL中的〈member id>得到要访问的成员交换机,然后通过集群私有IP建立到成员交换机 的HTTP连接,去掉URL中的〈member id>转发给对应的成员交换机,成员交换机向命令交 换机回送HTTP回应报文,命令交换机收到回应报文后在URL中添加〈memberid〉信息,将其 转发到对应的客户端上。
通过上述方法,能够在交换机上实现集群功能,而且能够提供丰富的访问集群成 员的方式,一般厂家的实现也基本完成上述功能。但该方法却存在一些严重的不足,它主要 表现在以下两点1、命令交换机没有备份对于一个集群,命令交换机是唯一一个访问集群的入口, 一旦命令交换机出现问题,整个集群内的设备将无法访问;2、集群内部管理报文的封装方式比较单一集群管理协议主要是对大量的中低端 交换机进行集中管理,中低端交换机的资源有限,由于其存储空间以及处理能力的限制,很 多中低端交换机只是完成简单的二层转发控制,具有简单的VLAN等管理功能,TCP/IP协议 也不支持。这种情况,上述实现方式将无法完成SNMP等方式访问成员的操作。

发明内容
本发明的目的在于克服背景技术中的不足而提供一个在以太网交换机上实现具 有高可靠性和灵活性的集群网管系统及方法。本发明是一种通过备份命令交换机和对集群 内部管理报文的Ethernet封装实现集群的高可靠性和灵活性的方法。本发明的技术方案主要实现下面两个功能A)、提供命令交换机的备份功能;B)、在命令交换机和成员交换机之间,提供管理报文的以太帧封装功能。具体实现步骤分别如下集群备份功能是通过备份命令交换机的方式来实现,当备份交换机检测到命令 交换机失效时,备份交换机自动升级为命令交换机,继续管理和维护集群的运行。命令交换机的备份过程包含以下步骤(1)指定备份交换机通过命令指定哪些交换机为备份交换机,该步骤应该在命 令交换机备份过程中首先完成;(2)集群数据的备份命令交换机保存的集群信息备份到备份交换机的过程,集 群信息包括成员交换机的相关信息,以及集群的一些配置信息。集群数据备份采用实时备 份的方式,当指定完备份交换机后即可以进行备份,在集群运行期间,如果有成员发生变化 或者集群配置发生变化时实时的进行数据的备份;(3)主备切换检测该步骤确定是否满足备份交换机切换为主用交换机的条件。 该步骤在备份交换机运行期间一直执行,备份交换机和主用交换机之间发送检测报文,直 到检测到主用交换机失效,备份交换机具有切换为主用交换机的条件为止;(4)主备切换过程备份交换机切换为主用交换机的过程。只有满足备份交换机 切换为主用交换机的条件后才执行该步骤;(5)主备切换后成员的恢复主备切换后,向所有成员发加入请求,使成员重新加 入集群,重新加入过程见前面的成员加入部分叙述。集群内部管理报文的Ethernet封装是指在集群内部,命令交换机和成员交换机 之间,用以太帧来封装管理报文的方式,这样可以在不支持TCP/IP协议的低端交换机上实 现集群管理的功能。集群内部管理报文的Ethernet封装过程包含以下步骤(1)使能报文的Ethernet封装功能;
6
(2)命令交换机收到报文后,判断是否是访问集群内部成员的管理报文,如果是, 用Ethernet报文格式进行封装,然后发送给指定的成员交换机;(3)成员交换机收到命令交换机发送过来的Ethernet封装格式的报文后,解封 装,然后根据报文的类型交给相应的模块处理,处理完毕再把处理结果用Ethernet格式封 装后发送给命令交换机;(4)命令交换机收到返回的Ethernet封装的处理结果报文后,解封装,然后发送
给管理端。本发明的优点在于(1)通过实现备份命令交换机,提高了集群网管功能的健壮性,保证了集群管理的 稳定性和连续性;(2)通过实现集群内部管理报文的Ethernet封装,在不支持TCP/IP协议的低端交 换机上实现集群管理功能,降低了用户的投资和使用的复杂性。


图1 为现有技术中具有三种集群角色的集群结构图。图2 为现有技术中SNMP报文通过集群内部UDP封装方式访问成员交换机的报文 转发流程图。图3 为本发明中具有备份功能的集群结构图。图4 为本发明中SNMP报文通过集群内部Ethernet封装方式访问成员交换机的 报文转发流程图。图5 为本发明交换机操作系统方框图。
具体实施例方式下面结合说明书附图及实施例,对本发明作进一步说明。如图3所示,它是本发明中集群备份功能的实施例。该实施例的实现过程中包含 如下步骤(1)通过命令cluster commander backup来设置备份命令交换机。(2)命令交换机和备份交换机之间互发检测报文。(3)命令交换机把自己的集群配置发送给备份交换机做备份。(4)命令交换机添加成员交换机和候选交换机,该实施例加入了五个成员交换机 和一个候选交换机。(5)命令交换机把加入的成员交换机和候选交换机信息发送给备份交换机做备 份。(6)备份交换机检测到命令交换机down掉,自己切换为命令交换机,然后根据备 份的成员和候选交换机的配置信息,请求成员交换机的重新加入,和候选交换机互发集群 心跳保持报文。至此,备份交换机接替命令交换机来管理集群,从而实现了集群的备份功 能。如图4所示,它是本发明中实现集群内部管理报文Ethernet封装过程的实施例。该实施例以SNMP管理报文为例,其实现的方法步骤包括
(1)通过命令 cluster packet ethernet-encapsulation enable 来启动集群的 Ethernet封装功能;(2)SNMP客户端访问成员交换机1时,会在SNMP请求报文头部的 community字段中指定成员交换机的mac地址,以反映要访问的成员交换机,比如以 “pUblic@00-03-0f-00-00-01”的形式来指定,其中”为分隔符,后面是指定成员交换机1 的mac地址;(3)命令交换机收到SNMP客户端发来的请求报文后,发现community字段有” 符号,表示是对成员交换机访问的管理报文,于是取出mac,将SNMP报文以Ethernet格式封 装,目的mac即为取出的成员交换机的mac,从相应的端口发给成员交换机;(4)成员交换机接收到SNMP管理报文,根据报文类型判断出是Ethernet封装 的SNMP管理报文,然后交由SNMP代理处理,SNMP代理处理完毕,形成SNMP应答报文,用 Ethernet格式进行封装,然后发送给命令交换机;(5)命令交换机收到应答报文,根据报文类型确定是Ethernet封装的SNMP应答报 文,取出应答报文,发送给SNMP管理客户端。至此完成了一次完整的集群内部Ethernet格 式封装SNMP管理报文的SNMP访问过程。本发明交换机操作系统方框图,如图5所示。本发明交换机操作系统,它包括子系 统命令行系统及报文接收系统。其中,命令行系统负责接收、解释用户输入的命令;报文 接收系统负责网络报文的接收、转发。当通过命令行系统实现集群网管功能、以及配置命令交换机、备份交换机以及启 动集群内不报文的Ethernet封装功能时,交换机软件系统将会进行如下步骤的操作(1)、配置集群功能的命令,启动集群功能,配置好命令交换机、备份交换机以及 集群内部报文的Ethernet封装功能。如输入以下命令“cluster run key test vid 100、 cluster commander test、 clustercommander backup、 cluster packet ethernet encapsulation";(2)、命令交换机和备份交换机互发检测报文,检测命令交换机是否失效,同时命 令交换机把集群数据备份到备份交换机;(3)、如果备份交换机检测到命令交换机失效,则接替命令交换机来维护集群功能 的运行。当在启动集群功能的接口上收到一个单播报文时,交换机软件系统将会进行如下 步骤的操作(1)、在启动集群功能的接口上收到一个单播报文;(2)、判断报文是否是访问集群内部成员交换机的报文;(3)、如果是,判断是否使能了 Ethernet封装功能,否则本机处理收到的单播报文。(4)、如果启动了 Ethernet封装功能,则用Ethernet格式封装收到的报文,然后转 发给相应的成员交换机处理,如果没有启动Ethernet封装功能,直接转发给成员交换机处理。
8
权利要求
一种集群网管方法,其特征在于集群备份功能,是通过备份命令交换机的方式来实现,当备份交换机检测到命令交换机失效时,备份交换机自动升级为命令交换机,继续管理和维护集群的运行;集群内部管理报文的Ethernet封装,是在集群内部,命令交换机和成员交换机之间,用以太帧来封装管理报文的方式,可在不支持TCP/IP协议的低端交换机上实现集群管理的功能。
2.根据权利要求1所述的集群网管方法,其特征在于所述的命令交换机的备份过程, 其方法步骤包括(A)、指定备份交换机通过命令指定哪些交换机为备份交换机;(B)、集群数据的备份命令交换机保存的集群信息备份到备份交换机的过程;集群信 息,包括成员交换机的相关信息以及集群的一些配置信息;集群数据备份采用实时备份的 方式;当指定完备份交换机后即可以进行备份;在集群运行期间,如果有成员发生变化或 者集群配置发生变化时实时的进行数据的备份;(C)、主备切换检测该步骤确定是否满足备份交换机切换为主用交换机的条件;该步 骤在备份交换机运行期间一直执行,备份交换机和主用交换机之间发送检测报文,直到检 测到主用交换机失效,备份交换机具有切换为主用交换机的条件为止;(D)、主备切换过程备份交换机切换为主用交换机的过程;只有满足备份交换机切换 为主用交换机的条件后才执行该步骤;(E)、主备切换后成员的恢复主备切换后,向所有成员发加入请求,使成员重新加入集群。
3.根据权利要求1所述的集群网管方法,其特征在于所述的集群内部管理报文的 Ethernet封装过程,其方法步骤包括(A)、使能报文的Ethernet封装功能;(B)、命令交换机收到报文后,判断是否是访问集群内部成员的管理报文;如果是,用 Ethernet报文格式进行封装;然后发送给指定的成员交换机;(C)、成员交换机收到命令交换机发送过来的Ethernet封装格式的报文后,解封装;然 后根据报文的类型交给相应的模块处理;处理完毕再把处理结果用Ethernet格式封装后 发送给命令交换机;(D)、命令交换机收到返回的Ethernet封装的处理结果报文后,解封装;然后发送给管理端。
4.一种交换机操作系统,它包括子系统命令行系统及报文接收系统,其中,命令行 系统负责接收、解释用户输入的命令;报文接收系统负责网络报文的接收、转发,其特征在 于当通过命令行系统实现集群网管功能、以及配置命令交换机、备份交换机以及启动集 群内部报文的Ethernet封装功能时,交换机软件系统操作步骤包括(A)、配置集群功能的命令,启动集群功能,配置好命令交换机、备份交换机以及集群内 部报文的Ethernet封装功能;(B)、命令交换机和备份交换机互发检测报文,检测命令交换机是否失效;同时命令交 换机把集群数据备份到备份交换机;(C)、如果备份交换机检测到命令交换机失效,则接替命令交换机来维护集群功能的运当在启动集群功能的接口上收到一个单播报文时,交换机软件系统操作步骤包括(A)、在启动集群功能的接口上收到一个单播报文;(B)、判断报文是否是访问集群内部成员交换机的报文;(C)、如果是,判断是否使能了Ethernet封装功能,否则本机处理收到的单播报文;(D)、如果启动了Ethernet封装功能,则用Ethernet格式封装收到的报文;然后转发给 相应的成员交换机处理;如果没有启动Ethernet封装功能,直接转发给成员交换机处理。
全文摘要
本发明涉及一种具有高可靠性和灵活性的集群网管系统及方法。本发明可实现提供命令交换机的备份功能;以及在命令交换机和成员交换机之间提供管理报文的以太帧封装功能。集群备份功能,是通过备份命令交换机的方式来实现,当备份交换机检测到命令交换机失效时,备份交换机自动升级为命令交换机,继续管理和维护集群的运行;集群内部管理报文的Ethernet封装,是在集群内部,命令交换机和成员交换机之间,用以太帧来封装管理报文的方式,在不支持TCP/IP协议的低端交换机上实现集群管理的功能。本发明提高了集群网管功能的健壮性,保证了集群管理的稳定性和连续性;并在不支持TCP/IP协议的低端交换机上实现集群管理功能,降低了用户的投资和使用的复杂性。
文档编号H04L12/24GK101873225SQ20101020183
公开日2010年10月27日 申请日期2010年6月9日 优先权日2010年6月9日
发明者姚建忠 申请人:神州数码网络(北京)有限公司;上海神州数码有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1