一种网络设备的集群管理方法

文档序号:7677421阅读:220来源:国知局
专利名称:一种网络设备的集群管理方法
技术领域
本发明涉及通信系统中的网络管理方法,具体地说涉及到网络设备的集群管理方法。
1.在对网络设备进行集群化管理时,必须对网络设备做唯一标识,以防止对一台网络设备重复管理,目前设备厂商都是通过将设备厂商自定义的设备序列号作为唯一标识来实现此项功能,这就使得不同厂商的设备互通存在困难。
2.由于网络设备集群管理是在设备厂商的私有协议栈上,采用厂商的私有协议实现的,实现私有协议栈的实现方式各不相同,私有协议内容也各不相同,使得各厂商的设备在集群管理上很难实现互通,难以满足电信运营商对网络中设备统一管理的需求。
3.传统的网络设备集群管理通常只定位在以太网络之上,当出现与非以太网络混合组网时,无法胜任。
4.由于标准网管报文到私有协议的转换需要占用命令网络设备的大量处理资源,使得目前网络设备的集群管理能力有限,无法满足大型组网的需求。
5.由于采用私有协议栈,因此需要对私有协议栈地址进行管理,这样会增加维护和开发成本。
为达到上述目的,本发明提供的网络设备的集群管理方法,包括(1)网管在网络中指定一台设备作为集群的管理设备,并对该台设备进行相应的配置;
(2)集群管理设备启动拓扑收集过程收集网络中规定跳数内的网络拓扑结构信息;(3)网管可以根据从集群管理设备取来的拓扑结构信息,指定拓扑中需要加入集群的候选设备,并通知集群管理设备启动集群成员设备的加入过程;(4)集群管理设备将指定的候选设备加入集群,使其进行相应的配置,成为集群的成员设备;(5)集群建立后,通过集群管理设备对集群中的成员设备进行管理,来自集群外部、目标为成员设备的管理报文,在集群管理设备上经过标准的网络地址转换过程(NAT)转发到相应的成员设备处理,成员设备按通常的处理过程处理该管理报文。
上述步骤(1)中对集群管理设备进行相应的配置,包括在该设备上配置下述内容集群名称、集群的使能状态、集群的管理IP地址池、集群状态有效保留时间、成员设备的握手时间间隔、本管理设备在集群中的角色、本管理设备的IP地址。
上述步骤(4)中所述将候选网络设备加入集群的过程包括(A1)集群管理设备向可以加入集群的候选网络设备下发集群加入请求;(A2)候选设备根据自己的状况判断是否可以加入集群,如果不可以,则反馈拒绝加入响应,结束加入集群的过程;否则向集群管理设备反馈同意加入集群的确认响应;(A3)集群管理设备收到候选设备的确认响应后,如果候选设备同意加入,就向所述候选设备发送包括私有IP地址、成员编号、握手间隔、状态保持时间等的配置信息,候选设备收到该信息后进行相应的设置,并在设置结束后向集群管理设备发出加入集群结束的确认响应。
上述步骤(4)中所述为加入集群的每个成员设备进行包括分配私有IP地址的配置,包括在每个成员设备上配置下述内容成员设备的编号、成员设备的私有IP地址、成员设备名称、成员设备的标识(ID)、成员设备的状态、成员设备操作时的状态、集群管理的密码、当前状态已经保留的时间。
上述步骤(4)中所述为加入集群的每个成员设备进行标识采用包括下述字段的数据结构进行网络类型用于标识设备所在的网络类型;物理地址用于标识设备所在网络的物理地址。
本发明提供的网络设备的集群管理装置,包括集群设备管理器和成员设备管理器,其中集群设备管理器包括网络地址转换模块,用于对成员设备的管理报文进行网络地址转换;私有IP地址分配模块,用于完成成员网络设备的私有IP地址的分配;网络设备集群管理模块,用于对成员网络设备的集中管理,对来自集群外部、目标为成员设备的管理报文,在经过标准的网络地址转换模块转发到相应的成员设备处理,使成员设备按通常的处理过程处理该管理报文;拓扑处理模块,用于网络拓扑结构的发现,收集网络中规定跳数内的网络拓扑结构信息;成员设备管理器包括网络设备集群管理模块,用于完成成员设备端的机群管理任务;
拓扑处理模块,用于完成邻接设备的发现和拓扑收集请求的额响应/转发处理。
与现有技术相比,由于本发明采用对加入集群的每个成员设备进行包括分配私有IP地址和进行标识的配置,可以在现有的IP协议栈上实现,这样使得实现相对容易,而且具有良好的可开放性,便于不同厂商设备的管理;由于利用私有IP地址实现对网络设备的管理,还可以节约宝贵的公有IP地址资源;另外,由于本发明采用标准的网络地址转换进行设备管理报文的转发,便于通过硬件实现,因此提高了本发明的通用性,能够大大减轻管理设备的CPU负担,实现大量网络设备的集中管理,因此,采用本发明,能够对网络设备进行有效的集群管理。
本发明的实质是通过使用标准协议栈及私有IP地址段实现对网络设备的集中管理。本发明的具体实施过程参考

图1。首先在步骤1,由网管或者用户通过命令行在网络中指定一台设备作为集群的管理设备,该设备通常为3层交换机或性能较好的网络设备,然后对该台设备进行相应的配置,在本例中所进行的配置内容包括集群名称用于标识本管理集群的名称;
集群的使能状态用于标识本管理集群能否处于有效状态;集群的管理IP地址池用于给成员设备配置的私有IP地址段;集群有效保留时间用于表示在多久没有收到成员握手后,认为成员与管理设备联系中断;握手时间间隔用于配置成员设备与管理设备间发送握手的间隔;本管理设备在集群中的角色用于标识设备是管理设备还是成员设备;管理设备的管理IP地址用于标识管理设备用于集群内部通讯的IP地址;在步骤2,首先确定本管理集群的范围,为此需要确定网络拓扑收集跳数的大小,然后由集群管理设备启动拓扑收集过程收集网络中规定跳数内的网络拓扑结构信息,以获取可以加入管理集群的被管理设备的信息,包括获取被管理设备的MAC地址和互连端口号。
在步骤3,网管/命令行用户可以根据集群管理设备收集来的拓扑信息,和其他相关情况决定是否建立设备管理集群,例如当设备较少是需要重新选定建立管理集群的范围,而不是立即进行管理集群的建立。如果可以建立集群,则通知集群管理设备启动集群成员设备的加入过程。
在步骤4,集群管理设备确定网络中可以加入集群的候选设备,并将确定的候选设备加入集群,使其成为集群的成员设备,同时对加入集群的每个成员设备进行包括分配私有IP地址和成员编号等配置。(在具体的通信网络中,在有些情况下,一个设备并不需要连接到互联网或另一个专有的网络上,此时无须遵守对IP地址进行申请和登记的规定,该设备可以使用任何的地址,如使用私有IP地址。在RFC1597(专用国际互联网络地址分配,Address Allocation for Private Internets)中,规定以下IP地址段是用作私用地址的A类地址10.0.0.0到10.255.255.255B类地址172.16.0.0到172.31.255.255.255C类地址192.168.0.0到192.168.255.255因此可以使用上述私有IP地址用于集群中的设备管理。
本例中所述为加入集群的每个成员设备进行包括分配私有IP地址和成员编号的配置,对于每个成员设备的配置包括下述内容集群名称用于标识当前交换机所处的集群名称;集群口令统一的集群管理口令,用于集群内管理过程的鉴权。
成员设备的编号用于在集群中唯一标识该设备。这是一个内部编号,便于实现时作为索引。
成员设备的私有IP地址用于成员设备基于IP网络通讯的网络地址。
管理设备的IP地址用于集群内成员设备和管理设备之间基于IP的通信。
成员设备名称用于标识该设备的名称。
在本例中,为加入集群的每个成员设备进行标识采用包括下述字段的数据结构

网络类型(Type)用于标识设备所在的网络类型;物理地址用于标识设备所在网络的物理地址,用字符表示。
在上述结构中共10字节,其中网络类字段2个字节,物理地址字段6个字节,保留(Reserved)2个字节另做他用。采用上述结构,不再需要厂商自己定义设备的标识方法,有利于维护设备的唯一性,而且是借用设备物理地址的唯一性来保证。同时这样标识不局限在某种物理网络之上,例如当TYPE为0时,设备网络物理地址表示为以太网地址。TYPE可以随设备所在的物理网络不同而进行扩充。
最后在步骤5,集群建立后,由集群管理设备对集群中的其它成员设备进行管理,对来自集群外部对集群内部的成员设备进行管理的报文,在集群管理设备上经过标准的网络地址转换过程,将报文的目的地址转换为集群内部采用私有IP地址转发到相应的成员设备处理。
在上述步骤4中,所述将候选网络设备加入集群的过程采用下述步骤实现,参考图2在步骤11,集群管理设备向可以加入集群的候选网络设备下发集群加入请求。在步骤12候选设备根据自己的状况判断是否可以加入集群,例如可以根据本候选设备是否在其它集群中以及本设备中的软件版本是否支持集群管理决定是否加入集群;如果不可以加入集群,结束加入集群的操作过程,向集群管理设备反馈拒绝加入集群的响应;否则在步骤13判断本候选设备是否已设定特权用户密码,如果没有设定,则不需要进行鉴权操作,直接进行反馈同意加入集群的确认响应操作,如果本设备已经设定密码,则在步骤14对管理设备的身份进行鉴权操作,当鉴权通过后,在步骤15反馈同意加入集群的确认响应操作,否则向集群管理设备反馈拒绝信息,结束加入集群的操作。
上述设备的鉴权操作参考下述过程首先候选设备向管理网络设备返回一个包含一个用于认证的随机数(challenge)的报文,集群管理设备在收到报文后,利用该随机数,对要传递的鉴权信息进行加密,鉴权信息包括有候选网络设备、认证口令(可以是集群网络设备的下发的集群管理口令),然后利用该鉴权信息封装一个响应报文,封装好报文后,将该报文下发到相应的候选设备,候选设备在经过鉴权后确认该管理网络设备的身份后,向管理网络设备返回一个同意加入的确认报文。
在步骤16,集群管理设备在收到候选网络设备返回的同意加入集群的响应后,为该候选网络设备分配集群成员标识号、管理使用的私有IP以及一些其他配置信息等,利用这些信息,再加上口令(可以经过加密处理),封装成一个配置报文下发到候选设备,候选设备在收到该报文后,解析出包含的口令,以及集群管理序号和管理私有IP等配置信息,记录下集群管理设备下发的这些配置信息后,该候选网络设备先将自己的角色改变成成员交换机,然后向集群管理设备返回一个加入结束确认,集群管理设备在收到候选网络设备的加入确认后,标识该候选网络设备为集群成员,至此候选设备加入过程结束。
图3是本发明所述装置实施例的结构框图。图中所示的网络设备的集群管理装置,包括集群设备管理器1和成员设备管理器2,其中集群设备管理器1设置在集群管理设备中,用于实现成员设备的集群管理,包括网络地址转换模块11,用于对成员设备的管理报文进行网络地址转换;
私有IP地址分配模块12,用于完成成员网络设备的私有IP地址的分配;网络设备集群管理模块13,用于对成员网络设备的集中管理,对来自集群外部、目标为成员设备的管理报文,在经过标准的网络地址转换模块转发到相应的成员设备处理,使成员设备按通常的处理过程处理该管理报文;拓扑处理模块14,用于网络拓扑结构的发现,收集网络中规定跳数内的网络拓扑结构信息;成员设备管理器2设置在被管理的成员设备中,用于完成集群管理中的成员设备侧的管理,包括网络设备集群管理模块21,用于完成成员设备端的机群管理任务;拓扑处理模块22,用于完成邻接设备的发现和拓扑收集请求的额响应/转发处理。
使用上述装置进行网络设备的集群管理时,首先拓扑处理模块14通过候选设备侧的拓扑处理模块14收集网络中规定跳数内的网络拓扑结构信息,将该信息传给网络设备集群管理模块13,由网络设备集群管理模块13向可以加入集群的候选设备的网络设备集群管理模块21下发集群加入请求,网络设备集群管理模块21根据自己的状况判断是否可以加入集群,将即可以加入或拒绝加入的响应反馈给网络设备集群管理模块13;当网络设备集群管理模块13收到候选设备的确认加入的响应后,由私有IP地址分配模块12进行成员网络设备的私有IP地址的分配,分配的私有IP地址通过网络设备集群管理模块13发给候选设备的网络设备集群管理模块21,同时发给网络设备集群管理模块21的还有成员编号、握手间隔、状态保持时间等的配置信息,网络设备集群管理模块21使用该信息后对设备进行相应的设置,并在设置结束后向集群管理设备发出加入集群结束的确认响应。当候选设备成为集群的成员设备后,对来自集群外部、目标为成员设备的管理报文,在经过网络地址转换模块11进行标准的网络地址转换,然后经网络设备集群管理模块13转发到相应的成员设备处理的网络设备集群管理模块21,使成员设备按通常的处理过程处理该管理报文。
权利要求
1.一种网络设备的集群管理方法,包括(1)网管在网络中指定一台设备作为集群的管理设备,并对该台设备进行相应的配置;(2)集群管理设备启动拓扑收集过程收集网络中规定跳数内的网络拓扑结构信息;(3)网管可以根据从集群管理设备取来的拓扑结构信息,指定拓扑中需要加入集群的候选设备,并通知集群管理设备启动集群成员设备的加入过程;(4)集群管理设备将指定的候选设备加入集群,使其进行相应的配置,成为集群的成员设备;(5)集群建立后,通过集群管理设备对集群中的成员设备进行管理,来自集群外部、目标为成员设备的管理报文,在集群管理设备上经过标准的网络地址转换过程(NAT)转发到相应的成员设备处理,成员设备按通常的处理过程处理该管理报文。
2.根据权利要求1所述的网络设备的集群管理方法,其特征在于步骤(1)中所述对集群管理设备进行相应的配置,包括在该设备上配置下述内容集群名称、集群的使能状态、集群的管理IP地址池、集群状态有效保留时间、成员设备的握手时间间隔、本管理设备在集群中的角色、本管理设备的IP地址。
3.根据权利要求1所述的网络设备的集群管理方法,其特征在于步骤(4)中所述将候选网络设备加入集群的过程包括(A1)集群管理设备向可以加入集群的候选网络设备下发集群加入请求;(A2)候选设备根据自己的状况判断是否可以加入集群,如果不可以,则反馈拒绝加入响应,结束加入集群的过程;否则向集群管理设备反馈同意加入集群的确认响应;(A3)集群管理设备收到候选设备的确认响应后,如果候选设备同意加入,就向所述候选设备发送包括私有IP地址、成员编号、握手间隔、状态保持时间等的配置信息,候选设备收到该信息后进行相应的设置,并在设置结束后向集群管理设备发出加入集群结束的确认响应。
4.根据权利要求3所述的网络设备的集群管理方法,其特征在于步骤(A2)所述候选设备判断自己是否可以加入集群,是本候选设备是否已经在其它集群中以及本设备中的软件版本是否支持集群管理决定的。
5.根据权利要求3所述的网络设备的集群管理方法,其特征在于步骤(A2)中在候选设备向集群管理设备反馈同意加入集群的确认响应前,还要判断本候选设备是否已设定特权用户密码,如果没有设定,直接反馈同意加入集群的确认响应操作;如果已经设定,则向集群管理反馈要求鉴权操作,然后根据管理设备下发的鉴权信息进行本候选设备的鉴权操作。当鉴权通过后,再反馈同意加入集群的确认响应操作,否则向集群管理设备反馈拒绝加入集群的响应。
6.根据权利要求1所述的网络设备的集群管理方法,其特征在于步骤(4)中所述为加入集群的每个成员设备进行必需的配置,对每个成员设备配置包括下述内容成员设备的编号、成员设备的私有IP地址、成员设备名称、成员设备的状态、成员设备操作的状态、集群管理的密码。
7.根据权利要求1所述的网络设备的集群管理方法,其特征在于步骤(4)中所述为加入集群的每个成员设备进行标识采用包括下述字段的数据结构进行网络类型用于标识设备所在的网络类型;物理地址用于标识设备所在网络的物理地址。
8.一种网络设备的集群管理装置,包括集群设备管理器和成员设备管理器,其中集群设备管理器包括网络地址转换模块,用于对成员设备的管理报文进行网络地址转换;私有IP地址分配模块,用于完成成员网络设备的私有IP地址的分配;网络设备集群管理模块,用于对成员网络设备的集中管理,对来自集群外部、目标为成员设备的管理报文,在经过标准的网络地址转换模块转发到相应的成员设备处理,使成员设备按通常的处理过程处理该管理报文;拓扑处理模块,用于网络拓扑结构的发现,收集网络中规定跳数内的网络拓扑结构信息;成员设备管理器包括网络设备集群管理模块,用于完成成员设备端的机群管理任务;拓扑处理模块,用于完成邻接设备的发现和拓扑收集请求的额响应/转发处理。
全文摘要
本发明公开了一种网络设备的集群管理方法,该方法包括网管/命令行用户在网络中集成的设备中指定一台作为集群的管理设备,由该设备收集网络中规定跳数内的网络拓扑结构信息,网管/命令行用户根据上述信息决定是否建立设备管理集群或要加入集群的设备,如果建立设备管理集群,则由集群管理设备将指定的设备加入集群,并对加入集群的每个成员设备进行包括分配私有IP地址和成员标号的配置。集群建立后,由集群管理设备进行集群的管理。上述方案可以在现有的IP协议栈上实现,使得实现相对容易,且具有良好的可开放性,便于不同厂商设备的管理;还可以节约公网IP地址资源,实现对通过一台设备对大量的网络设备进行有效的管理。
文档编号H04L12/24GK1441569SQ02103958
公开日2003年9月10日 申请日期2002年2月27日 优先权日2002年2月27日
发明者胡安平, 马海寅, 罗洁雯, 王建, 邱晓东, 阮强胜 申请人:华为技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1