从代理模块故障中恢复的方法

文档序号:6349491阅读:285来源:国知局
专利名称:从代理模块故障中恢复的方法
技术领域
本发明有关于模块化网络设备,特别是指具有多余备用的管理与系统控制功能的模块化交换器。
过去以来,模块化的架构已被发展用来设计网络设备,运用模块设计的好处是能够提供弹性以符合未来网络的成长需求。一般而言,模块化网络设备,如模块化交换器,拥有一张系统管理的代理模块(agent module)以及一张以上的网络接口模块,这些模块配置在模块化网络设备的机架(chassis)插槽(slot),安装在机架上的网络接口模块可提供内部的交换功能而不会形成带宽瓶颈拖累整个网络,而代理模块则结合了交换组织(switch fabric)与管理功能以监控模块化交换器的网络交换运作。这样的代理模块对网络而言虽是不可或缺,然而,却代表了代理模块为潜在的致命点,当它故障时,部份或整个网络将因此瘫痪。有鉴于此,如何提供一种拥有备用代理模块、可靠的模块化交换器,实为一重要的课题。
本发明之另一目的是提供一种机制,能在模块化网络设备建立冗余的(redundant)管理与系统控制功能。
为达上述目的,本发明提供一种从第一代理模块故障中恢复的方法,其中第一代理模块安装在模块化网络设备中以执行管理与系统控制功能,而模块化网络设备在其机架中可设置数张网络接口模块。根据本发明,安装第二代理模块在模块化网络设备的机架中,并自动设定第二代理模块的已安装信号,以通知第一代理模块已完成安装第二代理模块。然后,第二代理模块依据第一代理模块的已安装信号、就绪信号和特许信号已经被设定而判定先前已安装第一代理模块。在第二代理模块的就绪信号设定后,第一代理模块对第二代理模块进行网络接口模块的组态信息同步处理,再者,第一代理模块会定期地送一信息给第二代理模块,以表示第一代理模块未发生故障。若在一既定时间间隔之内未收到该信息,则第二代理模块侦测到第一代理模块已发生故障。因此,模块化网络设备包含第一代理模块和第二代理模块进行重新开机,并且第二代理模块运用同步过的组态信息,接管执行管理与系统控制功能。
另一方面,本发明揭露一种方法,能够建立模块化网络设备的冗余管理与系统控制功能,其中,模块化网络设备在其机架中可设置多张网络接口模块,当激活模块化网络设备时,第一代理模块已经安装在机架的第一插槽且第二代理模块安装在机架的第二插槽。若第一代理模块的特许信号已被设定而第二代理模块的特许信号被取消时,决定第一代理模块为主代理模块而第二代理模块为备用代理模块,在第一代理模块的就绪信号和第二代理模块的就绪信号均设定之后,第一代理模块对第二代理模块进行网络接口模块的组态信息同步处理。再者,第一代理模块会定期地送一信息给第二代理模块,以表示第一代理模块未发生故障,若在一既定时间间隔之内未收到该信息,则第二代理模块侦测到第一代理模块已经发生故障。结果,模块化网络设备进行重新开机,并且第二代理模块运用同步过的组态信息,接手执行管理与系统控制功能。
100模块化网络设备(系统);110、120代理模块;130网络接口模块;142、144代理模块插槽;146网络接口模块插槽;202、202’中央处理器;210背板;510主代理模块;520备用代理模块;530数据封包;540响应封包;550标头;551、553、557、559字段;PRT#、PRT#’已安装信号;RDY#、RDY#’就绪信号;PRV#、PRV#’特许信号。
为建立冗余系统管理的架构,系统100必须安装两张代理模块在机架上,而插槽142、144专门用来容纳代理模块。冗余代理模块的配置可以提供流畅的管理,在网络管理员激活系统100或将其重新开机时,若系统100已安装好两张代理模块,则在插槽142的代理模块110成为主代理模块,而在插槽144的代理模块120成为备用代理模块。然而,若管理员在系统100的电源打开之后才安装一代理模块,则先前安装的代理模块成为主代理模块,而后来安装的成为备用代理模块。从下面较佳实施例的描述,本发明的特征将更清楚易懂。
参考图2,每一代理模块具有三种专用信号用来决定在系统100中的主代理模块和备用代理模块,本领域技术人员当察知代理模块110以及代理模块120具有大体上相同的结构。一旦安装好代理模块110(120)之后,通过将已安装信号PRT#自动连接至地(ground)而将其设定(assert)。本说明书中信号名称字尾标有#符号者代表一低电位有效(low active)信号。特许信号PRV#只在代理模块110(120)判断本身成为主代理模块后才会设定,此外,在系统电源开启或重新开机后,就绪信号RDY#可用来表示已完成初始化程序,如图标,这些信号在背板210(backplane)上接收与传送。代理模块110(120)包括一中央处理器(CPU)202(202’)以控制信号PRV#、RDY#(信号PRV#’、RDY#’)且用以侦测从另一代理模块120(110)发出的信号PRV#、RDY#和PRT#(信号PRV#’、RDY#’和PRT#’)。CPU 202(202’)也能执行与网络交换与管理相关的功能。如图标,信号PRV#与信号RDY#(信号PRV#’、RDY#’)也可以经由电阻R1(R1’)和电阻R2(R2’)耦接电源Vcc。
背板210在系统100内为星形布线(star-wired)的结构,可将每一网络接口模块插槽146连接至代理模块插槽142、144,并提供代理模块110(120)和网络接口模块130之间的通信以交流控制信号及侦测、管理活动,每张模块上的背板连接器(图中未示)可使模块很容易的连上背板而得到所有的系统服务。背板210最好还包括用来传递代理模块110(120)和网络接口模块130之间网络活动的数据信道、用来传递模块侦测信号的控制信道;背板210也具有运作在代理模块110和代理模块120间的通信信道以保持两者组态信息的同步。同张网络接口模块130端口之间的网络活动并不会进入背板210,易言之,当封包的目的地为本地连接节点时,网络接口模块130可提供交换转接服务。如果封包的目的地址不在本地,则网络接口模块130送出封包穿越背板210至代理模块110(120),代理模块110(120)再将其转接至适当的网络接口模块130。
本发明的操作可通过图3来详细说明。在系统100激活且代理模块110(120)已经开始运作时,安装代理模块120(110)于机架中以建立冗余备用的管理与系统控制功能(步骤S310)。代理模块120(110)会自动设定本身的信号PRT#’(PRT#),以通知代理模块110(120)已完成安装。然后,代理模块120(110)依据信号PRT#、信号RDY#和信号PRV#(信号PRT#’、信号RDY#’和信号PRV#’)已经被设定而判定先前已安装代理模块110(120)(步骤S320)。在代理模块120(110)信号RDY#(RDY#’)设定后,系统100自代理模块110(120)对代理模块120(110)进行网络接口模块130所有组态信息的同步处理(步骤S330)。系统100会把两张代理模块视为逻辑上的一个装置,代理模块120(110)运作在随时待命的模式,也就是发生在代理模块110(120)上的管理活动状态会不断地通知代理模块120(110),当代理模块110(120)中的任何组态信息更改时,系统100重新进行代理模块110(120)和代理模块120(110)两者间的同步处理。
在正常运作期间,代理模块110(120)会定期地送一信息给代理模块120(110),以表示未发生故障(步骤S340),若在一既定时间间隔之内未收到该信息,则代理模块120(110)侦测到代理模块110(120)已发生故障(步骤S350),因此,模块化网络设备100包含代理模块110和代理模块120进行重新开机(步骤S360)。经过系统重新开机,代理模块120(110)设定其信号RDY#’(RDY#),以表示代理模块120(110)已完成一初始化程序,且设定代理模块120(110)的信号PRV#’(PRV#),以表示代理模块120(110)已接手先前由代理模块110(120)所执行的管理与系统控制功能。如果代理模块110(120)恢复至正常操作状态,代理模块110(120)取消(de-assert)其信号PRV#(PRV#’),并且依据代理模块120(110)的信号PRT#’、信号RDY#’和信号PRV’#(信号PRT#、信号RDY#和信号PRV#)已被设定,而判定代理模块120(110)已接手执行管理与系统控制功能,此时除非系统100再次开机,代理模块110(120)将维持在备用状态。以此方式,代理模块120(110)运用同步过的组态信息接管执行管理与系统控制功能(步骤S370)。
当安装有两张代理模块的系统100电源打开或重新开机时,安装在插槽142的模块成为主代理模块,而安装在插槽144的模块成为备用代理模块。参考图4,在系统100激活时,代理模块110已经安装在机架的插槽142且代理模块120安装在插槽144(步骤S410),代理模块110、120分别设定各自的信号PRT#和信号PRT#’,以互相通知对方上述代理模块110、代理模块120已安装完成。代理模块110将会设定其信号PRV#,以表示安装在插槽142的代理模块110将成为主代理模块,而安装在插槽144的代理模块120侦测到代理模块110的信号PRV#已被设定,则保持其信号PRV#’在取消状态,当信号PRV#已设定而信号PRV#’取消时,决定代理模块110扮演主代理模块而代理模块120则扮演备用代理模块的角色(步骤S420)。在代理模块110、120各自完成初始化程序之后,代理模块110和代理模块120分别设定信号RDY#、RDY#’。在代理模块110的信号RDY#和代理模块120的信号RDY#’均设定好之后,系统100自主代理模块对备用代理模块进行网络接口模块130所有组态信息的同步处理(步骤S430),当主代理模块中的任何组态信息更改时,系统100重新进行主代理模块和备用代理模块两者间的同步处理。
在正常运作期间,主代理模块会定期地送一信息给备用代理模块,以表示未发生故障(步骤S440),若在一既定时间间隔内未收到该信息,则备用代理模块侦测到主代理模块已发生故障(步骤S450),导致系统100包含代理模块110和代理模块120进行重新开机(步骤S460)。经过系统重新开机,备用代理模块120设定其信号RDY#’以表示完成初始化程序,且设定备用代理模块120的信号PRV#’,表示代理模块120已接手先前由代理模块110所执行的管理与系统控制功能。如果原先的主代理模块110恢复至正常操作状态,代理模块110会取消其信号PRV#,并且依据代理代理模块120的信号PRT#’、信号RDY#’和信号PRV’#已被设定,而判定代理模块120已接手执行管理与系统控制功能,除非系统100再次开机,主代理功能不会转移回到代理模块110。由于代理模块120从原主代理模块110得知所有的组态信息,因此代理模块120可接手执行管理与系统控制功能(步骤S470)。
根据本发明,如果主代理模块中的任何组态信息更改或系统重新开机时,主代理模块对备用代理模块进行组态信息的同步更新处理,图5说明本发明的同步处理过程。简言之,主代理模块510传送一数据封包530给备用代理模块520,数据封包530具有一标头(header)550以及与组态信息有关的一笔数据570。在一实施例中,数据封包530中的标头550包含一字段551以表示封包类型,例如封包传递类型SYNC WR,如图所示,标头550可以具有指定给SECTION ID的字段553,代表存储器的区段识别码,标头550还可以具有指定给OFFSET的字段557和指定给LENGTH的字段559,分别代表存储器区段中的偏移地址及数据570的长度。若能收到正确地收到数据,备用代理模块520送回一响应封包540至主代理模块510,借此确认数据封包的传送,如图所示,响应封包540只是一具有字段551以表示封包确认类型ACK的标头550,因此,若先前的传送成功,主代理模块510会接收响应封包540。以此方式,同步处理重复进行上述的数据封包传送、响应封包送回和响应封包接收的步骤,直到全部组态信息转移完毕。
权利要求
1.一种从第一代理模块故障中恢复的方法,该第一代理模块安装在一模块化网络设备中以执行管理与系统控制功能,该模块化网络设备在其机架中可设置多张网络接口模块,其特征是,该方法至少包含下列步骤安装一第二代理模块在该机架中并设定该第二代理模块的已安装信号,以通知该第一代理模块已完成安装该第二代理模块;该第二代理模块依据该第一代理模块的已安装信号、该第一代理模块的就绪信号和该第一代理模块的特许信号已被设定而判定已安装该第一代理模块;在该第二代理模块的就绪信号设定后,该第一代理模块对该第二代理模块进行该些网络接口模块的组态信息同步处理;该第一代理模块定期地送一信息给该第二代理模块,以表示该第一代理模块未发生故障;若在一既定时间间隔之内未收到该信息,则该第二代理模块侦测到该第一代理模块发生故障;该模块化网络设备包含该第一代理模块和该第二代理模块进行重新开机;以及该第二代理模块运用该同步过的组态信息,执行管理与系统控制功能。
2.如权利要求1所述的从第一代理模块故障中恢复的方法,其特征是,该方法更至少包含下列步骤当上述第一代理模块中的任何组态信息更改时,对上述第二代理模块重新进行同步处理。
3.如权利要求2所述的从第一代理模块故障中恢复的方法,其特征是,该方法更至少包含下列步骤在上述重新开机步骤之后,设定上述第二代理模块就绪信号,以表示上述第二代理模块已完成一初始化程序;以及设定上述第二代理模块的特许信号,以表示上述第二代理模块已接手先前由上述第一代理模块所执行的管理与系统控制功能。
4.如权利要求3所述的从第一代理模块故障中恢复的方法,其特征是,该方法更至少包含下列步骤在上述重新开机步骤之后,若上述第一代理模块恢复至一正常操作状态,则进行下列步骤取消上述第一代理模块特许信号;以及上述第一代理模块依据上述第二代理模块已安装信号、上述第二代理模块就绪信号和上述第二代理模块特许信号已被设定,判定上述第二代理模块已接手执行管理与系统控制功能。
5.如权利要求1所述的从第一代理模块故障中恢复的方法,其特征是,其中上述信息同步处理步骤至少包含下列步骤从上述第一代理模块传送一数据封包给上述第二代理模块,该数据封包具有一标头以及与组态信息有关的一笔数据;从上述第二代理模块送回一响应封包至上述第一代理模块,借此确认该数据封包的传送;上述第一代理模块接收该响应封包;以及重复进行该传送数据封包步骤、该送回响应封包步骤和该接收响应封包步骤,直到全部组态信息转移完毕;其中,该数据封包中的该标头至少包含一字段表示一封包传递类型;其中,该响应封包为该标头其具有该字段表示一封包确认类型。
6.如权利要求1所述的从第一代理模块故障中恢复的方法,其特征是,上述安装第二代理模块步骤是在上述模块化网络设备电源开启后进行。
7.如权利要求1所述的从第一代理模块故障中恢复的方法,其特征是,上述第一代理模块和上述第二代理模块具有大体上相同的结构。
8.一种建立一模块化网络设备的冗余管理与系统控制功能的方法,该模块化网络设备在其机架中可设置多张网络接口模块,其特征是,该方法至少包含下列步骤激活该模块化网络设备,其中一第一代理模块安装在该机架的一第一插槽且一第二代理模块安装在该机架的一第二插槽;若该第一代理模块的特许信号已被设定而该第二代理模块的特许信号被取消时,决定该第一代理模块为一主代理模块且该第二代理模块为一备用代理模块;在该第一代理模块的就绪信号和该第二代理模块的就绪信号均设定之后,该第一代理模块对该第二代理模块进行该些网络接口模块的组态信息同步处理;该第一代理模块定期地送一信息给该第二代理模块,以表示该第一代理模块未发生故障;若在一既定时间间隔之内未收到该信息,则该第二代理模块侦测到该第一代理模块已发生故障;该模块化网络设备包含该第一代理模块和该第二代理模块进行重新开机;以及该第二代理模块运用该同步过的组态信息,执行管理与系统控制功能。
9.如权利要求8所述的建立模块化网络设备的冗余管理与系统控制功能的方法,其特征是,该方法更至少包含下列步骤在上述模块化网络设备电源开启后,分别设定上述第一代理模块的已安装信号和上述第二代理模块的已安装信号,以互相通知对方上述第一代理模块、上述第二代理模块已安装完成;设定上述第一代理模块特许信号,以表示安装在上述第一插槽的上述第一代理模块为上述主代理模块;上述第二代理模块侦测到上述第一代理模块特许信号已被设定;保持上述第二代理模块特许信号在取消状态;以及当上述第一代理模块、上述第二代理模块各自完成一初始化程序,分别设定上述第一代理模块就绪信号和上述第二代理模块就绪信号。
10.如权利要求9所述的建立模块化网络设备的冗余管理与系统控制功能的方法,其特征是,该方法更至少包含下列步骤当上述第一代理模块中的任何组态信息更改时,对上述第二代理模块重新进行同步处理。
11.如权利要求10所述的建立模块化网络设备的冗余管理与系统控制功能的方法,其特征是,该方法更至少包含下列步骤在上述重新开机步骤之后,设定上述第二代理模块就绪信号,以表示上述第二代理模块已完成上述初始化程序;以及设定上述第二代理模块特许信号,以表示上述第二代理模块已接手先前由上述第一代理模块所执行的管理与系统控制功能。
12.如权利要求11所述的建立模块化网络设备的冗余管理与系统控制功能的方法,更至少包含下列步骤在上述重新开机步骤之后,若上述第一代理模块恢复至一正常操作状态,则进行下列步骤取消上述第一代理模块特许信号;以及上述第一代理模块依据上述第二代理模块已安装信号、上述第二代理模块就绪信号和上述第二代理模块特许信号已被设定,判定上述第二代理模块已接手执行管理与系统控制功能。
13.如权利要求8所述的建立模块化网络设备的冗余管理与系统控制功能的方法,其特征是,上述信息同步处理步骤至少包含下列步骤从上述第一代理模块传送一数据封包给上述第二代理模块,该数据封包具有一标头以及与组态信息有关的一笔数据;从上述第二代理模块送回一响应封包至上述第一代理模块,借此确认该数据封包的传送;上述第一代理模块接收该响应封包;以及重复进行该传送数据封包步骤、该送回响应封包步骤和该接收响应封包步骤,直到全部组态信息转移完毕;其中,该数据封包中的该标头至少包含一字段表示一封包传递类型;其中,该响应封包为该标头其具有该字段表示一封包确认类型。
14.如权利要求8所述的建立模块化网络设备的冗余管理与系统控制功能的方法,其特征是,上述第一代理模块和上述第二代理模块具有大体上相同的结构。
全文摘要
一种从模块化网络设备的主代理模块故障中的恢复方法,其中,主代理模块执行管理与系统控制功能,而模块化网络设备在其机架中可设置数张网络接口模块。在电源开启之后,安装一备用代理模块到机架上,备用代理模块会依据主代理模块的三种专用信号已被设定而判定先前已安装主代理模块,然后,模块化网络设备进行主代理和备用代理模块之间的网络接口模块组态信息同步更新。如果在一既定时间间隔之内未收到主代理模块送来的信息,则备用代理模块侦测到主代理模块发生故障,结果模块化网络设备重新开机,并且由备用代理模块接管成为主代理模块。
文档编号G06F11/36GK1459725SQ0212026
公开日2003年12月3日 申请日期2002年5月17日 优先权日2002年5月17日
发明者吴丽华, 林慈韵 申请人:智邦科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1