一种热重启方法及其装置的制造方法

文档序号:9261243阅读:166来源:国知局
一种热重启方法及其装置的制造方法
【技术领域】
[0001]本发明涉及通信技术领域,尤其涉及一种快速、可靠的热重启方法和装置。
【背景技术】
[0002]业务板在执行热重启时,其CPU (Central Processing Unit,中央处理器)和转发芯片等硬件一起复位,使得转发芯片在整个热重启过程中都无法工作,造成热重启过程中的流量大量丢包。
[0003]为了避免热重启过程导致的流量丢包,相关技术中提出了比如基于备份业务板的平滑重启(GR, Graceful Restart),但其过程中需要备份业务板或周边设备的配合,且涉及到数据的保存与恢复等操作,机制复杂且容易导致错误的发生。
[0004]因此,如何通过更加简单可靠的机制,减少热重启过程中的流量丢包,成为目前亟待解决的技术问题。

【发明内容】

[0005]有鉴于此,本发明提供一种热重启方法及其装置,通过推迟数据平面的复位时机,使得数据转发业务在控制平面的复位过程中仍然能够正常进行,有助于减少流量的丢包,且无需执行数据的保存和恢复操作。
[0006]为实现上述目的,本发明提供技术方案如下:
[0007]一种热重启方法,用于业务板,其中该热重启方法包括:根据接收到的热重启指令,对所述业务板的控制平面执行复位操作,在控制平面复位完成之前,保持所述业务板的数据平面持续工作;在所述控制平面完成复位后,对所述数据平面执行复位操作。
[0008]相应地,本发明还提出了一种热重启装置,用于业务板,包括:
[0009]控制平面复位单元,用于根据接收到的热重启指令,对所述业务板的控制平面执行复位操作;
[0010]数据平面复位单元,用于在控制平面复位完成之前,保持所述业务板的数据平面持续工作,并在所述控制平面完成复位后,对所述数据平面执行复位操作。
[0011]由以上技术方案可见,本发明通过推迟数据平面的复位时机,使得数据转发业务在控制平面的复位过程中仍然能够正常进行,有助于减少流量的丢包,且无需执行数据的保存和恢复操作。
【附图说明】
[0012]图1示出了相关技术中的热重启方法的时序示意图;
[0013]图2A示出了根据本发明的一个实施例的热重启方法的流程示意图;
[0014]图2B示出了根据本发明的一个实施例的热重启方法的时序示意图;
[0015]图3A示出了根据本发明的一个实施例的业务板的结构示意图;
[0016]图3B示出了根据本发明的另一个实施例的业务板的结构示意图;
[0017]图4示出了根据本发明的一个实施例的对控制平面和数据平面进行复位的具体流程示意图;
[0018]图5示出了根据本发明的一个实施例的热重启装置的示意框图。
【具体实施方式】
[0019]本发明通过推迟数据平面的复位时机,使得数据转发业务在控制平面的复位过程中仍然能够正常进行,有助于减少流量的丢包,且无需执行数据的保存和恢复操作。
[0020]图1示出了相关技术中的热重启方法的时序示意图。
[0021]如图1所示,在相关技术中,若需要对业务板执行热重启,则控制平面和数据平面一起复位。其中,控制平面需要较长时间来完成复位和初始化操作,即图1所示的Tl时间内;而数据平面需要的复位和初始化时间较短,即图1所示的T2时间内,但在剩余的(T1-T2)长度的时间段内,由于数据平面已经复位且控制平面的初始化操作尚未完成,导致数据平面无法执行正常的数据转发业务,因而导致在整个Tl时间内都存在流量丢包。
[0022]针对相关技术中的上述技术问题,本发明提供了下列实施例,并结合图2-图5对本发明的技术方案进行详细说明:
[0023]图2A示出了根据本发明的一个实施例的热重启方法的流程示意图。
[0024]如图2A所示,根据本发明的一个实施例的热重启方法,用于业务板,包括:
[0025]步骤202,根据接收到的热重启指令,对所述业务板的控制平面执行复位操作,在控制平面复位完成之前,保持所述业务板的数据平面持续工作。
[0026]步骤204,在所述控制平面完成复位后,对所述数据平面执行复位操作。
[0027]在该技术方案中,通过推迟数据平面的复位时机,使得在控制平面复位的过程中,数据平面仍然能够根据自身存储的表项来维持数据转发业务,尽可能地避免了该时间段内的流量丢包。
[0028]同时,在控制平面完成复位后,数据平面才执行相应的复位操作,数据平面在较短时间内完成了复位及初始化操作后,能够立即基于控制平面来恢复数据转发业务,尽可能缩短了流量丢包的时间长度。
[0029]图2B示出了根据本发明的一个实施例的热重启方法的时序示意图。
[0030]结合图1和图2B可知,在根据本发明的热重启方法中,控制平面和数据平面无需同时执行复位操作。具体地,在整个Tl时间段内,即控制平面执行复位和初始化的过程中,数据平面能够继续维持工作,使得热重启的大部分时间内都能够基于数据平面已存储的表项来避免流量丢包;而在控制平面完成复位及初始化操作后,数据平面才开始执行复位及初始化操作,即仅在较短的T2时间段内,数据平面才存在很少的流量丢包,并且在T2时间段之后能够立即恢复工作,继续执行数据转发业务。
[0031]因此,本发明基于数据平面的复位时机的推迟,虽然在数据平面执行复位的较短时间(即T2时间段)内存在很少的流量丢包,但整个过程中无需备份业务板或周边设备的协助,且无需执行数据的保存和恢复等,有助于简化实现机制并提升系统运行的可靠性。
[0032]需要说明的是:在本发明的技术方案中,虽然仅提及了应用对象为“业务板”,但本领域技术人员应该理解的是,该“业务板”实际上可能存在多种具体形式,下面结合图3A和图3B进行详细说明。其中,图3A示出了根据本发明的一个实施例的业务板的结构示意图;图3B示出了根据本发明的另一个实施例的业务板的结构示意图。
[0033]实施例一
[0034]如图3A所示,根据本发明的一个实施例的业务板为单块板,其中设置有对应于控制平面的CPU和对应于数据平面的转发芯片,当该业务板热重启时,通过延迟对转发芯片的复位,使得在控制平面(即CPU)复位的过程中,数据平面(即转发芯片)仍然能够根据自身存储的表项来维持数据转发业务,尽可能地避免了该时间段内的流量丢包。
[0035]实施例二
[0036]如图3B所示,根据本发明的另一个实施例的业务板采用IRF架构(IntelligentResilient Framework,智能弹性架构),即IRF框式设备中包括主控板以及若干个(图中仅示出了单个线卡板的情形)线卡板。
[0037]其中,当主控板和线卡板同时需要热重启时,主控板的控制平面(即CPU)首先复位,而线卡板的数据平面(即转发芯片)能够继续执行转发业务,从而通过延迟数据平面的复位,以尽可能避免控制平面复位过程中的流量丢包。
[0038]针对上述各类情形以及图2A所示的热重启方法,图4示出了根据本发明的一个实施例的对控制平面和数据平面进行复位的具体流程示意图。
[0039]如图4所示,根据本发明的一个实施例的对控制平面和数据平面进行复位的具体流程包括:
[0040]步骤402,预先对包含内核(kernel)的boot包进行解压和存储。
[0041]具体地,所述boot包将被解压至业务板的高端内存区,其中,所述高端内存区具体是指仅用于存储解压后的boot包而不会被其他数据占用的内存地址。例如,可以在某次开机或热重启后,控制平面的CPU对所述boot包执行上述的预解压操作。
[0042]Boot包具体是指在系统复位后执行的第一段代码,用于完成系统硬件的初始化,例如:包括时钟的设置、地址空间的映射以及设置堆栈指针等,主要是内核、BSP (BoardSupport Package,板级支持包)等系统启动的最小软件保证。Boot包加载完成后,贝U跳转到操作系统内核Kernel的入口,引导操作系统包的加载和运行。
[0043]由于boot包内的很多数据均处于压缩状态,因而通过上述的预解压操作,使得需要执行热重启时能够直接使用已经预解压后的boot包,节省了实时解压缩的时间,有助于加快热重启的执行速度。当然,本领域技术人员理解的是,对于boot包的预解压操作显然并不是必须的,可以根据实际情况确定是否采取相应的操作。
[0044]步骤404,在接收到热重启指令后,停止控制平面的所有进程、中断和DMA (DirectMemory Access,直接内存存取)。
[0045]在该过程中,无需其他设备的协助,有助于简化方案的执行机制,提高可靠性。同时,整个过程中无需执行数据保存和恢复,且各种
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1