框式设备线卡的热插拔方法、装置、主控板及框式设备与流程

文档序号:20163998发布日期:2020-03-24 21:18阅读:223来源:国知局
框式设备线卡的热插拔方法、装置、主控板及框式设备与流程

本申请涉及框式设备技术领域,尤其涉及一种框式设备线卡的热插拔方法、装置、主控板及框式设备。



背景技术:

热插拔(hotplug)功能就是允许用户在不关闭系统,不切断电源的情况下取出和更换损坏的磁盘、电源或线卡等部件,从而提高了系统对灾难的及时恢复能力、扩展性和灵活性等。热插拔最早出现在服务器领域,是为了提高服务器实用性而提出的。该技术在交换机、防火墙设备等框式设备中也得到广泛的应用,在保证其他线卡正常运作的情况下,利用热插拔技术将问题线卡退出或更换,保证了系统的问题运行,同时保证同框中的其他线卡业务不受影响。

相关技术中,当框式设备的线卡出现异常时,需要维护人员到现场进行线卡插拔的工作,大大降低了产品的自动化程度和维护效率。



技术实现要素:

为克服相关技术中存在的问题,本申请提供了一种框式设备线卡的热插拔方法、装置、主控板及框式设备。

根据本申请实施例的第一方面,提供一种框式设备线卡的热插拔方法,应用于所述框式设备的主控板,所述方法包括:

当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

在一个示例性实施例中,在对所述线卡的电源管理芯片进行复位和下电操作之前,所述方法还包括:

启动中断服务,以中断当前所述主控板的其他服务及其他非异常线卡的运行,并存储中断点、所述主控板和其他所述正常线卡的当前状态。在一个示例性实施例中,所述检测到线卡异常的步骤包括:

向所述框式设备的每一线卡发送检测请求;

如果未收到所述线卡的响应,则确定所述线卡异常。

在一个示例性实施例中,所述检测请求携带接收所述检测请求的线卡的槽位信息,以在未收到所述线卡的响应时,根据未响应线卡的槽位信息确定异常的线卡。

在一个示例性实施例中,所述方法包括:

当检测到异常的线卡不止一个时,根据所述线卡的优先级确定对所述线卡的电源管理芯片进行上下电操作的顺序。

在一个示例性实施例中,所述对所述电源管理芯片进行上电和解复位操作的步骤之后还包括:

获取所述线卡的状态信息;

当所述状态信息为不在位状态时,发送警报信号。

在一个示例性实施例中,所述方法还包括:

当所述状态信息为在位状态时,对所述线卡进行初始化配置。

根据本申请实施例的第二方面,提供一种框式设备线卡的热插拔装置,所述装置包括:

下电模块,用于当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

上电模块,用于对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

根据本申请实施例的第三方面,提供一种主控板,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任意实施例中所述的框式设备线卡的热插拔方法的步骤。

根据本申请实施例的第四方面,提供一种框式设备,包括主控板和至少一块线卡,所述主控板与所述线卡通信连接,所述主控板用于实现上述任意实施例中所述的框式设备线卡的热插拔方法的步骤。

本申请的实施例提供的技术方案可以包括以下有益效果:

本技术方案中,框式设备的主控板检测到线卡异常时,可以控制异常线卡的电源管理芯片进行上下电操作,通过对异常线卡的电源管理芯片进行复位和下电操作,模拟对异常线卡的拔出操作,再进行上电和解复位操作,模拟对异常线卡的插入操作,从而完成对异常线卡的热插拔操作,实现对异常线卡的重启,以解决异常问题。这样,通过主控板控制异常线卡的电源管理芯片的上下电,在软件层面上自动完成异常线卡的热插拔,线卡的热插拔无需维护人员到现场操作,针对线卡异常的情况能够远程及时处理,提高维护效率,有效降低维护成本。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本申请的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1为本申请一示例性实施例示出的一种框式设备线卡的热插拔方法的流程图。

图2为本申请一示例性实施例示出的主控板检测线卡异常过程的流程图。

图3为本申请一示例性实施例所示出的一种框式设备线卡的热插拔方法的流程图。

图4为本申请一示例性实施例示出的一种框式设备线卡的热插拔装置的结构框图。

图5为本申请一示例性实施例示出的一种主控板的结构框图。

图6为本申请一示例性实施例示出的一种框式设备的结构框图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

下面结合附图,对本申请的框式设备线卡的热插拔方法、装置、主控板及框式进行详细说明。在不冲突的情况下,下述的实施例及实施方式中的特征可以相互组合。

本申请提供了一种框式设备线卡的热插拔方法。图1所示为本申请一示例性实施例示出的一种框式设备线卡的热插拔方法的流程图,该方法中的框式设备可以是交换机、防火墙设备等,本申请不作具体限定。框式设备通常包括一块主控板和若干线卡,主控板用于提供框式设备的管理和控制功能,线卡也可以称为业务处理板,用于提供业务传输,本申请的框式设备线卡的热插拔方法可以应用于主控板。如图1所示,该框式设备线卡的热插拔方法包括以下步骤101至102:

步骤101,当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作。

框式设备的线卡包括电源管理芯片,当线卡插入框式设备上对应的线卡槽位时,框式设备为线卡供电,这样,主控板与线卡可以通信连接,进行业务传输。

在步骤101中,主控板可以实时检测线卡是否异常,也可以周期性检测线卡是否异常。当检测到线卡异常时,对异常的线卡的电源管理芯片进行复位下电,模拟对异常线卡的拔出操作。

步骤102,对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

在步骤102中,在对异常线卡的电源管理芯片进行复位和下电操作之后,再对异常线卡的电源管理芯片进行上电解复位,模拟对异常线卡的插入操作,热插拔是一种物理操作,这样,可以完成对线卡的热插拔操作,无需通过人工的方式进行热插拔,从而解决线卡异常的问题。在相关技术中,需要维护人员到框式设备的现场对异常的线卡进行热插拔操作。

在本申请一种可能的实施方式中,可以预先设定一个时间间隔,主控板对电源管理芯片进行复位和下电操作,在设定时间间隔后,再对电源管理芯片进行上电和解复位操作。设定时间间隔可以是1秒、3秒、5秒,也可以是30秒,还可以是1分钟,本申请不作具体的限定。

在本申请一种可能的实施方式中,当检测到异常的线卡不止一个时,可以根据所述线卡的优先级确定对所述线卡的电源管理芯片进行复位和下电、上电和解复位操作的顺序。这样,可以用优先级表示各线卡的重要程度,对于重要程度高的异常线卡,优先对其电源管理芯片进行复位和下电、上电和解复位操作,以完成异常线卡的热插拔,恢复正常运行,以恢复重要业务的正常服务。

在本申请一种可能的实施方式中,在对所述线卡的电源管理芯片进行复位和下电操作之前,所述方法还包括:启动中断服务,以中断当前所述主控板的其他服务及其他非异常线卡的运行,并存储中断点、所述主控板和其他所述非异常线卡的当前状态。

当检测到至少一个线卡异常时,主控板启动中断服务,停止当前所运行的其他服务以及与其他非异常线卡之间的通信,以保护其他服务及其他非异常线卡不受异常线卡的影响。这样,能够避免对异常线卡进行热插拔操作影响其他服务及其他非异常线卡的运行,在处理完异常线卡的热插拔后,可以根据存储的中断点和主控板的当前状态,恢复其他服务及其他非异常线卡的继续运行。

在本申请一种可能的实施方式中,所述中断服务还包括:关闭中断使能;在完成一次热插拔操作后,重新开启中断使能。这样,能够防止框式设备产生的其他新的中断事件对本次线卡异常的中断事件造成影响。

在本申请一种可能的实施方式中,在对所述线卡的电源管理芯片进行复位和下电操作之前,将热插拔标志置位1,表示执行一次热插拔操作;在对所述线卡的电源管理芯片进行上电和解复位操作之后,将所述热插拔标志置位0,表示将热插拔标志位清零,完成一次热插拔操作。通过改变热插拔标志位,将热插拔标志置位1,显示当前启动中断服务所处理的事件为热插拔操作。在一次热插拔操作中,可以仅针对一块异常的线卡执行热插拔,这样,可以提高对线卡执行热插拔的准确性,便于记录每个线卡的热插拔操作。

在本申请一种可能的实施方式中,在对所述线卡的电源管理芯片进行复位和下电操作之前,可以控制所述线卡退出,即控制异常线卡退出,退出操作可以停止异常线卡当前处理的业务,并保存异常线卡进行热插拔前的处理的业务的相关信息。

在本申请一种可能的实施方式中,在完成对异常线卡的热插拔操作之后,可以获取该线卡的状态信息,线卡的状态信息包括在位状态和不在位状态,在位状态可以表示线卡已插入线卡槽位,不在位状态可以表示线卡未插入线卡槽位。

当线卡的状态信息为在位状态时,表示该线卡已插入线卡槽位,主控板对该线卡的电源管理芯片的上下电的作用生效,主控板可以对该线卡进行初始化配置,以使线卡可以正常工作;当状态信息为不在位状态时,表示该线卡未插入线卡槽位,主控板对该线卡的电源管理芯片的上下电的作用未生效,也就是说,本次热插拔的操作无法解决线卡异常的问题,主控板可以发送警报信号,通知维护人员到现场对线卡进行维修或者更换。

本实施例提供的上述方法,框式设备的主控板检测到线卡异常时,可以控制异常线卡的电源管理芯片进行上下电操作,通过对异常线卡的电源管理芯片进行复位和下电操作,模拟对异常线卡的拔出操作,再进行上电和解复位操作,模拟对异常线卡的插入操作,从而完成对异常线卡的热插拔操作,实现对异常线卡的重启,以解决异常问题。这样,通过主控板控制异常线卡的电源管理芯片的上下电,在软件层面上自动完成异常线卡的热插拔,线卡的热插拔无需维护人员到现场操作,针对线卡异常的情况能够远程及时处理,提高维护效率,有效降低维护成本。

在本申请的一示例性实施例中,以如何检测线卡异常为例进行详细说明,如图2所示,所述检测到线卡异常的步骤具体包括:

步骤201,向所述框式设备的每一线卡发送检测请求。

步骤202,如果未收到所述线卡的响应,则确定所述线卡异常。

在本申请一种可能的实施方式中,所述检测请求携带接收所述检测请求的线卡的槽位信息,以在未收到所述线卡的响应时,根据未响应线卡的槽位信息确定异常的线卡。所述检测请求携带有每一线卡的槽位信息,槽位信息可以确定插设于框式设备的每一线卡的槽位。如果线卡处于非异常状态,会对主控板发送的检测请求作出响应,且非异常线卡作出的响应携带的信息与预设的信息一致。非异常线卡作出的响应中可以包括该线卡的槽位信息,在确定未响应的线卡为异常线卡之后,可以基于响应的线卡的槽位信息确定所述异常线卡在框式设备上对应的槽位,从而主控板可以根据所述槽位对应的异常线卡执行对所述线卡的电源管理芯片进行复位、下电、上电和解复位的操作。

在本申请一种可能的实施方式中,对于异常线卡未响应检测请求的情况,可以是异常线卡未对主控板作出响应,也可以是异常线卡对主控板作出响应,但是响应携带的信息与预设的信息不一致。

在本申请一种可能的实施方式中,主控板以报文的形式发送检测请求,主控板向每一线卡发送检测报文,判断线卡是否反馈对应的回复报文。在本申请一种可能的实施方式中,可以是回复报文包括每一线卡的槽位信息,主控板可以根据已反馈的回复报文中的槽位信息,确定未反馈的线卡的槽位信息,以确定异常的线卡。也就是说,已反馈对应的回复报文的正常线卡的槽位信息,可以排除异常,剩下的未反馈与检测报文对应的回复报文,则可以确定对应的线卡为异常,这样,通过确定异常线卡的槽位信息,能够确定槽位对应的线卡,以针对确定的异常线卡的电源管理芯片进行上下电操作,提高热插拔操作的准确性。反馈与检测报文对应的回复报文,主控板可以根据接收到的回复报文中确定线卡为正常。如果线卡的当前状态为异常,则不会反馈与检测报文对应的回复报文,则可以确定对应的线卡为异常。当线卡的当前状态为异常时,可以是不反馈回复报文,也可以是反馈的回复报文与检测报文不对应。检测报文与回复报文所包括的信息,可以是预先设置好的指定信息。

在本申请一种可能的实施方式中,在对异常线卡的电源管理芯片进行复位和下电、上电和解复位操作,可以再次确定异常线卡所对应的槽位。可以根据对第一次检测所有线卡中是否存在异常线卡时所确定的异常线卡对应的槽位信息,再次检测确定线卡是否异常,以提高确定线卡异常的准确性。

在本实施例中,主控板通过发送检测请求是否得到线卡的响应的方式来检测线卡异常。主控板向框式设备的每一个线卡发送检测请求,如果线卡的当前状态为正常,在接收到检测请求后,会向主控板响应,如果线卡未响应,则确定线卡为异常线卡,从而提高检测异常线卡的准确性。

上述所示出的实施例是针对框式设备的每一个线卡同步发送检测报文,检测所有线卡中是否存在异常线卡,在本申请的另一示例性实施例中,可以是针对框式设备的每一个线卡逐一发送检测报文。在当前发送检测报文确定当前检测的线卡为异常时,启动中断服务,对该异常线卡的电源管理芯片进行上下电操作,以完成该异常线卡的热插拔操作,使得线卡恢复正常。完成一个线卡的恢复正常,再进行下一个线卡的检测。当然,如果当前检测的线卡为正常,则进行下一个线卡的检测。

在本申请一种可能的实施方式中,主控板可以定义一个全局结构体,用于存储线卡热插拔的相关信息,例如,该全局结构体包括以下信息:

typedefstruct{

inthotplug_state;

intslot;

intstate;

intvalib;

inthstat;

inthirq;

intpold[slot_max];

intpnew[slot_max];

intres[slot_max];

}

其中,hotplug_state可以表示热插拔状态;slot可以表示线卡的槽位号;hstat可以表示热插拔标志位;hirq可以表示热插拔中断;pold[slot_max]可以表示上一次线卡在位状态;pnew[slot_max]可以表示当前线卡的在位状态;res[slot_max]可以表示发生状态变化的槽位。

图3为本申请一示例性实施例所示出的一种框式设备线卡的热插拔方法的流程图,如图3所示,该框式设备线卡的热插拔方法包括以下步骤301至307:

步骤301,检测是否存在线卡异常,如果是,执行步骤302;如果否,继续执行步骤301。

步骤302,启动中断服务,关闭中断使能,将热插拔状态置位1。

步骤303,控制所述线卡退出。

步骤304,对所述线卡的电源管理芯片进行复位和下电操作。

步骤305,在设定时间段后对所述电源管理芯片进行上电和解复位操作。

步骤306,所述线卡的热插拔完成,将热插拔状态置位0。

步骤307,获取所述线卡的状态信息,判断所述状态信息是否为在位状态;如果是,执行步骤308;否则,执行步骤309。

步骤308,对所述线卡进行初始化配置。

步骤309,发送警报信号。

本实施例提供的上述方法,框式设备的主控板检测到线卡异常时,启动中断服务,以停止当前框式设备其他服务以及其他正常线卡的运行,避免异常线卡影响当前框式设备其他服务以及其他正常线卡,关闭中断使能,避免其他中断事件影响对当前异常线卡进行热插拔操作的处理;将热插拔状态置位1,主控板控制线卡的电源管理芯片进行上下电操作,具体先对电源管理芯片进行复位和下电,再对电源管理芯片进行上电和解复位,来完成线卡的热插拔操作,将热插拔状态置位0,完成该异常线卡的热插拔操作。在完成该线卡的热插拔操作后,获取该线卡的状态信息,如果该线卡的状态信息为在位状态,表示热插拔操作生效,实现异常线卡的重启,则对线卡进行初始化设置,使得线卡恢复正常运行;如果该线卡的状态信息为不在位状态,表示热插拔操作未生效,该线卡仍为异常,则发送警报信号,通知维护人员到现场进行维修或者更换。这样,通过主控板控制异常线卡的电源管理芯片的上下电操作,在软件层面上自动完成异常线卡的热插拔,使得线卡恢复正常,线卡的热插拔无需维护人员到现场操作,针对线卡异常的情况能够远程及时处理,提高维护效率,有效降低维护成本。如果对线卡的热插拔未生效,能够及时发送警报信号通知维护人员到现场进行维修或者更换,进一步提高维护效率。

本申请还提供了一种框式设备线卡的热插拔装置。图4为本申请一示例性实施例示出的一种框式设备线卡的热插拔装置的结构框图。如图4所示,所述装置40包括:

下电模块410,用于当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

上电模块420,用于对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

在本申请一示例性实施例中,所述装置还包括:

启动模块,用于在对所述线卡的电源管理芯片进行复位和下电操作之前,启动中断服务,以中断当前所述主控板的其他服务及其他非异常线卡的运行;

存储模块,用于存储中断点、所述主控板和其他所述正常线卡的当前状态。

在本申请一示例性实施例中,所述装置包括检测模块,用于检测线卡是否异常,所述检测模块包括:

发送子模块,用于向所述框式设备的每一线卡发送检测请求;

确定子模块,用于如果未收到所述线卡的响应,则确定所述线卡异常。

在本申请一示例性实施例中,所述检测请求携带接收所述检测请求的线卡的槽位信息,所述确定子模块还用于在未收到所述线卡的响应时,根据未响应线卡的槽位信息确定异常的线卡。

在本申请一示例性实施例中,所述装置还包括:

确定模块,用于当检测到异常的线卡不止一个时,根据所述线卡的优先级确定对所述线卡的电源管理芯片进行上下电操作的顺序。

在本申请一示例性实施例中,所述装置还包括:

获取模块,用于在对所述电源管理芯片进行上电和解复位操作的步骤之后,获取所述线卡的状态信息;

发送模块,用于当所述状态信息为不在位状态时,发送警报信号。

在本申请一示例性实施例中,所述装置还包括:

配置模块,用于当所述状态信息为在位状态时,对所述线卡进行初始化配置。

上述装置中各个模块的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。

对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。

本申请还提供了一种主控板,图5为本申请一示例性实施例示出的一种主控板的结构框图。如图5所示,所述主控板50包括:

处理器;

存储器;用于存储所述处理器可执行的计算机程序;

其中,所述处理器执行所述计算机程序实现以下步骤:

当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

本申请还提供了一种框式设备,图6为本申请一示例性实施例示出的一种框式设备的结构框图。如图6所示,所述框式设备60包括主控板610和至少一块线卡620,所述主控板610与所述线卡620通信连接,所述主控板610用于实现以下步骤:

当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现以下步骤:

当检测到线卡异常时,对所述线卡的电源管理芯片进行复位和下电操作;

对所述电源管理芯片进行上电和解复位操作,以完成所述线卡的热插拔。

本申请实施例可采用在一个或多个其中包含有程序代码的可读介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。计算机可用可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的可读介质的例子包括但不限于:相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。

上述对本申请特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。

本领域技术人员在考虑说明书及实践这里申请的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未申请的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本申请记载的范围。

以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1