重启机箱管理系统的方法、装置、可读介质及存储控制器与流程

文档序号:12946706阅读:145来源:国知局
重启机箱管理系统的方法、装置、可读介质及存储控制器与流程

本发明涉及计算机技术领域,特别涉及一种重启机箱管理系统的方法、装置、可读介质及存储控制器。



背景技术:

在机箱管理系统中,风扇监控模块是一个不可或缺的模块,如果风扇监控模块不能正常运行,会导致机箱内的风扇失去监控,可能影响到机箱的散热效果,最终影响箱管理系统对应的机箱中各个节点的正常运行。

一般情况下,如果风扇监控模块对应的风扇转动正常,则确定风扇模块正常运行。但是,当机箱管理系统发生内存越界时,也可能引发风扇模块运行异常,机箱管理系统发生内存越界虽然会破坏风扇监控模块对风扇的监控,但不会影响风扇的正常转动。目前,为了避免出现上述问题,会定时重启机箱管理系统。

上述技术方案中,无论机箱管理系统是否发生内存越界,都需要定时重启机箱管理系统,导致机箱管理系统频繁启动。



技术实现要素:

本发明实施例提供了一种重启机箱管理系统的方法、装置、可读介质及存储控制器,不需要频繁启动机箱管理系统。

第一方面,本发明提供了一种重启机箱管理系统的方法,包括:

在机箱管理系统的风扇监控模块运行异常时,获取所述机箱管理系统对应的机箱中各个节点cpu(centralprocessingunit,中央处理器)在设定时间段内分别对应的温度变化值;

从至少一个所述温度变化值中,确定出最大温度变化值;

在确定的所述最大温度变化值不大于预设温度变化阈值时,确定所述机箱管理系统发生内存越界;

重启所述机箱管理系统。

优选地,在所述获取所述机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值之前,进一步包括:

预先在所述风扇监控模块中设置监控函数;

接收所述监控函数发送的监控参数;

在所述监控参数为设定参数时,确定所述风扇监控模块运行异常。

优选地,在所述重启所述机箱管理系统之前,进一步包括:

在确定是所述机箱管理系统发生内存越界时,进行内存越界报警,以提示用户输入重启指令;

在接收到用户输入的所述重启指令时,执行所述重启所述机箱管理系统。

优选地,在所述进行内存越界报警之后,进一步包括:

记录所述内存越界报警的报警时长;

在所述报警时长达到设定的重启时长时,接收所述监控函数在当前时间点发送的当前监控参数;

在所述当前监控参数为所述设定参数时,执行所述重启所述机箱管理系统。

第二方面,本发明实施例提供一种重启机箱管理系统的装置,包括:获取模块、选择模块、判断模块和重启模块;

所述获取模块,用于在机箱管理系统的风扇监控模块运行异常时,获取所述机箱管理系统对应的机箱中各个节点处cpu在设定时间段内分别对应的温度变化值;

所述选择模块,用于从所述获取模块获取的至少一个所述温度变化值中,确定出最大温度变化值;

所述判断模块,用于在所述选择模块确定的所述最大温度变化值不大于预设温度变化阈值时,确定是所述机箱管理系统发生内存越界;

所述重启模块,用于重启所述机箱管理系统。

优选地,进一步包括:设置模块、第一接收模块和参数判断模块;

所述设置模块,用于预先在所述风扇监控模块中设置监控函数;

所述第一接收模块,用于接收所述设置模块设置的所述监控函数发送的监控参数;

所述参数判断模块,用于在所述监控参数为设定参数时,确定所述风扇监控模块运行异常。

优选地,进一步包括:报警模块;

所述报警模块,用于在确定是所述机箱管理系统发生内存越界时,进行内存越界报警,以提示用户输入重启指令;

所述重启模块,用于在接收到用户输入的所述重启指令时,执行所述重启所述机箱管理系统。

优选地,进一步包括:记录模块和第二接收模块;

所述记录模块,用于记录所述内存越界报警的报警时长;

所述第二接收模块,用于在所述报警时长达到设定的重启时长时,接收所述监控函数在当前时间点发送的当前监控参数;

所述重启模块,用于在所述当前监控参数为所述设定参数时,执行所述重启所述机箱管理系统。

第三方面,本发明实施例提供了一种可读介质,

包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行第一方面中任一项所述的方法。

第四方面,本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;

所述处理器和所述存储器通过所述总线连接;

所述存储器,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行第一方面中任一项所述的方法。

本发明实施例提供了一种重启机箱管理系统的方法、装置、可读介质及存储控制器,当风扇监控模块运行异常时,首先获取机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值,再从上述温度变化值中选取出最大温度变化值。机箱管理系统发生内存越界时,风扇监控模块不能监控风扇,但风扇是不停止转动的,此时机箱散热正常。因此,如果机箱中各个节点cpu的温度变化值不会超过预设温度变化阈值,说明机箱管理系统发生内存越界;反之,则说明风扇不能正常转动。在确定机箱管理系统发生内存越界之后,重启机箱管理系统。由此可见,本发明实施例提供的技术方案,当且仅当在确定出机箱管理系统发生内存越界导致风扇监控模块发生异常运行时,才重启机箱管理系统,无需定时重启机箱管理系统,即无需频繁重启机箱管理系统。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一个实施例提供的一种重启机箱管理系统的方法流程图;

图2是本发明一个实施例提供的另一种重启机箱管理系统的方法流程图;

图3是本发明一个实施例提供的一种重启机箱管理系统的装置的结构示意图;

图4是本发明一个实施例提供的另一种重启机箱管理系统的装置的结构示意图;

图5是本发明一个实施例提供的又一种重启机箱管理系统的装置的结构示意图;

图6是本发明一个实施例提供的再一种重启机箱管理系统的装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提供了一种重启机箱管理系统的方法,包括以下步骤:

步骤101,在机箱管理系统的风扇监控模块运行异常时,获取所述机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值。

步骤102,从至少一个所述温度变化值中,确定出最大温度变化值。

步骤103,在确定的所述最大温度变化值不大于预设温度变化阈值时,确定所述机箱管理系统发生内存越界。

步骤104,重启所述机箱管理系统。

本发明实施例提供了一种重启机箱管理系统的方法,当风扇监控模块运行异常时,首先获取机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值,再从上述温度变化值中选取出最大温度变化值。机箱管理系统发生内存越界时,风扇监控模块不能监控风扇,但风扇是不停止转动的,此时机箱散热正常。因此,如果机箱中各个节点cpu的温度变化值不会超过预设温度变化阈值,说明机箱管理系统发生内存越界;反之,则说明风扇不能正常转动。在确定机箱管理系统发生内存越界之后,重启机箱管理系统。由此可见,本发明实施例提供的技术方案,当且仅当在确定出机箱管理系统发生内存越界导致风扇监控模块发生异常运行时,才重启机箱管理系统,无需定时重启机箱管理系统,即无需频繁重启机箱管理系统。

在本发明的一个实施例中,在所述获取所述机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值之前,进一步包括:

预先在所述风扇监控模块中设置监控函数;

接收所述监控函数发送的监控参数;

在所述监控参数为设定参数时,确定所述风扇监控模块运行异常。

在风扇监控模块中设置风扇监控函数之后,风扇监控函数会向外部发送一个与风扇转速相关的监控参数。当风扇监控模块受到机箱管理系统发生内存越界影响时,风扇监控函数返回的监控参数为设定参数。

例如,设定参数为1,那么当监控参数等于1时,说明机箱管理系统发生内存越界,并引发风扇监控模运行异常。

当机箱管理系统发生内存越界时,具体可以通过如下两种方式实现重启机箱管理系统,具体的:

方式1:在本发明的一个实施例中,在所述重启所述机箱管理系统之前,进一步包括:

在确定是所述机箱管理系统发生内存越界时,进行内存越界报警,以提示用户输入重启指令;

在接收到用户输入的所述重启指令时,执行所述重启所述机箱管理系统。

方式2:在本发明的一个实施例中,在所述进行内存越界报警之后,进一步包括:

记录所述内存越界报警的报警时长;

在所述报警时长达到设定的重启时长时,接收所述监控函数在当前时间点发送的当前监控参数;

在所述当前监控参数为所述设定参数时,执行所述重启所述机箱管理系统。

由于机箱管理系统出现内存越界不影响风扇的正常转动,因此机箱管理系统出现内存越界不会马上影响机箱的散热,不需要立刻进行重启。所以可以通过预先设定重启时长,使得用户在机箱管理系统重启之前,有足够的时间进行数据备份以防止数据丢失以及处理需要立刻完成的工作。

为了更好地说明本发明实施例,如图2所示,本发明实施例提供了另一种重启机箱管理系统的方法,包括以下步骤:

步骤201,预先在风扇监控模块设置监控函数。

在本发明实施例中,将风扇监控模块中设置监控函数,该监控函数可以向外部发送与风扇转速相关的监控参数。

步骤202,接收监控函数发送的监控参数。

在本发明实施例中,监控函数每监控一次风扇就会返回一个监控参数。

步骤203,判断监控参数是否为设定参数,如果是,执行步骤202;否则,执行步骤204。

在本发明实施例中,设定参数为0,由于监控参数与风扇转速相关,那么当监控参数为0时,说明风扇监控模不获取风扇转速,从而证明风扇监控模无法监控风扇。

步骤204,确定风扇监控模块运行异常,并获取机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值。

在本发明实施例中,获取各个节点cpu在1分钟内的温度变化值。例如,各节点的1分钟内的温度变化值分别为1℃、1.5℃和2℃。

步骤205,从至少一个温度变化值中,确定出最大温度变化值。

以步骤204中的,各节点的温度变化值为例,最大温度变化值为2℃。

步骤206,判断最大温度变化值是否不大于预设温度变化阈值,如果是,执行步骤207;否则,执行步骤202。

在本发明实施例中,温度变化阈值要根据每一个机箱管理系统对应的机箱的散热能力决定。散热能力越强,温度变化阈值越大。选择最大值作比较是为了快速确定机箱管理系统是否发生内存越界,如果最大温度变化值小于预设温度变化阈值,那么说明各节点的温度变化值都小于预设温度变化阈值,而不需要依次比较各节点的温度变化值与预设温度变化阈值的大小。

以步骤204中的各节点的温度变化值为例,最大温度变化值为2℃。如果预设温度变化阈值为2℃,那么说明各节点的温度变化值都小于2℃,因此风扇的转动是正常的;如果预设温度变化阈值为1.5℃,说明风扇出现故障。

步骤207,确定机箱管理系统发生内存越界,并进行内存越界报警,以提示用户输入重启指令。

在本发明实施例中,通过发送邮件、发送陷阱指令、写日志和发光二极管发光中的至少一种方法来发出警报。通过多方式提示用户重启系统,保证用户能够及时处理机箱管理系统出现的内存越界问题。

步骤208,判断是否接收到用户输入的重启指令,如果是,执行步骤212;否则,执行步骤209。

在本发明实施例中,用户还可以找到引发机箱管理系统出现内存越界的进程,只需要重启该进程就可以消除内存越界。

步骤209,记录内存越界报警的报警时长。

在本发明实施例中,以发出报警的时刻作为记录报警时长的起始时刻。

步骤210,在内存越界报警时长达到设定的重启时长时,接收监控函数在当前时间点发送的当前监控参数。

在本发明实施例中,重启时长为1小时。在不影响机箱中各节点正常运行的前提下,重启时长可以根据实际情况进行调整。例如,运行的程序不是很多的时候,机箱产生热量小,此时重启时长可以大于1小时;如果运行的程序多,机箱产生热量大,此时要尽快的重启机箱管理系统,避免机箱温度过高给机箱中各节点的正常运行带来负面影响。

步骤211,判断当前监控参数是否为设定参数,如果是,执行步骤212;否则,执行步骤202。

步骤212,重启机箱管理系统。

本发明实施例提供的技术方案能够确定出机箱管理系统发生内存越界是否影响到风扇监控模块正常运行,并提示用户进行重启,使用户只有在机箱管理系统发生内存越界影响到风扇监控模块的情况下,才重启机箱管理系统,而不是每经过已经过一段时间,就自动重启机箱管理系统。

如图3所示,本发明实施例提供一种重启机箱管理系统的装置,包括:获取模块301、选择模块302、判断模块303和重启模块304;

获取模块301,用于在机箱管理系统的风扇监控模块运行异常时,获取所述机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值;

选择模块302,用于从获取模块301获取的至少一个所述温度变化值中,确定出最大温度变化值;

判断模块303,用于在选择模块302确定的所述最大温度变化值不大于预设温度变化阈值时,确定是所述机箱管理系统发生内存越界;

重启模块304,用于重启所述机箱管理系统。

如图4所示,本发明实施例提供另一种重启机箱管理系统的装置,进一步包括:设置模块401、第一接收模块402和参数判断模块403;

设置模块401,用于预先在所述风扇监控模块中设置监控函数;

第一接收模块402,用于接收设置模块设401的所述监控函数发送的监控参数;

参数判断模块403,用于在所述监控参数为设定参数时,确定所述风扇监控模块运行异常。

如图5所示,本发明实施例提供又一种重启机箱管理系统的装置,进一步包括:报警模块501;

报警模块501,用于在确定是所述机箱管理系统发生内存越界时,进行内存越界报警,以提示用户输入重启指令;

重启模块304,用于在接收到用户输入的所述重启指令时,执行所述重启所述机箱管理系统。

如图6所示,本发明实施例提供再一种重启机箱管理系统的装置,进一步包括:记录模块601和第二接收模块602;

记录模块601,用于记录所述内存越界报警的报警时长;

第二接收模块602,用于在所述报警时长达到设定的重启时长时,接收所述监控函数在当前时间点发送的当前监控参数;

重启模块304,用于在所述当前监控参数为所述设定参数时,执行所述重启所述机箱管理系统。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本发明实施例提供了一种可读介质,包括执行指令,当存储控制器的处理器执行所述执行指令时,所述存储控制器执行本发明任意一个实施例中提供的重启机箱管理系统的方法。

本发明实施例提供了一种存储控制器,包括:处理器、存储器和总线;

所述存储器用于存储执行指令,所述处理器与所述存储器通过所述总线连接,当所述存储控制器运行时,所述处理器执行所述存储器存储的所述执行指令,以使所述存储控制器执行本发明任意一个实施例中提供的重启机箱管理系统的方法。

综上所述,本发明各个实施例至少具有如下有益效果:

1、本发明一个实施例中,当风扇监控模块运行异常时,首先获取机箱管理系统对应的机箱中各个节点cpu在设定时间段内分别对应的温度变化值,再从上述温度变化值中选取出最大温度变化值。机箱管理系统发生内存越界时,风扇监控模块不能监控风扇,但风扇是不停止转动的,此时机箱散热正常。因此,如果机箱中各个节点cpu的温度变化值不会超过预设温度变化阈值,说明机箱管理系统发生内存越界;反之,则说明风扇不能正常转动。在确定机箱管理系统发生内存越界之后,重启机箱管理系统。由此可见,本发明实施例提供的技术方案,当且仅当在确定出机箱管理系统发生内存越界导致风扇监控模块发生异常运行时,才重启机箱管理系统,无需定时重启机箱管理系统,即无需频繁重启机箱管理系统。

2、本发明一个实施例中,通过设置监控函数,使得风扇监控模块中的风扇监控函数可以向外部发送监控参数,从而能够确定风扇监控模块是否运行正常。

3、本发明一个实施例中,通过设定重启时长,可以让用户在重启机箱管理系统前有足够的时间来处理必须完成的工作,以及对关键数据进行备份,避免因为重启而导致数据丢失。

4、本发明一个实施例中,当机箱管理系统出现内存越界问题时,向用户报警,使得用户能够及时重启机箱管理系统以解决内存越界问题。

需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1