刀片服务器的管理方法和系统的制作方法

文档序号:9631753阅读:545来源:国知局
刀片服务器的管理方法和系统的制作方法
【技术领域】
[0001] 本发明涉及计算机系统领域,具体来说,涉及一种刀片服务器的管理方法和系统。
【背景技术】
[0002] 现有技术中,在对刀片服务器进行下电或复位操作时,在按下刀片的关机按钮关 闭刀片时,电源控制单元会按照芯片的下电时序,依次将刀片上芯片的电源切断;当按下刀 片的复位按钮复位刀片时,复位控制单元会按照芯片的复位时序,依次将芯片复位。但是, 上述管理方式如果执行下电或者复位操作的时候,CPU正在访问存储介质,就可能会导致 文件系统的数据损坏,如果关键数据被破坏,比如文件的索引表,可能导致系统无法正常启 动。对于FLASH介质,可能会导致坏块的增多,更会降低存储介质的使用周期。
[0003] 针对相关技术中的上述问题,目前尚未提出有效的解决方案。

【发明内容】

[0004] 针对相关技术中的上述问题,本发明提出一种刀片服务器的管理方法和系统,能 够保护刀片服务器上存储介质的数据,防止文件系统被损坏,保证存储介质数据的安全性, 提尚系统可靠性。
[0005] 本发明的技术方案是这样实现的:
[0006] 根据本发明的一个方面,提供了一种刀片服务器的管理方法。
[0007] 该管理方法包括:
[0008] 基板管理控制器(BMC)在检测到对刀片服务器的关机或复位指令的情况下,修改 关机或复位的控制信息并发送至刀片服务器;
[0009] 刀片服务器根据关机或复位的控制信息执行与关机或复位操作相关的数据处 理;
[0010] 在完成与关机或复位操作相关的数据处理后,刀片服务器将处理结果发送至 BMC;
[0011] BMC基于处理结果对刀片服务器进行关机或复位操作。
[0012] 其中,BMC在检测对刀片服务器的关机或复位指令时,BMC可通过监测刀片服务器 的关机按钮或复位按钮的状态来检测对刀片服务器的关机或复位指令。
[0013] 此外,BMC在修改关机或复位的控制信息并发送至刀片服务器时,BMC可通过将电 源控制寄存器的状态修改为下电或复位;并由刀片服务器检测电源控制寄存器的状态。
[0014] 其中,刀片服务器在根据关机或复位的控制信息执行与关机或复位操作相关的数 据处理时,刀片服务器在检测到电源控制寄存器的状态为下电或复位的情况下,可通过执 行下电或复位的流程并卸载存储设备的方式来执行相关的数据处理。
[0015] 另外,刀片服务器在将处理结果发送至BMC时,刀片服务器可将电源状态控制器 的状态修改为下电或复位;并由BMC检测电源状态控制器的状态。
[0016] 其中,BMC在基于处理结果对刀片服务器进行关机或复位操作时,BMC在检测到电 源状态寄存器的状态为下电或复位的情况下,BMC可发送下电或重启信号至刀片服务器; 并由刀片服务器根据下电或重启信号进行关机或复位操作。
[0017] 另外,BMC在将电源控制寄存器的状态修改为下电或复位时,BMC还可记录第一当 前时间。
[0018] 此外,BMC在基于处理结果对刀片服务器进行关机或复位操作时,在BMC检测到电 源状态控制器的状态并非下电或复位的情况下,BMC可检测第二当前时间;并在第二当前 时间和第一当前时间的差值大于预定时间差阈值的情况下,BMC发送下电或重启信号至刀 片服务器;并由刀片服务器根据下电或重启信号进行关机或复位操作。
[0019] 另外,该管理方法进一步包括:
[0020] 在第二当前时间和第一当前时间的差值不大于预定时间差阈值的情况下,BMC继 续检测电源状态寄存器的状态。
[0021] 根据本发明的另一方面,提供了一种刀片服务器的管理系统。
[0022] 该管理系统包括:
[0023] 修改模块,用于在检测到对刀片服务器的关机或复位指令的情况下,修改关机或 复位的控制信息并发送至刀片服务器;
[0024] 执行模块,用于根据关机或复位的控制信息执行与关机或复位操作相关的数据处 理;
[0025] 发送模块,用于在完成与关机或复位操作相关的数据处理后,处理结果发送;
[0026] 操作模块,用于基于处理结果对刀片服务器进行关机或复位操作。
[0027] 本发明通过在对刀片服务器进行下电或者复位操作时,先让刀片服务器的完成与 关机或复位操作相关的数据处理,再对刀片服务器进行关机或复位操作,从而能够保护刀 片服务器上存储介质的数据,防止文件系统被损坏,保证存储介质数据的安全性,提高系统 可靠性。
【附图说明】
[0028] 为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所 需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施 例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获 得其他的附图。
[0029] 图1是根据本发明实施例的刀片服务器的管理方法的流程图;
[0030]图2是根据本发明实施例的刀片服务器的管理系统的拓扑结构图;
[0031] 图3是根据本发明实施例的刀片上电的BMC的处理流程;
[0032] 图4是根据本发明实施例的刀片上电的CPU的处理流程;
[0033] 图5是根据本发明实施例的刀片下电的BMC的处理流程;
[0034] 图6是根据本发明实施例的刀片下电的CPU的处理流程;
[0035] 图7是根据本发明实施例的刀片复位的BMC的处理流程;
[0036] 图8是根据本发明实施例的刀片复位的CPU的处理流程;
[0037] 图9是根据本发明实施例的刀片服务器的管理系统的框图。
【具体实施方式】
[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完 整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于 本发明中的实施例,本领域普通技术人员所获得的所有其他实施例,都属于本发明保护的 范围。
[0039] 根据本发明的实施例,提供了一种刀片服务器的管理方法。
[0040] 如图1所示,根据本发明实施例的管理方法包括:
[0041] 步骤S101,BMC在检测到对刀片服务器的关机或复位指令的情况下,修改关机或 复位的控制信息并发送至刀片服务器;
[0042] 步骤S103,刀片服务器根据关机或复位的控制信息执行与关机或复位操作相关的 数据处理;
[0043] 步骤S105,在完成与关机或复位操作相关的数据处理后,刀片服务器将处理结果 发送至BMC;
[0044] 步骤S107,BMC基于处理结果对刀片服务器进行关机或复位操作。
[0045] 从上述实施例可以看出,本发明利用BMC,实时检测微动开关和硬复位按钮的状 态,当板卡需要下电或者硬复位操作时,BMC会先检测到该动作,然后,将下电或者硬复位动 作通知给CPU内核,CPU执行正常的下电流程,并将下电结果反馈给BMC,BMC检测到CPU已 经下电完成后,再触发电源控制单元或者复位控制单元执行刀片的下电或者复位操作,这 样就能够对存储介质的数据以及介质本身进行可靠的保护,提供了系统的可靠性。
[0046] 其中,在一个实施例中,BMC在检测对刀片服务器的关机或复位指令时,BMC可通 过监测刀片服务器的关机按钮或复位按钮的状态来检测对刀片服务器的关机或复位指令。
[0047] 此外,在一个实施例中,BMC在修改关机或复位的控制信息并发送至刀片服务器 时,BMC可通过将电源控制寄存器的状态修改为下电或复位;并由刀片服务器检测电源控 制寄存器的状态。
[0048] 其中,在一个实施例中,刀片服务器在根据关机或复位的控制信息执行与关机或 复位操作相关的数据处理时,刀片服务器在检测到电源控制寄存器的状态为下电或复位的 情况下,可通过执行下电或复位的流程并卸载存储设备的方式来执行相关的数据处理。
[0049] 另外,在一个实施例中,刀片服务器在将处理结果发送至BMC时,刀片服务器可将 电源状态控制器的状态修改为下电或复位;并由BMC检测电源状态控制器的状态。
[0050] 其中,在一个实施例中,BMC在基于处理结果对刀片服务器进行关机或复位操作 时,BMC在检测到电源状态寄存器的状态为下电或复位的情况下,BMC可发送下电或重启信 号至刀片服务器;并由刀片服务器根据下电或重启信号进行关机或复位操作。
[0051] 另外,在一个实施例中,BMC在将电源控制寄存器的状态修改为下电或复位时,BMC 还可记录第一当前时间。
[0052] 此外,在一个实施例中,BMC在基于处理结果对刀片服务器进行关机或复位操作 时,在BMC检测到电源状态控制器的状态并非下电或复位的情况下,BMC可检测第二当前时 间;并在第二当前时间和第一当前时间的差值大于预定时间差阈值的情况下,BMC发送下 电或重启信号至刀片服务器;并由刀片服务器根据下电或重启信号进行关机或复位操作。
[0053] 另外,在一个实施例中,根据本发明实施例的管理方法进一步包括:
[0054] 在第二当前时间和第一当前时间的差值不大于预定时间差阈值的情况下,BMC继 续检测电源状态寄存器的状态。
[0055] 在实现上述管理方法的过程中,本发明主要借助于如图2所示的拓扑结构,从 图2可以看出,刀片的电源键和复位键连到BMC上;BMC通过电源信号线和复位信号线向 SPARTAN(-种现场可编程门阵列(FPGA)芯片)发送刀片上下电和复位的指令;而SPARTAN 作为电源控制单元和复位控制单元,可控制刀片上下电和复位的操作;而且,BMC、SPARTAN、 CPU三者之间通过I2C总线(包括时钟信号线(SCL)和数据线(SDA))相连,SPARTAN作为 I2C从设备,BMC和CPU作为I2C主设备。
[0056] 对于SPARTAN的控制流程来说,在本实施例中,SPARTAN提供两个寄存器供BMC 和CPU访问,分别为电源控制寄存器(P0WER_CTRL_REG)和电源状态寄存器(P0WER_STAT_ REG)。寄存器合法值包括P0WER_0FF、P0WER_0N、P0WER_REB00T,分别表示CPU下电、上电、 复位。SPARTAN上电后将这两个寄存器的状态均设置为P0WER_0FF。之后电源控制寄存 器(P0WER_CTRL_REG)作为控制信号由BMC更改,CPU读取;电源状态寄存器(P0WER_STAT_ REG)作为反馈信号由CPU更改,BMC读取。寄存器的状态如表一所示:
[0057]
[0059] 再看CPU控制流程,在一个实施例中,为了实现刀片下电或复位前的数据保护处 理,而无需用户态参与,在本发明的实施例中,在CPU内核中增加一个I2C设备驱动,该驱动 在linux内核启动
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1