服务器系统与节点替换方法_3

文档序号:8339413阅读:来源:国知局
re package data)至少其中之一。在步骤S208中,处理模块16会关闭(power off)节点10的电源,以执行节点替换程序。
[0042]请参照图2B,图2B为根据本发明另一实施例的服务器系统的节点替换方法的步骤流程图。如图2B所示,在对节点安装操作系统、软件包数据与固件包数据至少其中之一的步骤(即步骤S206)之后,检测模块12或是另一组监控模块(图未示)可以持续地检测节点中的硬件的状况,以使处理模块16判断硬件是否发生错误(即步骤S210)。若检测模块12或是另一组监控模块检测出节点10当中的硬件产生不可修复的错误(un-correcterror),则执行步骤S212 ;若检测模块12或是另一组监控模块检测出节点10当中的硬件产生可修复的错误(correct error)次数达到预设的门滥值(default threshold value),则执行步骤S214。
[0043]在步骤S212中,由于节点10当中的硬件产生不可修复的错误,亦即此时节点10已经损坏而无法正常运作,则处理模块16会关闭节点10的电源,以执行节点替换程序。在步骤S214中,由于节点10当中的硬件产生可修复的错误次数达到预设的门槛值(例如,一小时内产生10次以上的可修复的错误次数),亦即此时节点10快要损坏而即将无法正常运作,则处理模块16会对节点10进行正常关机(shutdown)程序,并据以执行节点替换程序。
[0044]请参照图3,图3为根据本发明一实施例的节点替换程序的步骤流程图。如图3所示,在步骤S300中,处理模块16会将节点10设定为初始模式。于本实施例中,初始模式为动态主机配置协议(dynamic host configurat1n protocol, DHCP)模式。在实际的操作中,当处理模块16判断出节点10能拔离服务器系统I时,会自动地将节点10的基板管理控制器设定回DHCP模式,以取得新的一组基板管理控制器的互联网协议位址(internetprotocol address, IP address)。
[0045]在步骤S302中,提示模块14会产生一组第二指示信号,此第二指示信号用以指示节点10能拔离服务器系统I。在步骤S304中,检测模块12会检测节点10是否拔离服务器系统I。若检测模块12检测出节点10仍未拔离服务器系统1,则继续执行步骤S304 ;若检测模块12检测出节点10拔离服务器系统1,则执行步骤S306。在步骤S306中,检测模块12会接续检测节点10或另一组节点是否插入服务器系统I。若检测模块12检测出有一组节点(节点10或另一组节点)插入服务器系统1,则执行步骤S308 ;若检测模块12检测出仍未有节点插入服务器系统1,则继续执行步骤S306。在步骤S308中,提示模块14会产生第一指示信号,并接续执行步骤S202。
[0046]请参照图4,图4为根据图3中的步骤S304的详细步骤流程图。如图4所示,在提示模块14产生第二指示信号(即步骤S302)之后,计时模块18会设定一组第一预设时间(例如一分钟)并且开始计时。在步骤S402中,会判断节点10是否已拔离服务器系统I。若判断出节点10于第一预设时间内仍未拔离服务器系统1,则执行步骤S404 ;若判断出节点10拔离服务器系统I且已经过第一预设时间,则执行步骤S306。在步骤S404中,计时模块18会重置第一预设时间并重新计时,并接续步骤S402的判断程序。
[0047]此外,步骤S402中所执行的判断节点10是否已拔离服务器系统I的步骤可以通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过Ping节点10上BMC的NIC来检测节点10是否拔离。藉此,通过图4的判断机制可以避免因网络不稳或接触不良所造成的误判节点10已拔离服务器系统I的情况,换句话说,图4的判断机制为一种de-bounce机制。
[0048]请参照图5,图5为根据图3中的步骤S306的详细步骤流程图。如图5所示,于检测模块12检测节点10是否拔离服务器系统I的步骤(即步骤S304)之后,计时模块18会设定一组第一预设时间与一组第二预设时间并开始计时,其中第二预设时间接续于第一预设时间之后。举例来说,第一预设时间为计时模块18开始计时的第一分钟(即第O?60秒),而第二预设时间则为计时模块18开始计时的第二分钟(即第61?120秒),需知,第一预设时间与第二预设时间是可不同的。
[0049]在步骤S502中,会判断节点10是否插入服务器系统I。若判断出节点10仍未插入服务器系统1,则执行步骤S504 ;若判断出节点10插入服务器系统1,则执行步骤S506。在步骤S504中,计时模块18会重置第一预设时间并重新计时,并接续步骤S502的判断程序,所以步骤S502及步骤S504的判断机制为一种de-bounce机制。此外,步骤S502所执行的判断程序可以系通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过Ping节点10上BMC的NIC来检测节点10是否插入。
[0050]在步骤S506中,若判断出节点10插入服务器系统I且已经过第一预设时间,则接着判断节点10于第二预设时间中是否仍持续插入服务器系统I。若判断节点10于第二预设时间中仍持续插入服务器系统1,表示节点10与所插入服务器系统I中的位置皆正确无误,则执行步骤S308之后的步骤;若判断节点10于第二预设时间中拔离服务器系统1,表示节点10与所插入服务器系统I中的位置可能有错误或插错节点10而被拔离,则执行步骤S300之后的步骤,以将正确的节点10插入至服务器系统I中的正确位置,所以步骤S506的判断机制为一种人为防呆(fool-proofing)机制。
[0051]此外,步骤S506中所执行的判断程序可以通过检测模块12、处理模块16或节点10的网络界面控制器来达成,本发明在此不加以限制,例如可通过ping节点10上BMC的NIC来检测节点10是否持续插入。藉此,通过图5的判断机制除了可以避免因网络不稳或接触不良所造成的误判节点10已插入服务器系统I的情况之外,还能让使用者有机会当误差节点时,有机会将此节点拔除并插入正确的节点,换句话说,图5的判断机制为一种de-bounce机制与防呆(fool-proofing)机制的组合。
[0052]综合以上所述,本发明实施例提供的服务器系统与节点替换方法,其通过检测节点的识别码与节点中的硬件的硬件配置信息,来判断节点或节点中的硬件是否已被替换或新的节点是否被加入,进而选择性地执行节点替换程序或对此节点安装操作系统、软件包数据或固件包数据,甚至在节点或硬件没被替换下,也可强制重新对此节点安装操作系统、软件包数据或固件包数据。此外,本发明的服务器系统与节点替换方法还可于节点安装操作系统、软件包数据或固件包数据后,持续地检测节点中的硬件状况,并于节点中的硬件产生错误时通过提示信号来让使用者得知可以进行节点替换程序。藉此,本发明的服务器系统与节点替换方法可以自动地执行节点是否需要换置的处理程序,使用者仅需依据提示信号来将节点插入或拔离服务器系统,而不需要去做其他的检测程序,十分具有实用性。
[0053]当然,本发明还可有其它多种实施例,在不背离本发明精神及其实质的情况下,熟悉本领域的技术人员当可根据本发明作出各种相应的改变和变形,但这些相应的改变和变形都应属于本发明所附的权
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1