服务器reboot测试方法、服务器、控制器和系统的制作方法

文档序号:10552794阅读:538来源:国知局
服务器reboot测试方法、服务器、控制器和系统的制作方法
【专利摘要】本发明提供了服务器reboot测试方法、服务器、控制器和系统,该方法包括:通过交换机,建立服务器和控制器相互通信;服务器接收控制器发送的开机请求,进行开机启动;判断是否存在Ispci?tmp文件,如果是,则读取设备信息,将设备信息写入Ispci?$count文件,并比较Ispci?tmp文件和Ispci?$count文件是否一致,否则,为服务器的设备信息,生成Ispci?tmp文件;当Ispci?tmp文件和Ispci?$count文件一致时,发送启动完成信息;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,实现了服务器稳定性测试的自动化。
【专利说明】
服务器reboot测试方法、服务器、控制器和系统
技术领域
[0001]本发明涉及服务器应用技术领域,特别涉及服务器reboot测试方法、服务器、控制器和系统。
【背景技术】
[0002]随着云计算服务的不断发展,对服务器的稳定性要求越来越高。目前服务器稳定性测试的一种重要方法为reboot测试。
[0003]现有服务器的reboot测试方式主要是,在各个服务器节点安装reboot脚本,通过人工的方式为各个服务器节点连通电源,手动开启各个服务器节点,reboot脚本运行,并检测开机过程是否正常,然后对服务器节点执行关机操作,并需要人工依次对各个服务器节点进行断开电源的操作,即现有的reboot测试方法只能通过人工参与的方式完成,而无法使服务器稳定性测试自动进行。

【发明内容】

[0004]本发明实施例提供了服务器reboot测试方法、服务器、控制器和系统,实现服务器稳定性测试的自动化。
[0005]服务器reboot测试方法,通过交换机,建立服务器和控制器之间相互通信;还包括:
[0006]当服务器接收到控制器发送的开机请求时,进行开机启动;
[0007]服务器判断本身是否存在Ispc1-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispc 1-$count文件,并比较Ispc1-tmp文件和I spc1-$count文件是否一致,否则,为服务器中的设备信息,生成Ispc1-tmp文件;
[0008]当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给控制器;
[0009]创建gpu.txt 文件和server.txt 文件;
[0010]接收控制器发送的关机请求,进行关机操作。
[0011 ] 优选地,所述通过交换机,建立服务器和控制器之间相互通信,包括:
[0012]服务器通过OS网络和BMC网络连接到交换机;
[0013]控制器通过OS网络连接到交换机。
[0014]优选地,上述方法进一步包括:在服务器中设置第一计数器count;
[0015]在所述开机启动之后,进一步包括:服务器判断本身是否存在count文件,如果是,则将所述第一计数器count+Ι,存储到所述count文件;否则,启动所述第一计数器count,将所述第一计数器count+Ι,生成count文件,并将所述第一计数器count写入服务器开机启动项。
[0016]优选地,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;
[0017]进一步包括:设置启动时序;
[0018]所述开机启动,包括:根据设置的启动时序,顺序启动所述资源服务器和server端。
[0019]服务器reboot测试方法,应用于控制器,在控制器中设置第二计数器count,并设置检测阈值;还包括:
[°02°] Ml、控制器初始化所述第二计数器count ;
[0021]M2、接收服务器发送的启动完成信息,判断所述第二计数器count的计数是否小于检测阈值,如果是,则检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则调用服务器的关机函数,控制服务器关机;
[0022]M3、向服务器发送开机请求,调用服务器的开机函数,控制服务器开机启动,并将第二计数器count+Ι,执行M2。
[0023]优选地,上述方法进一步包括:清除所述服务器中的操作系统日志。
[0024]优选地,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接;
[0025]所述控制服务器关机,包括:顺序控制所述server端关机和所述资源服务器关机;
[0026]所述控制服务器开机启动,包括:顺序控制所述资源服务器开机启动和所述server端开机启动。
[0027]应用于上述任一所述的服务器reboot测试方法的服务器,通过外设的交换机,与外设的控制器之间相互通信,包括:开关单元、第一判断单元、读取写入单元和生成单元,其中,
[0028]所述开关单元,用于当接收到外设的控制器发送的开机请求时,进行开机启动,并触发所述第一判断单元,当接收到外设的控制器发送的关机请求,进行关机操作;
[0029]所述第一判断单元,用于接收到所述开机单元的触发时,判断是否存在Ispc1-tmp文件,如果是,则触发所述读取写入单元;并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,否则,触发所述生成单元;
[0030]所述读取写入单元,用于读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给外设的控制器,并创建gpu.txt文件和server.txt文件;
[0031]所述生成单元,用于为各个设备信息,生成Ispc1-tmp文件。
[0032]优选地,上述服务器,通过OS网络和BMC网络连接到外设的交换机。
[0033]优选地,上述服务器,进一步包括:第二判断单元和第一计数器,其中,
[0034]所述第二判断单元,用于判断是否存在count文件,如果是,则触发所述第一计数器;否则,启动所述第一计数器,生成count文件,并将所述第一计数器写入服务器开机启动项;
[0035]所述第一计数器,用于统计所述开关单元的开机启动次数,当所述开关单元进行开机启动时,进行count+Ι,并将开机启动次数存储到所述count文件。
[0036]优选地,上述服务器,为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张re timer卡,通过该re timer卡及Mini SASHD线缆与所述资源服务器连接。
[0037]应用于上述任一所述的服务器reboot测试方法的控制器,包括:设置单元、第二计数器、检测单元和调用控制单元,其中,
[0038]所述设置单元,用于设置检测阈值;
[0039]所述检测单元,用于判断所述第二计数器的计数是否小于所述设置单元设置的检测阈值,如果是,则检测外设的服务器中是否存在gpu.txt文件和server.txt文件,如果是,则触发所述调用控制单元;
[0040]所述调用控制单元,用于在接收到所述检测单元的触发时,调用外设的服务器的关机函数,控制外设的服务器关机,向外设的服务器发送开机请求,调用外设的服务器的开机函数,控制外设的服务器开机启动,并将所述第二计数器的计数加I。
[0041]服务器reboot测试系统,包括:至少一个上述任意一种服务器、交换机和上述任意一种控制器,其中,
[0042]所述至少一个服务器和所述控制器分别与所述交换机连接。
[0043]本发明实施例提供了服务器reboot测试方法、服务器、控制器和系统,该方法,通过交换机,建立服务器和控制器之间相互通信;当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispc1-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,否则,为服务器中的设备信息,生成Ispc1-tmp文件;当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,通过该方法,通过服务器判断文件是否存在,并对比文件间的一致性,即可判断出服务器启动是否正常,另外,服务器的启动和关机均可在控制器的控制下,自动进行,而无需人工参与进来,实现了服务器稳定性测试的自动化。
【附图说明】
[0044]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0045]图1是本发明一个实施例提供的服务器reboot测试方法的流程图;
[0046]图2是本发明另一个实施例提供的服务器reboot测试方法的流程图;
[0047]图3是本发明又一个实施例提供的服务器reboot测试方法的流程图;
[0048]图4是本发明实施例提供的Pcie-Switch服务器的启动/关机时序不意图;
[0049]图5是本发明一个实施例提供的服务器的结构示意图;
[0050]图6是本发明一个实施例提供的控制器的结构示意图;
[0051]图7是本发明一个实施例提供的服务器reboot测试系统的结构示意图。
【具体实施方式】
[0052]为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0053]如图1所示,本发明实施例提供了一种服务器reboot测试方法,该方法可以包括以下步骤:
[0054]步骤101:通过交换机,建立服务器和控制器之间相互通信;
[0055]步骤102:当服务器接收到控制器发送的开机请求时,进行开机启动;
[0056]步骤103:服务器判断本身是否存在Ispc1-tmp文件,如果是,则执行步骤104 ;否贝1J,执行步骤105;
[0057]步骤104:读取服务器中的设备信息,将该设备信息写入Ispcilcount文件,并比较Ispc1-tmp文件和I spc1-$count文件是否一致,如果是,则执行步骤106,否则,执行步骤107;
[0058]步骤105:为服务器中的设备信息,生成Ispc1-tmp文件;
[0059]步骤106:发送启动完成信息给控制器,并创建gpu.txt文件和server.txt文件,并执行步骤108 ;
[0060]步骤107:提示错误信息,并结束当前流程;
[0061]步骤108:接收控制器发送的关机请求,进行关机操作。
[0062]通过交换机,建立服务器和控制器之间相互通信;当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在Ispc1-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,否则,为服务器中的设备信息,生成Ispc1-tmp文件;当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,通过该方法,通过服务器判断文件是否存在,并对比文件间的一致性,即可判断出服务器启动是否正常,另外,服务器的启动和关机均可在控制器的控制下,自动进行,而无需人工参与进来,实现了服务器稳定性测试的自动化。
[0063]在本发明一个实施例中,为了保证服务器与控制器间的通信,步骤101的【具体实施方式】:服务器通过OS网络和BMC网络连接到交换机;控制器通过OS网络连接到交换机。
[0064]在本发明一个实施例中,为了实现统计服务器启动次数,进一步包括:在服务器中设置第一计数器count;在步骤102之后,进一步包括:服务器判断本身是否存在count文件,如果是,则将第一计数器count+Ι,存储到count文件;否则,启动第一计数器count,将第一计数器count+Ι,生成count文件,并将第一计数器count写入服务器开机启动项,通过将计数器写入服务器开机启动项,保证了启动次数统计的准确性。
[0065]在本发明一个实施例中,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张re timer卡,通过该ret imer卡及MiniSASHD线缆与所述资源服务器连接;进一步包括:设置启动时序;所述开机启动,包括:根据设置的启动时序,顺序启动所述资源服务器和server端,保证了 Pcie-Switch服务器自动的正常启动。
[0066]如图2所示,本发明实施例提供服务器reboot测试方法,应用于控制器,可以包括如下步骤:
[0067]步骤201:在控制器中设置第二计数器count,并设置检测阈值;
[0068]步骤202:控制器初始化第二计数器count ;
[0069]步骤203:接收服务器发送的启动完成信息,判断第二计数器count的计数是否小于检测阈值,如果是,则执行步骤204;否则,执行步骤205;
[°07°] 步骤204:检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则执行步骤206 ;否则,执行步骤207 ;
[0071]步骤205:关闭服务器,并退出控制服务器,并结束当前流程;
[0072]步骤206:调用服务器的关机函数,控制服务器关机,并执行步骤208;
[0073]步骤207:延迟一定时间,并返回执行步骤203;
[0074]步骤208:向服务器发送开机请求,调用服务器的开机函数,控制服务器开机启动,并将第二计数器count+Ι,执行步骤203。
[0075]在本发明一个实施例中,为了避免服务器中已经执行的操作对服务器启动产生影响,该方法进一步包括:清除服务器中的操作系统日志。
[0076]在本发明一个实施例中,所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张re timer卡,通过该ret imer卡及MiniSASHD线缆与所述资源服务器连接;所述控制服务器关机,包括:顺序控制所述server端关机和所述资源服务器关机;所述控制服务器开机启动,包括:顺序控制所述资源服务器开机启动和所述server端开机启动,保证了 Pcie-Switch服务器的正常启动,实现了对Pcie-Switch服务器的稳定性测试的自动化。
[0077]为使本发明的目的、技术方案和优点更加清楚,结合服务器和控制器之间的交互过程,作进一步地详细描述。
[0078]如图3所示,本发明又一实施例提供了服务器reboot测试方法,该方法可以包括以下步骤:
[0079]步骤301:通过交换机,建立服务器和控制器之间相互通信;
[0080]在该步骤中,服务器通过OS网络和BMC网络连接到交换机;控制器通过OS网络连接到交换机;当服务器为Pcie-Switch服务器时,该Pcie-Switch服务器包括:资源服务器和server端,其中,资源服务器可包含多个GPU,server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与资源服务器连接;资源服务器和server端通过OS网络和BMC网络连接到交换机。
[0081 ] 步骤302:在服务器中设置第一计数器count,在控制器中设置第二计数器count,并设置检测阈值;
[0082]在该步骤中,当服务器为Pcie-Switch服务器时,可将第一计数器count设置在资源服务器。
[0083]步骤303:控制器初始化第二计数器count,清除服务器中的操作系统日志;
[0084]该步骤中,清除服务器中的操作系统日志,是为了避免服务器之前的操作对稳定性测试造成影响。
[0085]步骤304:控制器向服务器发送开机请求,调用服务器的开机函数,进行服务器开机启动;
[0086]在该步骤中,当服务器为非热插拔服务器如Pcie-Switch服务器等,可以进一步通过设置启动时序,根据启动时序启动服务器,如图4所示,本发明实施例为Pcie-Switch服务器设置的启动/关机时序,由于Pcie-Switch服务器为非热插拔,则需要首先启动包含有GPU的资源服务器,当资源服务器启东完成之后,再启动server端;同时,在关机过程中,则首先关闭server端,再关闭资源服务器,从而避免服务器由于启动时序问题造成的宕机。
[0087]步骤305:服务器判断本身是否存在count文件,如果是,则执行步骤306;否则执行步骤307;
[0088]步骤306:将第一计数器count+Ι,存储到count文件,并执行步骤308;
[0089]步骤307:启动第一计数器count,将第一计数器count+Ι,生成count文件,并将第一计数器count写入服务器开机启动项;
[0090]在步骤305至步骤307的过程,主要是服务器自身对其启动次数的统计,该统计通过计数器自动完成,而无需人为的参与。
[0091 ]步骤308:服务器判断本身是否存在Ispc1-tmp文件,如果是,则执行步骤309;否则执行步骤310;
[0092]步骤309:读取服务器中的设备信息,将该设备信息写入Ispcilcount文件,并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,如果是,则执行步骤311 ;否则执行步骤312;
[0093]步骤310:为服务器中的设备信息,生成Ispc1-tmp文件;
[0094]步骤308至步骤310是对服务器中各个设备的信息的收集和对比,通过对设备信息的对比,判断服务器是否启动完全,例如:一个服务器中有GPUl和GPU2,在Ispc1-tmp文件则包含有GPUl和GPU2的信息,而Ispc1-$count文件中仅有GPUl的信息,则两个文件不一致,说明服务器启动并未完成。
[0095]步骤311:发送启动完成信息给控制器,创建gpu.txt文件和server.txt文件,并执行步骤313;
[0096]步骤312:提示错误信息,并结束当前流程;
[0097]步骤313:控制器接收服务器发送的启动完成信息,判断第二计数器count的计数是否小于检测阈值,如果是,则执行步骤314;否则,执行步骤315;
[0098]例如:设置检测阈值为1000,第二计数器count的计数为服务器启动次数,则当服务器启动次数小于1000时,第二计数器count的计数小于1000。
[00"] 步骤314:检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则执行步骤316;否则,执行步骤317;
[0100]在该步骤中,首先需要检测服务器是否连接到交换机,即控制器能够通过交换机连接到服务器,由于前面提及当服务器启动完成后,将创建gpu.txt文件和server.txt文件,则通过控制器检测服务器中是否存在gpu.txt文件和server.txt文件,来进一步确定服务器已经启动完成。
[0101]步骤315:关闭服务器,并退出控制服务器,并结束当前流程;
[0102]步骤316:调用服务器的关机函数,控制服务器关机,并执行步骤304;
[0?03] 在该步骤中,将第二计算器count+Ι,对于非热插拔服务器如Pcie-Switch服务器等来说,能够根据上面设置的时序,顺序控制server端关机和资源服务器关机。
[0104]步骤317:延迟一定时间,并返回执行步骤313。
[0105]如果没检测到gpu.txt文件和server.txt文件,可能由于服务器还没启动完成,那么可以通过延长一定时间如5s再重新接收服务器发送的启动完成信息。
[0106]如图5所示,本发明实施例提供应用于上述任一所述的服务器reboot测试方法的服务器,该服务器通过外设的交换机,与外设的控制器之间相互通信,包括:开关单元501、第一判断单元502、读取写入单元503和生成单元504,其中,
[0107]开关单元501,用于当接收到外设的控制器发送的开机请求时,进行开机启动,并触发第一判断单元502,当接收到外设的控制器发送的关机请求,进行关机操作;
[0?08]第一判断单元502,用于接收到开机单元501的触发时,判断是否存在Ispc1-tmp文件,如果是,则触发读取写入单元503;并比较Ispc1-tmp文件和I spc1-$count文件是否一致,否则,触发生成单元504;
[0109]读取写入单元503,用于读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并当Ispc1-tmp文件和Ispc1-$count文件一致时,发送启动完成信息给外设的控制器,并创建gpu.txt文件和server.txt文件;
[Ο??Ο]生成单元504,用于为各个设备信息,生成Ispc1-tmp文件。
[0111]在本发明另一实施例中,通过OS网络和BMC网络连接到外设的交换机。
[0112]在本发明又一实施例中,上述服务器进一步包括:第二判断单元和第一计数器(图中未示出),其中,
[0113]第二判断单元,用于判断是否存在count文件,如果是,则触发第一计数器;否则,启动第一计数器,生成count文件,并将第一计数器写入服务器开机启动项;
[0114]第一计数器,用于统计开关单元501的开机启动次数,当开关单元501进行开机启动时,进行count+Ι,并将开机启动次数存储到count文件。
[ΟΙ15] 在本发明另一实施例中,上述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,server端插有一张ret imer卡,通过该retimer卡及MiniSASHD线缆与资源服务器连接。
[0116]如图6所示,本发明实施例提供应用于上述任一所述的服务器reboot测试方法的控制器,该控制器,包括:设置单元601、第二计数器602、检测单元603和调用控制单元604,其中,
[0117]设置单元601,用于设置检测阈值;
[0118]检测单元603,用于判断第二计数器602的计数是否小于设置单元601设置的检测阈值,如果是,则检测外设的服务器中是否存在gpu.txt文件和server.txt文件,如果是,则触发调用控制单元604;
[0119]调用控制单元604,用于在接收到检测单元603的触发时,调用外设的服务器的关机函数,控制外设的服务器关机,向外设的服务器发送开机请求,调用外设的服务器的开机函数,控制外设的服务器开机启动,并将第二计数器602的计数加I。
[0120]上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。
[0121]如图7所示,本发明实施例提供服务器reboot测试系统,包括:至少一个上述任意一种服务器701、交换机702和控制器703,其中,
[0122]至少一个服务器701和控制器703分别与交换机702连接。
[0123]根据上述方案,本发明的各实施例所提供的服务器reboot测试方法、服务器、控制器和系统,至少具有如下有益效果:
[0124]1.通过交换机,建立服务器和控制器之间相互通信;当服务器接收到控制器发送的开机请求时,进行开机启动;服务器判断本身是否存在I spc1-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并比较Ispc1-tmp文件和Ispc1-$(3011111:文件是否一致,否则,为服务器中的设备信息,生成18口0;[-1:11^1文件;当所述18口(^-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给控制器;创建gpu.txt文件和server.txt文件;接收控制器发送的关机请求,进行关机操作,通过该方法,通过服务器判断文件是否存在,并对比文件间的一致性,即可判断出服务器启动是否正常,另外,服务器的启动和关机均可在控制器的控制下,自动进行,而无需人工参与进来,实现了服务器稳定性测试的自动化。
[0125]2.服务器通过OS网络和BMC网络连接到交换机;控制器通过OS网络连接到交换机;使得控制器能够控制服务器的自动开关机,保证了服务器稳定性测试的自动化,另外,通过设置启动时序;根据设置的启动时序,顺序启动Pcie-Switch服务器的资源服务器和server端,使得非热插拔的Pcie-Switch服务器也能够实现稳定性测试的自动化。
[0126]3.在服务器启动完成之后,启动完成信息给控制器,创建gpu.txt文件和server, txt文件,控制器在接收到启动完成信息之后,还是会检测服务器中是否存在gpu.txt文件和server, txt文件,保证了服务器启动的准确性。
[0127]4.通过设置检测阈值,只有当控制器中的第二计数器count的计数小于检测阈值时,控制器才会调用开机/关机函数,控制服务器的开机/关机,避免稳定性测试进入死循环,另外,控制器通过清除服务器中的操作系统日志,避免服务器中除开关机之外的操作对服务器稳定性造成影响,进一步提高服务器稳定性测试的准确性。
[0128]需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。
[0129]本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储在计算机可读取的存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质中。
[0130]最后需要说明的是:以上所述仅为本发明的较佳实施例,仅用于说明本发明的技术方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等,均包含在本发明的保护范围内。
【主权项】
1.服务器reboot测试方法,其特征在于,通过交换机,建立服务器和控制器之间相互通信;还包括: 当服务器接收到控制器发送的开机请求时,进行开机启动; 服务器判断本身是否存在Ispc1-tmp文件,如果是,则读取服务器中的设备信息,将该设备信息写入Ispc1-$count文件,并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,否贝IJ,为服务器中的设备信息,生成Ispc1-tmp文件; 当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给控制器; 创建gpu.txt文件和server.txt文件; 接收控制器发送的关机请求,进行关机操作。2.根据权利要求1所述的方法,其特征在于, 所述通过交换机,建立服务器和控制器之间相互通信,包括: 服务器通过OS网络和BMC网络连接到交换机; 控制器通过OS网络连接到交换机; 和/或, 进一步包括:在服务器中设置第一计数器count; 在所述开机启动之后,进一步包括:服务器判断本身是否存在count文件,如果是,则将所述第一计数器count+Ι,存储到所述count文件;否则,启动所述第一计数器count,将所述第一计数器count+Ι,生成count文件,并将所述第一计数器count写入服务器开机启动项。3.根据权利要求1或2所述的方法,其特征在于, 所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张retimer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接; 进一步包括:设置启动时序; 所述开机启动,包括:根据设置的启动时序,顺序启动所述资源服务器和server端。4.服务器reboot测试方法,其特征在于,应用于控制器,在控制器中设置第二计数器count,并设置检测阈值;还包括: Ml、控制器初始化所述第二计数器count ; M2、接收服务器发送的启动完成信息,判断所述第二计数器count的计数是否小于检测阈值,如果是,则检测服务器中是否存在gpu.txt文件和server.txt文件,如果是,则调用服务器的关机函数,控制服务器关机; M3、向服务器发送开机请求,调用服务器的开机函数,控制服务器开机启动,并将第二计数器count+Ι,执行M2。5.根据权利要求4所述的方法,其特征在于,进一步包括:清除所述服务器中的操作系统曰志。6.根据权利要求4或5所述的方法,其特征在于,所述服务器为Pcie-Switch服务器,该Pci e-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张ret imer卡,通过该retimer卡及MiniSASHD线缆与所述资源服务器连接; 所述控制服务器关机,包括:顺序控制所述server端关机和所述资源服务器关机; 所述控制服务器开机启动,包括:顺序控制所述资源服务器开机启动和所述server端开机启动。7.应用于权利要求1至3任一所述的服务器reboot测试方法的服务器,通过外设的交换机,与外设的控制器之间相互通信,其特征在于,包括:开关单元、第一判断单元、读取写入单元和生成单元,其中, 所述开关单元,用于当接收到外设的控制器发送的开机请求时,进行开机启动,并触发所述第一判断单元,当接收到外设的控制器发送的关机请求,进行关机操作; 所述第一判断单元,用于接收到所述开机单元的触发时,判断是否存在Ispc1-tmp文件,如果是,则触发所述读取写入单元;并比较Ispc1-tmp文件和Ispc1-$count文件是否一致,否则,触发所述生成单元; 所述读取写入单元,用于读取服务器中的设备信息,将该设备信息写入Ispc1-$c0unt文件,并当所述Ispc1-tmp文件和所述Ispc1-$count文件一致时,发送启动完成信息给外设的控制器,并创建gpu.txt文件和server.txt文件; 所述生成单元,用于为各个设备信息,生成Ispc1-tmp文件。8.根据权利要求7所述的服务器,其特征在于, 通过OS网络和BMC网络连接到外设的交换机; 和/或, 进一步包括:第二判断单元和第一计数器,其中, 所述第二判断单元,用于判断是否存在count文件,如果是,则触发所述第一计数器;否则,启动所述第一计数器,生成count文件,并将所述第一计数器写入服务器开机启动项; 所述第一计数器,用于统计所述开关单元的开机启动次数,当所述开关单元进行开机启动时,进行count+Ι,并将开机启动次数存储到所述count文件; 和/或, 所述服务器为Pcie-Switch服务器,该Pcie-Switch服务器包括:资源服务器和server端,其中,所述server端插有一张ret imer卡,通过该ret imer卡及Mini SASHD线缆与所述资源服务器连接。9.应用于权利要求4至6任一所述的服务器reboot测试方法的控制器,其特征在于,包括:设置单元、第二计数器、检测单元和调用控制单元,其中, 所述设置单元,用于设置检测阈值; 所述检测单元,用于判断所述第二计数器的计数是否小于所述设置单元设置的检测阈值,如果是,则检测外设的服务器中是否存在gpu.txt文件和server.txt文件,如果是,则触发所述调用控制单元; 所述调用控制单元,用于在接收到所述检测单元的触发时,调用外设的服务器的关机函数,控制外设的服务器关机,向外设的服务器发送开机请求,调用外设的服务器的开机函数,控制外设的服务器开机启动,并将所述第二计数器的计数加I。10.服务器reboot测试系统,其特征在于,包括:至少一个权利要求7或8所述的服务器、交换机和权利要求9所述的控制器,其中, 所述至少一个服务器和所述控制器分别与所述交换机连接。
【文档编号】G06F11/22GK105912431SQ201610202489
【公开日】2016年8月31日
【申请日】2016年4月1日
【发明人】肖欢, 巩祥文
【申请人】浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1