一种服务器启动过程故障检测方法、装置及受控终端与流程

文档序号:16327536发布日期:2018-12-19 06:00阅读:205来源:国知局
一种服务器启动过程故障检测方法、装置及受控终端与流程

本发明涉及服务器故障诊断技术领域,特别是涉及一种服务器启动过程故障检测方法、装置及受控终端。

背景技术

随着it领域技术不断的发展,服务器的安全性,可靠谱和可用性的也越来越重要。当服务器出现启动故障时,基本要求就是可以快速定位和快速解决。服务器的启动主要依靠服务器上的bios(basicinput/ouputsystem)芯片里的驱动程序,它保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序,为计算机提供最底层的、最直接的硬件设置和控制。也就是说实现了对bios程序启动过程的监控,就实现了对服务器启动的监控。

当对服务器进行更改配置后,如换cpu、内存,更新bios,更新pcie设备等操作后,系统会出现重启异常的现象。为了确认更改配置后的服务器启动过程中是否产生故障,用户需要在服务器上接上显示器,在服务器前时刻观察服务器开机进展,最终确认服务器是否产生了故障。在工厂生产或在客户机房中,有成百上千台机器,通过在每台服务器上连接显示器,然后再人工监控服务器开机进展,确认机器是否正常启动,需要消耗大量的物力和人力成本。

因此,在服务器更改配置后,如何快速自动检测服务器启动过程中是否发生了故障,减少物力和人力成本,是目前亟待解决的问题。



技术实现要素:

针对现有技术的不足,本发明提供了一种服务器启动过程故障检测方法、装置及受控终端,能够在服务器更改配置后,快速自动检测服务器启动过程中是否发生了故障,减少物力和人力成本。

第一方面,提供一种服务器启动过程故障检测方法,所述方法包括:

确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开机启动信号,若第一设定时间内未检测到bios发送的开始启动信号,则bmc发送故障信号;

若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号。

结合第一方面,在第一方面的第一种可能的实现方式中,所述确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开始启动信号,若第一设定时间内未检测到bios发送的开机启动信号,则bmc发送故障信号,包括:

确定bmc在服务器启动5s内是否检测到bios发送的开始启动信号,若开机启动5s内未检测到bios发送的开始启动信号,则bmc发送故障信号。

结合第一方面及其上述实现方式,在第一方面的第二种可能的实现方式中,所述若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号,包括:

bmc服务器开机启动5s内检测到bios发送的开始启动信号,bmc重新计时,确定bmc在10min内是否检测到bios发送的启动完成信号,若10min内未检测到bios发送的启动完成信号,则bmc发送故障信号。

结合第一方面及其上述实现方式,在第一方面的第三种可能的实现方式中,

所述bios与bmc沟通的信号可以通过gpio的状态变化或发送日志到bmc。

结合第一方面及其上述实现方式,在第一方面的第四种可能的实现方式中,

所述bmc显示故障信号的方法,包括:

在服务器上设置由bmc控制的led灯,作为启动故障灯。

第二方面,提供一种用于一种服务器启动过程故障检测的装置,包括:

第一确定单元,所述第一确定单元用于确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开机启动信号,若第一设定时间内未检测到bios发送的开始启动信号,则bmc发送故障信号;

第二确定单元,所述第二确定单元用于若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号。

结合第二方面,在第二方面的第一种可能的实现方式中,所述第一确定单元具体用于:

确定bmc在服务器启动5s内是否检测到bios发送的开始启动信号,若开机启动5s内未检测到bios发送的开始启动信号,则bmc发送故障信号。

结合第二方面及其上述实现方式,在第二方面的第二种可能的实现方式中,所述第二确定单元具体用于:

bmc服务器开机启动5s内检测到bios发送的开始启动信号,bmc重新计时,确定bmc在10min内是否检测到bios发送的启动完成信号,若10min内未检测到bios发送的启动完成信号,则bmc发送故障信号。

结合第二方面及其上述实现方式,在第二方面的第三种可能的实现方式中,所述装置还包括报警单元:

所述报警单元为设置在服务器上由bmc控制的led灯,作为启动故障灯。

第三方面,提供一种受控终端,包括:

处理器、存储器,其中,

该存储器用于存储计算机程序,该处理器用于从存储器中调用并运行该计算机程序,使得终端设备执行上述的终端设备的方法。

第四方面,提供了一种计算机存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。

第五方面,提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述各方面所述的方法。

因此,本申请通过bmc对bios设置两个监控点:开始启动和启动完成两个监控点的监控,实现自动检测bios主芯片是否可以正常开机,当系统产生故障时可以自动报警,快速定位发生故障的机台,有效节省物力及人力成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本申请一个实施例的方法的示意性流程图。

图2是本申请另一个实施例的方法的示意性流程图。

图3是本申请一个实施例的装置的示意性框图。

图4为本发明实施例提供的一种受控终端的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。为了使本技术领域的人员更好地理解本发明中的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

下面对本申请中出现的关键术语进行解释。

bios(basicinput/ouputsystem):表示基本输入输出系统,是一组固化到计算机内主板上一个rom芯片上的程序,它保存着计算机最重要的基本输入输出的程序、开机后自检程序和系统自启动程序,它可从cmos中读写系统设置的具体信息,其主要功能是为计算机提供最底层的、最直接的硬件设置和控制。

bmc(baseboardmanagementcontroller):表示基板管理控制器,是电脑进行数模信号转换的设备,承担输出显示图形的任务。显卡接在电脑主板上,它将电脑的数字信号转换成模拟信号让显示器显示出来。

gpio(generalpurposeinputoutput):表示通用输入/输出或总线扩展器,当微控制器或芯片组没有足够的i/o端口,或当系统需要采用远端串行通信或控制时,gpio产品能够提供额外的控制和监视功能。

应理解,文中描述的第一、第二只是为了指代和区别不同的信号、指令等,其中,第一、第二不具有先后顺序的限定。

图1是本申请一个实施例的方法的示意性流程图。其中,图1执行主体可以为一种用于服务器启动过程故障检测的装置。

如图1所示,该方法100包括:

步骤110,确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开机启动信号,若第一设定时间内未检测到bios发送的开始启动信号,则bmc发送故障信号;

步骤120,若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,所述确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开始启动信号,若第一设定时间内未检测到bios发送的开机启动信号,则bmc发送故障信号,包括:

确定bmc在服务器启动5s内是否检测到bios发送的开始启动信号,若开机启动5s内未检测到bios发送的开始启动信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,所述若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号,包括:

bmc服务器开机启动5s内检测到bios发送的开始启动信号,bmc重新计时,确定bmc在10min内是否检测到bios发送的启动完成信号,若10min内未检测到bios发送的启动完成信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,bios与bmc沟通的信号可以通过gpio的状态变化或发送日志到bmc。

可选地,作为本申请一个实施例,所述bmc显示故障信号的方法,包括:

在服务器上设置由bmc控制的led灯,作为启动故障灯。

具体的,图2示出了本申请一个实施例的方法的示意图。

在服务器上增加一个led灯,为启动故障灯,由bmc控制。当bmc与bios沟通过程中,检测到了服务器启动异常,可以点亮此led灯。

在bios开机过程中,按服务器开机键,bios开始启动,bmc对bios启动过程设置两个监控点,第一个监控点是bios启动前期,bmc在检测到了系统开机信号后开始计时,在一定时间内,例如大约5秒内如果没有收到bios发送的开始启动,那么bmc就认定这个开机bios无法正常启动系统,从而自动点亮启动故障灯。第二个监控点是系统开机后期,在接收收到了第一个监控点信号后,bmc重新计时,经过一段时间内,例如bmc在接收到了第一个信号后的10分钟内都接收不到bios启动完成的信号,那么bmc就认定此bios无法正常启动系统,会自动点亮启动故障灯。bios与bmc沟通的信号可以通过gpio的状态变化或发送日志到bmc等一系列方式。用户可以根据点亮的故障灯,快速的确认哪台服务器发生了故障。

因此,本申请实施例可通过bmc监控bios开机信号的方法,bios无法正常启动时,可以自动快速的点亮启动故障灯,减少了物力和人力成本,实现了自动且快速的去定位故障服务器。

图3示出了本申请一个实施例的装置的示意性框图。

如图3所示,该装置300包括:

第一确定单元310,所述第一确定单元用于确定bmc在服务器启动后第一设定时间内是否检测到bios发送的开机启动信号,若第一设定时间内未检测到bios发送的开始启动信号,则bmc发送故障信号;

第二确定单元320,所述第二确定单元用于若第一设定时间内检测到bios发送的开始启动信号,确定bmc在第二设定时间内是否检测到bios发送的启动完成信号,若第二设定时间内未检测到bios发送的启动完成信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,所述第一确定单元310具体用于:

确定bmc在服务器启动5s内是否检测到bios发送的开始启动信号,若开机启动5s内未检测到bios发送的开始启动信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,所述第二确定单元320具体用于:

bmc服务器开机启动5s内检测到bios发送的开始启动信号,bmc重新计时,确定bmc在10min内是否检测到bios发送的启动完成信号,若10min内未检测到bios发送的启动完成信号,则bmc发送故障信号。

可选地,作为本申请一个实施例,所述装置还包括报警单元330(图中未显示):

所述报警单元330为设置在服务器上由bmc控制的led灯,作为启动故障灯。

图4为本发明实施例提供的一种受控终端400的结构示意图,该受控终端400可以用于执行本申请实施例提供的服务器启动过程故障检测示出的方法。

其中,该受控终端400可以包括:处理器410、存储器420及通信单元430。这些组件通过一条或多条总线进行通信,本领域技术人员可以理解,图中示出的服务器的结构并不构成对本申请的限定,它既可以是总线形结构,也可以是星型结构,还可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

其中,该存储器420可以用于存储处理器410的执行指令,存储器420可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(sram),电可擦除可编程只读存储器(eeprom),可擦除可编程只读存储器(eprom),可编程只读存储器(prom),只读存储器(rom),磁存储器,快闪存储器,磁盘或光盘。当存储器420中的执行指令由处理器410执行时,使得终端400能够执行以下上述方法实施例中的部分或全部步骤。

处理器410为存储设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器420内的软件程序和/或模块,以及调用存储在存储器内的数据,以执行电子设备的各种功能和/或处理数据。所述处理器可以由集成电路(integratedcircuit,简称ic)组成,例如可以由单颗封装的ic所组成,也可以由连接多颗相同功能或不同功能的封装ic而组成。举例来说,处理器410可以仅包括中央处理器(centralprocessingunit,简称cpu)。在本申请实施方式中,cpu可以是单运算核心,也可以包括多运算核心。

通信单元430,用于建立通信信道,从而使所述存储设备可以与其它设备进行通信。接收其他设备发送的用户数据或者向其他设备发送用户数据。

本申请还提供一种计算机存储介质,

其中,该计算机存储介质可存储有程序,该程序执行时可包括本申请提供的各实施例中的部分或全部步骤。所述的存储介质可为磁碟、光盘、只读存储记忆体(英文:read-onlymemory,简称:rom)或随机存储记忆体(英文:randomaccessmemory,简称:ram)等。

因此,本申请实施例通过bmc对bios设置两个监控点:开始启动和启动完成两个监控点的监控,实现自动检测bios主芯片是否可以正常开机,当系统产生故障时可以自动报警,快速定位发生故障的机台,有效节省物力及人力成本,本实施例所能达到的技术效果可以参见上文中的描述,此处不再赘述。

本领域的技术人员可以清楚地了解到本申请实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请实施例中的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中如u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者第二设备、网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。

本说明书中各个实施例之间相同相似的部分互相参见即可。尤其,对于终端实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例中的说明即可。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

尽管通过参考附图并结合优选实施例的方式对本发明进行了详细描述,但本发明并不限于此。在不脱离本发明的精神和实质的前提下,本领域普通技术人员可以对本发明的实施例进行各种等效的修改或替换,而这些修改或替换都应在本发明的涵盖范围内/任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1