本发明涉及故障检测领域,特别涉及一种服务器故障的报警方法、装置、设备及计算机可读存储介质。
背景技术
随着互联网行业的飞速发展,互联网企业对服务器的需求量越来越大,使得服务器数据中心的数量在成倍增长,但是这同时也给服务器的检测管理工作带来巨大挑战。
现有技术对服务器故障的报警方法一般是通过对服务器中的硬件设备逐一进行检测,并在检测出存在故障时发出提示信息以提示工作人员进行排查并进行维修处理的操作。但是面对日益庞大的服务器集群应用,一旦发现故障信息则立即通知工作人员进行维修处理,将消耗大量的人力资源进行故障排查的操作。
因此,如何提供一种高效的服务器故障的报警方法,以节约人力资源是本领域技术人员目前需要解决的技术问题。
技术实现要素:
有鉴于此,本发明的目的在于提供一种服务器故障的报警方法,能够节约人力资源;本发明的另一目的是提供一种服务器故障的报警装置、设备及计算机可读存储介质,均具有上述有益效果。
为解决上述技术问题,本发明提供一种服务器故障的报警方法,包括:
获取服务器中各硬件设备的运行信息;
根据预设规则对各所述运行信息进行判断,确定各所述运行信息对应的硬件设备的故障级别;
根据所述故障级别发出对应的报警信息。
优选地,所述根据预设规则对各所述运行信息进行判断,确定各所述运行信息对应的硬件设备的故障级别具体包括:
判断各所述运行信息是否在对应的标准范围内;
若是,则设置所述运行信息对应的硬件设备的故障级别为第一级别;
否则,则进一步判断所述运行信息对应的故障情况是否为可自适应修复故障;
若为可自适应修复故障,则设置所述运行信息对应的硬件设备的所述故障级别为第二级别;
否则,则设置所述运行信息对应的硬件设备的所述故障级别为第三级别。
优选地,在所述根据所述故障级别发出对应的报警信息之后进一步包括:
提取所述运行信息中的关键词信息;
根据所述关键词信息从预先存储的故障处理建议中获取对应的故障处理建议。
优选地,在所述根据所述故障级别发出对应的报警信息之后进一步包括:
将所述运行信息、故障描述和所述故障级别记录至日志。
优选地,所述获取服务器中各硬件设备的运行信息具体为:
以预设的周期获取服务器中各硬件设备的运行信息。
优选地,所述根据所述故障级别发出对应的报警信息具体为根据所述故障级别利用蜂鸣器和/或指示灯发出对应的报警信息。
为解决上述技术问题,本发明还提供一种服务器故障的报警装置,包括:
获取模块,用于获取服务器中各硬件设备的运行信息;
设置模块,用于根据预设规则对各所述运行信息进行判断,确定各所述运行信息对应的硬件设备的故障级别;
报警模块,用于根据所述故障级别发出对应的报警信息。
为解决上述技术问题,本发明还提供一种服务器故障的报警设备,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序时实现上述任一种服务器故障的报警方法的步骤。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述任一种服务器故障的报警方法的步骤。
本发明提供的服务器故障的报警方法,包括首先获取服务器中各硬件设备的运行信息;然后根据预设规则对各运行信息进行判断,确定各运行信息对应的硬件设备的故障级别;并根据故障级别发出对应的报警信息。因此,工作人员可以根据不同的故障级别对应的报警信息对服务器进行相应的处理,从而不需要在一出现报警信息即对服务器进行维修处理的操作,从而节约了人力资源。
为解决上述技术问题,本发明还提供了一种服务器故障的报警装置、设备及计算机可读存储介质,均具有上述有益效果。
附图说明
为了更清楚地说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种服务器故障的报警方法的流程图;
图2为本发明实施例提供的另一种服务器故障的报警方法的流程图;
图3为本发明实施例提供的一种服务器故障的报警装置的结构图;
图4为本发明实施例提供的一种服务器故障的报警设备的结构图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
本发明实施例的核心是提供一种服务器故障的报警方法,能够节约人力资源;本发明的另一核心是提供一种服务器故障的报警装置、设备及计算机可读存储介质,均具有上述有益效果。
为了使本领域技术人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。
图1为本发明实施例提供的一种服务器故障的报警方法的流程图。如图1所示,一种服务器故障的报警方法包括:
s10:获取服务器中各硬件设备的运行信息。
本实施例中获取所有服务器中的硬件设备的运行信息,服务器可以是只有一个服务器,也可以是服务器集群。需要说明的是,服务器中的硬件设备包括cpu、内存、pci-e设备、硬盘和风扇等,采集预设的需要检测的硬件设备的运行信息,检测硬件设备的具体内容包括在位信息、健康状态、温度、电压和运行速率等,运行信息还可以包括总线或内存的带宽、读写速率等,本实施例对检测硬件设备的具体内容不做限定。
s20:根据预设规则对各运行信息进行判断,确定各运行信息对应的硬件设备的故障级别。
具体的,根据获取的运行信息与预设规则进行比较的结果确定并设置服务器的故障级别。预设规则具体为根据不同的需求标准设置的规则,包括设置故障级别的级数以及各级别的判断标准,本实施例对此不做具体的限定。
s30:根据故障级别发出对应的报警信息。
预先对应于各不同的故障级别分别设置不同的报警信息,以便在确定出故障级别后,根据故障级别发出对应的报警信息,以便工作人员能够根据不同的报警信息做出相应的处理措施。
本发明实施例提供的服务器故障的报警方法,包括首先获取服务器中各硬件设备的运行信息;然后根据预设规则对各运行信息进行判断,确定各运行信息对应的硬件设备的故障级别;并根据故障级别发出对应的报警信息。因此,工作人员可以根据不同的故障级别对应的报警信息对服务器进行相应的处理,从而不需要在一出现报警信息即对服务器进行维修处理的操作,从而节约了人力资源。
图2为本发明实施例提供的另一种服务器故障的报警方法的流程图。如图2所示,本实施例对技术方案作了进一步的说明和优化,具体的,根据预设规则对各运行信息进行判断,确定各运行信息对应的硬件设备的故障级别具体包括:
s21:判断各运行信息是否在对应的标准范围内;
s22:若是,则设置运行信息对应的硬件设备的故障级别为第一级别。
预先根据实际需求设置各运行信息的标准范围,然后将各运行信息与对应的标准范围进行比较,例如,将硬件设备的温度、电压、带宽和速率等信息分别与温度标准范围、电压标准范围、带宽标准范围和速率标准范围进行比较,以判断各运行信息是否在各对应的标准范围内。若在标准范围内,则设置该运行信息对应的硬件设备的故障级别为第一级别。
一般的,当对硬件设备进行重启、替换的操作时,其温度、电压等运行信息可能会有所变化,因此可以相应地判断是否存在硬件设备故障状态恢复、硬件设备重启和硬件设备更换的操作信息,以更准确地确认该运行信息对应的硬件设备的故障级别为第一级别。
s23:否则,则进一步判断运行信息对应的故障情况是否为可自适应修复故障;
s24:若为可自适应修复故障,则设置运行信息对应的硬件设备的故障级别为第二级别;
s25:否则,则设置运行信息对应的硬件设备的故障级别为第三级别。
也即,在判断出运行信息不在表顺范围内之后,进一步判断该运行信息对应的故障情况是否为可自适应修复故障,具体的,通过预先定义可自适应修复故障的具体类型,如运行速率变化过快、温度过高、电压过低等情况,通过将运行信息对应的故障情况与可自适应修复故障的具体类型进行比较,从而判断出该故障情况是否为可自适应修复故障,若是,则设置运行信息对应的硬件设备的故障级别为第二级别。
当判断出故障情况为不可自适应修复故障时,设置运行信息对应的硬件设备的故障级别为第三级别。需要说明的是,不可自适应修复故障包括组件掉线、组件损坏等故障等。第三级别的故障一般需要工作人员及时对服务器进行维修处理,以避免造成损失。
需要说明的是,本实施例中根据预设规则将故障级别分为第一级别、第二级别和第三级别,这只是用于表示不同的级别,也可以用普通级别、告警级别和故障级别或者其他的方式进行描述,并不作为具体的限定。
可见,通过将各运行信息与对应的标准范围进行比较,得出不存在故障的第一级别,再对存在故障的运行信息进行判断,得出可自适应修复故障的第二级别和不可自适应修复故障的第三级别,通过明确的分级方式并划分故障级别,更便于工作人员对存在的故障进行处理。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,在根据故障级别发出对应的报警信息之后进一步包括:
提取运行信息中的关键词信息;
根据关键词信息从预先存储的故障处理建议中获取对应的故障处理建议。
具体的,预先设置不同的故障情况及各相应的故障处理建议并进行存储。在根据故障级别发出对应的报警信息之后,根据对运行信息的判断情况得出当前的故障情况,根据当前的故障情况去预先存储的故障情况中查找对应的信息,并获取相应的故障处理建议。
更具体的,在根据故障级别发出对应的报警信息之后,提取该运行信息中的关键词信息,并利用该关键词信息在预先存储的故障情况中查找对应的故障处理建议。
需要说明的是,若预先存储的故障处理建议中没有与当前的故障情况对应的故障处理建议,则还可以再获取工作人员输入的故障处理建议并进行存储。
本实施例提供的服务器故障的报警方法,能够进一步为故障信息提供对应的故障处理方法,能够提高修复故障的效率。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,在根据故障级别发出对应的报警信息之后进一步包括:
将运行信息、故障情况和故障级别记录至日志。
具体的,在根据故障级别发出对应的报警信息之后,按照预设的描述规则,根据运行信息对发生故障的硬件设备及对应的故障情况进行描述,即为故障描述。通过将将运行信息、故障描述和故障级别记录至日志,以便工作人员查看,得出硬件设备的历史运行情况,以便对硬件设备进行改进。
在本实施例中,根据故障级别发出对应的报警信息具体为根据故障级别利用蜂鸣器和/或指示灯发出对应的报警信息。
由于蜂鸣器和/或指示灯的装置简单,且发出提示信息的效果明显,因此作为优选的实施方式,根据蜂鸣器和/或指示灯的不同显示效果组合作为不同的报警信息,便于工作人员及时知晓服务器的故障情况。
在上述实施例的基础上,本实施例对技术方案作了进一步的说明和优化,具体的,获取服务器中硬件设备的运行信息具体为:
以预设的周期获取服务器中各硬件设备的运行信息。
为了能够更全面更准确地获取服务器中的故障情况,可以以预设的周期获取服务器中各硬件设备的运行信息,以便能够周期性地检测服务器中的设备的故障情况。
上文对于本发明提供的一种服务器故障的报警方法的实施例进行了详细的描述,本发明还提供了一种与该方法对应的服务器故障的报警装置、设备及计算机可读存储介质,由于装置、设备及计算机可读存储介质部分的实施例与方法部分的实施例相互照应,因此装置、设备及计算机可读存储介质部分的实施例请参见方法部分的实施例的描述,这里暂不赘述。
图3为本发明实施例提供的一种服务器故障的报警装置的结构图,如图3所示,服务器故障的报警装置包括:
获取模块31,用于获取服务器中各硬件设备的运行信息;
设置模块32,用于根据预设规则对各运行信息进行判断,确定各运行信息对应的硬件设备的故障级别;
报警模块33,用于根据故障级别发出对应的报警信息。
本发明实施例提供的服务器故障的报警装置,具有上述服务器故障的报警方法的有益效果。
图4为本发明实施例提供的一种服务器故障的报警设备的结构图,如图4所示,服务器故障的报警设备包括:
存储器41,用于存储计算机程序;
处理器42,用于执行计算机程序时实现如上述服务器故障的报警方法的步骤。
本发明实施例提供的服务器故障的报警设备,具有上述服务器故障的报警方法的有益效果。
为解决上述技术问题,本发明还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述服务器故障的报警方法的步骤。
本发明实施例提供的计算机可读存储介质,具有上述服务器故障的报警方法的有益效果。
以上对本发明所提供的服务器故障的报警方法、装置、设备及计算机可读存储介质进行了详细介绍。本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。