一种服务器预警方法及装置与流程

文档序号:12120478阅读:273来源:国知局
一种服务器预警方法及装置与流程

本发明涉及服务器监控技术领域,特别是涉及一种服务器预警方法及装置。



背景技术:

随着计算机技术的快速发展,各行各业建设的信息系统越来越多。服务器作为信息系统的关键部件,其健康运行是信息系统的业务正常运行的保障。

在实际应用中,服务器的预警系统尤为重要,预警系统在发现服务器可能存在问题时可以发出预警通知,能够很好地帮助管理员及时处理和定位问题。

在现有技术中,预警通知的发出基于一组固定的状态阈值,当预警系统监测到服务器出现超过阈值的状态时,针对该预警事件的预警通知就会被下达。

在这种方式下,如果阈值设置的太高,将会有很多潜在的问题被忽略;如果阈值设置的较低,则会有很多不必要的预警通知发生。而有的预警事件可能并不需要当时就进行处理,预警通知的频繁发送将会给管理员带来困扰,给其分析处理造成混乱。



技术实现要素:

本发明的目的是提供一种服务器预警方法及装置,以自适应地确定是否发出针对预警事件的预警通知,避免频繁发送预警通知给用户带来困扰。

为解决上述技术问题,本发明提供如下技术方案:

一种服务器预警方法,包括:

在目标服务器运行过程中,监测所述目标服务器的预警项;

如果第一预警项的监测值达到所述第一预警项对应的设定阈值,则生成第一预警事件;

根据预先获得的事件与行为记录表,预测所述第一预警事件是否为重要事件,所述事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息;

如果是,则将针对所述第一预警事件的预警通知发送给所述用户。

在本发明的一种具体实施方式中,所述根据预先获得的事件与行为记录表,预测所述第一预警事件是否为重要事件,包括:

在预先获得的事件与行为记录表中查找所述第一预警项对应的历史预警事件;

根据查找到的每个历史预警事件对应的监测值及每个历史预警事件的标记信息,预测所述第一预警事件是否为重要事件。

在本发明的一种具体实施方式中,在所述生成第一预警事件之后,还包括:

在所述事件与行为记录表中记录所述第一预警事件。

在本发明的一种具体实施方式中,还包括:

如果监测到所述用户基于所述第一预警事件对所述目标服务器进行了相应处理,则在所述事件与行为记录表中将所述第一预警事件标记为重要事件。

在本发明的一种具体实施方式中,在所述将针对所述第一预警事件的预警通知发送给用户之后,还包括:

接收所述用户基于所述预警通知的反馈信息;

如果所述反馈信息为忽略所述预警通知,则在所述事件与行为记录表中将所述第一预警事件标记为非重要事件;

如果所述反馈信息为接受所述预警通知,则在所述事件与行为记录表中将所述第一预警事件标记为重要事件。

一种服务器预警装置,包括:

预警项监测模块,用于在目标服务器运行过程中,监测所述目标服务器的预警项;

预警事件生成模块,用于如果第一预警项的监测值达到所述第一预警项对应的设定阈值,则生成第一预警事件;

重要事件预测模块,用于根据预先获得的事件与行为记录表,预测所述第一预警事件是否为重要事件,所述事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息,如果是,则触发预警通知发送模块;

所述预警通知发送模块,用于将针对所述第一预警事件的预警通知发送给所述用户。

在本发明的一种具体实施方式中,所述重要事件预测模块,具体用于:

在预先获得的事件与行为记录表中查找所述第一预警项对应的历史预警事件;

根据查找到的每个历史预警事件对应的监测值及每个历史预警事件的标记信息,预测所述第一预警事件是否为重要事件。

在本发明的一种具体实施方式中,还包括预警事件记录模块,用于:

在所述生成第一预警事件之后,在所述事件与行为记录表中记录所述第一预警事件。

在本发明的一种具体实施方式中,还包括:

重要事件第一标记模块,用于在监测到所述用户基于所述第一预警事件对所述目标服务器进行了相应处理时,在所述事件与行为记录表中将所述第一预警事件标记为重要事件。

在本发明的一种具体实施方式中,还包括重要事件第二标记模块,用于:

在所述将针对所述第一预警事件的预警通知发送给用户之后,接收所述用户基于所述预警通知的反馈信息;

如果所述反馈信息为忽略所述预警通知,则在所述事件与行为记录表中将所述第一预警事件标记为非重要事件;

如果所述反馈信息为接受所述预警通知,则在所述事件与行为记录表中将所述第一预警事件标记为重要事件。

应用本发明实施例所提供的技术方案,在监测目标服务器的预警项的过程中,如果第一预警项的监测值达到该第一预警项对应的设定阈值,则可以生成第一预警事件,根据事件与行为记录表,可以预测第一预警事件是否为重要事件,如果第一预警事件为重要事件,则可以将针对该第一预警事件的预警通知发送给用户。事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息,在生成第一预警项对应的第一预警事件后,可以根据用户对第一预警项对应的历史预警事件的重要程度,预测第一预警事件是否为重要事件,参考了用户对于服务器状态的认知,可以自适应地确定是否发出针对该第一预警事件的预警通知,避免频繁发送预警通知给用户带来困扰,使得发出的预警通知更加合理有效,缩短了管理员对预警事件的处理时间,提高了预警系统的可用性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例中一种服务器预警方法的实施流程图;

图2为本发明实施例中一种服务器预警装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

参见图1所示,为本发明实施例所提供的一种服务器预警方法的实施流程图,该方法可以包括以下步骤:

S110:在目标服务器运行过程中,监测目标服务器的预警项。

目标服务器可以为任意一个信息系统中的任意一台服务器,其具体可以是Linux服务器,还可以是Unix服务器。

在本发明实施例中,可以预先根据目标服务器的应用场景、业务类型等,确定目标服务器的预警项,不同服务器的预警项可以相同或者不同。预警项具体可以为处理器负载状态、内存使用状态、网络状态等。不同预警项对应不同的设定阈值。可以预先在预警阈值表中存储各个预警项的设定阈值信息。预警系统对外可以提供HTTP接口,用于为用户提供设定阈值的修改及查看等操作。

在目标服务器运行过程中,可以监测目标服务器的各个预警项,获得各个预警项的监测值。在实际应用中,可以针对不同预警项设定不同的监测周期。

S120:如果第一预警项的监测值达到第一预警项对应的设定阈值,则生成第一预警事件。

在对目标服务器的预警项进行监测的过程中,如果第一预警项的监测值达到第一预警项对应的设定阈值,则可以生成第一预警事件。

第一预警项为目标服务器对应的多个预警项中的任意一个预警项。第一预警事件中可以包含第一预警项的名称信息、第一预警项的监测值信息等。

S130:根据预先获得的事件与行为记录表,预测第一预警事件是否为重要事件。

在本发明的一个实施例中,在步骤S120生成第一预警事件后,可以在事件与行为记录表中记录第一预警事件。即在对目标服务器的预警项进行监测的过程中,生成的预警事件都可以记录到事件与行为记录表中。

在本发明实施例中,事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息。根据标记信息,可以确定每个历史预警事件是否为重要事件。用户可以是管理员、技术人员等。

在步骤S120生成第一预警事件后,可以根据预先获得的事件与行为记录表,预测第一预警事件是否为重要事件。如果是,则可以继续执行步骤S140的操作。如果否,则在事件与行为记录表中记录第一预警事件后,不做其他操作。

在本发明的一种具体实施方式中,步骤S130可以包括以下步骤:

步骤一:在预先获得的事件与行为记录表中查找第一预警项对应的历史预警事件;

步骤二:根据查找到的每个历史预警事件对应的监测值及每个历史预警事件的标记信息,预测第一预警事件是否为重要事件。

为便于描述,将上述两个步骤结合起来进行说明。

事件与行为记录表中记录有每个预警项对应的历史预警事件及每个历史预警事件的标记信息。

通过查找事件与行为记录表,可以查找到第一预警项对应的历史预警事件。每个历史预警事件对应第一预警项的一个监测值。

根据查找到的每个历史预警事件对应的监测值及每个历史预警事件的标记信息,可以预测第一预警事件是否为重要事件。具体的,可以以第一预警项对应的历史预警事件为训练数据,使用分类算法,预测当前生成的第一预警事件是否为重要事件。

在本发明的一种具体实施方式中,可以利用kNN算法进行分类预测。kNN算法是指将事件与行为记录表中的数据,即每个预警项对应的历史预警事件作为训练数据集,训练数据集中只存在两种类型,一种为重要事件类型,一种为非重要事件类型,训练过程中找出两种类型的中心点。当新的预警事件发生时,计算该预警事件对应的监测值与训练数据集中两中心点的欧氏距离,预测结果为与其距离较小的中心点的类型。预测完成后,更新类型中心点。

举例而言,假设第一预警项为内存使用状态,其对应的设定阈值为50%,在事件与行为记录表中记录的该第一预警项对应的历史预警事件分别为:

事件1:监测值为55%,标记信息为非重要事件;

事件2:监测值为60%,标记信息为非重要事件;

事件3:监测值为80%,标记信息为重要事件。

当前第一预警事件:监测值为58%,其与非重要事件类型中心点的距离小于其与重要事件类型中心点的距离,可以预测该第一预警事件为非重要事件。

如果事件与行为记录表中没有记录第一预警项对应的历史预警事件,则可以直接将第一预警事件确定为重要事件。

S140:将针对第一预警事件的预警通知发送给用户。

根据事件与行为记录表,如果预测第一预警事件为重要事件,则可以将针对第一预警事件的预警通知发送给用户。具体的,可以通过短信、邮件或者电话等方式发送该预警通知。以便用户能够及时获知第一预警事件,并及时处理相应问题。用户可以通过预警系统对外提供的HTTP接口,配置接收预警通知的方式。

根据用户对历史预警事件的处理行为预测第一预警事件是否为重要事件,如果是重要事件,则表明第一预警事件是用户更加关注的问题,预警作用更为有效。

应用本发明实施例所提供的方法,在监测目标服务器的预警项的过程中,如果第一预警项的监测值达到该第一预警项对应的设定阈值,则可以生成第一预警事件,根据事件与行为记录表,可以预测第一预警事件是否为重要事件,如果第一预警事件为重要事件,则可以将针对该第一预警事件的预警通知发送给用户。事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息,在生成第一预警项对应的第一预警事件后,可以根据用户对第一预警项对应的历史预警事件的重要程度,预测第一预警事件是否为重要事件,参考了用户对于服务器状态的认知,可以自适应地确定是否发出针对该第一预警事件的预警通知,避免频繁发送预警通知给用户带来困扰,使得发出的预警通知更加合理有效,缩短了管理员对预警事件的处理时间,提高了预警系统的可用性。

在本发明的一个实施例中,该方法还可以包括以下步骤:

如果监测到用户基于第一预警事件对目标服务器进行了相应处理,则在事件与行为记录表中将第一预警事件标记为重要事件。

在本发明实施例中,生成第一预警事件后,可以在事件与行为记录表中记录第一预警事件。无论是否向用户发送针对第一预警事件的预警通知,用户都可以通过事件与行为记录表查看到该第一预警事件。

如果监测到用户基于该第一预警事件对目标服务器进行了相应处理,则表明该第一预警事件为重要事件,可以在事件与行为记录表中将第一预警事件标记为重要事件。

在本发明的一个实施例中,在步骤S140之后,还可以包括以下步骤:

第一个步骤:接收用户基于预警通知的反馈信息;

第二个步骤:如果反馈信息为忽略预警通知,则在事件与行为记录表中将第一预警事件标记为非重要事件;

第三个步骤:如果反馈信息为接受预警通知,则在事件与行为记录表中将第一预警事件标记为重要事件。

为便于描述,将上述三个步骤结合起来进行说明。

在将针对第一预警事件的预警通知发送给用户后,用户可以分析并判断第一预警事件对应的问题的严重性,并做出处理或者忽略。用户可以基于该预警通知返回反馈信息。如果用户认为该预警通知较为重要,则可以返回接受该预警通知的反馈信息,如果用户认为该预警通知并不重要,或者当前并不需要对该预警通知对应的第一预警事件进行处理,则可以返回忽略该预警通知的反馈信息。

根据用户的反馈信息,可以确定是否要在事件与行为记录表中将第一预警事件标记为重要事件。具体的,如果反馈信息为忽略预警通知,则在事件与行为记录表中将第一预警事件标记为非重要事件,如果反馈信息为接受预警通知,表明用户接受了该预警通知,则可以在事件与行为记录表中将第一预警事件标记为重要事件。

本发明实施例引入了用户对预警通知的行为的影响,用户对于整个服务器的状态具有较好的认识和把握,如服务器运行的业务类型、可能存在的风险等。

经过多次迭代,预警系统发出的预警通知契合用户的处理结果。针对不需要发送预警通知的预警事件,预警系统可以取消该预警通知,这样,可以减少预警通知发送频次,减少管理员的工作量。

应用本发明实施例所提供的技术方案,预警系统可以自我调整,逐渐适应于用户关注的服务器状态,从而使得发送的预警通知更加有效、必要。

相应于上面的方法实施例,本发明实施例还提供了一种服务器预警装置,下文描述的一种服务器预警装置与上文描述的一种服务器预警方法可相互对应参照。

参见图2所示,该装置可以包括以下模块:

预警项监测模块210,用于在目标服务器运行过程中,监测目标服务器的预警项;

预警事件生成模块220,用于如果第一预警项的监测值达到第一预警项对应的设定阈值,则生成第一预警事件;

重要事件预测模块230,用于根据预先获得的事件与行为记录表,预测第一预警事件是否为重要事件,事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息,如果是,则触发预警通知发送模块240;

预警通知发送模块240,用于将针对第一预警事件的预警通知发送给用户。

应用本发明实施例所提供的装置,在监测目标服务器的预警项的过程中,如果第一预警项的监测值达到该第一预警项对应的设定阈值,则可以生成第一预警事件,根据事件与行为记录表,可以预测第一预警事件是否为重要事件,如果第一预警事件为重要事件,则可以将针对该第一预警事件的预警通知发送给用户。事件与行为记录表中记录有每个预警项对应的历史预警事件及针对每个历史预警事件,根据用户对该历史预警事件的处理行为,确定的该历史预警事件的重要程度的标记信息,在生成第一预警项对应的第一预警事件后,可以根据用户对第一预警项对应的历史预警事件的重要程度,预测第一预警事件是否为重要事件,参考了用户对于服务器状态的认知,可以自适应地确定是否发出针对该第一预警事件的预警通知,避免频繁发送预警通知给用户带来困扰,使得发出的预警通知更加合理有效,缩短了管理员对预警事件的处理时间,提高了预警系统的可用性。

在本发明的一种具体实施方式中,重要事件预测模块230,具体用于:

在预先获得的事件与行为记录表中查找第一预警项对应的历史预警事件;

根据查找到的每个历史预警事件对应的监测值及每个历史预警事件的标记信息,预测第一预警事件是否为重要事件。

在本发明的一种具体实施方式中,还包括预警事件记录模块,用于:

在生成第一预警事件之后,在事件与行为记录表中记录第一预警事件。

在本发明的一种具体实施方式中,还包括:

重要事件第一标记模块,用于在监测到用户基于第一预警事件对目标服务器进行了相应处理时,在事件与行为记录表中将第一预警事件标记为重要事件。

在本发明的一种具体实施方式中,还包括重要事件第二标记模块,用于:

在将针对第一预警事件的预警通知发送给用户之后,接收用户基于预警通知的反馈信息;

如果反馈信息为忽略预警通知,则在事件与行为记录表中将第一预警事件标记为非重要事件;

如果反馈信息为接受预警通知,则在事件与行为记录表中将第一预警事件标记为重要事件。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的技术方案及其核心思想。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1