业务应用的失效监测方法、计算机设备和存储介质与流程

文档序号:23726608发布日期:2021-01-26 17:12阅读:57来源:国知局
业务应用的失效监测方法、计算机设备和存储介质与流程

[0001]
本申请涉及云计算服务上的应用服务技术,尤其涉及一种业务应用的失效监测方法、计算机设备和存储介质。


背景技术:

[0002]
云计算(cloud computing)是分布式计算的一种,云计算的核心就是以互联网为中心,在网站上提供快速且安全的云计算服务与数据存储,让每一个使用互联网的人都可以使用网络上的庞大计算资源与数据中心。当前,云计算服务发展已经非常成熟,很多的机构、企业、事业等组织机构逐渐将自己的业务应用部署在云计算上。
[0003]
但是,云计算的发展依然面临许多关键性的问题,如云计算上的业务应用的状态失效时,无法区分是云计算基础设施服务引发的业务状态失效,还是业务应用自身的内存溢出,或者业务应用所在的服务器夯死引发的业务状态失效。这样不仅不利于快速依据状态失效原因恢复业务应用的状态,也不利于后续的云计算或者业务应用的架构和优化。
[0004]
因此,如何确定云计算上的业务应用的状态失效的原因,依然是需要解决的问题。


技术实现要素:

[0005]
本申请提供一种业务应用的失效监测方法、计算机设备和存储介质,用以解决现有技术中无法确定云计算上的业务应用的状态失效的原因的问题。
[0006]
一种业务应用的失效监测方法,应用于云服务系统,所述云服务系统包括监测服务器、第一日志分析系统、第二日志分析系统和云主机,包括:
[0007]
所述监测服务器从所述第一日志分析系统处获取目标业务应用的状态;
[0008]
若所述目标业务应用的状态为失效,则所述监测服务器从所述第二日志分析系统处获取所述目标业务应用失效时所述云主机的运行状态;
[0009]
若所述云主机的运行状态为运行正常,则所述监测服务器确定所述目标业务应用的状态失效的原因为所述目标业务应用异常;
[0010]
若所述云主机的运行状态为运行异常,则所述监测服务器确定所述目标业务应用的状态失效的原因为云主机异常。
[0011]
其中一个实施例中,所述云服务系统还包括业务应用服务器和多个业务应用探测服务器,所述方法还包括:
[0012]
所述业务应用探测服务器从所述业务应用服务器获取所述目标业务应用的进程的探测数据;
[0013]
所述业务应用探测服务器根据所述目标业务应用的进程的探测数据,得到所述目标业务应用的进程的状态;
[0014]
所述业务应用探测服务器将所述目标业务应用的进程的状态发送给所述第一日志分析系统;
[0015]
所述第一日志分析系统根据所述目标业务应用的进程的状态,确定所述目标业务
应用的状态。
[0016]
其中一个实施例中,所述云服务系统还包括信息配置服务器,所述业务应用探测服务器从所述业务应用服务器获取所述目标业务应用的进程的探测数据之前,所述方法还包括:
[0017]
所述信息配置服务器获取所述目标业务应用的探测配置信息,所述探测配置信息包括所述目标业务应用的应用名称、服务接口信息、应用访问路径和监测频率;
[0018]
所述信息配置服务器根据所述探测配置信息生成业务应用探测指令,并将所述业务应用探测指令发送给所述业务应用探测服务器;所述业务应用探测指令用于指示所述业务应用探测服务器对所述业务应用服务器上的所述目标业务应用的进程进行探测。
[0019]
其中一个实施例中,所述方法还包括:
[0020]
所述信息配置服务器从所述第一日志分析系统处获取所述目标业务应用的进程状态,并根据所述目标业务应用的进程状态生成所述目标业务应用的进程状态分析图;所述进程状态分析图用于显示所述目标业务应用中每个进程的状态。
[0021]
其中一个实施例中,所述云服务系统还包括告警服务器,所述方法还包括:
[0022]
所述告警服务器从所述第一日志分析系统处获取所述目标业务应用中状态失效的所述进程对应的业务应用探测服务器的标识;
[0023]
所述告警服务器根据所述状态失效的所述进程对应的业务应用探测服务器的标识生成服务器异常信息;
[0024]
所述告警服务器将所述服务器异常信息发送至所述业务应用服务器。
[0025]
其中一个实施例中,所述云服务系统还包括重启服务器,所述告警服务器从所述第一日志分析系统处获取所述目标业务应用中状态失效的所述进程对应的业务应用探测服务器的标识之后,所述方法还包括:
[0026]
所述重启服务器根据所述状态失效的所述进程对应的服务器标识生成所述目标业务应用的重启命令;
[0027]
所述重启服务器将所述重启命令发送至所述业务应用服务器。
[0028]
其中一个实施例中,所述云服务系统还包括云主机探测服务器,所述监测服务器从所述第二日志分析系统处获取所述目标业务应用失效时所述云主机的运行状态之前,所述方法还包括:
[0029]
所述云主机探测服务器从所述云主机获取所述云主机的探测数据;
[0030]
所述云主机探测服务器根据所述云主机的探测数据,得到所述云主机的运行状态;
[0031]
所述云主机探测服务器将所述云主机的运行状态发送给所述第二日志分析系统。
[0032]
其中一个实施例中,所述方法还包括:
[0033]
所述信息配置服务器接收云主机探测指令,并将所述云主机探测指令发送给所述云主机探测服务器,所述云主机探测指令用于指示所述云主机探测服务器对所述云主机的运行状态进行探测。
[0034]
另一方面,本申请还提供一种云服务系统,包括监测服务器、第一日志分析系统、第二日志分析系统和云主机;
[0035]
所述监测服务器,用于从所述第一日志分析系统处获取目标业务应用的状态,若
所述目标业务应用的状态为失效,则从所述第二日志分析系统处获取所述目标业务应用失效时所述云主机的运行状态;
[0036]
所述监测服务器,还用于若所述云主机的运行状态为运行正常,则确定所述目标业务应用的状态失效的原因为所述目标业务应用异常,若所述云主机的运行状态为运行异常,则确定所述目标业务应用的状态失效的原因为云主机异常。
[0037]
其中一个实施例中,还包括:业务应用服务器和多个业务应用探测服务器;
[0038]
所述业务应用探测服务器,用于从所述业务应用服务器获取所述目标业务应用的进程的探测数据,根据所述目标业务应用的进程的探测数据,得到所述目标业务应用的进程的状态,将所述目标业务应用的进程的状态发送给所述第一日志分析系统;
[0039]
所述第一日志分析系统,用于根据所述目标业务应用的进程的状态,确定所述目标业务应用的状态。
[0040]
其中一个实施例中,还包括:信息配置服务器;
[0041]
所述信息配置服务器,用于获取所述目标业务应用的探测配置信息,所述探测配置信息包括所述目标业务应用的应用名称、服务接口信息、应用访问路径和监测频率,根据所述探测配置信息生成业务应用探测指令,并将所述业务应用探测指令发送给所述业务应用探测服务器;所述业务应用探测指令用于指示所述业务应用探测服务器对所述业务应用服务器上的所述目标业务应用的进程进行探测。
[0042]
其中一个实施例中,所述信息配置服务器还用于从所述第一日志分析系统处获取所述目标业务应用的进程状态,并根据所述目标业务应用的进程状态生成所述目标业务应用的进程状态分析图;所述进程状态分析图用于显示所述目标业务应用中每个进程的状态。
[0043]
其中一个实施例中,还包括:告警服务器;
[0044]
所述告警服务器,用于从所述第一日志分析系统处获取所述目标业务应用中状态失效的所述进程对应的业务应用探测服务器的标识,根据所述状态失效的所述进程对应的业务应用探测服务器的标识生成服务器异常信息,将所述服务器异常信息发送至所述业务应用服务器。
[0045]
其中一个实施例中,还包括:重启服务器;
[0046]
所述重启服务器,用于根据所述状态失效的所述进程对应的服务器标识生成所述目标业务应用的重启命令,将所述重启命令发送至所述业务应用服务器。
[0047]
其中一个实施例中,还包括:云主机探测服务器;
[0048]
所述云主机探测服务器,用于从所述云主机获取所述云主机的探测数据,根据所述云主机的探测数据,得到所述云主机的运行状态,将所述云主机的运行状态发送给所述第二日志分析系统。
[0049]
其中一个实施例中,所述信息配置服务器还用于接收云主机探测指令,并将所述云主机探测指令发送给所述云主机探测服务器,所述云主机探测指令用于指示所述云主机探测服务器对所述云主机的运行状态进行探测。
[0050]
本申请提供一种业务应用的失效监测方法,获取了目标业务应用状态失效时云主机的运行状态,若该目标业务应用失效时该云主机的运行状态为运行正常,则可以确定是由于该目标业务应用自身运行异常导致的失效。若该目标业务应用失效时该云主机的运行
状态为运行异常,则确定该目标业务应用失效的原因是由于云主机运行异常导致的应用状态失效。因此,本申请提供的方法可以有效区分业务应用失效的原因,以便快速依据业务失效原因恢复业务应用的状态,有利于后续的云计算或业务应用的架构和优化。
附图说明
[0051]
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0052]
图1为本申请的一个实施例提供的云服务系统的示意图。
[0053]
图2为本申请的一个实施例提供的业务应用的失效监测方法的流程示意图。
[0054]
图3为本申请的另一个实施例提供的云服务系统的示意图。
[0055]
图4为本申请的另一个实施例提供的业务应用的失效监测方法的流程示意图。
[0056]
图5为本申请的又一个实施例提供的云服务系统的示意图。
[0057]
图6为本申请的又一个实施例提供的业务应用的失效监测方法的流程示意图。
[0058]
图7为本申请的另一个实施例提供的业务应用的失效监测方法的流程示意图。
[0059]
图8为本申请的一个实施例提供的进程状态分析图的示意图。
[0060]
图9为本申请的又一个实施例提供的云服务系统的示意图。
[0061]
图10为本申请的又一个实施例提供的业务应用的失效监测方法的流程示意图。
[0062]
图11为本申请提供的云服务系统的示意图。
[0063]
通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
[0064]
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0065]
云计算(cloud computing)是分布式计算的一种,云计算的核心就是以互联网为中心,在网站上提供快速且安全的云计算服务与数据存储,让每一个使用互联网的人都可以使用网络上的庞大计算资源与数据中心。当前,云计算服务发展已经非常成熟,很多的机构、企业、事业等组织机构逐渐将自己的业务应用部署在云计算上,以拥抱云计算行业为各产业带来的无限计算、存储、网络能力、弹性伸缩、海量存储、实时业务上线等优势,为各个使用云计算的客户带来了焕然一新的业务体验。但是,云计算的发展依然面临许多关键性的问题,如云计算上的业务应用的有效性,是当前需要引起重视的问题。当云计算上的业务应用的状态失效时,现有技术无法区分是云计算基础设施服务引发的业务状态失效,还是业务应用自身的内存溢出,或者业务应用所在的服务器夯死引发的业务状态失效。这样不仅不利于快速依据状态失效原因恢复业务应用的状态,也不利于后续的云计算或者业务应用的架构和优化,有时候还会引起云计算服务商和软件业务应用商之间的无证据纠纷等。目前,vmvare公司通过购买各中间件的许可证来开发监测各个中间件的健康状态,比如开
发探测mysql中间件的状态,开发tomcat的主状态,但是目前的中间件行业发展特别快,接口开发的速度跟不上中间件新增的速度,况且有些中间件开发商并不愿意开发接口出来,这些都导致vmvare公司所监测的业务状态也只是业务应用的一部分,达不到对业务应用的全面监测。因此,如何确定云计算上的业务应用的状态失效的原因,依然是需要解决的问题。
[0066]
本申请基于上述的问题,提供一种业务应用的失效监测方法,通过分别监测目标业务应用失效时,目标业务应用的状态和云主机的状态,确定目标业务应用失效的原因是目标业务应用异常还是云主机异常,解决了现有技术中无法确定云计算上的业务应用的状态失效的原因的问题。
[0067]
本申请提供的业务应用的失效监测方法应用于云服务系统10,如图1所示,该云服务系统10包括监测服务器11、第一日志分析系统12、第二日志分析系统13和云主机14。该第一日志分析系统12用于记录目标业务应用的状态,该第二日志分析系统用于记录云主机的状态。该监测服务器11用于分别确定该目标业务应用失效时,该目标业务应用的状态和该云主机14的状态。通过业务应用的服务日志状态和云主机的进程状态信息的联动分析,可以一起分析云服务的问题,为业务应用、云主机基础设施,提供了非常有价值的分析数据,可以促进业务应用、云主机基础设置的优化进程。
[0068]
可以理解,监测服务器11、第一日志分析系统12、第二日志分析系统13和云主机14可以分别运行在独立的物理设备上,也可以集成在多个物理设备上。该集成在多个物理设备上例如,该监测服务器11部署在一个物理服务器上,该第一日志分析系统12和该第二日志分析系统13部署在另一个物理服务器上,该云主机14的数量可以为多个,该云主机14通常部署在用户设备上,例如,该云主机14部署在用户的个人电脑上。该监测服务器11、该第一日志分析系统12和该第二日志分析系统13也可以部署在一个物理服务器上,该云主机14部署在用户设备上。
[0069]
请参见图1和图2,图2所示的业务应用的失效监测方法可以应用于图1所示的云服务系统10,该失效监测方法包括:
[0070]
s201,该监测服务器从该第一日志分析系统处获取目标业务应用的状态。
[0071]
在一个可选的实施例中,该第一日志分析系统12记录的该目标业务应用的状态并不是该目标业务应用的连续的状态,而是在预设心跳频率下获取到的该目标业务应用的状态。该预设心跳频率例如30秒,则每隔30秒该第一日志分析系统12记录一次该目标业务应用的状态。该预设心跳频率可以由工作人员根据实际需要进行设置。
[0072]
s202,若该目标业务应用的状态为失效,则该监测服务器从该第二日志分析系统处获取该目标业务应用失效时该云主机的运行状态。
[0073]
该监测服务器11可以判断该目标业务应用的状态是否为失效,若该目标业务应用的状态为失效,则该监测服务器11继续判断该云主机14的运行状态,若该目标业务应用的状态为正常运行,则该监测服务器11不继续判断该云主机14的运行状态。与该第一日志分析系统12相似,在一个可选的实施例中,该第二日志分析系统13记录的该云主机14的状态并不是该云主机14的连续的状态,而是在该预设心跳频率下获取到的该目标业务应用的状态。在一个可选的实施例中,该第一日志分析系统12和该第二日志分析系统13开始进行状态记录的时刻相同,进行状态记录的时刻相同。例如,该预设心跳频率为30秒,该第一日志
分析系统12在该预设心跳频率下进行该目标业务应用的运行状态的记录时,记录的时刻依次为00:30分、01:00分、01:30分、02:00分、02:30分、03:00分。该第二日志分析系统13在该预设心跳频率下进行该云主机14的状态的记录时,记录的时刻依次为00:30分、01:00分、01:30分、02:00分、02:30分、03:00分。该第一日志分析系统12在01:30分记录到该目标业务应用的状态为失效时,此时需要获取该第二日志分析系统13在01:30分记录到的云主机14的运行状态。
[0074]
s203,若该云主机的运行状态为运行正常,则该监测服务器确定该目标业务应用的状态失效的原因为该目标业务应用异常。
[0075]
例如,该第一日志分析系统12在01:30分记录到该目标业务应用的状态为失效时,该第二日志分析系统13在01:30分记录到的云主机14的运行状态为运行正常,则确定该目标业务应用的状态失效的原因为该目标业务应用异常,该目标业务应用异常例如目标业务应用自身的内存溢出、或者业务应用所在的服务器夯死。
[0076]
s204,若该云主机的运行状态为运行异常,则该监测服务器确定该目标业务应用的状态失效的原因为云主机异常。
[0077]
例如,该第一日志分析系统12在01:30分记录到该目标业务应用的状态为失效时,该第二日志分析系统13在01:30分记录到的云主机14的运行状态为运行异常,则确定该目标业务应用的状态失效的原因为云主机14异常。
[0078]
本实施例提供一种业务应用的失效监测方法,获取了目标业务应用状态失效时云主机14的运行状态,若该目标业务应用失效时该云主机14的运行状态为运行正常,则可以确定是由于该目标业务应用自身运行异常导致的失效。若该目标业务应用失效时该云主机14的运行状态为运行异常,则确定该目标业务应用失效的原因是由于云主机14运行异常导致的应用状态失效。因此,本申请提供的方法可以有效区分业务应用失效的原因,以便快速依据业务失效原因恢复业务应用的状态,有利于后续的云计算或业务应用的架构和优化。
[0079]
请参见图3,在本申请的一个实施例中,该云服务系统10还包括业务应用服务器15和多个业务应用探测服务器16,该业务应用服务器15运行有该目标业务应用,该业务应用探测服务器16可以从该业务应用服务器15处探测该目标业务应用的运行数据等,请参见图3和图4,图4所示的业务应用的失效监测方法可以应用于图3所示的云服务系统10,在执行步骤s201~步骤s203以后,该业务应用的失效监测方法还包括:
[0080]
s401,该业务应用探测服务器从该业务应用服务器获取该目标业务应用的进程的探测数据。
[0081]
该目标业务应用在运行过程中会有多个进程,每个进程都有各自的状态。以新浪邮箱为目标业务应用为例,客户在使用新浪邮箱时会有多个操作步骤,例如可以依次登录邮箱、打开邮箱的联系人列表、创建新邮件、发送邮件等。每个操作步骤都对应一个进程,一个该业务应用探测服务器16可以从该业务应用服务器15获取该目标业务应用的一个进程的探测数据,多个该业务应用探测服务器16可以分别从该业务应用服务器15获取该目标业务应用的多个进程的探测数据。在实际操作中,该目标业务应用在使用过程中所涉及到的进程是根据实际情况确定的,例如,客户在使用新浪邮箱时涉及到的进程只包括登录邮箱和打开邮箱的联系人列表,则该新浪邮箱在使用过程中所涉及的进程就只有两个。
[0082]
s402,该业务应用探测服务器根据该目标业务应用的进程的探测数据,得到该目
标业务应用的进程的状态。
[0083]
该业务应用探测服务器16获取到了该目标业务应用的多个进程的探测数据,根据该目标业务应用的多个进程的探测数据可以确定该目标业务应用的多个进程的状态。
[0084]
s403,该业务应用探测服务器将该目标业务应用的进程的状态发送给该第一日志分析系统。
[0085]
该第一日志分析系统12可以记录该目标业务应用在使用过程中涉及到的每个进程的状态,若某一个进程处于失效状态,则该第一日志分析系统12可以记录该进程的状态为失效状态。若某一个进程处于正常运行状态,则该第一日志分析系统12可以记录该进程的状态为正常状态。
[0086]
s404,该第一日志分析系统根据该目标业务应用的进程的状态,确定该目标业务应用的状态。
[0087]
若该目标业务应用在使用过程中涉及到的进程的状态均为正常状态,则该目标业务应用的状态为正常。若该目标业务应用在使用过程中涉及到的任意一个进程的状态为失效状态,则该目标业务应用的状态为失效。基于步骤s202至步骤s204的描述,此时该目标业务应用的状态为失效的原因可能是该目标业务应用自身异常,也可能是该云主机14异常引起的该目标业务应用的状态失效。若该目标业务应用失效时该云主机14的运行状态为运行异常,则该监测服务器11确定该目标业务应用的状态失效的原因为云主机14异常。
[0088]
请参见图5,在本申请的一个实施例中,该云服务系统还包括信息配置服务器17,客户可以在该信息配置服务器17上配置该目标业务应用的探测配置信息,参见图5和图6,图6所示的业务应用失效的监控方法可以应用于图5所示的云服务系统10中,步骤s401之前,该业务应用的失效监测方法还包括:
[0089]
s601,该信息配置服务器获取该目标业务应用的探测配置信息,该探测配置信息包括该目标业务应用的应用名称、服务接口信息、应用访问路径和监测频率。
[0090]
该目标业务应用的应用名称例如为updatevpeport,该应用访问路径例如为http://ip:port/v1/yc/cmp-cloud-network/updatevpeport,该监测频率即上述的该心跳频率,每个该业务应用探测服务器16需同时,同频率获取对应的进程的探测数据。该服务接口信息例如下表所示:
[0091]
参数名参数说明参数位置参数类型是否必选备注baseinfo基本信息无jsonobject是 accountid账户idbaseinfostring是 userid用户idbaseinfostring是 properties区域对象无jsonobject是 portid端口idpropertiesstring是 localport本端端口名称propertiesstring否 localvlanid本端端口vlanidpropertiesstring否 localaddress本端端口地址propertiesstring否 mtu端口mtupropertiesstring否 description端口描述propertiesstring否 [0092]
s602,该信息配置服务器根据该探测配置信息生成业务应用探测指令,并将该业
务应用探测指令发送给该业务应用探测服务器16;该业务应用探测指令用于指示该业务应用探测服务器16对该业务应用服务器15上的该目标业务应用的进程进行探测。
[0093]
具体的,该业务应用探测指令用于指示该业务应用探测服务器16根据该应用访问路径和该服务接口信息访问该应用名称对应的业务应用,即该目标业务应用,再根据该监测频率探测该目标业务应用的进程。该监测频率可以根据实际需要设置,本申请不做限定。客户可以在客户端的自服务界面上配置该目标业务应用的探测配置信息,在配置好该探测配置信息后,该信息配置服务器会根据该探测配置信息赋予该目标业务应用对应的用于测试的账户名,例如张三,该用于测试的账户名被授权进行该目标业务应用的访问。即,客户在进行该目标业务应用的访问时,用的是该用于测试的账户名,而不是客户设置的名称。被赋予用于测试的账户名可以减少该业务应用探测指令对于业务应用的影响。即,业务应用部署者在配置云主机14的自服务信息时,可以专为云计算平台配置一个账户,即该用于测试的账户,并且对此账户的业务逻辑处理只做response,不做后续处理,以此来减少心跳测试对于目标业务应用的影响。该心跳测试指的是步骤s401。
[0094]
可选的,该云服务系统10还包括云主机探测服务器18,该信息配置服务器17还用于接受云主机探测指令,并将该云主机探测指令发送至该云主机探测服务器17。
[0095]
该业务应用的失效监测方法还包括:该信息配置服务器接收客户输入的该云主机探测指令,并将该云主机探测指令发送给该云主机探测服务器,该云主机探测指令用于指示该云主机探测服务器对该云主机的运行状态进行探测。
[0096]
该云主机探测指令例如为操作系统top命令,该信息配置服务器17在接收到该云主机探测指令后,将该云主机探测指令发送给该云主机探测服务器,该云主机探测服务器在接收到该云主机探测指令后对该云主机14的运行状态进行探测。
[0097]
请参见图5和7,图7所示业务应用失效的监控方法可以应用于图5所示的云服务系统10中,步骤s202之前,该业务应用的失效监测方法还包括:
[0098]
s701,该云主机探测服务器从该云主机获取该云主机的探测数据。
[0099]
在一个可选的实施例中,该云主机的探测数据包括该云主机的处理器利用率数据、存储器利用率数据和接口利用率数据。该云主机探测服务器18在获取该云主机的探测数据时,也是以与该多个业务应用探测服务器16所使用的该监测频率为准获取探测数据。例如,该业务应用探测服务器16的监测频率为30秒,即每隔30秒获取一次进程的探测数据,则该云主机探测服务器18也是每隔30秒获取一次云主机的探测数据。若该云主机探测服务器18和该业务应用探测服务器16开始获取探测数据的时间不一致,则需要先校准,使该云主机探测服务器和该业务应用探测服务器16开始获取探测数据的时间一致。即,该云主机探测服务器和多个该业务应用探测服务器16为同时,同监测频率工作。还需要说明的是,该云主机探测服务器18也可以不用接受该云主机探测指令,该云主机探测服务器18也可以设定为以该监测频率为准获取该云主机12的探测数据。
[0100]
s702,该云主机探测服务器根据该云主机的探测数据,得到该云主机的运行状态。
[0101]
该云主机探测服务器18获取到该云主机14的处理器利用率数据、存储器利用率数据和接口利用率数据之后,分别判断该处理器利用率数据的值是否超过预设处理器利用率,以及判断该存储器利用率数据的值是否超过预设存储器利用率数据,以及判断该接口利用率数据的值是否超过预设接口利用率数据。若该处理器利用率数据的值超过预设处理
器利用率,或该存储器利用率数据的值超过预设存储器利用率数据,或该接口利用率数据的值超过预设接口利用率数据,则确定该云主机14的运行状态为运行异常。若该处理器利用率数据的值不超过预设处理器利用率,且该存储器利用率数据的值不超过预设存储器利用率数据,且该接口利用率数据的值不超过预设接口利用率数据,则确定该云主机14的运行状态为运行正常。
[0102]
s703,该云主机探测服务器将该云主机的运行状态发送给该第二日志分析系统。
[0103]
该第二日志分析系统13根据该监测频率的监测时刻分别记录该云主机14的运行状态。例如01:30分,记录到的该云主机14的运行状态为运行正常,02:00分,记录到该云主机14的运行状态为运行正常,02:30分记录到该云主机14的运行状态为运行异常,以此类推。
[0104]
本实施例提供的方法可以通过该云主机探测服务器18获取该云主机14的处理器利用率数据,存储器利用率数据和接口利用率数据,并分别判断该处理器利用率数据的值是否超过预设处理器利用率,以及判断该存储器利用率数据的值是否超过预设存储器利用率数据,以及判断该接口利用率数据的值是否超过预设接口利用率数据,进而确定该云主机14的运行状态为运行正常还是运行异常。本实施例提供的方法在该目标业务应用的状态为失效的时候,提供该云主机14的运行状态,从而使该监测服务器11可以确定该目标业务应用的状态失效的原因是目标业务应用异常还是云主机14的运行异常,解决了现有技术中无法确定云计算上的业务应用的状态失效的原因的问题。
[0105]
可选的,该信息配置服务器17还用于:从该第一日志分析系统12处获取该目标业务应用的进程状态,并根据该目标业务应用的进程状态生成该目标业务应用的进程状态分析图;该进程状态分析图用于显示该目标业务应用中每个进程的状态。
[0106]
该进程分析图为可视化图形,例如图8所示的柱状图,该柱状图的竖轴代表进程的持续时长,该柱状图的横轴代表不同的进程。若某个进程处于失效的状态,则该进程对应在该柱状图上的进程的持续时长为0,例如图8所示的柱状图中,进程3处于失效状态,则进程3在该柱状图上的进程的持续时长为0,进程3以后的进程,即进程4、进程5在该柱状图上的进程的持续时长也为0。
[0107]
参见图9,在本申请的一个实施例中,该云服务系统还包括告警服务器19和重启服务器20,该告警服务器19用于生成该目标业务应用中失效的进程对应的服务器标识,该重启服务器20和该告警服务器19用于从该告警服务器19处获知该目标业务应用中的失效的进程,并针对该失效的进程生成重启脚本。参照图9和图10,图10所示业务应用失效的监控方法可以应用于图9所示的云服务系统10中,在执行步骤s601~步骤s602的基础上,该业务应用的失效监测方法还包括:
[0108]
s1001,该告警服务器从该第一日志分析系统处获取该目标业务应用中状态失效的该进程对应的业务应用探测服务器16的标识。
[0109]
一个该业务应用探测服务器16用于获取一个进程的探测数据。该第一日志分析系统12在记录该目标业务应用中的进程的状态时,也记录了与每个进程对应的业务应用探测服务器16的标识。当某个进程失效时,该告警服务器19可以从该第一日志分析系统12处获取到与失效的进程对应的业务应用探测服务器16的标识。
[0110]
s1002,该告警服务器根据该状态失效的该进程对应的业务应用探测服务器的标
识生成服务器异常信息。
[0111]
该服务器异常信息可以显示该目标业务应用中失效的进程对应的业务应用探测服务器16的标识。
[0112]
s1003,该告警服务器将该服务器异常信息发送至该业务应用服务器。
[0113]
客户可以通过该服务器异常信息获知该目标业务应用中失效的进程对应的业务应用探测服务器16的标识,进而获知该目标业务应用中失效的进程。通过获知该目标业务应用中失效的进程后,可以精确得确定该目标业务应用失效的具体原因,为重启该目标业务应用提供有效的参考。该告警服务器19还可以根据客户配置的信息发送方式,通过短信、或邮件、或电话的方式通知客户该服务器异常信息。
[0114]
s1004,该告警服务器将该状态失效的该进程对应的服务器标识发送给该重启服务器。
[0115]
在该告警服务器19获知该状态失效的该进程对应的服务器标识后,将该状态失效的该进程对应的服务器标识发送给该重启服务器20可以帮助该重启服务器20生成重启命令,具体如步骤s1105所述。
[0116]
s1005,该重启服务器根据该状态失效的该进程对应的服务器标识生成该目标业务应用的重启命令。
[0117]
该重启命令也可以称为重启脚本,该重启命令具体用于重启该目标业务应用中失效的进程。
[0118]
s1006,该重启服务器将该重启命令发送至该业务应用服务器。
[0119]
该重启服务器20将该重启命令,或者说该重启脚本发送至该业务应用服务器15后,该业务应用服务器15可以执行该重启脚本,从而重启该目标业务应用。
[0120]
本实施例提供的方法可以依据该目标业务应用中失效的进程进行该目标业务应用的重启,可以节省该目标业务应用的重启时间,提高该目标业务应用的重启效率。
[0121]
在图9所示的云服务系统10中,该云服务系统包括告警服务器19和重启服务器20,可选的,该云服务系统10还可以包括告警服务器19,但是不包括重启服务器20。
[0122]
本申请还提供一种云服务系统10,请参见图9或图11,该云服务系统10包括监测服务器11、第一日志分析系统12、第二日志分析系统13和云主机14。
[0123]
该监测服务器11用于从该第一日志分析系统12处获取目标业务应用的状态,若该目标业务应用的状态为失效,则从该第二日志分析系统13处获取该目标业务应用失效时该云主机14的运行状态。
[0124]
该监测服务器11还用于若该云主机14的运行状态为运行正常,则确定该目标业务应用的状态失效的原因为该目标业务应用异常,若该云主机14的运行状态为运行异常,则确定该目标业务应用的状态失效的原因为云主机异常。
[0125]
该云服务系统10还包括业务应用服务器15和多个业务应用探测服务器16。该业务应用探测服务器16用于从该业务应用服务器15获取该目标业务应用的进程的探测数据,根据该目标业务应用的进程的探测数据,得到该目标业务应用的进程的状态,将该目标业务应用的进程的状态发送给该第一日志分析系统12。该第一日志分析系统12用于根据该目标业务应用的进程的状态,确定该目标业务应用的状态。
[0126]
该云服务系统10还包括:信息配置服务器17。
[0127]
该信息配置服务器17用于获取该目标业务应用的探测配置信息,该探测配置信息包括该目标业务应用的应用名称、服务接口信息、应用访问路径和监测频率,根据该探测配置信息生成业务应用探测指令,并将该业务应用探测指令发送给该业务应用探测服务器16。该业务应用探测指令用于指示该业务应用探测服务器16对该业务应用服务器15上的该目标业务应用的进程进行探测。
[0128]
该信息配置服务器17还用于从该第一日志分析系统12处获取该目标业务应用的进程状态,并根据该目标业务应用的进程状态生成该目标业务应用的进程状态分析图。该进程状态分析图用于显示该目标业务应用中每个进程的状态。
[0129]
该信息配置服务器17还用于接收云主机探测指令,并将该云主机探测指令发送给该云主机探测服务器18,该云主机探测指令用于指示该云主机探测服务器18对该云主机14的运行状态进行探测。
[0130]
该云服务系统10还包括:云主机探测服务器18。
[0131]
该云主机探测服务器18用于从该云主机14获取该云主机14的探测数据,根据该云主机14的探测数据,得到该云主机14的运行状态,将该云主机14的运行状态发送给该第二日志分析系统13。
[0132]
该云服务器系统10还包括告警服务器19,该告警服务器19用于从该第一日志分析系统12处获取该目标业务应用中状态失效的该进程对应的业务应用探测服务器16的标识,根据该状态失效的该进程对应的业务应用探测服务器16的标识生成服务器异常信息,将该服务器异常信息发送至该业务应用服务器15。
[0133]
该云服务系统10还包括重启服务器20,该重启服务器20用于根据该状态失效的该进程对应的服务器标识生成该目标业务应用的重启命令,将该重启命令发送至该业务应用服务器15。
[0134]
可以理解,监测服务器11、第一日志分析系统12、第二日志分析系统13、云主机14、业务应用服务器15、业务应用探测服务器16、信息配置服务器17、云主机探测服务器18、告警服务器19和重启服务器20均可以分别运行在独立的物理设备上,也可以集成在多个物理设备上。该集成在多个物理设备上。例如,该监测服务器11部署在一个物理服务器上,该第一日志分析系统12和该第二日志分析系统13部署在另一个物理服务器上,该云主机14的数量可以为多个,该云主机14通常部署在用户设备上,该业务应用服务器15部署在一个物理服务器上,该业务应用探测服务器16、该信息配置服务器17和该云主机探测服务器18部署在一个物理服务器上,该告警服务器19和该重启服务器20部署在一个物理服务器上。
[0135]
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1