一种云计算集群服务状态监控方法和系统与流程

文档序号:12751646阅读:215来源:国知局
一种云计算集群服务状态监控方法和系统与流程

本发明涉及云计算服务器领域,尤其涉及一种云计算集群服务状态监控方法和系统。



背景技术:

云计算是一种全新的计算模式,其核心思想是企业或个人不再需要在电脑中安装大量应用软件,而是通过Web浏览器接入到一种大范围的、按需定制的服务中,即“云服务”。云计算技术将使用户体验发生根本性的变化。相比传统服务器架构,云计算服务器大大提高了其利用率,同时也在系统中省去了很多重复的硬件,将计算、存储、交换、管理等集成到标准系统中,并且与外界的网络设备、存储设备间的接口和通用架构保待一致。

集群服务器,简而言之,就是一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。一组集群服务器包含多台拥有共享数据存储空间的服务器,各服务器之间通过内部局域网进行相互通信;当其中一台服务器发生故障时,它所运行的应用程序将由其他的服务器自动接管;在大多数情况下,集群中所有的计算机都拥有一个共同的名称,集群系统内任意一台服务器都可被所有的网络用户所使用。

在云计算集群服务器系统中,由多个服务器组成的集群服务器做用户负载和服务器备份,用户登录服务器时,会根据云计算服务器负载到指定服务器上处理用户数据。其中服务器之间都有至少一个备份服务器,对大规模集群方式的云计算服务器组来说,感知其中一台服务器设备的指定业务模块异常非常重要,其中云计算服务器通常由网页处理模块,用户交互管理模块,用户数据存储模块组成,当其中一个业务模块出现异常时,其他模块无法感知。

现有技术存在的问题:现有技术是服务器设备异常后,等待管理员重启;或等待服务器设备进程异常调度超时,服务器设备重启,现有技术比较被动,无法实现对集群服务器状态的监控以及出现异常的提前预警。



技术实现要素:

本发明所要解决的技术问题是针对现有技术的不足,提供一种云计算集群服务状态监控方法和系统。

本发明解决上述技术问题的技术方案如下:一种云计算集群服务状态监控方法,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,包括如下步骤:

步骤S1,发送经过加密的报文给所述云计算集群;

步骤S2,判断经过预设第一时间阈值后,是否未接收到所述云计算集群返回的报文或者接收到的报文出错,若是,则产生云计算集群状态异常提醒信息,否则返回步骤S1。

本发明的有益效果是:本发明能够提前感知云服务集群的异常,并根据异常进行相应的动作,化被动为主动。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步地,步骤S1中,每隔预设第二时间阈值发送经过加密的报文给所述云计算集群。

进一步地,步骤S2中,若未接收到所述云计算集群中所述云计算服务器的非数据模块返回的报文或者接收到的报文出错,则发送重启信息给所述非数据模块对应的云计算服务器。

进一步地,步骤S2中,若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

进一步地,步骤S2中,若未接收到所述云计算集群中所述备份服务器返回的报文或者接收到的报文出错,则发送重启信息给所述备份数据库。

本发明解决上述技术问题的另一种技术方案如下:一种云计算集群服务状态监控系统,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,包括:

发送模块,用于发送经过加密的报文给所述云计算集群;

判断模块,用于判断经过预设第一时间阈值后,是否未接收到所述云计算集群返回的报文或者接收到的报文出错,若是则调用所述异常提醒模块,否则调用所述发送模块;

异常提醒模块,用于产生云计算集群状态异常提醒信息。

本发明的有益效果是:本发明能够提前感知云服务集群的异常,并根据异常进行相应的动作,化被动为主动。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步地,所述发送模块的具体实施包括:每隔预设第二时间阈值发送经过加密的报文给所述云计算集群。

进一步地,所述判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的非数据模块返回的报文或者接收到的报文出错,则发送重启信息给所述非数据模块对应的云计算服务器。

进一步地,所述判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

进一步地,所述判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

本发明附加的方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明实践了解到。

附图说明

图1为本发明所述云计算集群服务状态监控方法流程图;

图2为本发明所述云计算集群服务状态监控系统结构图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

图1为本发明所述云计算集群服务状态监控方法流程图。

如图1所示,一种云计算集群服务状态监控方法,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,包括如下步骤:

步骤S1,发送经过加密的报文给所述云计算集群;

步骤S2,判断经过预设第一时间阈值后,是否未接收到所述云计算集群返回的报文或者接收到的报文出错,若是,则产生云计算集群状态异常提醒信息,否则返回步骤S1。

在本发明的具体实施例中,步骤S1中,每隔预设第二时间阈值发送经过加密的报文给所述云计算集群。

在本发明的具体实施例中,步骤S2中,若未接收到所述云计算集群中所述云计算服务器的非数据模块返回的报文或者接收到的报文出错,则发送重启信息给所述非数据模块对应的云计算服务器。

在本发明的具体实施例中,步骤S2中,若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

在本发明的具体实施例中,步骤S2中,若未接收到所述云计算集群中所述备份服务器返回的报文或者接收到的报文出错,则发送重启信息给所述备份数据库。

图2为本发明所述云计算集群服务状态监控系统结构图。

如图2所示,一种云计算集群服务状态监控系统,所述云计算集群包括集群服务器和备份服务器,所述集群服务器包括多个云计算服务器,所述备份服务器连接到所述集群服务器的多个所述云计算服务器,用于对多个所述云计算服务器的数据进行备份,包括:

发送模块,用于发送经过加密的报文给所述云计算集群;

判断模块,用于判断经过预设第一时间阈值后,是否未接收到所述云计算集群返回的报文或者接收到的报文出错,若是则调用所述异常提醒模块,否则调用所述发送模块;

异常提醒模块,用于产生云计算集群状态异常提醒信息。

在本发明的具体实施例中,发送模块的具体实施包括:每隔预设第二时间阈值发送经过加密的报文给所述云计算集群。

在本发明的具体实施例中,判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的非数据模块返回的报文或者接收到的报文出错,则发送重启信息给所述非数据模块对应的云计算服务器。

在本发明的具体实施例中,判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

在本发明的具体实施例中,判断模块的具体实施包括:

若未接收到所述云计算集群中所述云计算服务器的数据模块返回的报文或者接收到的报文出错,则通知所述备份服务器给所述数据模块进行数据备份。

在本说明书的描述中,参考术语“实施例一”、“实施例二”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体方法、装置或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、方法、装置或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1