1.一种基于Zookeeper的服务监控系统,其特征在于,包括:
监控数据收集中心,利用Zookeeper搭建所述监控数据收集中心的集群服务,采集业务服务的性能指标数据,同时获取用于运行所述业务服务的物理服务器的运行信息;
实时风险计算中心,基于所述性能指标数据和所述运行信息,实时判断所述业务服务是否存在风险;
报警平台,若所述业务服务存在风险,则接收到所述实时风险计算中心发来的报警信息后发出警报信号。
2.根据权利要求1所述的服务监控系统,其特征在于,所述系统,还包括,闲时故障分析中心和故障处理备忘平台,所述故障处理备忘平台包括故障案例数据库,所述闲时故障分析中心在所述业务服务存在风险的条件下,确定所述业务服务发生故障的因素,并且根据所述因素从所述故障案例数据库获取相应的预备故障案例后推送至所述报警平台,以使所述报警平台显示所述预备故障案例。
3.根据权利要求1或2所述的服务监控系统,其特征在于,所述系统,还包括管理平台和配置管理数据库,其中,所述管理平台对所述业务服务进行参数配置,并且将参数保存至所述配置管理数据库。
4.根据权利要求3所述的服务监控系统,其特征在于,所述监控数据收集中心,从所述配置管理数据库读取所述参数,并且将所述参数持久化至所述Zookeeper上,以利用所述Zookeeper实现所述监控数据收集中心的分布式任务调度。
5.根据权利要求2所述的服务监控系统,其特征在于,所述故障处理备忘平台,在所述故障解决的条件下,记录并且存储用于解决所述故障的故障解决方案至所述故障案例数据库,作为预备故障案例。
6.一种基于Zookeeper的服务监控方法,其特征在于,所述方法,包括以下步骤:
利用Zookeeper搭建监控数据收集中心的集群服务;
采集业务服务的性能指标数据,同时获取用于运行所述业务服务的物理服务器的运行信息;
基于所述性能指标数据和所述运行信息,实时判断所述业务服务是否存在风险;
若所述业务服务存在风险,则发出警报信号。
7.根据权利要求6所述的服务监控方法,其特征在于,所述若所述业务服务存在风险,则发出警报信号之后,所述方法,还包括:
确定所述业务服务发生故障的因素;
根据所述因素从所述故障处理备忘平台获取相应的预备故障案例推送至所述报警平台,以使所述报警平台显示所述预备故障案例。
8.根据权利要求6或7所述的服务监控方法,其特征在于,所述利用Zookeeper搭建监控数据收集中心的集群服务之前,所述方法,还包括:
对所述业务服务进行参数配置;
保存所述参数。
9.根据权利要求8所述的服务监控方法,其特征在于,所述利用Zookeeper搭建监控数据收集中心的集群服务,具体包括:
读取上述参数;将参数持久化至Zookeeper上,以利用Zookeeper实现监控数据收集中心集群服务的分布式任务调度。
10.根据权利要求7所述的服务监控方法,其特征在于,所述根据所述因素从所述故障处理备忘平台获取相应的预备故障案例推送至所述报警平台之后,所述方法,还包括:
在所述故障解决的条件下,记录并且存储用于解决所述故障的故障解决方案至所述故障案例数据库,作为预备故障案例。