本说明书涉及运维,尤其涉及一种异动识别方法、装置以及设备。
背景技术:
1、随着互联网技术的迅速发展和智能终端的使用普及,很多业务都可以依托于智能终端上的应用进行,这些应用具有庞大的用户规模,则相应的应用服务器需要具有强大的处理能力。
2、目前,通常会通过集群的形式提供服务,集群中包含了多个(通常是大规模的)应用服务器。需要对集群的工作状况进行监控,现有的监控系统是面向整个集群的,敏感性不够高,小的异动会被淹没在集群数据中,被集群数据平均或掩盖,因此,难以提早发现一些很小的异动,只能当系统集群发生较大异常时,才能发现异动,而此时,往往故障已经产生。
3、基于此,针对集群,需要有助于更可靠更提前地识别异动以避免故障产生的方案。
技术实现思路
1、本说明书一个或多个实施例提供一种异动识别方法、装置、设备以及存储介质,用以解决如下技术问题:针对集群,需要有助于更可靠更提前地识别异动以避免故障产生的方案。
2、为解决上述技术问题,本说明书一个或多个实施例是这样实现的:
3、本说明书一个或多个实施例提供的一种异动识别方法,包括:
4、采集集群中的服务调用数据,所述集群中包含多个服务器;
5、按照服务名维度,对所述服务调用数据进行聚合,得到不同的服务分别对应于所述多个服务器的聚合数据;
6、通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器。
7、本说明书一个或多个实施例提供的一种异动识别装置,包括:
8、服务调用数据采集模块,采集集群中的服务调用数据,所述集群中包含多个服务器;
9、服务调用数据聚合模块,按照服务名维度,对所述服务调用数据进行聚合,得到不同的服务分别对应于所述多个服务器的聚合数据;
10、聚合比对识别异动模块,通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器。
11、本说明书一个或多个实施例提供的一种异动识别设备,包括:
12、至少一个处理器;以及,
13、与所述至少一个处理器通信连接的存储器;其中,
14、所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
15、采集集群中的服务调用数据,所述集群中包含多个服务器;
16、按照服务名维度,对所述服务调用数据进行聚合,得到不同的服务分别对应于所述多个服务器的聚合数据;
17、通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器。
18、本说明书一个或多个实施例提供的一种非易失性计算机存储介质,存储有计算机可执行指令,所述计算机可执行指令设置为:
19、采集集群中的服务调用数据,所述集群中包含多个服务器;
20、按照服务名维度,对所述服务调用数据进行聚合,得到不同的服务分别对应于所述多个服务器的聚合数据;
21、通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器。
22、本说明书一个或多个实施例采用的上述至少一个技术方案能够达到以下有益效果:能够采集应用服务器集群每台机器的服务调用数据,基于不同的服务,把所有单个应用服务器的服务调用数据进行分类比对,精准识别出有异动的应用服务器,进而有助于在异动劣化为故障前,将尚处于较小状态的异动提前识别出来,从而阻止故障的发生,能够提高整个集群的工作可靠性;不仅如此,由于精确到服务名维度,有助于快速定位可能导致该异动的服务所涉及的变更,进而阻止这种变更为更多的应用服务器带来异动风险。
1.一种异动识别方法,包括:
2.如权利要求1所述的方法,所述采集集群中的服务调用数据,具体包括:
3.如权利要求1所述的方法,所述按照服务名维度,对所述服务调用数据进行聚合,得到不同的服务分别对应于所述多个服务器的聚合数据,具体包括:
4.如权利要求2或3所述的方法,所述指标包括以下至少一种:调用总量、业务成功量、调用成功量、调用总耗时、返回码信息;
5.如权利要求1所述的方法,所述通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器,具体包括:
6.如权利要求1所述的方法,所述采集分别在对应的各所述服务器中执行;
7.如权利要求1所述的方法,所述通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器之后,所述方法还包括:
8.如权利要求7所述的方法,所述将所述变更确定为风险变更,具体包括:
9.如权利要求8所述的方法,所述若所述发生时间所处的时间分片对应的所述服务调用数据子集合,属于识别出的离群点之后,所述方法还包括:
10.如权利要求1所述的方法,所述服务指所述服务器中的可执行函数。
11.一种异动识别装置,包括:
12.如权利要求11所述的装置,所述服务调用数据采集模块,通过预先在各所述服务器预先部署的采集组件,拦截对应的所述服务器上的服务;
13.如权利要求11所述的装置,所述服务调用数据聚合模块,在所述服务调用数据中,根据服务器标识确定多个服务调用数据集合,每个服务调用数据集合分别对应于一个所述服务器;
14.如权利要求12或13所述的装置,所述指标包括以下至少一种:调用总量、业务成功量、调用成功量、调用总耗时、返回码信息;
15.如权利要求11所述的装置,所述聚合比对识别异动模块,根据所述聚合数据中包含的指标,确定所述多个服务器分别在同一个服务上表现出的多维特征;
16.如权利要求11所述的装置,所述采集分别在对应的各所述服务器中执行;
17.如权利要求11所述的装置,所述聚合比对识别异动模块,在所述通过针对所述多个服务器的所述聚合数据进行比对,识别所述多个服务器中是否存在有异动的服务器之后,确定近期在所述集群中的变更,以及所述集群中执行了所述变更的服务器集合;
18.如权利要求17所述的装置,所述聚合比对识别异动模块,确定所述变更的发生时间,以及所述聚合数据中属于所述有异动的服务器的服务调用数据,其中,所述发生时间处于所述服务调用数据对应的时间范围内;
19.如权利要求18所述的装置,所述聚合比对识别异动模块,在所述若所述发生时间所处的时间分片对应的所述服务调用数据子集合,属于识别出的离群点之后,将所述服务调用数据子集合作为参考子集合,针对所述集群中多个尚不属于有异动的服务器,获取各所述尚不属于有异动的服务器的对应于所述发生时间所处的时间分片的服务调用数据子集合,作为校验子集合;
20.如权利要求11所述的装置,所述服务指所述服务器中的可执行函数。
21.一种异动识别设备,包括: