本公开涉及人工智能,具体的涉及云计算,更具体地涉及一种基于ai语言模型集群运维方法、装置、设备、存储介质和程序产品。
背景技术:
1、当今的大型云计算系统中,kubernetes是一种非常流行的容器编排和管理平台,能够自动化地部署、扩展和管理应用程序和服务。但是,由于kubernetes集群中涉及到大量的节点和服务,可能会发生各种各样的异常事件,例如节点故障、服务失效等等。这就对运维人员具有一定的技术要求,对于一些新手或不熟悉kubernetes集群的人员来说,处理上述异常事件会变得困难耗时,极大程度影响运维效率。
2、需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
1、鉴于上述问题,本公开提供了一种提高运维效率的基于ai语言模型的集群运维方法、装置、设备、存储介质和程序产品。
2、根据本公开的第一个方面,提供了一种基于ai语言模型的集群运维方法,所述方法包括:
3、响应于集群的异常事件触发,获取异常事件信息;
4、调用ai语言模型接口,将所述异常事件信息输入至所述ai语言模型;
5、接收所述ai语言模型返回的异常事件描述文本;以及
6、根据所述异常事件描述文本进行集群运维。
7、根据本公开的实施例,所述根据所述异常事件描述文本进行集群运维包括:
8、根据所述异常事件描述文本确定异常事件类型;
9、根据所述异常事件类型确定目标解决方案;以及
10、执行所述目标解决方案对应的运维脚本以处理异常事件。
11、根据本公开的实施例,所述根据所述异常事件类型确定目标解决方案包括:
12、根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案;或
13、根据所述异常事件类型在解决方案库中匹配目标解决方案。
14、根据本公开的实施例,所述根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案包括:
15、调用ai语言模型接口,将所述异常事件类型输入至所述ai语言模型;
16、将接收到所述ai语言模型输出的解决方案在解决方案库中进行比对,根据比对结果确定目标解决方案。
17、根据本公开的实施例,所述根据比对结果确定目标解决方案包括:
18、若确定解决方案库中存在所述解决方案,确定所述解决方案为目标解决方案;
19、若确定解决方案库中不存在所述解决方案,将所述解决方案发送至运维前台;以及
20、响应于运维前台的确认指令,确定所述解决方案为目标解决方案。
21、根据本公开的实施例,所述方法还包括:
22、响应于运维前台的检索指令,获取解决方案库中的异常事件列表;以及
23、展示未处理的异常事件并通知运维人员。
24、本公开的第二方面提供了一种基于ai语言模型的集群运维装置,所述装置包括:
25、第一获取模块,用于响应于集群的异常事件触发,获取异常事件信息;
26、调用模块,用于调用ai语言模型接口,将所述异常事件信息输入至所述ai语言模型;
27、接收模块,用于接收所述ai语言模型返回的异常事件描述文本;以及
28、运维模块,用于根据所述异常事件描述文本进行集群运维。
29、根据本公开的实施例,所述运维模块包括:第一确定子模块、第二确定子模块和执行子模块。
30、第一确定子模块,用于根据所述异常事件描述文本确定异常事件类型;
31、第二确定子模块,用于根据所述异常事件类型确定目标解决方案;以及
32、执行子模块,用于执行所述目标解决方案对应的运维脚本以处理异常事件。
33、根据本公开的实施例,所述第二确定子模块包括:第一确定单元和匹配单元。
34、第一确定单元,用于根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案;或
35、匹配单元,用于根据所述异常事件类型在解决方案库中匹配目标解决方案。
36、根据本公开的实施例,所述第一确定单元包括:调用子单元、比对子单元和第一确定子单元。
37、调用子单元,用于调用ai语言模型接口,将所述异常事件类型输入至所述ai语言模型;
38、比对子单元,用于将接收到所述ai语言模型输出的解决方案在解决方案库中进行比对;
39、第一确定子单元,用于根据比对结果确定目标解决方案。
40、根据本公开实施例,所述第一确定子单元还用于若确定解决方案库中存在所述解决方案,确定所述解决方案为目标解决方案;若确定解决方案库中不存在所述解决方案,将所述解决方案发送至运维前台;以及响应于运维前台的确认指令,确定所述解决方案为目标解决方案。
41、根据本公开的实施例,所述装置还包括:第二获取模块和展示模块。
42、第二获取模块,用于响应于运维前台的检索指令,获取解决方案库中的异常事件列表;以及
43、展示模块,用于展示未处理的异常事件并通知运维人员。
44、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述集群运维方法。
45、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述集群运维方法。
46、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述集群运维方法。
47、通过本公开的实施例提供的一种基于ai语言模型的集群运维方法,当集群触发异常事件时,调用ai语言模型接口,将异常事件信息输入至所述ai语言模型;根据接收到的ai语言模型返回的异常事件描述文本进行集群运维。本公开实施例通过将ai语言模型与kubernetes集群相结合,通过自然语言处理技术将kubernetes集群中的异常事件转化为对应的文本表述,便于运维人员理解,降低运维人员的技术门槛,同时自动生成对应的解决方案建议供运维人员确认,大大提高集群运维效率。
1.一种基于ai语言模型的集群运维方法,其特征在于,所述方法包括:
2.根据权利要求1所述的集群运维方法,其特征在于,所述根据所述异常事件描述文本进行集群运维包括:
3.根据权利要求2所述的集群运维方法,其特征在于,所述根据所述异常事件类型确定目标解决方案包括:
4.根据权利要求3所述的集群运维方法,其特征在于,所述根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案包括:
5.根据权利要求4所述的集群运维方法,其特征在于,所述根据比对结果确定目标解决方案包括:
6.根据权利要求1至5中任一项所述的集群运维方法,其特征在于,所述方法还包括:
7.一种基于ai语言模型的集群运维装置,其特征在于,所述装置包括:
8.一种电子设备,包括:
9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。
10.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的方法。