基于AI语言模型的集群运维方法及装置与流程

文档序号:37260047发布日期:2024-03-12 20:38阅读:12来源:国知局
基于AI语言模型的集群运维方法及装置与流程

本公开涉及人工智能,具体的涉及云计算,更具体地涉及一种基于ai语言模型集群运维方法、装置、设备、存储介质和程序产品。


背景技术:

1、当今的大型云计算系统中,kubernetes是一种非常流行的容器编排和管理平台,能够自动化地部署、扩展和管理应用程序和服务。但是,由于kubernetes集群中涉及到大量的节点和服务,可能会发生各种各样的异常事件,例如节点故障、服务失效等等。这就对运维人员具有一定的技术要求,对于一些新手或不熟悉kubernetes集群的人员来说,处理上述异常事件会变得困难耗时,极大程度影响运维效率。

2、需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。


技术实现思路

1、鉴于上述问题,本公开提供了一种提高运维效率的基于ai语言模型的集群运维方法、装置、设备、存储介质和程序产品。

2、根据本公开的第一个方面,提供了一种基于ai语言模型的集群运维方法,所述方法包括:

3、响应于集群的异常事件触发,获取异常事件信息;

4、调用ai语言模型接口,将所述异常事件信息输入至所述ai语言模型;

5、接收所述ai语言模型返回的异常事件描述文本;以及

6、根据所述异常事件描述文本进行集群运维。

7、根据本公开的实施例,所述根据所述异常事件描述文本进行集群运维包括:

8、根据所述异常事件描述文本确定异常事件类型;

9、根据所述异常事件类型确定目标解决方案;以及

10、执行所述目标解决方案对应的运维脚本以处理异常事件。

11、根据本公开的实施例,所述根据所述异常事件类型确定目标解决方案包括:

12、根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案;或

13、根据所述异常事件类型在解决方案库中匹配目标解决方案。

14、根据本公开的实施例,所述根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案包括:

15、调用ai语言模型接口,将所述异常事件类型输入至所述ai语言模型;

16、将接收到所述ai语言模型输出的解决方案在解决方案库中进行比对,根据比对结果确定目标解决方案。

17、根据本公开的实施例,所述根据比对结果确定目标解决方案包括:

18、若确定解决方案库中存在所述解决方案,确定所述解决方案为目标解决方案;

19、若确定解决方案库中不存在所述解决方案,将所述解决方案发送至运维前台;以及

20、响应于运维前台的确认指令,确定所述解决方案为目标解决方案。

21、根据本公开的实施例,所述方法还包括:

22、响应于运维前台的检索指令,获取解决方案库中的异常事件列表;以及

23、展示未处理的异常事件并通知运维人员。

24、本公开的第二方面提供了一种基于ai语言模型的集群运维装置,所述装置包括:

25、第一获取模块,用于响应于集群的异常事件触发,获取异常事件信息;

26、调用模块,用于调用ai语言模型接口,将所述异常事件信息输入至所述ai语言模型;

27、接收模块,用于接收所述ai语言模型返回的异常事件描述文本;以及

28、运维模块,用于根据所述异常事件描述文本进行集群运维。

29、根据本公开的实施例,所述运维模块包括:第一确定子模块、第二确定子模块和执行子模块。

30、第一确定子模块,用于根据所述异常事件描述文本确定异常事件类型;

31、第二确定子模块,用于根据所述异常事件类型确定目标解决方案;以及

32、执行子模块,用于执行所述目标解决方案对应的运维脚本以处理异常事件。

33、根据本公开的实施例,所述第二确定子模块包括:第一确定单元和匹配单元。

34、第一确定单元,用于根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案;或

35、匹配单元,用于根据所述异常事件类型在解决方案库中匹配目标解决方案。

36、根据本公开的实施例,所述第一确定单元包括:调用子单元、比对子单元和第一确定子单元。

37、调用子单元,用于调用ai语言模型接口,将所述异常事件类型输入至所述ai语言模型;

38、比对子单元,用于将接收到所述ai语言模型输出的解决方案在解决方案库中进行比对;

39、第一确定子单元,用于根据比对结果确定目标解决方案。

40、根据本公开实施例,所述第一确定子单元还用于若确定解决方案库中存在所述解决方案,确定所述解决方案为目标解决方案;若确定解决方案库中不存在所述解决方案,将所述解决方案发送至运维前台;以及响应于运维前台的确认指令,确定所述解决方案为目标解决方案。

41、根据本公开的实施例,所述装置还包括:第二获取模块和展示模块。

42、第二获取模块,用于响应于运维前台的检索指令,获取解决方案库中的异常事件列表;以及

43、展示模块,用于展示未处理的异常事件并通知运维人员。

44、本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述集群运维方法。

45、本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述集群运维方法。

46、本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述集群运维方法。

47、通过本公开的实施例提供的一种基于ai语言模型的集群运维方法,当集群触发异常事件时,调用ai语言模型接口,将异常事件信息输入至所述ai语言模型;根据接收到的ai语言模型返回的异常事件描述文本进行集群运维。本公开实施例通过将ai语言模型与kubernetes集群相结合,通过自然语言处理技术将kubernetes集群中的异常事件转化为对应的文本表述,便于运维人员理解,降低运维人员的技术门槛,同时自动生成对应的解决方案建议供运维人员确认,大大提高集群运维效率。



技术特征:

1.一种基于ai语言模型的集群运维方法,其特征在于,所述方法包括:

2.根据权利要求1所述的集群运维方法,其特征在于,所述根据所述异常事件描述文本进行集群运维包括:

3.根据权利要求2所述的集群运维方法,其特征在于,所述根据所述异常事件类型确定目标解决方案包括:

4.根据权利要求3所述的集群运维方法,其特征在于,所述根据所述异常事件类型调用ai语言模型接口,以确定目标解决方案包括:

5.根据权利要求4所述的集群运维方法,其特征在于,所述根据比对结果确定目标解决方案包括:

6.根据权利要求1至5中任一项所述的集群运维方法,其特征在于,所述方法还包括:

7.一种基于ai语言模型的集群运维装置,其特征在于,所述装置包括:

8.一种电子设备,包括:

9.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~6中任一项所述的方法。

10.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~6中任一项所述的方法。


技术总结
本公开提供了一种基于AI语言模型的集群运维方法,涉及人工智能技术领域,可以应用于金融技术领域。所述方法包括:响应于集群的异常事件触发,获取异常事件信息;调用AI语言模型接口,将所述异常事件信息输入至所述AI语言模型;接收所述AI语言模型返回的异常事件描述文本;以及根据所述异常事件描述文本进行集群运维。本公开还提供了一种基于AI语言模型的集群运维装置、设备、存储介质和程序产品。

技术研发人员:杨诚
受保护的技术使用者:中国工商银行股份有限公司
技术研发日:
技术公布日:2024/3/11
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1