服务冲突的处理方法、装置、存储介质及电子装置与流程

文档序号:35412767发布日期:2023-09-09 23:16阅读:48来源:国知局
服务冲突的处理方法、装置、存储介质及电子装置与流程

本技术实施例涉及计算机,具体而言,涉及一种服务冲突的处理方法、装置、存储介质及电子装置。


背景技术:

1、随着技术的发展,用于深度学习和资源调度管理领域的ai平台需求量愈发增加,同时平台部署量也上升了一个量级,对于这些平台稳定的运行维护就显得格外重要。但是由于平台使用人员误操作,部署与集群冲突的服务组件等情况经常出现,导致ai集群底层服务可能出现异常情况;并且在这种情况下,存在无法自动恢复正常的问题,整体影响较大。相关技术中当集群底层服务器上存在冲突服务组件时,平台异常,需要人工定位处理恢复,定位时主要参照平台问题修复手册手动定位。无法对冲突组件进行自动分析定位及自动处理修复。人工定位处理服务冲突导致的问题包括耗费人力较大,且定位时长无法把控,效率较低,且由于运维人员经验及技术限制,可能导致无法准确定位问题并修复。可见,相关技术中对于服务冲突的处理效率存在着较低的问题。

2、针对相关技术中存在的服务冲突的处理效率较低的技术问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种服务冲突的处理方法、装置、存储介质及电子装置,以至少解决相关技术中存在的服务冲突的处理效率较低的技术问题。

2、根据本技术的一个实施例,提供了一种服务冲突的处理方法,包括:获取待检测节点的目标状态信息,其中,所述目标状态信息用于表示所述待检测节点的服务运行的状态信息;在根据所述目标状态信息确定出所述待检测节点存在目标类型的服务冲突的情况下,根据预训练模型确定与所述目标类型的服务冲突对应的目标处理操作,其中,所述目标处理操作用于对所述目标类型的服务冲突进行修复,所述预训练模型包括一组故障模型,所述一组故障模型中的每个故障模型是利用发生对应的一种类型的服务冲突所产生的数据包集合训练所得到的模型;在确定出所述目标处理操作的情况下,执行所述目标处理操作,以对所述目标类型的服务冲突进行修复。

3、在一个示例性实施例中,在获取待检测节点的目标状态信息之后,所述方法还包括:根据所述目标状态信息判断所述待检测节点是否存在服务冲突;在确定所述待检测节点存在服务冲突的情况下,判断所述服务冲突是否为预先部署的服务所发生的服务冲突;在判断出所述服务冲突不是所述预先部署的服务所发生的服务冲突的情况下,确定所述待检测节点存在所述目标类型的服务冲突。

4、在一个示例性实施例中,所述获取待检测节点的目标状态信息,包括:获取所述待检测节点的一组微服务组件运行的第一状态信息以及所述待检测节点的底层容器服务的第二状态信息,其中,所述目标状态信息包括所述第一状态信息和所述第二状态信息。

5、在一个示例性实施例中,在根据预训练模型确定与所述目标类型的服务冲突对应的目标处理操作之前,所述方法还包括:在所述第一状态信息表示所述一组微服务组件的交互异常的情况下,确定所述待检测节点存在第一类型的服务冲突;在所述第二状态信息表示所述底层容器服务所对应的容器未处于运行状态的情况下,确定所述待检测节点存在第二类型的服务冲突;其中,所述目标类型的服务冲突包括所述第一类型的服务冲突和所述第二类型的服务冲突。

6、在一个示例性实施例中,所述根据预训练模型确定与所述目标类型的服务冲突对应的目标处理操作,包括:获取所述待检测节点的目标日志信息,其中,所述目标日志信息包括所述待检测节点的一组微服务组件对应的服务和/或所述待检测节点的底层容器服务发生所述目标类型的服务冲突时所产生的日志信息;利用所述预训练模型对所述目标日志信息进行检测,得到所述目标处理操作的标识,其中,所述目标处理操作的标识用于指示所述待检测节点执行所述目标处理操作的标识所指示的所述目标处理操作,以对所述目标类型的服务冲突进行修复。

7、在一个示例性实施例中,所述利用所述预训练模型对所述目标日志信息进行检测,得到所述目标处理操作的标识,包括:利用所述预训练模型提取所述目标日志信息的一组目标特征值,其中,所述一组目标特征值包括所述目标日志信息中一组参数的特征值;将所述一组目标特征值与所述预训练模型中的一组预设特征值进行对比,得到对比结果,其中,所述一组预设特征值表示所述预训练模型中与所述一组参数对应的预设特征值;基于所述对比结果确定所述目标处理操作的标识。

8、在一个示例性实施例中,所述将所述一组目标特征值与所述预训练模型中的一组预设特征值进行对比,得到对比结果,包括:确定所述一组目标特征值分别与n组预设特征值之间的方差值,得到n个方差值,其中,所述n组预设特征值是所述预训练模型中的n个故障模型对应的预设特征值,所述n个故障模型中的每个故障模型分别对应一组预设特征值,所述n个方差值中的每个方差值是所述一组目标特征值与所述n组预设特征值中的一组预设特征值之间的方差值,所述对比结果包括所述n个方差值,n为大于或等于1的正整数;所述基于所述对比结果确定所述目标处理操作的标识,包括:在所述n个方差值中第i个方差值小于或等于第i个预设修复阈值的情况下,将与所述第i个预设修复阈值对应的处理操作的标识确定为所述目标处理操作的标识,其中,所述第i个预设修复阈值为所述n个故障模型中第i个故障模型所对应的修复阈值,i为小于或等于n的正整数。

9、在一个示例性实施例中,所述方法还包括:在所述n个方差值中的每个方差值均大于与所述每个方差值所对应的预设修复阈值的情况下,使用所述目标日志信息对所述预训练模型进行训练。

10、在一个示例性实施例中,在根据预训练模型确定与所述目标类型的服务冲突对应的目标处理操作之前,所述方法还包括:通过以下步骤得到所述一组故障模型中的第i个故障模型,其中,所述第i个故障模型对应第i个类型的服务冲突,所述第i个故障模型用于确定与所述第i个类型的服务冲突对应的处理操作,i为大于或等于1的正整数:获取第i个数据包集合以及与所述第i个数据包集合对应的实际处理操作的标识,其中,所述第i个数据包集合包括发生所述第i个类型的服务冲突时所产生的样本日志信息集合;利用所述第i个数据包集合对第i个初始故障模型进行训练,直至所述第i个初始故障模型输出的预测处理操作的标识与所述实际处理操作的标识之间的损失值满足预设的收敛条件,结束训练,并将训练结束时的所述第i个初始故障模型确定为所述第i个故障模型,其中,在所述损失值不满足所述收敛条件的情况下,所述第i个初始故障模型中的参数被调整。

11、根据本技术的又一个实施例,还提供了一种服务冲突的处理装置,包括:获取模块,用于获取待检测节点的目标状态信息,其中,所述目标状态信息用于表示所述待检测节点的服务运行的状态信息;第一确定模块,用于在根据所述目标状态信息确定出所述待检测节点存在目标类型的服务冲突的情况下,根据预训练模型确定与所述目标类型的服务冲突对应的目标处理操作,其中,所述目标处理操作用于对所述目标类型的服务冲突进行修复,所述预训练模型包括一组故障模型,所述一组故障模型中的每个故障模型是利用发生对应的一种类型的服务冲突所产生的数据包集合训练所得到的模型;处理模块,用于在确定出所述目标处理操作的情况下,执行所述目标处理操作,以对所述目标类型的服务冲突进行修复。

12、根据本技术的又一个实施例,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。

13、根据本技术的又一个实施例,还提供了一种电子装置,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器被设置为运行所述计算机程序以执行上述任一项方法实施例中的步骤。

14、通过本技术实施例,通过获取待检测节点的目标状态信息,在根据目标状态信息确定出待检测节点存在目标类型的服务冲突的情况下,根据预训练模型确定出与目标类型的服务冲突对应的目标处理操作,目标处理操作用于对目标类型的服务冲突进行修复,其中,预训练模型中包括一组故障模型,一组故障模型中的每个故障模型是利用发生对应的一种类型的服务冲突所产生的数据包集合训练所得到的模型。即当检测出待检测节点存在目标类型的服务冲突时,可以根据预训练模型自动确定出与目标类型的服务冲突对应的目标处理操作,再根据目标处理操作对目标类型的服务冲突进行修复。避免了相关技术中需要依靠人工对服务冲突进行定位及修复导致处理时间较长的问题。因此,可以解决相关技术中存在的服务冲突的处理效率较低的技术问题,达到了提高服务冲突的处理效率的效果。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1