故障根因分析方法、装置、设备和可读存储介质与流程

文档序号:36247647发布日期:2023-12-02 14:20阅读:32来源:国知局
故障根因分析方法与流程

本发明涉及无线网络与人工智能领域,尤其是指一种故障根因分析方法、装置、设备和可读存储介质。


背景技术:

1、现有资源池服务器硬盘、存储设备、网络端口或交换机故障主要通过监控cpu、内存、网络等性能指标监控,当性能指标超过预配置阈值时发送告警通知,由人工核查指标,以及服务器系统日志、网络日志等方式查找根原因。

2、但是对于网络闪断即时断时续的故障场景,难以准确定位故障原因,具有效率低且不准确的缺点。并且由于服务器与存储节点间网络不稳定、抖动等原因造成存储设备在集群中不断地离线上线,易于造成资源池集群性能不稳定。


技术实现思路

1、本发明的目的是提供一种故障根因分析方法、装置、设备和可读存储介质,用于解决在资源池发生故障时,故障定位效率低且不准确的问题。

2、为了解决上述技术问题,本发明实施例提供一种故障根因分析方法,包括:

3、采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;

4、根据所述性能数据,利用色彩模式rgb三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;

5、根据所述性能图像、所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型。

6、可选地,所述方法还包括:

7、在获取待识别故障数据后,提取所述待识别故障数据中的故障文本数据和至少一第二监测构件的性能数据;

8、根据所述性能数据,利用色彩模式rgb三通道特性,构建性能图像;其中,每一第二监测组件对应一个性能图像,每一所述第二监测组件包括至少一所述第二监测构件;

9、将所述待识别故障数据中的故障文本数据和每一第二监测组件分别对应的性能图像,输入至所述故障识别模型,获得所述待识别故障数据的故障识别结果。

10、可选地,根据所述性能数据,利用色彩模式rgb三通道特性,构建性能图像,包括:

11、按照性能指标类型分别对所述性能数据进行预处理;

12、利用色彩模式rgb三通道特性将预处理后的所述性能数据转化为多个性能曲线;其中,每一所述性能指标类型的所述性能数据对应一种颜色的性能曲线;

13、根据多个所述性能曲线,构建性能图像。

14、可选地,所述性能数据的性能指标类型包括中央处理器cpu利用率、内存利用率、网络流量和网络时延中的一项或多项;

15、所述按照性能指标类型分别对所述性能数据进行预处理,包括以下的一项或多项:

16、通过线性变换方法分别将所述cpu利用率和所述内存利用率映射到相应的数据区间;

17、通过对数换算方法将所述网络流量的原始数值映射到相应的数据区间;

18、通过线性变换方法和/或对数换算方法将所述网络时延的原始数值映射到相应的数据区间,其中,在所述网络时延的原始数值小于或者等于第一阈值的情况下,通过线性变换方法将所述原始数值映射到相应的数据区间,在所述网络时延的原始数值大于第一阈值的情况下,通过对数换算方法将所述原始数值映射到相应的数据区间。

19、可选地,所述根据多个所述性能曲线,构建性能图像,包括:

20、根据面积分布图方法将每一所述性能曲线分别转化为对应的第一性能图像;

21、将多个所述第一性能图像进行合成,构建性能图像。

22、可选地,所述方法还包括:

23、通过滑动时间窗口采集待识别故障数据中的至少一第二监测构件的性能数据;

24、其中,所述滑动时间窗口每滑动第一预设时间采集一次所述性能数据,所述滑动时间窗口的长度为第二预设时间,所述第一预设时间小于所述第二预设时间。

25、可选地,所述预设损失函数包括:

26、加权系数其中,y为取值为(0,1]的加权系数,z为满足预设条件的所述性能图像的数量占所述性能图像总数量的比例值,所述满足预设条件包括:所述性能图像对应的所述性能数据中的cpu利用率小于第二阈值、内存利用率小于第三阈值、网络流量小于第四阈值和网络时延小于第五阈值。

27、本发明实施例还提供一种故障根因分析装置,包括:

28、采集模块,用于采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;

29、图像构建模块,用于根据所述性能数据,利用色彩模式rgb三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;

30、模型训练模块,用于根据所述性能图像、所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型。

31、本发明实施例还提供一种故障根因分析设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上任一项所述的故障根因分析方法。

32、本发明实施例还提供一种可读存储介质,包括:所述可读存储介质上存储有程序,所述程序被处理器执行时实现如上任一项所述的故障根因分析方法的步骤。

33、本发明的上述技术方案的有益效果如下:

34、上述方案中,获取故障训练数据,并将故障训练数据中的性能数据转化为性能图像,根据性能图像、故障文本数据和预设损失函数对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型,通过故障识别模型可以实现故障快速定位,减少人工经验依赖,提高运维效率。



技术特征:

1.一种故障根因分析方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述方法还包括:

3.根据权利要求1或2所述的方法,其特征在于,根据所述性能数据,利用色彩模式rgb三通道特性,构建性能图像,包括:

4.根据权利要求3所述的方法,其特征在于,所述性能数据的性能指标类型包括中央处理器cpu利用率、内存利用率、网络流量和网络时延中的一项或多项;

5.根据权利要求3所述的方法,其特征在于,所述根据多个所述性能曲线,构建性能图像,包括:

6.根据权利要求1所述的方法,其特征在于,所述方法还包括:

7.根据权利要求1所述的方法,其特征在于,所述预设损失函数包括:

8.一种故障根因分析装置,其特征在于,包括:

9.一种故障根因分析设备,其特征在于,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如权利要求1至7任一项所述的故障根因分析方法。

10.一种可读存储介质,其特征在于,包括:所述可读存储介质上存储有程序,所述程序被处理器执行时实现如权利要求1至7任一项所述的故障根因分析方法的步骤。


技术总结
本发明提供了一种故障根因分析方法、装置、设备和可读存储介质,该方法包括:采集故障训练数据,所述故障训练数据包括故障文本数据和至少一第一监测构件的性能数据;根据所述性能数据,利用色彩模式RGB三通道特性,构建性能图像;其中,每一第一监测组件对应一个性能图像,每一所述第一监测组件包括至少一所述第一监测构件;根据所述性能图像、所述故障文本数据和预设损失函数,对多模态学习模型进行训练,获得用于故障根因分析的故障识别模型。本发明实施例中,通过故障识别模型可以实现故障快速定位,减少人工经验依赖,提高运维效率。

技术研发人员:梁双春
受保护的技术使用者:中国移动通信有限公司研究院
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1