微服务异常追踪的方法、服务器及存储介质与流程

文档序号:33796412发布日期:2023-04-19 10:12阅读:39来源:国知局
微服务异常追踪的方法、服务器及存储介质与流程

本技术涉及人工智能和微服务架构领域,尤其涉及一种微服务异常追踪的方法、服务器及存储介质。


背景技术:

1、在现有技术中,使用人工追踪异常的方式通常存在以下问题:不同的模块涉及不同的环境以及开发团队,即使拥有完善的链路追踪数据,人工方式缺少足够的经验发现链路中可能存在的异常,在异常发生时难以定位异常;同时,传统方式一般在检测到整条链路异常后再进行异常的定位,无法对之前已存在的异常进行预警,此时可能已发生重大事故。

2、而使用传统的机器学习或异常检测方法存在以下问题:需要大量的标注数据,同时数据极不平衡,超大规模微服务调用链的标注难度大;不同追踪对象的异常情况不同导致异常难以识别;各个被追踪对象的数据分离,未能考虑链路的调用关系。


技术实现思路

1、本技术实施例提供了一种微服务异常追踪的方法、服务器及存储介质,用于利用人工智能深度学习技术,通过无需人工标记的大量span信息的学习,从而可根据不同的被追踪对象识别出调用处理耗时过长以及过短的情况。

2、本技术第一方面提供一种微服务异常追踪的方法,可以包括:

3、对链路中每个工作单元的span信息进行特征提取,得到特征数据和请求处理耗时;

4、将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型;

5、根据所述训练模型进行微服务异常追踪。

6、可选的,所述根据所述训练模型进行微服务异常追踪,包括:

7、接收第一服务器发送的关于第一微服务的调用请求;

8、根据所述调用请求获取目标特征数据;

9、将所述目标特征数据输入至预先获取的训练模型,得到目标耗时;

10、若所述目标耗时在预置耗时范围内,则预测正常;

11、若所述目标耗时未在所述预置耗时范围内,则预测异常,展示并发送所述调用请求对应调用链的信息、定位异常内容,以及错误信息中的至少一项给所述第一节点。

12、可选的,所述特征数据包括:链路标识、微服务名称、请求时间、微服务部署互联网协议、调用方法名、函数入参、函数返回、中央处理器使用率、内存使用率、表空间使用率和用户连接数中的至少一项。

13、可选的,所述方法还包括:

14、根据链路追踪的对象类型,对所述请求处理耗时进行标准化处理,得到标准化后的请求处理耗时;

15、所述将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型,包括:

16、将所述特征数据作为输入,所述标准化后的请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型。

17、可选的,所述将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型,包括:

18、将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络、加权均方根误差wrmse损失函数和adam优化算法,进行模型训练,得到所述训练模型。

19、可选的,所述双向长短期记忆网络为将每条链路的每个阶段的状态拼接成多维向量作为网络的输入,将前向的lstm和后向的lstm结合成bi-lstm,输出各阶段的预测耗时。

20、可选的,所述wrmse损失函数为根据每一条链路的长度l、每一阶段标准化后的实际请求处理耗时yt、预测请求处理耗时样本数n、每一条链路的权重wi得到的。

21、本技术第二方面提供一种服务器,可以包括:

22、处理模块,用于对链路中每个工作单元的span信息进行特征提取,得到特征数据和请求处理耗时;将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型;根据所述训练模型进行微服务异常追踪。

23、可选的,服务器还包括:

24、收发模块,用于接收第一服务器发送的关于第一微服务的调用请求;

25、处理模块,用于根据所述调用请求获取目标特征数据;将所述目标特征数据输入至预先获取的训练模型,得到目标耗时;若所述目标耗时在预置耗时范围内,则预测正常;若所述目标耗时未在所述预置耗时范围内,则预测异常,显示模块,用于展示和收发模块用于发送所述调用请求对应调用链的信息、定位异常的相关内容,以及错误信息中的至少一项给所述第一节点。

26、可选的,所述特征数据包括:链路标识、微服务名称、请求时间、微服务部署互联网协议、调用方法名、函数入参、函数返回、中央处理器使用率、内存使用率、表空间使用率和用户连接数中的至少一项。

27、可选的,所述处理模块,具体用于根据链路追踪的对象类型,对所述请求处理耗时进行标准化处理,得到标准化后的请求处理耗时;将所述特征数据作为输入,所述标准化后的请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型。

28、可选的,所述处理模块,具体用于将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络、加权均方根误差wrmse损失函数和adam优化算法,进行模型训练,得到所述训练模型。

29、可选的,所述双向长短期记忆网络为将每条链路的每个阶段的状态拼接成多维向量作为网络的输入,将前向的lstm和后向的lstm结合成bi-lstm,输出各阶段的预测耗时。

30、可选的,所述wrmse损失函数为根据每一条链路的长度l、每一阶段标准化后的实际请求处理耗时yt、预测请求处理耗时样本数n、每一条链路的权重wi得到的。

31、本技术第三方面提供一种服务器,可以包括:

32、存储有可执行程序代码的存储器;

33、与所述存储器耦合的处理器;

34、所述存储器用于存储可执行程序代码;

35、所述处理器调用所述存储器中存储的所述可执行程序代码,用于所述处理器执行如本技术第一方面所述的方法。

36、本技术又一方面提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一可执行指令,所述可执行指令在计算设备上运行时,使得计算设备执行如本技术第一方面所述的方法。

37、本发明又一方面公开一种计算机程序产品,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本技术第一方面所述的方法。

38、本发明又一方面公开一种应用发布平台,所述应用发布平台用于发布计算机程序产品,其中,当所述计算机程序产品在计算机上运行时,使得所述计算机执行本技术第一方面所述的方法。

39、从以上技术方案可以看出,本技术实施例具有以下优点:

40、在本技术实施例中,对链路中每个工作单元的span信息进行特征提取,得到特征数据和请求处理耗时;将所述特征数据作为输入,所述请求处理耗时作为输出,使用双向长短期记忆网络进行模型训练,得到所述训练模型;根据所述训练模型进行微服务异常追踪。即利用人工智能深度学习技术,通过无需人工标记的大量span信息的学习,从而可根据不同的被追踪对象识别出调用处理耗时异常(例如过长以及过短)的情况。整个过程无需人工干预,异常预测的准确性较高,在电信业务超大规模的微服务调用场景下具有针对性的实用意义。

41、上述说明仅是本发明实施例技术方案的概述,为了能够更清楚了解本发明实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本发明实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1