一种微服务系统的异常检测方法及装置与流程

文档序号:25082719发布日期:2021-05-18 13:20阅读:82来源:国知局
一种微服务系统的异常检测方法及装置与流程

1.本发明涉及微服务系统故障检测技术领域,具体涉及一种微服务系统的异常检测方法及装置。


背景技术:

2.微服务系统是一种将单个应用程序作为一组软件服务套件的软件架构形式,各个服务运行于独立的进程,彼此通过轻量级协议进行通信。随着计算机技术以及网络通信技术的快速发展,微服务系统架构成为一种广泛使用的服务器架构。由于,微服务系统架构中服务关系复杂和多变,成千上万的服务器接口节点在工作的过程中,往往也会因细粒度带来额外的硬件和软件负担过重而发生异常,因此,有必要对微服务系统架构进行异常检测。
3.目前,现有技术中微服务系统的异常检测方法主要基于单个服务器,即通过对各个服务器单独进行业务指标监控,具体通过长时间检测各个服务器包含业务的资源指标和性能指标是否超过预设阈值,进而判断微服务系统发生异常的服务器接口节点,然后利用人工对异常节点进行排查,该检测方式一方面由于只针对单个服务器,很难获知不同服务器之间相互调用信息的关系,导致很难检测出不同服务器节点之间的异常现象,另一方面,长时间检测微服务器的业务信息,实时性也较差,并且,还需要人工排查异常节点,其也费时费力,最终导致成本较大。


技术实现要素:

4.有鉴于此,本发明实施例提供了一种微服务系统的异常检测方法,以解决现有技术中利用人工对异常节点进行排查,费时费力,最终导致成本较大,实时性较差的问题。
5.根据第一方面,本发明实施例提供了一种微服务系统的异常检测方法,其特征在于,包括如下步骤:
6.构建微服务架构的节点网络图;
7.根据所述节点网络图,获取与业务调用请求指令对应的目标节点调用链路,所述目标节点调用链路中的各节点按照节点调用顺序依次排列;
8.获取所述目标节点调用链路中的各节点的数据特征,并按照所述节点调用顺序将所述各节点的数据特征组成目标节点数据特征向量;
9.构建节点异常检测模型,并将所述目标节点数据特征向量输入所述异常节点检测模型训练得到检测结果;
10.根据所述检测结果,确认发生异常故障的所述目标节点调用链路。
11.结合第一方面,在第一方面第一实施方式中,多个所述目标节点数据特征向量依次顺序存放至预设队长的节点消息队列中作为同时待检测的目标节点消息队列。
12.结合第一方面第一实施方式,在第一方面第二实施方式中,将所述目标节点消息队列输入多个顺序排列的所述节点异常检测模型训练得到检测结果,多个所述节点异常检测模型的数量等于所述目标节点消息队列中存放所述目标节点数据特征向量的数量。
13.结合第一方面第二实施方式,在第一方面第三实施方式中,所述构建节点异常检测模型,并将所述目标节点数据特征向量输入所述异常节点检测模型训练得到检测结果的步骤包括:
14.利用孤立森林算法构建所述节点异常检测模型,将所述目标节点数据特征向量或所述目标节点消息队列输入所述异常节点监测模型训练得到检测结果。
15.结合第一方面或第一方面任一实施方式,在第一方面第四实施方式中,所述各节点的数据特征包括节点服务时延和/或数据资源占用量和/或网络传输速度。
16.根据第二方面,本发明实施例提供一种微服务系统的异常检测装置,包括:
17.第一构建模块,用于构建微服务架构的节点网络图;
18.第一获取模块,用于根据所述节点网络图,获取与业务调用请求指令对应的目标节点调用链路,所述目标节点调用链路中的各节点按照节点调用顺序依次排列;
19.第二获取模块,用于获取所述目标节点调用链路中的各节点的数据特征,并按照所述节点调用顺序将所述各节点的数据特征组成目标节点数据特征向量;
20.第二构建模块,用于构建节点异常检测模型,并将所述目标节点数据特征向量输入所述异常节点检测模型训练得到检测结果;
21.确认模块,用于根据所述检测结果,确认发生异常故障的所述目标节点调用链路。
22.结合第二方面,在第二方面第一实施方式中,多个所述目标节点数据特征向量依次顺序存放至预设队长的节点消息队列中作为同时待检测的目标节点消息队列。
23.结合第二方面第一实施方式,在第二方面第二实施方式中,将所述目标节点消息队列输入多个顺序排列的所述节点异常检测模型训练得到检测结果,多个所述节点异常检测模型的数量等于所述目标节点消息队列中存放所述目标节点数据特征向量的数量。
24.结合第二方面第二实施方式,在第二方面第三实施方式中,所述第二构建模块包括:
25.构建子模块,用于利用孤立森林算法构建所述节点异常检测模型,将所述目标节点数据特征向量或所述目标节点消息队列输入所述异常节点监测模型训练得到检测结果。
26.根据第三方面,本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现第一方面或第一方面任一实施方式中所述的微服务系统的异常检测方法的步骤。
27.根据第四方面,本发明实施例提供一种微服务系统,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现第一方面或第一方面任一实施方式中所述的微服务系统的异常检测方法的步骤。
28.本发明实施例技术方案,具有如下优点:
29.本发明实施例提供一种微服务系统的异常检测方法及装置,其中方法通过对目标节点调用链路的各节点的数据特征对应的目标节点数据特征向量或存储有目标节点数据特征向量的目标节点消息队列基于节点异常检测模型进行训练得到检测结果,可以快速确定发生异常故障的目标节点调用链路,不需要人工对海量的各节点数据进行标注,降低了人力成本,省时省力,提高了检测效率,同时,也保证了各节点数据的实时性,显著提高了微服务系统的响应速度。
附图说明
30.为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
31.图1为本发明实施例中微服务系统的异常检测方法的流程图;
32.图2为本发明实施例中微服务架构的节点网络图;
33.图3为本发明实施例中业务调用请求指定对应的调用链路轨迹示意图;
34.图4为本发明实施例中目标节点数据特征向量的示意图;
35.图5为本发明实施例中目标节点调用链路的模型训练示意图;
36.图6为本发明实施例中目标节点消息队列示意图;
37.图7为本发明实施例中目标节点消息队列的模型训练示意图;
38.图8为本发明实施例中微服务系统的异常检测装置的结构框图;
39.图9为本发明实施例中计算机设备的硬件结构示意图。
具体实施方式
40.为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
41.实施例1
42.本发明实施例提供一种微服务系统的异常检测方法,用于检测微服务系统中各微服节点异常故障,如图1所示,的包括如下步骤:
43.步骤s1:构建微服务架构的节点网络图。此处的节点网络图可以通过instramentation机制在微服务系统运行的过程中通过埋点或安装代理程序形成网络状节点图,如图2所示,为示意的微服务架构的节点网络图,其呈现星星点点式分布,构成网络结构图。在图2中,每个节点可以是微服务系统的组件,该组件可以是一台机器或一个技术组件(消息中间件、网络服务器)或一个数据库。其中节点网络图中各网络节点存储有微服务日志,该微服务日志相当于各网络节点的数据标签,该数据标签上存储有各网络节点的数据信息。
44.步骤s2:根据节点网络图,获取与业务调用请求指令对应的目标节点调用链路,目标节点调用链路中的各节点按照节点调用顺序依次排列。此处的业务调用请求指令为用户待操作的用户指令,例如:用户在淘宝客户端上在线购买商品时,用户在淘宝客户端购物可以是业务调用请求指令,用户事先登录淘宝客户端-确定目标商品-在线支付,用户的该操作顺序为用户利用淘宝购物时的目标节点调用链路。目标节点调用链路为待检测的节点调用链路。例如:业务调用请求指令为m1,其对应的目标调用链路可以为a-c-d;业务调用请求指令为m2,其对应的目标调用链路可以为a-b-e。此处的目标节点调用链路中的各节点是按照先后顺序形成的路径。如图3所示,为不同的业务对应不同的入口调用请求,两个不同的调用请求对应的目标节点调用链路分别为:
45.业务调用请求指令1:a->c->f;
46.业务调用请求指令2:d->f->e;
47.目标节点调用链路也可以看成是业务调用请求指令对应的用户操作运行轨迹,该运行轨迹可以看成微服务节点的id号。
48.上述中各节点的数据特征包括节点服务时延和/或数据资源占用量和/或网络传输速度。该各节点的数据特征还可以包括其他类型数据特征,并不以此为限。
49.步骤s3:获取目标节点调用链路中的各节点的数据特征,并按照节点调用顺序将各节点的数据特征组成目标节点数据特征向量。
50.例如:以服务时延为例,目标节点调用链路经过a、c、f三个微服务节点,如图4所示,在时间轴上的微服务节点a、c、f的跨度分别为span1、span2、span3,分别在这三个时间跨度下,抽取微服务节点a、c、f在同一次调用中的数据特征向量,可抽取的数据特征一般包括节点服务时延和/或数据资源占用量和/或网络传输速度,如cpu百分比、内存占有量、网络io字节数等。将抽取的数据特征按找调用顺序拼接为一个特征向量,仅以服务时延特征为例,最终产生的轨迹特征向量表示为(span1,span2,span3),为了区分每个节点对时间的独自占用,目标节点调用链路的轨迹特征向量也可以表示为(span1

span2,span2-span3,span3)。
51.步骤s4:构建节点异常检测模型,并将目标节点数据特征向量输入异常节点检测模型训练得到检测结果。
52.在一具体实施例中,上述步骤s4在执行的过程中,可具体包括如下步骤:
53.利用孤立森林算法构建节点异常检测模型,将目标节点数据特征向量输入异常节点监测模型训练得到检测结果。
54.如图5所示,为节点异常检测模型训练目标节点数据特征向量的结构框图。
55.在图5中,目标节点数据特征向量的数量与训练模型的数量相同,即存在多种轨迹运行向量就对应存在多少个训练模型,该训练模型基于孤立森林算法构建出的节点异常检测模型。
56.上述孤立森林算法是一种适用于连续数据的无监督异常检测算法,该算法是对孤立树和样本点x在孤立树中的路径长度h(x)的定义。
57.对于孤立树:若t为孤立树的一个节点,t存在两种情况:没有子节点的外部节点,有两个子节点(tl,tr)和一个test的内部节点。在t的test由一个属性q和一个分割点p组成,q<p的点属于tl,反之属于tr。样本点x在孤立树中的路径长度h(x):样本点x从itree的根节点到叶子节点经过的边的数量。
58.孤立森林算法大致可以分为两个阶段,第一阶段需要训练t颗孤立树,组成孤立森林。随后,将每个样本点带入森林中的每颗孤立树,计算平均高度,之后再计算每个样本点的异常值分数。
59.第一阶段:
60.步骤s111:
61.x={x1,.......x
n
},为给定数据集,x
j
=(x
i1
,.......,x
id
),从x中随机抽取ψ个样本点构成x的子集x

放入根节点。
62.步骤s112:从d中随机指定一个维度q,在当前数据中随机产生一个切割点p,
63.m
in
(x
ij
,j=q,x
ij
∈x

)<p<max(x
ij
,j=q,x
ij
∈x

)。
64.步骤s113:此切割点p生成了一个超平面,将当前数据空间划分为两个子空间:指定维度小于p的样本点放入左子节点,大于或等于p放入右子节点。
65.步骤s114:递归步骤s112和步骤s113,直到所有的叶子节点都只有一个样本点或者孤立树(itree)已经达到指定的高度。
66.步骤s115:循环步骤s112至步骤s114,直到生成t个孤立树(itree)。
67.第二阶段:
68.步骤s211:对于每个数据点x
i
,令其遍历每一颗孤立树(itree),计算点x
i
在森林中的平均高度h(x
i
),对所有点的平均高度做归一化处理。异常分数的计算公式如下所示:
69.其中,
[0070][0071]
通过上述孤立森林算法构建节点异常检测模型,对输入该模型内的目标节点数据特征向量进行训练得到发生异常故障的目标节点数据特征。
[0072]
当然,本发明实施例还可以利用其它无监督方式的检测算法检测目标节点数据特征向量是否发生异常故障。
[0073]
步骤s5:根据检测结果,确认发生异常故障的目标节点调用链路。该检测结果为[0,1]之间的数值认为正常数据,将大于1的数值认为是非正常数据,因此,根据该检测结果,可以确认发生异常故障的目标节点调用链路。
[0074]
本发明实施例中的微服务系统的异常检测方法,通过对目标节点调用链路的各节点的数据特征对应的目标节点数据特征向量基于节点异常检测模型进行训练得到检测结果,可以快速确定发生异常故障的目标节点调用链路,不需要人工对海量的各节点数据进行标注,降低了人力成本,省时省力,提高了检测效率,同时,也保证了各节点数据的实时性。
[0075]
实施例2
[0076]
本发明实施例提供一种微服务系统的异常检测方法,为了提高微服务系统的异常检测的响应速度和实时性要求,作为一种优选的实施方式,可以将多个目标节点数据特征向量依次顺序存放至预设队长的节点消息队列中作为同时待检测的目标节点消息队列。
[0077]
如图6所示,为预设队长的目标节点消息队列,该预设队长的长短可以根据不同需求设置,在图6中,预设队长的目标节点消息队列可以存储n个目标节点数据特征向量,将该n各目标节点数据特征向量依次按照顺序存放。此处的目标节点消息队列相当于一个数据存储容器。将多个目标节点数据特征依次顺序存放至预设队长的节点消息队列中作为同时待检测的目标节点消息队列,以确保同时对存储有多个目标节点数据特征进行检测,进而提高微服务系统的异常检测的响应速度。
[0078]
在实施例1中的上述步骤s4在执行的过程中,还可具体包括如下步骤:
[0079]
利用孤立森林算法构建节点异常检测模型,将目标节点消息队列输入异常节点监
测模型训练得到检测结果。此处的目标节点消息队列可以是多个队列,目标节点消息队列中存储有多个目标节点数据特征,在节点异常检测模型中同时检测目标节点消息队列,为了提高微服务系统检测的响应速度。孤立森林算法构建节点异常检测模型的过程同上,在此不再赘述。
[0080]
具体地,如图7所示,为了便于轨迹运行向量的异常检测的水平扩展,可以将多个节点异常检测模型加载于一个进程中,以并行方式部署多个同样的检测进程。生产者进程采集并拼接轨迹运行特征向量,并将轨迹运行特征向量数据发布到目标节点消息队列,异常检测进程作为消费者获取轨迹特征数据并独自进行异常检测,发现异常后通过消息队列上报异常分析、告警等模块作后续处理。
[0081]
在图7中,多个节点异常检测模型的数量等于目标节点消息队列中存放目标节点数据特征的数量。
[0082]
本发明实施例中的微服务系统的异常检测方法,通过对存放有多个目标节点数据特征向量的目标节点消息队列基于节点异常检测模型进行训练得到检测结果,可以快速确定发生异常故障的目标节点消息队列,不需要人工对海量的各节点数据进行标注,降低了人力成本,省时省力,提高了检测效率,同时,也保证了各节点数据的实时性,同时显著提高微服务系统异常检测的响应速度。
[0083]
实施例3
[0084]
本发明实施例提供一种微服务系统的异常检测装置,如图8所示,包括:
[0085]
第一构建模块81,用于构建微服务架构的节点网络图。
[0086]
第一获取模块82,用于根据节点网络图,获取与业务调用请求指令对应的目标节点调用链路,目标节点调用链路中的各节点按照节点调用顺序依次排列。
[0087]
第二获取模块83,用于获取目标节点调用链路中的各节点的数据特征。并按照节点调用顺序将各节点的数据特征组成目标节点数据特征向量。
[0088]
第二构建模块84,用于构建节点异常检测模型,并将目标节点数据特征向量输入异常节点检测模型训练得到检测结果。
[0089]
确认模块85,用于根据检测结果,确认发生异常故障目标节点调用链路。
[0090]
本发明实施例中的微服务系统的异常检测装置,多个目标节点数据特征依次顺序存放至预设队长的节点消息队列中作为同时待检测的目标节点消息队列。
[0091]
本发明实施例中的微服务系统的异常检测装置,将目标节点消息队列输入多个顺序排列的节点异常检测模型训练得到检测结果,多个节点异常检测模型的数量等于目标节点消息队列中存放目标节点数据特征的数量。
[0092]
本发明实施例中的微服务系统的异常检测装置,第二构建模块84包括:
[0093]
构建子模块,用于利用孤立森林算法构建节点异常检测模型,将目标节点数据特征或目标节点消息队列输入异常节点监测模型训练得到检测结果。
[0094]
本发明实施例中的微服务系统的异常检测装置,各节点的数据特征包括节点服务时延和/或数据资源占用量和/或网络传输速度。
[0095]
本发明实施例中的微服务系统的异常检测装置,通过对目标节点调用链路的各节点的数据特征对应的目标节点数据特征向量或存储有目标节点数据特征向量的目标节点消息队列基于节点异常检测模型进行训练得到检测结果,可以快速确定发生异常故障的目
标节点调用链路,不需要人工对海量的各节点数据进行标注,降低了人力成本,省时省力,提高了检测效率,同时,也保证了各节点数据的实时性,显著提高了微服务系统的响应速度。
[0096]
实施例4
[0097]
本发明实施例提供一种存储介质,其上存储有计算机指令,该指令被处理器执行时实现实施例1或实施例2中的方法的步骤。该存储介质上还存储有节点网络图、目标节点调用链路、业务调用请求、目标节点数据特征向量、检测结果等。其中,存储介质可为磁碟、光盘、只读存储记忆体(read-only memory,rom)、随机存储记忆体(random access memory,ram)、快闪存储器(flash memory)、硬盘(hard disk drive,缩写:hdd)或固态硬盘(solid-state drive,ssd)等;所述存储介质还可以包括上述种类的存储器的组合。
[0098]
本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,存储介质可为磁碟、光盘、只读存储记忆体(rom)或随机存储记忆体(ram)等。
[0099]
实施例5
[0100]
本发明实施例提供一种计算机设备,如图9所示,该计算机设备包括存储器920、处理器910及存储在存储器920上并可在处理器910上运行的计算机程序,处理器910执行程序时实现实施例1或实施例2中方法的步骤。
[0101]
图9是本发明实施例提供的执行列表项操作的处理方法的一种计算机设备的硬件结构示意图,如图9所示,该计算机设备包括一个或多个处理器910以及存储器920,图9中以一个处理器910为例。
[0102]
执行列表项操作的处理方法的计算机设备还可以包括:输入装置930和输出装置940。
[0103]
处理器910、存储器920、输入装置930和输出装置940可以通过总线或者其他方式连接,图9中以通过总线连接为例。
[0104]
处理器910可以为中央处理器(central processing unit,cpu)。处理器910还可以为其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
[0105]
显然,上述实施例仅仅是为清楚地说明所作的举例,而并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1