基于自然语言描述的异常时序指标生成系统与方法与流程

文档序号:33953947发布日期:2023-04-26 13:57阅读:50来源:国知局
基于自然语言描述的异常时序指标生成系统与方法与流程

本发明涉及时序数据处理,具体地,涉及基于自然语言描述的异常时序指标生成系统与方法。


背景技术:

1、在智能运维领域,包含异常时序指标的数据是用于构建异常检测系统与评估异常检测系统有效性的重要资源。如在cpu异常时的“cpu占用率”、“内存占用率”、“磁盘吞吐率”、“业务成功率”等时序指标可用于构建与评估“cpu异常监控子模块”。目前,可通过专业运维人员构建系统仿真或基于规则的模拟生成异常时序指标数据。但仿真系统的成本高、灵活性不足,规则模拟欠缺真实性,且使用上述方法要求操作人员具备相关专业背景和技能。

2、专利文献cn115033386a(申请号:202210772022.4)公开了一种时序数据生成方法、装置及存储介质,用于提高非平稳时序数据的模拟精度和效率。本技术公开的时序数据生成方法包括:进行硬件配置;根据所述硬件配置进行具体配置;根据所述具体配置构建时序数据生成系统;根据所述时序数据生成系统生成时序数据。该专利需要根据具体要求调整生成的配置,对使用人员的专业性要求较高、成本也较高。

3、专利文献cn112926802a(申请号:202110354068.x)公开了一种时序数据对抗样本生成方法、系统、电子设备及存储介质;所述方法包括使用原始时序数据训练时序预测模型;采用随机梯度下降优化策略计算所述时序预测模型中损失函数的最大值;根据所述损失函数的最大值确定出对应的噪声;对所述原始时序数据叠加所述噪声生成全局扰动的时序数据对抗样本。该专利使用了对抗的方法生成数据,数据的仿真性有保障,但无法通过控制输入而得到不同类型的数据;本发明所述通过自然语言控制输出数据类型,同时“自然语言”这一输入形式降低了对应用人员技术背景的要求。

4、本发明提出基于自然语言描述的异常时序指标生成系统与方法,该系统与方法接收使用自然语言描述的异常,生成与语言描述对应的异常时序指标数据,且可以基于某一系统的历史指标日志生成具备该系统特点的异常(如指标的周期性、平稳性等特点)。该系统与方法降低了异常时序指标的构建成本,对比现有方法在灵活性、真实性方面得到了提高。


技术实现思路

1、针对现有技术中的缺陷,本发明的目的是提供一种基于自然语言描述的异常时序指标生成方法及系统。

2、根据本发明提供的一种基于自然语言描述的异常时序指标生成方法,包括:

3、步骤s1:构建指标样本库;

4、步骤s2:构建异常时序指标生成器,并利用指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;

5、步骤s3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。

6、优选地,所述步骤s1采用:

7、步骤s1.1:基于预设场景收集指标数据,构成指标数据集;

8、步骤s1.2:对收集的指标数据进行归一化处理,得到归一化处理后的指标数据集;

9、步骤s1.3:基于归一化处理后的指标数据集构建预设场景异常指标样本库;

10、步骤s1.4:基于归一化处理后的指标数据集构建预设场景正常指标样本库;

11、所述预设场景包括:cpu占满、cpu停止、内存占满以及网络中断;

12、所述指标包括:cpu占用率、内存占用率、网络吞吐率以及业务成功率;

13、所述异常指标样本库为异常描述文本标签和相应的异常指标数据矩阵组成的二元组;

14、所述正常指标样本库为正常描述文本标签和相应的指标数据矩阵组成的二元组。

15、优选地,所述步骤s2采用:

16、步骤s2.1:构建异常时序指标矩阵生成器,包括时序指标矩阵判别器和时序指标矩阵生成器;

17、步骤s2.2:构建时序指标矩阵判别器所需样本集合,包括正样本集合和负样本集合;

18、步骤s2.3:基于时序指标矩阵判别器所需样本集合优化当前时序指标矩阵判别器的参数;

19、步骤s2.4:构建时序指标矩阵生成器所需样本集合,每个样本为[(预设长度的文本向量,随机短向量),1],其中,1表示样本标签;

20、步骤s2.5:将构建的时序指标矩阵生成器所需样本集合输入当前异常时序指标矩阵生成器,得到相应判别标签,基于判别标签和样本标签优化当前时序指标矩阵生成器,重复触发步骤s2.2至步骤s2.5,直至迭代次数达到预设值,得到训练后的异常时序指标矩阵生成器;

21、所述正样本集合包括:[(预设长度的文本向量,相对应的指标数据),1],其中,1表示正样本;

22、所述负样本集合包括:[(预设长度的文本向量,时序指标矩阵),0]以及[(与当前时序指标矩阵不对应的预设长度的文本向量,时序指标矩阵),0],其中,0表示负样本。

23、优选地,所述异常时序指标矩阵生成器采用:

24、步骤s2.1.1:将描述文本标签转化为预设长度的文本向量;

25、步骤s2.1.2:基于预设长度的文本向量以及随机短向量输入时序指标矩阵生成器获得尺寸与指标数据矩阵一致的时序指标矩阵;

26、步骤s2.1.3:将预设长度的文本向量与时序指标矩阵输入时序指标矩阵判别器,输出0或1;其中,0表示假;1表示真。

27、优选地,所述步骤s3采用:

28、步骤s3.1:基于自然语言描述利用训练后的异常时序指标矩阵生成器获取时序指标矩阵;

29、步骤s3.2:解析时序指标矩阵得到异常指标时序。

30、根据本发明提供的一种基于自然语言描述的异常时序指标生成系统,包括:

31、模块m1:构建指标样本库;

32、模块m2:构建异常时序指标生成器,并利用指标样本库训练异常时序指标生成器,得到训练后的异常时序指标生成器;

33、模块m3:利用训练后的异常时序指标生成器基于自然语言描述生成异常时序指标。

34、优选地,所述模块m1采用:

35、模块m1.1:基于预设场景收集指标数据,构成指标数据集;

36、模块m1.2:对收集的指标数据进行归一化处理,得到归一化处理后的指标数据集;

37、模块m1.3:基于归一化处理后的指标数据集构建预设场景异常指标样本库;

38、模块m1.4:基于归一化处理后的指标数据集构建预设场景正常指标样本库;

39、所述预设场景包括:cpu占满、cpu停止、内存占满以及网络中断;

40、所述指标包括:cpu占用率、内存占用率、网络吞吐率以及业务成功率;

41、所述异常指标样本库为异常描述文本标签和相应的异常指标数据矩阵组成的二元组;

42、所述正常指标样本库为正常描述文本标签和相应的指标数据矩阵组成的二元组。

43、优选地,所述模块m2采用:

44、模块m2.1:构建异常时序指标矩阵生成器,包括时序指标矩阵判别器和时序指标矩阵生成器;

45、模块m2.2:构建时序指标矩阵判别器所需样本集合,包括正样本集合和负样本集合;

46、模块m2.3:基于时序指标矩阵判别器所需样本集合优化当前时序指标矩阵判别器的参数;

47、模块m2.4:构建时序指标矩阵生成器所需样本集合,每个样本为[(预设长度的文本向量,随机短向量),1],其中,1表示样本标签;

48、模块m2.5:将构建的时序指标矩阵生成器所需样本集合输入当前异常时序指标矩阵生成器,得到相应判别标签,基于判别标签和样本标签优化当前时序指标矩阵生成器,重复触发模块m2.2至模块m2.5,直至迭代次数达到预设值,得到训练后的异常时序指标矩阵生成器;

49、所述正样本集合包括:[(预设长度的文本向量,相对应的指标数据),1],其中,1表示正样本;

50、所述负样本集合包括:[(预设长度的文本向量,时序指标矩阵),0]以及[(与当前时序指标矩阵不对应的预设长度的文本向量,时序指标矩阵),0],其中,0表示负样本。

51、优选地,所述异常时序指标矩阵生成器采用:

52、模块m2.1.1:将描述文本标签转化为预设长度的文本向量;

53、模块m2.1.2:基于预设长度的文本向量以及随机短向量输入时序指标矩阵生成器获得尺寸与指标数据矩阵一致的时序指标矩阵;

54、模块m2.1.3:将预设长度的文本向量与时序指标矩阵输入时序指标矩阵判别器,输出0或1;其中,0表示假;1表示真。

55、优选地,所述模块m3采用:

56、模块m3.1:基于自然语言描述利用训练后的异常时序指标矩阵生成器获取时序指标矩阵;

57、模块m3.2:解析时序指标矩阵得到异常指标时序。

58、与现有技术相比,本发明具有如下的有益效果:

59、1、本发明通过将多个异常指标矩阵化,使得系统可以表达某一异常场景下多个指标的相关现象,使得数据模拟更为全面;

60、2、本发明通过将矩阵化的指标与运维描述文本联合建模,使得系统具备从文本直接生成对应的运维指标数据的能力,使得数据模拟更为方便,降低用户专业水平要求;

61、3、本发明通过使用特定系统场景调整模型风格的方法,使得系统具备对不同风格(周期性、趋势性)的运维指标的模拟,增加了系统模拟数据的真实性、灵活性。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1