一种数据分析方法、装置、电子设备及存储介质与流程

文档序号:37343576发布日期:2024-03-18 18:16阅读:11来源:国知局
一种数据分析方法、装置、电子设备及存储介质与流程

本申请涉及数据处理领域,尤其涉及一种数据分析方法、装置、电子设备及存储介质。


背景技术:

1、时间序列数据是一种包括时间数据以及与时间数据对应的某类数据的数据,异常检测是目前时间序列数据分析领域中较为成熟的应用之一,是从正常的时间序列数据中识别出不正常的事件或行为的过程,其对时间序列数据进行分析,以得到某类数据在与其对应的时间数据所表征的时间点或时间段内的异常情况,从而反映出产生时间序列数据的设备或环境的异常情况的数据异常检测方法。该方法广泛应用于诸多领域如量化交易、网络安全检测、自动驾驶汽车和大型工业设备的日常维护等领域。

2、相关技术通过基于自注意力机制的传统transformer模型对时间序列数据进行分析,该模型在结构上的参数量较多,在处理时间序列数据中的非线性时间序列数据或海量时间序列数据时会导致较高的计算耗时和精度上的损失。

3、有鉴于此,需要一个基于同样有效且更为精简的分析模型的时间序列异常检测方法。


技术实现思路

1、本申请实施例提供一种数据分析方法、装置、电子设备及存储介质,解决了相关技术在处理时间序列数据中的非线性时间序列数据或海量时间序列数据时会导致较高的计算耗时和精度上的损失的问题。

2、为实现上述技术目的,本申请实施例采用如下技术方案:

3、第一方面,本申请实施例提供一种数据分析方法,该方法包括:

4、获取时间序列数据;时间序列数据包括至少一组时间数据;

5、将时间序列数据输入第一模型,输出时间序列中每组时间数据的异常度;其中,第一模型包括串联的多层时频域融合层以及全连接层;时频域融合层用于基于第一输入数据进行时域和频域的数据融合,输出第一输出数据;第一层时频域融合层的第一输入数据为时间序列数据,第i层时频域融合层的第一输入数据为第i-1层时频域融合层的第一输出数据,i为大于1的整数;全连接层用于根据时频域融合层的第一输出数据输出时间序列中每组时间数据的异常度。

6、第一方面中,通过以fft模块替代传统transformer模型中的自注意力模块构成时频域融合层,得到改进的包含堆叠的多个时频域融合层的transformer模型,在其他条件不变的情况下,将模型的参数量减小为原来的60%,可以在保证时间序列数据异常检测精度的同时,有效减少计算耗时,从而提高处理效率。

7、在一种实现中,时频域融合层具体用于:

8、将第一输入数据转化为频域数据;

9、将频域数据和对应的时间数据进行残差连接并归一化,输出第二输出数据;

10、将第二输出数据进行至少一轮第一处理,输出第三输出数据;其中,第一处理包括:

11、对第二输入数据进行第一线性变换,得到第一中间数据;

12、将第一中间数据与第二输入数据进行残差链接并归一化,输出第三输出数据;第一轮第一处理的第二输入数据为第二输出数据,第j轮第一处理的第二输入数据为第j-1轮第一处理的第三输出数据,j为大于1的整数。

13、在一种实现中,频域数据为基于第一输入数据进行快速傅里叶变换得到的。

14、在一种实现中,根据时频域融合层的第一输出数据输出时间序列中每组时间数据的异常度,包括:

15、对第一输出数据进行第二线性变换,得到第一特征数据;

16、对时间序列数据中的时间数据与对应的第一特征数据作差,作差得到的结果的绝对值为时间数据的异常度。

17、在一种实现中,方法还包括:将异常度符合预设异常条件的时间数据确定为异常数据;预设异常条件包括:异常度在时间数据对应的异常度中按异常度大小排序得到的位数小于或等于预设位数;预设位数基于时间序列数据的时间数据的数量及预设比例确定。

18、第二方面,本申请实施例提供一种数据分析装置,该装置包括:

19、获取模块,用于获取时间序列数据;时间序列数据包括至少一组时间数据;

20、处理模块,用于将时间序列数据输入第一模型,输出时间序列中每组时间数据的异常度;其中,第一模型包括串联的多层时频域融合层以及全连接层;时频域融合层用于基于第一输入数据进行时域和频域的数据融合,输出第一输出数据;第一层时频域融合层的第一输入数据为时间序列数据,第i层时频域融合层的第一输入数据为第i-1层时频域融合层的第一输出数据,i为大于1的整数;全连接层用于根据时频域融合层的第一输出数据输出时间序列中每组时间数据的异常度。

21、在一种实现中,处理模块具体用于调用串联的多层时频域融合层进行以下处理:

22、将第一输入数据转化为频域数据;

23、将频域数据和对应的时间数据进行残差连接并归一化,输出第二输出数据;将第二输出数据进行至少一轮第一处理,输出第三输出数据;其中,第一处理包括:对第二输入数据进行第一线性变换,得到第一中间数据;将第一中间数据与第二输入数据进行残差链接并归一化,输出第四输出数据;第一轮第一处理的第二输入数据为第二输出数据,第j轮第一处理的第二输入数据为第j-1轮第一处理的第四输出数据,j为大于1的整数;

24、频域数据为基于第一输入数据进行快速傅里叶变换得到的;

25、处理模块,具体用于:对第一输出数据进行第二线性变换,得到第一特征数据;对时间序列数据中的时间数据与对应的第一特征数据作差,作差得到的结果的绝对值为时间数据的异常度。

26、在一种实现中,装置还包括确定模块,用于将异常度符合预设异常条件的时间数据确定为异常数据;预设异常条件包括:异常度在时间数据对应的异常度中按异常度大小排序得到的位数小于或等于预设位数;预设位数基于时间序列数据的时间数据的数量及预设比例确定。

27、第三方面,本申请提供一种电子设备,包括:处理器,以及用于存储处理器可执行指令的存储器;其中,处理器被配置为执行指令,以实现如上述第一方面提供的数据分析方法。

28、第四方面,本申请提供一种计算机可读存储介质,存储有信息传递的实现程序,该程序被处理器执行时实现如第一方面提供的数据分析方法。

29、第五方面,本申请提供一种计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行如上述第一方面提供的方法。

30、本申请中第二方面、第三方面、第四方面和第五方面描述的有益效果,可以参考第一方面的有益效果分析,此处不再赘述。



技术特征:

1.一种数据分析方法,其特征在于,包括:

2.如权利要求1所述的数据分析方法,其特征在于,所述时频域融合层具体用于:

3.如权利要求2所述的数据分析方法,其特征在于,所述频域数据为基于所述第一输入数据进行快速傅里叶变换得到的。

4.如权利要求1、2或3任一项所述的数据分析方法,其特征在于,所述根据所述时频域融合层的所述第一输出数据输出所述时间序列中每组所述时间数据的异常度,包括:

5.如权利要求4所述的数据分析方法,其特征在于,所述方法还包括:将所述异常度符合预设异常条件的所述时间数据确定为异常数据;所述预设异常条件包括:所述异常度在所述时间数据对应的异常度中按异常度大小排序得到的位数小于或等于预设位数;预设位数基于所述时间序列数据的所述时间数据的数量及预设比例确定。

6.一种数据分析装置,其特征在于,包括:

7.如权利要求6所述的数据分析装置,其特征在于,所述处理模块具体用于调用所述串联的多层时频域融合层进行以下处理:

8.如权利要求7所述的数据分析装置,其特征在于,所述装置还包括确定模块,用于将所述异常度符合预设异常条件的所述时间数据确定为异常数据;所述预设异常条件包括:所述异常度在所述时间数据对应的异常度中按异常度大小排序得到的位数小于或等于预设位数;预设位数基于所述时间序列数据的所述时间数据的数量及预设比例确定。

9.一种电子设备,其特征在于,包括:存储器,处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至5中任一项所述的数据分析方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至5中任一项所述的数据分析方法。


技术总结
本申请公开了一种数据分析方法、装置、电子设备及存储介质,涉及数据处理领域,以解决时间序列数据分析时计算耗时较高的问题。该方法包括:获取时间序列数据;所述时间序列数据包括至少一组时间数据;将所述时间序列数据输入第一模型,输出所述时间序列中每组所述时间数据的异常度。

技术研发人员:杨文强,杨文聪,黄蓉,唐雄燕
受保护的技术使用者:中国联合网络通信集团有限公司
技术研发日:
技术公布日:2024/3/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1