数据处理方法、设备及介质与流程

文档序号:36791916发布日期:2024-01-23 12:11阅读:18来源:国知局
数据处理方法、设备及介质与流程

本技术涉及数据处理,具体涉及一种数据处理方法、设备及介质。


背景技术:

1、时序预测广泛存在于人们的日常生活中,例如交通态势预测、天气预测等等。由于时序预测的精准性对于系统的安全性、稳定性以及运行效率的提高至关重要,时序预测从时间序列预测,到考虑空间因素的预测,再随着机器学习和深度学习的兴起的预测模型的预测,不断发展变化。

2、目前对于时序预测,一般基于采用注意力机制的预测模型,例如时空图卷积神经网络、transformer模型、informer模型等。通过输入包括时空两个维度的图数据,捕获图数据的时间特征和空间特征提高模型的预测精度。其中,图数据例如交通领域的城市道路网络、生物化学领域的药物分子结构、推荐系统领域的社交关系网络等。例如,图1a中,输入城市道路网络(即图数据),包括道路还有各个路口,然后根据输入的城市道路网络预测各个时间段的交通态势。再例如,图1b中,输入药物分子结构,包括单个原子表示的节点以及连接的化学键表示的边,预测该药物分子的三维结构。

3、然而,目前的注意力机制一般为自注意力机制,需要对输入数据的每个位置计算权重,这样会占据大量的计算资源,模型复杂度较高。当图数据的图顶点规模较大时,预测模型易受到计算机硬件资源的限制,模型训练难以进行。


技术实现思路

1、本技术实施例提供了一种数据处理方法、设备及介质,解决神经网络模型训练时占用时间和内存过多的问题。

2、第一方面,本技术实施例提供了一种数据处理方法,应用于电子设备,包括:获取神经网络模型的输入张量;基于输入张量和第一预设张量进行注意力机制计算,得到第一中间张量,其中,第一预设张量的维度与输入张量的维度相同,第一预设张量的至少一个维度的维数小于输入张量的对应维度的维数,第一中间张量的维度和各维度的维数与第一预设张量的维度和各维度的维数相同;基于输入张量和第一中间张量进行注意力机制计算,得到输入张量的第一特征提取结果;基于第一特征提取结果和神经网络模型进行推理,得到神经网络模型的推理结果。

3、可以理解,第一预设张量为根据神经网络模型中的预设参数随机初始化得到,第一预设张量可以理解为下文中的低维学习参数张量。由于第一预设张量中的至少一个维度的维数小于输入张量的对应维度的维数,则根据第一预设张量和输入张量计算得到第一中间张量的计算复杂度相比于自注意力机制的计算复杂度会降低,当输入张量的维数足够大时,计算得到中间张量的计算复杂度会大幅降低。

4、可以理解,第一中间张量为下文中的根据输入张量和低维学习参数张量采用注意力机制计算得到的低维的中间张量。第一特征提取结果为下文中的根据低维的中间张量和输入张量采用注意力机制计算得到的输出张量(即输入张量的特征),提取到的为输入张量的第一维度的特征。

5、在一些实施例中,神经网络模型为采用注意力机制实现对应应用场景下的数据预测的模型(即神经网络模型为预测模型)。其中,数据预测可以例如交通态势预测、天气预测、输入法联想预测等。神经网络模型。预测模型,可以例如时空图卷积神经网络、transformer模型、informer模型等。神经网络模块的推理即通过预测模块进行数据预测或训练预测模块。

6、本技术中的数据处理方法,在采用注意力机制计算输入张量的特征时,引入比输入张量维数更少的第一预设张量,可以降低计算复杂度,提高计算速度,并且减少在计算过程中占用的内存,使得神经网络模型的推理时间更少,推理所需的计算资源更少。

7、在上述第一方面的一种可能的实现中,基于输入张量和第一预设张量进行注意力机制计算,得到第一中间张量,包括:将第一预设张量作为注意力机制计算中的查询,将输入张量作为注意力机制计算中的键和值,进行注意力机制计算,得到第一中间张量。

8、可以理解,第一预设张量作为下文注意力机制计算公式(1)中的q,将输入张量作为注意力机制计算公式(1)中的k和v,采用注意力机制计算公式(1),计算得到第一中间张量。

9、在上述第一方面的一种可能的实现中,基于输入张量和第一中间张量进行注意力机制计算,得到输入张量的第一特征提取结果,包括:将输入张量作为注意力机制计算中的查询,将第一中间张量作为注意力机制计算中的键和值,进行注意力机制计算,得到第一特征提取结果。

10、可以理解,输入张量作为下文注意力机制计算公式(1)中的q,将第一中间张量作为注意力机制计算公式(1)中的k和v,采用注意力机制计算公式(1),计算得到第一特征提取结果。

11、在上述第一方面的一种可能的实现中,基于第一特征提取结果和神经网络模型进行推理,包括:将第一特征提取结果作为输入张量的第一特征,并基于第一特征和神经网络模型进行推理。

12、在上述第一方面的一种可能的实现中,上述方法还包括:基于输入张量和第二预设张量进行注意力机制计算,得到第二中间张量,其中,第二中间张量的维度和各维度的维数与第二预设张量的维度和各维度的维数相同,第二预设张量中至少两个维度由输入张量的至少两个维度发生维度调换后得到,且维度调换前的第二预设张量中至少两个维度中的至少一个维度中的维数小于输入张量对应维度的维数;基于输入张量和第二中间张量进行注意力机制计算,得到输入张量的第二特征提取结果;基于第一特征提取结果和第二特征提取结果和神经网络模型进行推理,得到神经网络模型的推理结果。

13、可以理解,第二预设张量为根据神经网络模型中的预设参数随机初始化得到,第二预设张量可以理解为下文中的低维学习参数张量。且第二预设张量不同于输入张量的维数的维度与第一预设张量不同。由于第二预设张量中的至少一个维度的维数小于输入张量的对应维度的维数,则根据第二预设张量和输入张量计算得到第二中间张量的计算复杂度相比于自注意力机制的计算复杂度会降低,当输入张量的维数足够大时,计算得到中间张量的计算复杂度会大幅降低。

14、可以理解,第二中间张量为下文中的根据输入张量和低维学习参数张量采用注意力机制计算得到的低维的中间张量。第二特征提取结果为下文中的根据低维的中间张量和输入张量采用注意力机制计算得到的输出张量(即输入张量的特征),提取到的为输入张量的第二维度的特征。

15、可以理解,通过上述第一预设张量和第二预设张量可以实现对输入张量的两个维度的特征提取。即本技术实施例提供的数据处理方法可以实现对输入张量的至少一个维度的特征提取。

16、在上述第一方面的一种可能的实现中,基于输入张量和第二预设张量进行注意力机制计算,得到第二中间张量,包括:将第二预设张量作为注意力机制计算中的查询,将输入张量作为注意力机制计算中的键和值,进行注意力机制计算,得到第二中间张量。

17、可以理解,第二预设张量作为下文注意力机制计算公式(1)中的q,将输入张量作为注意力机制计算公式(1)中的k和v,采用注意力机制计算公式(1),计算得到第二中间张量。

18、在上述第一方面的一种可能的实现中,基于第一特征提取结果和第二特征提取结果和神经网络模型进行推理,包括:将输入张量作为注意力机制计算中的查询,将第二中间张量作为注意力机制计算中的键和值,进行注意力机制计算,得到第二特征提取结果。

19、可以理解,输入张量作为下文注意力机制计算公式(1)中的q,将第二中间张量作为注意力机制计算公式(1)中的k和v,采用注意力机制计算公式(1),计算得到第二特征提取结果。

20、在上述第一方面的一种可能的实现中,基于第一特征提取结果和第二特征提取结果和神经网络模型进行推理,包括:对第一特征提取结果和第二特征提取结果进行逐元素相加,并将相加结果进行归一化处理得到输入张量的第二特征;基于第二特征和神经网络模型进行推理。

21、在上述第一方面的一种可能的实现中,对输入张量进行特征提取后得到具有第一形状的第一特征提取结果。

22、在上述第一方面的一种可能的实现中,输入张量的形状和第一形状相同。

23、可以理解,在神经网络模型获取到输入张量后,可以根据神经网络模型的嵌入维度,对输入张量进行特征嵌入,然后再执行上述将特征嵌入后的张量作为输入张量进行后续的特征提取。神经网络模型的嵌入维度的维数可以与输入张量的对应维度的维数相同。例如,预测模型的嵌入维度为8,而输入的张量数据的形状为100×24×3(其中3表示输入数据的特征维度),因此对输入的张量数据进行特征嵌入后变成形状为100×24×8的张量数据。

24、在上述第一方面的一种可能的实现中,输入张量的形状和第一形状不同。

25、可以理解,神经网络模型的嵌入维度的维数可以与输入张量的对应维度的维数不同,即神经网络模型的嵌入维度的维数可以比输入张量的对应维度的维数大,也可以比输入张量的对应维度的维数小。例如,预测模型的嵌入维度的维数为8,而输入的张量数据的形状为100×24×3(其中3表示输入数据的特征维度的维数),因此对输入的张量数据进行特征嵌入后变成形状为100×24×8的张量数据。

26、在上述第一方面的一种可能的实现中,上述方法还包括:在推理结果不满足终止条件的情况下,调整第一预设张量的参数;基于输入张量和调整后的第一预设张量进行注意力机制计算,得到第一中间张量。

27、可以理解,在进行神经网络模型的推理后,如果推理结果与预期推理结果相差过大,可以根据推理结果对第一预设张量的初始化参数进行调整,然后再进行上述数据处理过程,使得推理结果更加准确。

28、第二方面,本技术实施例提供了一种数据处理装置,包括:获取模块,用于获取神经网络模型的输入张量;注意力机制计算模块,用于基于输入张量和第一预设张量进行注意力机制计算,得到第一中间张量,其中,第一预设张量的维度与输入张量的维度相同,第一预设张量的至少一个维度的维数小于输入张量的对应维度的维数,第一中间张量的维度和各维度的维数与第一预设张量的维度和各维度的维数相同;基于输入张量和第一中间张量进行注意力机制计算,得到输入张量的第一特征提取结果;推理模块,用于基于第一特征提取结果和神经网络模型进行推理,得到神经网络模型的推理结果。

29、第三方面,本技术实施例提供了一种电子设备,包括:一个或多个处理器;一个或多个存储器;一个或多个存储器存储有一个或多个程序,当一个或者多个程序被一个或多个处理器执行时,使得电子设备执行上述数据处理方法。

30、第四方面,本技术实施例提供了一种计算机可读存储介质,存储介质上存储有指令,指令在计算机上执行时使计算机执行上述数据处理方法。

31、第五方面,本技术实施例提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述数据处理方法。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1