一种DMA传输数据预处理方法、计算子系统及智能计算平台与流程

文档序号:37798666发布日期:2024-04-30 17:08阅读:5来源:国知局
一种DMA传输数据预处理方法、计算子系统及智能计算平台与流程

本技术属于数据处理领域,尤其涉及一种dma传输数据预处理方法、计算子系统及智能计算平台。


背景技术:

1、当下随着人工智能的飞速发展,功能各异的智能计算平台不断涌现。对智能计算平台内用于运算的中央处理器(central processing unit,cpu)的计算和运行能力的要求也日益增大。智能计算平台的cpu主要用于运行各类深度学习模型。而各类模型的权重张量十分庞大,当深度学习模型大小大于cpu的外部的存储器容量时,绕过cpu的存储限制的一种方式是将模型划分成多个部分并在多个cpu中运行。然而,此类解决方案在成本和各cpu的通信问题上都导致模型运行效果受到影响,导致模型运行存在较长的延迟和较低的吞吐量。

2、虽然cpu运行深度学习模型使用的权重张量可能很大,但由于许多权重张量是稀疏的,因为许多权重值是零。当下具有在线解压缩单元的直接存储器访问(direct memoryaccess ,dma)引擎可以即时地处理、解压缩权重张量。但由于智能计算平台内处理的数据量过于庞大,导致dma引擎随着数据内容、类型的变化,基于dma引擎的处理效率不断下降,影响智能计算平台的运行效率。

3、因此,亟需一种对dma传输数据预处理方法,以提升dma引擎与存储器的数据传输的效率。


技术实现思路

1、本技术实施例提供了一种dma传输数据预处理方法、计算子系统及智能计算平台,可以解决传统的通过在dma引擎中根据预设的解压缩策略和传输参数执行解压缩和数据传输过程中,当智能计算平台内处理的数据量过于庞大时,会导致dma引擎随着数据内容、类型的变化,基于dma引擎的处理效率不断下降,影响dma引擎与存储器的数据传输的效率的问题。

2、第一方面,本技术实施例提供了一种dma传输数据预处理方法,应用于智能计算平台的dma引擎,所述智能计算平台还包括存储器和终端设备;所述方法包括:

3、在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;

4、根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;

5、根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;

6、根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据;

7、根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;

8、将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;

9、将所述第二目标数据发送至所述终端设备中。

10、在一些实施例中,所述对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果,包括:将所述第一目标数据输入预设的稀疏性检测模型,所述稀疏性检测模型用于输出所述第一目标数据对应的零元素信息和无用元素信息,根据所述零元素信息和无用元素信息计算所述稀疏性检测结果。

11、示例性的,所述稀疏性检测模型包括零元素提取网络、无用元素提取网络和结果计算网络;所述将所述第一目标数据输入预设的稀疏性检测模型,包括:将所述第一目标数据输入至所述零元素提取网络,所述零元素提取网络用于获取所述第一目标数据中的零元素和空白元素,以根据所述零元素和空白元素输出所述零元素信息;将所述第一目标数据输入至所述无用元素提取网络,所述无用元素提取网络用于运行所述第一目标数据,将所述第一目标数据在预设时长内未变化的元素确认为无用元素,以根据所述无用元素输出所述无用元素信息;将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络用于根据所述零元素信息和所述无用元素信息计算所述稀疏性检测结果。

12、需要说明的是,在一些实施例中,所述将所述零元素信息和所述无用元素信息输入至所述结果计算网络,包括:将所述零元素信息和所述无用元素信息输入至所述结果计算网络,所述结果计算网络采用预设的稀疏性检测公式计算所述零元素信息和所述无用元素信息对应的所述稀疏性检测结果,所述稀疏性检测公式包括:

13、;

14、式中y为所述稀疏性检测结果对应的值,z为所述零元素信息对应的数据大小,n为所述无用元素信息的数据大小,a为所述目标数据的数据大小,以根据所述稀疏性检测结果的值将所述第一目标数据分为稀疏数据和非稀疏数据。

15、在一些实施例中,所述根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,包括:当根据所述稀疏性检测结果确定所述稀疏数据中存在噪声信息时,采用最小绝对值选择与收缩算法作为所述目标压缩算法;当根据所述稀疏性检测结果确定所述稀疏数据中不存在噪声信息时,采用基于弹性网正则化的稀疏编码算法作为所述目标压缩算法。

16、在一些实施例中,在所述根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据之前,还包括:将所述稀疏数据输入至预设的数据重构模型,所述数据重构模型对所述稀疏数据进行数据重构,输出所述稀疏数据对应的重构数据,以根据所述目标压缩算法对所述重构数据进行压缩。

17、在一些实施例中,所述神经网络模型包括特征提取网络、生成网络和合并网络;所述将所述压缩数据和所述编码数据输入至预设的神经网络模型,包括:将所述压缩数据和所述编码数据分别输入至所述特征提取网络,以获取所述压缩数据对应的第一内容信息和所述编码数据对应的第二内容信息;将所述第一内容信息和所述第二内容信息输入至所述生成网络,所述生成网络用于根据所述第一内容信息和第二内容信息生成排序信息;将所述压缩数据、所述编码数据和所述排序信息输入至所述合并网络,所述合并网络用于根据所述排序信息合并所述压缩数据和所述编码数据,以输出所述第二目标数据。

18、在一些实施例中,其特征在于,在所述将所述第二目标数据发送至所述终端设备中之前,还包括:将所述第二目标数据输入至预设的特征提取模型,输出所述第二目标数据对应的特征信息;根据所述特征信息确定所述第二目标数据对应的第一目标格式;将所述第二目标数据的数据格式转换为所述第一目标格式,用于将转换后的所述第二目标数据发送至所述终端设备;或,获取所述终端设备的终端数据格式,将所述终端数据格式确认为第二目标格式;将所述第二目标数据的数据格式转换为所述第二目标格式,用于将转换后的所述第二目标数据发送至所述终端设备。

19、第二方面,本技术实施例提供了一种计算子系统,应用于智能计算平台的dma引擎,所述智能计算平台还包括存储器和终端设备;所述计算子系统包括:

20、获取模块,用于在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测 ,获取所述第一目标数据对应的稀疏性检测结果;

21、解析模块,用于根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;

22、确定模块,用于根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;

23、压缩模块,用于根据所述目标压缩算法对所述稀疏数据进行压缩,获取第一压缩数据;

24、编码模块,用于根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;

25、合并模块,用于将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;

26、发送模块,用于将所述第二目标数据发送至所述终端设备中。

27、第三方面,本技术实施例提供了一种智能计算平台,包括dma引擎、存储器和终端设备;

28、其中,所述dma引擎包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如本技术任一实施例所提供的dma传输数据预处理方法。

29、本技术实施例与现有技术相比存在的有益效果是:

30、本技术实施例提供的技术方案中,首先,在接收到所述终端设备发送的对所述存储器的数据访问请求时,获取所述数据访问请求对应的第一目标数据,对所述第一目标数据进行稀疏性检测,获取所述第一目标数据对应的稀疏性检测结果;然后,根据所述稀疏性检测结果将所述第一目标数据分为稀疏数据和非稀疏数据,解析所述非稀疏数据获取所述非稀疏数据对应的数据类型;同时,根据所述稀疏性检测结果确定所述稀疏数据对应的目标压缩算法,根据所述数据类型确定所述非稀疏数据对应的目标编码算法;再然后,根据所述目标压缩算法对所述稀疏数据进行压缩,获取压缩数据并根据所述目标编码算法对所述非稀疏数据进行编码,获取编码数据;进一步的,将所述压缩数据和所述编码数据输入至预设的神经网络模型,所述神经网络模型用于对所述压缩数据和编码数据进行排序和合并,输出第二目标数据;最后,将所述第二目标数据发送至所述终端设备中。

31、本技术实施例中,所提供的方法能够在智能计算平台内的任意终端设备需要对任意存储器的数据进行访问时,dma引擎能够通过对数据访问请求对应的第一目标数据进行稀疏性检测,以将第一目标数据分为稀疏数据和非稀疏数据,进而确定稀疏数据对应的目标压缩算法和非稀疏数据对应的目标编码算法,将对稀疏数据的压缩后获得的压缩数据和非稀疏数据编码后获得的编码数据输入至预设的神经网络模型,以对压缩数据和编码数据进行排序和合并,输出第二目标数据并输入至终端设备中。进而确保了智能计算平台运行的稳定性,提升dma引擎与存储器的数据传输的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1