从多维阵列预取多维元素块的硬件装置和方法与流程

文档序号:24160774发布日期:2021-03-05 16:31阅读:来源:国知局

技术特征:
1.一种硬件处理器,包括:解码器,用于解码预取指令以将多维元素块从多维阵列预取到高速缓存中,其中预取指令的至少一个操作数将指示多维元素块的元素的系统存储器地址、多维元素块的步幅和多维元素块的边界;以及执行单元,用于执行预取指令以:生成多维元素块的其它元素的系统存储器地址;以及将多维元素块从系统存储器地址加载到高速缓存中。2.根据权利要求1所述的硬件处理器,进一步包括预取单元,以从状态机生成多维元素块的其它元素的系统存储器地址。3.根据权利要求2所述的硬件处理器,其中预取单元进一步包括加法器,以生成多维元素块的其它元素的系统存储器地址。4.根据权利要求2所述的硬件处理器,其中预取单元进一步包括地址生成单元,以生成多维元素块的其它元素的系统存储器地址。5.根据权利要求1所述的硬件处理器,其中指令的至少一个操作数将指示高速缓存的级以加载多维元素块。6.根据权利要求1所述的硬件处理器,其中步幅包括第一维度中的第一步幅和第二维度中的不同的第二步幅。7.根据权利要求1所述的硬件处理器,其中执行单元将加载多维元素块到受害者高速缓存中。8.根据权利要求1-7中任一项所述的硬件处理器,其中执行单元将用多维元素块代替高速缓存中的推测性预取数据集。9.一种方法,包括:用解码单元解码预取指令以将多维元素块从多维阵列预取到高速缓存中,其中预取指令的至少一个操作数将指示多维元素块的元素的系统存储器地址、多维元素块的步幅和多维元素块的边界;以及用执行单元执行预取指令以:生成多维元素块的其它元素的系统存储器地址;以及将多维元素块从系统存储器地址加载到高速缓存中。10.根据权利要求9所述的方法,进一步包括提供预取单元,以从状态机生成多维元素块的其它元素的系统存储器地址。11.根据权利要求10所述的方法,其中预取单元进一步包括加法器,以生成多维元素块的其它元素的系统存储器地址。12.根据权利要求10所述的方法,其中预取单元进一步包括地址生成单元,以生成多维元素块的其它元素的系统存储器地址。13.根据权利要求9所述的方法,其中指令的至少一个操作数将指示高速缓存的级以加载多维元素块。14.根据权利要求9所述的方法,其中步幅包括第一维度中的第一步幅和第二维度中的不同的第二步幅。15.根据权利要求9所述的方法,其中执行单元将加载多维元素块到受害者高速缓存
中。16.根据权利要求9-15中任一项所述的方法,其中执行单元将用多维元素块代替高速缓存中的推测性预取数据集。17.一种装置,包括:一个或多个处理器的集合;以及存储代码的一个或多个数据存储设备的集合,该代码在由处理器的集合执行时使得一个或多个处理器的集合执行以下各项:用解码单元解码预取指令以将多维元素块从多维阵列预取到高速缓存中,其中预取指令的至少一个操作数将指示多维元素块的元素的系统存储器地址、多维元素块的步幅和多维元素块的边界;以及用执行单元执行预取指令以:生成多维元素块的其它元素的系统存储器地址;以及将多维元素块从系统存储器地址加载到高速缓存中。18.根据权利要求17所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:进一步包括提供预取单元以从状态机生成多维元素块的其它元素的系统存储器地址。19.根据权利要求18所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中预取单元进一步包括加法器以生成多维元素块的其它元素的系统存储器地址。20.根据权利要求18所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中预取单元进一步包括地址生成单元以生成多维元素块的其它元素的系统存储器地址。21.根据权利要求17所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中指令的至少一个操作数将指示高速缓存的级以加载多维元素块。22.根据权利要求17所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中步幅包括第一维度中的第一步幅和第二维度中的不同的第二步幅。23.根据权利要求17所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中执行单元将加载多维元素块到受害者高速缓存中。24.根据权利要求17-23中任一项所述的装置,其中数据存储设备的集合进一步存储代码,该代码在由处理器的集合执行时使得处理器的集合执行以下各项:其中执行单元将用多维元素块代替高速缓存中的推测性预取数据集。25.一种硬件处理器,包括:用于解码预取指令以将多维元素块从多维阵列预取到高速缓存中的装置,其中预取指令的至少一个操作数将指示多维元素块的元素的系统存储器地址、多维元素块的步幅和多维元素块的边界;以及
用于执行预取指令以进行以下各项的装置:生成多维元素块的其它元素的系统存储器地址;以及将多维元素块从系统存储器地址加载到高速缓存中。
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1