内核优化和延迟执行的制作方法

文档序号:33799277发布日期:2023-04-19 10:53阅读:28来源:国知局
内核优化和延迟执行的制作方法

至少一个实施例涉及根据本文描述的各种新颖技术的内核优化和执行。例如,在图形处理单元上执行先前提交的内核之前,代理可以根据本文描述的各种新颖技术修改图形处理单元上的内核的内核参数。


背景技术:

1、内核的优化需要了解与内核相关联的应用程序的需求以及内核将在其上操作的信息(例如,数据)。数据可以来自计算机系统内部或来自计算机系统外部(例如,通过网络来自远程计算机系统)。通常,在将内核提交给处理器执行之前,应该知道要用于内核的数据。如果在内核提交给处理器(例如,图形处理单元(gpu))时数据是已知的,则可以根据已知数据优化该内核以执行。但是,在某些情况下,在内核提交时要在内核中使用的数据是未知的。例如,在某些情况下,可以在提交内核之后通过网络接口接收数据,在这种情况下,可能无法在提交内核时选择优化的参数以用于内核的执行。这可能导致内核效率低下,其中要么已将太多资源提交给内核,要么已提交给内核的资源太少。或者,应用程序可能会等到收到数据后再提交内核,这会引入内核的提交和执行上的延迟。


技术实现思路



技术特征:

1.一种方法,包括:

2.如权利要求1所述的方法,其中提交所述内核包括设置与所述内核相关联的等待执行标志,所述方法还包括:

3.如权利要求2所述的方法,其中执行所述内核包括重置与所述内核相关联的等待执行标志。

4.如权利要求2所述的方法,还包括:

5.如权利要求1所述的方法,其中所述数据包括消息,所述消息具有包括报头信息的报头和包括消息内容的主体,其中所述报头信息用于更新所述至少一个动态可配置参数,并且所述主体用于使得所述内核在所述至少一个动态可配置参数被更新后执行。

6.如权利要求1所述的方法,其中所述至少一个动态可配置参数包括数据大小参数、数据类型参数、线程数参数或存储器量参数中的至少一个。

7.如权利要求1所述的方法,其中所述内核被提交给图形处理单元并在所述图形处理单元上执行。

8.一种系统,包括:

9.如权利要求8所述的系统,其中所述第一处理设备是图形处理单元,所述第二处理设备是中央处理单元,并且所述第三设备是网络接口控制器,并且其中所述网络接口控制器用于通过网络连接从远程系统接收所述数据。

10.如权利要求8所述的系统,其中由所述第二处理设备提交所述内核包括设置与所述内核相关联的等待执行标志,其中所述第三设备进一步用于:

11.如权利要求10所述的系统,其中由所述第一处理设备执行所述内核包括由所述第三设备重置与所述内核相关联的所述等待执行标志。

12.如权利要求10所述的系统,其中所述第一处理设备进一步用于将所述第一存储器位置或所述第二存储器位置中的至少一个发送到所述第三设备。

13.如权利要求8所述的系统,其中所述数据包括消息,所述消息具有包括报头信息的报头和包括消息内容的主体,其中所述报头信息用于更新所述至少一个动态可配置参数,并且所述主体用于使得所述内核在至少一个动态可配置参数被更新后执行。

14.如权利要求9所述的系统,其中所述至少一个动态可配置参数包括数据大小参数、数据类型参数、线程数参数或存储器量参数中的至少一个。

15.一种非暂时性计算机可读存储介质,包括指令,所述指令在由处理设备执行时,使所述处理设备执行操作,所述操作包括:

16.如权利要求15所述的非暂时性计算机可读存储介质,其中提交所述内核包括设置与所述内核相关联的等待执行标志。

17.如权利要求16所述的非暂时性计算机可读存储介质,其中所述指令还使所述处理设备执行包括以下的操作:

18.如权利要求16所述的非暂时性计算机可读存储介质,其中执行所述内核包括重置与所述内核相关联的等待执行标志。

19.如权利要求17所述的非暂时性计算机可读存储介质,其中所述指令还使所述处理设备执行包括以下的操作:

20.如权利要求18所述的非暂时性计算机可读存储介质,其中所述内核被提交给图形处理单元并在所述图形处理单元上执行。


技术总结
本公开涉及内核优化和延迟执行。包括至少一个动态可配置参数的内核由处理器提交。内核将在稍后被执行。提交内核后接收数据。基于数据更新内核的至少一个动态可配置参数。在至少一个动态可配置参数已被更新之后执行具有至少一个更新的动态可配置参数的内核。

技术研发人员:S·苏尔,S·A·B·琼斯,S·舒勒
受保护的技术使用者:迈络思科技有限公司
技术研发日:
技术公布日:2024/1/13
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1