一种芯片控制方法、装置、系统、存储介质及电子设备与流程

文档序号:37510780发布日期:2024-04-01 14:17阅读:9来源:国知局
一种芯片控制方法、装置、系统、存储介质及电子设备与流程

本说明书涉及计算机,尤其涉及一种芯片控制方法、装置、系统、存储介质及电子设备。


背景技术:

1、目前,使用计算机等电子设备处理数据已经极为普遍,而为了应对日益增大的数据规模,电子设备中使用多个芯片来相互配合处理大规模数据已经成为主流方案。

2、例如,可利用多个图形处理器(graphics processing unit,gpu)来训练模型参数在亿级甚至十亿级规模的大模型。

3、然而,在使用多个芯片处理大规模数据时,如何平衡各芯片的功耗,使各芯片最小的代价最大化处理效率,是一个亟待解决的问题。


技术实现思路

1、本说明书实施例提供一种芯片控制方法、装置、系统、存储介质及电子设备,以部分解决上述现有技术存在的问题。

2、本说明书实施例采用下述技术方案:

3、本说明书提供的一种芯片控制方法,多个芯片通过第一总线与主机相连,用于接收并处理所述主机通过所述第一总线发送的待处理数据,所述多个芯片还通过第二总线相互连接;所述方法包括:

4、针对任一芯片,该芯片确定该芯片通过所述第二总线连接其他芯片的接口;

5、监控所述接口的数据传输状态,所述接口至少用于接收所述其他芯片通过第二总线发送的待处理数据,以及通过所述第二总线向所述其他芯片发送待处理数据;

6、根据监控的所述数据传输状态,控制该芯片的功耗状态。

7、可选地,所述芯片包括gpu;

8、所述第一总线包括pcie总线;

9、所述第二总线包括多卡互联总线。

10、可选地,所述芯片通过所述第一总线直接与所述主机相连;或者,所述芯片通过第一总线与pcie交换机相连,所述pcie交换机通过第一总线与所述主机相连。

11、可选地,所述接口为多个;

12、所述数据传输状态包括存在正在传输的数据的繁忙状态以及不存在正在传输的数据的空闲状态。

13、可选地,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

14、当监控到所有接口的数据传输状态均为空闲状态时,监控该芯片的负载;

15、根据监控到的负载,控制该芯片的功耗状态。

16、可选地,根据监控到的负载状态,控制该芯片的功耗状态,包括:

17、若所述负载低于第一预设阈值,则控制该芯片进入低功耗状态,并通过所述第一总线向所述主机发送第一通知消息,所述第一通知消息用于通知所述主机该芯片进入低功耗状态,以及通过所述第二总线向所述其他芯片发送第二通知消息,以使所述其他芯片中连接该芯片的接口进入低功耗状态。

18、可选地,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

19、当监控到同时存在繁忙状态和空闲状态的接口时,针对空闲状态的接口,控制该空闲状态的接口进入低功耗状态,并通过所述第二总线向所述其他芯片发送第二通知消息,以使所述其他芯片中与该空闲状态的接口相连的接口进入低功耗状态。

20、可选地,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

21、当监控到同时存在繁忙状态和空闲状态的接口时,针对繁忙状态的接口,通过所述第二总线查询连接该繁忙状态的接口的其他芯片的负载;

22、根据该芯片的负载以及查询到的其他芯片的负载,控制该芯片的功耗状态。

23、可选地,根据该芯片的负载以及查询到的其他芯片的负载,控制该芯片的功耗状态,包括:

24、若该芯片的负载与查询到的其他芯片的负载之和不大于第二预设阈值,且该芯片的负载小于查询到的其他芯片的负载,则通过所述第一总线向所述主机发送第三通知消息,所述第三通知消息用于通知所述主机优先向该芯片发送待处理数据;

25、若该芯片的负载与查询到的其他芯片的负载之和大于所述第二预设阈值,则根据该芯片的负载控制该芯片的功耗状态。

26、可选地,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

27、当监控到所有接口的数据传输状态均为繁忙状态时,通过所述第二总线查询所述其他芯片的负载;

28、将该芯片的负载以及查询到的所述其他芯片的负载通过第一总线上报所述主机,以使所述主机对各芯片进行负载均衡。

29、本说明书提供的一种芯片控制芯片,所述系统包括主机和多个芯片;

30、所述多个芯片通过第一总线与所述主机相连;

31、所述多个芯片还通过第二总线相互连接;

32、所述芯片用于接收并处理所述主机通过所述第一总线发送的待处理数据;所述芯片还用于确定所述芯片通过所述第二总线连接其他芯片的接口,监控所述接口的数据传输状态,根据监控的所述数据传输状态,控制所述芯片的功耗状态,所述接口至少用于接收所述其他芯片通过第二总线发送的待处理数据,以及通过所述第二总线向所述其他芯片发送待处理数据。

33、本说明书提供的一种芯片控制装置,多个芯片通过第一总线与主机相连,用于接收并处理所述主机通过所述第一总线发送的待处理数据,所述多个芯片还通过第二总线相互连接;所述装置应用于任一芯片中,所述装置包括:

34、接口确定模块,用于确定所述装置所在芯片通过所述第二总线连接其他芯片的接口;

35、监控模块,用于监控所述接口的数据传输状态,所述接口至少用于接收所述其他芯片通过第二总线发送的待处理数据,以及通过所述第二总线向所述其他芯片发送待处理数据;

36、控制模块,用于根据监控的所述数据传输状态,控制该芯片的功耗状态。

37、本说明书提供的一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的芯片控制方法。

38、本说明书提供的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述的芯片控制方法。

39、本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果:

40、本说明书实施例除将多个芯片通过第一总线与主机相连以外,还通过第二总线将该多个芯片互联,第二总线可实现各芯片之间跳过主机而直接传输待处理数据,因此,针对任一芯片,该芯片即可通过其自身通过第二总线连接其他芯片的接口的数据传输状态,控制自身的功耗状态,以实现各芯片以尽量小的功耗最大化处理效率。



技术特征:

1.一种芯片控制方法,其特征在于,多个芯片通过第一总线与主机相连,用于接收并处理所述主机通过所述第一总线发送的待处理数据,所述多个芯片还通过第二总线相互连接;所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述芯片包括gpu;

3.如权利要求2所述的方法,其特征在于,所述芯片通过所述第一总线直接与所述主机相连;或者,所述芯片通过第一总线与pcie交换机相连,所述pcie交换机通过第一总线与所述主机相连。

4.如权利要求1所述的方法,其特征在于,所述接口为多个;

5.如权利要求4所述的方法,其特征在于,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

6.如权利要求5所述的方法,其特征在于,根据监控到的负载状态,控制该芯片的功耗状态,包括:

7.如权利要求4所述的方法,其特征在于,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

8.如权利要求4所述的方法,其特征在于,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

9.如权利要求8所述的方法,其特征在于,根据该芯片的负载以及查询到的其他芯片的负载,控制该芯片的功耗状态,包括:

10.如权利要求4所述的方法,其特征在于,根据监控的所述数据传输状态,控制该芯片的功耗状态,包括:

11.一种芯片控制系统,其特征在于,所述系统包括主机和多个芯片;

12.一种芯片控制装置,其特征在于,多个芯片通过第一总线与主机相连,用于接收并处理所述主机通过所述第一总线发送的待处理数据,所述多个芯片还通过第二总线相互连接;所述装置应用于任一芯片中,所述装置包括:

13.一种计算机可读存储介质,其特征在于,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述权利要求1-10任一项所述的方法。

14.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现上述权利要求1-10任一项所述的方法。


技术总结
本说明书公开了一种芯片控制方法、装置、系统、存储介质及电子设备,本说明书实施例除将多个芯片通过第一总线与主机相连以外,还通过第二总线将该多个芯片互联,第二总线可实现各芯片之间跳过主机而直接传输待处理数据,因此,针对任一芯片,该芯片即可通过其自身通过第二总线连接其他芯片的接口的数据传输状态,控制自身的功耗状态,以实现各芯片以尽量小的功耗最大化处理效率。

技术研发人员:请求不公布姓名,请求不公布姓名,请求不公布姓名,请求不公布姓名
受保护的技术使用者:摩尔线程智能科技(北京)有限责任公司
技术研发日:
技术公布日:2024/3/31
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1