用于获取板卡互联结构的方法、计算设备及存储介质与流程

文档序号:37158166发布日期:2024-02-26 17:23阅读:15来源:国知局
用于获取板卡互联结构的方法、计算设备及存储介质与流程

本发明的实施例总体涉及数据通信领域,并且更具体地涉及用于获取板卡互联结构的方法、计算设备及存储介质。


背景技术:

1、随着在诸如计算机视觉、语音识别、自然语言处理等领域所采用的深度学习模型的复杂程度显著增加,单张板卡(例如,图形处理单元(gpu)板卡)难以满足针对模型的训练任务的需要,通常需要将多张板卡进行互联,以根据多张板卡之间有效的互联结构,实现多板卡并行运算以及板卡之间的数据传输交互,从而实现对模型的训练。然而,板卡之间有效的互联结构通常难以被获取。


技术实现思路

1、针对上述问题,本发明提供了一种用于获取板卡互联结构的方法、计算设备和存储介质,使得能够动态地获取板卡之间的互联结构,并对所获取的互联结构进行及时更新。

2、根据本发明的第一方面,提供了一种用于获取板卡互联结构的方法,其特征在于,包括:从多个板卡中选择任一板卡作为基准板卡;修改基准板卡的端口的链路参数;针对多个板卡中除基准板卡以外的其他板卡,遍历其他板卡的端口,以检测是否有其他板卡的端口的链路参数发生变化;基于关于是否有其他板卡的端口的链路参数发生变化的检测结果,确定基准板卡的端口的链路。

3、在一些实施例中,确定基准板卡的端口的链路包括:响应于检测到其他板卡的端口中的某一端口的链路参数发生变化,确定该链路参数发生变化的端口与基准板卡的端口之间存在互联关系。

4、在一些实施例中,链路参数包括:与链路宽度有关的参数、和与链路速度有关的参数。

5、在一些实施例中,用于获取板卡互联结构的方法还包括:对多个板卡中的所有板卡进行初始化,以使得每个板卡的端口的链路参数被设置为初始值。

6、在一些实施例中,修改基准板卡的端口的链路参数包括:将基准板卡的端口的链路参数从初始值修改为检测值,其中初始值与检测值不同。

7、在一些实施例中,用于获取板卡互联结构的方法还包括:响应于基准板卡的端口的链路已被确定,将基准板卡的端口的链路参数恢复至初始值。

8、在一些实施例中,用于获取板卡互联结构的方法还包括:响应于确定多个板卡中除基准板卡以外的其他板卡的某一端口与基准板卡的端口之间存在互联关系,将互联关系记录在映射表中,映射表反映多个板卡的互联结构。

9、在一些实施例中,用于获取板卡互联结构的方法还包括:针对映射表中记录的存在互联关系的两个端口,修改两个端口中的一个端口的链路参数;响应于两个端口中的另一端口的链路参数没有发生变化,确定两个端口之间的互联关系发生错误;以及将映射表中与两个端口的互联关系相关的记录删除。

10、在一些实施例中,确定基准板卡的端口的链路包括:响应于未检测到有端口的链路参数发生变化,确定基准板卡的端口与其他板卡的端口之间不存在互联关系。

11、根据本发明的第二方面,提供了一种计算设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本发明的第一方面的方法。

12、根据本发明的第三方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中计算机指令用于使计算机执行本发明的第一方面的方法。

13、应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。



技术特征:

1.一种用于获取板卡互联结构的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,确定所述基准板卡的端口的链路包括:

3.根据权利要求1所述的测试板,其特征在于,所述链路参数包括:与链路宽度有关的参数、和与链路速度有关的参数。

4.根据权利要求3所述的方法,其特征在于,还包括:

5.根据权利要求4所述的方法,其特征在于,修改所述基准板卡的端口的链路参数包括:

6.根据权利要求5所述的方法,其特征在于,还包括:

7.根据权利要求2所述的方法,其特征在于,还包括:

8.根据权利要求7所述的方法,其特征在于,还包括:

9.根据权利要求1所述的方法,其特征在于,确定所述基准板卡的端口的链路还包括:

10.一种计算设备,包括:

11.一种存储有计算机指令的非瞬时计算机可读存储介质,其中所述计算机指令用于使计算机执行权利要求1-9中任一项所述的方法。


技术总结
本发明的实施例涉及一种用于获取板卡互联结构的方法、计算设备和存储介质。该方法包括:从多个板卡中选择任一板卡作为基准板卡;修改基准板卡的端口的链路参数;针对多个板卡中除基准板卡以外的其他板卡,遍历其他板卡的端口,以检测是否有其他板卡的端口的链路参数发生变化;基于关于是否有其他板卡的端口的链路参数发生变化的检测结果,确定基准板卡的端口的链路。本发明能够动态地获取板卡之间的互联结构,并对所获取的互联结构进行及时更新。

技术研发人员:请求不公布姓名,请求不公布姓名
受保护的技术使用者:上海壁仞科技股份有限公司
技术研发日:
技术公布日:2024/2/25
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1