一种GPU服务器的制作方法

文档序号:18121329发布日期:2019-07-10 09:39阅读:302来源:国知局
一种GPU服务器的制作方法

本发明涉及服务器技术领域,具体为一种gpu服务器。



背景技术:

目前,图形处理器(graphicsprocessingunit,gpu)具有强大的并行计算能力,可以作为协处理器,提高服务器系统的运算性能。使得其广泛应用于高性能计算、深度学习等领域。通常来说,不同的gpu拓扑有各自的优点和缺点,不同的特点决定了它们不同的应用场景。如何在有限的服务器空间内实现不同拓扑的转换,是gpu服务器设计者首先要考虑的问题。

由于服务器空间有限,加之gpu服务器对供电、散热要求较高,一般很难兼顾架构多变性和服务器稳定性。所以业界很多gpu服务器都是通过固定gpu拓扑来节省空间,换来服务器的稳定性。但是,gpu互访时要经过upi(ultrapathinterconnect),速度会受到影响。



技术实现要素:

为了克服上述所指出的现有技术的缺陷,本发明人对此进行了深入研究,在付出了大量创造性劳动后,从而完成了本发明。

具体而言,本发明所要解决的技术问题是:提供一种gpu服务器,旨在解决现有技术中gpu服务器都是通过固定gpu拓扑来节省空间,换来服务器的稳定性,但gpu互访时要经过upi,速度会受到影响的技术问题。

为解决上述技术问题,本发明的技术方案是:

一种gpu服务器,包括设置在下部空间内的主板和设置在上部空间内的gpu板、pcie切换器和pcie插槽;

所述主板上设有第一cpu和第二cpu,所述第一cpu和第二cpu之间通过upi通讯连接,所述下部1u空间内设有第一pcie连接器、第二pcie连接器、第三pcie连接器和第四pcie连接器,其中,所述第一pcie连接器和第二pcie连接器均与所述第一cpu连接,所述第三pcie连接器和第四pcie连接器均与所述第二中央处理器连接;

所述gpu板包括第一gpu、第二gpu、第三gpu、第四gpu、第五gpu、第六gpu、第七gpu以及第八gpu,所述pcie插槽包括第一pcie插槽、第二pcie插槽、第三pcie插槽以及第四pcie插槽,pcie切换器包括第一pcie切换器和第二pcie切换器,所述上部3u空间内设有第五pcie连接器、第六pcie连接器、第七pcie连接器、第八pcie连接器、第九pcie连接器、第十pcie连接器、第十一pcie连接器以及第十二pcie连接器,其中,所述第一pcie切换器分别与所述第一gpu、第二gpu、第三gpu、第四gpu、第五pcie连接器、第六pcie连接器连接,所述第二pcie切换器分别与所述第五gpu、第六gpu、第七gpu、第八gpu、第十一pcie连接器以及第十二pcie连接器连接,所述第七pcie连接器与所述第一pcie插槽连接,所述第八pcie连接器与所述第二pcie插槽连接,所述第九pcie连接器与所述第三pcie插槽连接,所述第十pcie连接器与所述第四pcie插槽连接;

所述下部空间内的pcie连接器与上部空间内的pcie连接器通过线缆互联。

作为一种改进的方案,所述主板设置在所述下部空间的散热风道内;

所述gpu板设置在所述上部空间的散热风道内。

作为一种改进的方案,所述下部空间内的各个pcie连接器均设置在板卡边缘;

所述上部空间内的各个pcie连接器均设置在板卡边缘。

作为一种改进的方案,所述主板、第一pcie连接器、第二pcie连接器、第三pcie连接器以及第四pcie连接器均设置在下部1u空间内;

所述gpu板、pcie切换器、pcie插槽、第五pcie连接器、第六pcie连接器、第七pcie连接器、第八pcie连接器、第九pcie连接器、第十pcie连接器、第十一pcie连接器以及第十二pcie连接器均设置在上部3u空间内。

作为一种改进的方案,所述第一pcie连接与所述第五pcie连接器连接,所述第六pcie连接器与所述第七pcie连接器连接,所述第二pcie连接器与所述第八pcie连接连接,所述第三pcie连接器与所述第九pcie连接器连接,所述第十pcie连接器与所述第十一pcie连接器连接,所述第四pcie连接器与所述第十二pcie连接器连接。

作为一种改进的方案,所述第一pcie连接与所述第五pcie连接器连接,所述第六pcie连接器与所述第七pcie连接器连接,所述第三pcie连接器与所述第八pcie连接器连接,所述第四pcie连接器与所述第九pcie连接器连接,所述第十pcie连接器与所述第十一pcie连接器连接,所述第二pcie连接器与所述第十二pcie连接器连接。

作为一种改进的方案,所述第一pcie连接与所述第五pcie连接器连接,所述第二pcie连接器与所述第七pcie连接器连接,所述第三pcie连接与所述第八pcie连接器连接,所述第四pcie连接器与所述第九pcie连接器连接,所述第十pcie连接器与所述第十一pcie连接器连接,所述第六pcie连接器与所述第十二pcie连接器连接。

在本发明实施例中,gpu服务器包括设置在下部空间内的主板和设置在上部空间内的gpu板、pcie切换器和pcie插槽,主板与gpu板之间的通讯通过设置板卡边缘的pcie连接器以及对应的线缆实现,从而实现不同gpu拓扑之间的自由切换,形成一种弹性的服务器构架。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

图1是本发明实施例一提供的gpu服务器的结构示意图;

图2是本发明实施例二提供的gpu服务器的结构示意图;

图3是本发明实施例三提供的gpu服务器的结构示意图;

其中,1-第一cpu,2-第二cpu,3-第一pcie连接器,4-第二pcie连接器,5-第三pcie连接器,6-第四pcie连接器,7-第一gpu,8-第二gpu,9-第三gpu,10-第四gpu,11-第五gpu,12-第六gpu,13-第七gpu,14-第八gpu,15-第一pcie插槽,16-第二pcie插槽,17-第三pcie插槽,18-第四pcie插槽,19-第一pcie切换器,20-第二pcie切换器,21-第五pcie连接器,22-第六pcie连接器,23-第七pcie连接器,24-第八pcie连接器,25-第九pcie连接器,26-第十pcie连接器,27-第十一pcie连接器,28-第十二pcie连接器。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的、技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。

图1至图3分别示出了本发明实施例提供的gpu服务器的结构示意图,为了便于说明,图中仅给出了与本发明实施例相关的部分。

gpu服务器包括设置在下部空间内的主板和设置在上部空间内的gpu板、pcie切换器和pcie插槽;

所述主板上设有第一cpu1和第二cpu2,所述第一cpu1和第二cpu2之间通过upi通讯连接,所述下部1u空间内设有第一pcie连接器3、第二pcie连接器4、第三pcie连接器5和第四pcie连接器6,其中,所述第一pcie连接器3和第二pcie连接器4均与所述第一cpu1连接,所述第三pcie连接器5和第四pcie连接器6均与所述第二cpu2连接;

所述gpu板包括第一gpu7、第二gpu8、第三gpu9、第四gpu10、第五gpu11、第六gpu12、第七gpu13以及第八gpu14,所述pcie插槽包括第一pcie插槽15、第二pcie插槽16、第三pcie插槽17以及第四pcie插槽18,pcie切换器包括第一pcie切换器19和第二pcie切换器20,所述上部3u空间内设有第五pcie连接器21、第六pcie连接器22、第七pcie连接器23、第八pcie连接器24、第九pcie连接器25、第十pcie连接器26、第十一pcie连接器27以及第十二pcie连接器28,其中,所述第一pcie切换器19分别与所述第一gpu7、第二gpu8、第三gpu9、第四gpu10、第五pcie连接器21、第六pcie连接器22连接,所述第二pcie切换器20分别与所述第五gpu11、第六gpu12、第七gpu13、第八gpu14、第十一pcie连接器27以及第十二pcie连接器28连接,所述第七pcie连接器23与所述第一pcie插槽连接,所述第八pcie连接器24与所述第二pcie插槽16连接,所述第九pcie连接器25与所述第三pcie插槽连接,所述第十pcie连接器26与所述第四pcie插槽18连接;

所述下部空间内的pcie连接器与上部空间内的pcie连接器通过线缆互联。

在该实施例中,该第一pcie插槽15、第二pcie插槽16、第三pcie插槽17以及第四pcie插槽18用于插外部设备。

在本发明实施例中,主板设置在所述下部空间的散热风道内;

所述gpu板设置在所述上部空间的散热风道内;

从而提高gpu服务器的散热效果,提高gpu服务器的系统稳定性。

在本发明实施例中,所述下部空间内的各个pcie连接器均设置在板卡边缘;

所述上部空间内的各个pcie连接器均设置在板卡边缘;

该各个pcie连接器均为高速pcie连接器,且设置在板卡边缘位置,便于操作人员现场插拔,为操作人员提供便利。

在本发明实施例中,该gpu服务器为4u结构的服务器,对于其他类型的服务器,其设计构架相似;

其中,主板、第一pcie连接器3、第二pcie连接器4、第三pcie连接器5以及第四pcie连接器6均设置在下部1u空间内;

所述gpu板、pcie切换器、pcie插槽、第五pcie连接器21、第六pcie连接器22、第七pcie连接器23、第八pcie连接器24、第九pcie连接器25、第十pcie连接器26、第十一pcie连接器27以及第十二pcie连接器28均设置在上部3u空间内。

在本发明实施例中,如图1所示,所述第一pcie连接与所述第五pcie连接器21连接,所述第六pcie连接器22与所述第七pcie连接器23连接,所述第二pcie连接器4与所述第八pcie连接连接,所述第三pcie连接器5与所述第九pcie连接器25连接,所述第十pcie连接器26与所述第十一pcie连接器27连接,所述第四pcie连接器6与所述第十二pcie连接器28连接;

在该gpu拓扑结构中,第一pcie切换器19挂在第一cpu1上,第二pcie切换器20挂在第二cpu2上,其可充分利用cpu资源,这种拓扑结构应用于gpu云场景。

如图2所示,所述第一pcie连接与所述第五pcie连接器21连接,所述第六pcie连接器22与所述第七pcie连接器23连接,所述第三pcie连接器5与所述第八pcie连接器24连接,所述第四pcie连接器与所述第九pcie连接器25连接,所述第十pcie连接器26与所述第十一pcie连接器27连接,所述第二pcie连接器4与所述第十二pcie连接器连接。

在该拓扑结构中,第一pcie切换器19和第二pcie切换器20均挂在第一cpu1下,两边的gpu互访时不需要通过upi,提升了访问速度,这种拓扑的典型应用场景是深度学习和训练。

如图3所示,第一pcie连接与所述第五pcie连接器21连接,所述第二pcie连接器4与所述第七pcie连接器23连接,所述第三pcie连接与所述第八pcie连接器24连接,所述第四pcie连接器6与所述第九pcie连接器25连接,所述第十pcie连接器26与所述第十一pcie连接器27连接,所述第六pcie连接器22与所述第十二pcie连接器28连接;

该拓扑结构进一步简化的gpu的互访路径,两边的gpu互访只需通过两级pcie切换器,不需要经过cpu,这种拓扑在某些特殊的深度学习场景下应用。

在本发明实施例中,在4u的服务器系统里,主板位于下部1u空间,gpu板位于上部3u空间,pcie连接器均位于板卡边缘的位置,不同拓扑的切换仅通过变换两块板卡之间的线缆互联即可实现。cpu板和gpu板分别位于下/上两个散热风道,提高了系统的稳定性。

以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1