一种计算机系统架构的制作方法

文档序号:9396636阅读:331来源:国知局
一种计算机系统架构的制作方法
【技术领域】
[0001]本发明涉及计算机技术领域,更具体地说,涉及一种计算机系统架构。
【背景技术】
[0002]随着目前网络及数据量的爆发式增长,对于数据的高性能计算变得越来越重要。
[0003]由于目前的计算机系统架构中通用的处理器并不是专门为对数据的高性能计算设计的,用其来完成对数据的高性能计算存在运算效率低的问题,因此,通常采用处理器搭配GPU(Graphics Processing Unit,图形处理器)的方式来完成对于数据的高性能计算。但是,目前的计算机架构中的GPU之间无法直接进行数据传输,而是通过处理器将一个GPU的数据进行处理后传送至另一个GPU以完成两个GPU间的数据传输。由于GPU与处理器间的数据传输通常基于PCIE (Peripheral Component Interface Express,总线和接口标准)3.0x16链路,而其目前能提供的最大带宽仅仅为16GB/S,并且作为传输媒介的处理器存在运算效率低的问题,因此导致GPU间数据传输的效率较低。
[0004]综上所述,现有技术的计算机系统架构存在GPU间数据传输的效率较低的问题。

【发明内容】

[0005]本发明的目的是提供一种计算机系统架构,以解决现有技术的计算机系统架构中存在的GPU间数据传输的效率较低的问题。
[0006]为了实现上述目的,本发明提供如下技术方案:
[0007]—种计算机系统架构,包括信息处理模块、PCIE交换模块及GPU计算模块,所述GPU计算模块包括多个GPU,任意两个所述GPU间均通过NVLink链路进行数据通信;所述信息处理模块通过所述PCIE交换模块与所述GPU计算模块建立PCIE链路连接,所述信息处理模块与所述GPU计算模块间通过所述PICE链路进行数据通信。
[0008]优选的,所述PCIE交换模块与所述信息处理模块之间通过PCIE 3.0x8链路进行数据通信,所述PCIE交换模块与所述GPU计算模块之间通过PCIE 3.0x16链路进行数据通
?目O
[0009]优选的,所述GPU计算模块包括L个计算增强单元,所述GPU的数量为4L个,每个所述计算增强单元均包括4个所述GPU,所述PCIE交换模块包括L个PCIE交换单元,所述PCIE交换单元与所述计算增强单元--对应连接,L为正整数。
[0010]优选的,所述信息处理模块包括信息处理单元,所述信息处理单元具体为Χ86处理器或者ARM处理器。
[0011]优选的,所述信息处理单元的数量为两个。
[0012]优选的,所述信息处理模块还包括集中管理单元,所述集中管理单元用于在所述信息处理单元的控制下对所述计算机系统架构中的I/O通讯设备进行集中管理。
[0013]优选的,所述信息处理模块还包括信息采集单元,所述信息采集单元用于在所述集中管理单元的控制下对所述计算机系统架构的温度及电压进行实时监控。
[0014]优选的,所述集中管理单元与所述信息处理单元之间通过DMI总线连接,所述集中管理单元与所述信息采集单元之间通过PCIE 3.0xl链路连接。
[0015]优选的,所述计算机系统架构还包括SAS扩展模块,所述SAS扩展模块包括M个物理磁盘,M为正整数;
[0016]所述SAS扩展模块通过PCIE 3.0x8链路与所述信息处理模块连接,用于在所述信息处理模块的控制下完成数据的存储与读取。
[0017]优选的,所述信息处理模块还包括磁盘存储阵列,所述磁盘存储阵列包括N个物理磁盘,N为正整数;
[0018]所述磁盘存储阵列通过SAS信号与所述SAS扩展模块进行数据通信。
[0019]本发明提供的一种计算机系统架构,包括信息处理模块、PCIE交换模块及GPU计算模块,GPU计算模块包括多个GPU,任意两个GPU间均通过NVLink链路进行数据通信;信息处理模块通过PCIE交换模块与GPU计算模块建立PCIE链路连接,信息处理模块与GPU计算模块间通过PICE链路进行数据通信。与现有技术相比,首先,本申请实现了基于信息处理模块作为管理的冗余设计,提高了系统的冗余度;其次,实现了 GPU间的全互连,即任意两个GPU间均可直接进行数据通信,且其进行数据通信基于NVLink链路,NVLink链路是每个GPU具备的专有的高速互联通道,其能够提供的带宽能够达到20GB/S,比现有技术中GPU与处理器间进行数据通信基于的PCIE 3.0x16链路的带宽高出25%,因此,实现了基于点对点模式的数据高速传输,即有效提高了 GPU间数据传输的效率。
【附图说明】
[0020]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
[0021]图1为本发明实施例提供的一种计算机系统架构的结构示意图;
[0022]图2为本发明实施例提供的一种计算机系统架构中当L为2时的结构示意图;
[0023]图3为本发明实施例提供的一种计算机系统架构中当L为2时的模型图;
[0024]图4为本发明实施例提供的一种计算机系统架构中信息处理模块的架构示意图。
【具体实施方式】
[0025]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0026]请参阅图1,其示出了本发明实施例提供的一种计算机系统架构的结构示意图,该计算机系统架构可以包括信息处理模块1、PCIE交换模块2及GPU计算模块3,GPU计算模块3包括多个GPU,任意两个GPU间均通过NVLink链路进行数据通信;信息处理模块I通过PCIE交换模块2与GPU计算模块3建立PCIE链路连接,信息处理模块I与GPU计算模块3间通过PICE链路进行数据通信。
[0027]其中,GPU的数量可根据实际需要进行确定。
[0028]首先,本申请实现了基于信息处理模块作为管理的冗余设计,提高了系统的冗余度;其次,实现了 GPU间的全互连,即任意两个GPU间均可直接进行数据通信,且其进行数据通信基于NVLink链路,NVLink链路是每个GPU具备的专有的高速互联通道,其能够提供的带宽能够达到20GB/s,比现有技术中GPU与处理器间进行数据通信基于的PCIE 3.0x16链路的带宽高出25%,因此,实现了基于点对点模式的数据高速传输,即有效提高了 GPU间数据传输的效率。
[0029]其中,GPU计算模块中的GPU属于数据的高性能计算器件,其主要为系统提供高强度的浮点计算性能。信息处理模块是整个系统的信息处理核心,由其控制GPU计算模块中的GPU完成相关工作。而PCIE交换单元能够起到一个传输中介的作用,其能够使得信息处理模块与GPU计算模块之间通过PCIE交换模块进行间接连接,进而使得信息处理单元通过PCIE信息控制GPU计算模块完成相关工作。
[0030]需要说明的是,深度学习是机器学习研究中的一个新的领域,其动机在于建立和模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习就包括对于数据的高性能计算,如对一张图片进行特征提取需要170G次浮点计算,120万张图片进行一次网络训练,则需要318P的浮点运算,如果由一个CPU(CentraMProcessing Unit,中央处理器)完成上述计算量需要22天的时间,而如果由一个GPU来完成上述工作量大概仅需要18个小时的时间,因此本发明中采用GPU进行数据的高性能计算具有计算效率尚的优点。
[0031]优选的,本发明实施例提供的一种计算机系统架构中,PCIE交换模块与信息处理模块之间可以通过PCIE 3.0x8链路进行数据通信,PCIE交换模块与GPU计算模块之间可以通过PCIE 3.0x16链路进行数据通信。
[0032]需要说明的是,PCIE 3.0x8链路和PCIE 3.0x16链路均属于PCIE链路,而PCIE3.0x8链路比较符合PCIE交换模块与信息处理模块之间进行数据通信的特点,而PCIE3.0x16链路比较符合PCIE交换模块与GPU计算模块之间进行数据通信的特点,且,实验证明,采用上述链路进行相关模块间的通信,既节约了带宽资源,又能达到数据的正常通信。
[0033]优选的,上述实施例提供的一种计算机系统架构,GPU计算模块可以包括L个计算增强单元,GPU的数量可以为4L个,每个计算增强单元均可以包括4个GPU,PCIE交换模块可以包括L个PCIE交换单元,PCIE交换单元与计算增强单元--对应连接,L为正整数。
[0034]需要说明的是,L的具体数值可根据实际需要进行确定。当GPU的数量为4L时,为了在实际生产时合理分配各模块的排布,可设置成每4个GPU属于同一计算增强单元,由此,GPU计算模块则包括L个计算增强单元,每个计算增强单元均通过一个PCIE交换单元与信息处理模块连接。举例说明,当L为2时,本发明
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1