集群工作站及实现该集群工作站的方法

文档序号:7813641阅读:545来源:国知局
专利名称:集群工作站及实现该集群工作站的方法
技术领域
本发明涉及一种集群工作站以及实现该集群工作站的方法。
背景技术
工作站是一种集图形图像,数据运算,结果交付的处理机,工作站的性能一直是高性能计算以及大规模计算的瓶颈,尤其是当有大批量图形图像处理任务时,工作站的性能则是影响任务处理效果的关键因素。CPU(中央处理器)+GPU(图形处理器)的图形图像处理架构现在已经逐渐的蔓延开来,用GPU的资源专门处理图形以及辅助计算,可以弥补CPU 单一处理速度的瓶颈。GPU辅助计算将CPU从多个任务的中分离开来,使CPU和GPU各司其职,进而提高性能。目前,在集成有PCIE (PCI-Express)接口的主机节点上插入相应的GPU或者显卡, 就可以提供高速的图形图像功能。目前方案中具有的是单节点(即单一主板,单一工作站)的性能,没有相应的工作站冗余;同时工作站扩展性不强,增加节点需要通过以太网进行连接,但是现在以太网的速率还是大多数大规模高性能图形运算的瓶颈,至多可以满足某些小规模的运算。扩展性不强,没有相应的冗余,节点连接的性能受限。

发明内容
针对相关技术中存在的一个或多个问题,本发明的目的在于提供一种集群工作站,以解决上述问题中的至少之一。为实现上述目的,根据本发明的一个方面,提供了一种集群工作站,所述工作站包括多个主板,每个所述主板均包括设置在主板上的IB网卡;IB子卡,其可拆卸地与所述主板连接;中板,所述多个主板的IB网卡通过所述IB子卡与所述中板连接;以及IB交换模块,所述IB交换模块与所述中板连接。优选地,所述IB交换模块包括与所述中板/电源连接的第一接口。优选地,所述IB交换模块包括与所述第一接口电连接的交换芯片,所述交换芯片上设置有多个端口,所述多个主板中的每一个均连接到一个所述端口,以提供所述多个主板之间的信息的交换。优选地,所述工作站还包括图形处理器,其通过所述主板的IO接口与所述主板连接。优选地,所述IB交换模块还包括与具有IB端口的设备电连接的第二接口。根据本发明的另一方面,提供一种实现集群工作站的方法,所述方法包括通过 IB子卡将多个主板中的IB网卡连接至中板;以及将所述中板连接至IB交换模块。优选地,所述IB交换模块包括与所述中板/电源连接的第一接口。优选地,所述IB交换模块包括与所述第一接口电连接的交换芯片,所述交换芯片上设置有多个端口,所述多个主板中的每一个均连接到一个所述端口,以提供所述多个主板之间的信息的交换。优选地,所述方法还包括将图形处理器连接至所述主板的IO接口。优选地,将具有IB端口的设备连接到所述IB交换模块的第二接口。根据本发明的集群工作站将各个单工作站节点进行资源整合,形成一个整体统一的工作站,对用户提供数据通信,图像处理的服务。通过集群内部各个节点之间的高速互联通道,可以实现不同节点GPU、显卡之间的数据互通,集运算、图形图像处理、信息交互于一整体,并且,其运行高效稳定,管理统一方便,是普通工作站无法比拟的。


本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中图1为根据本发明的实施例的IB交换模块的立体图;图2为根据本发明的实施例的IB交换模块的电路板的平面图;图3为根据本发明的实施例的实现集群工作站方法的逻辑关系图;图4为根据本发明的实施例的实现集群工作站方法的流程图;以及图5示出根据本发明实施例的连接有扩展模块的实现集群工作站方法的逻辑关系图。
具体实施例方式考虑到相关技术中存在的问题,本发明提供一种集群工作站和实现该集群工作站的方法。下面详细描述本发明的实施例,所述实施例的示例在附图中示出。应理解,下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。根据本发明,在每个节点(例如,刀片主板)都连接GPU或者显卡的时候,其之间的互联是通过中板实现的,节点的IO接口与IB交换模块的接口连接实现节点和模块之间的互联,各个节点之间的连接是通过中板的物理连接实现的,物理连接主要有两套网络,以太网和IB网,节点与GPU模块之间的连接速率没有瓶颈,各个节点之间的连接带宽才是GPU 数据在各节点之间传输的限制因素。为了实现工作站之间的高速互联,根据本发明,提供一种IB交换模块。IB(InfiniBand)网为高速互联网络,用于大规模计算数据传输和高性能计算,目前支持20(ib/S的DDR速率,各个工作站之间的互联不是通过GPU或显卡自身,而是通过节点间的IB网,将各个GPU或者显卡连接起来,作为一个整体给外界用户提供高效的数据计算和传输以及图形服务。图1和图2为根据本发明的IB交换模块的立体图及其电路板7的平面图。如图 1所示,该IB交换模块1的上下左右是封口的,前面是该交换模块的接口,后面是该交换模块的主板与刀片机箱的中板接口。如图2所示,其示出了与中板连接同时也为该交换模块的供电的第一接口 3、5,还示出了用于提供端口之间信息的高速交换的交换芯片7,第一接口 3、5和交换芯片7均设置在电路板11上。通常,每个刀片主板都有一个IB网卡,这些网卡是相互独立的,彼此之间的连接都需要先连接到机箱的中板上,然后中板与IB交换模块相连,从而实现节点之间通过IB交换模块的互联。具体地说,各个刀片主板的IB网卡通过IB子卡连接到中板上,其中,该IB 子卡可拆卸地与刀片主板连接,通过该IB子卡来连接IB网卡和中板,实现接口转换工程, 即将IB网卡接口转换成与中板相配合的标准接口。然后,通过中板的接口与IB交换模块的第一接口 3、5连接,由于第一接口 3、5与交换芯片7电连接,从而使得与该IB交换模块1 连接的中板所连接的刀片服务器之间互相通信。具体地说,交换芯片7上设置有多个端口, 每一个刀片主板均连接至一个端口,通过这些端口提供刀片主板之间的信息的交换。图3示出了根据本发明的一个实施例的逻辑关系图。如图3所示,该图中示出了 8个刀片服务器2,当然,根据需要,可以设置更多或更少的刀片2。这些刀片2均连接到中板4上,然后,中板4通过其与IB交换模块的接口 6连接至IB交换模块1上。根据需要,如图2所示,该IB交换模块1还可以包括与外界进行连接通信的第二接口 9,该接口可以设置多个,例如,20个。通过这些第二接口 9,外界(例如,具有IB端口的设备,如IB交换机)可以与刀片服务器连接通信。图4示出了根据本发明的实施例的实现集群工作站的方法的流程图。如上所述, 为了得到高速互联的集群工作站,IB网连接的具体实现方法包括通过可拆卸地连接到刀片主板的IB子卡将多个刀片主板中的IB网卡连接到中板(步骤Si)。将连接有多个刀片主板的中板连接至上述的IB交换模块(步骤S2),通过该交换模块的交换芯片使多个刀片之间互相通信。通过将GPU或显卡连接至刀片主板的IO接口(步骤S3),从而将各个GPU或显卡连接起来,作为一个整体给外界用户提供高效的数据计算和传输以及图形服务。如图5 所示,各个刀片主板的IB网卡通过IB子卡连接到中板上,然后中板4与交换模块1相连, 这样就实现了主板的互联。扩展模块,如GPU或显卡等通过主板IO接口连接到主板上,主板上的操作系统将数据分发给各个IB网卡端口,然后IB网卡通过IB子卡连接到中板上, 中板连接到交换模块上,实现了数据的连接与共享。当需要与外界连接通信时,将IB交换模块连接至外界,例如,具有IB端口的设备, 如IB交换机等,从而提供一种扩展功能。集群中的每个节点都可以通过上述方法实现单节点工作站需求,将这些节点互联起来,可以实现工作站集群,通过上述方法,可以实现每个节点之间的数据通信与同步。根据本发明的集群工作站将各个单工作站节点进行资源整合,形成一个整体统一的工作站,对用户提供数据通信,图像处理的服务。通过集群内部各个节点之间的高速互联通道,可以实现不同节点GPU、显卡之间的数据互通,集运算、图形图像处理、信息交互于一整体,并且,其运行高效稳定,管理统一方便,是普通工作站无法比拟的。各个GPU或者显卡之间的互联不是通过高速IB网络,而是通过以太网,虽然也可提供服务,但是服务的质量在低速和小数据传输还可以,对于高速和大数据传输来说,还需要进一步提高以太网的速率才能满足。尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同限定。
权利要求
1.一种集群工作站,其特征在于,所述工作站包括 多个主板,每个所述主板均包括设置在主板上的IB网卡; IB子卡,其可拆卸地与所述主板连接;中板,所述多个主板的IB网卡通过所述IB子卡与所述中板连接;以及 IB交换模块,所述IB交换模块与所述中板连接。
2.根据权利要求1所述的集群工作站,其特征在于,所述IB交换模块包括与所述中板 /电源连接的第一接口。
3.根据权利要求2所述的集群工作站,其特征在于,所述IB交换模块包括与所述第一接口电连接的交换芯片,所述交换芯片上设置有多个端口,所述多个主板中的每一个均连接到一个所述端口,以提供所述多个主板之间的信息的交换。
4.根据权利要求1-3中任一项所述的集群工作站,其特征在于,所述工作站还包括图形处理器,其通过所述主板的IO接口与所述主板连接。
5.根据权利要求4所述的集群工作站,其特征在于,所述IB交换模块还包括与具有IB 端口的设备电连接的第二接口。
6.一种实现集群工作站的方法,其特征在于,所述方法包括 通过IB子卡将多个主板中的IB网卡连接至中板;以及将所述中板连接至IB交换模块。
7.根据权利要求6所述的方法,其特征在于,所述IB交换模块包括与所述中板/电源连接的第一接口。
8.根据权利要求7所述的方法,其特征在于,所述IB交换模块包括与所述第一接口电连接的交换芯片,所述交换芯片上设置有多个端口,所述多个主板中的每一个均连接到一个所述端口,以提供所述多个主板之间的信息的交换。
9.根据权利要求6-8任一项所述的方法,其特征在于,所述方法还包括将图形处理器连接至所述主板的IO接口。
10.根据权利要求9所述的方法,其特征在于,所述IB交换模块具有第二接口,将具有 IB端口的设备连接到所述IB交换模块的第二接口。
全文摘要
本发明公开一种集群工作站,该工作站包括多个主板,每个所述主板均包括设置在主板上的IB网卡;IB子卡,其可拆卸地与所述主板连接;中板,所述多个主板的IB网卡通过所述IB子卡与所述中板连接;以及IB交换模块,所述IB交换模块与所述中板连接。本发明还公开一种实现集群工作站的方法,该方法包括通过IB子卡将多个主板中的IB网卡连接至中板;以及将所述中板连接至IB交换模块。根据本发明的集群工作站将各个单工作站节点进行资源整合,形成一个整体统一的工作站,对用户提供数据通信,图像处理的服务。通过集群内部各个节点之间的高速互联通道,可以实现不同节点GPU、显卡之间的数据互通,集运算、图形图像处理、信息交互于一整体。
文档编号H04L12/56GK102542524SQ20111045918
公开日2012年7月4日 申请日期2011年12月31日 优先权日2011年12月31日
发明者戴荣, 李程, 许涛, 马少杰 申请人:曙光信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1