协作服务器的制造方法

文档序号:9602506阅读:382来源:国知局
协作服务器的制造方法
【专利说明】协作服务器发明领域
[0001]本发明涉及协作服务器,特别是涉及适合于音频和视频会议的协作服务器。
[0002]发明背景
[0003]近年来在智能电话、平板计算机和计算机中的改进导致当说到用于音频信息、视频信息或其它内容例如远程桌面协议分组的共享的会议呼叫时对灵活性的增加的要求。协作服务器以参与者可与彼此通信以共享音频、视频和/或其它信息的方式提供自由。
[0004]用于视频会议系统的群集节点服务器是已知的。然而,这样的系统从每瓦性能方面来说和也从每机架单元方面来说遭受差的性能。
[0005]多处理器(MP)服务器也是已知的。然而,这样的服务器是高速缓存一致的系统,且因此需要为高速缓存一致性设计的特殊中央处理单元(CPU)。这些特殊CPU是昂贵的,这意味着MP服务器本身也是昂贵的。MP服务器也遭受差的功率效率且运行起来也是昂贵的。
[0006]发明概述
[0007]本发明目的在于通过根据第一方面提供协作服务器来解决上面的问题,协作服务器包括:交换机结构;以及多个处理模块,每个处理模块包括CPU核心;其中多个处理模块经由交换机结构被互连。
[0008]协作服务器的交换机结构(也被称为“交换机”或“互连”)直接暴露于软件,使得多个隔离的存储空间存在。这与由CPU组成的MP服务器且在CPU之间有链接相反,这个链接的结构的操作对在只看到单个共享存储空间的MP服务器上运行的软件是透明的。协作服务器因此相对于MP服务器是有利的,因为没有对高速缓存一致性的需要。这意味着昂贵的特别设计的CPU是不需要的。
[0009]本发明的交换机结构提供网络拓扑,其中节点经由一个或多个交换机彼此连接。网络拓扑的多个物理链接/互连提供网络流量的交替路线,这是有利的,因为它提供在网络拥塞方面的减小。此外,灵活的互连使任务能够使用特殊算法被动态地分派。任务可在处理模块之间动态地移动以通过在交换机结构中将消耗前一任务的输出的任务放置得拓扑地尽可能接近来使模块负载和互连负载平衡。
[0010]现在将陈述本发明的可选特征。这些单独地或在与本发明的任何方面的任何组合中是可应用的。
[0011]优选地,交换机结构包括布置在顶交换机和三个叶交换机的树拓扑中的四个交换机,每个叶交换机直接连接到顶交换机并直接连接到其它叶交换机中的每个;其中多个处理模块包括三组处理模块:包括多个处理模块的第一组,每个处理模块直接连接到三个叶交换机中的第一个;包括多个处理模块的第二组,每个处理模块直接连接到三个叶交换机中的第二个;以及包括多个处理模块的第三组,每个处理模块被引导到三个叶交换机中的第三个。
[0012]优选地,交换机结构包括至少一个PCI Express (PCIe)交换机。交换机结构通过形成非透明PCIe桥来使处理模块互连。以这种方式,在桥的两侧处有智能设备或处理器,使得桥的两侧都具有独立的地址域。
[0013]在一个实施方式中,交换机结构可以是单个PCIe交换机。
[0014]在另一实施方式中,交换机结构包括布置在顶PCIe交换机和三个叶PCIe交换机的树拓扑中的四个PCIe交换机,每个叶PCIe交换机直接连接到顶PCIe交换机并直接连接到其它叶PCIe交换机中的每个;其中多个处理模块包括三组处理模块:包括多个处理模块的第一组,每个处理模块直接连接到三个叶PCIe交换机中的第一个;包括多个处理模块的第二组,每个处理模块直接连接到三个叶PCIe交换机中的第二个;以及包括多个处理模块的第三组,每个处理模块被引导到三个叶PCIe交换机中的第三个。
[0015]优选地,在顶PCI Express (PCIe)交换机和叶PCI Express (PCIe)交换机之间的每个连接具有8通道(lane)的宽度。优选地,在两个叶PCI Express (PCIe)交换机之间的每个连接具有4通道的宽度。
[0016]优选地,协作服务器配置成使得PCIe交换机能够进行PCIe多播以使源能够在单次传输中定址到多个目的地。
[0017]单次传输可以是编程输入/输出(ΡΙ0)写或可以是DMA事务。
[0018]可选地,交换机结构配置成经由编程输入输出(ΡΙ0)传输数据。
[0019]可选地,交换机结构配置成经由直接存储器存取(DMA)传输数据。在数据使用DMA被传输的场合,DMA优选地使用嵌在交换机中或在处理模块中的引擎。
[0020]优选地,至少一个处理模块包括GPU核心和MPU核心中的至少一个。
[0021 ] 优选地,每个处理模块包括GPU核心和MPU核心中的至少一个。
[0022]甚至更优选地,每个处理模块包括GPU核心和MPU核心。
[0023]在处理模块中的一个或多个GPU或MPU核心的存在意味着任务可以在CPU或GPU/MPU上执行。这使任务除了分配到不同的处理模块以外还能够动态地分配到不同类型的处理单元。某些任务可以在CPU或GPU/MPU上执行。这对最低功率和最大密度实现资源的平衡。以这种方式,每瓦性能和性能密度被提高到一个程度,使得由服务器占据的空间明显小于竞争的预先存在的产品。协作服务器可安置在2U尺寸的壳体(即具有19英寸的宽度和3.5英寸的高度的壳体)中。
[0024]从可在各种类型的处理单元上执行的任务的类型方面来说,服务器可配置成使得一个或多个处理单元的CPU能够执行下列任务中的一个或多个:视频编码、视频解码、视频比例调整、视频增强、音频编码、音频解码、音频混合、文档渲染、远程桌面渲染、UI(用户界面)渲染和覆盖、网络分组化和协议封装。
[0025]此外,服务器也可配置成使得一个或多个处理单元的GPU能够执行下列任务中的一个或多个:视频比例调整、视频增强、远程桌面渲染、UI渲染和覆盖。
[0026]此外,服务器可配置成使得一个或多个处理单元的MPU能够执行下列任务中的一个或多个:视频编码和解码。
[0027]上面的GPU和MPU任务是CPU任务的子集。任务被动态地分配到CPU、GPU或MPU,使得它们在最低功率下执行最大性能的单元中被执行,该单元通常是GPU或MPU。它们(通常)也可在另一单元CPU上被执行,以便使在单元之间的总负载平衡。这个方法最大化每瓦性能和在系统中同时执行的任务的数量以实现最大密度。
[0028]优选地,每个处理模块还包括3个额外的CPU核心。以这种方式,每处理模块有4个CPU核心。
[0029]优选地,多个处理模块之一是主模块,主模块连接到参与者端口,使得在使用中,所有参与者经由主模块访问服务器。
[0030]优选地,服务器的系统体系结构在两个盒子上被共享。以这种方式,在两个盒子上的硬件的共享使大量处理模块能够被互连。
[0031]根据本发明的第二方面,提供了协作服务器,其包括:交换机结构;以及多个处理模块,每个处理模块包括CPU核心以及GPU核心和MPU核心中的至少一个;其中多个处理模块经由交换机结构被互连。
[0032]优选地,每个处理模块包括GPU核心和MPU核心中的至少一个。
[0033]甚至更优选地,每个处理模块包括GPU核心和MPU核心。
[0034]根据本发明的第三方面,提供了协作服务器,其包括:交换机结构;以及多个处理模块,每个处理模块包括CPU核心;其中多个处理模块经由交换机结构被互连;以及交换机结构包括布置在顶交换机和三个叶交换机的树拓扑中的四个交换机,每个叶交换机直接连接到顶交换机并直接连接到其它叶交换机中的每个;以及其中多个处理模块包括三组处理模块:包括多个处理模块的第一组,每个处理模块直接连接到三个叶交换机中的第一个;包括多个处理模块的第二组,每个处理模块直接连接到三个叶交换机中的第二个;以及包括多个处理模块的第三组,每个处理模块被引导到三个叶交换机中的第三个。
[0035]下面陈述本发明的另外的可选特征。
[0036]附图的简要说明
[0037]现在作为例子参考附图描述本发明的实施方式,其中:
[0038]图1示出本发明的协作服务器的硬件体系结构的方框图。
[0039]图2是由协作服务器执行的任务的管线的例子。
[0040]本发明的详细描述和另外的可选特征
[0041]参考图1,协作服务器1包括多个处理模块10、11、12、13,每个处理模块包括中央处理单元(CPU)核心。服务器1还包括交换机结构,处理模块10、11、12、13通过交换机结构被互连。在图1所示的实施方式中,交换机结构采取布置在具有顶PCIe交换机20和单个叶PCIe交换机21、22、23的树拓扑中的四个外围部件互连Express (PCIe)交换机20、21、22、23的形式。每个叶PCIe交换机直接连接到顶PCIe交换机,且也直接连接到每个其它叶PCIe交换机。
[0042]多个处理模块10、11、12、13由三组处理模块构成。第一组处理模块包括多个处理模块10、11,每个处
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1