用于高性能、低功率数据中心互连结构的系统和方法

文档序号:9600796阅读:194来源:国知局
用于高性能、低功率数据中心互连结构的系统和方法
【专利说明】用于高性能、低功率数据中心互连结构的系统和方法 本申请是申请日为2010年10月19日、申请号为201080060153. 5、发明名称为"用于 高性能、低功率数据中心互连结构的系统和方法"的发明专利申请的分案申请。
[0001] 优先权要求/相关申请 本专利申请要求35use119(e)下的2009年10月30日提交的并且标题为"System andMethodforEnhancedCommunicationsinaMulti-ProcessorSystemofa Chip(S0C) "的美国临时专利申请系列号61/256, 723的优先权,通过引用将其合并于此。
技术领域
[0002] 本公开主要地涉及用于基于计算的系统的交换结构(switchingfabric)。
【背景技术】
[0003] 随着因特网、基于web的公司和系统的持续成长以及计算机的激增,如公知的那 样,存在在温度受控制的位置容纳多个服务器计算机并且可以外部管理的许多数据中心。
[0004] 图1A和1B示出了如目前众所周知的经典数据网络聚合。图1A示出了典型网络 数据中心架构100的图解视图,其中顶级交换机l〇la-n在机架102a-n的顶层,这些机架 102a-n由点缀有本地路由器103a-f的刀片服务器107a-n填充。附加存储路由器和核心 交换机105a-b以及附加机架单元108a-n包含附加服务器104e-k和路由器106a-g。图lb 示出了如下系统的示例性物理视图110,该系统具有布置于边缘路由器系统112a-h周围的 外围服务器llla-bn,这些边缘路由器系统112a-h放置于位于中央的核心交换系统113周 围。通常,这样的聚合110具有从机架服务器到它们的机架顶交换机的Ι-Gb以太网以及经 常具有通向边缘和核心路由器的l〇Gb以太网端口。
[0005] 然而需要的是一种着重于网络聚合的用于分组交换功能的系统和方法,该系统和 方法减少典型系统的大小和功率要求,而又同时减少成本,并且这一点正是本公开所涉及 的。
【附图说明】
[0006] 图1A和1B图示了典型数据中心系统; 图2是网络聚合系统的概况; 图3图示了机架系统中的示例性数据中心的概况; 图4图不了网络聚合系统的尚级拓扑; 图5A图示了网络聚合系统的示例性交换机的框图; 图5B图示了MAC地址编码; 图6图示了网络聚合系统的广播机制的第一实施例; 图7图示了网络聚合系统的单播路由的示例; 图8图示了网络聚合系统的防故障单播路由的示例;并且 图9图示了网络聚合系统的广播机制的第二实施例。
【具体实施方式】
[0007] 本公开特别可应用于如图所示和下文描述的网络聚合系统和方法,并且正是将在 这一背景中描述本公开。然而将理解该系统和方法具有更大效用,因为可以使用在本公开 的范围内的其他元件和架构来实施该系统和方法,并且本公开并不限于下文描述的示范实 施例。
[0008] 该系统和方法也支持如下路由,该路由使用树状或者图形拓扑,该树状或者图形 拓扑支持每节点多个链接,其中每个链接在拓扑内指定为向上、向下或者横向链接或者两 者。此外,如下文更具体描述的那样,系统中的每个节点可以是组合计算/交换机节点或 者仅为交换机节点,并且输入/输出(I/O)可以驻留于任何节点上。系统也可以提供具有 分段式以太网介质访问控制(MAC)架构的系统,该架构可以具有将MACIP地址多目的化 (re-purpose)用于内部MAC和外部MAC并且将通常是物理信令的内容用于MAC以向交换 机中馈送的方法。系统也可以提供一种非欺骗(non-spoofing)通信方法以及一种故障恢 复(fault-resilient)广播方法,该故障恢复广播方法可以具有一种用于故障恢复的单播 误路由方法。在网络安全的背景中,欺骗攻击是如下情形,在该情形中,一个人或者程序通 过伪造数据并且由此获得非法利益来成功地冒充为另一个人或者程序。
[0009] 系统也可以提供在管理处理器之间的严格安全性,使得管理处理器可以相互"信 任"。在(下文更详细描述的)图5A中所示的示例系统中,在每个SoC内有管理处理器(M3 微处理器,框906,图5A)。信任管理处理器上运行的软件,因为a)销售商(在这一情况下 为Smooth-Stone)已经开发和验证代码、b)不允许非销售商代码在处理器上运行。维持在 管理处理器之间的信任关系允许它们传送命令(例如重新引导另一节点)或者请求来自另 一节点的敏感信息而不担心用户可能欺骗请求并且获得对信息的访问或者系统的控制。
[0010] 系统也可以提供如下网络代理,该网络代理在片上系统(S0C)内的常通 (always-on)功率域中具有集成微控制器,该微控制器可以接管用于更大板上处理器的网 络代理并且可以应用于子树。系统也提供如下多域(multi-domaining)技术,该技术可以 明显扩展可路由粗树(fattree)状结构的大小而仅有对路由报头和路由表的不重要改变。
[0011] 图2图示了网络聚合系统300。网络聚合支持一个或者多个高速链接301 (粗 线)(诸如l〇-Gb/秒以太网通信),该链接301连接聚合路由器302和一个或者多个机架 303 (诸如如图3中所示的三个机架303a-c)。在第一机架303a中,网络聚合系统提供在机 架内的架子上的一个或者多个Smooth-Stone计算单元306a_d(诸如服务器计算机)之间 的由粗线表示的多个高速l〇Gb路径。在于2009年10月30日提交并且标题为"Systemand MethodforEnhancedCommunicationsinaMulti-ProcessorSystemofaChip(SOC)', 的美国临时专利申请系列号61/256, 723中更详细描述了每个Smooth-Stone计算单元的 更多细节,通过引用将该申请整体结合于此。Smooth-Stone计算单元中的嵌入式交换机 306a-d可以替换机架顶交换机,因此节省大量功率和成本而又仍然提供通向聚合路由器 302的10Gb以太网端口。网络聚合系统交换结构可以将传统以太网(1Gb或者10Gb)集成 到XAUI结构中,并且Smooth-Stone计算单元可以充当用于第三方以太网连接的服务器的 机架顶交换机。
[0012] 中间机架303b图示了网络聚合系统中的机架的另一配置,其中一个或者多个 Smooth-Stone计算单元306e、f可以集成到已经包含机架顶交换机308a的现有数据中心 机架中。在这一情况下,IT团体可以继续让它们的其他计算单元经由1Gb以太网直至现有 机架顶交换机连接,并且内部Smooth-Stone计算单元可以经由10GbXAUI结构来连接,并 且它们可以如图2中所示用1Gb或者10Gb以太网互连集成直至现有机架顶交换机。第三 机架303c图示了一种传统上部署数据中心机架的目前方式。第三机架303c中的细红线表 示1Gb以太网。因此,数据中心机架的目前部署在传统上是直至机架顶交换机308b的1Gb 以太网,并且然后是从机架顶交换机出来通向聚合路由器的l〇Gb(粗红线310)。注意所有 服务器以未知量存在,而出于清楚和简单的目的,这里以有限量描绘它们。另外,使用增强 型SS服务器,无需附加路由器,因为它们操作它们自己的XAUI交换结构,下文讨论。
[0013] 图3示出了根据本系统一个实施例的示例性"机架中的数据中心"400的概况。"机 架中的数据中心"400可以具有10-Gb以太网PHY401a-n和Ι-Gb私有以太网PHY402。大 型计算机(功率服务器)403a_n支持搜索;数据挖掘;编索引;ApacheHadoop(Java软件框 架);MapReduce(Google引入的软件框架,该软件框架用于支持计算机集群上的对大数据 集的分布式计算);云应用等。具有本地闪存和/或固态盘(SSD)的计算机(服务器)404a-n 支持搜索、MySQL、⑶N、软件即服务(SaaS)、云应用等。单个大型慢速风扇405扩增它上方的 竖直安装的服务器的对流冷却。数据中心400具有例如简单磁盘捆绑(JB0D)配置的硬盘 阵列406并且可选地具有盘外形规格的Smooth-Stone计算单元(例如阵列406和407中 的绿框),这些计算单元可选地充当盘控制器。硬盘服务器或者SS盘服务器可以用于web 服务器、用户应用和云应用等。也示出了存储服务器的阵列407和历史服务器408a、b(任 何大小、任何销售商),历史服务器408a、b具有用于旧式应用的标准以太网接口。
[0014] 机架400中的数据中心使用专用系统互连方式,该方式明显减少功率和接线并且 实现异构系统,从而将集成现有的基于以太网的服务器并且实现旧式应用。在一个方面中, 完整服务器或者存储服务器置于具有盘或者SSD外形规格中,具有带有4个ServerNode? 的8-16个SATA接口和带有4个ServerNode?的8个PCIex4接口。它使用如下专用板来 支持盘和/或SSD+ServerNode?,该专用板与(一个或多个)盘配对并且支持Web应用、用 户应用、云应用、盘高速缓存等。
[0015]Smooth-StoneXAUI系统互连减少机架的功率、接线和大小。无需个别服务器上的 高功率、昂贵以太网交换机和高功率以太网Phy。
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1