具对称式多处理器性能的刀锋式丛集系统之时序分配架构的制作方法

文档序号:6608548阅读:171来源:国知局
专利名称:具对称式多处理器性能的刀锋式丛集系统之时序分配架构的制作方法
技术领域
本发明是一种关于计算机系统中的时序分配架构,特别是在具对称式多处 理器性能的刀锋式丛集系统之备用的时序分配架构。
背景技术
就目前而言,对称式多处理器系统(SMP system)与刀锋式丛集系统(blade clustering system)的实质差异仍然是很难被打破的。这两个系统都是针对某 些目的与在某种配置下运作而设计。要将两个型式的系统结合为一,时序分配 将是主要的问题之一。一般而言,可靠而高阶的对称式多处理器系统具有一备用的时序分配系统, 而典型的刀锋式系统在每一刀锋上具有专用的区域时序产生及分配系统。图1为常规技术中具有时序分配之高阶对称式多处理器系统的例子。具有 若干个计算模块120、 130、 140…的系统包含第一中央时序器111及第二中央时 序器112为两个相同的时序来源,其交换时序边缘校正信息(clock edge alignment information)以维持同一的时序边缘校正。两个或多个的计算模块 (compute module) 120、 130、 140…以系统总线(system bus)彼此连接,而 致能一个或多个对称式多处理器领域,计算模块120、 130、 140的每一个接收 由第一中央时序器111与第二中央时序器112产生并分配之时序讯号的两个复 制讯号。多任务器121/131/141用于切换此二个中央时序,如果第一中央时序 或第二中央时序其中之一失灵,则必须使用另一个。因此一个典型的对称式多 处理器系统通常需要同步(synchronized)或时序边缘校正以使得整个系统运 作。此外,区域时序器122/132/142可能只是用于测试。因为区域时序器 122/132/142并没有经过同步或时序边缘校正,在正常运作下,区域时序器 122/132/142 —般是失能(disabled)或暂停(suspended)。因此,区域时序器 不论在基板的空间上或是运作中的对称式多处理器系统的性能上都是一种浪 费。图2为常规技术中刀锋式丛集系统150的典型实施例,由于每一个刀锋151、 152、 153…皆是一运作不同操作系统的独立计算机,因此不需要经过同步或时 序边缘校正,倘若任一刀锋151、 152、 153…的区域时序器失灵,其它刀锋仍将 持续运作。只要一个丛集管理系统(clustering management system)可以处 理任务的安排/派遣,刀锋系统仍可利用于新的任务。因此,常规技术之大多数 刀锋系统并不具有备用时序器(redundant clock(s))。但另一方面,也意味着 常规的刀锋系统在刀锋中并不具备对称式多处理器的性能,因为其缺少同步或
时序边缘校正。为实现弹性的系统配置,使刀锋系统具有对称式多处理器的性能,首先必 需将时序产生与分配的架构重新安排。发明内容因此,本发明提供备用时序分配架构使刀锋式丛集系统具有对称式多处理 器的性能。本发明使用一中央时序器与若干备用区域时序器,而提供刀锋式丛 集系统大型的对称式多处理器性能。在本发明的实施例,具有对称式多处理器性能之刀锋式丛集系统包含若干 刀锋模块及一时序分配架构。每一个刀锋模块包含若干区域时序用户。时序分配架构包含一时序多任务器(clock multiplexer)、设置于每一刀锋模块上之 可运作的区域时序器、以及一中央时序器。中央时序器用以产生中央时序讯号, 时序多任务器接收中央时序讯号及由区域时序器所产生的区域时序讯号,中央 时序讯号被时序多任务器选择并发送至每一刀锋模块的区域时序用户;其中如 果中央时序器失灵,位于刀锋模块上之时序多任务器切换中央时序讯号,改为 发送区域时序讯号至区域时序用户。


图1为常规技术中高阶对称式多处理器系统的时序分配实施例。 图2为常规技术中刀锋式丛集系统的典型设备。 图3为依本发明实施例之具有备用时序架构的刀锋式计算系统。 图4为图3所示之刀锋式丛集系统设定于单一刀锋运作模式。 图5为图3所示之刀锋式丛集系统设定于多刀锋运作模式。
具体实施方式
本发明提供一备用的时序架构,使得刀锋式丛集系统设备具有高阶对称式 多处理器的特征,而使其具有弹性的系统架构。请参阅图3, 一刀锋式丛集系统主要包含一中央时序器10及若干刀锋模块 20、 30、 40、 50。刀锋式丛集系统基本包含必要的硬设备及一丛集管理系统(图 中未示)以管理刀锋模块20、 30、 40、 50的运作。(为提供较清楚的说明,刀 锋式丛集系统所包含的其它系统构件在图式中被省略。)该丛集管理系统是一软 件程序,在刀锋模块20、 30、 40、 50与使用者间作为管理/运作接口。在本发 明中,丛集管理系统支持丛集计算(cluster computing),包含具有/不具有主 节点(head node)之非対禾尔式丛集(asymmetric clustering)及对称式丛集 (symmetric clustering)。每一刀锋模块20/30/40/50可当成一部独立计算机,通常在一主机板卜.实
现。刀锋模块20/30/40/50与不同的电子元件例如处理器、系统内存、桥式芯片、输入/输出控制器、网络接口控制器、扩充卡的输入/输出连接器(皆未显示)、 一时序多任务器(MUX) 21/31/41/51及区域时序器22/32/42/52,被具 体实现在印刷电路板。这些元件经由特定的总线连接彼此以执行数据处理的任 务。每一刀锋模块20/30/40/50具有一专用的操作系统以执行直接的监控并管 理设置其上的硬件元件,管理各种计算机资源并提供应用软件一个操作的环境。 在本发明中,每一个刀锋模块专用的操作系统具有执行对称式多处理器配置的 性能。刀锋模块20、 30、 40、 50的处理器(图中未示)是装设于专用处理器插槽 (图中未示)的单一芯片处理器,每一个均设置有一个或多个计算核心 (computing core)。依照本发明,在刀锋式丛集系统中的所有处理器可支持各 种的对称式多处理器的配置,例如1、 2、 4或8个处理芯片等。亦即,在刀锋 式丛集系统中口J能现存有不只一个对称式多处理器区域。设置于电路板外或设置于刀锋模块20、 30、 40、 50之一的中央时序器10, 产生并分配一同步的中央时序讯号予每一刀锋模块20、 30、 40、 50。在某些特 定的例子,该中央时序讯号可由刀锋模块20、 30、 40、 50之一的区域时序讯号 器所提供。屮央时序器10是由丛集管理系统所控制,以执行丛集任务。设置于每一刀锋模块20/30/40/50上之区域时序器22/32/42/52为一独立 的时序来源,当刀锋式丛集系统正在运作时,区域时序器22/32/42/52产生并 分配一可运作的区域时序讯号。区域时序器22/32/42/52亦可用于单独运作, 例如测试、除错、问题修复,倘若区域时序器22/32/42/52可维持相同的时 序边缘校正,刀锋式丛集系统便可以单一刀锋运作(single blade operation) 支持完整的时序故障恢复能力的特征(参照图4)。时序多任务器21/31/41/51电气连接中央时序器10及在每一刀锋模块 20/30/40/50之区域时序器22/32/42/52与区域时序用户。中央时序讯号及区域 时序讯号被发送至时序多任务器21/31/41/51。时序多任务器21/31/41/51监测时序讯号的状态,可由中央时序讯号与区 域时序讯号中选择一健全的时序讯号。时序多任务器21/31/41/51可预设为选 择中央时序讯号,如果所选择的屮央时序讯号有问题,而其它的时序讯号是健 全的,时序多任务器21/31/41/51将由故障的讯号来源切换至健全的讯号。时 序多任务器21/31/41/51的实际例子是选择锁相回路(PLL),此为丛集管理系 统所控制。刀锋式丛集系统的丛集管理系统监测时序的状态、控制时序分配的 路径,并采取必要的行动以恢复该刀锋式丛集系统。请参照图4,在单一刀锋运作的模式(single-blade operation mode)中, 只有一个刀锋模块20/30/40/50与每一个操作系统02/03/04/05领域所涵盖。 在此一模式下,时序的产生与分配完全是备用的。
如同一丛集系统,刀锋式丛集系统可预设为使用中央时序讯号。 一旦中央时序器10失灵或有问题,时序多任务器21/31/41/51切换而刀锋式丛集系统之 该刀锋模块20/30/40/50可以使用其区域时序器22/32/42/52所产生之区域时 序讯号,因此仍得以保持刀锋模块20/30/40/50的运作。如果区域时序器 22/32/42/52可以保持区域时序讯号与中央时序讯号在中央时讯号失灵前的时 序边缘校正,整个刀锋式丛集系统可以保持同步的丛集运作。相对的,若无同 步化区域时序讯号,每一刀锋模块20/30/40/50将仍可运作,只要丛集管理系 统持续处理任务的安排/派遣,刀锋式丛集系统仍可用于新的任务。请参照图5,在多刀锋运作模式(multiple-blade operation mode)中, 二刀锋模块(20、 30) / (40、 50)的处理器由两个系统总线连接以形成二个或 多个对称式多处理器/操作系统领域06、 07。 一网络连结(network connection) 连接该对称式多处理器/操作系统领域06、 07以丛集化,此配置在同一对称式 多处理器/操作系统领域06、 07的范围内需要同步时序。在实施例中, 一旦该 中央时序器10失灵,由于区域时序器(22、 32) / (42、 52)无法提供位于同 -对称式多处理器/操作系统领域中的处理器同步时序讯号,正在进行中的任务 将不会回复。在本发明中系统总线可由任何连接二个或多个处理器间的电路而 实现以允许对称式多处理,例如此些总线兼容于HyperTransport协议。网络 连结包含实际的高速接口连接于刀锋模块的网络接口控制器之间,例如无限 宽带连结(infinite Band connection)或千兆字节以太网络连结(Gigabyte Ethernet connectiorO。-个解决方式是利用同步模块(图中未示)以同步化在同-对称式多处 理器/操作系统领域06/07之区域时序器(22、 32) / (42、 52)。另一个解决方式是重新启动刀锋式丛集系统为单一刀锋运作模式。丛集管 理系统将再利用其电源(recycle the power),改变对称式多处理器配置及时 序来源,并以单一刀锋运作模式重新启动系统。于是刀锋丛集系统不需经任何 修理或替换将仍可被利用。在常规技术中,替换或修理硬件配置甚为费时。利 用时序分配架构,本发明提供刀锋式丛集系统维持运作 -段持续性期间的机会。中央时序器可预设为完全备用模式(full-redundant mode)。如果基于某 种原因刀锋式丛集系统无法在单一刀锋运作模式下运作,则丛集管理系统将需 要再利用其电源,改变该时序来源并再重新启动系统,如同单一刀锋运作模式。针对需要外部时序来源当作中央时序的那些刀锋,在测试那些刀锋将仰赖 一额外的时序来源。本发明提供单独计算机测试、除错及问题修复之弹性化, 刀锋可因此运作如同独立计算机。必要的硬设备及/或软件/韧体配置将可能需要被用来改变对称式多处理器 的配置。本发明之备用的时序分配架构是为了弹性化系统配置的基本条件之一 。虽然本发明的技术内容已经以较佳实施例揭露如上,然其并非用以限定本 发明,任何熟习此技艺者,在不脱离本发明之精神所做些许之更动与润饰,皆应涵盖于本发明之范畴内。
权利要求
1.一种具对称式多处理器性能的刀锋式丛集系统之时序分配架构,该刀锋式丛集系统含有若干刀锋模块,该时序分配架构包含中央时序器,产生一中央时序讯号;及一时序多任务器与一可运作的区域时序器,安装于各该刀锋模块,该时序多任务器接收该中央时序讯号与该区域时序器所产生之一区域时序讯号,该时序多任务器选择该中央时序讯号并发送至各该刀锋模块的若干区域时序用户;其中,如果该中央时序器失灵,位于各该刀锋模块上之该时序多任务器切换该中央时序讯号,改为发送该区域时序讯号至该些区域时序用户。
2. 如权利要求1所述之具对称式多处理器性能的刀锋式丛集系统之时序分 配架构,其特征是,该中央时序讯号由该些刀锋模块其中一个的该区域时序器 所提供。
3. 如权利要求1所述之具对称式多处理器性能的刀锋式丛集系统之时序分 配架构,其特征是,该时序分配架构更包含一同步模块,用以同步化在至少一 个对称式多处理器范围中,二个或更多该些刀锋模块的该区域时序讯号。
4. 如权利要求3所述之具对称式多处理器性能的刀锋式丛集系统之时序分 配架构,其特征是,在同一对称式多处理器范围中,不同之该些刀锋模块上之 若干处理器间通过一系统总线连接。
5. 如权利要求1所述之具对称式多处理器性能的刀锋式丛集系统之时序分 配架构,其特征是,该刀锋式丛集系统更包含一网络连结(network connection) 在该些刀锋模块间。
6. —种具对称式多处理器性能的刀锋式丛集系统,包含若干刀锋模块,分别包含若干区域时序用户;及 一时序分配架构,包含一中央时序器,产生一中央时序讯号;及一时序多任务器与-可运作的区域时序器,安装于各该刀锋模块, 该时序多任务器接收该中央时序讯号与该区域时序器所产生之一区域 时序讯号,该时序多任务器选择该中央时序讯号并发送至各该刀锋模 块的该些区域时序用户;其中,如果该中央时序器失灵,位于该刀锋模块上之该时序多任务器 转换该中央时序讯号,改为发送该区域时序讯号至该些区域时序用户。
7. 如权利要求6所述具对称式多处理器性能的刀锋式丛集系统,其特征是, 该中央时序讯号由该些刀锋模块其中一个的该区域时序器所提供。
8. 如权利要求6所述具对称式多处理器性能的刀锋式丛集系统,其特征是, 该时序分配架构更包含一同步模块,用以同步化在至少一个对称式多处理器范 围中,二个或更多该些刀锋模块的该区域时序讯号。
9. 如权利要求8所述具对称式多处理器性能的刀锋式丛集系统,其特征是, 在同一对称式多处理器中,不同之该些刀锋模块上之若干处理器间通过一系统 总线连接。
10. 如权利要求6所述具对称式多处理器性能的刀锋式丛集系统,其特征是, 更包含一网络连结在该刀锋模块间。
全文摘要
本发明揭示了一种备用的时序分配架构,使刀锋式丛集系统具有对称式多处理器性能并可弹性化系统配置;本架构主要由一个中央时序器提供中央时序讯号,并由配置于系统中每一刀锋模块上可运作的区域时序器提供区域时序讯号;时序多任务器选择中央时序讯号并发送至位于每一刀锋模块之若干区域时序用户;如果中央时序器失灵,时序多任务器切换改为发送区域时序讯号。
文档编号G06F1/10GK101126942SQ20071009629
公开日2008年2月20日 申请日期2007年4月10日 优先权日2006年8月15日
发明者平井智则, 钟志明 申请人:泰安电脑科技(上海)有限公司;泰安电脑科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1