具有分布式负载平衡系统的集群计算机的制作方法

文档序号:6588353阅读:164来源:国知局
专利名称:具有分布式负载平衡系统的集群计算机的制作方法
技术领域
本发明是有关于一种集群计算机,特别有关于一种具有分布式负载平衡系统之集群计算机,让集群计算机在进行运算(如不可分割运算)时,透过分布式负载平衡系统的控制可使得每个节点(Node)共同存取同一储存系统,并且可妥善保护集群计算机运作时的各种数据,以及提升节点的数据处理速度。
背景技术
随着半导体制造技术和集成电路设计之进步,个人计算机已经广泛被采用于个人、家庭、学术研究、商业以及工业等方面。另一方面,随着国际互联网的蓬勃发展,大量信息不断在国际互联网内流动,特别是在电子商务和学术研究的领域,信息的处理和流动更是频繁且沉重,所以需要处理能力强大且具有高可靠度的高阶服务器等相关设备和器材来进行稳定的支持与运作。
然而,一般具有强大处理能力的高阶服务器其价格却非常昂贵,并不符合企业的经济效益。由于目前一般个人计算机用的处理器已经具有一定程度的处理能力及可靠性,而且通过应用超高速的网络联机(如具有Gigabit传送速度的网络,甚至是应用光纤信道和光纤网络设备建立的网络联机),计算机与计算机之间的数据传送速度得以大幅提升,所以可借着平行处理和分布式计算等技术,将多台个人计算机以网络连接形式建构成一个集群计算机,提供高效率计算和处理予各领域。
请参考

图1,其所绘示为公知集群计算机之示意图。公知集群计算机10主要是由多个节点30和至少一台主计算机70组成,且各设备是透过网络连接设备(如交换器等)60互相连接以构成一个局域网络20,其中主计算机70具有任务分配、控制节点30的负载平衡,以及监控集群计算机10内所有运作等功能,以于必要时加以控制。
请参考图2,其所绘示为根据图1所示之公知集群计算机的节点内之设备连接示意图。图1之公知集群计算机10中,每一节点30可由一个或多个处理器80及记忆模块90以共享总线100的方式互相连接组成。
而且,公知集群计算机10之每一节点30都具有专属的节点储存设备40或节点储存系统等,如磁盘阵列(RAID)、网络储存设备(Network AttachedStorage;NAS)和储存局域网络(Storage Area Network;SAN)等,以储存节点30处理的数据,或者用作数据备份。一般而言,若节点30是由共享总线100连接多个处理器80构成时,节点储存设备40多为连接至共享总线100的共享储存设备,以供多个处理器80同时存取。
图1所示之集群计算机10,一般采用具有开放性原始码特性的操作系统,如采用Unix或Linux等操作系统作为其工作平台,该系统的优点是具有高稳定度、高弹性的设计及实施等,因此可以根据使用者的需求与考虑,进行不同的修改及调整,以提高工作效率。
集群计算机10一般是作高效率计算之用,当集群计算机10进行运算(如不可分割运算)时,连接国际互联网50的主计算机70依据应用程序的设定及每一节点的处理能力等,将此运算任务的多个子任务平均分配至各个节点30,以达至负载平衡和加速运算的目的。同时,主计算机70亦持续监控各节点30的运作情况,依照应用程序的设计和安排,在多个节点30之间进行动态负载平衡的处理。
一般而言,当节点30完成主计算机70交付的子任务后,主计算机70将依据动态负载平衡的原则,交付另一子任务给节点30进行,直至此运算(如不可分割运算)完成为止。当此运算完成时,主计算机70将根据应用程序的设计,自各个节点30的节点储存设备40提取节点30进行的运算任务之结果,并将其整合统一为运算的结果。或者当各节点30完成其进行的子任务时,先将结果传送至主计算机70,主计算机70待取得所有子任务的结果时,对所有子任务的结果进行整合统一,以得到运算任务(如不可分割运算)的结果。
每一节点30在处理子任务时,都会对节点储存设备40进行数据存取,因此,每个节点30的工作效率与节点储存设备40不无关连。例如,节点储存设备40与处理器80连接之间的频宽、节点储存设备40的运作速度和集群计算机10的工作平台和应用程序对节点储存设备40之优化等,都会影响节点的工作效率。
此外,当集群计算机10进行运算(如不可分割运算),各个节点30在进行运算任务时,需要同时存取节点储存设备40及处理来自主计算机70的通信,例如主计算机70对节点30进行动态负载平衡、主计算机70询问节点30运算任务的进度、主计算机70对节点30要求运算任务的结果等,使得节点30未能专注于处理运算任务,节点30的工作效率因而大幅下降。
在节点30建立或维护方面,由于每个节点30都需要专属的节点储存设备40,所以当新增节点30时,成本势必因昂贵的节点储存设备40而上升,而且,集群计算机10内众多节点储存设备40是分别对应依附各个节点30,基于储.存设备的容量越大,每个储存单位的成本越便宜之价格原理,分布式的节点储存设备40之成本偏高,同时亦降低了储存数据的安全性和备份数据时的方便性。另一方面,为提高集群计算机10的工作效率及增加其稳定性,各个节点储存设备40的规格必须尽量统一,因而限制了采购或更换节点储存设备40的弹性,拥有集群计算机10的成本便难以降低。
在数据保存方面,由于主计算机70是负责控制任务分配和负载平衡等功能,若集群计算机10中的主计算机70突然故障而停止运作时,各个节点30便无法确保正常无误地运作,同时节点30运算所需的数据或所产生的数据亦未被控制,而储存在每个节点储存设备40中的数据亦可能受到影响而损毁,可见公知的集群计算机10在数据保存方面未能提供稳定的可靠度。
随着知识经济的发展,企业对于大量数据处理的应用需求日趋迫切,而且数据的处理、储存、安全和管理等需求也呈现爆炸性成长,集群计算机的应用将日益广泛。然而,传统集群计算机的实施和应用上却未能同时提供低成本、高可靠度和高工作效率的运算。因此,如何建立可以节省企业成本、强化扩充能力、具高稳定性、高安全性的集群计算机,是知识经济时代企业得以在激烈竞争中脱颖而出的致胜关键。

发明内容
鉴于上述之发明背景中,随着知识经济的发展,企业和学术研究等对于大量数据处理的应用需求日趋迫切,而且数据的处理、储存、安全和管理等需求也呈现爆炸性成长,然而高阶服务器群组其价格却非常昂贵。但随着半导体制造、集成电路设计和通信网络技术的进步,一般的个人计算机已具备可靠的处理能力,网络通信的速度亦快速提升,因此利用一般计算机透过网络连接建构而成的集群计算机,可提供接近高阶服务器群组的工作能力,但建立、维护或扩充成本都比高阶服务器群组便宜,于是提供了服务器群组外的另一实施方案。在集群计算机中,每一节点都具有专属的节点储存设备或节点储存网络作数据存取之用,但当新增节点时,成本势必因昂贵的节点储存设备而上升,而集群计算机内分散的众多节点储存设备,亦导致维护节点时成本大为增加。
另外,为提高集群计算机的工作效率及增加其稳定性,各个节点储存设备的规格必须尽量统一,限制了采购或更换节点储存设备的弹性,拥有集群计算机的成本便难以进一步降低。
再者,若公知集群计算机中控制任务分配和负载平衡等功能的主计算机因故障而停止运作时,各个节点的运作和监控,以及节点间的负载平衡便受到影响,储存在每个节点储存设备中的数据亦可能受到损毁,宝贵的数据因而流失。
本发明的主要目的为提供了一种集群计算机,特别是有关于一种具有分布式负载平衡系统之集群计算机,让集群计算机在进行运算(如不可分割运算)时,每一节点共同存取同一储存系统,减少每一节点所包含的储存设备,以降低导入集群计算机的门槛。同时,亦可提升集群计算机的处理速度和运作可靠度,并可增加储存或备份数据时的安全性与方便性。
根据以上所述之目的,本发明提供了一种具有分布式负载平衡系统之集群计算机,此具有分布式负载平衡系统之集群计算机至少包括具有多个连接端口的网络连接装置(如交换器);连接至网络连接装置的储存系统;数个节点,这些节点用于共同执行一运算(如一不可分割运算),且每一个节点是连接至网络连接装置,以于执行运算时对储存系统进行存取;至少一前端服务器,其一端连接至国际互联网,另一端则连接至网络连接装置;以及至少一负载平衡服务器,此至少一负载平衡服务器之一端是连接至网络连接装置,当前端服务器将运算任务委派予此至少一负载平衡服务器时,此至少一负载平衡服务器则对这些节点进行运算任务分配和负载平衡控制,将运算任务的子任务平均分配至各节点,并控制储存系统的运作,以优化本发明所提供之具有分布式负载平衡系统之集群计算机的运作。
此外,本发明之具有分布式负载平衡系统之集群计算机,更包括有控制台,用以监控网络连接设备、储存系统、众多节点及至少一计算机服务器的运作。
而本发明之具有分布式负载平衡系统之集群计算机内的储存系统,可由储存局域网络或网络储存设备构成。另外,每一节点可由数个处理器和至少一记忆模块以共享总线的连接方式构成。
一种具有分布式负载平衡系统之集群计算机,至少包括至少一交换器,该至少一交换器具有多个连接端口;至少一前端服务器,该至少一前端服务器之一端是连接一国际互联网,该至少一前端服务器之另一端是对应连接至该多个连接端口之至少一个连接端口;一储存系统,该储存系统是对应连接至该多个连接端口之该至少一连接端口,其中该储存系统具有可扩充性,以及该储存系统是选自于一储存局域网络和一网络储存设备中之一者;多个节点,该多个节点用于执行一运算任务多个子任务,且该每一个节点是连接至该多个连接端口之对应一个第一连接端口,以在执行该多个子任务时对该储存系统进行一存取步骤;以及至少一负载平衡服务器,该至少一负载平衡服务器之一端是连接至该至少一前端服务器的另一端,该至少一负载平衡服务器之另一端连接至该多个连接端口之对应一个第二连接端口,且该至少一前端服务器用于将该运算任务委派至该至少一负载平衡服务器,而该至少一负载平衡服务器用于对该多个节点进行一运算任务分配,以将该运算任务之该多个子任务分配至该多个节点,以及对该多个节点进行一负载平衡控制。
利用集群计算机内应用分布式负载平衡系统控制集中式的储存系统及节点的工作负载,可提升节点工作时的处理能力,加快运算速度。同时,当前端服务器运作出现故障而停止时,利用分布式负载平衡系统对各设备和节点的控制,本发明之集群计算机所进行的运算仍可毫不间断地持续进行,而且由于各节点是对同一集中式的储存系统进行数据存取,所以集群计算机的运算数据得以妥善存放在集中式的储存系统中,不因外在环境的改变而受损,故此数据的管理、储存与备份就更加安全和方便。另外,借着利用集中式的储存系统,建立集群计算机或扩充节点时的成本得以大幅降低。
附图简要说明本发明的较佳实施例将在下列说明文字中结合附图做更详细的阐述,其中图1显示的是公知集群计算机之示意图;图2显示的是根据图1所示之公知集群计算机的节点内之设备连接示意图;图3显示的是本发明之一实施例的连接示意图;图4显示的是本发明之一较佳实施例的连接示意图;以及图5A至图5B显示的是根据图4之中央储存系统的实施例之示意图。
具体实施例请参考图3,其所显示的是本发明之一实施例的连接示意图。如图3所示,本发明所提供之集群计算机300,是由多个连接至局域网络310的节点320、一台连接国际互联网380的前端服务器370和至少一台具有分布式负载平衡系统用作负载平衡等工作的服务器340所组成,而且更具有一个连接至局域网络310的中央储存系统330,其中每一节点320可由一个或多个处理器及记忆模块以共享总线的方式互相连接组成,每一节点320内并不包含节点储存设备(或节点储存系统)。
当集群计算机300运作时,前端服务器370将运算任务(如不可分割运算)给予用作负载平衡等工作的服务器340,然后由服务器340将此运算任务平均分配至各个节点320,由众多节点320执行此运算任务的子任务,以达至负载平衡的目的。由于本发明之集群计算机300中,是分别利用不同的服务器和网络设备等实施连接国际互联网380的前端服务器370和用作负载平衡的服务器340,而且前端服务器370具有防火墙的功能,所以可保护集群计算机300内部的运作。
同时,透过适当修改和调整集群计算机300的运作平台和应用程序等,例如,因为节点320及中央储存系统330都具有媒体存取控制地址(Media AccessControl Address;MAC地址),故可以此MAC地址作为数据流动的参考,在节点320进行运算任务的子任务时,将所需数据储存至中央储存系统330,或者从中央储存系统330读取所需数据。
另外,由于前端服务器370只是负责将运算任务给予用作负载平衡的服务器340而不需负责负载平衡的工作,所以当前端服务器370受到不明的攻击或故障而停止运作时,具有分布式负载平衡系统的服务器340仍可持续运作并掌管集群计算机300内部的各设备和节点,持续对节点320进行负载平衡等工作,所以节点320的运作不受影响。而且,由于本发明之集群计算机300是采用中央储存系统330,所以经由服务器340和应用程序的控制,节点320可继续对中央储存系统330取用运算时所需之数据或存入所产生的运算结果而不受外界影响,储存于中央储存系统330的数据亦不会因而流失,重要的数据便得以妥善保全。
此外,前端服务器370和服务器340可直接自中央储存系统330对节点320运算后所得之结果取用支配,而不需如公知集群计算机的主计算机等待节点上传运算结果,而且需要连络节点才可取得节点的运算结果。因此,前端服务器370和服务器340不需要常常询问节点320运算任务的进度,亦不需对节点320要求运算任务的结果,节点320便可利用全部的资源来专注于处理运算任务,于是节点320的工作效率得以提升,集群计算机300的处理效能亦随之大幅增加。
请参考图4,其显示的是本发明之一较佳实施例的连接示意图。在图4中,本发明之集群计算机300,是利用网络连接设备(如交换器等)350同时连接多个节点320、两台(或两台以上)用作负载平衡等工作的服务器360、两台(或两台以上)连接国际互联网380的前端服务器370以及中央储存系统330,以构成一个局域网络390,其中每一节点320可由一个或多个处理器及记忆模块以共享总线的方式互相连接组成,但每一节点内并不包含节点储存设备(或节点储存系统)。
而且,集群计算机300内更包括控制台400,利用专属网络联机等方式,直接与前端服务器370、用作负载平衡等工作的服务器360、中央储存系统330和众多节点320等进行连系与通信,掌握目前集群计算机300内各设备的运作情况,以便管理人员随时进行监控。
由于图4之集群计算机300具有连往国际互联网380的信道,故前端服务器370一般都具有防火墙功能,而采用两台(或两台以上)的前端服务器370之原因用于平均分担工作,以及当其中一台前端服务器370未能正常运作时,另一台前端服务器370可立刻接管,避免连接国际互联网380的信道完全瘫痪。同理,集群计算机300采用两台(或两台以上)的服务器360来互相支持及备用,以增加集群计算机运作时的稳定度,以及当任一台服务器360故障时另一台可支持控制各节点320持续进行运作。
另外,请同时参考图4、图5A和图5B,图5A和图5B分别显示为根据图4之中央储存系统的实施例之示意图。图5A所示之中央储存系统330是以储存局域网络(SAN)500实现的,储存数据经连接线路410自网络连接设备350传送至储存局域网络500的控制设备510,然后控制设备510将储存数据储存至适当的储存设备520。
图5B所示之中央储存系统330是以网络储存设备(NAS)550实现的,储存数据可经由多条连接线路410自网络连接设备350传送至网络储存设备550中适当的储存设备560。
图4之中央储存系统330,可由如磁盘阵列、网络储存设备和储存局域网络等实施,但并未限制于如上所述之设备或系统。
应用本发明之集群计算机300,除了节点320的工作效率得以提升外,由于集群计算机300的节点320内不包含节点储存设备(或节点储存系统),所以当扩充节点320时成本得以减少,但却不会降低节点320的工作效率,而且因集群计算机300采用集中式的中央储存系统330,而非公知集群计算机中呈分布式的节点储存设备,基于储存设备的容量越大,每个储存单位的成本越便宜之价格原理,可得知应用中央储存系统330的储存成本较为便宜,并可改善节点320使用专属的节点储存设备(或节点储存网络)时储存设备的使用率不佳之问题。
此外,由于应用了集中式的中央储存系统330,集群计算机300的组成得以简化,其应用程序和作业平台的组成也得以简化,便可提高执行的速度。因数据得以集中管理和储存,大大增加储存管理人员于维护和备份时的方便性,同时亦提升了数据的整合统一和安全性。
本发明之优点为提供一种具有分布式负载平衡系统之集群计算机,由于本发明之集群计算机是由负责运算任务委派和对外联机的前端服务器、负责运算任务分配和负载平衡的负载平衡服务器、节点和中央储存系统组成,所以当对外联机的前端服务器故障时,并不影响集群计算机中负载平衡服务器、节点和中央储存系统等设备的运作,所以集群计算机执行的运算可以持续进行而不受影响,同时储存于中央储存系统亦不会因前端服务器故障而流失。而且,由于各节点都存取同一中央储存系统,节点便可集中资源处理运算,所以节点的处理能力得以提高,运算速度亦可加快,同时使得数据的管理与备份更加可靠方便,并降低建立集群计算机或扩充节点时的成本。故此,本发明之集群计算机提供了低成本、高可靠度和高工作效率的运算。
此外,由于本发明之具有分布式负载平衡系统之集群计算机具有建立及用户(Customize)容易、低导入成本、高扩充弹性但低扩充成本、高可靠性及稳定度等特点,故特别适合企业、学术研究和工程应用等需要高效率计算的领域之用。
如熟悉此技术之人员所了解的,以上所述仅为本发明之较佳实施例而已,并非用以限定本发明之申请专利范围;凡其它未脱离本发明所揭示之精神下所完成之等效改变或修饰,均应包含在下述之申请专利范围内。
权利要求
1.一种具有分布式负载平衡系统之集群计算机,至少包括至少一网络连接设备,该至少一网络连接设备具有多个连接端口;一储存系统,该储存系统是对应连接至该多个连接端口之至少一个连接端口,其中该储存系统具有可扩充性,以及该储存系统选自于一储存局域网络和一网络储存设备中之一者;多个节点,该多个节点用于执行一运算任务的多个子任务,且该每一节点是连接至该多个连接端口之对应一个第一连接端口,以在执行该多个子任务时对该储存系统进行一存取步骤;以及至少一前端服务器,该至少一前端服务器之一端是连接至一国际互联网;至少一计算机服务器,该至少一计算机服务器之一端是连接至该至少一前端服务器之另一端,该至少一计算机服务器之另一端是连接至该多个连接端口之对应一个第二连接端口,且该至少一前端服务器用于将该运算任务委派至该至少一计算机服务器,而该至少一计算机服务器用于对该多个节点进行一运算任务分配和一负载平衡控制。
2.如权利要求1所述的具有分布式负载平衡系统之集群计算机,其中上述之至少一网络连接设备为至少一交换器。
3.如权利要求1所述的具有分布式负载平衡系统之集群计算机,其中上述之运算任务分配是将该运算任务之该多个子任务平均分配至该多个节点。
4.如权利要求1所述的具有分布式负载平衡系统之集群计算机,其中每一该多个节点是由多个处理器和至少一记忆模块以共享总线的连接方式构成。
5.如权利要求1所述的具有分布式负载平衡系统之集群计算机,其中上述之集群计算机更包括至少一控制台,用以监控该至少一网络连接设备、该储存系统、该多个节点及该至少一计算机服务器的运作。
6.如权利要求1所述的具有分布式负载平衡系统之集群计算机,其中上述之运算任务为一不可分割运算。
7.一种具有分布式负载平衡系统之集群计算机,至少包括至少一交换器,该至少一交换器具有多个连接端口;至少一前端服务器,该至少一前端服务器之一端是连接一国际互联网,该至少一前端服务器之另一端是对应连接至该多个连接端口之至少一个连接端口;一储存系统,该储存系统是对应连接至该多个连接端口之该至少一连接端口,其中该储存系统具有可扩充性,以及该储存系统是选自于一储存局域网络和一网络储存设备中之一者;多个节点,该多个节点用于执行一运算任务多个子任务,且该每一个节点是连接至该多个连接端口之对应一个第一连接端口,以在执行该多个子任务时对该储存系统进行一存取步骤;以及至少一负载平衡服务器,该至少一负载平衡服务器之一端是连接至该至少一前端服务器的另一端,该至少一负载平衡服务器之另一端连接至该多个连接端口之对应一个第二连接端口,且该至少一前端服务器用于将该运算任务委派至该至少一负载平衡服务器,而该至少一负载平衡服务器用于对该多个节点进行一运算任务分配,以将该运算任务之该多个子任务分配至该多个节点,以及对该多个节点进行一负载平衡控制。
8.如权利要求7所述的具有分布式负载平衡系统之集群计算机,其中每一该多个节点是由多个处理器和至少一记忆模块以共享总线的连接方式构成。
9.如权利要求7所述的具有分布式负载平衡系统之集群计算机,其中上述之集群计算机更包括至少一控制台,用以监控该至少一交换器、该至少一前端服务器、该储存系统、该多个节点及该至少一负载平衡服务器的运作。
10.如权利要求7所述的具有分布式负载平衡系统之集群计算机,其中上述之运算任务为一不可分割运算。
11.如权利要求7所述的具有分布式负载平衡系统之集群计算机,其中上述之至少一前端服务器更具有该集群计算机之一防火墙功能。
全文摘要
一种集群计算机,特别是一种具有分布式负载平衡系统之集群计算机,让集群计算机在进行运算时,经由分布式负载平衡系统的控制可平衡每一节点(Node)的运算负载,并且使每一节点共同存取同一储存系统,减少每一节点所包含的储存设备,以降低导入集群计算机的门槛。同时,当集群计算机的前端服务器故障时,分布式负载平衡系统能控制各设备和节点,节点进行的运算工作得以持续进行而不受影响,而且运算数据获得妥善安全的保护,在储存或备份数据时就更加方便。另外,集群计算机的处理速度和工作效率亦得以提升。
文档编号G06F15/16GK1480863SQ0213202
公开日2004年3月10日 申请日期2002年9月6日 优先权日2002年9月6日
发明者李先知, 赵玉诚, 吴俊明 申请人:劲智数位科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1