多部件自组织软连接集群计算机智能资源管理方法

文档序号:6458842阅读:136来源:国知局
专利名称:多部件自组织软连接集群计算机智能资源管理方法
技术领域
本发明属于网络系统资源管理领域,特别涉及一种多部件自组织软连接集群计算机的 智能资源管理方法。
技术背景随着社会和科学技术的发展,计算机已日益成为人们工作、学习、生活、交流、娱乐 等方面不可缺少的工具,尤其是在办公室、实验室、电化教学教室、图书馆等场所得到了 广泛的应用。但是现阶段计算机都是一个相对独立的设备,是由主机、显示器、键盘、鼠 标等硬件设备构成的一个整体,用户的使用也是独占一台主机资源及其外设。在这种情况 下,如果某一关键的硬件设备出现故障,则即使其它硬件设备仍可使用,整台计算机也将 无法正常工作,会造成用户因无法使用计算机而给工作、生活带来影响。为了解决单机的运算及I/O能力的不足,提高系统的可靠性,获得规模可扩展能力,降低整体方案的运维 成本(运行、升级、维护成本),自七十年代开始计算机厂商和研究机构就开始了对集群计 算机系统的研究和开发。集群计算机系统在处理能力、可靠性、1/0能力等方面都得到了大幅的提升,但由于传统集群计算机系统的基本单元(节点)仍然是单独的计算机,每个节 点计算机中的各种硬件设备又是固定连接的(看作是一种"硬连接")。所以存在资源浪费、 效率不高的问题。针对计算机目前的使用状况,专利文献(申请号200810026062.4,发明名称多部件 自组织软连接集群计算机及其自组织方法)分析了造成计算机资源浪费、效率不高的主要 原因,并充分利用目前的超宽带(UWB)无线传输技术能在3.1GHz到10.6GHz频率之间 提供最高达到480Mbps数据传输速率,提出了一种多部件自组织软连接集群计算机及其自 组织方法,该集群计算机不像传统的集群计算机那样以单台计算机为基本单元,而是以计 算机的部件(由计算机硬件中的一种或多种构成)为基本单元,相同类型的计算机部件构 成部件群。部件群中的部件按照计算机的构成方式,通过一个或多个连接器(包括有线数 据交换器或无线收发器)自组织地与对应部件群中的部件建立连接并进行数据传输,该集 群计算机结构如图1所示。用户使用时,各个部件群中的部件根据需求自组织地组合(看 作是一种"软连接")成一个计算机系统为用户服务,具有资源高度共享、可靠性高、便于 维护等突出的优点,可以广泛适用于生产、服务、教学、娱乐等多种场合。 一个典型的实施例是集群计算机系统由终端部件群、主机部件群和外存部件群三个部分组成。其中,终 端部件群由多套计算机终端构成,为系统提供用户使用的界面和接口,每套终端可以看作 系统的一个终端部件;主机部件群由多台计算机主机构成,为系统的运算和处理中心,每 个计算机主机可以看作是系统的一个运算处理部件;外存部件群由多个外部存储器构成, 为系统提供海量存储空间,每个外部存储器可以看作系统的一个外存部件。这样, 一套终 端部件、主机部件和外存部件顺次连接,即可以构成一台功能完整的计算机。利用上述专利文献所提供的多部件自组织软连接集群计算机,可以降低成本、提高可 靠性和简化运行维护,在资源管理方面,上述文献中所提供的自组织"组合"方法中采用 了用户分级管理和权重分配。但从集群计算机整体运行效率来看,对多部件自组织软连接 集群计算机的资源管理还存在如下不足(1)部件群中的每个部件不能总处于开启状态, 这样会造成部件资源的闲置和浪费,需要对部件群中的部件资源进行调度,根据用户对资 源的需求动态提供部件资源,即随着用户数量的增加逐步增加部件资源,而随着用户数量 的减少逐步减少部件资源,实现部件的自动开启和自动关闭;(2)对用户分级、按权重分 配资源仍然是静态的分配方式,即分配给用户的资源是固定不变的,为了达到部件资源的 高度共享,需要根据用户实际使用资源的多少来平衡用户之间的资源占用,实现对用户之 间资源的动态调度;(3)用户数据的存储只是临时性的,用户退出系统后,由于下次登陆 系统时不一定是同一个存储部件提供服务,况且临时分配的存储空间也将被释放,所以用 户所存储的数据不能长期保存。但有的用户有长期保存数据的需求,因此存储资源的使用 既要实现临时存储,也要解决永久存储的问题;(4)必须实施部件的故障管理和安全管理, 保证部件资源的可靠性,从而保障系统的安全可靠运行。上述不足不仅会造成资源的闲置 和降低资源的利用率,也会影响用户数据的保存和服务的可靠性,因此,为多部件自组织 软连接集群计算机提供一种全面智能的资源管理方法,将会优化集群计算机的资源配置, 进一步降低成本和提供高可靠性的服务,使多部件自组织软连接集群计算机更具实际应用 价值和市场竞争力。 发明内容本发明的目的在于克服上述现有技术的不足,为多部件自组织软连接集群计算机提供 一种智能资源管理方法,提高集群计算机的部件资源利用率、优化资源配置,从而进一步 降低投资成本和运行维护管理成本,并提高系统的可靠性。本发明所提供的一种多部件自组织软连接集群计算机的智能资源管理方法,实现部件群中部件资源的动态调度,根据用户对资源的需求动态提供部件资源,即随着用户数量的 增加逐步增加部件资源,而随着用户数量的减少逐步减少部件资源,实现部件的自动开启 和自动关闭。本发明的多部件自组织软连接集群计算机智能资源管理方法通过如下技术方案实现-要实现部件的自动开启,需要在部件群中设置一个"监控器",没有部件开启时,"监 控器"处于激活状态,用于监控"组合"命令中对部件资源的需求情况,当对本部件群有 需求时,选择一个部件开启。部件开启成功后,"监控器"进入非激活状态,以后的部件开 启由集群计算机控制。"监控器"可以是一个独立的设备,也可以集成到某一个部件中,它 实现的功能是接收到"组合"命令后触发一个部件开启。 部件的自动开启可以釆用如下具体步骤实现(1) "监控器"处于激活状态;(2) "监控器"监测到"组合"命令中对本部件群有资源需求;(3) "监控器"触发一个部件开启。(4) 如果被选择的部件在时间T (T>0)内无法开启,则重复步骤(3),选择触发另 一个部件开启;(5) 开启的部件为集群计算机系统提供服务;(6) 有部件成功开启后,"监控器"进入非激活状态;(7) 集群计算机系统监控部件资源使用情况;(8) 如果部件群提供的资源已不能满足系统的需求时,将增加一个部件开启;(9) 直到部件群的资源能够满足集群计算机系统的需求。 部件的自动关闭是由部件群监控系统的资源使用情况,当系统资源需求减少到一定程度时,关闭一些部件以节约资源。部件的自动关闭可以采用如下具体步骤实现(1) 集群计算机监控部件资源使用情况;(2) 当集群计算机检测到由m (Km《M, M为部件的总个数)个部件所提供给系统 的资源可以由m-l个部件来保证,转入下一步;(3) 集群计算机从m个部件中选择一个;(4) 将由该个部件提供服务的其它部件群的部件切换到由其余m-l个部件提供;(5) 所选择的部件空闲后自动关闭;(6) 重复步骤(1) - (5);(7) 直至最后一个部件关闭;(8) 将"监控器"置为激活状态。所述的智能资源管理方法,对用户迸行分级,为用户分配登录帐号、运算服务等级和 存储服务等级,当用户登录到系统后,对分配给用户的资源进行动态调度,根据用户实际 使用资源的多少来平衡用户之间的资源占用,将用户空闲资源调度出一部分作为预留资源, 然后将预留资源分配给迫切需要资源的用户,实现部件资源的高度共享。用户分级过程是用户向集群计算机系统管理者申请登录帐号、运算服务等级和存储服 务等级;用户获得帐号、相应的服务等级和存储服务等级以后,即可登录系统;系统收到 登录信息后,根据用户的等级为用户分配相应的部件资源,并开始为用户提供服务。对用户资源进行动态调度是由系统监测每个用户使用部件资源的情况,然后予以动态 调整。动态资源调度过程,采用如下具体步骤实现(1) 系统监测用户使用部件资源的情况;(2) 如果在时间T (T>0)内某个用户使用部件资源的比例低于某个阀值L1 (L1>0), 系统将分配给该用户的资源调整出 一部分作为预留资源;(3) 如果在时间T (T>0)内某个用户使用部件资源的比例高于某个阀值L2 (L2>0), 这时若有预留资源,则系统将部分预留资源分配给该用户,以满足该用户对资源需求;(4) 如果被调整出资源的用户资源需求增加,且增加后该用户使用的总资源不超出其 被允许使用的最大资源的范围,即在其规定级别范围内,则系统首先从预留资源中调配资 源给该用户,如果预留资源不够,系统将回收分配出去的部分预留资源以满足该用户的需 求;(5) 系统保存着一个"动态资源调度列表",内容包括各用户使用部件资源的比例、 调整资源的情况、剩余预留资源情况和预留资源分配情况等。所述.的智能资源管理方法,解决用户使用存储类部件资源时的临时存储和永久存储问 题。暂时存储是指用户只在使用集群计算机的过程中占用的存储类部件资源,当用户退出 系统后即被释放,所存放的数据将丢失。永久存储是指用户需要长期保存数据时需要占用 的存储类资源,用户退出系统后保存的数据仍然有效,存储类资源仍然被占用,用户可以 进行重复访问。所述的方法将从存储类部件群中划分出一部分作为永久存储区,实现用户 数据在系统中的长期保存。要实现临时存储和永久存储,首先从存储类部件群中划分一个区域作为用户数据的永 久存储区,永久存储区不能再作为临时存储空间;用户登录到系统后,系统根据用户等级 在存储类部件群中为用户分配临时存储空间,并提示临时存储空间的访问位置;然后,系 统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判断用户是否是 第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户所申请大小的 永久存储空间,并提示永久存储空间的访问位置,系统保存有"永久存储空间分配表"记 录永久存储空间与用户的映射关系;如果用户曾经成功登录过系统,则系统根据"永久存 储空间分配表"建立用户与其永久存储空间的映射关系,并提示永久存储空间的访问位置。 当用户准备退出系统时,系统将提示用户把需要长期保存的数据存储到永久存储空间中, 临时存储空间将被释放。所述的智能资源管理方法,通过读取运行部件的关键参数实施部件的故障管理和安全 管理,监测和维护部件资源的可靠运行。故障管理是监测部件是否处于正常的运行状态, 安全管理是监测部件是否受到攻击或篡改。对某个部件群中的部件实施故障管理和安全管理,首先针对故障管理和安全管理分别 设置一个关键参数表,即故障管理参数表和安全管理参数表,选择参数的要求是这些参数 能够全面反映部件的运行状态和安全状态。然后对每个参数设置多个级别的阀值如LKL2.......Ln(n为自然数),当系统监测到某个参数达到(高于或低于或等于)某个阀值时,将产生对应级别的告警信息,如达到阀值Li即产生i级告警(i=l,2,......n),并通过多种方式将告警信息通知系统管理者,由系统管理者根据告警级别采取相应的措施以确保部件的 正常运行和安全。通知系统管理者的方式可以是(1)将告警信息显示到系统管理者的电脑 屏幕上;(2)如果系统已与Internet相连,则可以给系统管理者发送E-mail; (3)如果与电 信运营商达成协议,可以通过短消息的方式将告警信息发送到管理者的手机上。 当某一个部件无法开启时,将以最高级别的故障告警信息通知系统管理者。 将所有故障告警和安全告警分别记录到故障日志文件和安全日志文件中,以备查询。 上述功能的实现,使多部件自组织软连接集群计算机更具竞争优势(1) 通过实现部件群中部件资源的动态调度,不仅可以优化多部件自组织软连接集群 计算机的资源配置,而且可以避免部件的闲置、最大限度地节省损耗成本和维护成本,同 时也提高了对多部件自组织软连接集群计算机进行维护的自动化程度。(2) 对用户进行分级和对分配给用户的资源进行动态调度,克服了现有多用户系统对所有用户平均分配资源的不足,实现了资源的高度共享,不仅可以提供差异化服务,而且 也提高了多部件自组织软连接集群计算机资源的利用率。(3) 临时存储和永久存储问题的解决,实现了用户数据的长期保存,满足了不同用户 的存储要求,扩展了多部件自组织软连接集群计算机的服务功能和服务范围。(4) 通过对部件实施故障管理和安全管理,可以让系统管理者及时发现部件的异常状 态,及时采取相应的措施,保障系统的安全和可靠运行。


图l多部件自组织软连接集群计算机典型结构示意图 图2本发明实施例中集群计算机的示意图 图3本发明实施例主机部件自动开启流程图 图4本发明实施例主机部件自动关闭流程图 图5本发明实施例用户分级过程流程图 图6本发明实施例用户资源动态调度过程流程图 图7本发明实施例临时存储和永久存储实现流程图 图8本发明部件的故障管理和安全管理实现流程图具体实施方式
本发明所提供的一种多部件自组织软连接集群计算机的智能资源管理方法,是基于计算 机部件群以及部件群之间的自组织连接而组成的集群计算机。下面将结合附图对本发明的具体实施方式
作进一步说明。本发明的一个典型实施例中的集群计算机如图2所示,集群计算机系统分为终端部件 群201、主机部件群202和外存部件群203三个部分。其中,终端部件群201由N套的计 算机终端204构成,为系统提供用户使用的界面和接口,每套终端可以看作系统的一个终 端部件;主机部件群202由M台计算机主机部件207构成,为系统的运算和处理中心,每 个计算机主机可以看作是系统的一个运算处理部件;外存部件群203由K个的外部存储器 209构成,为系统提供海量存储空间,每个外部存储器可以看作系统的一个外存部件。于 是, 一套终端部件、主机部件和外存部件连接成功后,即可构成一台功能完整的计算机。一、部件的自动开启和自动关闭实施例中,集群计算机系统分成了终端部件群201、主机部件群202和外存部件群203 三个部分,亦即有终端部件204、主机部件207和外存部件209三类部件。其中终端部件204是用户使用系统的界面和接口,是由用户来开启和关闭的,不需要实现自动开启和关 闭;外存部件209的自动开启和关闭与主机部件群类似。所以,在本实施例中,只说明实 现主机部件207的自动开启和关闭过程。在本实施例中,实现主机部件的自动开启,"监控器"只要在接收到"组合"命令后(指 其他部件群发出的组合命令,如手动开启的终端部件发出的"组合"命令),触发接通一台 (或个,具体实施例中对于主机部件而言,用量词"台"来替代"个")主机部件的电源即 可开启一台主机。主机部件207的自动开启可以采用如下具体步骤实现(1) 在主机部件群202中的"监控器"处于激活状态;(2) "监控器"监测到"组合"命令中对主机部件群有资源需求;(3) "监控器"选择触发一台主机部件开启(触发的依据可以是已设定好的优先等级), 如主机l;(4) 如果被选择的主机1在时间T (T>0)内无法开启,则选择触发另一台部件开启, 如主机2;(5) 开启的主机部件为集群计算机系统提供服务;(6) 有主机部件成功开启后,"监控器"进入非激活状态;(7) 集群计算机监控主机部件资源使用情况;(8) 如果主机部件群提供的资源已不能满足系统的需求时,将增加一台主机部件开启;(9) 直到主机部件群的资源能够满足系统的需求。 主机部件自动开启流程如图3所示。 .主机部件207的自动关闭可以采用如下具体步骤实现 (1 )集群计算机监控终端部件群201的资源使用情况;(2) 当集群计算机检测到由m (Km《M)台主机部件所提供给终端部件群201的资 源可以由m-l台主机部件来保证;(3) 集群计算机从m台主机部件中选择一台;(4) 将由该台主机部件提供服务的终端部件切换到由其余m-l台主机部件提供;(5) 所选择的主机部件空闲后自动关闭;(6) 重复步骤(1) - (5);(7) 直至最后一台主机部件关闭;(8) 将主机部件群中的"监控器"置为激活状态。 主机部件自动关闭流程如图4所示。二、用户分级和用户资源的动态调度用户分级是指用户在向集群计算机管理者申请用户帐号和用户密码时,同时还要申请 运算服务等级和存储服务等级,例如,可以将终端部件要求的运算服务划分为3个等级-等级0为普通运算服务等级,主要用于上网、文字处理等需要运算量不大的普通任务;等 级1为需要一定运算量的任务,如从事一些一台主机部件207可以完成的运算量中等的计 算;等级2为需要大量运算量的任务,如需要大量数学运算的实时任务等,此时需要启动 多台主机部件207的并行计算功能来加快运算速度;存储服务等级可以按需要的存储空间 来划分,例如等级O需要IOOM存储空间,等级1需要200M存储空间等等,另外,存 储服务还有临时存储和永久存储之分。用户分级过程实现的具体步骤包括(1) 用户向集群计算机系统管理者申请登录帐号、运算服务等级和存储服务等级;(2) 系统管理者为用户分配登录帐号、运算服务等级和存储服务等级;(3) 用户通过终端部件204输入登录信息;(4) 系统收到登录信息后,根据用户的运算服务等级为用户分配相应的主机部件资源, 根据用户的存储服务等级为用户分配临时存储空间和永久存储空间;(5) 系统为用户提供服务。 用户分级过程的流程如图5所示。用户资源动态调度是指根据用户实际使用所分配资源的情况,在不影响用户服务质量 的条件下,对用户资源进行动态调整,将一定时期内空闲的资源临时分配给需要资源的用 户,使系统部件资源得到充分利用。本实施例中,终端部件204由用户独占,无法进行调 整,而主机部件207资源和外存部件209资源可以进行调整。用户资源动态调度的具体实现步骤包括(1) 系统监测终端部件群201中每个终端部件204 (用户)使用资源(主机部件资源 和外存部件资源)的情况;(2) 如果在时间T(TX))内某台终端部件204使用资源的比例低于某个阀值L1(L1X)), 主机部件群202将分配给该终端部件的资源调整出一部分作为预留资源;(3) 如果在时间T(TX))内某台终端部件204使用资源的比例高于某个阀值L2(L2〉0), 这时若有预留资源,则主机部件群202将部分预留资源分配给该终端部件,以满足该终端 部件对资源的需求;(4) 如果被调整出资源的终端部件资源需求增加,且在其规定级别范围内,则系统首 先从预留资源中调出资源给该终端部件,如果预留资源不够,系统将回收分配出去的部分 预留资源来满足该终端部件的需求;(5) 系统保存有一个"动态资源调度表",内容包括各终端部件204使用部件资源(本 实施例中为主机部件资源和外存部件资源)的比例、调整资源的情况、剩余预留资源情况 和预留资源分配情况等。用户资源动态调度流程如图6所示。 三、临时存储和永久存储用户在向系统管理者申请帐号的同时,需要申请存储服务等级,存储服务包括分配临 时存储空间和永久存储空间,所以用户在申请需要指明是否需要永久存储空间。临时存储 空间将根据用户的等级分配,如等级0为100M、等级1为200M、等级2为400M等等, 为用户在使用系统的过程存储数据,如仿真过程中产生的数据,但用户退出系统后,临时 存储空间将被释放,存储的数据将被删除,如果用户需要长期保存数据则自己通过U盘保 存。如果用户需要在系统中保存数据,则需要申请永久存储空间,存储空间的大小由用户 根据需求指定。显然,临时存储空间的分配容易实现,在用户从终端部件群201登录后,由主机部件 群202根据用户的存储服务等级随机从外存部件群203中分配即可。但永久存储空间不能 随机分配,需要为用户分配固定的存储空间,以便用户登录后即可访问到所保存的数据。临时存储和永久存储实现的具体步骤包括(1) 从外存部件群203中划分一个区域作为用户数据的永久存储区,本实施例指定外 存储器1为永久存储区,外存储器1不能再作为临时存储空间;(2) 用户从终端部件群201登录进入系统;(3) 系统根据用户等级在外存部件群203中为用户分配临时存储空间,并提示临时存 储空间的访问位置;(4) 系统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判断 用户是否是第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户所申请大小的永久存储空间,并提示永久存储空间的访问位置。同时,系统保存有"永久存 储空间分配表"记录永久存储空间与用户的映射关系;(5) 如果用户曾经成功登录过系统,则系统根据"永久存储空间分配表"建立用户与 其永久存储空间的映射关系,并提示永久存储空间的访问位置;(6) 当用户准备退出系统时,系统提示用户把需要长期保存的数据存储到永久存储空 间中,临时存储空间将被释放。临时存储和永久存储实现的流程如图7所示。四、部件的故障管理和安全管理(实现的流程如图8所示)本实施例中,对主机部件群202中的主机部件207实施故障管理和安全管理,具体步 骤包括(1) 设置主机部件207的故障管理参数表和安全管理参数表,其中故障管理参数表包 括CPU利用率、内存利用率等参数,安全管理参数表包括系统文件、注册表等参数。(2) 对每个参数设置多个级别的阀值,对故障管理参数CPU利用率设置的阀值为 Ll=50%, L2=70%, L3=90%;内存利用率设置的阀值为Ll=60%, L2=80%, L3=95%。对 安全管理参数系统文件和注册表设置的阀值均为Ll-O (将被修改),L2=l (已被修改)。(3) 当系统监测到故障管理参数CPU利用率和内存利用率的阀值等于或高于U时产 生初级告警;当阀值等于或高于L2时产生中级告警;当阀值等于或高于L3时产生高级 告警,总共三级告警。当系统监测到安全管理参数系统文件和注册表的阀值-Ll时,将发 出安全参数将被修改的告警信息;当阀值二L2时,将发出安全参数已被修改的告警信息。(4) 告警信息通过显示到系统管理者电脑屏幕上,或发送E-mail,或发送短消息到管 理者手机上等方式通知系统管理者;(5) 系统管理者根据告警级别采取相应的措施解决部件故障和安全问题,以确保系统 的正常可靠运行。(6) 当某一个主机部件207无法开启时,将以最高级别的故障告警信息通知系统管理 者。主机部件无法开启的信息由主机部件群的"监控器"发送给第一台成功开启的主机部 件。(7) 将所有故障告警和安全告警分别记录到主机部件群202的故障日志文件和安全曰 志文件中,以备査询。
权利要求
1、多部件自组织软连接集群计算机智能资源管理方法,其特征在于所述集群计算机的每个部件群设有一个“监控器”,“监控器”实现在接收到“组合”命令后触发一个部件开启,部件的自动开启通过如下步骤实现(1)“监控器”处于激活状态;(2)“监控器”监测到“组合”命令中对本部件群有资源需求;(3)“监控器”触发一个部件开启;(4)如果被选择的部件在时间T内无法开启,则重复步骤(3),选择触发另一个部件开启,所述T>0;(5)开启的部件为集群计算机系统提供服务;(6)有部件成功开启后,“监控器”进入非激活状态;(7)集群计算机监控部件资源使用情况;(8)如果部件群提供的资源已不能满足集群计算机系统的需求时,将增加一个部件开启,直到部件群的资源满足集群计算机系统的需求。
2、 根据权利要求l所述的多部件自组织软连接集群计算机智能资源管理方法,其特征 在于还通过如下步骤实现部件的自动关闭(2.1) 集群计算机监控部件资源的使用情况;(2.2) 当集群计算机检测到由m个部件所提供给系统的资源可由m-l个部件来提供时, 转入步骤(2.3),所述Km《M, M为部件的总个数;(2.3) 集群计算机从所述m个部件中选择一个;将由该个部件提供的服务切换到由其 余m-l个部件提供;(2.4) 步骤(2.3)所选择的部件空闲后自动关闭;(2.5) 重复步骤(2.1) - (2.4);(2.6) 直至最后一个部件关闭;(2.7) 将"监控器"置为激活状态。
3、 根据权利要求2所述的多部件自组织软连接集群计算机智能资源管理方法,其特征 在于还包括对用户进行分级,为用户分配登录帐号、运算服务等级和存储服务等级,并通 过所述步骤(2.1)监控部件资源的使用情况,同时对分配给用户的资源进行动态调度,监 控和调度过程如下(3.1)如果在时间T内某个用户使用部件资源的比例低于某个阀值L1,集群计算机系统将分配给该用户的资源调整出一部分作为预留资源,所述TX), L1>0;(3.2) 如果在时间T内某个用户使用部件资源的比例高于某个阔值L2,这时若有预留 资源,则系统将部分预留资源分配给该用户,以满足该用户对资源需求,所述1>0, L2>0;(3.3) 如果被调整出资源的用户资源需求增加,且增加后该用户使用的总资源不超出 其被允许使用的最大资源的范围,则集群计算机系统首先从预留资源中调配资源给该用户, 如果预留资源不够,集群计算机系统将回收分配出去的部分预留资源以满足该用户的需求;(3.4) 集群计算机系统保存着一个"动态资源调度列表",内容包括各用户使用部件资 源的比例、调整资源的情况、剩余预留资源情况和预留资源分配情况等。
4、 根据权利要求3所述的多部件自组织软连接集群计算机智能资源管理方法,其特征 在于还包括对存储资源的管理,系统从存储类部件群中分出一部分存储资源作为永久存储 区,另一部分作为临时存储区,所述对存储资源的管理包括如下步骤-(4.1) 用户登录到系统后,系统根据用户的存储服务等级在存储类部件群中为用户分 配临时存储空间,并提示临时存储空间的访问位置;(4.2) 系统判断用户是否申请了永久存储空间,如果用户申请了永久存储空间,则判 断用户是否是第一次登录进入系统,如果是第一次,则系统在永久存储区为用户分配用户 所申请大小的永久存储空间,并提示永久存储空间的访问位置;(4.3) 系统保存用于记录永久存储空间与用户的映射关系的"永久存储空间分配表";(4.4) 如果用户曾经成功登录过系统,则系统根据"永久存储空间分配表"建立用户 与其永久存储空间的映射关系,并提示永久存储空间的访问位置;(4.5) 当用户准备退出系统时,系统将提示用户把需要长期保存的数据存储到永久存 储空间中,临时存储空间将被释放。
5、 根据权利要求4所述的多部件自组织软连接集群计算机智能资源管理方法,其特征 在于还包括对系统中部件群中部件的故障管理和安全管理-首先针对故障管理和安全管理分别设置一个关键参数表,参数表中的参数反映部件的 运行状态和安全状态,每个参数都有对应的多个阈值,每个阈值对应不同的安全级别;系统监测某个部件当前的参数,判断该参数所处的阈值范围,产生对应级别的告警信 息,并将告警信息通知系统管理者,由系统管理者根据告警级别采取相应的措施以确保部 件的正常运行和安全;当系统监测到某一个部件无法开启时,将以最高级别的故障告警信息通知系统管理者;将所有故障告警和安全告警分别记录到故障日志文件和安全日志文件中,以备查询。 6、根据权利要求5所述的多部件自组织软连接集群计算机智能资源管理方法,其特征 在于集群计算机系统将告警信息显示到系统管理者的电脑屏幕上或通过Internet发送E-mail给系统管理者或通过短消息的方式将告警信息发送到管理者的手机上。
全文摘要
本发明公开了一种多部件自组织软连接集群计算机智能资源管理方法,该方法根据用户对资源的需求动态提供部件资源,即随着用户数量的增加逐步增加部件资源,而随着用户数量的减少逐步减少部件资源,实现部件的自动开启和自动关闭;通过监控部件资源的使用情况,实现部件群中部件资源的动态调度,同时实施部件的故障管理和安全管理,监测和维护部件资源的可靠运行。本发明还对系统存储资源进行划分处理,满足不同用户数据的临时与永久存储要求。本发明能提高集群计算机的部件资源利用率、优化资源配置,从而进一步降低投资成本和运行维护管理成本,并提高系统的可靠性。
文档编号G06F15/16GK101271444SQ200810027758
公开日2008年9月24日 申请日期2008年4月29日 优先权日2008年4月29日
发明者刘桂开, 军 张, 岗 韦 申请人:华南理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1