台式计算机刀片故障识别系统和方法

文档序号:6121256阅读:234来源:国知局
专利名称:台式计算机刀片故障识别系统和方法
技术领域
本发明涉及台式刀片计算机系统,并且特别地涉及一种用于识别并隔 离在系统内发生的故障的台式计算机刀片系统和方法。
背景技术
通过服务器刀片技术来固定硬件和服务器应用位置的逐渐普及已经导 致台式刀片系统的发展。与将服务器固定在服务器刀片系统中不一样,台 式刀片系统故意将用户与"台式"处理单元分开。例如,典型的台式刀片 系统在计算机房间或区域中包括一个或多个机架,每个机架都具有一个或
多个安装于其中的"刀片"也即"刀片中心(bladecenter)"。刀片中心 中的每个刀片都是被分派(allocate)给用户并提供相同功能的处理单元, 如同该处理单元就位于用户的桌子上。在用户的桌子处向用户提供小型桌 端(deskside) i殳备,其提供针对显示单元和诸如键盘、鼠标和USB端口 之类的接口设备的接口 。桌端设备通常通过使用公知的组网技术诸如以太 网来硬连线到刀片中心或耦合到刀片中心。
使用以太网和因特网协议("IP")作为例子,视频和键盘/鼠标信息 经由路由器/交换机从桌端单元穿过IP网络行进到刀片中心中的台式处理 器。将这些设备经由IP网络并在距离上分开增加了许多故障点,这些故障 点在台式处理器位于用户位置处并直接连接到外围设备的传统台式计算机 安装中不存在。更特别地,在台式刀片环境中,故障点包括网络、桌端单 元和台式处理器刀片(和/或刀片中心)。结果,如果存在问题则用户无法 容易地帮助进行问题性质的识别并且没有任何与刀片中心进行通信的途 径。
作为上述缺点的结果,当前的台式刀片系统的实现需要对桌端单元进 行耗时和昂贵的访问以识别并校正问题。而且,在此期间,用户不能使用
他们的计算机,因此影响了生产力。因此,理想的是具有一种可允许系统 自己识别故障问题的源并且采取自主校正动作的台式刀片系统和方法。在 不能釆取自主校正动作的情况下,诸如在需要技术人员来访问例如桌端单 元的非冗余硬件的故障时可能出现的那样,理想的是具有一种隔离故障的 系统和方法。

发明内容
在第一方面,本发明提供了一种用于对耦合到计算机网络的计算机网
络设备中的故障进行远程地隔离的系统,该系统包括多个耦合到该计算 机网络的第一计算机单元,多个第一计算机单元位于计算机网络的用户端; 以及多个耦合到该计算机网络的第二计算机单元,多个第二计算机单元位 于网络的服务提供商端,多个第二计算机单元中的一个被指定向多个第一 计算机单元中的一个提供计算服务;其中经历与它的所被指定的第二计算 机单元进行故障通信的多个第一计算机单元中的一个使用多个第 一计算机 单元中的另 一个作为代理计算机单元以远程地隔离故障。
该系统可以进一步包括刀片中心,其中多个第 一计算机单元是在台式 刀片系统中的桌端单元而多个第二计算机单元是被包括为刀片中心的 一部 分的台式刀片。
优选地,经历与它的所被指定的台式刀片进行故障通信的桌端单元指 示刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试,如果 分配给经历故障的桌端单元的台式刀片通过了诊断测试,则刀片中心重启 分配给经历故障的桌端单元的台式刀片,如果分配给经历故障的桌端单元 的台式刀片诊断测试失败,则刀片中心分配另 一个台式刀片给经历故障的 桌端单元。
优选地,刀片中心指示代理桌端单元将包传输给经历故障的桌端单元, 该包包括指示是否已经重启了原先所分配的台式刀片或者是否已经分配了 另一个台式刀片的数据。
优选地,代理桌端单元未从经历故障的桌端单元接收到确认数据包被 收到的响应,代理桌端单元对经历故障的桌端单元执什珍断测试以进一步
隔离故障。
优选地,如果经历故障的桌端单元通过了诊断测试,则确定通信网 络在经历故障的桌端单元与刀片中心之间的一点处已经发生故障;报告故 障;并且经历故障的桌端单元使用另 一个桌端单元来与分配给经历故障的 桌端单元的台式刀片进行通信;以及如果经历故障的桌端单元诊断测试失 败,则确定经历故障的桌端单元有故障并且报告故障。
优选地,经历与它的所指定的台式刀片的故障通信的桌端单元使用 UDP协议和注册类广播协议中的一种来与代理桌端单元进行通信以指示 刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试。
在第二方面,提供了 一种用于对耦合到计算机网络的计算机网络设备 中的故障进行远程地隔离的方法,该计算机网络设备包括多个耦合到该 计算机网络的第 一计算机单元,多个第 一计算机单元位于计算机网络的用 户端;以及多个耦合到该计算机网络的第二计算机单元,多个第二计算机 单元位于该网络的服务提供商端,多个第二计算机单元中的一个被指定向
多个第一计算机单元中的一个提供计算服务;该方法包括确定多个第一 计算机单元中的一个正经历着与它的所被指定的第二计算机单元的故障通
信;以及使用多个第一计算机单元中的另 一个作为代理计算机单元以远程 地隔离故障。
优选地,多个第一计算机单元是台式刀片系统中的桌端单元而多个第 二计算机单元是被包括为刀片中心的一部分的台式刀片。
优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来 对故障进行远程地隔离包括指示刀片中心对分配给经历故障的桌端单元 的台式刀片进行i貪断测试,如果分配给经历故障的桌端单元的台式刀片通 过了诊断测试则重启分配给经历故障的桌端单元的台式刀片;并且如果分 配给经历故障的桌端单元的台式刀片诊断测试失败则将另 一个台式刀片分 配给经历故障的桌端单元。
优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来 对故障进行远程地隔离进一步包括指示代理桌端单元将包传输给经历故 障的桌端单元,该包包括指示是否已经重启了原先所分配的台式刀片或者
是否已经分配了另 一个台式刀片的数据。
优选地,使用多个第一计算机单元中的另一个作为代理计算机单元来
对故障进行远程地隔离进一步包括如果代理桌端单元未从经历故障的桌 端单元接收到确认数据包被收到的响应,则对经历故障的桌端单元执行诊 断测试以进一步隔离故障。
优选地,如果经历故障的桌端单元通过了诊断测试,则使用多个第一 计算机单元中的另 一个作为代理计算机单元来对故障进行远程地隔离进一
步包括确定通信网络在经历故障的桌端单元与刀片中心之间的一点处已 经发生故障;报告故障;并让经历故障的桌端单元使用另一个桌端单元来 与分配给经历故障的桌端单元的台式刀片进行通信;并且其中,如果经历 故障的桌端单元诊断测试失败,则用多个第一计算机单元中的另 一个作为 代理计算机单元来对故障进行远程地隔离进一步包括确定经历故障的桌 端有故障;并"^艮告故障。
优选地,经历与它的所被指定的台式刀片的故障通信的桌端单元使用 UDP协议和注册类广播协议中的一个来与代理桌端单元进行通信以指示 刀片中心对分配给经历故障的桌端单元的台式刀片进行诊断测试。
在第三个方面,提供了一种计算机程序,包括计算机程序代码以在被 加载进计算机系统中并在其上被执行时使得所述计算机执行根据第二方面 的方法的步骤。
可以以机器可读存储设备的形式来提供计算机程序代码,所述机器可 读存储设备已在其上存储了用于对耦合到计算机网络的计算机网络i殳备中 的故障进行远程地隔离的计算机程序,该计算机网络设备包括多个耦合 到计算机网络的第 一计算机单元,多个第 一计算机单元位于计算机网络的 用户端;以及多个耦合到计算机网络的第二计算机单元,多个第二计算机 单元位于网络的服务提供商端,多个第二计算机单元中的一个被指定向多 个第一计算机单元中的一个提供计算服务;计算机程序包括指令集,当其 被机器执行时使得机器执行包括以下内容的方法确定多个第一计算机单 元中的一个正经历着与它的所被指定的第二计算机单元的故障通信;以及 使用多个第一计算机单元中的另 一个作为代理计算机单元以远程地隔离故 障。
多个第 一计算机单元是台式刀片系统中的桌端单元而该多个第二计算 机单元可以是被包括为刀片中心的一部分的台式刀片。
使用多个第一计算机单元中的另 一个作为代理计算机单元来对故障进
行远程地隔离可以包括指示刀片中心对分配给经历故障的桌端单元的台 式刀片进行诊断测试,如果分配给经历故障的桌端单元的台式刀片通过了 诊断测试则重启分配给经历故障的桌端单元的台式刀片;并且如果分配给 经历故障的桌端单元的台式刀片诊断测试失败则将另 一个台式刀片分配给 经历故障的桌端单元。
使用多个第一计算机单元中的另 一个作为代理计算机单元来对故障进 行远程地隔离可进一步包括指示代理桌端单元将包传输给经历故障的桌 端单元,该包包括指示是否已经重启了原先所分配的台式刀片或者是否已 经分配了另 一个台式刀片的数据。
使用多个第一计算机单元中的另 一个作为代理计算机单元来对故障进 行远程地隔离可进一步包括如果代理桌端单元未从经历故障的桌端单元 接收到确认数据包被收到的响应,则对经历故障的桌端单元执行诊断测试 以进一步隔离故障。
如果经历故障的桌端单元通过了诊断测试,则使用多个第一计算机单 元中的另 一个作为代理计算机单元来对故障进行远程地隔离可进一步包 括确定通信网络在经历故障的桌端单元与刀片中心之间的一点处已经发 生故障;报告故障;并让经历故障的桌端单元使用另一个桌端单元来与分 配给经历故障的桌端单元的台式刀片进行通信;并且其中,如果经历故障 的桌端单元诊断测试失败,则使用多个第一计算机单元中的另一个作为代 理计算机单元来对故障进行远程地隔离可进一步包括确定经历故障的桌
端有故障;并报告故障。
因此,本发明优选地解决了现有技术的关于认证的缺陷,并且提供一 种新颖且非显而易见的台式刀片系统和方法,用于识别故障并采取自主校 正动作。在这点上,该系统利用UDP协"^义和其它桌端单元的存在来尝试让 经历与其它桌端单元的问题通信的桌端单元从而使那些单元帮助识别和解
决问题。
根据一个方面,本发明优选地提供一种用于对耦合到计算机网络的计
算机网络设备中的故障进行远程地隔离的系统。多个第一计算机单元耦合
到计算机网络。多个第一计算机单元位于计算机网络的用户端。多个第二 计算机单元耦合到计算机网络。多个笫二计算机单元位于网络的服务提供
商端。多个第二计算机单元中的一个被指定向多个第一计算机单元中的一 个提供计算服务。经历与它的所被指定的第二计算机单元进行故障通信的 多个第一计算机单元中的一个使用多个第一计算机单元中的另 一个作为代 理计算机单元以远程地隔离故障。
根据本发明的另 一个方面,本发明优选地提供一种用于对耦合到计算 机网络的计算机网络设备中的故障进行远程地隔离的方法。该计算机网络 设备包括多个耦合到计算机网络的第 一计算机单元,其中多个第 一计算机
单元位于计算机网络的用户端;多个耦合到计算机网络的第二计算机单元, 其中多个第二计算机单元位于网络的服务提供商端,并且多个第二计算机
单元中的一个4皮指定向多个第一计算机单元中的一个提供计算服务。多个 第 一计算机单元中的 一个被确定正经历着与它的所被指定的第二计算机单
元的故障通信。多个第一计算机单元中的另一个被用作代理计算机单元以 远程地隔离故障。
根据本发明的另一个方面,优选地提供了一种已在其上存储了用于对 耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的计算机程 序的机器可读存储设备。该计算机网络设备包括多个耦合到计算机网络的 第一计算机单元,其中多个第一计算机单元位于计算机网络的用户端;以 及多个耦合到计算机网络的第二计算机单元,其中多个第二计算机单元位 于网络的服务提供商端,多个第二计算机单元中的一个被指定向多个第一 计算机单元中的一个提供计算服务。该计算机程序包括指令集,当其被机
器执行时使得机器执行下述方法,其中确定多个第一计算机单元中的一 个正经历着与它的所被指定的第二计算机单元的故障通信。使用多个第一 计算机单元中的另 一个作为代理计算机单元以远程地隔离故障。
本发明的另外的方面将在后续的描述中被部分地阐述,并且将通过描
述部分地显而易见,或者可以通过对本发明的实施被领会到。将借助在权 利要求书中所特别指出的组件和组合来实现并达到本发明的各方面。应当 理解,如所申请的那样,前述的概括描述和后续的详细的描述只是示例性 的和解释性的而不是本发明的限制。


现在,将只是通过举例的方式,参考附图来描述本发明的优选的实施
例,在附图中
图l是根据本发明的原理所构建的示例性的系统的图2是本发明的优选的实施例的整个过程的流程图3是图2中的客户端内容请求准备和传输过程(步骤S210)的流程
图;以及
图4是图3中的告知代理桌端设备并使用代理桌端设备来进一步隔离 故障的过程(步骤S316)的流程图。
具体实施例方式
本发明的优选的实施例有利地提供一种用于以下述方式对台式刀片系 统进行故障隔离和通知方法和系统,所述方式不论在台式刀片系统中存在 多个故障点但仍使台式刀片用户参与问题确定过程的需要最小化。因此, 本发明的优选的实施例提供一种方法和系统,允许用户经由不能连接到台 式刀片的桌端设备自动地通知刀片中心采取自主校正动作。如果自主纠错 是不可能的,则本发明的优选的实施例提供隔离故障的能力,从而促进了 问题的解决。
现在参考附图,其中相同的标号指代相同的单元,在图l中示出了根 据本发明的原理所构建的且一般被标明为"100"的系统。系统100包括经 由通信网络106与刀片中心104进行电子通信的桌端单元102a和102b(在 这里被共同称为桌端单元102)。
刀片中心104包括一个或多个台式刀片108 (其中两个在图1中浮皮示 出为台式刀片108a和108b)和刀片中心控制器110。在多个刀片中心104
可共存并且可被高效地管理和维护的服务提供商设施中,刀片中心104通 常位于通信网络106的服务提供商一端。刀片中心控制器110包括允许刀 片中心104与其它设备进行通信所必须的硬件,以控制刀片中心的功能, 诸如将各个台式刀片108分派给用户,也即将台式刀片108分派给桌端单 元102,以及执行这里所描述的其它功能。刀片中心控制器110可包括中 央处理单元、输/v/输出接口、易失性和非易失性存储器、网,口和现有 技术可公知的任何其它硬件以控制刀片中心104的操作。因此,计算网络 是由图1中所示出的设备所形成。例如,计算网络设备是耦合到通信网络 106的那些i殳备,诸如刀片中心104和/或它的组成部分以及台式单元102。
台式刀片硬件一般是在现有技术中公知的并且通常包括允许台式刀片 108用作台式个人计算机、与刀片中心控制器110进行通信并从刀片中心 控制器IIO接受控制命令、以及执行这里所描述的发明功能所需要的那些 硬件组件。例如,台式刀片108包括中央处理单元、操作系统、易失性和/ 或非易失性存储器以及允许台式刀片108与刀片中心控制器110和桌端单 元102进行通信所需要的接口硬件和软件。值得注意,尽管图l示出从刀 片中心控制器110到通信网络106的单一连接,但是本发明不受这样的限 制。可以预期,可在一个或多个台式刀片108与通信网络106之间进4亍直 接连接。台式刀片108使用刀片中心104的底盘内的通信背板或者使用现 有技术中可公知的任何其它技术来与刀片中心控制器110进行通信。
通信网络106可以是能够从桌端单元102传送信息给刀片中心104的 任何网络。通信网络106的例子包括因特网协议(IP)网络,诸如因特网、 电话网络和电力公司配电网络。然而,出于筒化的缘故,通信网络106在 这里是指在IP网络的上下文中.
桌端单元102可以是能够执行这里所描述的功能的任何桌端设备且位 于处在或靠近用户物理工作空间处的通信网络106的用户端。例如,桌端 单元102包括用于与通信网络106进行通信的硬件以及完成同样功能的合 适的软件。桌端单元102还包括诸如非易失性和易失性存储设备以及支持 外围设备(诸如键盘112、鼠标114和监视器116 )的接口硬件和软件之类 的组件。在操作中,桌端单元102允许用户在由台式刀片108装配的监视
器上观看显示屏幕。用于执行这个功能的技术是公知的。类似地,基于用
户对键盘112和鼠标114的操控向台式刀片108提供数据的技术是公知的。 如下面所详细地描述的那样,桌端单元102优选地包括通信软件,其 允许桌端单元102还与其它桌端单元102进行通信。例如,可将IP协议栈 的用户数据报协议(UDP)的部分用于这种通信。可以认为,本领域的技 术人员可以实现这里所描述的关于使用像UDP这样的协议进行桌端单元 102到桌端单元102的通信的功能。
此外,尽管参考UDP描述下面的例子,但是可以预期,可使用与其它 桌端单元102进行通信并定位其它桌端单元102的其它广播和非广播的方 法。例如,可以用预定义的地址(诸如IP地址)列表来配置桌端单元102, 为的是其它桌端单元102可用于帮助进行故障隔离和解决。经历问题的桌 端单元102可能会试图与它的子网中的其它桌端单元102进行通信。还存 在诸如CISCO组多播协议("CGMP")、通用属性注册协议("GARP") 和GARP多播注册协议("GMRP")之类的其它可以使用的注册类广播 方法。可以针对下述系统定义路由器注册类,所述系统将允许桌端单元102 向路由器发送IP包,接着所述IP包将被发送^个注册了的桌端单元 102。
由桌端单元102和刀片中心104执行故障识别和自主过程118。下面 参考图2 - 4来详细地描述这个过程。
参考图2描述本发明的整个过程。首先,桌端单元102对于正确的网 络配置进行测试(未示出)。这种测试在现有技术中是公知的并且可包括 经由动态主机配置协议("DHCP")以确定是否获得IP、网关和域名系 统("DNS")服务器地址从而桌端单元102可以发现网关、DNS服务器 等等的测试。如果这个基本的启动测试失败则对用户进行警告。假定基本 网络配置是正确的,当用户希望登录时,桌端单元102探测到这个请求并 将包传输给刀片中心104以启动登录(步骤S200)。登录请求是得到所分 配的台式刀片108、获得用于访问的授权等等的请求。在正常操作下,一 旦被授权,用户屏幕被发送给桌端单元102用于在监视器116上进行显示。 根据本发明,桌端单元102包括超时功能,以致如果用户屏幕未被返回,
则假定出了问题并且故障隔离开始(步骤S202)。如果用户屏幕被返回, 则认为台式刀片系统100处于正常操作(步骤S204 ),并且本发明的过程 结束。如果在预定的超时周期之后用户屏幕未被返回,则故障隔离开始。
最初,出现问题的桌端单元102确定是否可以发现另一个桌端单元102 (步骤S206)。在一个实施例下,出现问题的桌端单元102可以广播UDP 包,其中该UDP包具有可被保留用于定位另一个桌端单元102的功能的识 别字段。可以预期,才艮据本发明的原理所构建的所有桌端单元102可以在 IP栈内包括将对这种UDP广播请求进行应答的软件。在UDP包内是该进 行广播的桌端单元102的IP地址。出于简化和易于讨论的缘故,出现问题 的桌端单元102(即,从刀片中心104接收用户屏幕有麻烦的桌端单元102 ) 在这里将被称为桌端单元102a。另一个桌端单元102 (即,充当"代理" 以帮助问题隔离/解决的桌端单元102)在这里将^皮称为桌端单元102b。
如果桌端单元102a在预定的超时周期内不能发现另一个桌端单元,即 不能发现桌端单元102b,则认为网络出现故障(步骤S208)。用户被告 知这个问题并且被指示去联系信息技术部门寻求进一步的帮助。当然,如 果没有返回任何用户屏幕并且桌端单元102a不能定位另一个桌端单元 102,则也可能桌端单元102a已具有重大故障,在这种情况下用户大概也 将相同的问题告知信息技术部门。
如果能够定位另一个桌端单元102,则将这个另外的设备用作"代理" 用于进行故障隔离和问题解决(步骤S210),如上面所注明的那样,桌端 102b服务于这里所描述的这个目的。
参考图3详细地解释使用另一个桌端单元102作为代理用于进行故障 隔离和问题解决的步骤(步骤S210)。如果另一个桌端单元102 (诸如桌 端单元102b)被定位,则桌端单元102a将询问关于桌端单元102b是否能 与刀片中心104进行通信的请求传输给代理桌端单元102b ( S300)。如果 代理桌端单元102b不能与刀片中心104进行通信,则代理桌端单元102b 告知桌端单元102a桌端单元102b不能与刀片中心104进行通信并且通信 网络106 —定是在桌端单元102与刀片中心104之间的某点处出现故障 (S302)。此外,还可以预期,当从代理桌端单元102b接收到它不能与
刀片中心104进行通信的指示时,桌端单元102a可确定通信网络106出现 故障。在上述任一情况下,用户被告知网络中断(outage)。对网络中断 进行警告的消息进行可被生成并被传输给信息技术部门,并且可指示用户 联系信息技术组(因为网络中断可能造成信息技术组不可通过通信网络 106到达)。
如果代理桌端单元102b可与刀片中心104进行通信,则桌端单元102a 指示代理桌端单元102b告知刀片中心104:桌端单元102a不能连接(步 骤S304 )。刀片中心104经由刀片中心控制器110测试分配给桌端单元102a 的台式刀片108(步骤S306)。如果台式刀片中心108是好的(步骤S308), 则刀片中心控制器110重启刀片108 (步骤S310)。如果台式刀片中心108 是不良的,则刀片中心控制器110分配另一个台式刀片108(步骤S312), 并且实现发生故障的刀片动作策略(步骤S314)。
例如,发生故障的刀片动作策略可以包括告知特定的信息技术专家刀 片已经发生故障、自动地^J^生故障的台式刀片108断电、对发生故障的 台式刀片108执行自动化的诊断以;SJ或者创建日志项等等。
无论台式刀片108是好的并被重启过(步骤S310 )还是发生故障的并 是所分配的新刀片,代理桌端单元102b都被用于促进告知处理以进一步帮 助进行隔离和解决(步骤S316),并且过程返回到步骤S200 (见图2), 因此用户可以再次试图登录到台式刀片108。
参考图4详细地描述步骤S316。刀片中心104经由刀片中心控制器110 将指示所采取的行动(例如已经重启分配给桌端单元102a的台式刀片108 或者已经将新的台式刀片108分配给桌端单元102a)的指令包发送给代理 桌端单元102b (步骤S400)。代理桌端单元102b将指令包转发给,皮测试 的桌端单元也即桌端单元102a (步骤S402 )。桌端单元102b等待一预定 的时间用于桌端单元102a对指令的确i人接收做出响应(步骤S404)。如 果接收到确认,则假定桌端单元102a是运作的并且过程结束。在这种情况 下,或者已经通过分配新的台式刀片108解决了问题或者通信网络106存 在问题而信息技术部门已经被告知或用户被指示告知信息技术部门。
如果未从桌端单元102a接收到确认,代理桌端单元102b在尝试进一
步隔离故障中对桌端单元102a执行诊断测试(步骤S406)。像存储器测 试、软件操作、网络通信接口测试等等的实际诊断测试是公知的并且超出 了本发明的范围。如果桌端单元102a通过了诊断测试,则就知道桌端单元 102a是运行的,并且因为被分配给桌端单元102a的原先的刀片102a是运 行的或已经被另一个桌端单元108所替代,所以从桌端单元102a到刀片中 心104的网络连接出现故障(步骤S410)。
代理桌端单元102b将通信网络故障报告给信息技术部门(步骤S412 ) 并且警告桌端单元102a应当将另 一个桌端单元102用作代理以与台式刀片 108进行通信(步骤S414)。在这种情况下,尽管与刀片中心104的通信 由于在桌端单元102a与台式刀片108之间的包将采取的附加路由的原因可 能更慢,但是通信将至少使用户能够执行工作。值得注意,根据步骤S414, 如果桌端单元102a需要桌端单元102用于与台式刀片108进行通信,则可 使用任何其他桌端单元102。换句话说,代理桌端单元不受限于上面关于 步骤S206和S210所描述的、最初对来自桌端单元102a用于帮助的请求 做出响应的桌端单元102b。在确定哪一个桌端单元102将作为用于实际工 作(其与故障隔离相对)的通信代理来帮助桌端单元102a时,可以使用诸 如使用具有最低处理器负载、最快的通信响应时间等等的桌端单元之类的 算法。
如果桌端单元102a未通过诊断测试(步骤S408),则确定桌端单元 102a已经发生故障(步骤S416)。代理桌端单元102b将故障报告给信息 技术部门(步驟S418)。此外,如果桌端单元102a是部分地运行的,则 代理桌端单元102b可警告桌端单元102a留心故障,从而用户也可净皮告知 该故障以及信息技术部门已经被警告。
可以预期,以上面所描述的任何方式告知信息技术组可导致事故单的 自动生成。取决于故障,与事故单相关的信息可以被提供给用户,从而用 户相信问题已经被识别并且信息技术部门已经被告知并将注意该问题。
尽管已经在使用桌端单元102和刀片中心104的计算机的上下文中描 述了本发明的优选的实施例,但是本发明不受限于此。可以预期,可以在 任何环境中实现本发明,所述环境使用靠近用户也即在网络的用户端的单
元,其耦合到集中放置的处理设备的库(bank)或与其进行通信。例如, 可以在有线电视网中实现本发明,用于隔离确定在置顶电缆盒和/或电缆调 制解调器与位于有线公司设施处的有线公司控制器之间的问题。还可在电
话系统中实现本发明,用于确定在位于用户设施处的电话、DSL调制解调 器等等以及位于电话公司设施处的电话公司所控制的装置之间的问题。
可以以硬件、软件或者硬件和软件的组合来实现本发明。可以在一个 计算机系统中以集中方式,或者以不同组件分散在若干互连的计算机系统 的分布方式来完成本发明的方法和系统的实现。任何类型的计算机系统或 者其他适于实现这里所描述的装置适于执行这里所描述的功能。
典型的硬件和软件的组合可以是具有计算机程序的通用计算机系统, 该计算机程序当被加载和执行时控制计算机系统以使它实现这里所描述的 方法。还可在计算机程序产品中嵌入本发明,其包括所有使能这里所描述 的方法的实现的特性,并且当其被加栽进计算机系统中时能够实现这些方 法。
在本上下文中的计算机程序或应用意指指令集以任何语言、代码或符 号的任何表达式,该指令集旨在使得系统具有直接地或在下面二者中的任 何一个或二者同时完成之后执行特定的功能的信息处理能力a)转换到 另一语言、代码或符号;b)以不同的材料形式再现。
权利要求
1.一种用于对耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的系统,所述系统包括多个耦合到所述计算机网络的第一计算机单元,所述多个第一计算机单元位于计算机网络的用户端;以及多个耦合到所述计算机网络的第二计算机单元,所述多个第二计算机单元位于网络的服务提供商端,所述多个第二计算机单元中的一个被指定向所述多个第一计算机单元中的一个提供计算服务;其中经历与它的所被指定的第二计算机单元进行故障通信的所述多个第一计算机单元中的一个使用所述多个第一计算机单元中的另一个作为代理计算机单元以远程地隔离所述故障。
2. 根据权利要求l所述的系统,进一步包括刀片中心,其中所述多个 第一计算机单元是在台式刀片系统中的桌端单元,而所述多个笫二计算机 单元是净皮包括为刀片中心的一部分的台式刀片。
3. 根据权利要求2所述的系统,其中经历与它的所被指定的台式刀片 进行故障通信的桌端单元指示所述刀片中心对分配给所述经历故障的桌端 单元的台式刀片进行诊断测试,如果分配给所述经历故障的桌端单元的台 式刀片通过了所述"^断测试,则所述刀片中心重启所述分配给所述经历故 障的桌端单元的台式刀片,如果分配给所述经历故障的桌端单元的台式刀 片诊断测试失败,则所述刀片中心分配另 一个台式刀片给所述经历故障的 桌端单元。
4. 根据权利要求3所述的系统,其中所述刀片中心指示所述代理桌端 单元将包传输给所述经历故障的桌端单元,所述包包括指示是否已经重启 了原先所分配的台式刀片或者是否已经分配了另 一个台式刀片的数据。
5. —种用于对耦合到计算机网络的计算机网络设备中的故障进行远程 地隔离的方法,所述计算机网络设备包括多个耦合到所述计算机网络的 第一计算机单元,所述多个第一计算机单元位于计算机网络的用户端;以 及多个耦合到所述计算机网络的第二计算机单元,所述多个第二计算机单 元位于网络的服务提供商端,所述多个第二计算机单元中的一个被指定向所述多个第一计算机单元中的一个提供计算服务;所述方法包括确定所迷多个第一计算机单元中的一个正经历着与它的所被指定的第二计算机单元的故障通信;以及使用所述多个第一计算机单元中的另 一个作为代理计算机单元以远程 地隔离所述故障。
6. 根据权利要求5所述的方法,其中所述多个第一计算机单元是台式 刀片系统中的桌端单元,而所述多个第二计算机单元是被包括为刀片中心 的一部分的台式刀片。
7. 根据权利要求6所述的方法,其中使用所述多个第一计算机单元中 的另一个作为代理计算机单元来对故障进行远程地隔离包括指示所述刀片中心对分配给所述经历故障的桌端单元的台式刀片进行 诊断测试,如果分配给所述经历故障的桌端单元的台式刀片通过了所述诊断测试则重启分配给所述经历故障的桌端单元的台式刀片;以及如果分配给所述经历故障的桌端单元的台式刀片诊断测试失败则将另 一个台式刀片分配给所述经历故障的桌端单元。
8. 根据权利要求7所述的方法,其中使用所述多个第一计算机单元中的另一个作为代理计算机单元来对故障进行远程地隔离进一步包括指示 所述代理桌端单元将包传输给所述经历故障的桌端单元,所述包包括指示 是否已经重启了原先所分配的台式刀片或者是否已经分配了另 一个台式刀 片的数据。
9. 根据权利要求8所述的方法,其中使用所述多个第一计算机单元中的另一个作为代理计算机单元来对故障进行远程地隔离进一步包括如果 所述代理桌端单元未从所述经历故障的桌端单元接收到确认数据包被收到 的响应,则对所述经历故障的桌端单元执行诊断测试以进一步隔离所述故 障。
10. —种计算机程序,包括计算机程序代码以在其被加载进计算机系 统中并在其上被执行时使得所述计算机执行根据权利要求5到9中的任何 一个所述的方法的步骤。
全文摘要
一种用于对耦合到计算机网络的计算机网络设备中的故障进行远程地隔离的方法和系统。多个第一计算机单元耦合到该计算机网络。该多个第一计算机单元位于计算机网络的用户端。多个第二计算机单元耦合到该计算机网络。该多个第二计算机单元位于网络的服务提供商端。该多个第二计算机单元中的一个被指定向该多个第一计算机单元中的一个提供计算服务。经历与它的所被指定的第二计算机单元进行故障通信的该多个第一计算机单元中的一个使用多个第一计算机单元中的另一个作为代理计算机单元以远程地隔离故障。
文档编号G01R31/08GK101107810SQ200680002996
公开日2008年1月16日 申请日期2006年1月12日 优先权日2005年1月27日
发明者D·C·克罗默, H·J·洛克, R·D·瓦尔特曼, R·S·斯普林菲尔德 申请人:国际商业机器公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1