用于显示实时在线模块更换时间的方法与流程

文档序号:19161097发布日期:2019-11-16 01:23阅读:373来源:国知局
用于显示实时在线模块更换时间的方法与流程

相关申请的交叉引用

本申请要求保护由gupta等人2017年3月31日提交的标题为methodtodisplayreal-timemoduleoirtime的美国临时申请no.62/479,417以及由gupta等人2017年7月7日提交的标题为methodtodisplayreal-timemoduleoirtime的美国申请no.15/643,661的权益,其公开内容通过引用并入本文。

本公开一般地涉及计算机网络,并且更具体地,本公开涉及一种用于显示实时模块在线插入和移除(oir)时间的方法。



背景技术:

在模块化配置系统中,在线插入和移除(oir)是在不中断整个系统的性能的情况下更换有故障的设备模块的过程。在此过程期间,系统继续运行,并且有故障的设备模块(例如,线卡、电源、风扇托盘等)被用新的设备模块更换。在大多数情况下,在正在更换有故障的设备模块的同时,系统通过因缺少的设备模块产生的开口而被暴露于外部环境。这可使系统气流不平衡,因为此真空空间将提供最小阻力路径并且气流会绕过此空间,从而使其他区域和/或组件无法得到足够的气流用于冷却。

在要更换的所有设备模块当中,风扇托盘oir通常是最关键的。值得注意的是,如果在系统中没有冗余的风扇托盘,则系统将没有任何气流用于冷却,并且由于过热而可能存在系统可靠性问题。因此,应该尽可能快地完成扇形托盘oir以避免系统故障。用于完成oir的时间限制将取决于整体系统配置和业务模式、系统环境状况(温度、高度等)以及系统的热行为。

当前,系统被设计为基于用于设备模块更换的估计持续时间来提供足够的oir时间。这样的时间限制常常被公布在硬件安装指南中。然而,公布的时间仅对特定环境温度下的特定系统配置有效。系统配置方面的任何变化(诸如由于升级而导致)常常使所公布的时间限制无效。此外,许多设备已从1990年代的23℃的环境温度转移到现今的30℃环境温度作为节省大量电费的手段。

附图说明

通过结合附图参考以下描述,可以更好地理解本文的实施方式,在附图中相似的附图标记指示相同或功能类似的元件,其中:

图1例示了风扇托盘oir的示例时间-温度曲线图;

图2a-2b例示了不同设备的热行为的示例时间-温度曲线图;

图3例示了用于显示oir时间的led的示例;

图4a-4c例示了用于显示oir时间的led的另外的示例;

图5例示了用于显示oir时间的液晶传感器的示例;以及

图6例示了用于显示实时oir时间的示例简化程序。

具体实施方式

概要

在独立权利要求中陈述本发明的各方面,并且在从属权利要求中陈述优选的特征。可以将一个方面的特征单独或者与其他方面相结合地应用于每个方面。

根据本公开的一个或多个实施例,模块化联网机架中的设备确定用于包含在所述模块化联网机架内的多个设备模块中的特定设备模块的在线插入和移除(oir)时间。设备基于特定设备模块的oir时间来确定多个设备模块的oir时间,并且提供多个设备模块的oir时间的指示以用于显示给用户。

还描述了用于实现本文描述的方法的系统和装置,包括网络节点、计算机程序、计算机程序产品、计算机可读介质以及编码在有形介质上以用于实现方法的逻辑。

描述

如上面所指出的,在线插入和移除(oir)是可在不影响系统性能的情况下更换有故障的或过时的设备模块(例如,在联网机架/机箱内)的过程。此过程在某些方面类似于热插拔。然而,热插拔主要是硬件功能并且通常不需要软件命令,然而oir通常是软件特征。值得注意的是,既在移除设备模块之前且在安装更换设备模块之后,都需要在oir期间执行特殊的软件指令。在此过程期间,应该使用相同的设备模块来更换原始的设备模块。另外,当在设备(例如,路由器)内的多个设备模块或组件上执行oir时,通常应该一次在一个设备模块上执行操作。

通常,风扇托盘oir(例如,有故障的或过时的风扇托盘的更换)是应该被谨慎地对待的特殊情形。例如,通常系统可以被设计为在所有风扇在风扇托盘中工作的情况下操作。在一些情况下,系统可以仍然能够在单个风扇故障的情况下操作,但是该风扇托盘应该尽快被新的风扇托盘更换。另外,正在开发提供更好的冷却性能的新的高性能风扇,并且可以期望通过执行oir来用新的高性能风扇托盘升级现有的风扇托盘。

然而,如果风扇托盘oir在规定时间内未完成,则整个系统可能关闭以避免设备模块或组件的过热和损坏。因此,在风扇托盘oir期间通常需要特殊的软件(sw)监视以确保避免组件由于高温而导致的灾难性故障。换句话说,风扇托盘oir需要在可能至少取决于工作温度的规定时间限制内完成。一旦风扇托盘被从系统中移除,这就将提供达到故障限制的时间的估计。

图1中所示的时间-温度曲线图例示了风扇托盘oir时间的示例图由。如所示,包括风扇托盘的系统(例如,模块化联网机架)可能正在温度110下工作,该温度110在设备更换之前的时间段期间可以是相对恒定的。在时间115处启动的风扇托盘oir期间,可以移除风扇托盘,从而改变系统内的状况。在没有(或显著减少的)气流的情况下,系统的温度会预计上升,如斜率120所示。如果温度达到最大允许温度130,则可能发生系统故障。因此,重要的是知道故障时间限制140并监视oir处理时间,以确信不超过时间限制。

用于显示实时模块oir时间的方法

本文描述的技术引入若干智能方法来实时地确定设备模块oir时间,并且进一步地,提供所确定的oir的可见指示(例如,显示),从而向用户(例如,启动oir的操作员)报警可用于设备模块oir处理的时间量。以这种方式,用户能够避免由于系统关闭(例如,通过风扇托盘oir期间的系统过热或热失控引起)而导致的任何网络故障时间。提供了各种方法来确定包含在模块化联网机架内的多个设备模块的设备模块oir并且将oir时间信息呈现给用户。在一些实施例中,智能软件处理用于针对风扇托盘oir监视实时设备温度和/或系统气流。在本文中还引入了若干机制以利用结果得到的信息来显示实时oir时间限制。

具体地,根据如在下面详细地描述的本公开的一个或多个实施例,模块化联网机架中的设备确定包含在模块化联网机架内的多个设备模块中的特定设备模块的在线插入和移除(oir)时间。设备基于特定设备模块的oir时间来确定多个设备模块的oir时间,并且提供多个设备模块的oir时间的指示以显示给用户。

说明性地,可以例如根据oir时间处理通过硬件、软件和/或固件来执行本文描述的技术,oir时间处理可以包括由处理器执行的计算机可执行指令,以执行与本文描述的技术有关的功能。

在操作上,图2a和图2b分别例示了两个不同的设备模块“设备-a”和“设备-b”在风扇托盘oir期间的热行为,两个不同的设备模块可以被认为是特定模块化联网机架系统的热最差设备模块(例如,对风扇托盘移除最敏感的设备模块)。假定系统在稳定状态下工作,设备-a和设备-b将各自具有它们自己的工作温度210a和210b,例如取决于设备的类型及其在模块化联网机架中的物理位置。这些温度以及其他相关状况(气流速率、功率水平等)可以通过系统中的控制设备来监控。两个设备模块还将预期具有不同的功率耗散性质以及最大允许温度230a和230b的不同值和在无气流状况下的不同加热特性(如通过斜率220a和220b所例示)。这些可以基于设备类型获知或者由系统中的控制设备确定。

风扇托盘一被从包含设备-a和设备-b的模块化联网机架中移除,这些设备就将开始按照其特性曲线加热。为了避免温度达到最大限制(例如,最大允许设备温度230a和230b),如果在系统中未及时插回风扇托盘,则系统可以被配置为在温度低于这些限制时断电。如果由系统启动关闭直到完全断电为止花费的时间是已知的(例如,关机时间245a和245b),则可识别设备的安全工作点(例如温度235a和235b)。此安全工作点确定特定设备oir时间限制250a和250b,从而提供足够的时间来启动系统关闭而不损坏设备。

在确定每个特定设备模块oir时间时,还可以确定模块化联网机架中的多个设备模块的oir时间。特别地,可以比较各种设备模块的oir时间。例如,任何设备的最差可用时间(例如,最低设备oir时间)可以定义用于系统的oir时间限制。例如,如图2a和图2b所示,设备-b与设备-a相比有较短的时间限制。因此,系统oir时间限制可以由设备b限定。可替代地,还可以考虑每个设备模块对温度增加的重要性或敏感性。如果在设备-b的“安全工作点”插回风扇托盘,则系统的温度将开始斜降,并且系统将返回到其正常工作状况。

一旦设备(例如,系统控制器)基于针对所述多个设备模块中的一个或多个单独的设备模块所确定的oir时间来确定机架内的多个设备模块的oir时间,就存在可将这种实时信息提供给用户的若干方式。在一个实施例中,oir时间处理可以将所确定的系统oir时间的指示提供给电子显示器。例如,这样的显示器可以是系统控制台、网络机架/机箱它本身上的lcd显示器等。可替代地,可按照硬件安装指南公布命令行接口(cli)命令,以从运行oir时间确定处理的设备得到实时数据。

在一个实施例中,设备/控制器可以经由闪光模式将针对多个设备模块所确定的oir时间的指示输出到led。led可以被定位在系统中的任何地方,包括例如在机架的内表面上或者在机架内的设备中的一个(例如,系统控制器、控制器卡、风扇托盘等)上。例如,如图3中所示,设备模块300可以包括能够产生可用oir时间的闪光模式或其他可见指示作为选项的led310。为了解释oir时间的led闪光信息,可以在设备300上包括标签320,包括例如闪光颜色和/或持续时间以及对应的系统关闭时间),并且还可以将此信息包括在硬件安装指南中。

如图3所示,所指示的闪光模式可以仅被配置为提供时间范围信息(例如,介于2至3分钟之间)而不是确切的时间限制。有时,对于较高功率密度的系统,可能有必要知道在系统关闭之前可用的确切时间,使得可在规定时间内安全地完成设备模块更换。

因此,在一些实施例中,时间码闪光模式可以用于向用户提供可用于设备模块oir的确切时间的视觉指示(例如,经由一个或多个led)。例如,如图4a和图4b中所示,可以提供分别位于设备模块400a(其可以是风扇托盘,如所示)或400b上的单个led410a和410b,以使用闪光模式和/或颜色表示数字来显示所确定的系统oir时间码信息。另一方面,如图4c中所示,多个led411c、412c和413c可以顺序地或同时地闪光,其中每个单个led代表系统oir时间的数值数字。还可使用不同的led颜色方案(例如,以表示当系统接近关闭时的严重程度)。

各种不同的闪光模式(颜色、频率、持续时间等)可以被用作系统oir时间的指示。特别地,可以使用不同的led颜色来提供总oir时间的数值信息。例如,如果针对联网机架中的多个设备模块所确定的oir时间有3个数字(分钟和秒),则每个数字可以通过单个led(例如,图4a中所示的单个led410a)来表示如下:

-具有1秒间隔的绿色闪光-第一数值数字

-持续2秒的纯绿色-暂停

-具有1秒间隔的绿色闪光-第二数值数字

-持续2秒的纯绿色-暂停

-具有1秒间隔的绿色闪光-第三数值数字

-持续5秒的纯绿色-在开始下一个循环之前暂停

另外,单个led的闪光模式可以还包括不同的led颜色以及变化的闪光间隔以将oir时间显示给用户。例如,为了显示系统oir时间限制的3位数字(以秒为单位),可以通过单个led(例如,图4b中所示的单个led410b)来表示每个数字如下:

-具有2秒间隔的绿色闪光-第一数值数字,

-具有2秒间隔的黄色闪光-第二数值数字,以及

-具有2秒间隔的红色/蓝色闪光-第三数值数字。

多个led可以为显示oir时间码信息提供附加灵活性和清晰性。特别地,如图4c中所示,可以指派每个led(411c、412c和413c)以表示oir时间数值中的数值数字的位置。例如,led411c可以使模式闪光以表示第一数值数字,led412c可以闪光以表示第二数值数字,并且led413c可以闪光以表示第三数值数字。作为具体示例,458秒的时间可以被显示如下:

-第一led-具有2秒间隔的4次闪光(总时间=8秒)

-持续2秒的暂停(总时间=10秒)

-第二led-具有2秒间隔的5次闪光(总时间=20秒)

-持续2秒的暂停(总时间=22秒)

-第三led-具有2秒间隔的8次闪光(总时间=38秒)

-持续2秒的暂停(总时间=40秒)

因此,可以在40秒内向用户显示整个时间码,并且在正常操作中,可以在几秒的间隙之后按需重复此循环。可以相应地调整显示的频率、每个闪光灯之间的间隔以及led的颜色,并且可以针对每个平台考虑其在设备模块oir期间的复杂性(例如,风扇托盘大小、可访问性、led位置等)和设备加热曲线来不同地定制模式。

可用于提供所确定的具有三个数字的oir时间的指示的闪光模式的另一示例可以如下:

-如果oir时间>4分钟,则提供纯绿色

-如果oir时间<4分钟,则提供纯绿色持续1分钟,并且然后

-针对第一数字使绿色闪光一次并且然后使黄色闪光指示第一数字的值所需的次数,

-针对第二数字使绿色闪光一次并且然后使黄色闪光指示第二数字的值所需的次数,

-针对第三数字使绿色闪光一次并且然后使黄色闪光指示第三数字所需的次数,

-持续1分钟的纯绿色,并且在纯led的每1分钟之后重复闪光序列。

另外,纯绿色可以基于模块化联网机架的风扇的状况替代地是绿色或黄色/红色(以指示所有风扇正在工作或者显示风扇故障状况)。

具体示例可以如下:

-如果oir时间>4分钟,则提供纯绿色

-如果oir时间<4分钟,则:

-提供纯led持续3秒钟以表示0,或者

-交替地使led闪光接通持续1秒钟并关闭持续1秒钟以表示期望的数字,在显示下一个数字之前有5秒钟关闭时间

-在整个码被闪光之后返回到纯led。

对于此示例,可以从开始到开始每60秒重复闪光模式。

在一些实施例中,可以基于可用oir时间来使用led的不同颜色。例如,

-<4分钟至>90秒,绿色闪光码

-<90秒至>60秒,琥珀色闪光码

-<60秒,连续地红色闪光码

如上面所指出的,纯绿色led可以基于风扇的状况是绿色或黄色/红色以指示所有风扇正在工作或者存在风扇故障状况。

在一些实施例中,可以提供oir时间的指示以显示给用户设备,诸如经由定制智能电话应用的输出。特别地,可以通过与网络运营中心(noc)连接来提供oir时间以使用实时设备温度的系统日志信息并且显示oir时间限制。例如,通过使用智能电话应用,用户设备还可以通过调整中央办公室/数据中心空调单元或其他环境控制设备来监控和控制环境温度(或者可以连接到可以被配置为调整室温的系统控制器)。因此,可以在oir期间降低环境温度以为模块更换赢得附加时间。还可以使用蓝牙应用,其中蓝牙发送单元可以经由无线连接向用户设备(例如,智能电话或其他手持个人数字助理)提供oir信息以供立即显示。

在一些实施例中,液晶传感器可以用于将oir时间信息指示给用户。通常,液晶传感器使用塑料条中的基于环境温度来改变颜色的热敏(热致变色)液晶。特别地,如图5中所示,设备模块500可以包括标签550,标签550包括液晶温度计560以显示包含设备模块的模块化联网机架周围的环境温度,并且进一步地,以标记所对应的oir时间限制。虽然此方法不提供oir时间作为实时数据而是指示针对不同的工作环境温度针对最坏可能的配置测试的时间限制,但是位于设备模块(诸如风扇托盘)上的标签550将向操作员/用户提供针对完成设备模块更换的可用时间的快速参考。在可以改变系统的热分布(例如,高功率、高气流阻力、设备热参数)的设备模块升级的情况下,也将需要按新标签更新这些时间限制。

图6例示了根据本文描述的一个或多个实施例的用于显示实时模块oir时间的实施例简化程序。例如,非通用的、专门地配置的设备(例如,系统控制器)可以通过执行存储的指令(例如,oir确定和显示处理)来执行程序600。

程序600可以在步骤605处开始并且继续到步骤610,其中如上面更详细地描述的,设备确定模块化联网机架中的多个设备模块中的特定设备模块的oir时间。特定设备模块可以是线卡、结构卡、路由处理器卡、电源或风扇托盘。在一些实施例中,oir时间是从模块化联网机架中移除风扇托盘所需的时间。设备可以基于特定设备的工作温度、特定设备模块处的气流速率、特定设备模块的功率耗散速率、特定设备模块的最大允许温度、特定设备模块在无气流状况下的加热特性或其组合来确定oir时间。

在步骤615中,如上面更详细地描述的,设备基于所确定的特定设备模块的oir时间来确定多个设备模块的oir时间。在一些实施例中,设备可以比较若干特定设备模块的oir并且根据比较来确定多个设备模块的最小oir时间。其他因素可以包括设备敏感性、系统内的重要性、成本和更换的容易性。

在步骤620中,如上面更详细地描述的,设备提供多个设备模块的oir时间的指示以显示给用户。指示可以是电子显示器、一个或多个led或热致变色条。在一些实施例中,一种或多种led闪光模式可以用于显示所确定的oir时间。闪光模式可以包括闪光计数/频率、闪光间隔和/或持续时间以及闪光颜色,这些可以变化并被顺序地或相结合地使用以指示oir时间值。另外,可以将oir时间的指示提供给用户设备,诸如智能电话,其在一些实施例中可以连接到诸如空调单元这样的房间系统设备以特别地针对风扇托盘oir修改工作温度并使温度增加变慢。程序600然后在步骤625处结束。

应该注意的是,虽然程序600内的某些步骤如上所述可以是可选的,但是图6中所示的步骤仅仅是用于例示的示例,并且可以视需要包括或者排除某些其他步骤。进一步地,虽然示出了步骤的特定排序,但是此排序仅仅是说明性的,并且在不脱离本文的实施方式的范围的情况下,可以利用步骤的任何适合的布置。

因此,本文描述的技术提供包含多个设备模块的网络机架的oir时间的容易可见的指示,从而使得用户能够容易地确定更换有故障的或过时的设备模块特别是风扇托盘需要多少时间。特别地,描述了被配置为估计设备模块温度的实时热状态和可用的设备模块oir时间限制并且提供方便的用户界面来向用户显示oir信息的智能软件处理。以这种方式,改进了产品可靠性并且可避免由于过热或热失控而导致的不希望的系统关闭。这些技术与系统配置和工作环境状况无关,因为它使用实时设备温度信息。

虽然已经示出并描述了提供用于指示模块在线插入和移除(oir)时间的说明性实施例,但是应当理解的是,可以在本文的实施例的精神和范围内做出各种其他改变和修改。例如,虽然示例性实施例涉及风扇托盘oir,但是本文描述的技术还可以被用于其他设备模块(诸如电源)的移除/更换,其中将在其他实施例中考虑工作功率水平和由设备模块对功率的耗散(达到最小功率的时间)。

前面的描述针对具体实施例。然而,将显而易见的是,可以对所描述的实施例做出其他改变和修改,同时获得其优点中的一些或全部。例如,明确地设想了可将本文描述的组件和/或元件实现为软件,软件被存储在具有在计算机、硬件、固件或其组合上执行的程序指令的有形(非暂时性)计算机可读介质(例如,磁盘/cd/ram/eeprom/等)上。因此本描述将作为示例来进行,而不应以其他方式限制本文的实施例的范围。因此,所附权利要求的目的是涵盖如落入本文的实施例的真实精神和范围内的所有这样的变化和修改。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1