在电子网络上表征服务水平的制作方法

文档序号:8476902阅读:479来源:国知局
在电子网络上表征服务水平的制作方法
【专利说明】在电子网络上表征服务水平
[0001] 背景
[0002] 应用通常被部署在数据中心内,其中应用在一个或多个服务器上执行。数据中心 通常具有包括多个不同网络设备(诸如各种类型的路由器、交换机等)的网络。任意单个 网络设备的故障有时能导致应用从数据中心外部不可用。由此,从终端用户的观点来看,应 用的可用性不仅仅依赖于应用本身是否正常运行,还依赖于将应用连接到终端用户的居间 网络设备的正常运行。
[0003] 为了解决这个问题,网络设备可被部署在冗余对或更大的分组中。冗余网络设备 和/或链接可提供一些对单个设备故障或链接故障的保全措施,因为当给定分组中的单个 设备/链接发生故障时,其他设备有时将继续工作,由此,应用依然可被终端用户获得。由 此,某个应用是否可从数据中心外部获得不仅仅依赖于单个网络设备的正常运行,还依赖 于在冗余分组中的一个或多个设备发生故障时,冗余分组有多有效地处于保持连接。
[0004] 概述
[0005] 以上列出的示例旨在提供快速参考以帮助读者,并且不旨在限定此处所描述的概 念的范围。
[0006] 本文档涉及处理电子数据。一个实现表现为能包括从一个或多个事件日志中获得 事件的技术。事件可反映一个或多个数据中心中的一个或多个网络设备发生的故障。该技 术还可包括使用一个或多个准则来过滤事件以获得事件子集。该技术还可包括确定一应用 的一个或多个网络戳记,使用该事件子集来表征一个或多个网络戳记中各个网络设备的一 个或多个服务水平,以及基于一个或多个网络戳记中的各个网络设备的服务水平来表征该 应用的服务水平。
[0007] 另一实现表现为包括指令的一个或多个计算机可读存储设备,所述指令在被一个 或多个处理设备执行时使得所述一个或多个处理设备执行动作。动作可包括从一个或多个 事件日志中获得事件。事件可反映一个或多个数据中心中的一个或多个网络设备发生的故 障。动作还可包括使用一个或多个准则来过滤事件以获得事件子集并使用该事件子集来表 征网络设备的一个或多个服务水平。动作还可包括确定服务水平的一个或多个相关并基于 该一个或多个相关来标识一个或多个有风险的设备。
[0008] 另一实现表现为一系统,该系统可包括事件分析组件和被配置成执行该事件分析 组件的一个或多个处理设备。事件分析组件可被配置成从事件日志获得事件,事件反映网 络上的由一个或多个数据中心中的一个或多个网络设备发生的故障。事件分析组件还可被 配置成基于事件来表征应用或网络设备的服务水平,以及标识用于改变应用或网络设备的 服务水平的一个或多个推荐的潜在网络改变。一个或多个推荐的潜在网络改变可基于与所 推荐的潜在网络改变相关联的预期成本或预期收益中的至少一个来推荐。
【附图说明】
[0009] 附图示出了本专利中传达的概念的实现。示出的实现的特点将参考以下描述并结 合附图来更容易地理解。各个附图中的类似附图标记被用于指示类似的元素。此外,每一 个如图标记的最左边的数字传达其中首次引入该附图标记的附图及相关联的讨论。
[0010] 图1-3和8显示了其中可根据某些实现来采用所提出的概念的示例性数据中心架 构。
[0011] 图4示出其中可采用所提出的概念的示例系统。
[0012] 图5示出根据某些实现可被配置成实现某些概念的示例计算机或计算设备。
[0013] 图6、7和10是用于根据某些实现实现某些概念的流程图。
[0014] 图9和11显示可根据某些实现来相对于某些概念生成的图像用户界面的屏幕截 图。
[0015] 详细描述
[0016] 概览
[0017] 本讨论涉及表征电子网络上的设备或应用的服务水平。出于本文档的目的,术语 "服务水平"包括诸如可靠性、可用性、通信量流/损失等概念。例如,可用性涉及给定应用、 设备或硬件/软件组件在给定时间段上平均运行的时间片段,例如,如按时间基础(诸如按 一年的基础)测量的"运行时间"。可靠性涉及给定应用、设备或硬件组件的故障的可能性, 例如,到下一故障的预期时间。故障涉及当给定应用、设备或组件不如期地执行时的实例。
[0018] 可用性、可靠性以及故障的具体定义可在各参考文献中找到。虽然以下定义不在 本文中被显式地采取,但是以下定义可提供关于术语可用性、可靠性和故障的更清楚的解 释。例如,MIL-STD 721C将可用性定义为一项目处于可操作和可提交状态中的程度的测量。 MIL-STD 721C将可靠性定义为(1)在规定条件下没有故障执行的持续时间或概率或(2) 在规定条件下,一项目将在没有故障的情况下执行其预期功能达指定间隔的概率。故障可 被定义为一项目不能在其指定的性能限定(MIL-STD 721B)内运行或在其中任一项目或任 一项目的一部分没有或不会如先前指定地那样(MIL-STD 721C)执行的事件或不可操作状 ??τ O
[0019] 一般而言,所揭示的实现可表征个别网络设备(诸如接入路由器、聚集交换机等) 的服务水平。附加地,所揭示的实现可表征使用一个或多个网络设备的应用的服务水平。应 用的服务水平可以是应用所使用的网络设备的服务水平的函数。此外,网络设备中的一些 可被部署在多个设备的冗余分组中。由此,应用的服务水平可以是冗余分组在确保应用通 信量能在没有受到故障的显著影响的情况下被例如沿着替换设备/链接的替换路径路由 时如何有效的函数。术语"网络服务水平"独立于应用代码和/或执行应用的计算设备的 故障来描述该应用的服务水平,并涉及应用依赖于用于连接性的各个网络设备和链接的服 务水平。例如,网络服务水平可受到硬件故障(设备或链接故障)、软件故障(协议、设备操 作系统、固件等)以及配置故障的影响。术语"网络可用性"类似地独立于应用代码故障和 执行应用的计算设备的故障。
[0020] 本技术的一些可充分利用数据中心事件日志,其可包括被各个设备或应用记录的 事件。日志中的事件可包括指示数据中心中一个或多个设备的故障的错误报告。事件日志 可被处理来评估数据中心中各个设备的服务水平。在一些实现中,事件日志可被过滤,例 如,通过过滤出重复事件、合并同时事件等,来提供更加紧凑的数据集以供评估服务水平。
[0021] 数据中心示例
[0022] 图1示出数据中心网络架构100的示例。架构可显现在被连接到网络104(诸如 因特网)的数据中心102中。在这种情况下,架构100包括各设备或组件,诸如一个或多个 核心路由器106、一个或多个接入路由器108、一个或多个聚集交换机110、一个或多个架顶 式(ToR)交换机 112 (1)和 112 (2)以及一个或多个机架 114 (I)、114 (2)、114 (3)和 114 (4)。 机架114中的每一个都能包括一个或多个主存应用116的服务器设备。注意,图1中各个 设备的不同实例由括号来区别,例如,112(1)指代与112(2)不同的ToR交换机。当统一地 参照多个设备时,括号将不被使用,例如ToR 112可指代ToR 112(1)或ToR 112(2)或它们 两者。还注意,架构100可包括各种不在图1中显示的设备或组件,例如,各种入侵检测和 防护系统、虚拟专用网络(VPN)、防火墙、负载平衡器等。
[0023] 从逻辑观点来看,架构100可被组织到包括核心层118、L3聚集层120和L2聚集 层122的分层结构中。该逻辑组织可基于层-2 (例如,干线化、VLAN等)和层-3 (例如,路 由)职责的功能分隔。在图1中,只显示了一个接入路由器108和一个聚集交换机110,但是 具有多个接入路由器和多个聚集交换机的示例也遵循。在具有多个接入路由器的实现中, 多个接入路由器可被部署在冗余性分组中以在L3聚集层120处提供冗余性。类似地,在具 有多个聚集交换机的实现中,多个聚集交换机可被部署在冗余性分组中以在L2聚集层122 处提供冗余性。一般而言,在冗余性分组中,该分组包括多个成员并且各个成员能在冗余性 分组的其他成员发生故障时执行交换/路由功能。还注意,图1示出了冗余配置中的核心 路由器106。尽管以下示例使用设备的冗余对来解释某些发明概念,但是设备可被冗余地以 2个或更多个来配置在分组中。由此,本文中使用的术语"分组"包括设备对以及更大的分 组两者。
[0024] 一般而言,冗余性分组可用各种配置来部署,包括"活跃一待用"配置和"活跃一活 跃"配置。在活跃一待用配置中,一个或多个设备是活跃的(例如,携带通信量),而一个或 多个其他设备是待用的(例如,不携带通信量)并且可被激活来替代发生故障的设备。在 活跃一活跃配置中,分组中的各设备是活跃的,并且在分组中的一设备发生故障时,本应该 由该发生故障的设备携带的通信量能由分组中的其余成员来携带。
[0025] ToR 112(也称为主交换机)将由机架114主存的服务器经由图1中连接线表示的 数据中心网络连接到架构100的其余部分。这些ToR交换机中的主端口通常是10/100/1000 以太网,其中上行链路是千兆以太网或IOGE (千兆)端口。ToR可向上游连接到聚集交换机 110。这些聚集交换机可用作层-2通信量的聚集点并通常支持高速技术(诸如10千兆以 太网)以携带大量通信量(例如,数据)。
[0026] 来自聚集交换机110的通信量可被转发到接入路由器108。接入路由器可以采用 虚拟路由和转发(VRF)来为每个承租人创建虚拟的层-3环境。(承租人是被主存在使用网 络设备来用于连接性的服务器上的应用(诸如服务)一将通信量从用户或其他服务路由到 主存其的服务器或将通信量从主存其的服务器路由到用户或其他服务。)由此,图1示出了 单个承租人、应用116,虽然多个承租人可以在机架114的各个服务器上执行。在一些实现 中,L3聚集层120可聚集来自多达数千个服务器的通信量并将通信量路由到能连接到架构 100的剩余部分和网络104的核心路由器106。
[0027] 一些实现(尤其是面向用户的应用)可使用负载平衡器来改进被主存的应用的性 能。负载平衡器的冗余对可连接到聚集交换机110并执行服务器的静态IP地址(通过DNS 展示给客户端)和动态IP地址之间的映射来处理用户对于应用116的请求。负载平衡器 可支持不同的功能,诸如网络地址转换、安全套接字层或传输层安全性加速、cookie管理和 数据高速缓存。
[0028] 防火墙可被部署在一些实现中以通过针对一组
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1