云服务监测系统的制作方法

文档序号:7860678阅读:157来源:国知局
专利名称:云服务监测系统的制作方法
技术领域
本说明书涉及确定消费者可用的云计算资源的状态。本说明书还涉及基于该云计算资源的状态来调节操作动作,以便努力维持针对消费者的服务保证。
背景技术
单位对信息技术(IT)和基础架构计算资源的使用正从静态环境移动至更加动态和不固定的计算环境。传统上,单位的计算资源存在于由该单位所拥有并由该单位直接控制的固定基础架构上。然而,利用计算资源的虚拟化以及共享的计算环境(例如,云计算),计算资源消费者的应用和计算服务请求可以驻留在各种动态虚拟系统和资源上以及使用它们,以及使用任何数量的服务提供者来满足用户服务水平协议。传统上,应用所有者也拥有计算基础架构,以使得该相同实体管理和维护数据中心。数据中心将消费者的应用指派至物理数据中心中计算资源的特定集合(例如,特定的·计算簇)。即使在所需节点数量缩放时,在任何时间指派的特定节点也将来自所分配节点集合中的一个节点。在虚拟化云计算环境中,用户可以跨多个计算环境和服务提供者来缩放用户的资源利用,而不再受制于特定簇或特定数据中心中的固定数量的节点。由云计算服务提供者提供的、基础架构即服务和平台即服务,向用户提供了资源集合,与建立不同计算大小、容量和吞吐率的虚拟机类似。例如,较小的实例可以配置为具有受限的处理资源,而较大的实例将具有相对多的处理资源能力。传统上,在用户也拥有计算环境的情况下,用户具有针对资源利用和性能信息的直接本地访问权,以及针对输出自用户计算环境的所有监测度量和日志信息的本地访问权。与当今的服务提供者形成对照,在科学研究计算环境中(例如,其中国家机关可以具有供研究者使用的计算环境),研究者针对关于可能影响研究者计算利用的物理基础架构的性能信息具有直接访问权。在共享计算环境中,用户的应用从基础架构环境解耦合,使得该用户可能不再为了监测和控制应用性能而具有针对基础架构的本地可视性。由于用户现在有能力将用户的应用从本地计算环境(基础架构)解耦合并且在动态的虚拟云计算环境中部署应用,所以用户针对第三方服务提供者提供的云计算环境状态不再具有本地可视性。该云计算服务提供者(例如,亚马逊云查看)可以提供钩子程序以便提供针对计算环境的被动工具或查看,使得用户可以监测关于用户的应用所使用的计算资源的度量(例如,虚拟机、CPU使用、存储器使用、用户指派的虚拟机针对应用执行的读取和写入数量)。然而,尽管用户的虚拟资源与其他用户使用的任意数量其他虚拟资源共存在同一物理基础架构上(例如,多租户、多类别用户),但是服务提供者不会向用户提供了解计算环境实际状态的能力。例如,同一服务器物理簇上的虚拟机会彼此影响,因为它们消耗共享的资源,如CPU、存储器、网络和盘,但是虚拟机不能直接查看其它虚拟机的使用。而且,作为另一示例,对同一物理盘上存储卷的读取和写入访问彼此影响,以及通信流共享同一网络。共享环境中的用户仅看到该用户指派的虚拟资源的活动,而不能看到整体环境以便知道在共享环境中运行的其他虚拟资源和处理的消耗如何特定地影响该用户。在用户观察到性能下降,但该用户不能利用服务提供者提供的被动监测而探究其原因时,用户无法知晓共存于该云计算环境中的其他用户对该用户产生的实际影响。

发明内容
云服务监测系统(CSMS)包括处理器、耦合至该处理器的存储器和经由网络(例如,因特网)与共享服务环境通信的通信接口。CSMS存储器包括用于识别服务水平协议(SLA)规则的处理器可执行指令,该规则配置用于执行以便满足由云计算环境提供的云资源的消费者的SLA需求。CSMS,通过CSMS从云计算环境(例如,从服务提供者或另一源)接收被动测量和主动探测该环境以便确定该云计算环境的状态信息,来观察该云计算环境。CSMS确定该状态信息何时指示该SLA需求处于未被遵守(例如,不满足该SLA需求)的风险中,以及作为响应,该CSMS动态地调整该SLA规则,以增大遵守SLA需求的预期(例如,改进云计算环境将满足SLA需求的概率)。在阅读了下述附图和详细描述之后,其他系统、方法和特征对于本领域技术人员而言将变得显然。所有这种附加的系统、方法、特征将包括在本说明书中、落入本公开的范
围,以及由下述权利要求所保护。


参考下述附图和描述,将更好地理解系统和/或方法。参考下述附图描述非限制性和非穷尽性描述。附图中的部件无需按比例绘制,重点在于示出原理。在附图中,除非特别指明,否则,贯穿不同附图,类似的附图标记可以指示类似部件。图1示出了云服务监测系统(CSMS)配置。图2示出了多类别、多租户要求和数据平台覆盖层的共享资源环境。图3示出了用于平衡用户和服务提供者兴趣的某些问题。图4示出了由CSMS执行的主动探测的类型。图5示出了由该CSMS提供的云提供者和消费者框架。图6示出了 CSMS可以用来确定SLA规则的调整的逻辑流程图。图7示出了基于历史性能的长期供给(sourcing)决定。图8示出了复合服务规则场景。图9示出了开始时间决定因素。图10示出了针对开始时间的动态调整。图11使用多个区域(zone)示出了等待时间决定因素。图12示出了由服务监测和动态规则扩展的控制层。图13示出了开始时间分析逻辑图示。图14示出了使用所收集测量的线性回归的应用。图15示出了基于所请求会话数量和开始会话的时间的要求。图16示出了传输文件时间的逻辑图示。图17示出了基于利用的开始时间。图18示出了 CSMS可以如何确定传输文件的时间。图19示出了由CSMS呈献给用户的可视化。
具体实施例方式此处描述的原理可以具体化在多种不同形式中。并非所有描述的部件都是必须的,而是,某些实现可以包括附加的、不同的或更少的部件。在不脱离此处给出的权利要求精神或范围的前提下,可以做出关于部件部署和类型的变体。可以提供附加的、不同的或更少的部件。图1示出了云服务监测系统(CSMS)配置100。CSMS102配置100包括云服务监测系统(CSMS102) 102,其包括处理器104、耦合至处理器104的存储器106和经由网络116 (例如,因特网)与共享服务环境(112,114)通信的通信接口 108。CSMS102存储器106包括用于识别服务水平协议(SLA)规则120的处理器可执行指令118,该规则120配置用于执行以便满足由云计算环境(112,114)提供的云资源的消费者的SLA需求122。CSMS102通过CSMS102从云计算环境(112,114)(例如,从服务提供者或另一源)接收被动测量124来观察该环境。用户(142,144)可以仅仅监听该环境,和/或在被动数据收集模式中被提供以特定于该用户的测量。CSMS102还通过主动地探测该云计算环境(112,114)以接收主动测量126从而确定该云计算环境(112,114)的状态信息(例如,用于满足SLA的任一云资源 的市场价格、该云计算环境的带宽或网络延迟、或开始在云计算环境中执行的计算实例的时间,或其任何组合)来观察该云计算环境(112,114)。CSMS102确定该状态信息何时指示该SLA需求处于未被遵守(例如,不符合该SLA需求)的风险(128)中,以及作为响应,该CSMS102动态地调整(130)该SLA规则120,以增大遵守该SLA需求的期望(例如,改进云计算环境将满足SLA需求的概率)。CSMS102主动地探测共享环境(112,114),以收集关于服务质量和服务响应的实时(主动126)测量,使得该用户可以对服务响应134和服务质量132的性能以及共享计算环境的状态进行建模(例如,确定服务质量136和服务响应138的状态)。CSMS102允许用户理解云计算环境的状态(136,138),使得用户可以针对环境资源的用户利用做出最佳决定,其中,该云计算环境是用户并未拥有的基础架构。CSMS102使用主动探测来利用测试询问该环境,以便确定该环境的实时状态,和期望用以满足用户SLA的资源状态(例如,云环境的当前状态)。CSMS102探测该环境(例如,确定云的状态),以确定该环境是否可以满足用户期望的计算资源请求(例如,SLA122)。除了服务提供者(112,114)向用户提供的信息被动测量124之外,探测140也充当用户了解环境实际状态的反馈机制。例如,在电信行业中,当用户拔通电话号码时,电信网络服务提供者可能在该服务提供者知道该呼叫质量较差时向该用户返回忙信号,而不是允许该电话呼叫接通。用户可能倾向于在呼叫质量较差时得到忙信号,而不是接通该电话。因此,CSMS102使用探测140来确定环境状态,以针对向用户递送服务来促进用户调整和偏好(例如,使用动态规则)。CSMS102提供使用以各种方式收集的不同测量类型的系统和方法,以确定存储(146)哪些数据以及以何种频度存储该数据(和/或处理该数据),以及基于CSMS102执行的分析,该CSMS102确定环境的实时状态、调整用户的利用和/或提供用户可选择的选项以便实现用户的SLA。CSMS102可以改变用户的SLA规则120 (例如,静态规则),以针对在云资源中请求(126)所选云资源具有不同时间,针对开始在云计算环境中执行的计算实例具有不同时间,待开始或停止的计算实例具有不同数量,和/或基于环境的实时状态来向不同的云计算环境指引消费者的云计算工作负荷的部分。CSMS102使用用户接口148来提供环境状态(包括服务质量和服务响应)的可视化152。图2示出了多类别、多租户要求202 (例如,应用)和分解至用户接口层204、数据平台层206和数据层208的数据平台覆盖层的共享资源环境200。例如,一个用户(例如,满意航线)的挑战可以向该环境强行施加了满足先验不可知的多类别多租户要求的能力。CSMS102提供了覆盖层,用于捕获数据以及具有用户的SLA122地对数据进行递送,以用于日常计算、网络和存储资源。CSMS102可以扩展至专用资源(例如,私有数据中心和专用网络)。以使用亚马逊web服务云作为服务提供者为例,正在向用户提供的服务状态随时间发生变化,因为在云环境中存在共享资源的其他用户,以及存在服务提供者未向用户提供可视性的其他操作。在传统基础架构环境中,资源位于用户的控制区域(例如,数据中·心)中,以及用户针对该用户用来向用户递送SLA的资源具有直接可视性,尽管在用户控制的环境中会随着时间出现变化,但是用户针对在环境中使用的所有资源具有直接的可视性,并且可以针对待在环境中进行的调整做出更具信息性的决定。在传统数据中心中,直接的可视性将允许用户识别用户的虚拟机正与另一用户的虚拟机共享CPU,其中,其他用户的使用影响该用户,以及将该用户移至另一 CPU。在共享环境中,提供计算资源服务的实体和消费计算资源服务的实体是分开的且不同的,服务提供者仅向用户提供针对用户资源状态的测量,而关于影响向该用户递送服务的其他用户使用的其他共享资源却不能提供信息。服务提供者仅向用户提供用户特定的资源测量(例如,被动监测或监听提供被动测量-用户的CPU使用,用户的存储器使用)。CSMS102主动地实时探测资源和环境的状态,以直接了解共享环境中潜在资源的状态(例如,正在如何向其他用户分配共享资源)以及这些资源可能如何影响用户的SLA以使得用户可能调整该用户的动作(例如,使用动态规则)。CSMS102提供在下文详细讨论的主动探测(例如,向该环境注入受控的业务(诸如,文件传输)和/或诸如启动计算实例或会话的资源使用),以及收集针对用于表征环境和资源的服务质量和服务响应的实时测量。通过主动地询问该环境,CSMS102能够发现预期用于满足用户SLA的资源状态和环境状态,使得该用户可以做出更具信息性的决定(例如,使用动态规则来动态地实时调整用户的资源利用策略)。CSMS102通过分析主动测量126 (包括开始实例和/或会话的时间、传输文件的时间、CPU利用要求和容量、网络带宽可用性、网络延迟和盘I/O访问速度(读取/写入))来表征服务质量136和服务响应138。CSMS102确定可能受到访问该环境的人员数量影响的当前服务状态是否会影响用户体验(包括服务质量和服务响应)。CSMS102可以通过向目的地发送网络分组以及测量何时接收到该分组来测量延迟。以相同的方式,CSMS102主动地探测该环境以确定影响用户服务质量136的准确实时测量。CSMS102可以把服务(例如,共享的资源)作为黑盒进行分析,这需要响应于CSMS102主动探测请求(例如,待由黑盒服务完成的分组,请求或工作,以便测量实时服务质量和/或服务响应)来执行某些处理。CSMS102可以使用开始实例或会话的时间、传输文件的时间来表征服务响应,以及使用网络带宽可用性和网络延迟来表征服务质量,包括测量“最大事务数量”和读取/写入延迟。在潜在利用较大时,可能预期延迟会增长。表I示出了用户的SLA需求和要求154的类型。CSMS102提供了一种方式,以识别待收集的被动和主动测量,以便分析计算环境的历史的、实时的和长期的行为特征,并且使用动态规则来满足 用户的SLA。
权利要求
1.一种用于云服务监测(CSM)的计算机实现方法,包括利用处理器识别服务水平协议(SLA)规则,所述SLA规则用于执行以满足由云计算环境提供的云资源的用户的SLA需求,所述SLA规则由所述处理器使用网络进行访问; 使用连接至所述网络的所述处理器来观察所述云计算环境以收集状态信息;识别数学模型,所述数学模型通过使用所述处理器向所述收集的状态信息应用所述模型来对所述观察的云计算环境的行为进行建模;通过利用所述处理器向所述收集的状态信息应用所述模型来确定所述状态信息何时指示所述云计算环境处于不满足所述SLA需求的风险中;以及基于确定不满足所述SLA需求的风险,调整所述SLA规则,以改进所述云计算环境将满足所述SLA需求的概率。
2.如权利要求1的方法,其中观察包括使用所述网络来获取由所述云计算环境提供的被动状态信息;以及使用所述网络、通过探测所述云计算环境来获取检测的状态信息。
3.如权利要求1的方法,其中观察包括通过下述操作来获取所述云计算环境的带宽或网络延迟的测量或二者经由所述网络向所述云计算环境发送文件传输服务请求,以用于将已知大小的文件从第一 CSM实例向位于已知位置的第二 CSM实例进行传输;经由所述网络接收所述文件传输服务请求的结果;基于所述文件传输服务请求的结果,计算所述云计算环境的带宽或所述网络延迟的测量或二者。
4.如权利要求1的方法,其中观察包括获取对用于满足所述SLA的任意云资源的市场价格或在所述云计算环境中执行的计算实例的开始时间的或二者的测量。
5.如权利要求1的方法,其中调整所述SLA规则包括通过向经由所述网络连接至所述云计算环境的协调工具传达所述SLA规则改变来改变所述SLA规则,以便对于在所述云资源中的选定云资源具有不同的请求时间,其中所述协调工具实现所述SLA规则改变。
6.如权利要求1的方法,其中调整所述SLA规则包括改变所述SLA规则以便对于在所述云计算环境中执行的计算实例具有不同的开始时间。
7.如权利要求1的方法,其中调整所述SLA规则包括改变所述SLA规则以便将针对所述用户的云计算工作负荷的部分向不同的云计算环境指引。
8.一种用于云服务监测(CSM)的产品,包括其上存储有处理器可执行指令的计算机可读存储器,其中在所述处理器执行所述指令时,引起所述处理器识别服务水平协议(SLA)规则,所述SLA规则配置用于执行以满足针对由云计算环境提供的云资源的用户的SLA需求;观察所述云计算环境以确定所述云计算环境的状态信息;以及确定所述状态信息何时指示所述SLA需求处于不满足所述SLA需求的风险中,以及作为响应,调整所述SLA规则以改进所述云计算环境将满足所述SLA需求的概率。
9.如权利要求8的产品,其中所述指令进一步引起所述处理器获取由所述云计算环境直接提供的被动状态信息;以及通过探测所述云计算环境来获取检测的状态信息。
10.如权利要求8的产品,其中所述指令进一步引起所述处理器获取所述云计算环境的带宽或网络延迟的测量或二者。
11.如权利要求8的产品,其中所述指令进一步引起所述处理器获取对用于满足所述SLA的任意云资源的市场价格或在所述云计算环境中执行的计算实例的开始时间或二者的测量。
12.如权利要求8的产品,其中所述指令进一步引起所述处理器改变所述SLA规则以便对于在所述云资源中的选定云资源具有不同的请求时间。
13.如权利要求8的产品,其中所述指令进一步引起所述处理器改变所述SLA规则以便对于在所述云计算环境中执行的计算实例具有不同的开始时间。
14.如权利要求8的产品,其中所述指令进一步引起所述处理器改变所述SLA规则以便将针对所述用户的云计算工作负荷的部分向不同的云计算环境指引。
15.一种用于云服务监测(CSM)的计算机系统,包括处理器;与所述处理器通信的数据库,其存储针对用户的SLA需求和与所述SLA需求相关联的对应SLA规则;与所述处理器耦合的存储器,其中所述存储器包括存储在其上的处理器可执行指令,其中在由所述处理器执行所述指令时,引起所述处理器识别服务水平协议(SLA)规则,所述SLA规则配置用于执行以满足针对由云计算环境提供的云资源的用户的SLA需求;观察所述云计算环境以确定用于所述云计算环境的状态信息;以及确定所述状态信息何时指示所述SLA需求处于不满足所述SLA需求的风险中,以及与所述数据库通信的SLA控制器,所述SLA控制器在所述系统确定所述SLA需求处于不满足所述SLA需求的风险中时,调整所述SLA规则以改进所述云计算环境将满足所述SLA 需求的概率。
16.如权利要求15的系统,其中所述系统包括位于所述网络中的一个或多个CSM实例, 所述CSM实例通过探测所述云计算环境来观察所述环境以获取检测的状态信息,其中每个所述CSM实例配置用于发送针对所述云计算环境中资源的资源请求,以及接收对资源请求的响应,以及其中所述系统经由通信接口来获取由所述云计算环境直接提供的被动状态信肩、O
17.如权利要求15的系统,其中所述系统包括位于所述网络中的一个或多个CSM实例, 所述CSM实例观察所述环境以获取对所述云计算环境的带宽或网络延迟或二者的测量。
18.如权利要求15的系统,其中所述系统包括位于所述网络中的一个或多个CSM实例, 所述CSM实例观察所述环境以获取对用于满足所述SLA的任意云资源的市场价格或在所述云计算环境中执行的计算实例的开始时间或二者的测量。
19.如权利要求15的系统,其中所述SLA控制器通过向连接至所述云计算环境的协调工具传达所述调整来经由所述网络调整所述SLA规则,其中所述协调工具实现所述SLA规则改变,以使得所述SLA规则对于在所述云资源中的选定云资源具有不同的请求时间。
20.如权利要求15的系统,其中所述SLA控制器通过向连接至所述云计算环境的协调工具传达所述调整来经由所述网络调整所述SLA规则,其中所述协调工具实现所述SLA规则改变,以使得所述SLA规则对于在所述云计算环境中执行的计算实例具有不同的开始时间。
21.如权利要求15的系统,其中所述SLA控制器通过向连接至所述云计算环境的协调工具传达所述调整来经由所述网络调整所述SLA规则,其中所述协调工具实现所述SLA规则改变,以使得所述SLA规则将针对所述用户的云计算工作负荷的部分向不同的云计算环境指引。
全文摘要
本发明的实施方式涉及一种云服务监测系统。云服务监测系统(CSMS)有助于云计算资源的消费者确定所述消费者可用的云计算资源的状态。所述CSMS针对这样的云模型尤其有效,在该模型中,所述云计算资源的消费者与所述云资源的提供者不同。CSMS102还提供了用于调整操作动作以针对消费者维持服务保证的机制。在此方面中,CSMS响应于云的状态来动态地调整操作动作,而不是执行未针对所监测条件定制的固定预定操作动作。
文档编号H04L29/06GK103002005SQ20121034722
公开日2013年3月27日 申请日期2012年9月7日 优先权日2011年9月7日
发明者T·唐, F·巴德拉多加, J·C·康 申请人:埃森哲环球服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1