因特网服务的模型建立的制作方法

文档序号:6414568阅读:263来源:国知局
专利名称:因特网服务的模型建立的制作方法
技术领域
本发明一般涉及检测与诊断计算机服务的问题。更具体地,本发明涉及从计算机服务中自主收集、组织、抽取及提交测量数据,使操作员能检测、隔离及解决故障与服务质量问题,以及制订服务与容量计划。
在过去几年中,通常称作“因特网”的环球网已经爆炸性地增长。主要是,这一增长受到所谓的“网页”浏览器的引入与广泛使用的促进,这些浏览器允许对诸如电子邮件、新闻、文件传送协议(ftp)、网页等网络服务进行基于简单的图形用户界面(GUI)访问。许多人与因特网服务供应者(ISP)签订合同来获得对因特网的访问。ISP的用户通常利用公共交换电话网用个人计算机及调制解调器连接到ISP。一旦连通,用户便能执行想要的功能。
除了提供对因特网的连接,ISP或诸如团体IT部门等其它计算机接入供应者(CAP)通常提供扩展、增强或改进因特网功能的额外服务、例如。许多CAP提供用户收发电子邮件的能力。或者CAP可提供本地域名服务器(DNS)来加快用户试图访问的域名的分辨力,从而改进整体接入速度。
这些服务的用户趋向于用简单的条件来观察该项服务的质量可达到性及性能(即速度、响应性等)。不幸的是,服务的可达到性及性能取决于许多因素。首先是服务本身及实现该服务的服务器。这些服务器可包括服务器软件、运行服务器软件的硬件、在硬件上运行的操作系统以及支持该服务的实现的网络硬件与软件。最后,服务器部件的性能与响应性可进一步取决于其它服务、硬件、软件等。例如,电子邮件服务质量首先取决于运行电子邮件程序的硬件与软件。这一电子邮件程序可取决于DNS服务器及网络路由选择器。DNS可用于在发送电子邮件之前解决域名,而路由选择器则可用于将电子邮件从CAP局域网转发到因特网主干上。最后,DNS服务器的性能可能取决于网络文件系统(NFS)服务器及相同或不同硬件与软件所提供的若干其它硬件、软件或服务的性能。对电子邮件服务的性能有影响的各部件是互相关联的并可位于相同或不同的网络或硬件上,依赖于相同的或不同的软件与操作系统,或在相同或不同的硬件上运行。
从上面的讨论中可以看出,简单的可达到性及性能的服务质量测定可能取决于配置在复杂的系统基础结构中的许多硬件与软件部件的相互关系。也有可能各个CAP会有独一无二的部件配置及它们的相互关系构成的基础结构。这导致难于构造“万能”的解决方法来进行服务与容量计划以及检测、隔离与解决故障及服务质量问题。
许多CAP在相当量体裁衣的基础上管理他们的网络。结合在公共域中可获得的管理数字的集合及不断发展的策略与过程来提供没有预见性的基础结构测定与监控。通常在CAP人员之间只是在口头上传递基础结构、关系、测试与测定技术、策略及过程的详细知识。通常只有最高级的技术操作人员了解所有基础结构部件之间的关系。最后,只在操作人员内部取得了对付故障与服务质量问题的来之不易的经验之后,通常才启动操作过程与策略上的变化。带有相关故障与低劣服务的这一内部时段对CAP的声誉不利并损失CAP客户、市场份额及盈利。
从而,在本技术中存在着获取高级技术操作人员的知识与经验并使广大用户能利用这些信息的系统的需求。这一系统应能从各种来源与测试基础结构元件的工具收集数据,从SNMP MIB及日志文件采集数据,并将这些数据关联成使操作人员中较不熟练的成员能检测、隔离及解决故障与服务质量问题所需的信息。本技术中存在着对包含在潜在问题产生故障之前,或者在造成服务质量问题之前由用户进行检测的系统的需求。本领域中存在着对使操作人员中较不熟练的成员不咨询高级技术操作人便能诊断、隔离与解决故障及服务质量问题的系统的需求。最后,如果这一系统能自动自我配置及调度问题检测、隔离与解决所需的工具与测试元件更为理想。
本发明的用于建模、显示及采集关于计算机服务的信息的方法与装置满足这些与其它需求。从配置信息开始工作,构造计算机服务的分层模型。这一模型是基于计算机服务的显式模型。该模型定义服务及其部件的结构与相关性、测定值、基线与阈值、健康状态、报警及服务部件的控制。该模型能做到较容易的故障检测与隔离,系统的自动布署与配置,专业知识的传播、基本原因分析以及服务与其部件的结构和相关性的直观化。
在一个实施例中,该模型可表示为非循环图。在模型的根上是服务本身。下一级为实现该服务本身的服务器。各服务器又由支持该服务的实现的服务器软件、操作系统、网络接口、其它服务等构成。在层次的各级上将基础结构的其它元件结合到模型中。最后,在这一服务的叶节点上为监控层次中较高层上所表示的每个基础结构部件的健康和性能的基本特征的实际测定值。层次模型建立各服务如何依赖于其它服务、软件、硬件与网络。服务的部件可以有其自己的模型。这一部件的模型可例示在服务的模型中。这些模型及它们协助达到的功能可以用数据结构及在一个或多个计算机系统上运行的程序实现。
分层模型表示提供观察基础结构元件的复杂关系及表示各建模的基础元件的健康的测定值的容易理解的方法。这一表示可用图形用户界面(GUI)显示。可将测定值以及各基础结构的健康指示显示在模型表示上。
分层模型还提供用于自动布署软件代理的模板来取得影响服务的健康与性能的基本特征的测定值。将这些测定值向分层模型上方传播以提供该服务的整体健康与性能的指示。可以检测单个测定值并且根据从基线与/或阈值的偏离的定义认为是异常的。通过将测定值信息在模型层次中向上传播,然后应用算术或作为替代的模糊逻辑测试,也可以检测出由若干相关基础结构元件的累积效应引发的异常。当检测到异常时,模型中也可包含控制定义。这些控制定义可定义采取什么行动来解决异常。
可以通过在有问题的服务的层次中递降,利用该分层模型所建立的依赖性来诊断计算机服务的问题。随着从有问题的服务到层次的较低级穿过模型,检测有问题的其它服务。很快地排除健康的元件及与它们相关的服务。通过将搜索收缩到只有少数元件方便了根本原因确定。这一搜索可以自动地或在显示该模型的表示、各基础结构部件的健康的指示与测定数据的GUI的协助下进行这一搜索。


图1为代表性CAP的示意图。
图2为图1的电子邮件服务的分层模型的一部分的示意图。
图1示出计算机接入供应者(CAP)的示意图。用户通过电话网连接到连接在调制解调服务器110上的调制解调器112之一上。调制解调器服务器110连接在至少一个局域网120上。网络120允许在CAP内也连接到该网络120的其它计算机(102、104、106、108、128与114)之间通信。该网络还通过一些装置连接在因特网126上。在这一代表性图中,该连接示出为通过路由选择器116、CSU/DSU 118及租用线路124。
服务可由在连接到网络120上的计算机(102、104、106、108、128与114)上运行的软件提供。图1中,电子邮件是由运行在计算机106与108上的进程提供的。将图1的CAP配置成将电子邮件服务请求分布在计算机106与108之间。在计算机104与128上运行的进程提供域名服务(DNS)。在计算机102上运行的进程提供USENET新闻服务。最后,计算机114用来提供总体管理。
图2示出图1的示意性CAP的电子邮件服务的分层模型200。在模型200的根上是用框202表示的电子邮件服务。如上面所讨论的,图1的CAP的电子邮件服务依赖于在两台分开的计算机106、108上运行的两个电子邮件前端进程。这两个进程构成层次的下一级并表示为框204与206。电子邮件系统对这两个前端处理器的依赖性用从框202到框204与206的实线表示。指示这些进程的性能的测定值为响应时间与可利用性。模型的这些叶节点示出为馈入框204与206中箭头。
用框206表示的电子邮件前端处理器#2的性能取决于网络、DNS与计算机系统108的性能。它们是依次用框208、210与212表示的。电子邮件前端处理器#2对这些服务的依赖性用从框206到框208、210与212的实线表示。用框204表示的电子邮件前端处理器#1的性能取决于与电子邮件前端处理器#2相同的网络与DNS、但不同的计算机系统。这一依赖性用从框204到框208、210与228的虚线表示。电子邮件前端处理器#1的性能取决于计算机系统106的性能,而电子邮件前端处理器#2的性能取决于计算机系统108,因此在模型中它们具有不同的连通性。
指示用框228与212表示的计算机系统的性能的测定值为存储器与进程统计。模型的这些叶节点分别示出为馈入框228与212中的箭头。指示用框208表示的网络的性能的测定值为连通性、吞吐量与延时。连通性测量是否能进行某些连接或是否可以到达某些计算机,吞吐量测量通过网络每秒能传送多少数据,而延时测量数据到达其目的地花去多长时间。模型的这些叶节点示出为馈入框208中的箭头。
用框210表示的DNS服务取决于在两台分开的计算机104、128上运行的两个DNS进程的性能。这些进程构成分层结构的下一级并表示为框216与218。DNS服务对这两个进程的依赖性用从框210到框216与218的实线表示。指示这些进程的性能的测定值为响应时间与可利用性。模型的这些叶节点示出为分别馈入框216与218的箭头。
DNS#1与DSN#2进程取决于它们在其上运行的计算机的性能对于DNS#1为计算机系统104而对DNS#2为计算机系统128。这两个计算机系统分别用框226与224表示。DNS#1对计算机系统104的依赖性用从框216到框226的实线表示。DNS#2对计算机系统128的依赖性用从框218到框224的实线表示。指示用框226与224表示的计算机系统的性能的测定值为存储器与进程统计。模型的这些叶节点示出为分别馈入框226与224中的箭头。
通过检验图2能看出这一建模在布署测定代理中的优点。通过在适当的计算机系统上穿过模型及起动代理便可简单地布署监控电子邮件系统的健康的代理来取得叶节点指示的测定值。通过只布署用模型的叶节点指示的那些代理,不布署不必要的代理,不取不必要的测定值,便能用树遍历算法使整个过程自动化。由于两个或以上高层服务可依赖于同一低层服务,存在着布署冗余代理的可能性。这一不定是不好的。然而如果愿意,避免这一点的简单方法为将叶节点标记为布署过的,然后不再为标记的叶节点布署测定代理。
一旦布署测定代理,也可用该模型来通知操作人员潜在的问题。采用计算机系统128快要用完存储器的情况。这将被用馈入框224的叶节点MEMORY(存储器)表示的存储器测定代理检测到。存储器测定代理将会意识到使用的存储器量己超过了预定的阈值。然后它便可能以报警的方式将这一信息转发给包含该模型的系统。在图1中这最有可能是计算机系统114。这时计算机系统114可观察模型并通过跟随模型依赖性在模型中向上而确定DNS#2快要有问题了,并且这可能导致整个DNS问题。然后,它判定DNS的问题可能导致两个电子邮件前端处理器的问题,后者又可能导致电子邮件服务的问题。它可以通过从框224到框218到框210然后依次到各框204与206穿过模型,后两个框都引到表示电子邮件服务的框202,而作出这些判定。因此,利用该模型,便能判定哪些服务将要受到潜在的或实际的问题的影响。
可以通过图形显示器将这些问题以及所有测定数据通知操作人员。这一图形显示器可通过提供与图2非常相似的模型的视图表示来示出基础结构部件的依赖性。测定数据可示出为馈入基础结构部件的叶节点,或在各个基础结构部件表示的内部的直棒图、刻度盘与其它标记。问题、潜在问题及己超过阈值的测定值可通过闪烁或者改变该服务或测定值的表示的颜色来强调。
为了构成分层模型,必须首先定义该服务的信息。做到这一点的一种方法是通过用图符来表示服务的CUI,并可画出线或连接来建立依赖性。更简单的方法是利用文本文件。在文本文件的情况中,为各服务建立一项并赋予服务一个名称,从一组预定义的服务中选择服务类型,然后可选用地指定这一服务所依赖的部件并且也是可选用地指定要取得的指示该服务的性能的测定值及这些测定值所必需的参数。也可包含定义测定值、如何取得它们、及指示问题的该测定值的基线与阈值的项。这些项可以定义或重新定义模板与阈值。表1中示出样本文件的一部分。
表1示出电子邮件服务、邮件前端处理器#1及运行邮件前端处理器#1的计算机系统的项。这些服务分别对应于图2中的框202、204与228。表1还包含可用来改变CPU使用的测定值的默认阈值的项。
表1
表1中的测定值字段指定建立服务的健康指示要取的测定值。例如,MEM-Stats测定可在机器上运行作为该机器上的空闲存储器量的参数中指定的脚本(script)。这一返回值可以是是否需要在该机器上增加更多存储器或虚拟存储器的指示。
能用相当简单的分析算法来读取配置信息及构成服务模型。该模型可包括利用任何数目的传统数据结构存储在计算机存储器中的一个或多个有向图。测定可以在运行在本地或远程机器上处理,但将它们的数据返回给将测定值存储在模型中的监控程序。可用该监控或另一程序按照模型所规定的依赖性在模型中传播报警条件。该监控或另一程序可读取模型的依赖信息、测定值、报警条件来提供服务状态及所有的基础结构部件的图形显示。读出模型的程序也能用来允许用户遍历该模型寻找问题条件而诊断与隔离问题,同时该模型继续接收来自测定进程的更新。
可以理解本说明书是以示例而非限制方式陈述的,并可在不脱离本发明的精神与范围下作出各种修正与改变。
权利要求
1.一种建立计算机服务(202)的模型的方法,包括(a)定义所述计算机服务所依赖的第一组服务,其中所述第一组服务至少有一个成员;以及(b)构造所述第一组服务的成员与所述计算服务之间的关系的模型(200)。
2.权利要求1的方法,其中所述第一组服务的各成员具有给出该服务的性能指示的第一组测定值,及其中利用所述第一组测定值的成员与所述模型来判定所述第一组服务中哪一个成员正在导致所述计算机服务的异常性能。
3.权利要求1的方法,其中所述第一组服务的各成员具有给出该服务的性能指示的第一组测定值,及其中利用所述模型来布署取得作为所述第一组测定值的成员的测定值的测定代理。
4.一种计算机服务(202)的模型(200),包括包含所述计算机服务与第一服务之间的关系的第一数据结构,其中所述计算机服务的操作依赖于所述第一服务;以及包含第一测定值与所述第一服务之间的关系的第二数据结构。
5.一种计算机服务(202)的模型(200),包括多个第一数据结构,其中所述第一数据结构包含所述计算机服务与多个服务之间的关系,其中所述计算机服务的操作依赖于所述多个服务,及其中所述第一数据结构还包含多个测定值与所述多个服务之间的关系,及其中所述多个测定值的每一个指示所述多个服务中至少一个的性能。
6.权利要求5的模型,其中所述模型定义被执行来取得各所述多个测定值的一组测定代理。
全文摘要
本发明旨在建立计算机服务的依赖性模型。分层建模定义计算机服务与该计算机服务所依赖的硬件与软件服务之间的关系。这些关系可包含在定义有向非循环图的数据结构中。该模型还定义需要取得哪些测定值来确定该计算机服务的健康与性能及该计算机服务所依赖的所有计算机服务的健康与性能。可以用模型来确定测定位置与功能以布署取得这些测定值的软件代理。来自测定代理的数据可在模型层次中向上传播。还可用图形界面直观化模型(200)来传达依赖性及建模的服务所依赖的服务的健康与状态。
文档编号G06F11/22GK1227931SQ98122379
公开日1999年9月8日 申请日期1998年12月2日 优先权日1998年3月2日
发明者M·D·史密斯, D·L·卡斯维尔, S·拉马纳坦 申请人:惠普公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1