计算机系统的变化监视系统的制作方法

文档序号:6419131阅读:328来源:国知局
专利名称:计算机系统的变化监视系统的制作方法
技术领域
本发明涉及计算机系统,并且更具体地涉及一种用于监视计算机系统的变化的系统。
维护计算机或计算节点的网络的成本可相当昂贵。用户或系统管理员安装的软件可能使现有应用不能使用。当在大量节点上安装某产品时,“转出”产品中的错误对于系统求助桌面可以是破坏性的。共享库的更换会难于辨别并和系统故障相联系。用户和管理人员还会删除会使某应用不能使用的文件。另外,未经批准的用户安装产品可能是不可控环境中的破坏源。
质量保护相关系统中未被发现的变化在人日数上造成的风险是明显的。在不加监视的系统中,流逝的时间可能延伸数周或数月。
把计算机组升级到新级别的操作系统的过程可能花费数日,并且典型地需要对已安装的软件产品进行某种程度的验证和确认。在人工上和系统可使用性上,该过程可能是相当耗成本的。
现有的建议通过在需要时或出现大的系统更换时分别测试计算机系统中的各个计算机提供控制。
在现有计算机系统中,在系统变化之前说明并记录典型的变化控制活动。接着由系统工程师测试变化对一个计算机的影响。若对于该现行计算机该安装是正确的,则把变化扩散到该计算机系统中的其它有关计算机上。
质量例如在核工业中是关键性的事务。在验证核设计中使用的计算机程序上耗费了相当大的努力。若要施以验证,所使用的计算机必须对应的是验证过的计算机。大范围的重复式验证测试可以是耗时的并且需要相当大的知识库。
从而,在用于计算机系统的变化控制应用上仍存在改进的余地。
本发明提供一种变化监视系统,其监视计算机系统在多个平台以及多个产品上的变化。以这种方式,可以对先前验证过的计算机系统的品质监视它的各种平台和产品的不合乎需要的变化。
作为本发明的一个方面,对具有多个平台和多个产品的计算机系统提供一种变化监视系统。该变化监视系统包括用于建立并且管理代表该计算机系统的多个样板的装置。一个装置存储这些样板。一个装置和该计算机系统的多个平台通信。一个装置把样板与对应的平台或产品关联起来。进而,一个装置根据这些样板监视该计算机系统在平台以及产品上的变化。
作为一优选实施例,这些平台包括至少一个的具有第一操作系统的平台以及至少一个具有第二操作系统的平台,其中第二操作系统不同于第一操作系统。该用于监视计算机系统的装置包括用于监视第一和第二操作系统的装置。
计算机系统最好包括多个安装在这些平台上的软件产品,并且该用于监视计算机系统的装置包括用于辨别这些安装在计算机系统上的软件产品的装置。该用于辨别软件产品的装置可包括用于提供这些软件产品中的一个在一个不同的平台上的每个事例的计数。


图1是依据本发明的变化监视系统的方块图;图2是图1的变化监视系统的各程序的方块图;以及图3-13是用于图2的变化监视系统的各程序的流程图。
参照图1,其中示出用于计算机系统4的变化监视系统2。计算机系统4具有多个平台(用被监视节点示出)6、8和多个产品例如示例软件产品10、12、14、16。示例平台6采用第一操作系统(O1)18例如Unix,而示例平台8采用第二操作系统(O2)20例如Windows NT,第二操作系统20不同于第一操作系统18,尽管其中可采用大范围的操作系统(例如Windows95、Windows98),并且每个平台上操作系统可相同或不同。
尽管示出示例计算机系统4,应理解可采用大范围下的这样的系统(例如,不作为限定,用于各种应用,例如企业系统、核设计、金融、医疗、网服务器、部门系统、工程、软件开发、家庭PC或者管理业内或其它应使或必须使系统变化控制风险为最小的领域内的其它活动的多节点(例如从2个到数千个或更多节点)系统)。虽然示出示例平台6、8,本发明可应用于大范围的各种平台(例如,不作为限定,处理器、主机计算机、小型计算机、工作站、服务器、个人计算机(PC)以及其它微计算机、其它基于微处理器的计算机、中央处理机(CPU)或者采用某操作系统的连网处理器)。
示例系统2包括一个监视节点22、一个储存库节点24以及一个参考节点26。如下面连同图2-13更详细讨论那样,监视节点22建立并管理多个样板(T)28、30、34,这些样板代表计算机系统4的平台6、8和产品10、12、14、16并且由储存库节点24存储。监视节点22把各样板28、30、34与平台6、8以及产品10、12、14、16中的对应者关联起来,并且监视计算机系统4在平台6、8和/或产品10、12、14、16上的变化。例如,一个样板可能用于一个平台,另一个样板可用于另一个平台,再一个样板可用于一个或多个平台上的一个产品,而又一个样板可用于另一个或另外多个平台上的另一个产品,然而,如下面连同图3-4讨论那样,相同或类似平台,或者相同或类似平台上的相同产品可采用相同样板。
节点22、24、26采用用于和计算机系统4的平台6、8通信的计算机网络,例如示例的通信网络32。尽管示出示例型的通信网络,应理解可采用任何适用的计算机网络(例如,不作为限定地,令牌环、以太网、FDDI、任何可部分或全部配置为局域网(LAN)或广域网(WAN)的网络)。
系统2以管理监视的方式,即可从任一计算机监视任一计算机的方式,是一个独立的计算机系统。只要在一个或多个计算机例如22上安装系统2便可监视其它计算机例如6和8。例如,其中链接着Unix计算机(例如Unix平台HP-UX、Solaris、AIX)以及微软WindowsNT计算机的网络32中的各示例计算机可方便地从一个例如采用HPUnix工作站如22的系统管理员的桌面得到监视。从而,可从该管理员的桌面访问、查询和管理网络32上的所有计算机。
系统2最好采用客户机/服务器体系结构。一旦在基于NT和/或Unix的多个平台上建立该示例系统2,可从任一平台进行对其中的每个平台的变化控制状态的观察以及相继地进行对问题的补救。例如,中央帮助设施人员可以在NT平台上,而工程人员可采用NT和Unix平台。系统2便利从中央帮助设施的各个NT平台对所有工程平台(NT和Unix)的管理。相反地,若其它支持人员在Unix平台上,他们可以作为中央帮助设施通过该通信网络监视相同的各NT和Unix平台。
系统2采用“样板”概念。典型地,监视节点22(或其它节点)做出平台6、8以及产品10、12、14、16的样板28、30并作为参考状态存储在储存库节点24中。监视节点22对对应的被监视节点6、8拷贝可应用的样板。接着,监视节点22周期地检查计算机系统4的各个平台和各个产品以判定它们是否和存储的样板28、30匹配。
用于产品和平台的每个样板28、30是一个对象组的记录,这些对象构成一个厂家/系统产品或者构成一个逻辑上需要监视的对象的分组。对象例如可以是为了成功地执行产品或应用所必需的文件、进程和/或盘存储。每个示例软件产品10、12、14、16具有一个包含产品名和版本号的标号。用于产品的样板28、30列出所有的该产品中包含的对象、为验证每个对象所需的各属性、这些属性的期望值以及与从期望值发散相关的严重程度。对象(以及它们的属性)的例子是(1)平台(CPU类型、操作系统版本、操作系统版次(release);(2)文件(路径名、拥有者、组、权限、字节数量、CRC、链路数、链路分辨率);(3)进程(进程名、执行持续时间);以及(4)盘存储(驱动器、标识符、总容量、用户告警阈限、求助桌面告警阈限)。
系统2便于对所有需要保持不变的以及需要监视的平台、软件、硬件对象进行定义,并且便于接着验证这些对象未被更换。当系统2进行验证时,它查阅样板28、30以了解要检查哪些属性以及这些属性的期望值。它接着把这些期望值和平台6、8上的现行值进行比较。接着,系统2报告并记录任何查出的样板值和现行值之间的差异。
工程系统所使用的样板的范围例如取决于那些由母机构看成是对质量而言是关键性的项目。例如,可以是质量保证部门和工程部门共同确定范围。范围通常包括操作系统、CPU以及关键性应用。范围是可以改变的,例如从支持核反应堆核心设计的基于工作站的计算机系统上的42,000个文件到支持单种类型分析的个人计算机上的3,000个文件。
计算机工业中普遍了解的域是计算机系统4的体系结构中的最高层。被定义的域数典型地取决于环境的大小。在大型公司中,例如,通常每项主要业务至少有一个独立的域。域还可能划分成功能组(例如,工程,财会、人事)。最好根据对全局配置参数的检查确定各个域。在每个要求不同参数(例如,软件储存库的位置、异常报告制度、排它变化超时值、远程超时值、自动配合能力以及用户通知选用)的情况下,应确定一个新域。尽管一个域可能包括一个网络结构内的一组用来唯一地定义它们在系统4内的功能或组织(例如,用于工程部门的NT域A)的节点,任何域都是可能的(例如,用于工程部门的“NT域A”和用于信息部门的“Unix域B”的组合)。计算机系统的域可以是商业结构内的节点的逻辑分组。例如,可能存在一个带有几个下一级上的商业单元域的公司级的主域。也可以通过物理位置定义多个域,其中每个地点具有一个唯一域。
节点组是一个域内的节点集合,其允许该域下的其它逻辑集合。用户和管理人员利用节点组定义用于节点组的专用参数。典型地,把带有不同要求的不同节点类型定义成独立的节点组。例如,受控制的工程工作站节点可定义成为一个节点组,而不带有控制的财会PC节点可定义成为另一个节点组。
例如如图5的102那样,可通过查询各被监视节点6、8上存在的检验表(若有的话)检测各节点组。
用户组是可能具有权限以及其它按组定义的参数的用户ID的集合。
产品组是具有相同的特殊特性及要求的产品的逻辑集合。例如,通常一个操作系统应是一个产品组,从而,MS Office应是一个包括所有MS Office应用的产品组。
系统2的一实施例利用平台6、8的下述示例属性以及它们的文件构成样板28,30:(1)包含操作系统名、操作系统版本、操作系统版次的平台属性组,以及CPU标识符(尽管支持“等同的”CPU);以及(2)文件属性组,包括文件名(使用存在测试)、拥有者(例如,用户ID、组、系统)、附属的组(例如,系统、用户)、权限(例如,谁可执行、谁可读)、尺寸(用于不改变的文件的匹配尺寸或者最大阈限尺寸(例如,以千字节为单元的当其超过阈限时会触发通知的记录文件的最大文件尺寸))、链路(即至某全文件名(例如,“C:/abc/def/compiler.exe”)的捷径(例如,“/point”))和/或改进的循环冗余检验(CRC)(例如,32位、16位),尽管本发明可应用采用大范围的属性的样板。
系统2的另一实施例利用平台6、8的其它属性形成多个样板34:(1)Windows NTTM的注册项,这些项和一些特定应用关联(2)服务/端口守护程序(例如,持续运行的并因此需要核实它们未被破坏、仍在运行或者未休眠的程序,例如信箱服务程序);(3)计算机到计算机的信号交换,例如Unix对/从NT的数据流;(4)用于拨出的调制解调器服务程序;(5)盘分配额(为具体盘驱动器的多个用户各分配一个分配额(即,尺寸限制),并且若超出定额则提供告警);(6)盘储存图(即,某平台是否还变换到另一平台的盘驱动器);(7)盘安装(即,某具体的盘驱动器是否仍安装在该平台上);(8)环境变量(例如,至.exe文件的路径;至求助页面的路径;登录对话中的各变量,例如值“A”是至某具体程序的路径);(9)文件修整(例如,若某文件超过某特定长度,从该文件修整最老信息的一部分或部分百分比);和/或(10)软件库存功能(例如,根据信息和某具体样板匹配的百分比,确定字处理程序的期望版本级别,例如Word7.0)。
示例样板28、30提供文件管理控制,而样板34提供硬件管理控制。可理解存在用于这些实施例之一或二者的应用。
每个平台6、8是硬件和操作系统的组合,每个样板建立一个唯一系统环境(例如Intel奔腾和NT4.0,Service pack3)。硬件和操作系统的每个唯一组是一个独立的平台。而每个平台又包含它自己的样板组(例如,从储存库节点24下载用于软件和硬件产品的样板)、产品记录、产品分组表(例如,具有相似性的各产品,例如微软的Office或各份操作系统)以及检验表(例如,用来配置用户节点的各特定平台的产品组,用于再装入用户节点的各文件的位置)。从而,例如,带有HP UX9.01操作系统的HP735计算机是和带有HP UX9.05操作系统的HP735计算机不同的平台。应理解,具有一台计算机和两种(或更多)操作系统的单个节点包含两个(或更多的)平台。
通过CPU芯片(例如,奔腾)和步进级(例如,1、2、3)定义硬件。
通过名字(例如,NT)、版本(例如,4.0)和版次(例如,Servicepack3)定义操作系统,其中版次可能包括各种软件修补程序。
平台6和8具有一组分别用于产品10、12和14、16的产品样板。其包括在该节点上安装的产品的所有版本。虽然对每个平台只示出两种产品,可理解可使用三个或更多的这样的产品。每个平台通常还具有一个或多个已定义的主节点如26,它们含有该特定平台的原始配置。
示例系统2采用如图1中示出的四种逻辑节点类型,尽管在一个物理平台上可以有这些逻辑节点类型6/8、22、24、26中的两种、三种或四种。
参考节点26是进行验证并且含有被验证的程序和数据的地方。
储存库节点24是保存样板28、30、34和产品检验表(即,具体平台的产品表,例如“工程节点“开发节点”)的地方。该储存库存储用于其它平台的随后使用。系统2允许系统管理员建立一个除名字之外其它都和原始平台完全相同的“复制”节点。当配置要求需要在被控平台上运行软件时,该特性是非常宝贵的,因为可以在一个系统上验证软件并且接着在任一复制节点上运行软件。
储存库节点24定义多个平台。在一些环境下,可能存在单个保持用于所有域的所有储存库的原始拷贝的主储存库节点,并且还可能存在物理上位于每个域内、存储用于各个域的储存库的复制储存库节点。每个储存库节点具有一组定义用于该域的全局参数的配置文件;各样板例如28、30、34以及一组用于存在于该域内的每个平台的记录文件。系统2保持两种类型的配置文件。spp.cfg配置文件为至系统2的各种接口定义选项。node.cfg配置文件为单个域内或节点组内的各节点定义信息和选项,例如默认选项。
被监视节点6、8是那些用户在其上进行关键性品质计算的节点和平台。监视节点22例如由求助桌面人员和系统管理员使用,用来检查并修改被监视节点6、8。
参照图2,其中示出图1的系统2的总数据流。系统2包括程序spptmpl36、sppview38、sppchech40、sppreport42、sppcopy57、sppstate80和sppinstal106,它们都可由该系统的一些用户访问。系统2存在三种不同的使用阶段44、46、48。在产品状态建立阶段44中,系统管理员50利用程序spptmpl36定义被安装产品的各分量以及它的要被检查的各属性。该阶段44中确定的各属性值在把该产品设置到生产节点上时充当期望属性。这些属性值是参考产品状态52,该状态52存储在储存库节点24中。
管理员50最好规定系统2的某些特性可由每个用户访问,以使用户50、54可使用系统2的全部或重要的功能。然后,每次访问系统功能时,系统2进行检查以确定用户的访问权限。用户级别定义确定特定用户具体ID的权限级别。例如,最高级别是定义中央体系结构的管理员50。下一级别允许实施修正。第三级别是求助桌面人员54。最后,最低级别是只能观看系统2的有限信息的用户58。
在节点配置阶段46,管理员50(或求助桌面人员54)利用程序sppview38辨别要设置到某选定节点55上的各产品并辨别该节点上要执行的各具体行为例如周期性地生成异常报告。利用程序sppinstal106和sppcopy57把存储在储存库节点24中的包含着各属性值的样板56传送到该选定的节点55。也可以从外部驱动程序sppcopy57以便在节点55上增添产品样板和操作检验表,例如图5的102。
在监视和报告阶段48,用户58、管理员50或求助桌面人员54利用程序sppcheck40确定对产品期望状态的偏离。此外,管理员50或求助桌面人员54利用程序sppview38允许产品状态修改。此外,程序sppreport42向用户,例如管理员50、对图1的计算机系统4的品质感兴趣的新顾客62或审计员64,提供描述对各期望状态的一致性的报告。以这种方式,求助桌面人员54(或管理员50)辨别趋势并通过产生有关一个或多个节点的系统活动报告支持审查。
一旦要添加一个产品(例如,软件和/或硬件分量的集合,管理员50为储存库24中的单个产品提供信息。该信息是用于辨别必须要受到检查以便确认该产品保持未改变的要素的基础。管理员50可在一相同的硬件节点上复制该状态测试配置。在软件安装后,管理员50在连带装入到该选定节点55中的样板下利用程序sppcheck40验证该安装。如后面连同图9讨论那样,解决任何差异以和图1的参考节点26匹配并且予以确证。做出该节点的状态记录66供以后使用。
程序sppcheck40是系统2的关键分量,它诊断并修正某具体节点上的缺陷。缺陷是对期望状态的偏离。用户58、求助桌面人员54、管理员50或端口守护程序可以启动程序40,在此之后得到被修改的节点状态66,故障68得到记录,并且简述各修正行为70。
用户58可调用程序sppcheck40,后者根据最近对平台的再检查得到平台的质量保证被修改的节点状态66。可转换节点状态66以变成分析程序sppview38的输出的一部分并且充当该具体平台的质量保证记录。替代地,用户58可不做什么而依赖于累积的系统记录。作为另一种替代,用户58可通过调用程序spplook59得到有关当前质量保证状态的综述信息。对于支持关于该选定节点55的审计,该信息通常是足够的。
在用户58实施调用72下,求助桌面人员54通过利用程序sppview38许可产品状态修改对节点修正进程进行管理。该情况不同于下面连同图5(其中系统管理员50未接收调用)讨论的情况,其差别是图2中的用户58请求来自求助桌面人员54(他所具有的修正故障的权限范围比用户58要广)的帮助。
当检测出故障时,求助桌面人员54(或管理员50)辨别问题并采取修正行动。在这种情况下,例如,可由系统2通知管理员50存在问题,或者求助桌面人员54可通过观看检查结果辨别故障。
系统2的网络监视和报告功能是通过下述对话得到支持的(1)提供节点组的状态;(2)选择一个供详细检查的节点;(3)辨别一节点上的每个产品组和/或产品的状态;(4)显示对参考样板的差异;(5)要求对样板改变进行质量保证记录;(6)要求对系统改变进行质量保证记录;(7)在报告格式下显示该样板;(8)显示综述记录报告;(9)显示盘驱动器上可使用的空间;以及(10)显示可能受共享库影响的各产品的名字。这样借助关于该系统中哪部件对于每个产品集的操作是关键性的信息把计算机系统4组织成是可视的。
图3-13示出系统2的各程序的流程图,其中系统2最好采用基于应用的图形用户接口(GUI),例如图2的GUI37和GUI39。为简化参照,在图3-13中未示出这些GUI。动作的启动者称为施动者并且在这些图的圆圈的外面。在每个对象的中央设置字母C、E、I以表示该对象主要是(C)施控对象(即,主要进行控制和执行各功能的对象);(E)实体对象(即,其主要包含数据);以及(I)接口对象(即,其主要充当对用户的接口),尽管每个对象也可能执行和它的主要标示无关的功能。对象之间带有箭头的线表示信息流,其中有关传送的信息的细节后面连同图3-13予以讨论。
参照图3,一旦添加新产品、删除较老的产品或者修改产品(例如,对操作系统做出大的更换时,操作系统和硬件同时改变),管理员50在储存库24中设置某单个产品的信息。管理员50为新节点设置信息或为已有节点升级信息。对于辨别必须予以检查以确认产品保持未改变的要素,该信息是它们的基础。
首先,管理员50激励程序spptmpt36以在安装产品前得到节点76的快照。然后,管理员50在所需节点76(例如,软件开发节点、工程节点)上执行对该产品的安装指令组74。接着,管理员50规定要作为比较基础的快照的名字。对于初始节点采用条目“无”,如下面连同图4讨论那样。管理员50输入该产品名和该产品版本,并且选择产品组名。
接着,程序sppstate80查询节点76的操作系统以得到有关其现行状态的初始快照信息,其中包括感兴趣的指定目录中的所有文件的最近修改日期/时间、正在节点76上执行的所有进程的名字以及硬件组件表。在基本样板82中记录该信息,该样板82是草稿产品样板。
接着,管理员50和程序sppstate80获得的信息进行交互以消除或者撤消认为是不必要的检查(例如,“求助”人工页面上的检查)。例如,由程序spptmpt36驱动的GUI37(图2中示出)允许管理员50规定要检查的各属性、取消一个或多个文件(例如,通过后缀或通配符)、把选定的各文件移动到别的样板中和显示各样板。
例如,可以为软件应用添加、删除或修改的细目是(1)平台的目录;(2)文件或链路,其中文件名可由至公共存储器的一提供着名字的链路代替,并且在提供着“$PREFIXn”的场合中文件可按“$PREFIXn/…”规定;(3)必须执行的所需进程;(4)许可证服务程序(即,许可证服务程序进程名);(5)共享库参考(例如,共享库的文件名,其中保持相关性,以便以后关联共享库的改变);(6)用于快照的硬件配置标识;(7)用于快照的操作系统标识;和/或(8)该被安装产品所需的空闲盘空间。
图1的计算机系统4上的每个产品是通过它在图2的程序spptmpl36的GUI37中产品名示出的。这些产品名可能关联到更高层的分组中。系统2自动地生成和产品关联的各对象并且把对该产品的监视结合到系统2中。在平台监视下,如后面连带图5讨论那样,通过在产品级适当地利用快速再检查或者全面再检查询问每个产品以找出缺陷。当检测出产品改变时,系统2帮助对该产品“训练(drillingdown)”以确定问题。
操作系统例如是通过下述有名组描述的(1)可改变的(即,文件期望成是不同的);(2)基本的(即,文件期望成是相同的);和(3)共享库的(即,已知文件是由多个应用使用的)。
可按产品或按要素规定各种类型的缺陷的严重性程度(例如为感兴趣的每个对象和/或每个对象属性)。可随意地规定修正行为、在修正行为之前需要检查的状态和执行修正行为所需的权限等级。
一旦由管理员50委托,在储存库24中保存基本样板82和修改过的样板84以及作者名、样板建立的时间戳记、样板修改说明。通过程序sppstate80建立一个用于该具体产品的状态文件88并且也存储在储存库24中。还由程序sppcheck40利用作为QA(质量保证)记录生成的结果错误记录68检验状态文件88。
诸如84的各样板可以是一次全部生成的,或者是逐渐增加的。在一些情况中,构建一个初始样板并且随着增加新的检查过的产品逐渐修改该样板可能是方便的。在某平台已经验证过但它的起源是朦胧的情况下,可采用一次全部生成方法。在系统2的框架内这两种方法都是可使用的,并且管理员50可选择一个和环境相适应的方法。
如和图3有些相似的图4中所示,管理员50为一个由新操作系统和/或新硬件组成的新平台92设置信息90。例如,当对操作系统做出大更换和/或操作系统和硬件二者同时更换时,出现这种情况。
首先,管理员50利用产品厂家提供的工具94辨别产品。工具94以及产品从属性对于每种平台是不同的并且可能对于每种产品是不同的。接着,从工具94得到产品标识以及产品从属性数据96。该数据由正在运行的程序spptmpt36使用并可能由程序sppstate80使用。管理员50为被请求的快照名输入“无”,并且一旦由管理员确认程序sppstate80建立一个或多个基本产品样板82。
程序sppstate80向平台92的操作系统询问有关它的现行状态的信息。利用正执行的进程名中的差别辨别添加的进程。另外,还确定硬件中的差异。保留任何导出的基本样板82以添加到QA报告中并供以后可能的再使用。
然后,管理员50大致遵循对单个产品采用的相同处理(见图3)并且和程序sppstate80得到信息进行交互以消取或撤消某些实际上不需要的检查,并为剩余的检查设定严重性。相对比,图4的该当前活动涉及多得多的分量,并且在持续时间上要长得多。可以为软件应用添加、删除或修改的不同细目或增添细目是(8)产品的执行阶段所需的空闲盘空间;和(9)安装/相连(即,该应用必须存在一个文件系统)。
管理员50还可规定下述附加细目(10)盘定额(即,对用户的盘定额);(11)失控进程和时间限制(即,不再具有母体的进程或者那些超出时间限制仍现用的进程;(12)网络绑定(即,确保可使用充当服务器的各节点);(13)时间同步(即,规定用于时间同步的参考节点);(14)操作系统版本(即,期望的操作系统版本);(15)用于时间受限进程的各规则;和(16)队列容量(例如,完整打印队列)。管理员50还可通过分离的GUI子菜单规定有名硬件配置,例如如下(1)处理器可使用性;(2)RAM;和(3)盘容量(未示出)。
可随意地规定修正行为、修正行为之前必须检查的状态以及执行修正行为所需要的权限等级。可按产品或按要素规定各种类型的故障的严重性等级。还可按产品或按要素规定向用户的有关受到影响平台的通知以及向管理员50的有关缺陷的通知。按对象类型提供默认严重性等级。图4的其余部分和上面连带图3所讨论的相同。
参照图5,其中管理员50为节点98规定新配置。首先,管理员50通过程序sppview38的GUI39(图2中示出)说明要构建一个新节点配置,并且按照“硬件”、“操作系统”和“应用”选择一套定制产品。可以利用以前命名的应用组或者来自储存库24的任何节点上已定义的产品组作为开始点。GUI39还支持向系统2的各用户分配对节点98的访问权,以及节点专用信息例如网络服务器名、许可服务器名和执行程序sppcheck40的计划表。
接着,程序sppview38使程序sppmaster100为该新节点98构建一个检验表102和参考状态104。接着管理员50通过由程序sppview38驱动的GUI39输入新节点名并且启动安装程序sppinstal106。程序106以及图2的程序sppcopy57利用检验表102对节点98拷贝表102规定的各样板和所有产品参考状态文件,而且还拷贝系统2的适当程序,例如程序sppcheck40。
当执行时,程序sppcheck40为期待为不同的文件生成更换数据并且把该数据放在节点专用记录文件116(图6中示出)中。由拷贝到新节点98中的检验表以及各样板驱动的程序40还检查每个要素的状态并确认该安装和各期望状态属性匹配。
接着,管理员50使用程序sppview38,检查在其GUI39中描述的产品中的任何差异结果(例如,不同的编译程序),并采取任何下面连带图9讨论的必要的修正动作。最后,管理员50利用程序sppreport42通过GUI39启动生成质量保证记录。如后面连带图13讨论那样,把来自节点专用状态参考文件108以及参考状态104的文件的数据汇集到一份报告中(例如,带有纸张输出选项的文件输出)。
图6示出诊断并改正某具体节点110上的缺陷的程序sppcheck40。简言之,缺陷是对节点110的期望状态的偏离。例如,用户58、求助桌面人员54或端口守护程序112可启动获取节点110的现行状态114的程序40。最后,通过程序40在错误记录文件116中记录错误,并且通过程序sppreport42在报告118中综述修正行为。
诸如116的记录文件记录节点上的所有有关信息,包括系统更换以及管理员活动。在系统2的每次操作后更新state.log文件,系统活动例如可以包括以计划好的周期或者根据需要检查平台以及管理员对检测出的故障的解决办法。state.log文件中包括的信息类型是(1)安装活动;和(2)每个产品的验证时间和状态,以及对样板值的偏差。当对某具体产品做出改变时更新product.log文件。product.log文件中包括的信息类型是(1)样板改变信息;(2)文件替换文件;和(3)对改变的解释。
首先,在用户58或求助桌面人员54的请求下或者周期性地由端口守护程序112执行程序sppcheck40。可能准予访问有限的修正能力的用户58可规定产品名、程序40运行的时刻、要检验的对象表、是否要提供修正以及是否要停止检查。这既支持周期性的检查又支持非周期、请求下的检查以根据已存储的样板以证实某些产品。可能准许求助桌面人员54访问全范围的修正能力,他可规定带有文件CRC检查的检测和/或对某具体产品的检测。端口守护程序112可周期地进行全面测试以便证实该选定节点110的稳定性和一致性。端口守护程序112的修正行为等级和授予它的创始用户的等级相同。
具体地,用户可规定(1)只检查某些产品,借助置默认以检查在选定节点110上安装的所有产品;(2)仅检查某些对象类型(例如,(a)文件名和链路,(b)所需进程名,(c)许可服务器,(d)更替换文件安装/相连/映射,(e)数据定额,(f)时间同步,(g)网络服务器,(h)失控进程,(i)时间受限进程,(j)硬件配置,(k)操作系统配置,(l)网络绑定,(m)节点CPU可用性/[x]终端仿真程序可用性,和/或(n)盘容量),借助置默认除CRC检验(以及NT系统上的安全性)对检查所有类型;以及(3)旁路掉文件CRC检验,该检验是默认的并明显改进性能,但是是不太严密的。
请求下的快速再检验检查快速检查(例如,几秒钟)平台的状态,并且还取决于需要提供一种更全面的检验能力。快速再检验能力检查所有带有对象内容异常的对象属性。这提供对计算机系统4的快速第一级询问以确定任何属性改变。此外,当求助桌面人员54需要解决某具体问题时,存在着只验证计算机系统4内的单个产品从而节约验证整个计算机系统所需时间的选择。
程序sppcheck40使用规定每个要检查的对象的状态检验表120。程序40通过询问节点110对这些对象中的每个进行检查以判定对象的原始状态,例如样板中所描述的文件拥有者的名字,是否已更换到某修改过的状态,并且若有确定何时以及如何修改产品(例如,改变哪些对象以及属性,它们何时改变和如何改变它们)。
若存在缺陷,接着做出尝试修正节点110的决策。表120中的对象或者对象本身含有尝试修正的准则。然而,除非用户对此做出规定并且具有必需的授权,不会尝试修正。若尝试修正的决策是肯定的,则尝试对节点110的修正(例如,把受到影响的文件重新安装成它的由图1的参考节点26定义的原始状态)。
接着,程序40检查以判定对节点110的修正是否成功。然后,程序40把故障、修正行为及结果记录到记录文件116中,并向用户58、求助桌面人员54和/或管理员50(图2中示出)发送预定义的邮件报文以通知他们存在某些问题。例如,在构建新节点配置时,管理员50可规定向谁通知某些未修正的故障类型。
接着,程序40比较每个对象属性的现行值和对应的预定义期望值,并且然后利用该信息以及对应的严重性值为节点110确定现行节点状态114。图1的样板28、30、34包括用于各对象属性值的期望值以及严重性值的列表,严重性值是和对对应的期望值的对应偏离值相关的。程序40比较属性的现行值和该列表中的期望值,并且确定对每个偏离实例确定各属性以及它的相应严重性值。接着,检查节点110的每个偏离实例,并把最坏情况的严重性值指定为节点状态114或者为节点110的严重性等级。以这种方法,为节点110提供改变控制状态。
四种示例的严重性等级包括(1)OK(例如,节点状态GUI屏幕113上显示绿色);(2)告警,观察到某些差异(例如,黄色);(3)“故障”(即,潜在的节点故障、观察到严重差别)(例如,红色);以及(4)检查未运行(例如,兰色,其中不能通过图1的网络32访问节点110,或者其中不能执行系统2的一个或多个程序)。程序sppview38可使用用于每个被监视节点的节点状态114,以便在它的图2的GUI39上显示。
当用户登录到处于“故障”状态的平台时,每个平台利用程序sppcheck40显示“故障”状态屏幕(未示出)。例如,在任何处于“故障”状态下的平台上不能进行质量保证工作。此外,只要检测到不同于平台的样板的“故障”严重性,就显示“故障”状态屏幕。一旦解决了“故障”严重性差异,显示另一个屏幕(未示出)。向管理员50适当地发送一条和“故障”屏幕上显示的报文相对应的报文。
最后,程序sppreport42周期地检查记录文件116、把记录数据放入节点度量收集文件122中并把结果概括到异常报告118中。周期性地简述记录文件116,以便证实系统一致性(例如,用于质量保证记录)、辨别复发的问题和紧凑地报告所有错误(例如,若某文件的权限和长度发生改变,则应显示当前值、参考值以及供启动检查的文件名和日期/时间)。文件122最好减少成例如最近七天的数据。
以这种方式,图1的系统2检测可以指示因计算机系统4中的某事件改变某产品的变化。一种补救可以是重新安装和重新定制该产品。系统2可把该产品恢复到它的原始状态,并且从而和产品的安装过程无关地选择性地只安装产品受到影响的那些部分。这种特性使得实际修复时间以及为把产品恢复到其原始状态可能需要的附加定制工作为最小。
图7示出程序sppinstal106,它安装在系统1的监视节点22上并且和目标节点124上的图2的程序sppcopy57一起工作。首先,求助桌面人员54或管理员50登录到监视节点22并通过执行图2的程序sppview38启动安装进程。
端口守护程序112启动编排好的同步和异步活动,它还充当至图1的网络32的通信接口。通过程序sppcheck40进行对具体的被监视节点6、8的排定好的检验,程序40是通过端口守护程序使用的用户规定的时间表启动的。取决于用户的规定一天内可多次进行快速和/或完整的检查。例如,可以按数日或数小时规定重复周期。替代地,可在一天的一些具体时刻排定检查。
端口守护程序112还使得仅按月或按季度建立周期性的异常报告。当错过排定好的事件时(例如,这可发生在节点掉电),立即启动检查和报告。端口守护程序112还启动来自远程节点的文件传送并会在用户规定的时间间隔内重试传送直至成功(例如,在暂时不能得到该远程节点的事件下)。
还可以与上面对排好的检查的选择无关地在任何时间请求启动程序40以进行检查。
程序sppinstal106读目标节点配置124并安装系统2的适当文件和程序。它们还包括图2的程序sppcheck40、sppreport42以及图6的状态检验表120、节点专用状态数据114。另外,图2的程序sppview38仅装入求助桌面/管理员节点。接着,程序40证实该安装、生成节点专用状态数据114并生成至求助桌面人员54的诊断报文以指示成功的检查。该诊断报文指示执行过的各种检查的数量。
程序40可按日常基准(例如,在该示例实施例中,取决于母体结构的质量保证要求每日在被监视节点上一至四次)检查各样板,虽然范围更大的次数是可能的。在典型应用下,对修改过的CRC进行计算的“全部再检查”需要10到45分钟。这些重新检查是和其它监视功能一起在后台进行的。可从图1的监视节点22执行“快速再检查”以得到对任何被监视节点的迅速但不太详细的评定。在典型应用下这些再检查需要5到25秒,并且是用于求助桌面人员54的关键工具。
还可以利用程序40辨别因随后安装别的产品造成的以前安装的产品的改变。例如,若新近安装的产品重写某文件或改变某属性,则可检测出这样的改变。做为另一个例子,当改变共享库时,可能会影响一些共享这样的库的产品。程序40可以监视所有的库,并且从而可监视所有可能受任何库改变影响的产品。另外,程序sppview38的GUI39显示那些可能受共享库的影响的产品的产品名。做为另一个例子,动态链接表(DLL)未检测出的改变可能严重冲击系统。若某可执行文件(例如,.exe文件)使用某DLL并且该DLL被错误地删除,则会造成问题。而且,若改变某DLL,可能为负面地影响数个可执行文件。
图1的系统2确定安装产品在计算机系统4上的影响。新产品安装后运行系统2证实该当前的产品安装是正确进行的并检验系统其它产品未改变。该特性向管理员警告系统上以前安装的产品的产品性能上的可能问题。
图8示出程序sppview38,管理员50通过它设置新节点的信息或者升级现有节点的信息。首先,管理员50通过图2的GUI39激励(例如,通过点击某图符或通过在命令行中输入“sppview”)程序sppview38。接着,程序38的GUI39使得显示它的主菜单。管理员50从该菜单选择管理方式,并接着从带有配置选项表的下拉菜单选择配置类别。这些选项例如包括(1)从节点表规定分配给一节点组的名字;(2)从该节点表规定节点在图1的网络32上的地址(例如IP地址);(3)充当经该节点表进行节点复制的基础的各节点名;(4)用于各共享样板的目录名和用于各节点专用样板的目录名;(5)具有在其中提供节点名和许可服务器进程的专用许可服务器的节点名;(6)状态检验的重复日期/时间;(7)通过对象类型规定默认严重性等级;(8)用于记录的标准注解;(9)和“异常报告”生成并发的记录凝聚的间隔;(10)用于未修正的检测到的故障的系统/事件记录条目的时间间隔触发器;(11)目标节点上由系统2使用的带有以“adm/node_Name”为默认的目录;和(12)选择32位CRC检验。为上述配置选项的每一个提供一个专用GUI屏幕(未示出)以允许管理员50提供必要信息。
在管理员50通过GUI屏幕(未示出)输入用于节点的适应于配置类别的配置数据并且提供适当信息后,在用于各节点的状态检验表文件120中或者在主储存库24中保存用于各节点的节点配置数据。
参照图9,管理员50或求助桌面人员54辨别问题并采取修正动作。通过各种程序sppcheck40系统2按唯一定义的系统时刻表主动监视网络32上的每个被监视的节点。当系统2自动检测到改变时,建立一个事件响应以警告与系统偏离对应的系统人员,例如通过电子邮件、纸张或计算机屏幕发送警告,并且可发送给范围更广的用户以及企业中的其他人员。
例如如果需要使两个平台是相同的,系统2突出这两个平台之间的差异并且通过自动修复特性帮助管理员50使这些平台相同。在被控平台上,当未满足配置要求时,系统2向任何已对该平台或正试图对该平台的人发送通知。当该平台重新满足这些要求时系统2也通知他们。在这二种情况下,管理员50接收对任何故障的通知,而用户只接收用于被控平台的通知。
仍参照图9,程序sppview38由求助桌面人员54或管理员50执行。接着,程序40通告某故障的存在,例如,通过通知125(如用电子邮件、纸张)告诉管理员50存在某故障。替代地,管理员50可通过观察程序sppview38的GUI39(图2中示出)的检查结果屏幕(未示出)辨别故障。在后一种情况下,管理员50启动程序38(例如,通过点击某图符或在命令行上输入“sppview”)的主菜单(未示出)并选择监视选项。接着,在节点状态屏幕上示出被监视节点的状态,如上面连同图6讨论的那样,在其中利用四种颜色代码示出不同的节点状态。接着,选择节点126用来通过选择节点屏幕(未示出)观察。
由于例如上面连带图6讨论那样由用户或端口守护程序112启动程序sppcheck40刚确定该选定节点126的节点状态114。进而,从GUI39,管理员50从其中包含由程序40最近验证的现行状态以及时间的用于该节点组的所有节点的可分类的表中得到该选定节点126的现行状态。然后,管理员50从选择节点屏幕(未示出)选择观察产品屏幕,这使得在GUI39上显示各出故障产品的状态。显示程序40发现的有故障产品的差异细节。以这种方式,每个产品具有由程序40更新的改变控制状态。
然后,管理员50通过观察经从GUI39选择产品记录屏幕(未示出)而显示的记录文件116诊断问题。管理员50通过执行修正程序128(例如,从该产品记录屏幕或者通过对操作系统输入命令)修正问题。若授予着足够的访问权力求助桌面人员54也可执行程序128,或者替代地,可对管理员50通话或寻呼(例如,通过从该产品记录屏幕选择通知管理员)以请求执行该动作。
可通过从产品记录屏幕选择一委托选项更新用于该选定节点126的参考状态104。通过委托屏幕(未示出),管理员50输入对修正的描述(例如,通过使用下拉式标准说明表)以及日期、时间和人名。该信息转而输入到记录文件116中。最后,向用户通知该修正并且在该选定节点126上重新尝试该应用。然后,执行程序sppcheck40以确认该修正。
在解决活动期间,管理员50对受到影响的区域“训练”以确定更改是否是正确的。若该改变是可接收的,管理员50存档其理由。另一方面,如前面的讨论,管理员50把受过影响的平台恢复到它的原始状态,并且对问题的原因及修复归档。在这两种事件下,系统2记录该活动以及管理员认为该修改是正确的原因或记录通过某动作恢复平台以修正由某些事件造成的问题。接着,记录文件116允许其它人员检查随着时间进行的系统改变。
图10示出求助桌面人员54或管理员50通过利用通信网络32’的远程进程间通信能力访问的远程计算机系统。首先,例如由管理员50在管理员的工作站上执行程序sppview38。接着,通过利用网络32’的远程进程间通信能力在远程平台上执行远程程序sppcheck40’。程序40’向程序38回送信息并且在远程平台上存储远程节点状态文件114’和远程节点记录文件116’。借助程序sppview38可在网络32’远程访问文件114’、116’,利用程序sppview38选择节点(多个节点)以及由程序sppcheck40’使用的各选项。接着,可通过在程序38的GUI39(图2中示出)选择停止检查选项终止程序40’的执行。
图11示出为审计图1的计算机系统4并确定在其上安装着那些产品而设置的软件辨别功能。图1的储存库节点24的指定目录中的所有产品样板与目标节点130上驻留的文件比照以辨别在该平台上驻留的产品。接着,程序sppinstal106搜索节点130上的所有目录并检查文件名、文件长度和目录结构(例如,可忽略CRC匹配)以判定是否存在某产品(或某产品的一部分)。
然后,在一个文件中保存所有匹配以供程序sppreport42访问,后者接着关联匹配的字段。对于每个产品,显示从产品样板确定的产品名、所检测的文件的数量、期望产品版本并显示期望的文件数量。以这种方式,根据和文件结构的对比得到平台的产品图。最后,可为一组节点中的每个节点得到库存报告。该功能的一个重要方面是分析“宾客”节点和产品的未批准用户的可能安装的能力。例如,通过提供计算机系统4的每个平台上的产品拷贝计数,可确保遵照软件地点许可证,这些许可证批准软件产品使用的最大数量。
参照图12,管理员50利用程序sppview38把存储在储存库24中的一个节点的软件配置复制到一个相同的硬件节点132。从程序sppview38的主菜单(未示出),管理员50通过依次选择管理员和复制节点选项规定要拷贝的一现有节点配置。管理员50从复制节点屏幕(未示出)选择要复制的节点并请求安装。由于预先已配置节点和被复制节点132上的硬件和软件是相同的,不需要管理员的更多操作。接着,程序38调用程序sppmaster100,后者把来自储存库24用于该现有节点的检验表以及所有所需的状态文件拷贝到目标节点132的监视目录134中。接着,程序sppinstal106和程序sppcopy57在目标节点132上安装复制状态配置。
执行程序sppcheck40并为那些预期会在预先已配置节点和该被复制节点132之间改变的要素(例如,节点名、通信网络地址)生成参考数据。在节点专用状态参考文件108中存储该参考数据。由来自该被复制节点132的数据驱动的程序40还检查每个要素的状态并证实该安装和节点132的参考状态属性104匹配。
然后,管理员50观察来自程序sppview38的结果。管理员50选择一个造成产生数个可得到的报告(例如,状态配置、访问、节点专用样板)的初始QA选项,并且接着从选择产品屏幕(未示出)选择报告选项、获得可得到报告表,并访问来自程序sppreport42的描述节点132的初始状态的摘要报告。在安装软件之后,管理员50验证该安装并且如前面连带图9讨论那样解决任何为和图1的参考节点26相匹配的差异并存档。在这种方式下,管理员50可把计算机系统4的一个或多个平台(例如1000个平台)安装更换并且判定这些更换得到正确安装。
通过对话支持的各种样板分发功能包括(1)向一节点分发一样板,从而建立复制平台;(2)从一组可使用产品构建一个样板;和(3)改变多个产品的拥有者、小组和权限(例如,对于这些产品的初始分发那一项是重要的)。次要的构建样板功能可以是(a)允许每个被监视节点具有一组唯一产品;(b)改变用于某节点的样板中包含的产品(例如,增添产品、去掉产品);和(c)改变排定表和电子邮件通知。
以这种方式,利用主节点建立复制节点,或者把单个产品组复制到另一个节点。例如,管理员50可选择建立二者(a)一主节点和一用户节点,或者(b)只为一个用户节点。主节点是已正确安装并已证实过的节点,并且从而可用于建立一个复制节点或用于复制单个产品。前一个选项建立一个可由其它节点用作为文件及样板的源的主节点。在后一选项中,只为用户的节点是按照一主节点仿制的,从而可通过增添或去掉产品随时间改变。
图13示出生成报告,以便对图1的计算机系统4的一个或多个节点上的活动辨别趋势或者支持审计。求助桌面个人54或管理员50(或可能是审计员144)执行程序sppview38,后者转而调用程序sppreport42。替代地,这些人员通过在命令行上输入“spreport”以及对一个或多个报告的选择直接调用程序42,其中对一个多个报告的选择例如是用于图1的被监视节点6、8中的一个或多个的产品组报告、主产品组报告、产品库存报告、产品测试报告、状态报告、访问报告、异常报告、当前记录报告、产品QA报告、初始节点QA报告和/或系统度量报告(它造成产生状态报告、产品测试报告和适当的产品QA报告)。
在图1的示例系统2的客户机/服务器体系结构下,程序sppreport42是安装在监视节点22上的一个“客户程序”,其启动用于由对应的安装在选定的被监视节点6、8上的“服务器”程序spprpt(未示出)生成的报告。替代地,用户可登录一个被监视的节点6、8并通过程序spprpt直接生成报告。
为了通过程序sppview38的GUI39(图3中示出)进行选择,在启动报告选项之前管理员50和选择节点屏幕(未示出)交互以选择用于报告的所需节点(组)。接着,GUI39向管理员50显示报告选择屏幕(未示出),以便选择如上面利用命令行选项描述的一个或多个报告。因为图1的示例系统2是计算机系统4中的一个产品,还检查产品组报告并报告系统2产品的质量状态。产品QA报告例如示出样板更换的质量保证记录。
最好尽可能地简缩节点历史记录例如136,因为通常要长时间保存它们。因此,程序sppview38的GUI39提供一个在生成节点度量集合文件,例如月份历史记录下删除记录文件136的选项。由于记录文件136可变成相当大,周期性地把这些详细记录概括成更简单的摘要报告如138,以在简缩形式下提供相同信息。对于长期保护计算机系统的活动,这些摘要报告是关键性的。
然后,通过图2的GUI39显示用于各具体报告的选项,并且管理员50从报告选择屏幕(未示出)选择这些选项。管理员50从GUI39调用报告生成并且程序42生成所需的报告(多个报告)140。通过报告选择屏幕(未示出)所有报告140都可被选择以供通过程序sppview38在GUI39上观看、在打印机142上打印或打印成文件。
通过选择多个节点,摘要报告例如可能表示节点“1-17”是OK的而节点“18-20”是有故障的。以这种方式,各报告140向用户而不是由用户提供系统评估。另外,各报告140为计算机系统4提供完整的更换控制和问题解决活动的历年历史。
基于各记录文件136的各报告140可用于在计算机系统4的运行期间保护其品质状态。对于支持为判定在一具体时间段内这些平台和产品是否在受控环境下运行所需做的审计,这些记录是关键性的。进而,审计员144可观看选定的多个报告。例如,审计员144可具有生成报告的权限,但不具有修改系统2的权限。
在严格配置环境中系统2非常有用。在审计中各记录、档案文件和报告生成程序满足全部系统历史归档要求。其监视能力确保确认和验证(V&V)环境不是不可靠的,并且“节点复制”使得在无需更多V&V下增添新的平台。在图1的参考节点26上执行所有V&V并且然后仅在各复制节点上运行对应的程序的组合确保这些程序进行相容的计算。
在事务(ongoing)的基础上进行各种类型的审计。进行内部审计以断定保持着配置控制。进行顾客审计以确保为顾客准备的结果是在恰当配置的各平台上由验证过的程序执行的。进行核管理委员会(NRC)审计以确认执行着恰当的配置控制。按排定好的基础(例如,每月或每季度)准备的各摘要报告设计以满足上述各种审计要求。另外,审计员如144可观看在每个计算节点上保持的产品记录和系统计录。
示例系统2确保动态计算环境下关键计算组件保持不变。由于这种环境以日益加大的速度改变,系统2表明计算能力处于适当的质量保证状态并且低风险下支持这些环境的改变。可利用系统2显示一计算机系统和它的验证系统是相同的,并且从而展示出适当的配置控制。
系统2提供避免问题和解决问题两方面上的好处。通过确保目标平台配置成容纳“转出”的软件,它支持避免问题。这进而减少中央求助桌面设施所接收的支持呼叫次数并且还减少顾客的不满意。例如,核安全中使用的平台处于质量保证贴合的证据减少审计成本并避免昂贵的损失。另外,受损文件的确定免除了问题解决中的“侦探”阶段,该阶段通常是问题解决过程中花钱最多的部分。受损文件的快速确定把许多问题转到5到10分钟的解决时间,其间求助桌面可容易地处理这些问题。另外,这还减少转到上层支持人员的问题的数量。
示例系统2可展示给审计员的一个突出好处是可在极小成本下实现的高控制度和质量保证。一旦在计算机系统4上建立系统2,持续监视对系统人员警告改变。在知道系统2可在用户受到影响前检测系统的问题下,管理员可做其它工作。另外,系统2可方便快速地回答有关系统质量保证的询问。这些好处在系统可靠性、系统维护、系统管理、用户生产率和系统问题解决中的管理时间上提供明显的成本节约。系统2的主要好处来源于其快速监视、诊断和修复系统问题的能力。系统2的其它好处包括提高计算环境中的质量保证等级以及在混合(例如,NT和Unix)环境中监视计算机系统4的能力。
和扩展质量保证空间以及问题诊断概念相关的好处是显著的并且很容易超过最初的好处。借助安装并配置成周期性地检验计算机系统4(例如,每天四次)的系统2,可使和未发现的与质量保证相关的系统改变造成的时间风险为最小。另外,通过更频繁的周期监视可进一步减小时间窗口或者可在请求下进行验证。当他们的计算环境出现改变时用户和管理员受到通知,从而可以因在不顺应的系统上进行计算而损失大量小时数之前采取修正或说明动作。
通过利用系统2经通信网络32复制操作系统,可免除对被复制系统的验证步骤。另外,系统2特别适用于远程系统管理及故障诊断。系统2可定义一个包含任何数量的已安装平台的扩充的质量保证空间。一旦一个平台在系统2的控制下,可把它用作为与其它安装进行比较的基准,使得有可能部署任何数量的对参考平台的复制。
系统2跟踪受控计算环境中的变化。计算机系统环境变化自动得到检测并通过数种媒体向系统人员提供信息告警。记录计算机系统的所有活动以提供对变化的跟踪能力。例如,生成带有足够细节的报告以满足NRC核安全审计。
系统2自动地进行下述任务以提供独特的系统管理能力(1)监视计算机网络上任一平台上的任一文件的任何属性;(2)从任何一个平台监视任何另一个平台;(3)监视任何平台上的任何产品;(4)记录计算机系统变化控制活动;(5)向系统人员警告任何系统偏离;(6)建立NRC可接受的系统活动的质量保证记录,包含计算机系统变化控制的和问题解决活动的完整历年史;(7)把任何产品以及其各文件、各属性恢复到它们的原始状态;(8)提供工程系统控制;(9)确定产品安装对计算机系统的影响;(10)辨别系统上安装哪些产品以及它们的版本;(11)验证正确地安装更换,(12)对任何产品执行排定好的验证;(13)确定何时修改某产品并完整描述对该产品的改变;和(14)在回顾计算机系统偏离以及它们的解决的过程中引导管理员。
尽管出于公开的简明,本文中在显示或输出信息上参照了示例GUI37、39和打印机142,应理解这样的信息可被存储、由计算机修改或与其它数据组合。所有这样的处理应认为是在本文中所使用的术语“显示”的范围内。
尽管详细地说明了本发明的各具体实施例,业内人士理解依据本公开的总原理可对这些细节做出各种修改和改变。从而,所公开的具体布局对于本发明的范围是说明性而不是限制性的,附属的权利要求书以及其任何和所有等同给出本发明的范围的完整幅域。
权利要求
1.一种用于具有多个平台和多个产品的计算机系统的变化监视系统,所述变化监视系统包括装置,用于建立并管理多个表示所述计算机系统的样板;装置,用于存储所述多个样板,装置,用于和所述计算机系统的所述多个平台通信;装置,用于把所述各样板与所述平台或所述产品中的一些关联起来;以及装置,用于为所述平台或所述产品对所述样板的变化监视所述计算机系统。
2.权利要求1的变化监视系统,其中所述平台包括至少一个具有第一操作系统的平台和至少一个具有和所述第一操作系统不同的第二操作系统的平台;并且其中用于监视所述计算机系统的装置包括用于监视所述第一和第二操作系统的装置。
3.权利要求1的变化监视系统,其中所述用于通信的装置是通信网络。
4.权利要求1的变化监视系统,其中每个所述平台包括多个各具有多个属性的文件;并且其中所述用于监视所述计算机系统的装置包括用于监视所述属性的装置。
5.权利要求1的变化监视系统,其中每个所述平台具有一个变化控制状态;并且其中所述用于监视所述计算机系统的装置包括用于监视所述平台的所述变化控制状态的装置。
6.权利要求5的变化监视系统,其中所述用于存储所述样板的装置为每个所述平台存储所述样板中的一个样板;并且其中所述用于建立并管理的装置包括用于显示一个所述平台和对应的一个样板之间的差异的装置。
7.权利要求6的变化监视系统,其中所述用于确定所述变化控制状态的装置包括用于通知所述差异的装置。
8.权利要求1的变化监视系统,其中所述用于建立并管理的装置包括为多个所述平台建立所述样板中的一个样板的装置。
9.权利要求8的变化监视系统,其中对所述平台中的至少一个建立变化;并且其中所述用于监视所述计算机系统的装置包括用于判定正确地建立该变化的装置。
10.权利要求1的变化监视系统,其中一个所述平台包括所述产品中的多个;并且其中所述用于监视所述计算机系统的装置包括用于监视所述一个所述平台的所述多个产品的装置。
11.权利要求1的变化监视系统,其中一个所述平台包括多个目录;并且其中所述用于监视所述计算机系统的装置包括用于监视所述一个所述平台的所述多个目录的装置。
12.权利要求1的变化监视系统,其中所述平台中的至少一个具有在其上安装的所述产品中的至少一个,并且所述产品中的所述至少一个具有一个原始产品状态和一个已修改产品状态;其中所述用于存储所述样板的装置定义该原始产品状态;其中所述用于监视所述计算机系统的装置包括用于检测所述产品中的所述至少一个的已修改产品状态的装置;并且其中所述用于建立并管理的装置包括用于把所述产品中的所述至少一个恢复到该原始产品状态的装置。
13.权利要求12的变化监视系统,其中每个所述产品包括多个各具有一个原始文件状态和一个已修改文件状态的文件;其中所述用于检测该已修改产品状态的装置包括用于检测从该原始文件状态改变到该已修改文件状态的装置。
14.权利要求12的变化监视系统,其中每个所述产品具有一个变化控制状态,并且其中所述用于建立并管理的装置包括用于显示所述产品的所述变化控制状态的装置。
15.权利要求1的变化监视系统,其中所述用于建立并管理的装置包括用于显示所述样板中的一个样板的装置。
16.权利要求1的变化监视系统,其中所述用于监视所述计算机系统的装置包括用于向所述计算机系统显示变化的装置。
17.权利要求16的变化监视系统,其中所述用于向所述计算机系统显示变化的装置包括用于滤波所述变化以供显示的装置。
18.权利要求16的变化监视系统,其中所述用于向所述计算机系统显示变化的装置包括用于建立并显示质量保证记录的装置。
19.权利要求18的变化监视系统,其中每个所述平台具有一个品质控制状态;并且其中所述用于建立并显示质量保证记录的装置包括用于准备包含着所述平台的所述品质控制状态的报告的装置。
20.权利要求1的变化监视系统,其中所述多个产品包括至少一个的以前安装的产品和至少一个的新安装的产品;并且其中所述用于监视所述计算机系统的装置包括用于辨别因安装所述至少一个新安装的产品造成改变所述计算机系统的装置。
21.权利要求20的变化监视系统,其中所述用于辨别改变所述计算机系统的装置包括用于辨别因安装所述至少一个新安装的产品造成改变所述至少一个以前安装的产品的装置。
22.权利要求1的变化监视系统,其中所述产品包括多个在所述平台上安装的多个软件产品;并且其中所述用于监视所述计算机系统的装置包括用于辨别在所述计算机系统上安装的所述软件产品的装置。
23.权利要求22的变化监视系统,其中所述用于辨别所述软件产品的装置包括用于提供所述多个平台上所述软件产品中的一个的每个实例的计数。
24.权利要求22的变化监视系统,其中每个所述软件产品具有一个版本;并且其中所述用于辨别的装置包括用于辨别所述软件产品的版本的装置。
25.权利要求1的变化监视系统,其中在所述用于存储所述样板的装置上设置有关每个所述产品的信息;并且其中所述用于监视所述计算机系统的装置包括用于根据所述用于存储所述样板的装置的设置信息周期地确认所述产品的装置。
26.权利要求1的变化监视系统,其中在所述用于存储所述样板的装置上设置有关每个所述产品的信息;并且其中所述用于监视所述计算机系统的装置包括用于根据所述用于存储所述样板的装置的设置信息不定期地确认所述产品的装置。
27.权利要求1的变化监视系统,其中所述平台包括多个文件;其中所述样板包括文件管理信息;并且其中所述用于监视所述计算机系统的所述装置包括用于提供所述平台的文件管理控制的装置。
28.权利要求1的变化监视系统,其中所述平台包括硬件机构;其中所述样板包括用于所述硬件结构的硬件管理信息;并且其中所述用于监视所述计算机系统的装置包括用于提供所述平台的硬件管理控制的装置。
29.权利要求28的变化监视系统,其中所述硬件机构包括一个具有至少一个盘分配额、一个盘映射和一个盘安装的盘;并且其中所述用于提供硬件管理控制的装置包括用于监视所述盘分配额、所述盘映射和所述盘安装中的至少一个的装置。
30.权利要求1的变化监视系统,其中所述平台和所述产品包括多个各具有一个值的属性;其中所述样板包括一个用于所述各属性值的期望值表;并且所述用于监视所述计算机系统的所述装置包括用于比较所述属性值和所述表的期望值的装置。
31.权利要求30的变化监视系统,其中所述表包括用于每个所述期望值的严重性值,所述严重性值和所述属性值对所述表中的对应期望值的偏离相关;并且其中用于比较所述属性值和所述表的期望值的装置包括用于为每个所述偏离事例辨别每个所述属性以及对应的严重性值。
32.权利要求1的变化监视系统,其中每个所述平台包括多个各具有多个属性的进程;并且其中所述用于监视所述计算机系统的装置包括用于监视所述属性的装置。
全文摘要
一种用于计算机系统的变化监视系统包括用户建立并管理多个表示该计算机系统的样板的程序组。一个储存库存储这些样板。一个通信网络和该计算机系统的多个平台通信。一些程序把样板和该计算机系统的平台及多个软件产品之中的一些关联起来。其它程序根据这些样板为平台或软件产品的变化监视该计算机系统。
文档编号G06F11/34GK1316072SQ99810328
公开日2001年10月3日 申请日期1999年7月7日 优先权日1998年7月31日
发明者小劳伦斯·T·西科恩, 小托马斯·M·卡姆登, 杜安·E·阿尔特曼, 查尔斯·F·富勒, 哈罗德·J·库普, 格温多琳·施 申请人:西屋电气有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1