用于运维系统的设备管理方法和装置的制造方法

文档序号:10525640阅读:163来源:国知局
用于运维系统的设备管理方法和装置的制造方法
【专利摘要】本申请公开了用于运维系统的设备管理方法和装置。所述运维系统包括资源管理系统、故障池和交付池,所述资源管理系统用于执行设备的运维操作,所述故障池包括故障设备的集合,所述交付池包括完成运维的设备的集合;所述方法的一【具体实施方式】包括:查询故障池以确定是否存在故障设备;响应于确定出存在故障设备,向资源管理系统发送运维请求;接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备的相关信息添加至交付池。该实施方式能够实现故障设备的自动运维,降低了运维系统的人力成本,提升了运维效率。
【专利说明】
用于运维系统的设备管理方法和装置
技术领域
[0001]本申请涉及计算机技术领域,具体涉及设备的管理或维护技术领域,尤其涉及用于运维系统的设备管理方法和装置。
【背景技术】
[0002]现有的设备运维管理方案中,管理员在接收到机器管理系统监控到的报警信息后,需要人工确认故障类型,之后需先将故障机器下线,然后查找对应的服务器并发起报修;在完成运维后,管理员需要定时查询交付池是否有已完成运维的机器,在查询到已完成运维的机器时人工配置服务器的运行环境之后,通过交付池界面进行出池操作并启动监控,之后完成运维的机器才可以提供服务。随着设备数量的增多,运维需求量增大,上述方案中需要大量的人力来完成系统的运维,成本较高,并且人工监控无法对故障及时响应,运维效率较差。

【发明内容】

[0003]为了解决上述现有技术中的一个或多个问题,本申请提供了用于运维系统的设备管理方法和装置。
[0004]—方面,本申请提供了一种用于运维系统的设备管理方法,所述运维系统包括资源管理系统、故障池和交付池,资源管理系统用于执行设备的运维操作,故障池包括故障设备的集合,交付池包括完成运维的设备的集合;所述方法包括:查询故障池以确定是否存在故障设备;响应于确定出存在故障设备,向资源管理系统发送运维请求;接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池。
[0005]在一些实施中,所述方法还包括:监控故障设备的运维进度;对完成运维的故障设备进行业务环境和监控信息的配置;将配置好的故障设备从交付池中清除。
[0006]在一些实施中,查询故障池以确定是否存在故障设备,包括:通过故障查询接口查询故障池以确定是否存在故障设备;向资源管理系统发送运维请求,包括:利用运维发起接口向资源管理系统发送运维请求;监控故障设备的运维进度,包括:通过操作进度查询接口查询故障设备的运维进度。
[0007]在一些实施中,所述方法还包括:检测交付池中的设备是否已生效;清除交付池内已生效的设备;其中,检测交付池中的设备是否已生效包括:检测交付池中的设备的监控程序是否已运行和/或交付池中的设备是否已提供服务。
[0008]在一些实施中,查询故障池以确定是否存在故障设备,包括:查询故障池中是否存在满足预设报修条件的设备;将满足预设报修条件的设备作为故障设备。
[0009]在一些实施中,所述方法还包括:获取故障设备的故障信息;响应于确定出存在故障设备,按照预先配置的报修方式发送故障信息。
[0010]在一些实施中,所述方法还包括:查询故障池、交付池以及资源管理系统,以确定故障设备的状态信息;其中,状态信息包括:故障状态、运维状态以及待上线状态。
[0011]第二方面,本申请提供了一种用于运维系统的设备管理装置,运维系统包括资源管理系统、故障池和交付池,资源管理系统用于执行设备的运维操作,故障池包括故障设备的集合,交付池包括完成运维的设备的集合;所述装置包括:查询单元,用于查询故障池以确定是否存在故障设备;发送单元,用于响应于确定出存在故障设备,向资源管理系统发送运维请求;处理单元,用于接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池。
[0012]在一些实施中,所述装置还包括:监控单元,用于监控故障设备的运维进度;配置单元,用于对完成运维的故障设备进行业务环境和监控信息的配置;清除单元,用于将配置好的故障设备从交付池中清除。
[0013]在一些实施中,查询单元用于通过故障查询接口查询故障池以确定是否存在故障设备;发送单元用于利用运维发起接口向资源管理系统发送运维请求;监控单元用于通过操作进度查询接口查询故障设备的运维进度。
[0014]在一些实施中,所述装置还包括检测单元,用于:检测交付池中的设备是否已生效;以及清除交付池内已生效的设备;其中,检测交付池中的设备是否已生效包括:检测交付池中的设备的监控程序是否已运行和/或交付池中的设备是否已提供服务。
[0015]在一些实施中,查询单元用于按如下方式查询故障池以确定是否存在故障设备:查询故障池中是否存在满足预设报修条件的设备;将满足预设报修条件的设备作为故障设备。
[0016]在一些实施中,所述装置还包括报修单元,用于:获取故障设备的故障信息;响应于确定出存在故障设备,按照预先配置的报修方式发送故障信息。
[0017]在一些实施中,所述装置还包括更新单元,用于:查询故障池、交付池以及资源管理系统,以确定故障设备的状态信息;其中,状态信息包括:故障状态、运维状态以及待上线状态。
[0018]本申请提供的运维系统的设备管理方法和装置,通过查询故障池以确定是否存在故障设备,在确定存在故障设别时向资源管理系统发出运维请求,以供资源管理系统对故障设备进行运维操作,而后接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池,实现了故障设备的自动报修和自动运维,降低了运维系统的人力成本,提升了运维效率。
【附图说明】
[0019]通过阅读参照以下附图所作的对非限制性实施例详细描述,本申请的其它特征、目的和优点将会变得更明显:
[0020]图1是可以应用本申请的自动化运维系统的示意性的系统架构图;
[0021]图2是根据本申请的用于运维系统的设备管理方法的一个实施例的流程图;
[0022]图3是本申请的用于运维系统的设备管理方法的一个应用场景的原理示意图;
[0023]图4是根据本申请的用于运维系统的设备管理方法的另一个实施例的流程图;
[0024]图5是本申请的用于运维系统的设备管理方法的另一个应用场景的原理示意图;
[0025]图6是本申请用于运维系统的设备管理装置的一个实施例的结构示意图;
[0026]图7是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。
【具体实施方式】
[0027]下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
[0028]需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
[0029]请参考图1,其示出了可以应用本申请的自动化运维系统的示意性的系统架构图。
[0030]如图1所示,系统架构100包括终端设备101、设备管理服务器102以及资源管理服务器103等。其中,终端设备101可以通过有线连接或无线连接的方式与设备管理服务器102连接,设备管理服务器102可以通过有线连接或无线连接的方式与资源管理服务器103连接。
[0031]运维人员110可以使用终端设备101与设备管理服务器102交互。终端设备101可以安装控制设备管理服务器102的操作平台。运维人员110可以在操作平台上执行设备管理操作,终端设备101可以根据运维人员110的设备管理操作生成操作指令并向运维管理服务器发送该操作指令。操作平台还可以向运维人员110展示设备的运行状态和运维进度。
[0032]设备管理服务器102可以接收终端设备101发送的操作指令,对指令进行解析后生成运维请求,并向资源管理服务器103发出自动化运维处理请求。
[0033]资源管理服务器103可以执行自动化运维请求中包含的自动化运维任务,例如磁盘格式化、服务器下线等。
[0034]需要说明的是,需要说明的是,本申请实施例所提供的用于运维系统的设备管理方法一般由设备管理服务器102执行,相应地,用于运维系统的设备管理装置一般设置于设备管理服务器102中。
[0035]应该理解,图1中的终端设备、设备管理服务器、资源管理服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、设备管理服务器和资源管理服务器。
[0036]请参考图2,其示出了根据本申请的用于运维系统的设备管理方法的一个实施例的流程图。在本实施例中,运维系统可以包括资源管理系统(Resource Managing System,RMS)、故障池和交付池。其中,资源管理系统可以包括图1所示资源管理服务器103,用于执行设备的运维操作;故障池可以包括故障设备的集合,交付池可以包括完成运维的设备的集合。所述的用于运维系统的设备管理方法的流程200,包括以下步骤:
[0037]步骤201,查询故障池以确定是否存在故障设备。
[0038]运维系统可以对网络中的电子设备(包括服务器、终端),例如对数据中心的多台存储服务器进行运行维护。网络中的电子设备可以配置故障监控程序,当电子设备发生故障时可以被添加至故障池。故障池可以是故障设备的集合,其可以存储故障设备的相关信息,例如故障设备的标识信息。
[0039]在本实施例中,用于运维系统的设备管理方法运行于其上的电子设备(例如图1所示的设备管理服务器102)可以查询故障池,以确定当前是否存在故障设备。当故障池包含的设备数量大于零时,可以确定存在故障设备。这时,可以利用故障池存储的故障设备的相关信息标识出发生故障的设备。
[0040]在一些实施例中,用于运维系统的设备管理方法运行于其上的电子设备可以查询预定设备的运行状态。例如可以根据预定设备的标识在故障池中查询该设备是否位于故障池中,从而确定该预定设备是否发生故障。
[0041]在进一步的实施例中,用于运维系统的设备管理方法运行于其上的电子设备可以配置故障查询接口,则可以通过故障查询接口查询故障池以确定是否存在故障设备。
[0042]步骤202,响应于确定出存在故障设备,向资源管理系统发送运维请求。
[0043]在本实施例中,如果从故障池中查询出存在故障设备,可以停止故障设备的运行,将故障设备的业务迀移至其他的正常工作的设备中,即可以对故障设备进行下线处理。这时,可以向RMS发送运维请求。运维请求可以包括故障设备的标识信息和故障信息。RMS在接收到运维请求后,可以发起运维流程,对故障设备进行修复。
[0044]进一步地,RMS可以将接收到的运维请求转发至自动化运维系统,通过自动化运维系统中的任务分发模块将运维请求分发至对应的自动化任务处理服务器进行处理。具体地,自动换任务处理服务器可以对故障设备进行格式化、系统重装、重启、网络地址分配等运维操作,并将运维操作的状态信息反馈给RMS。在RMS接收到运维请求后,运维人员也可以介入运维操作过程,手动对故障设备进行修复。
[0045]在进一步的实施例中,用于运维系统的设备管理方法运行于其上的电子设备可以配置运维发起接口,则向资源管理系统发送运维请求,可以包括利用运维发起接口向资源管理系统RMS发送运维请求。运维发起接口可以包括与资源管理系统进行通信的接口,该接口支持资源管理系统的通信协议。
[0046]步骤203,接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池。
[0047]当故障设备完成运维时,资源管理系统RMS可以向用于运维系统的设备管理方法运行于其上的电子设备发送通知消息,以告知该电子设备故障设备已修复。用于运维系统的设备管理方法运行于其上的电子设备接收到通知消息后,可以将完成运维的故障设备添加至交付池。可选地,可以将完成运维的故障设备的相关信息保存在交付池中,例如将完成运维的故障设备的标识信息、资源配置信息等保存在交付池中。
[0048]交付池可以是完成运维的设备的集合,其可以存储完成运维的设备的相关信息。故障设备运维结束后可以被添加至交付池。交付池中的设备在经过管理员手动部署业务环境或根据业务需求自动部署业务环境后上线运行,提供服务。
[0049]在本实施例中,资源管理系统RMS可以向用于处理自动化运维任务的设备发出运维状态查询请求,用于处理自动化运维任务的设备接收到运维状态查询请求后会将运维状态反馈至资源管理系统RMS。在资源管理系统RMS接收到运维状态为“完成”的反馈消息后,可以自动向用于运维系统的设备管理方法运行于其上的电子设备发送运维完成的通知消息,以供该电子设备将完成运维的设备添加至交付池。
[0050]上述实施例中,用于运维系统的设备管理方法运行于其上的电子设备可以查询是否存在故障设备,并在确定存在故障设备时接入资源管理系统发起运维操作,故障设备的运维流程结束后可以自动发出通知,并被添加至交付池,无需人工关注是否存在故障设备和设备是否已结束运维流程,节省了运维系统的人力成本,同时提升了故障设备运维的响应速度,提升了运维效率。
[0051]在一些实施中,用于运维系统的设备管理方法还可以包括:监控故障设备的运维进度。具体地,可以通过资源管理系统查询运维流程的进度。进一步地,用于运维系统的设备管理方法运行于其上的电子设备可以配置操作进度查询接口,上述电子设备可以通过该接口与资源管理系统RMS进行通信连接,则可以进一步通过操作进度查询接口查询故障设备的运维进度。具体来说,资源管理系统RMS可以将从用于处理自动化运维任务的设备获取的运维状态信息通过操作进度查询接口发送至用于运维系统的设备管理方法运行于其上的电子设备。可选地,可以采用轮询的方式监控完成运维的设备,以便于在设备完成运维后立即启动业务环境和监控信息和配置,提升设备上线速度,降低故障修复耗时。
[0052]进一步地,用于运维系统的设备管理方法还可以包括:对完成运维的故障设备进行业务环境和监控信息的配置;以及将配置好的故障设备从交付池中清除。在故障设备的运维流程结束后,可以被添加至交付池。可以对交付池中的设备进行出池操作,包括对交付池中的设备进行业务环境和监控信息的配置。具体地,可以根据当前的业务需求配置已完成运维的设备的业务环境,启动对已完成的运维的设备的运行状态监控程序。之后,可以将配置好的故障设备从交付池中清除,已完成运维的设备可以重新上线,提供服务。在实际场景中,设备运维结束后可以自动通知待提供服务的产品线,按照产品线的需求提供业务环境部署和监控方案,完成后设备可以自动出池,在线上提供服务。相较于现有技术中在运维技术后人工部署业务环境并进行出池操作的方案,本实施例提供的方案进一步降低了人力成本,提升了设备上线的效率。
[0053]请参考图3,其示出了本申请的用于运维系统的设备管理方法的一个应用场景的原理示意图。
[0054]如图3所示,运维系统包括自动化运维平台31和设备管理平台32。设备管理平台32可以配置多个API(Applicat1n Programming Interface,应用程序编程接口),包括故障查询AP1、运维发起AP1、操作进度查询API以及机器出池API。运维系统的设备管理流程如下:在步骤301中通过故障查询API查询故障池是否存在故障设备,若存在则可以在步骤302中对故障设备进行机器下线、业务迀移操作,之后可以在步骤303中通过运维发起API发起运维流程。运维过程中在步骤304可以通过操作进度查询API查询运维进度,当运维流程结束后在步骤305中通过机器出池API进行设备业务环境的配置和部署以及生效监控程序,完成出池操作,之后在步骤306中设备可以上线提供服务,在实际场景中,在设备上线提供服务之后还可以将完成出池操作的设备从交付池中清除,将设备的状态由“运维中”更新为“正常运行”。
[0055]在进一步的实施例中,上述用于运维系统的设备管理方法还包括:检测交付池中的设备是否已生效,以及清除交付池内已生效的设备。可选地,可以清除交付池内已生效的设备的相关信息。具体来说,可以通过如下方式检测交付池中的设备是否已生效:检测交付池中的设备的监控程序是否已运行和/或交付池中的设备是否已提供服务。若交付池中的设备的监控程序已运行,或者交付池中的设备已提供服务,则可以确定该设备已生效。
[0056]交付池中有一些待出池并生效监控的设备实际上已经开始提供服务,但这些已生效的设备的相关信息还存储在交付池中,导致交付池数据不准确,本实施例中,可以通过检测交付池中的设备是否已生效并将已生效的设备从交付池中清除,能够提升运维系统中设备可用性的准确率,降低交付池的负载,提升运维效率。
[0057]继续参考图4,其示出了根据本申请的用于运维系统的设备管理方法的另一个实施例的流程图。在本实施例中,运维系统可以包括资源管理系统RMS、故障池和交付池。其中,资源管理系统可以包括图1所示资源管理服务器103,用于执行设备的运维操作;故障池可以包括故障设备的集合,交付池可以包括完成运维的设备的集合。所述的用于运维系统的设备管理方法的流程400,包括以下步骤:
[0058]步骤401,查询故障池中是否存在满足预设报修条件的设备,并将满足预设报修条件的设备作为故障设备。
[0059]运维系统可以对网络中的电子设备(包括服务器、终端),例如对数据中心的多台存储服务器进行运行维护。故障池可以是故障设备的集合,其可以存储故障设备的相关信息,例如故障设备的标识信息。
[0060]在本实施例中,用于运维系统的设备管理方法运行于其上的电子设备(例如图1所示的设备管理服务器102)可以查询故障池,判断故障池中是否存在满足预设报修条件的设备。其中,预设报修条件可以由管理员配置。管理员可以根据产品线的需求配置预设报修条件,当产品线中的设备满足该预设报修条件时可以自动发起报修。在一些可选的实现方式中,用于运维系统的设备管理方法运行于其上的电子设备可以自动根据产品线的需求配置预设报修条件,可选地,管理员可以审核自动配置的预设报修条件,审核通过后预设报修条件生效。可以将故障池中满足预设报修条件的设备作为待运维的故障设备。
[0061 ]步骤402,获取故障设备的故障信息。
[0062]在本实施例中,用于运维系统的设备管理方法运行于其上的电子设备可以获取步骤401确定出的满足预设报修条件的故障设备的故障信息。其中故障信息可以包括故障类型、故障时间、故障原因等。其中故障类型可以例如为硬件类、软件类,故障原因可以包括数据量过大、磁盘损坏等。故障设备可以将其故障信息发送给上述电子设备,上述电子设备也可以利用配置于故障设备中的监控程序或日志搜集程序获取故障的相关信息,根据监控程序或日志确定故障设备的故障信息。
[0063]步骤403,响应于确定出存在故障设备,按照预先配置的报修方式发送故障信息。
[0064]在确定出存储满足预设报修条件的故障设备之后,可以自动发起报修,按照预先配置的方式发送故障信息。其中,发送故障信息的方式可以由管理员预先配置,可以包括向指定的邮箱发送邮件、生成报警信息并呈现在管理员的运维管理操作界面中等方式。发送的故障信息中可包括故障类型、故障时间、故障原因等信息,管理员或资源管理系统可以根据故障信息快速、准确地定位故障并进行相应的运维操作。
[0065]步骤404,响应于确定出存在故障设备,向资源管理系统发送运维请求。
[0066]在本实施例中,可以对故障设备进行下线处理并向RMS发送运维请求。运维请求可以包括故障设备的标识信息和故障信息。RMS在接收到运维请求后,可以发起运维流程,对故障设备进行修复。
[0067]步骤405,接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池。
[0068]当故障设备完成运维时,资源管理系统RMS可以向用于运维系统的设备管理方法运行于其上的电子设备发送通知消息,以告知该电子设备故障设备已修复。用于运维系统的设备管理方法运行于其上的电子设备接收到通知消息后,可以将完成运维的故障设备添加至交付池。可选地,可以将完成运维的故障设备的相关信息保存在交付池中,例如将完成运维的故障设备的标识信息、资源配置信息等保存在交付池中。
[0069]上述实现流程中,步骤404、405分别与前述实施例中的步骤202、203相同,此处不再赘述。
[0070]从图4中可以看出,与图2对应的实施例相比,本实施例中的用于运维系统的设备管理方法的流程400细化了确定故障设备的步骤,并增加了满足预设报修条件时自动发送故障信息的步骤。由此,本实施例描述的方案可以支持产品线配置报修规则,当有符合报修规则的设备故障时,可以自动发起报修,进一步提升了运维效率。
[0071]请参考图5,其示出了本申请的用于运维系统的设备管理方法中的自动报修的应用场景的原理示意图,也即示出了上述流程400中步骤401、步骤402和步骤403的具体应用场景示意图。如图5所示,自动化运维平台51或管理员52可以在步骤501中为设备管理平台53配置自动报修规则,包括自动报修的故障类型、自动报修的故障原因等,之后管理员可以在步骤502中审核自动报修规则,审核通过后步骤503中自动报修规则生效。设备管理平台53在步骤504中发现符合自动报修规则的机器后可以在步骤505中发起故障报修流程,通知管理员51或自动化运维平台52设备发生故障,通知的方式可以包括邮件通知、生成通知消息并发送等。之后管理员51或自动化运维平台可以对故障设备进行修复并重新部署服务后上线,设备管理平台53可以接收运维完成的通知消息。
[0072]在一些实施例中,上述用于运维系统的设备管理方法的流程还可以包括:查询故障池、交付池以及资源管理系统,以确定故障设备的状态信息。其中,状态信息包括:故障状态、运维状态以及待上线状态。
[0073]如果在故障池中查找到设备的相关信息,可以确定设备的状态信息为故障状态;如果在交付池中查找到设备的相关信息,可以确定设备的状态信息为待上线状态,如果在资源管理系统的运维流程中查找到设备的相关信息,可以确定设备的状态信息为运维状态。据此,可以实时地更新设备的状态,无需人工监控设备状态,有利于运维系统的高效运行。
[0074]进一步参考图6,作为对上述各图所示方法的实现,本申请提供了用于运维系统的设备管理装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中(例如图1所示的设备管理服务器102中)。其中,运维系统包括括资源管理系统、故障池和交付池,资源管理系统用于执行设备的运维操作,故障池包括故障设备的集合,交付池包括完成运维的设备的集合。
[0075]如图6所示,本实施例所述的用于运维系统的设备管理装置600包括:查询单元601、发送单元602以及处理单元603。其中,查询单元601用于查询故障池以确定是否存在故障设备;发送单元602用于响应于确定出存在故障设备,向资源管理系统发送运维请求;处理单元603用于接收资源管理系统发送的运维完成的通知消息,将完成运维的故障设备添加至交付池。
[0076]在本实施例中,运维系统可以对大量的电子设备(包括服务器、终端)进行运行维护。这些电子设备可以配置故障监控程序,当电子设备发生故障时可以被添加至故障池。故障池可以存储故障设备的相关信息,例如故障设备的标识信息。查询单元601可以查询故障池包含的设备数量是否大于零,若是,则确定存在故障设备。可选地,查询单元601可以查询预定设备的运行状态。例如可以根据预定设备的标识在故障池中查询该设备是否位于故障池中,从而确定该预定设备是否发生故障。
[0077]如果查询单元601确定存在故障设备,可以对故障设备进行下线处理。这时,发送单元602可以向资源管理系统RMS发送运维请求。运维请求可以包括故障设备的标识信息和故障信息。资源管理系统RMS在接收到运维请求后,可以发起运维流程,对故障设备进行修复。
[0078]当故障设备完成运维时,资源管理系统RMS可以发送通知消息,以告知该故障设备已修复。处理单元603可以接收资源管理系统RMS发送的通知消息,之后将完成运维的故障设备添加至交付池。可选地,可以将完成运维的故障设备的相关信息(包括标识信息、资源配置信息等)保存在交付池中。
[0079]在一些实施例中,查询单元601用于按如下方式查询故障池以确定是否存在故障设备:查询故障池中是否存在满足预设报修条件的设备;将满足预设报修条件的设备作为故障设备。其中,预设报修条件可以由管理员配置根据产品线的需求配置,也可以由查询单元自动根据产品线的需求进行配置。当产品线中的设备满足该预设报修条件时可以自动发起报修。
[0080]进一步地,装置600还可以包括报修单元,用于:获取故障设备的故障信息;响应于确定出存在故障设备,按照预先配置的报修方式发送故障信息。报修单元可以利用配置于故障设备中的监控程序或日志搜集程序获取故障信息,包括故障类型、故障时间、故障原因等。之后可以按照预先配置的报修方式发送故障信息。预先配置的报修方式可以例如为邮件通知。
[0081]在本实施例的一些可选的实现方式中,装置600还包括监控单元,用于监控故障设备的运维进度。监控单元可以通过资源管理系统RMS获取故障设备的运维进度,在监控单元监控到故障设备运维完成时处理单元603将故障设备添加至交付池中。
[0082]进一步地,装置600还可以包括配置单元和清除单元。配置单元用于对完成运维的故障设备进行业务环境和监控信息的配置。在处理单元603将完成运维的故障设备添加至交付池后,配置单元可以按照产品线的需求对设备的业务环境进行部署,还可以启动监控程序,以对设备的业务状态进行监控。清除单元用于将配置好的故障设备从交付池中清除。之后配置好的故障设备可以重新上线提供服务。
[0083]在进一步的实施例中,查询单元用于通过故障查询接口查询故障池以确定是否存在故障设备,发送单元用于利用运维发起接口向资源管理系统发送运维请求,监控单元用于通过操作进度查询接口查询故障设备的运维进度。
[0084]在一些实施例中,装置600还包括检测单元,用于:检测交付池中的设备是否已生效;以及清除交付池内已生效的设备。当设备已上线提供服务或设备中的监控程序已开始运行时,可以确定设备已生效。则检测交付池中的设备是否已生效包括:检测交付池中的设备的监控程序是否已运行和/或交付池中的设备是否已提供服务。在设备已上线提供服务后,清除单元可以将交付池中该设备的相关信息清除,从而提升运维系统中设备可用率的准确性。
[0085]在一些实施例中,装置600还包括可以更新单元,用于:查询故障池、交付池以及资源管理系统,以确定故障设备的状态信息。其中,状态信息包括:故障状态、运维状态以及待上线状态。如果在故障池中查找到设备的相关信息,可以将设备的状态信息更新为故障状态;如果在交付池中查找到设备的相关信息,可以将设备的状态信息更新为待上线状态,如果在资源管理系统的运维流程中查找到设备的相关信息,可以将设备的状态信息更新为运维状态。据此,可以实时地更新设备的状态,无需人工监控设备状态,有利于运维系统的高效运行。
[0086]本领域技术人员可以理解,上述装置600还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图6中未示出。
[0087]本申请上述实施例提供的用于运维系统的设备管理装置600,能够实现故障设备的自动报修和自动运维,降低了运维系统的人力成本,提升了运维效率。
[0088]下面参考图7,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统700的结构示意图。
[0089]如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(R0M)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM 703中,还存储有系统700操作所需的各种程序和数据。CPU 70KROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线 704。
[0090]以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706 ;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口 705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便于从其上读出的计算机程序根据需要被安装入存储部分708。
[0091]特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元(CPU)701执行时,执行本申请的方法中限定的上述功能。
[0092]附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0093]描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括查询单元、发送单元和处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,查询单元还可以被描述为“用于查询故障池以确定是否存在故障设备的单元”。
[0094]作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,应用于运维系统,该运维系统包括资源管理系统、故障池和交付池,所述资源管理系统用于执行设备的运维操作,所述故障池包括故障设备的集合,所述交付池包括完成运维的设备的集合。当所述一个或者多个程序被一个设备执行时,使得所述设备:查询所述故障池以确定是否存在故障设备;响应于确定出存在所述故障设备,向所述资源管理系统发送运维请求;接收资源管理系统发送的运维完成的通知消息,将完成运维的所述故障设备添加至所述交付池。
[0095]以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
【主权项】
1.一种用于运维系统的设备管理方法,其特征在于,所述运维系统包括资源管理系统、故障池和交付池,所述资源管理系统用于执行设备的运维操作,所述故障池包括故障设备的集合,所述交付池包括完成运维的设备的集合;所述方法包括: 查询所述故障池以确定是否存在故障设备; 响应于确定出存在所述故障设备,向所述资源管理系统发送运维请求; 接收资源管理系统发送的运维完成的通知消息,将完成运维的所述故障设备添加至所述交付池。2.根据权利要求1所述的方法,其特征在于,所述方法还包括: 监控所述故障设备的运维进度; 对完成运维的所述故障设备进行业务环境和监控信息的配置; 将配置好的所述故障设备从交付池中清除。3.根据权利要求2所述的方法,其特征在于,所述查询所述故障池以确定是否存在故障设备,包括: 通过故障查询接口查询所述故障池以确定是否存在故障设备; 所述向所述资源管理系统发送运维请求,包括: 利用运维发起接口向所述资源管理系统发送运维请求; 所述监控所述故障设备的运维进度,包括: 通过操作进度查询接口查询所述故障设备的运维进度。4.根据权利要求2所述的方法,其特征在于,所述方法还包括: 检测所述交付池中的设备是否已生效; 清除所述交付池内已生效的设备; 其中,检测所述交付池中的设备是否已生效包括: 检测所述交付池中的设备的监控程序是否已运行和/或所述交付池中的设备是否已提供服务。5.根据权利要求1所述的方法,其特征在于,所述查询所述故障池以确定是否存在故障设备,包括: 查询所述故障池中是否存在满足预设报修条件的设备; 将满足所述预设报修条件的设备作为所述故障设备。6.根据权利要求5所述的方法,其特征在于,所述方法还包括: 获取所述故障设备的故障信息; 响应于确定出存在所述故障设备,按照预先配置的报修方式发送所述故障信息。7.根据权利要求1-6任一项所述的方法,其特征在于,所述方法还包括: 查询所述故障池、所述交付池以及所述资源管理系统,以确定所述故障设备的状态信息; 其中,所述状态信息包括:故障状态、运维状态以及待上线状态。8.—种用于运维系统的设备管理装置,其特征在于,所述运维系统包括资源管理系统、故障池和交付池,所述资源管理系统用于执行设备的运维操作,所述故障池包括故障设备的集合,所述交付池包括完成运维的设备的集合;所述装置包括: 查询单元,用于查询所述故障池以确定是否存在故障设备; 发送单元,用于响应于确定出存在所述故障设备,向所述资源管理系统发送运维请求;处理单元,用于接收所述资源管理系统发送的运维完成的通知消息,将完成运维的所述故障设备添加至所述交付池。9.根据权利要求8所述的装置,其特征在于,所述装置还包括: 监控单元,用于监控所述故障设备的运维进度; 配置单元,用于对完成运维的所述故障设备进行业务环境和监控信息的配置; 清除单元,用于将配置好的所述故障设备从交付池中清除。10.根据权利要求9所述的装置,其特征在于,所述查询单元用于通过故障查询接口查询所述故障池以确定是否存在故障设备; 所述发送单元用于利用运维发起接口向所述资源管理系统发送运维请求; 所述监控单元用于通过操作进度查询接口查询所述故障设备的运维进度。11.根据权利要求9所述的装置,其特征在于,所述装置还包括检测单元,用于: 检测所述交付池中的设备是否已生效;以及 清除所述交付池内已生效的设备; 其中,检测所述交付池中的设备是否已生效包括: 检测所述交付池中的设备的监控程序是否已运行和/或所述交付池中的设备是否已提供服务。12.根据权利要求8所述的装置,其特征在于,所述查询单元用于按如下方式查询所述故障池以确定是否存在故障设备: 查询所述故障池中是否存在满足预设报修条件的设备; 将满足所述预设报修条件的设备作为所述故障设备。13.根据权利要求12所述的装置,其特征在于,所述装置还包括报修单元,用于: 获取所述故障设备的故障信息; 响应于确定出存在所述故障设备,按照预先配置的报修方式发送所述故障信息。14.根据权利要求8-13任一项所述的装置,其特征在于,所述装置还包括更新单元,用于: 查询所述故障池、所述交付池以及所述资源管理系统,以确定所述故障设备的状态信息; 其中,所述状态信息包括:故障状态、运维状态以及待上线状态。
【文档编号】H04L12/24GK105897487SQ201610411090
【公开日】2016年8月24日
【申请日】2016年6月13日
【发明人】王洋
【申请人】北京百度网讯科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1