一种故障检测方法和装置的制造方法

文档序号:9219639阅读:278来源:国知局
一种故障检测方法和装置的制造方法
【技术领域】
[0001]本发明涉及移动通信技术领域,尤其涉及一种故障检测方法和装置。
【背景技术】
[0002]随着计算机技术的迅猛发展,计算机已经逐渐深入到我们工作和生活的各个方面。而随着各种计算业务量的快速增长,后端承载业务的互联网数据中心(Internet DataCenter)机房的规模也在呈几何倍数的扩大,动辄成千上万台的主机的机房也非常常见。
[0003]在这种大规模主机集群环境中,经常需要进行操作系统安装部署工作,目前主流的操作系统安装部署方式都是基于预启动执行环境(Preboot Execute Environment,PXE)技术实现的。具体的,在局域网内部设置PXE服务器,目标主机设置为网络引导启动,当目标主机启动后会向网络上发送动态主机配置协议(Dynamic Host Configurat1nProtocol, DHCP)请求包,当PXE服务器收到这个请求包后会应答这个请求,分配网际协议(Internet Protocol, IP)地址给目标主机,目标主机则通过简单文件传输协议(TrivialFile Transfer Protocol, TFTP)或多点简单文件传输协议(Multicast Trivial FileTransfer Protocol,MTFTP)从PXE服务器下载一个启动软件包到本机内存中执行。启动软件包后会依照预先设定的步骤将操作系统安装到本地。
[0004]以上技术可以解决大规模主机集群操作系统安装的问题,但是在启动软件包运行启动以后,目标主机和PXE服务器进入自动交互状态,这时便无法获取操作系统安装状态,只有在操作系统安装完成后才可以获取操作系统安装成功结果。而对于操作系统安装过程中出现故障的情况,只有工作人员去主机机房进行人工确认才能获得。

【发明内容】

[0005]本发明实施例提供一种故障检测方法和装置,用以解决现有技术中存在的当操作系统安装过程中出现故障时无法及时获知的问题。
[0006]本发明实施例采用以下技术方案:
[0007]一种故障检测方法,包括:
[0008]通过目标主机的智能平台管理接口 IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
[0009]根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
[0010]当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消肩、O
[0011]可选的,通过目标主机的IPMI获取所述目标主机的屏幕图像,具体包括:
[0012]按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
[0013]根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态,具体包括:
[0014]判断相邻时间间隔获取的屏幕图像是否相同;
[0015]当判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;
[0016]当判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
[0017]可选的,根据所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态,具体包括:
[0018]判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
[0019]当判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;
[0020]当判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
[0021]可选的,所述方法还包括:
[0022]当确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
[0023]根据对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
[0024]输出用于表征所述目标主机的操作系统的当前所处的安装阶段的通知消息。
[0025]可选的,所述屏幕图像以位图或矢量图格式存储。
[0026]本发明实施例还提供了一种故障检测装置,包括:
[0027]获取模块,用于通过目标主机的智能平台管理接口 IPMI获取所述目标主机处于操作系统安装过程中的屏幕图像;
[0028]安装状态确定模块,用于根据获取模块获取的所述屏幕图像的显示内容,确定所述目标主机的操作系统的安装状态;
[0029]告警消息输出模块,用于当安装状态确定模块确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息。
[0030]可选的,所述获取模块,具体用于:
[0031]按照预先设置的时间间隔,通过目标主机的IPMI获取所述目标主机的屏幕图像;则
[0032]所述安装状态确定模块,具体包括:
[0033]第一判断单元,用于判断相邻时间间隔获取的屏幕图像是否相同;
[0034]第一结果单元,用于当第一判断单元判断出相邻时间间隔获取的屏幕图像相同时,确定所述目标主机的操作系统的安装状态为异常;当第一判断单元判断出相邻时间间隔获取的屏幕图像不相同时,确定所述目标主机的操作系统的安装状态为正常。
[0035]可选的,所述安装状态确定模块,具体包括:
[0036]第二判断单元,用于判断所述屏幕图像中是否存在预先设置的用于表征操作系统安装过程中出现异常的特征图像;
[0037]第二结果单元,用于当第二判断单元判断出所述屏幕图像中存在所述特征图像时,确定所述目标主机的操作系统的安装状态为异常;当第二判断单元判断出所述屏幕图像中不存在所述特征图像时,确定所述目标主机的操作系统的安装状态为正常。
[0038]可选的,所述装置还包括:
[0039]对比模块,用于当安装状态确定模块确定出的安装状态为正常时,将所述屏幕图像和预先存储的与操作系统安装进程中的每个安装阶段分别对应的阶段图像进行对比;
[0040]安装阶段确定模块,用于根据对比模块的对比结果,确定所述目标主机的操作系统当前所处的安装阶段;
[0041]通知消息输出模块,用于输出用于表征安装阶段确定模块确定出的所述目标主机的操作系统的当前所处的安装阶段的通知消息。
[0042]可选的,所述屏幕图像以位图或矢量图格式存储。
[0043]本发明实施例的有益效果如下:
[0044]本发明实施例中,通过获取处于操作系统安装过程中的目标主机的屏幕图像,并根据获取的屏幕图像的显示内容,确定目标主机的操作系统的安装状态,当确定出的安装状态为异常时,输出用于提示当前操作系统安装异常的告警消息,与现有技术相比,当操作系统安装过程中出现故障时,能够根据屏幕图像的显示内容快速判断出异常,而无需人为主动去确认故障,缩短了对故障的判断时间,提高了大规模主机集群操作系统安装过程中的故障识别效率。
【附图说明】
[0045]图1为现有技术中大规模主机集群的操作系统安装过程实现示意图;
[0046]图2为现有技术中大规模主机集群中的目标主机完成操作系统安装的实现示意图;
[0047]图3为本发明实施例提供
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1