一种服务器系统故障诊断方法、系统、存储介质及设备与流程

文档序号:35988614发布日期:2023-11-15 17:56阅读:37来源:国知局
一种服务器系统故障诊断方法、系统、存储介质及设备与流程

本发明涉及服务器,尤其涉及一种服务器系统故障诊断方法、系统、存储介质及设备。


背景技术:

1、实际中,服务器机房环境较为嘈杂,且位置较为偏僻,不利于管理员现场进行监管和维护服务器;且机房内服务器数量众多,如果需要对不同的服务器进行操作,那么需要通过鼠标、键盘和屏幕与不同的服务器进行连接,十分麻烦;而kvm(keyboard video mouse,键盘,视频,鼠标)技术的出现可以让管理员通过远程pc(个人计算机)端就可以实现对机房内的服务器进行监管与操作。

2、为了实现对服务器的24小时监测,在休息时刻,管理员可以设置kvm按照一定的时间间隔对系统屏幕内容进行截图,并且对所截图片按照时间顺序进行命名,然后保存到特定的文件夹内,这样在管理员在结束休息后便可以通过查看截图了解对应时间段服务器的运行状况。但是仅凭截图难以进行准确故障诊断,还需要结合对应时刻的sel日志(系统事件日志)进行判断,但是sel日志存放的位置与截图图片的存放位置不同,且数量巨大,难以快速定位到故障时刻的sel日志,造成故障诊断的效率较低。

3、现有的技术是将截屏图片和sel日志都分别存放在bmc(baseboard managementcontroller,基板管理控制器)本地不同的文件夹下,当系统出现故障时,维护人员通过分别查看系统出现故障时的截屏图片以及记录的sel日志定位问题所在,但是大量的sel日志难以和相同时刻的截图相对应,造成定位故障的效率低下;并且在不同故障出现的情况下可能造成的系统显示相同,但是sel日志又是实时刷新的,更新速度较快,如果不及时将sel日志与当时状态下的系统显示对应,极有可能造成故障分析错误,定位问题的难度将大大增加。


技术实现思路

1、有鉴于此,本发明的目的在于提出一种服务器系统故障诊断方法、系统、存储介质及设备,用以解决现有技术中由于sel日志数量庞大且实时更新,导致难以将出现故障时刻下的系统截屏图片与相同时刻下记录的sel日志相对应,导致故障定位效率低的问题。

2、基于上述目的,本发明提供了一种服务器系统故障诊断方法,包括以下步骤:

3、通过kvm对服务器的系统进行故障监测;

4、响应于监测到系统出现故障,通过kvm对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息,日志用于实时记录系统的运行状态;

5、将系统故障画面与最新日志信息合并至同一画面,并通过kvm截取合并后的画面,以基于合并后的画面对系统故障进行诊断。

6、在一些实施例中,通过kvm对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息包括:

7、通过kvm对当前显示的系统故障画面进行截取,并将截取的系统故障画面存放至第一缓存中;

8、通过kvm获取预设数目的最新日志信息,并将最新日志信息存放至第二缓存中。

9、在一些实施例中,将系统故障画面与最新日志信息合并至同一画面,并通过kvm截取合并后的画面包括:

10、从第一缓存中获取系统故障画面,并使用图像缩放算法对系统故障画面进行等比例缩放,得到缩放画面,并将缩放画面存放至第三缓存的部分空间,第三缓存的空间大小与画面所占的空间大小相同;

11、从第二缓存中获取最新日志信息,并将获取的最新日志信息存放至第三缓存的剩余部分空间;

12、将第三缓存中的内容显示至kvm,并通过kvm将第三缓存中的当前显示内容进行截取。

13、在一些实施例中,图像缩放算法为二次线性插值图像缩放算法。

14、在一些实施例中,基于合并后的画面对系统故障进行诊断包括:

15、通过合并后的画面确定预设数目的最新日志信息中与系统故障画面所对应的日志信息,并基于对应的日志信息与系统故障画面对系统故障进行诊断。

16、在一些实施例中,获取预设数目的最新日志包括:

17、通过调用服务器的bmc的d-bus接口获取预设数目的最新日志。

18、在一些实施例中,方法还包括:

19、响应于系统出现故障,服务器的cpld根据各运行模块的比特位状态生成对应的日志信息。

20、本发明的另一方面,还提供了一种服务器系统故障诊断系统,包括:

21、监测模块,配置用于通过kvm对服务器的系统进行故障监测;

22、获取模块,配置用于响应于监测到系统出现故障,通过kvm对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息,日志用于实时记录系统的运行状态;以及

23、合并模块,配置用于将系统故障画面与最新日志信息合并至同一画面,并通过kvm截取合并后的画面,以基于合并后的画面对系统故障进行诊断。

24、本发明的又一方面,还提供了一种计算机可读存储介质,存储有计算机程序指令,该计算机程序指令被处理器执行时实现上述方法。

25、本发明的再一方面,还提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该计算机程序被处理器执行时执行上述方法。

26、本发明至少具有以下有益技术效果:

27、本发明的服务器系统故障诊断方法,通过利用kvm的截屏功能,在监测到系统出现故障时通过kvm对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息,并将系统故障画面与最新日志信息合并至同一画面,通过kvm截取合并后的画面,以基于合并后的画面对系统故障进行诊断,从而能够将系统故障和故障出现时的日志进行对应,从而了解系统出故障时的具体表现,并且能够区别相同的系统表现下的故障具体是什么,从而可以提高服务器故障定位的效率,以及提高服务器故障诊断的准确性,同时也可以积累不同故障下系统显示情况的数据,便于统计服务器的各种故障情况。



技术特征:

1.一种服务器系统故障诊断方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,通过所述kvm对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息包括:

3.根据权利要求2所述的方法,其特征在于,将所述系统故障画面与所述最新日志信息合并至同一画面,并通过所述kvm截取合并后的画面包括:

4.根据权利要求3所述的方法,其特征在于,所述图像缩放算法为二次线性插值图像缩放算法。

5.根据权利要求1所述的方法,其特征在于,基于所述合并后的画面对所述系统故障进行诊断包括:

6.根据权利要求1所述的方法,其特征在于,获取预设数目的最新日志包括:

7.根据权利要求1所述的方法,其特征在于,还包括:

8.一种服务器系统故障诊断系统,其特征在于,包括:

9.一种计算机可读存储介质,其特征在于,存储有计算机程序指令,所述计算机程序指令被处理器执行时实现如权利要求1-7任意一项所述的方法。

10.一种计算机设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时执行如权利要求1-7任意一项所述的方法。


技术总结
本发明提供了一种服务器系统故障诊断方法、系统、存储介质及设备,方法包括:通过KVM对服务器的系统进行故障监测;响应于监测到系统出现故障,通过KVM对当前显示的系统故障画面进行截取,并获取预设数目的最新日志信息,日志用于实时记录系统的运行状态;将系统故障画面与最新日志信息合并至同一画面,并通过KVM截取合并后的画面,以基于合并后的画面对系统故障进行诊断。本发明可以提高服务器故障定位的效率,以及提高服务器故障诊断的准确性。

技术研发人员:郑国伟,王兴隆,叶笑夕,谭艳
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:
技术公布日:2024/1/16
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1