一种交换机异常信息确定方法、装置、设备及介质与流程

文档序号:34011085发布日期:2023-04-29 22:29阅读:40来源:国知局
一种交换机异常信息确定方法、装置、设备及介质与流程

本发明涉及计算机,特别涉及一种交换机异常信息确定方法、装置、设备及介质。


背景技术:

1、bios(basic input output system,基础输入输出系统),是刻在主板rom(read-only memory,只读存储器)芯片上不可篡改的启动程序,bios负责计算系统自检程序(post,power on self test)和系统自启动程序。由于不可篡改性,故程序存储在rom芯片中,并且在断电后,依然可以维持原有设置。bios主要功能是控制交换机或服务器设备启动后的基本程式,包括硬盘驱动(如装机过程中优先选择硬盘启动、网络启动或者usb(universal serial bus,通用串行总线)启动盘),串口输出设置,内存和相关设备。作为交换机系统启动后的第一道程式,一旦bios代码出现漏洞,可能会造成整机宕机的严重后果。对于研发与测试工程师来说,启动宕机问题属于致命问题,是需要以最高优先级集中资源进行定位诊断的。然而此类问题一旦发生,留给研发人员进行问题定位的手段是极其有限的。在交换机新产品的研发测试阶段,在发生启动卡死或宕机此类致命问题后,留给研发人员进行问题定位的手段有限。对于该问题的传统定位方法:重新启动交换机打开biosdebug模式(计算机排除故障模式)后进行问题复现,debug模式开启后,启动时bios会将整套代码执行过程信息打印至串口,一旦复现到该问题,研发人员可定位到发生宕机时代码正在执行的详细位置,即可完成问题定位并进行分析与修复工作。对于现有交换机bios发生宕机问题普遍采用的定位方案,当手动开启debug模式后,在post(power on self test,加电自检)阶段bios将通过串口打印输出详细的启动日志。由于debug模式是默认关闭的,发生宕机问题后需要重启交换机进入bios开启debug模式后再进行问题再次复现。然而对于小概率发生的卡死问题,极有可能由于开启debug后无法再次复现到问题从而增加定位难度,甚至失去定位问题的机会,并且debug模式不会默认开启,因为开启debug模式后,大量代码信息需要打印,开机时间会被严重拉长,且启动界面杂乱影响用户体验。

2、由上可见,如何增加交换机异常信息确定的准确性,提高交换机异常信息确定的效率,避免出现小概率问题导致无法确定交换机异常信息的情况是本领域有待解决的问题。


技术实现思路

1、有鉴于此,本发明的目的在于提供一种交换机异常信息确定方法、装置、设备及介质,能够增加交换机异常信息确定的准确性,提高交换机异常信息确定的效率,避免出现小概率问题导致无法确定交换机异常信息的情况。其具体方案如下:

2、第一方面,本技术公开了一种交换机异常信息确定方法,应用于交换机,包括:

3、判断本地的预设数据包中的计算机排除故障命令是否为启动;

4、若本地的预设数据包中的计算机排除故障命令为启动,则将自身的计算机排除故障模式置为开启状态,以得到用于表征计算机排除故障启动的详细日志;

5、将所述详细日志发送并保存至本地的基板管理控制器,并对自身进行异常检测,若检测异常,则发送异常提示信息至客户端,以便客户端从所述基板管理控制器的所述详细日志中确定出交换机异常信息。

6、可选的,所述判断本地的预设数据包中的计算机排除故障命令是否为启动,包括:

7、当检测到自身上电之后,对自身进行安全性认证,若安全性认证通过,则判断本地的预设数据包中的计算机排除故障命令是否为启动。

8、可选的,所述以得到用于表征计算机排除故障启动的详细日志之后,还包括:

9、利用预设的日志简化指令对所述详细日志进行简化,以得到简化后的日志;

10、利用预设的串口将所述简化后的日志打印输出至客户端。

11、可选的,所述将所述详细日志发送并保存至本地的基板管理控制器,包括:

12、调用预设的发送数据函数和接收数据函数并利用lpc总线下的kcs接口建立本地的基本输入输出系统与所述基板管理控制器之间通信链路;

13、基于所述基本输入输出系统并利用所述通信链路将所述详细日志发送并保存至本地的基板管理控制器。

14、可选的,所述将所述详细日志发送并保存至本地的基板管理控制器之后,还包括:

15、确定出所述基板管理控制器的当前系统时间,并基于所述当前系统时间生成时间戳;

16、将所述时间戳添加至所述详细日志。

17、可选的,所述发送异常提示信息至客户端,以便客户端从所述基板管理控制器的所述详细日志中确定出交换机异常信息,包括:

18、生成并发送用于表征自身检测出现异常的异常提示信息至客户端,以便客户端基于所述异常提示信息确定出目标时间戳,并根据所述目标时间戳从所述详细日志中确定出用于表征计算机排除故障启动异常的交换机异常信息。

19、可选的,所述对自身进行异常检测之后,还包括:

20、若检测不异常,则获取设备启动加载项,根据业务需求从所述设备启动加载项中确定出目标操作系统;

21、利用预设的操作系统加载器执行所述目标操作系统。

22、第二方面,本技术公开了一种交换机异常信息确定装置,包括:

23、判断模块,用于判断本地的预设数据包中的计算机排除故障命令是否为启动;

24、详细日志确定模块,用于若本地的预设数据包中的计算机排除故障命令为启动,则将自身的计算机排除故障模式置为开启状态,以得到用于表征计算机排除故障启动的详细日志;

25、交换机异常信息确定模块,用于将所述详细日志发送并保存至本地的基板管理控制器,并对自身进行异常检测,若检测异常,则发送异常提示信息至客户端,以便客户端从所述基板管理控制器的所述详细日志中确定出交换机异常信息。

26、第三方面,本技术公开了一种电子设备,包括:

27、存储器,用于保存计算机程序;

28、处理器,用于执行所述计算机程序,以实现前述的交换机异常信息确定方法。

29、第四方面,本技术公开了一种计算机存储介质,用于保存计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的交换机异常信息确定方法的步骤。

30、可见,本技术提供了一种交换机异常信息确定方法,包括判断本地的预设数据包中的计算机排除故障命令是否为启动;若本地的预设数据包中的计算机排除故障命令为启动,则将自身的计算机排除故障模式置为开启状态,以得到用于表征计算机排除故障启动的详细日志;将所述详细日志发送并保存至本地的基板管理控制器,并对自身进行异常检测,若检测异常,则发送异常提示信息至客户端,以便客户端从所述基板管理控制器的所述详细日志中确定出交换机异常信息。本技术改进原有交换机bios宕机问题发生后的定位流程,交换机上电,默认开启debug模式,在串口过滤代码执行信息,即保证系统正常开机时间,在于bmc建立链路通信之后,在bmc指定路径下同步记录debug详细开机信息,当致命问题发生时,客户端可根据bmc下保存的启动debug信息判断错误发生具体位置从而完成定位,能够在致命问题第一次出现时以代码debug信息的方式保留bug环境协助工程师完成问题定位,以完全规避概率性问题复现难度大的风险,并且能够增加交换机异常信息确定的准确性,提高交换机异常信息确定的效率。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1