服务器故障定位方法、系统、终端及存储介质与流程

文档序号:29140664发布日期:2022-03-05 02:39阅读:来源:国知局

技术特征:
1.一种服务器故障定位方法,其特征在于,包括:监控测试日志,并在监控到测试日志存在报错信息之后断开与所有外部pcie设备的连接;重启服务器,重新采集测试日志并判断新的测试日志是否存在报错信息:若是,则判定pcie端口不存在故障;若否,则判定pcie端口存在故障,并对pcie端口逐一排查。2.根据权利要求1所述的方法,其特征在于,监控测试日志,包括:创建监控进程,所述监控进程利用关键词筛选技术从测试日志筛选报错信息。3.根据权利要求1所述的方法,其特征在于,在判定pcie端口不存在故障之后,所述方法还包括:重启服务器,并在服务器重启过程中监控系统健康指示灯状态;如果系统健康指示灯在基本输入输出系统完成全部开机跳转网络启动时由监控状态转换为故障状态,则判定网络模组存在故障。4.根据权利要求1所述的方法,其特征在于,对pcie端口逐一排查,包括:将所有pcie端口重新连接相应的外部pcie设备;随机选取一个pcie端口作为目标端口,卸载目标端口的驱动;重启服务器并重新采集测试日志,监控测试日志是否存在报错信息,保存监控结果并为所述目标端口安装驱动;遍历所有pcie端口,将监控结果为无报错信息的pcie端口作为故障端口输出。5.一种服务器故障定位系统,其特征在于,包括:报错监控单元,用于监控测试日志,并在监控到测试日志存在报错信息之后断开与所有外部pcie设备的连接;报错判断单元,用于重启服务器,重新采集测试日志并判断新的测试日志是否存在报错信息;第一判定单元,用于若新的测试日志存在报错信息,则判定pcie端口不存在故障;第二判定单元,用于若新的测试日志不存在报错信息,则判定pcie端口存在故障,并对pcie端口逐一排查。6.根据权利要求5所述的系统,其特征在于,报错监控单元包括:进程创建模块,用于创建监控进程,所述监控进程利用关键词筛选技术从测试日志筛选报错信息。7.根据权利要求5所述的系统,其特征在于,所述系统还包括:指示监控单元,用于重启服务器,并在服务器重启过程中监控系统健康指示灯状态;网络判定单元,用于如果系统健康指示灯在基本输入输出系统完成全部开机跳转网络启动时由监控状态转换为故障状态,则判定网络模组存在故障。8.根据权利要求5所述的系统,其特征在于,第二判定单元包括:设备连接模块,用于将所有pcie端口重新连接相应的外部pcie设备;驱动卸载模块,用于随机选取一个pcie端口作为目标端口,卸载目标端口的驱动;结果获取模块,用于重启服务器并重新采集测试日志,监控测试日志是否存在报错信息,保存监控结果并为所述目标端口安装驱动;
结果输出模块,用于遍历所有pcie端口,将监控结果为无报错信息的pcie端口作为故障端口输出。9.一种终端,其特征在于,包括:处理器;用于存储处理器的执行指令的存储器;其中,所述处理器被配置为执行权利要求1-4任一项所述的方法。10.一种存储有计算机程序的计算机可读存储介质,其特征在于,该程序被处理器执行时实现如权利要求1-4中任一项所述的方法。

技术总结
本发明涉及服务器技术领域,具体提供一种服务器故障定位方法、系统、终端及存储介质,包括:监控测试日志,并在监控到测试日志存在报错信息之后断开与所有外部PCIe设备的连接;重启服务器,重新采集测试日志并判断新的测试日志是否存在报错信息:若是,则判定PCIe端口不存在故障;若否,则判定PCIe端口存在故障,并对PCIe端口逐一排查。本发明可以快速有效的定位PCIe中断,冲突产生的报错诊断。具有定位准确,时效快的特点。时效快的特点。时效快的特点。


技术研发人员:刘玉磊
受保护的技术使用者:苏州浪潮智能科技有限公司
技术研发日:2021.12.03
技术公布日:2022/3/4
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1