一种易于查看的云服务器电源blackbox设计方法与流程

文档序号:11322859阅读:320来源:国知局
一种易于查看的云服务器电源blackbox设计方法与流程

本发明涉及数据快速存储和读取的方法,属于计算机技术领域,具体涉及一种易于查看的云服务器电源blackbox设计方法。



背景技术:

服务器电源就是指使用在服务器上的电源,它和个人计算机使用的电源一样,都是一种开关电源。服务器电源按照标准可以分为atx电源和ssi电源两种。服务器电源在出现故障的时候为了定位故障问题需要将故障信息写在电源内部供故障排查使用,即blackbox数据,中文称为黑盒故障日志。

针对blackbox数据记录,现有的方案多是直接将多组数据直接放在一个寄存器中,需要使用的时候将这个地址位信息全部读取出来,再根据特定的段位解析相应的数据。服务器内部读取电源信息的指令对读取长度有要求,当blackbox设计的长度大于服务器本身的要求时,指令就无法读取电源blackbox信息,必须将电源从服务器中拿出来使用服务器厂商的工具进行解析,不便于现场人员操作,有时也不能满足客户的故障分析要求。

如中国专利(申请号cn201611208065.0)公开了“一种基于服务器架构的服务器监控系统”,服务器电源数据获取模块用于获取电源的温度,功耗,输出电流,输出电压,在位状态信息,故障状态信息;处理器接收风扇数据获取模块、硬盘数据获取模块、服务器电源数据获取模块发送的数据信息,并将接收的数据信息储存至数据储存模块,同时将接收的数据信息在显示单元上显示,当接收的数据信息超出阈值时,在显示单元上发出提示信息。在服务器的日常使用及运维中要求能够实时监控服务器的运行参数,并将服务器运行参数信息及服务器故障信息实现可视化,实时对服务器内部元件及模块进行监控,保证服务器运行稳定。该发明通过可视化电源的不同参数值,有利于提高对服务器的监控和运行,但对于电源故障blackbox长度大于服务器本身的要求时,指令就无法读取blackbox信息的问题未有涉及,不便于操作人员对电源故障原因进行分析判断,进而采取有效的解决措施。



技术实现要素:

本发明提供一种易于查看的云服务器电源blackbox设计方法,用于解决在服务器内部读取指令小于blackbox设计的长度时,导致指令无法读取电源blackbox信息的问题,方便现场人员对电源故障进行分析和操作,从而有针对性的解决服务器电源使用中存在的问题。

本发明通过以下技术方案予以实现:

一种易于查看的云服务器电源blackbox设计方法,包括服务器电源以及多个寄存器,包括以下步骤:

s1、当服务器电源发生故障时,将故障时刻的数据按类别区分,并储存至不同的寄存器中,此次故障数据以page编码方式标识;

s2、按照s1的步骤记录下次服务器电源发生故障时刻的数据,同一寄存器中存放故障时刻的数据类别相同;

s2、当查询服务器电源故障信息以排查故障时,根据故障发生的时刻指令切换到对应的page编码,再使用标准的pmbus规范指令读取分别存储在不同寄存器中的故障时刻的数据,然后根据读取和解析到的数据完成服务器电源故障原因的排查和确认。

如上所述的一种易于查看的云服务器电源blackbox设计方法,所述步骤s1中寄存器设置有4个。

如上所述的一种易于查看的云服务器电源blackbox设计方法,所述步骤s1中4个寄存器设中按类别储存的数据,分别为故障时刻对应的输入电压、输入电流、输出电压、入风口温度数值。

如上所述的一种易于查看的云服务器电源blackbox设计方法,所述步骤s1中按类别储存在寄存器的数据长度范围在1~15个bytes之间。

如上所述的一种易于查看的云服务器电源blackbox设计方法,所述步骤s1中故障数据按page编码方式标识的范围为5~15个之间。

与现有技术相比,本发明的优点是:

1、通过将服务器电源故障信息数据从现有的单一寄存器存放,更改为多个寄存器存放,可有效解决blackbox数据长度过长时服务器指令无法读取数据的的问题。

2、本发明能用于所有支持pmbus的服务器系统,在不使用任何脚本或者软件的情况下,直接通过ipmitool指令读取故障数据进行电源故障分析,便于研发和客服人员读取电源故障信息,节省问题分析时间。

3、本发明可形成模块设计和产品,用于后续的各类服务器上,满足用户对服务器电源管理功能的需求,降低产品开发成本。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍。

图1是现有的服务器电源故障数据blackbox存取示意图;

图2是本发明的服务器电源故障数据blackbox存取示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。

一种易于查看的云服务器电源blackbox设计方法,包括服务器电源以及多个寄存器,包括以下步骤:

s1、当服务器电源发生故障时,将故障时刻的数据按类别区分,并储存至不同的寄存器中,此次故障数据按page编码方式标识;

s2、按照s1的步骤记录下次服务器电源发生故障时刻的数据,同一寄存器中存放故障时刻的数据类别相同;

s2、当查询服务器电源故障信息以排查故障时,根据故障发生的时刻指令切换到对应的page编码,再使用标准的pmbus规范指令读取分别存储在不同寄存器中的故障时刻的数据,然后根据读取和解析到的数据完成服务器电源故障原因的排查和确认。

具体而言,本实施例将电源blackbox信息分别寄存在pin、iin等多个独立的寄存器内,然后根据需要单独从以上寄存器读取故障信息,同时为了区分每一次记录的信息,按照page方式存放,这样在任何服务器中都可以简单操作且不用担心数据指令长度超出服务器内要求。

其中,balckbox信息存放的原理如下:

电源发生故障时会将故障时的数据进行记录,根据发生的时间放在相应的page中,即,将第一次故障的所有数据记录在page1,第二次记录在page2,依次递增至page的最大范围,然后再进行循环;读取的时候通过指令切换到相应的page,再根据标准的pmbus规范指令进行数据读取。

为进一步清楚的说明,以事件1的记录为例进行说明,事件1表示其中一次服务器电源故障。

如图1所示,现有的服务器电源故障数据blackbox存取过程如下:

①、当电源发生事件1故障时,电源会将所需要记录的数据a到数据n按照一定顺序记录在一个寄存器中;

②、当需要从电源内部获取事件1故障时,需要将整个寄存器的数据读取出来,一般的事件1对应的服务器电源故障数据在几百个byte,然后截取事件1中数据a到数据n的数据,并根据每个数据占有的字节再分开解析;

③、以上操作普遍适用于厂商自己开发的脚本,但是在服务器中如果字节长度过长则无法使用。

如图2所示,改进后的本发明服务器电源故障数据blackbox存取过程如下:

①、当电源发生事件1故障时,电源会将所需要记录的事件数据分别记录在数据a到数据n对应的寄存器中;

②、当需要从电源内部获取事件1故障时,只需要通过指令切换到page1,然后将使用标准的ipmitool指令读取数据a到数据npage1中的数据即可;

③、当需要查看事件n的时候,需要切换到pagen,然后按照②中的方法读取。

需要注意的是n受存储空间限制,具体根据存储空间决定,一般在5~15之间。以上操作不但适用于电源供应商自己读取数据,同时也适合在任何支持pmbus的服务器系统读取,操作更加方便。

结合图2,本发明的具体实现步骤如下:

①、当电源发生一次故障时,会将故障时刻的数据,包括输入电压、输入电流、输出电压、入风口温度等信息以一次事件的方式记录多个寄存器之中;

②、当需要根据事件1记录的数据排查故障时,需要先将电源切换到page1,page是代表事件中所有数据的虚拟页,实际上就是数据a到数据n各自寄存器记录的第一或者第n个数据的集合,这样查看事件1的时候,不至于读取其他事件的数据;

③、使用ipmitool指令分别读取page1中输入电压、入风口温度、输出电压、状态字等数据信息,单个寄存器中每类数据的长度只有1-2个,最多不超过15个bytes数据;

④、根据读取和解析到的数据判断事件1具体的故障及可能故障的原因。

按以上步骤,切换到不同的page编码读取不同的事件(1至n)信息,即可完成电源故障的排查和确认。除上述数据外,还可根据实际需要记录电源总的上电时间进行故障发生事件的判断等。

本发明未详尽描述的技术内容均为公知技术。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1