一种服务器电源黑盒数据解析系统的制作方法

文档序号:26003988发布日期:2021-07-23 21:21阅读:185来源:国知局
一种服务器电源黑盒数据解析系统的制作方法

本申请涉及服务器领域,特别涉及一种服务器电源黑盒数据解析系统。



背景技术:

服务器系统在突然断电或系统宕机时需要做rca(rootcauseanalysis,根本原因分析),但是服务器电源在断电或电源线被拔除时,内部存储的所有数据都会被清除,因此服务器电源的故障分析非常不便。基于此intel在其主导的共同电源规格crps(commonredundantpowersupply,共用冗余电源)提出了黑盒功能,服务器电源在系统断电后利用电源供应器维持时间将数据存储在eeprom(electrically-erasableprogrammableread-onlymemory,带电可擦可编程只读存储器)中,以便进行分析。

服务器电源黑盒功能是使用十六进制格式储存服务器电源的参数信息和状态,而人工难以直接解读出数值数据。为解决该问题,一般可以在bmc(baseboardmanagementcontroller,基板管理控制器)固件中加入黑盒解析功能或者是送回电源原厂作分析。但是如果服务器系统中的bmc固件未加入黑盒解析功能或者服务器需要立即回线工作,那么就需要将故障的服务器电源换置,在上述工况下,bmc无法支持对服务器电源黑盒数据的解析,因此就需要将服务器电源退回原厂进行分析,此流程耗时较长,不利于服务器系统的rca及客户服务的反馈或者及早发现大规模系统离线的问题。

因此,如何提供一种解决上述技术问题的方案是本领域技术人员目前需要解决的问题。



技术实现要素:

本申请的目的是提供一种服务器电源黑盒数据解析系统,可直接对服务器电源黑盒数据进行现场分析,不需通过bmc及ipmitool进行解析,也不需通电及额外治具板卡,可以大幅缩减rca时间,及早发现大规模系统离线的问题,同时服务器电源经本申请所提供的装置分析后不需退回原厂,即可回线工作,节省服务及维运成本。

为解决上述技术问题,本申请提供了一种服务器电源黑盒数据解析系统,包括:软件狗和提示装置,所述软件狗包括:

与服务器电源连接的输入接口,用于获取服务器电源黑盒数据;

控制器,用于按照预设线性格式解析所述服务器电源黑盒数据得到提示数据,所述提示数据的格式为十进制格式;

与所述提示装置连接的输出接口,用于向所述提示装置传输所述提示数据,以便所述提示装置对所述提示数据进行提示;

电源模块,用于为所述控制器供电。

优选的,该软件狗还包括:

信号相移电路,用于将所述服务器电源的i2c总线上挂载的元件的电压准位调整至预设值;

所述电源模块,还用于为所述信号相移电路供电。

优选的,所述输入接口与服务器电源的固件烧录接口匹配。

优选的,所述控制器采用表面粘着技术封装。

优选的,所述输入接口与所述服务器电源的一次侧i2c接口连接。

优选的,所述提示装置,具体用于:

通过图形化界面软件对所述提示数据进行提示。

优选的,所述提示装置,还用于对所述软件狗进行校验;

相应的,所述对所述提示数据进行提示的过程包括:

当所述校验成功,对所述提示数据进行提示。

优选的,服务器电源黑盒数据为输入电流、输入电压、输出电压、输入功率、输出功率、风扇转速和温度中的一项或多项。

优选的,当所述服务器电源黑盒数据为所述输入电流、所述输入电压、所述输入功率、所述输出功率、所述风扇转速和所述温度中的一项或多项,所述控制器具体用于:

按照第一关系式解析所述服务器电源黑盒数据得到提示数据,所述第一关系式为x=y×2n

其中,x为所述服务器电源黑盒数据对应的提示数据,y为所述服务器电源黑盒数据对应的二进制补码尾数,n为所述服务器电源黑盒数据对应的二进制补码指数。

优选的,当所述服务器电源黑盒数据为所述输出电压,所述控制器具体用于:

按照第二关系式解析所述服务器电源黑盒数据得到提示数据,所述第一关系式为x=y×2-9

其中,x为所述服务器电源黑盒数据对应的提示数据,y为所述服务器电源黑盒数据对应的整码数。

本申请提供了一种服务器电源黑盒数据解析系统,包括:软件狗和提示装置,软件狗包括:与服务器电源连接的输入接口,用于获取服务器电源黑盒数据;控制器,用于按照预设线性格式解析服务器电源黑盒数据得到提示数据,提示数据的格式为十进制格式;与提示装置连接的输出接口,用于向提示装置传输提示数据,以便提示装置对提示数据进行提示;电源模块,用于为控制器供电。

在实际应用中,采用本申请的方案,不需要在服务器系统中的bmc固件加入黑盒解析功能,让服务器置换故障电源后即可回线工作。不需通电及额外治具板卡,断电也可以分析,避免电源二次伤害。也不需要将服务器电源寄回电源原厂进行分析,通过软件狗即可直接对服务器电源黑盒数据进行现场解析,操作简单,不需过多设定一键即可做电源黑盒数据分析。得到便于用户判读的十进制数据,再通过提示装置对十进制数据进行提示,以便用户根据十进制数据直接得到服务器电源的参数信息和状态,大幅缩减rca时间,及早发现大规模系统离线的问题,软件狗体积较小,便于携带,此外,服务器电源经本申请所提供的系统分析后不需退回原厂,即可回线工作,节省服务及维运成本。

附图说明

为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本申请所提供的一种服务器电源黑盒数据解析系统的结构示意图;

图2为本申请所提供的一种计算范例示意图;

图3为本申请所提供的一种提示装置的提示界面的示意图;

图4为本申请所提供的另一种服务器电源黑盒数据解析系统的结构示意图;

图5为本申请所提供的一种信号相移电路的结构示意图;

图6为本申请所提供的另一种信号相移电路的结构示意图。

具体实施方式

本申请的核心是提供一种服务器电源黑盒数据解析系统,可直接对服务器电源黑盒数据进行现场分析,不需通过bmc及ipmitool进行解析,也不需通电及额外治具板卡,可以大幅缩减rca时间,及早发现大规模系统离线的问题,同时服务器电源经本申请所提供的装置分析后不需退回原厂,即可回线工作,节省服务及维运成本。

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

为便于理解本申请的方案,下面对服务器电源黑盒数据进行说明,从电源管理的角度看,服务器系统运行过程中需要监测电压、电流、温度或风扇速度等参数,bmc的主要功能是控制、监测大量的电源和风扇,包括:系统故障查询,例如:过压/欠压、过流、温度是否超出工作范围,或者是风扇速度是否正常,将故障监测转化成检测参数是否超出阀值这类简单操作。因此在服务器电源运行过程中实时采集数据,并在发生故障时将数据存储到eeprom中,由此创建事件数据记录仪,类似于飞机上的“黑盒子”,记录仪将按预设周期收集大量的最新数据(比如,20ms内的最新数据)。当服务器系统发生故障时,服务器系统的瞬间信息将被永久记录下来,以便后续能够检查故障发生前10ms至20ms期间的系统操作,为排查系统故障的原因和电源失效分析提供数据基础。通过核查这些数据,可以重新组织时间段,确定系统与电源的相互依赖关系。在理想情况下,复杂的服务器电源黑盒数据记录多种故障,便于建立系统之间的相互依赖性,发生一个故障后,可能会引发更多的后续故障。为了找到故障的根本原因,因此,需要记录仪记录尽可能完备的数据。

可以理解的是,虽然二进制数值或十进制数值可以很容易地被表示、存储和传输,例如,可以表示为穿孔卡片上有洞或无洞、导线上的高电压或低电压,或者顺时针或逆时针的磁场。对于二值信号进行存储和执行计算的电子电路非常简单可靠,制造商能够在一个单独的芯片上集成数百万甚至数十亿个这样的电路。目前,大多数计算机使用8位的块(字节,byte),作为最小的可寻址的内存单位。一个字节由8位组成,用二进制表示,它的值域是00000000~11111111,用十进制表示,它的值域是0~255。可以看出,用二进制表示法太冗长,而十进制表示法与位模式的互相转换很麻烦,而十六进制用数字0~9及字符a~f来表示0~15这16个值,十六进制和二进制之间的转换较简单直接,因此,一个字节常用十六进制表示,它的值域是00~ff。

在同一eeprom容量下,相较于二级制,十六进制可以节省更多字节。采取十六进制可以较二进制或十进制储存更多数据量。而且在c语言中主要使用十六进制,以0x或0x开头的数字常量被认为是十六进制的值,比如给定一个十六进制表示的数字:0x173a4c,转为二进制则为反过来,如果给定一个二进制数字,可以通过把它分为每4位一组来转换为十六进制,需要注意的是,如果总位数不是4的倍数,最左边的一组可以少于4位,前面用0补齐,因此,现有技术中服务器电源黑盒是使用十六进制格式储存服务器电源的参数信息和状态,以节省更多字节,但是人工难以直接解读出十六进数值的数据。

下面对本申请所提供的一种服务器电源黑盒数据解析系统进行详细说明。

请参照图1,图1为本申请所提供的一种服务器电源黑盒数据解析系统的结构示意图,该服务器电源黑盒数据解析系统包括软件狗1和提示装置2,软件狗1包括:

与服务器电源连接的输入接口11,用于获取服务器电源黑盒数据;

具体的,软件狗1的pcb(printedcircuitboard,印制线路板)设计上包括i2c(inter-integratedcircuit,集成电路总线)信号孔位,以线材导出接至输入接口11,输入接口11与服务器电源连接,用于获取服务器电源黑盒数据,这里的服务器电源黑盒数据即原始的十六进制数据,包括但不限于输入电流、输入电压、输出电压、输入功率、输出功率、风扇转速和温度。

控制器12,用于按照预设线性格式解析服务器电源黑盒数据得到提示数据,提示数据的格式为十进制格式;

具体的,控制器12需支持i2c通信协议、需支持usb(universalserialbus,通用串行总线)通信协议、固件编码原则、需符合pmbus1.2规范,即传递的内容与格式需符合pmbus1.2规范、还应满足3.3v电压应用等级以及工作时脉在100khz至400kh范围内。具体的,控制器12内部的固件也要符合pmbus1.2规范,控制器12的硬件从服务器电源取回的服务器电源黑盒数据,然后通过控制器12固件对服务器电源黑盒数据进行解析,其中,不同类型的服务器电源黑盒数据按照pmbus1.2规范存入不同的寄存器内,如输入电流存储在第一寄存器内,输出电压存储在第二寄存器内,以此类推。在进行解析时,首先判断各个寄存器中是否存在服务器电源黑盒数据,将存在数据的寄存器中的服务器电源黑盒数据取出,进行解析,得到十进制格式的提示数据,解析过程如下:

对于输入电流、输入电压、输入功率、输出功率、风扇转速和温度等数据,按照第一关系式x=y×2n进行解析,其中,x=y×2n为pmbus1.2针对linear-11所有传感器检测数值提供的解析关系式,linear-11数据格式使用(n)5位二进制补码指数和(y)11位二级制补码尾数,x为提示数据,计算范例参照图2所示。

对于输出电压,按照第二关系式x=y×2-9进行解析,可以理解的是,电压数值表示时使用pmbus寄存器的vout_mode寄存器的位置固定高linear-11,9位指示,因此固定n=-9h。

与提示装置2连接的输出接口13,用于向提示装置2传输提示数据,以便提示装置2对提示数据进行提示;

具体的,输出接口13采用mini-usbatype,通过传输线与提示装置2连接,传输线采用标准mini-usbatype对usb2.0线材即可,将usb2.0信号,d+,d-,id导入控制器12处理,电源vcc(+5v)接入5v转3.3v电源电路,gnd拉进各部件及参考信号,并向提示装置2传输提示数据,以便提示装置2进行提示。作为一种优选的实施例,为便于携带,提示装置2可以选择带有图形化界面软件的移动终端,以便通过移动终端上的图形化界面软件对提示数据进行提示。当然除了可以选用笔记本,还可以选择包括平板电脑在内的其他移动终端,本申请在此不再赘述。

具体的,可以采用带有gui(graphicaluserinterface,图形用户界面)的笔记本电脑。gui为一种图形化操作界面,可以通过专用软件,如labview软件来编程,应用于笔记本电脑的一个执行档,其人机界面功能,可选择服务器电源位址、工作时脉等,当执行连接时,也即对服务器电源执行pmbus指令,将问题日志中的服务器电源黑盒数据载入,也将软件狗1解析后的十进制提示数据载入作为判读,提示界面的示意图参照图3所示。

作为一种优选的实施例,提示装置2,还用于对软件狗1进行校验;

相应的,对提示数据进行提示的过程包括:

当校验成功,对提示数据进行提示。

具体的,考虑到解析内容及参数具有涉密信息,为提高数据交互的安全性,可利用图形化介面软件的校验功能对软件狗进行校验,校验成功后,对软件狗1分析后的十进制数据进行提示,同时搭配软件狗1的校验功能,对从服务器电源获取到的数据进行校验,校验成功后再进行分析。

具体的,校验过程如下:软件狗1会先与服务器电源的mcu进行数据交互,并传递校验密码,mcu确认软件狗1为合法元件,将eeprom存储的数据传递至软件狗1进行解析,解析完成后,软件狗1传递辨识密码至计算机上与图形化操作界面做辨识沟通,计算机确认软件狗1为合法元件后,会将软件狗解译后的十进制数据传递至图形化操作界展示。

其中,专用软件编程元件需有:用于执行i2c指令的元件,考虑到i2c会有位址选定及读取eeprom的行为,用于读取eeprom的元件,为了实现软件狗校验功能,因此还需有软件狗读取校验元件。将各部重要元件连结及编组,完成图形化操作界面,以执行读取并提示服务器电源黑盒数据的功能,编程完毕后需将其转成为可执行档,便可在计算机上执行。

电源模块14,用于为控制器12供电。

具体的,此电源模块14为一个5v转3.3v的转换器,其主要供给控制器12,及信号传输所需进行供电。为了节省整体空间及制作成本,本实施例可以采用表面黏着技术封装的转换器。

具体的,电源模块具体为一种线性ldo(lowdropoutregulator,低压差线性稳压器),ldo工作原理就是通过运放调节p-mos的输出,ldo内部产生一个基准电压,作为运放的反向电压,将ldo的输出电压通过分压作为运放的正向输入电压。运放的输出控制p-mos管的工作状态,p-mos处于线性电阻区,可看成一个压控可变电阻。输入电压vin,经过这个p-mos管后变为输出电压,这里p-mos管的作用为将输入电压通过p-mos的线性电阻区,将电压动态衰减,因此大量的热汇集于p-mos,处理功率通常小于1.5w以下。这有别于开关电源,开关电源是由脉冲宽度调变(pwm)控制ic、mosfet、磁性元件、电容构成。随着电力电子技术的发展和创新,目前开关电源主要以小型、轻量和高效率的特点被广泛应。开关电源利用的切换mos管多半是在全开模式(饱和区)及全闭模式(截止区)之间切换,这两个模式都有低耗散的特点,切换之间的转换会有较高的耗散,但时间很短,因此比较节省能源,产生废热较少。不过开关电源比较复杂,mos管会频繁切换,若切换电流未加以处理,可能会产生噪声及电磁干扰影响其他设备,而且若开关电源经有特别设计,其电源功率因数高,开关电源处理功率通常达数百。

可见,本实施例中,不需要在服务器系统中的bmc固件加入黑盒解析功能,让服务器置换故障电源后即可回线工作。不需通电及额外治具板卡,断电也可以分析,避免电源二次伤害。也不需要将服务器电源寄回电源原厂进行分析,通过软件狗即可直接对服务器电源黑盒数据进行现场解析,操作简单,不需过多设定一键即可做电源黑盒数据分析。得到便于用户判读的十进制数据,再通过提示装置对十进制数据进行提示,以便用户根据十进制数据直接得到服务器电源的参数信息和状态,大幅缩减rca时间,及早发现大规模系统离线的问题,软件狗体积较小,便于携带,此外,服务器电源经本申请所提供的系统分析后不需退回原厂,即可回线工作,节省服务及维运成本。

请参照图4,图4为本申请所提供的另一种服务器电源黑盒数据解析系统的结构示意图,该服务器电源黑盒数据解析系统在上述实施例的基础上:

作为一种优选的实施例,该软件狗1还包括:

信号相移电路15,用于将服务器电源的i2c总线上挂载的元件的电压准位调整至预设值;

电源模块14,还用于为信号相移电路15供电。

具体的,信号相移电路15针对服务器电源内部i2c有不同提高准位时,可以实现隔离及位准统一功能,以防不同位准造成高低电平判断问题,最后造成数据判读误差或失误问题。

具体的,一般在服务器内部,i2c的电压准位有5v、3.3v、1.8v三种规格。在使用上i2cbus上所有元件的电压准位需一致,不然会造成信号高位准或低为准误判断。使用标准供电电压5v的电压逻辑的电压准位规范:输入电压准位hi输入电压:3.5v以上,low输入电压:0.9v以下,介于0.9v与3.5v间逻辑无法判断。使用标准供电电压3.3v的电压逻辑的电压准位规范:输入电压准位hi输入电压:2.4v以上,low输入电压:0.8v以下介于0.8v与2.4v间逻辑无法判断。

参照图5所示,图5位本申请所提供的一种信号相移电路15的结构示意图,通过两个开关管ti和t2做隔离切换sda&scl两路信号。

具体的,参照图6所示,3.3v信号向5v传输时,当3.3v信号端为高电平时,q1的vgs电压为0,q1截止,此时5v信号端在上拉电阻r2的作用下,电平上拉到5v。当3.3v信号端为低电平时,q1的vgs电压为3.3v,q1导通,此时5v信号端受3.3v信号端作用,电平为0。当3.3v信号端为低电平时,3.3v信号端在q1内部寄生二极体的作用下电压下降,当下降到一定程度,q1的vgs电压会使q1导通,此时3.3v信号端受5v信号端作用,电平为0。

作为一种优选的实施例,输入接口11与服务器电源的固件烧录接口匹配。

具体的,考虑到服务器电源固件烧录接口都有其具体的型号,因此软件狗1的输入接口11需要能与服务器电源的固件烧录接口匹配,以便和服务器电源的固件烧录接口正确、完整紧密对接,以实现软件狗1的功能,同时不会影响信号传递品质。

作为一种优选的实施例,控制器12采用表面粘着技术封装。

具体的,使用表面黏着技术封装控制器12,可以缩小零件摆放的空间,可以让软件狗1的尺寸缩小至一个u盘大小,方便携带使用。

作为一种优选的实施例,输入接口11与服务器电源的一次侧i2c接口连接。

现行服务器电源皆为数字化电源。数字化电源是在类比控制切换式电源为设计的基础上,使用微处理器mcu取代类比控制,进行可程式化的电源管理,搭配软体演算法进行控制电源供应系统,来实现类比控制切换式电源无法做到的电源控制、管理、监控与通信功能,并具有高度的灵活性。可保证各种输入电压和各种负载条件都能得到最好的转换效率。全数位电源以mcu(microcontrollerunit,微控制器)或dsp(digitalsignalprocess,数位信号处理器)为核心,基于半数位电源基础加入回授控制、回授补偿的调整,通过远端诊断也能确保系统可靠性、执行故障管理、各种保护的设定,最终在电源产品上实现控制与管理,同时mcu内部模组与可程式化亦能简化外部被动元件数量。

具体的,现行的服务器电源会由其内部mcu来完成电源供应器中转换器开关控制,风扇控制,led控制,监控,保护,通讯等功能,就分工会分为一次侧mcu及二次侧mcu。因为一次测mcu都会有额外增加一个eeprom作为断电时数据储存及vpd(产品重要资讯)。在服务器电源断电时会将数据存入eeprom,因此一次测i2c接口为读取黑盒服务器电源黑盒数据的最佳位置,因此,本实施例中将软件狗1的输入接口11与服务器电源的一次侧i2c接口连接。

现行服务器电源会由其内部mcu为dsp晶片,dsp晶片的整体效能佳,可达成多功能的即时控制,特殊的硬体及指令设计适用于高等控制演算法,易于增加附属功能,晶片内部设计适用于数位信号处理,单一指令周期、多条内部汇流排、特殊的位址解码模式、零负担的回圈运算、可程式化的快闪记忆体、整数乘法的硬体计算、多样的i/o周边功能、其他特殊内建功能等。若采用一般的mcu,则80%的mcu时间将用于基本的正弦波脉宽调变、频率控制、与程序控制等,但如采用dsp,则包含交流稳压回路控制的数学运算,仅占用了20%的mcu时间,剩下的mcu时间可用于实现另外的控制法则,例如功率因数控制、前级直流电源稳压控制、随机式脉宽调变、电流涟波补偿、开机启动、错误诊断、参数估计、线上参数自动调整等种种功能。

本实施例中将软件狗1的输出接口13连接提示装置2,提示装置2中图形化界面软件执行档的示意图参照图3所示,通过点击图3右上connect,开始读取服务器电源黑盒数据,此时可以通过图3中左下的进度条确定读取进度,其上显示的数据既包括在blackbox栏位显示的软件狗1及图形化界面持续撷取的服务器电源黑盒数据,同时也包括在issuelog栏位的原始数据。此时即可判读服务器电源因何原因关闭,提示数据的格式为十进制格式,且根据pmb1.2规范标示输出,人工可以直接解读。

综上所述,采用本申请的方案,不需将服务器电源寄回电源原厂分析黑盒数据,现场可以直接解译,大幅缩减rca时间及早发现大规模系统离线的问题。服务器电源不需通电及额外治具板卡,通过本套工具即可直接读取到黑盒数据,服务器电源断电也可以进行分析,避免二次伤害,且不需通过bmc及ipmi工具解译黑盒数据,让服务器置换故障电源即可回线工作,此外服务器电源经分析后不需退回原厂,即可回线工作,可以节省服务及维运成本。本套系统简单轻便,仅需u盘大小的软件狗1搭配usb线连接至笔记本电脑,打开gui软件即可一键做黑盒数据分析。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的状况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本申请。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本申请的精神或范围的情况下,在其他实施例中实现。因此,本申请将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1