本发明涉及服务器集中管理领域的计算机软件开发,具体涉及一种在服务器中管理节点OEM IPMI接口的方法。
背景技术:
随着用户对服务器计算需求的不断提高,用户对服务器计算性能的要求也越来越高。融合架构服务器在节点密度和TCO(总体拥有成本Total Cost of Owners)上与传统服务器相比具有很大的优势,在实际中的应用也越来越广泛。融合架构服务器节点的模块和种类有多种,不同的服务器厂商使用的IPMI命令也各不相同,在整机柜服务器中进行模块化管理非常不方便。这对融合架构服务器的节点如何集中进行管理提出了新的挑战。
针对如何能够更有效、方便管理多个不同类型服务器节点这个问题,本申请发明了一种管理节点IPMI(Intelligent Platform Management Interface智能平台管理接口)OEM(Original Equipment Manufacturer原始设备制造商)接口的方法,只要节点支持这种IPMIOEM接口,就可以实现融合架构服务器节点的模块化,即可以支持计算模块、存储模块和网络模块等繁多种类和不同服务器厂商之间的IPMI的混合使用,使用起来非常灵活方便。
技术实现要素:
本发明涉及融合架构服务器、整服务器监控管理领域和节点管理领域,特别是涉及节点模块化过程中如何对节点的管理。其主要目的是针对融合架构服务器节点模块多和种类多,以及不同的服务器厂商使用的IPMI命令也各不相同的问题,将服务器节点模块化,以便方便集中管理。
具体实现过程如下:
一种在服务器中管理节点OEM IPMI接口的方法,其特征在于,该方法包括如下步骤:在不同节点IPMI协议上进行命令扩展;服务器机柜管理模块与节点模块IPMI进行通信;服务器管理模块通过OEM IPMI命令获取节点的资产信息和管理所需要的相关信息,从而完成对节点的模块化管理。
如上所述的在服务器中管理节点OEM IPMI接口的方法,其特征还在于,在不同节点IPMI协议上进行命令扩展具体包括:在节点IPMI协议上添加需要管理的节点类型定义。
如上所述的在服务器中管理节点OEM IPMI接口的方法,其特征还在于,在不同节点IPMI协议上进行命令扩展具体包括:在节点IPMI协议上添加节点上配置定义OEM命令。
如上所述的在服务器中管理节点OEM IPMI接口的方法,其特征还在于,在节点IPMI协议上添加节点上配置定义OEM命令具体包括:定义节点管理所需要的资产信息的OEM命令;定义资产信息获取的OEM命令的返回值。
如上所述的在服务器中管理节点OEM IPMI接口的方法,其特征还在于,在节点IPMI协议上添加节点上配置定义OEM命令具体包括定义节点管理所需要的温度电压信息的OEM命令;定义温度电压信息获取的OEM命令的返回值。
具体实施方式
本申请所述的方法的主要实现方式是通过在IPMI协议上进行命令扩展,添加需要管理的节点类型定义、节点配置定义OEM命令,然后通过这些OEM命令即可以完成对节点模块化设计管理的要求。
下面对本发明的内容进行更加详细的阐述:
本发明设计实现方法主要包括:
通过服务器模块化OEM IPMI命令定义的方法,定义节点CPU温度信息、进风口出风口的温度信息、CPU margin温度信息、内存的channel最大温度信息、节点12V输入电压、BMC需要的PWM信息、节点功耗信息、节点状态信息和获取状态更新标志信息,定义一种节点资产信息的命令。
之后,服务器机柜管理模块与节点模块IPMI进行通信;
管理模块通过OEM IPMI命令获取节点的资产信息和管理所需要的相关信息包括温度、电压、功耗、需要的PWM值和状态信息。
这些相关信息以及值具体可以是:
1)定义节点管理所需要的资产信息的OEM命令,管理模块通过节点类型OEM命令,完成不同类型设备的资产获取。
2)定义资产信息获取的OEM命令的返回值。
返回值解析如下所示:
Data 1-CPU的数量
Data 2:11-CPU的型号
Data 12-内存条的数量
Data 13:16-内存条的容量(LS-byte first,单位G)
Data 17-硬盘的个数
Data 18:21-硬盘的容量(LS-byte first,单位G)
Data 22-SSD硬盘的数量
Data 23:26-SSD硬盘的容量(LS-byte first,单位G)
3)定义节点管理所需要的温度电压信息的OEM命令,管理模块通过该OEM命令,完成不同类型设备管理所必需的信息的获取,完成节点的管理。
4)定义温度电压信息获取的OEM命令的返回值
具体返回值格式如下:
Data 1-CPU1温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 2-CPU2温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 3-进风口温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 4-出风口温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 5-CPU1 margin温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 5-CPU2margin温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 7-内存最大温度信息(单位读)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-温度值
Data 8-节点12V输入电压(小数位,基数1/256V)
[0:7]-value
Data 9-节点12V输入电压(整数位,基数1V)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-value
Data 10-节点所需要PWM值(BMC主要用于风扇控制)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-va lue
Data11-节点功耗(Watt)-(低字节)
[0:7]-value
Data 12-node total consumption(Watt)-(高字节)
[7]-有效位标志(0b=有效,1b=无效)
[0:6]-value
Data 13-node状态信息
[7]-节点开关机状态
1h=开机
0h=关机(soft-off S4/S5or mechanical off)
[4:6]-Reserved
[2:3]-Reserved
[0:1]-节点健康状态
0h=正常
1h=警告
2h=故障
使用本申请所述的方法,可以将服务器节点模块化,方便集中管理。