一种PCIeSwitch服务器整机管理方法与流程

文档序号:12309417阅读:384来源:国知局
一种PCIe Switch服务器整机管理方法与流程

本发明涉及计算机领域,特别是涉及一种pcieswitch服务器整机管理方法。



背景技术:

随着大数据技术及人工智能技术的发展,数据规模不断扩大,密集计算环境下对服务器存储性能及计算性能上的需求日益剧增,传统数据中心的资源简单调度和管理方式已经无法满足日益增长的业务需求。适应未来需求的硬件重构+软件定义的“融合架构”应运而生,在硬件层,将计算、存储、网络等各种设备中的同类资源整合为资源池,不同设备之间的同类资源能够任意重组;在软件层,通过上层软件动态感知业务的资源需求,利用硬件重组的能力,智能的动态分配和组合资源,满足各类应用的需求。

基于融合架构下的新技术趋势,pcieswitch服务器通过pci-e互联实现gpu及ssd的资源池化。在多节点服务器中,整机的监控管理显的尤为重要。

图1为现有技术中整机的监控管理方法的连接示意图。如图1所示,现有技术中整机柜服务器或多节点服务器都是通过专门的整机管理模块(rmc或cmc)来实现服务器整机管理的。以smartrack服务器为例,整机柜的监控和管理是以rmc作为整机管理模块,配合节点中板实现的,其中每个服务器节点103可能包括一个或多个池化服务器:节点中板102按照预定轮询周期,获取服务器节点103的设定参数信息存储至节点中板102,整机管理模块101按照预定轮询周期从节点中板102获取所有服务器节点103的监控信息;整机管理模块101将控制指令发送到节点中板102,节点中板102根据控制指令对相应服务器节点103进行控制。

这种监控管理方法虽然能实现对各服务器节点的统一管理,但是要开发出单独的硬件模块及软件模块用于中转信息,增加了研发成本,还占据了一定的整机空间。其次,监控管理信息都要通过节点中板传递,管理过程较为复杂,而且,若节点中板出现故障,将导致整个整机的监控管理任务无法进行。

因此,如何简化整机监控管理方式,优化产品结构,节约研发成本与软硬件成本,是本领域技术人员需要解决的技术问题。



技术实现要素:

本发明解决的技术问题在于提供一种pcieswitch服务器整机管理方法,用于简化整机监控管理方式,优化产品结构,节约研发成本与硬件成本。

为解决上述技术问题,本发明提供一种pcieswitch服务器整机管理方法,包括:

池化服务器的bmc监控池化服务器的主板的运行状态以获取监控信息并存储;

主机服务器的bmc从池化服务器的bmc获取监控信息,并向池化服务器的bmc发送控制指令。

优选地,池化服务器的bmc监控池化服务器的主板的运行状态以获取监控信息并存储具体为:

池化服务器的bmc按预定周期对主板进行轮询以获取监控信息并存储。

优选地,主机服务器的bmc从池化服务器的bmc获取监控信息具体为:

主机服务器的bmc按预定周期对池化服务器的bmc进行轮询,获取监控信息。

优选地,池化服务器的bmc监控池化服务器的主板的运行状态以获取监控信息并存储具体包括:

一级池化服务器的bmc监控一级池化服务器的主板的运行状态以获取一级监控信息并存储;

二级池化服务器的bmc监控二级池化服务器的主板的运行状态以获取二级监控信息并存储;

主机服务器的bmc从池化服务器的bmc获取监控信息,并向池化服务器的bmc发送控制指令具体包括:

一级池化服务器的bmc从二级池化服务器的bmc获取二级监控信息并存储;

主机服务器的bmc从一级池化服务器的bmc获取一级监控信息和/或二级监控信息,并向一级池化服务器的bmc发送控制指令。

优选地,在主机服务器的bmc从一级池化服务器的bmc获取一级监控信息和/或二级监控信息之后,还包括:

在web管理界面中显示一级监控信息和/或二级监控信息。

优选地,主机服务器的bmc向一级池化服务器的bmc发送控制指令具体为:

web管理界面将控制指令发送至主机服务器的bmc,主机服务器的bmc再将控制指令发送至一级池化服务器的bmc。

优选地,监控信息具体为:传感器信息和/或网络信息和/或拓扑信息和/或pcie设备状态信息。

优选地,控制指令具体为:开机指令或关机指令或重启指令或用户身份证明uid控制指令或bmc网络设置指令。

优选地,还包括:

远程主机向主机服务器的bmc发送控制指令,并从主机服务器的bmc获取监控信息。

本发明提供的pcieswitch服务器整机管理方法,包括:池化服务器的bmc监控池化服务器的主板的运行状态以获取监控信息并存储;主机服务器的bmc从池化服务器的bmc获取监控信息,并向池化服务器的bmc发送控制指令。相对于现有技术中整机管理模块通过节点中板对池化服务器进行管理的方式,通过该方法,无需单独开发类似节点中板等用于管理指令转发的硬件及配套软件,就可以实现对整机的监控与管理,从而简化了整机监控管理方式,优化了整机产品结构,节约了研发成本与软硬件成本。

附图说明

为了更清楚的说明本发明实施例或现有技术的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为现有技术中整机的监控管理方法的连接示意图;

图2为本发明实施例提供的第一种pcieswitch服务器整机管理方法的流程图;

图3为图2提供的pcieswitch服务器整机管理方法的一种连接示意图;

图4为本发明实施例提供的第二种pcieswitch服务器整机管理方法的流程图;

图5为本发明实施例提供的第三种pcieswitch服务器整机管理方法的流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的核心是提供一种pcieswitch服务器整机管理方法,用于对pcieswitch服务器整机进行监控和管理,简化了整机监控管理方式,并且无需单独开发用于管理的硬件,优化了整机产品结构,节约了研发成本与软硬件成本。

为了使本技术领域的人员更好地理解本发明方案,下面结合附图和具体实施方式对本发明作进一步的详细说明。

图2为本发明实施例提供的第一种pcieswitch服务器整机管理方法的流程图,图3为图2提供的pcieswitch服务器整机管理方法的一种连接示意图。如图2所示,pcieswitch服务器整机管理方法包括:

s20:池化服务器的bmc监控池化服务器的主板的运行状态以获取监控信息并存储。

s21:主机服务器的bmc从池化服务器的bmc获取监控信息。

s22:主机服务器的bmc向池化服务器的bmc发送控制指令。

需要说明的是,bmc(baseboardmanagementcontroller)指基板管理控制器,可以在机器未开机的状态下,对机器进行固件升级、查看机器设备、等一些操作。步骤s20、步骤s21和步骤s22无顺序关系,但若是对于同样的监控信息,则先进行步骤s20,后进行步骤s21。

如图3所示,本发明实施例提供的第一种pcieswitch服务器整机管理方法的一种连接方式是将池化服务器302的bmc连接在主机服务器301的bmc上。其中,主机服务器301相当于现有技术中的整机管理模块101。

在具体实施中,对于步骤s20来说,池化服务器与主机服务器间通过pciex4(也可以用x2或x8,视需要的带宽而定)×4的minisashd接口连接,在其中一路minisashd链路上增加i2c信号用于主机服务器的bmc与池化服务器的bmc通信,可以根据需要选择连接多个池化服务器。在pcieswitch服务器整机中,以一个池化服务器为一个节点,由该池化服务器的bmc监控整个节点的主板运行状态,并将获取得到的监控信息进行保存。

对于步骤s21来说,主机服务器通过bmc对pcieswitch服务器整机的各节点进行总体监控和管理。通过i2c信号,主机服务器的bmc向池化服务器的bmc发送查询请求,从而获取在池化服务器的bmc保存的监控信息。主机服务器的bmc将各池化服务器的bmc的监控信息汇总,就可以得到整机监控信息。

对于步骤s22来说,主机服务器通过i2c信号向池化服务器下达控制指令,用以指示池化服务器完成一系列操作。

本发明实施例提供的pcieswitch服务器整机管理方法,包括:池化服务器的bmc监控池化服务器的主板,获取并存储监控信息;主机服务器的bmc从池化服务器的bmc获取监控信息,并向池化服务器的bmc发送控制指令。相比于现有技术中通过节点中板使管理模块与服务器节点进行通信连接,本发明提供的方法无需单独开发类似节点中板等用于管理指令转发的硬件及配套软件,就可以实现对整机的监控与管理,从而简化了整机监控管理方式,优化了整机产品结构,节约了研发成本与软硬件成本。

在本发明实施例提供的第一种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,步骤s20具体为:

池化服务器的bmc按预定周期对主板进行轮询以获取所述监控信息并存储。

对于步骤s21和步骤s22的具体实施方式参见上文的描述,本实施例不再赘述。为了使pcieswitch服务器整机管理流程更加流畅,池化服务器定时采用轮询法实现对主板的监控管理。池化服务器的bmc循环执行监控管理任务,实现对服务器的实时监控。

本发明实施例提供的pcieswitch服务器整机管理方法,限定了池化服务器的bmc获取监控信息的方式是按预定周期采用轮询法进行获取,以达到实时监控管理的效果。

在本发明实施例提供的第一种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,步骤s21具体为:

主机服务器的bmc按预定周期对所述池化服务器的bmc进行轮询,获取监控信息。

对于步骤s20和步骤s22的具体实施方式参见上文的描述,本实施例不再赘述。同样的,采用这种方法,在pcieswitch服务器整机运行中,无需由主机服务器的bmc多次下达控制指令,只需一次设定,就可以使主机服务器的bmc循环执行监控管理任务。如将预定周期减小到一定值,可以基本上达到实时监控管理的效果。

本发明实施例提供的pcieswitch服务器整机管理方法,限定了主机服务器的bmc获取监控信息的方式是按预定周期采用轮询法进行获取,以达到实时监控管理的效果。

在上述两种优选的实施方式中,相应的,在主机服务器的bmc下达控制指令时,也可应用轮询法。

图4为本发明实施例提供的第二种pcieswitch服务器整机管理方法的流程图。如图4所示,在本发明实施例提供的第一种pcieswitch服务器整机管理方法的基础上,在另一实施例中,步骤s20具体包括:

s40:一级池化服务器的bmc监控一级池化服务器的主板的运行状态以获取一级监控信息并存储。

s41:二级池化服务器的bmc监控二级池化服务器的主板的运行状态以获取二级监控信息并存储。

步骤s21具体包括:

s42:一级池化服务器的bmc从二级池化服务器的bmc获取二级监控信息并存储;

s43:主机服务器的bmc从一级池化服务器的bmc获取一级监控信息和/或二级监控信息。

步骤s22具体为:

主机服务器的bmc向一级池化服务器的bmc发送控制指令。

需要说明的是,一级池化服务器和二级池化服务器采用级联的方式,即一个主机服务器可以连接多个一级池化服务器,而每个一级池化服务器只能连接一个二级池化服务器。

在具体实施中,对于步骤s20来说,步骤s40和步骤s41无顺序关系,可以是同时进行也可以是先后进行,可以是定时进行,如按照预定周期采用轮询法获得相应的监控信息。

对于步骤s21来说,步骤s42和步骤s43同样无顺序关系,可以是同时进行也可以是先后进行,可以是定时进行,如按照预定周期采用轮询法获得相应的监控信息。

对于步骤s22来说,主机服务器的bmc通过向一级池化服务器的bmc发送控制指令,可以是针对一级池化服务器的控制指令,也可以是针对二级池化服务器的控制指令,如果是后者,只需再由相应的一级池化服务器的bmc发送至目标二级池化服务器即可。

本发明实施例提供的pcieswitch服务器整机管理方法,在本发明实施例提供的第一种pcieswitch服务器整机管理方法的基础上,通过将池化服务器分为一级池化服务器和二级池化服务器,按照级联的方式上传监控信息和下达控制指令,可以实现对更多的池化服务器的管理,减少主机服务器的管理压力,优化了监控管理流程。

图5为本发明实施例提供的第三种pcieswitch服务器整机管理方法的流程图。如图5所示,在本发明实施例提供的第二种pcieswitch服务器整机管理方法的基础上,在另一实施例中,还包括:

s50:在web管理界面中显示一级监控信息和/或二级监控信息。

对于其他步骤的具体实施方式详见上文的描述,本实施例不再赘述。

需要说明的是,步骤s50与其他步骤无顺序关系。

在具体实施中,web管理界面可以是主机服务器的web管理界面,也可以是另一台用于管理的服务器的web管理界面。

本发明实施例提供的pcieswitch服务器整机管理方法在本发明实施例提供的第二种pcieswitch服务器整机管理方法的基础上,还包括将一级监控信息和/或二级监控信息显示在web管理界面中,这样可以方便用户查看监控信息。

在本发明实施例提供的第三种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,步骤s22具体为:

web管理界面将控制指令发送至主机服务器的bmc,主机服务器的bmc再将所述控制指令发送至所述一级池化服务器的bmc。

在具体实施中,可以通过web管理界面完成控制指令的输入,为了优化用户体验,输入界面可以采用触摸屏。

本发明实施例提供的pcieswitch服务器整机管理方法,可以通过web管理界面输入控制指令,方便了用户对pcieswitch服务器整机的管理。

在本发明实施例提供的第一种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,监控信息具体为:传感器信息和/或网络信息和/或拓扑信息和/或pcie设备状态信息。

在具体实施中,可依据用户的控制指令,获取用户所需的监控信息。如某池化服务器的某项监控指标出现异常,可以进行报警或者将该池化服务器停机,等待维修。当然,除了上述监控信息,还可以是其他监控信息。

本发明实施例提供的pcieswitch服务器整机管理方法,限定了监控信息的具体内容,通过这些监控信息的内容,可以较为全面的汇总形成pcieswitch服务器整机的监控信息。

在本发明实施例提供的第三种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,控制指令具体为:开机指令或关机指令或重启指令或重启bmc指令或uid控制指令或bmc网络设置指令。

在具体实施中,控制指令的内容可以是向某地址的池化服务器发送开机指令。当然,除了上述控制指令,也可以是其他控制指令。

本发明实施例提供的pcieswitch服务器整机管理方法,限定了控制指令的具体内容,通过这些控制指令的内容,可以优化pcieswitch服务器整机管理流程。

在本发明实施例提供的第三种pcieswitch服务器整机管理方法的基础上,作为优选的实施方式,还包括:

远程主机向主机服务器的bmc发送控制指令,并从主机服务器的bmc获取监控信息。

在具体实施中,远程主机通过ipmi(智能平台管理接口)接口与主机服务器连接,远程主机中的上层软件就可以通过主机服务器的bmc对pcieswitch服务器整机进行监控与管理。

本发明实施例提供的pcieswitch服务器整机管理方法,由远程主机向主机服务器的bmc发送控制指令并从主机服务器的bmc获取监控信息,从而可以实现对pcieswitch服务器整机的远程监控与管理。

以上对本发明所提供的pcieswitch服务器整机管理进行了详细介绍。说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。

还需要说明的是,在本说明书中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1