服务器监控方法

文档序号:8322091阅读:1198来源:国知局
服务器监控方法【
技术领域
】[0001]本发明是关于一种监控方法,尤其是关于一种服务器监控方法。【
背景技术
】[0002]近几年来,随着科技和网络的快速发展,服务器的功能愈益强大。为了保证服务器工作的稳定性,一般米用基板管理控制器(BaseboardManagementControl,BMC)来监控和管理服务器系统的运作。[0003]基板管理控制器在服务器系统中是一个独立的子系统,并不依赖于服务器的处理器、B1S或操作系统来工作,只要服务器接上电源,无论服务器处于开机、关机还是待机状态,基板管理控制器均处于工作状态。一般而言,基板管理控制器通过读取设置在服务器的传感器读数来即时监控服务器的运行状态,比如温度、电压等。然而,并非所有服务器的运作状态均能透过基板管理控制器来监控,也无法设置传感器。因此,如何设计一个新的服务器监控方法,能够即时的对服务器不正常状态进行控管,并且进行警示通知,乃为此一业界亟待解决的问题。【
发明内容】[0004]本发明的一方面是在提供一种服务器监控方法,用以监控一服务器系统。首先,提供一系统管理软件,运行于该服务器系统的一操作系统下,该系统管理软件于该操作系统下监控该服务器系统的至少一系统模块的运行状态,生成一运行状态数据。接着,由该系统管理软件向该服务器系统的一基板管理控制器传送该运行状态数据。基板管理控制器根据该运行状态数据,判断该系统模块是否处于正常工作状态。其中,基板管理控制器包括一传感器数据记录库,该传感器数据记录库提供一虚拟传感器数据记录,当判断该系统模块处于非正常工作状态时,该基板管理控制器将该虚拟传感器数据记录设置为一异常状态。该基板管理控制器根据该异常状态,产生一事件。该基板管理控制器包括一平台事件过滤器,该事件触发该平台事件过滤器发出一警示信号传送给一远程管理主机。[0005]在一实施例中,该系统管理软件通过OEM命令向该服务器系统的一基板管理控制器传送该运行状态数据。[0006]在一实施例中,在基板管理控制器接收运行状态数据前,还包括初始化该传感器数据记录库,其中初始化该传感器数据记录库是将该虚拟传感器数据记录设置为未提供。[0007]在一实施例中,系统模块为网络模块,当该系统管理软件监控到该网络模块发生网络断线时,该基板管理控制器将该虚拟传感器数据记录设置为异常状态,产生的该事件为网络断线事件,触发的该警示信号为网络断线警示信号。[0008]在一实施例中,系统模块为硬盘模块,当该系统管理软件监控到该硬盘模块发生故障时,该基板管理控制器将该虚拟传感器数据记录设置为异常状态,产生的该事件为系统硬盘故障事件,触发的该警示信号为硬盘故障警示信号。[0009]在一实施例中,系统模块为开关机模块,当该系统管理软件监控到服务器系统被非法关机时,该基板管理控制器将该虚拟传感器数据记录设置为异常状态,产生的该事件为非法关机事件,触发的该警示信号为非法关机警示信号。[0010]在一实施例中,发出警示信号传送给一远程管理主机还包括:发送一简单网络管理协定(SimpleNetworkManagementProtocol,SNMP)trap信号给该远程管理主机,或发送Email信号给该远程管理主机。[0011]在一实施例中,虚拟传感器数据记录为符合一IPMI规则的传感器数据记录,该OEM命令非该IPMI的一标准命令,但为根据该IPMI规则定义的命令。[0012]综上所述,本发明通过根据IPMI规则所定义的OEM命令由系统管理软件向基板管理控制器传送该运行状态数据,让基板管理控制器改变传感器数据记录库中储存的传感器数据记录来触发一事件,使得基板管理控制器可根据此事件,由平台事件过滤器向远程管理主机发出警示,达到监控的目的,在使用上相当方便。【附图说明】[0013]图1所示为本发明服务器监控系统的示意图;[0014]图2所示为本发明服务器监控方法流程图。【具体实施方式】[0015]以下为本发明较佳具体实施例以所附附图加以详细说明,下列的说明及附图使用相同的参考数字以表示相同或类似元件,并且在重复描述相同或类似元件时则予省略。[0016]智能平台管理界面(IntelligentPlatformManagementInterface,IPMI)为每部服务器内监管系统的一标准界面,通过智能平台管理界面可让管理信息在各感测器、监控电路、管理机台、管理软件上通行且有一致性。但由于IPMI所定义的管理监控功能有限,为避免造成IPMI管理监控功能不敷使用,因此IPMI有OEM命令集的设定。所谓OEM命令集,便是在原本的IPMI管理监控功能外,由厂商利用原本的IPMI功能整合出新的功能,以达到支援不同厂商不同需求的目的。而本发明即是利用OEM命令集来根据IPMI规则定义额外的OEM命令来进行监控功能,借以监控系统模块的状态,例如网络卡连接端口的状态、硬盘的状态或系统是否被非法关机等。[0017]图1所示为本发明服务器远程监控系统架构的示意图。服务器监控系统100包含:服务器110以及远程管理主机120。须注意的是,图1中仅绘示一个服务器110,然而于其他实施例中,可因应不同的情况设置不同数目的服务器110。本实施例的服务器监控系统100,系可在服务器110的系统模块1101有异常的事件发生时,例如:网络卡连接端口不正常、硬盘出现故障或系统被非法关机时产生一错误通知信息130。由于硬件设计上的限制,单靠基板管理控制器本身并没有办法检测到上述这些系统状况的改变,所以只靠基板管理控制器固件无法实现监控功能。因此,本发明通过额外的系统管理软件来即时监控基板管理控制器无法监控到的上述系统状态信息,进而发出警示信号。[0018]在一较佳实施例中,本发明的服务器110还包含:一系统模块1101、一系统管理软件(systemmanagementsoftware)1102以及一基板管理控制器1103。基板管理控制器1103还包括一传感器数据记录库1104。其中,系统管理软件1102,运行于服务器110的一操作系统下。系统管理软件1102可在此操作系统下对服务器110系统模块1101的运行状态进行监控,并产生一运行状态数据。并通过OEM命令由系统管理软件1102向服务器110中的一基板管理控制器1103传送此运行状态数据。在此实施例中,此OEM命令非IPMI原本即定义的命令,但是是根据IPMI规则定义的额外OEM命令,因此其要求的数据与对应的反应均符合IPMI规则定义。当基板管理控制器1103收到此运行状态数据后,可根据此运行状态数据,判断系统模块1101是否处于正常工作状态。其中,基板管理控制器1103内的传感器数据记录库(SensorDataRecord,SDR)1104提供有一虚拟传感器数据记录,当判断系统模块1101处于非正常工作状态时,基板管理控制器1103将虚拟传感器数据记录设置为一异常状态。基板管理控制器1103根据此异常状态,产生一事件(event)。此事件会触发基板管理控制器1103的一平台事件过滤器(PlatformEventFilter;PEF)发出一警示信号传送给一远程管理主机120。根据本发明提供的监控方法,虽然需要在基板管理控制器1103的固件代码里增加OEM命令和传感器数据记录(SDR),但是对系统管理软件1102的要求比较低,只要求系统管理软件1102采集信息,并将所收集到的信息通过设计好的OEM命令发送给基板管理控制器1103,而后续的程序均由基板管理控制器1103执行,因此可大幅降低系统管理软件1102的复杂度。[0019]其中,平台事件过滤器是在基板管理控制器1103产生事件时,对应产生一预设行为,例如,关机、重新启动或发送警报等。基板管理控制器1103内具有一事件过滤器表(eventfiltertable),定义有每一事件对应的处理方式。当基板管理控制器1103接收到来自内部或者外部的一事件时,会将此事件内容与事件过滤器表中记录的事件内容进行比对,一旦符合某一事件内容,则会根据事件过滤器表定义进行对应处理。例如以符合简单网络管理协定(SimpleNetworkManagementProtocol,SNMP)的错误通知信息(SNMPTrap)或Email方式,即时地通知远程管理主机120进行错误分析,以针对发生错误当前第1页1 2 
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1