基于环境参数的服务器集群自动保护系统的制作方法

文档序号:6297546阅读:194来源:国知局
基于环境参数的服务器集群自动保护系统的制作方法
【专利摘要】本发明涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全【技术领域】。系统包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。上位机由服务器集群运行环境监测与控制系统组成,下位机由一台IBM?server组成,上、下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。本发明可以达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。
【专利说明】基于环境参数的服务器集群自动保护系统
【技术领域】
[0001]本发明涉及一种基于环境参数的服务器集群自动保护系统,属于服务器安全【技术领域】。
【背景技术】
[0002]在高校的计算机实验教学中心,网络教学资源共享、网络应用服务和网络管理是由服务器集群来实现的。由于教学和科研的需要,要求这种网络服务是全天候的,即全年365天每天24小时不间断服务。为此,服务器集群也必须全天候工作,而且要保障设备无故障、连续可靠运行。如何保障服务器集群连续、可靠运行除设备本身的因素外,运行环境至关重要。运行环境中最重要的两个因素是电网供电和环境温度,因为异常停电会造成服务器数据丢失,而高温会使服务器设备瘫痪或损坏。因此,几乎在所有的服务器集群的运行环境中,大功率UPS电源和精密制冷空调是必须的配套设备。
[0003]但在实际应用中,一些突发因素仍然会导致服务器数据丢失甚至造成设备损坏。根据对西北农林科技大学计算机实验教学中心服务器集群10多年的运行统计,概率最高的两个因素是电网异常停电和空调故障。这里要特别强调一个技术细节,因为空调是感性负载,UPS电源不能给感性负责提供电力,也就是当电网停电时,空调也会停止工作。因此,当电网停电时,虽然服务器集群有UPS供电仍能正常工作,但由于空调停止工作,服务器集群自身工作所产生的热量使运行环境的温度会越来越高,高温最终会导致服务器瘫痪,并引起数据丢失甚至造成设备损坏。
[0004]因此,当出现电网异常停电、空调故障时,如何保护服务器设备,需要重点予以关注。目前市场上成熟的技术和产品是基于GSM的短信报警系统,即当温度超过设定的上限值时,将环境温度以手机短信形式发给技术管理者,以便管理人员能及时地处置问题。但在长期的应用中,也发现了其存在一些弊端,主要表现在以下几个方面:
[0005]①在晚上一些时段,即使报警短信发给技术管理人员,但由于大家都在熟睡,短信可能被忽略。
[0006]②遇到双休日、节假日,技术管理人员可能远离设备所在地,当收到报警短信时,问题很难及时处置。特别是在高校的寒、暑假期间,这种问题表现得最为突出。
[0007]③短信报警方式实质上是“无线报警技术+人力保障”的技术管理模式,这种管理方式本身就存在漏洞。因为对高校计算机实验教学中心而言,服务器集群的规模相对较小(几十台服务器),因此往往不安排技术管理人员24小时值班,所以“人力保障”本身就存在不确定性和响应效率低下的现实问题。
[0008]④可能造成较大的经济损失。一般情况下,计算机服务器与交换机、路由器等网络设备都集中安装在中心机房,而且这些设备价值比较高,一旦出现以上异常情况,如果处置不及时而造成设备损坏,其损失往往较大。我们自己就曾因此造成了一台价值12万元的防火墙设备损坏,其原因是雷雨天导致半夜突然停电,而高温报警的短信未被及时发现。
[0009]以上问题是基于GSM的短信报警技术本身无法解决的。
【发明内容】

[0010]本发明的目的在于针对上述问题,提供一种基于环境参数的服务器集群自动保护系统,通过实时监测服务器集群的运行环境参数(电网电压、环境温度),当环境参数异常并达到设定的上限值时,在保证服务器数据安全的情况下,自动停止服务器集群的运行,防止高温损坏设备;当环境参数恢复正常时,设计系统会自动开启服务器集群,恢复服务器集群的服务功能。
[0011]为了实现上述目的,本发明的技术方案如下。
[0012]一种基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连。上位机由服务器集群运行环境监测与控制系统组成,上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连。上、下位机采用UPS电源供电。
[0013]下位机的功能可以使用单片机技术结合传感器技术来实现。其各部分功能电路如下:
[0014]①数据采集与控制电路:选择美国Silicon Laboratories公司的C8051F340来实现数据的采集和控制。C8051F340使用Silicon Labs的专利CIP-51微控制器内核,具有片内上电复位、电压调整器、看门狗定时器和时钟振荡器等功能电路,是真正能独立工作的片上系统。CIP-51采用流水线结构,与标准的8051结构相比指令执行速度有很大的提高。FLASH存储器具有在系统重新编程能力,用户软件能对所有外设进行完全控制。
[0015]②电网电压采集电路:使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源。通过对电网电压检测端的测试,即可判断电网供电是否正常。
[0016]③温度检测电路:通过对环境温度的检测来判断空调是否正常工作,环境温度可通过温度传感器进行监测。系统设计选择美国Dallas公司生产的DS18B20作为温度传感器。
[0017]④继电器组控制电路:继电器组的主要功能是接受C8051F340单片机发出的命令,实现对服务器供电的控制。
[0018]该发明中,上位机通过运行设计的服务器自动保护系统软件,实现对下位机发送数据的分析,并当环境参数异常并达到设定的阀值时,通过以太网发送控制命令,关闭服务器集群,当服务器集群关闭后,再通过控制下位机切断服务器的供电电源;当环境参数恢复正常时,开启服务器并恢复其正常的网络服务功能。从而达到自动保护服务器集群及自动管理的目的。
[0019]该发明的有益效果在于:在服务器集群的管理中,由于空调故障、电网停电等突发因素不可避免,而这些因素可能造成服务器及网络系统瘫痪甚至设备损坏,严重影响服务器的安全可靠运行。再者,由于服务器及网络设备处于网络应用的核心位置,且设备价值较高,一旦出现问题,不但损失大、而且造成影响也很大。因此,对服务器集群进行自动保护具
有重要意义。[0020]本发明正是针对现实需要,以解决服务器集群在日常运行和管理中存在的问题为出发点,通过对服务器集群的运行环境因素进行实时监测,并当环境因素异常时,实现对保护服务器集群及网络设备保护;同时,当环境因素恢复正常时,恢复服务器集群原有的功能。即达到保护服务器数据及设备安全的目的,同时大大减轻技术管理人员的工作负担。
【专利附图】

【附图说明】
[0021]图1是本发明实施例中系统结构组成框图。
[0022]图2是本发明实施例中系统电路组成框图。
[0023]图3是本发明实施例中数据采集与控制电路图。
[0024]图4是本发明实施例中电网电压采集电路图。
[0025]图5是本发明实施例中温度采集电路图。
[0026]图6是本发明实施例中继电器控制电路图。
[0027]图7是本发明实施例中上位机连接框图。
[0028]图8是本发明实施例中上位机系统设计流程图。
【具体实施方式】
[0029]下面结合附图和实施例对本发明的【具体实施方式】进行描述,以便更好的理解本发明。
[0030]如图1所示,基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其中,下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连,继电器组采用UPS电源供电。下位机的功能是对服务器集群的运行环境参数进行实时采集,并将采集的数据上传至上位机;同时接收上位机发送的控制命令,控制服务器集群供电。上位机由服务器集群运行环境监测与控制系统组成,其功能是接收下位机采集的数据,并对数据进行分析,当数据异常并达到系统设计的阀值时,关闭服务器并切断服务器的供电;当环境参数恢复正常后,恢复服务器集群的正常服务功能。本发明实施例中,系统电路组成框图如图2所示。
[0031]下位机的功能可以使用单片机技术结合传感器技术来实现。各部分功能电路如下:
[0032]①数据采集与控制电路:由于S0C(System on a chip)单片机在一个芯片中集成了构成教据采集和控制系统所需的几乎所有数字、模拟接口和功能部件,而且具有与MCS-51内核及指令完全兼容的微控制器,因此选择美国Silicon Laboratories公司的C8051F340来实现数据的采集和控制。C8051F340使用Silicon Labs的专利CIP-51微控制器内核,具有片内上电复位、电压调整器、看门狗定时器和时钟振荡器等功能电路,是真正能独立工作的片上系统。CIP-51采用流水线结构,与标准的8051结构相比指令执行速度有很大的提高。FLASH存储器具有在系统重新编程能力,用户软件能对所有外设进行完全控制。因此,采用C8051F340为核心的单片机能更好地完成系统设计预期的功能,也能大大提高系统开发的效率。系统设计的C8051F340的外围引脚及信号定义如图3所示。
[0033]②电网电压采集电路:使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源,采集电路如图4所示。通过对电网电压检测端的测试,即可判断电网供电是否正常。
[0034]③温度检测电路:通过对环境温度的检测来判断空调是否正常工作,环境温度可通过温度传感器进行监测。系统设计选择美国Dallas公司生产的DS18B20作为温度传感器。温度采集电路如图5所示。其中,DQ为温度检测端,与C8051F340的P2.2端口相连接,实现温度的采集。
[0035]④继电器组控制电路:继电器组的主要功能是接受C8051F340单片机发出的命令,实现对服务器供电的控制。为尽量减化电路的设计,在设计中,将服务器集群及其附属的网络设备分为3组,分别由3组继电器进行控制。继电器控制电路如图6所示。
[0036]上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连,如图7所示。
[0037]上位机通过运行设计的服务器自动保护系统软件,实现对下位机发送数据的分析,当环境参数异常并达到设定的阀值时,通过以太网发送控制命令,关闭服务器集群,当服务器集群关闭后,再通过控制下位机切断服务器的供电电源;当环境参数恢复正常时,开启服务器并恢复其正常的网络服务功能。从而达到自动保护服务器集群及自动管理的目的。上位机系统设计流程如图8所示。
[0038]以上所述是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围。
【权利要求】
1.一种基于环境参数的服务器集群自动保护系统,包括下位机和上位机,其特征在于:所述下位机包括数据采集与控制系统、温度传感器、电网电压传感器和继电器组,温度传感器、电网电压传感器连接在数据采集与控制系统上,数据采集与控制系统与继电器组相连;所述上位机由服务器集群运行环境监测与控制系统组成,所述上位机由一台IBM server组成,与下位机之间通过RS-232总线相连,与服务器集群之间通过以太网相连;上、下位机采用UPS电源供电。
2.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述数据采集与控制系统选择美国Silicon Laboratories公司的C805IF340来实现数据的采集和控制。
3.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述电网电压采集电路使用直流稳压电源作为电网电压传感器,即可对电网电压进行实时监测,系统设计使用DC+5V稳压电源。
4.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述温度传感器为美国Dallas公司生产的DS18B20。
5.根据权利要求1所述的基于环境参数的服务器集群自动保护系统,其特征在于:所述继电器组主要是接受C8051F340单片机发出的命令,实现对服务器供电的控制。
【文档编号】G05B19/418GK103760838SQ201310573173
【公开日】2014年4月30日 申请日期:2013年11月14日 优先权日:2013年11月14日
【发明者】张晓峰, 牛亚斌, 张荷, 仵亚伟 申请人:西北农林科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1