一种新型液冷式服务器系统及管理方法、计算机程序与流程

文档序号:16327543发布日期:2018-12-19 06:00阅读:195来源:国知局
一种新型液冷式服务器系统及管理方法、计算机程序与流程

本发明属于服务器管理技术领域,尤其涉及一种新型液冷式服务器系统及管理方法、计算机程序。

背景技术

目前,业内常用的现有技术是这样的:

服务器系统的硬件构成与我们平常所接触的电脑有众多的相似之处,主要的硬件构成仍然包含如下几个主要部分:中央处理器、内存、芯片组、i/o总线、i/o设备、电源、机箱和相关软件。这也成了我们选购一台服务器时所主要关注的指标。在信息系统中,服务器主要应用于数据库和web服务,而pc主要应用于桌面计算和网络终端,设计根本出发点的差异决定了服务器应该具备比pc更可靠的持续运行能力、更强大的存储能力和网络通信能力、更快捷的故障恢复功能和更广阔的扩展空间,同时,对数据相当敏感的应用还要求服务器提供数据备份功能。而pc机在设计上则更加重视人机接口的易用性、图像和3d处理能力及其他多媒体性能。然而,现有服务器运行状态由人工进行监控,当大批量服务器线上运行时,需要多人巡检,耗费人力、执行效率低且精度不高;并且人工现场查看设备运行状态,在接触设备的同时易造成网络中断或其它异常,无法避免因人为疏忽导致故障漏报或响应不及时,对日常故障诊断效率低;同时服务器工作信号的异常导致主板发生系列反应而关机时就很难判断故障的根源信号,因为整个时序链路上的所有信号都有可能诱发主板关机,这对于硬件故障的快速定位带来了很大阻碍,严重的影响了故障的处理效率。

综上所述,现有技术存在的问题是:

现有服务器运行状态由人工进行监控,当大批量服务器线上运行时,需要多人巡检,耗费人力、执行效率低且精度不高;并且人工现场查看设备运行状态,在接触设备的同时易造成网络中断或其它异常,无法避免因人为疏忽导致故障漏报或响应不及时,对日常故障诊断效率低;同时服务器工作信号的异常导致主板发生系列反应而关机时就很难判断故障的根源信号,因为整个时序链路上的所有信号都有可能诱发主板关机,这对于硬件故障的快速定位带来了很大阻碍,严重的影响了故障的处理效率。

现有状态监控中,存在的不易构造一个未知网络的网络模型并确定模型中的各个参数,经验模型的精度较低,不够直观,过程复杂,对操作人员要求较高的问题。造成液冷式服务器系统管理中,智能化程度低。



技术实现要素:

针对现有技术存在的问题,本发明提供了一种新型液冷式服务器系统及管理方法、计算机程序。

本发明是这样实现的,一种新型液冷式服务器管理方法,包括:

通过温度检测模块通过粒子群算法检测液冷式服务器工作温度数据;其中,粒子群算法检测液冷式服务器工作温度数据中,初始化微粒群,其中包括初始化整个粒子群的位置xi=(xi1,xi2,···xid)t和速度vi=(vi1,vi2,···,vid)t及局部最优和整体最优,其中id表示第i代中第d个粒子;计算每个粒子在当前位置处的适应度值fitnessid=f(xid);然后根据适应度值的大小,初始化局部最优解pbesti=fitnessi和整体最优解gbest=min(fintess1,fitness2,···,fitnessn),i=1,2,···,n;在每次迭代过程中,每个粒子根据以下准则来更新自己的位置和速度:vid(t+1)=wvid(t)+c1r1(pld-xid(t))+c2r2(pgd-xid(t)),xid(t+1)=xid(t)+vid(t+1);其中vid为粒子的速度,xid为粒子的位置,w为惯性权重,c1和c2为加速度系数,r1和r2是随机数,pld为全局最优解而pgd为局部最优解;更新局部最优解pbesti和整体最优解gbest;整体最优解gbest达到设定的阈值或者已经达到最大迭代次数,终止计算;否则跳转至在每次迭代过程中,每个粒子更新自己的位置和速度步骤;

通过状态监控模块监控液冷式服务器工作状态参数;根据需要先设置监控液冷式服务器工作状态参数,得到被测液冷式服务器组成的网络整体的散射参数,包括反射参数和传输参数;其次对散射参数进行预处理,对数据序列进行补零,进行快速傅里叶变换;根据傅里叶逆变换后时域脉冲的分布情况和分辨率的要求,选择不同的窗函数对傅里叶变换前的数据进行处理;

单片机控制模块调度供液模块进行供应液;

通过动力模块采用水泵抽取储液胶管进行液体循环;通过制冷模块对液体进行冷却;

通过故障定位模块定位服务器主板硬件故障位置。

进一步,通过状态监控模块监控液冷式服务器工作状态参数;进一步包括:

步骤一,利用傅里叶逆变换,将频域测得的散射参数变换到时域,得到时域冲击响应,反射参数对应时域反射响应,传输参数对应时域传输响应;

步骤二,根据反射响应和传输响应中前两个脉冲在时间轴上的位置,分别构造四个时域选通函数;

步骤三,利用步骤二中选通函数,对步骤一中时域的反射响应和传输响应进行选通,分别提取出反射响应和传输响应中的前两个脉冲;

步骤四,将时域选通后的时域脉冲分别通过傅里叶变换,得到频域选通数据;

步骤五,频域选通数据中包含了被测电路的信息,利用得到的信息,根据公式构造补偿因子fcf(i);利用下面的公式,构造补偿因子fcf(i):

(i=1,2…)

g1(i)~g4(i)是在上步中得到的频域选通数据;

r(i)是比率因子;

fcf(i)补偿因子;

步骤六,利用遮蔽补偿公式,得到没有遮蔽误差的反射参数fs11(i)和传输参数fs21(i)。

进一步,步骤六,利用下面的遮蔽补偿公式,得到没有遮蔽误差的反射参数fs11(i)和传输参数fs21(i):

(i=1,2…);

在步骤六之后需要消除数据预处理,舍弃添加零点位置处的数据,得到的反射参数和传输参数除以窗函数,消除加窗产生的影响,得到最终的补偿后的反射参数fs11_c(i)和传输参数fs21_c(i):

(i=1,2…)

w(i)数据预处理中的窗函数。

进一步,状态监控方法进一步包括:

(1)对多个服务器进行智能型平台管理接口ipmi带外硬件巡检以获取每个所述服务器的硬件状态;

(2)根据所述硬件状态和预设故障知识库对每个所述服务器进行故障等级过滤并获取每个所述服务器的故障信息和故障等级;

(3)对所述故障等级和故障信息进行分析,根据分析结果选择性地将故障信息推送至事务处理平台以由所述事务处理平台对故障进行排除。

进一步,故障定位方法包括:

首先,按照时序信号的先后关系选取三个时序信号,将时序信号连接至cpld的输入管脚,将输入到cpld内部的时序信号通过主板led指示灯的方式显示出来,三个时序信号对应三个led指示灯;

然后,当三个信号中的一个优先发生异常时,就会点亮主板上对应的led指示灯;

所述输入到cpld内部的时序信号通过主板led指示灯的方式显示出来具体包括在cpld内部对时序信号状态通过硬件描述语言进行处理;处理完成的信号通过cpld的输出管脚传递到主板硬件线路;主板硬件线路根据cpld输出的结果将主板上对于的led指示灯点亮。

本发明的另一目的在于提供一种实现所述新型液冷式服务器管理方法的计算机程序。

本发明的另一目的在于提供一种实现所述新型液冷式服务器管理方法的计算机。

本发明的另一目的在于提供一种计算机可读存储介质,包括指令,当其在计算机上运行时,使得计算机执行所述的新型液冷式服务器管理方法。

本发明的另一目的在于提供一种实现所述新型液冷式服务器管理方法的新型液冷式服务器系统,所述新型液冷式服务器系统包括:

供电模块,与单片机控制模块连接,用于对液冷式服务器进行供电;

温度检测模块,与单片机控制模块连接,用于通过温度传感器检测液冷式服务器工作温度数据;

状态监控模块,与单片机控制模块连接,用于监控液冷式服务器工作状态参数;

单片机控制模块,与供电模块、温度检测模块、状态监控模块、供液模块、动力模块、制冷模块、故障定位模块连接,用于控制各个模块正常工作;

供液模块,与单片机控制模块连接,用于通过储液胶管进行供应液;

动力模块,与单片机控制模块连接,用于通过水泵抽取储液胶管进行液体循环;

制冷模块,与单片机控制模块连接,用于通过冷凝器对液体进行冷却;

故障定位模块,与单片机控制模块连接,用于定位服务器主板硬件故障位置。

本发明的另一目的在于提供一种搭载所述新型液冷式服务器系统的工业控制pc机。

本发明的优点及积极效果为:

本发明通过状态监控模块对大批量服务器硬件运行状态进行监控,解决了当前大批量服务器人工巡检的故障遗漏以及响应不及时的问题,在节省了人力巡检成本的支出的同时,避免了人为造成设备异常中断的影响,且大大提高了日常运维效率及故障预判.同时增强业务监控部署变更的灵活性及可操控性;同时通过故障定位模块实现服务器硬件故障的快速定位,使得服务器在发生异常关机等硬件故障时,能够通过主板led指示灯的形式明确显示故障位置,因此能够有效改善故障处理效率,提高产品的可维护性,提升客户满意度。

通过温度检测模块通过粒子群算法检测液冷式服务器工作温度数据;其中,粒子群算法检测液冷式服务器工作温度数据中,初始化微粒群,其中包括初始化整个粒子群的位置xi=(xi1,xi2,···xid)t和速度vi=(vi1,vi2,···,vid)t及局部最优和整体最优,可获得准确的温度数据。

本发明的状态监控模块监控冷式服务器工作状态参数中,可以测量状态监控模块运行的网络中的时域测量参数,通过对各个网络的时域参数分别进行选通操作,可以实现对局部网络的散射参数的测量,并且消除其他部分带来的误差。相比于传统方法,本发明的状态监控模块监控方法简单直观,降低操作人员的工作难度,而且具有更好的补偿结果。实现了服务器工作状态参数的监控。

附图说明

图1是本发明实施提供的新型液冷式服务器管理方法流程图。

图2是本发明实施提供的新型液冷式服务器系统结构框图。

图2中:1、供电模块;2、温度检测模块;3、状态监控模块;4、单片机控制模块;5、供液模块;6、动力模块;7、制冷模块;8、故障定位模块。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明提供的一种新型液冷式服务器系统及管理方法包括以下步骤:

s101,通过供电模块对液冷式服务器进行供电;

s102,通过温度检测模块检测液冷式服务器工作温度数据;通过状态监控模块监控液冷式服务器工作状态参数;

s103,单片机控制模块调度供液模块进行供应液;

s104,通过动力模块采用水泵抽取储液胶管进行液体循环;通过制冷模块对液体进行冷却;

s105,通过故障定位模块定位服务器主板硬件故障位置。

如图2所示,本发明实施例提供的新型液冷式服务器系统包括:供电模块1、温度检测模块2、状态监控模块3、单片机控制模块4、供液模块5、动力模块6、制冷模块7、故障定位模块8。

供电模块1,与单片机控制模块4连接,用于对液冷式服务器进行供电;

温度检测模块2,与单片机控制模块4连接,用于通过温度传感器检测液冷式服务器工作温度数据;

状态监控模块3,与单片机控制模块4连接,用于监控液冷式服务器工作状态参数;

单片机控制模块4,与供电模块1、温度检测模块2、状态监控模块3、供液模块5、动力模块6、制冷模块7、故障定位模块8连接,用于控制各个模块正常工作;

供液模块5,与单片机控制模块4连接,用于通过储液胶管进行供应液;

动力模块6,与单片机控制模块4连接,用于通过水泵抽取储液胶管进行液体循环;

制冷模块7,与单片机控制模块4连接,用于通过冷凝器对液体进行冷却;

故障定位模块8,与单片机控制模块4连接,用于定位服务器主板硬件故障位置。

本发明提供的状态监控模块3监控方法如下:

(1)对多个服务器进行智能型平台管理接口ipmi带外硬件巡检以获取每个所述服务器的硬件状态;

(2)根据所述硬件状态和预设故障知识库对每个所述服务器进行故障等级过滤并获取每个所述服务器的故障信息和故障等级;

(3)对所述故障等级和故障信息进行分析,根据分析结果选择性地将故障信息推送至事务处理平台以由所述事务处理平台对故障进行排除。

本发明提供的故障定位模块8定位方法如下:

首先,按照时序信号的先后关系选取三个时序信号,将时序信号连接至cpld的输入管脚,将输入到cpld内部的时序信号通过主板led指示灯的方式显示出来,三个时序信号对应三个led指示灯;

然后,当三个信号中的一个优先发生异常时,就会点亮主板上对应的led指示灯。

下面结合具体分析对本发明作进一步描述。

本发明实施例提供的新型液冷式服务器管理方法,包括:

通过温度检测模块通过粒子群算法检测液冷式服务器工作温度数据;其中,粒子群算法检测液冷式服务器工作温度数据中,初始化微粒群,其中包括初始化整个粒子群的位置xi=(xi1,xi2,···xid)t和速度vi=(vi1,vi2,···,vid)t及局部最优和整体最优,其中id表示第i代中第d个粒子;计算每个粒子在当前位置处的适应度值fitnessid=f(xid);然后根据适应度值的大小,初始化局部最优解pbesti=fitnessi和整体最优解gbest=min(fintess1,fitness2,···,fitnessn),i=1,2,···,n;在每次迭代过程中,每个粒子根据以下准则来更新自己的位置和速度:vid(t+1)=wvid(t)+c1r1(pld-xid(t))+c2r2(pgd-xid(t)),xid(t+1)=xid(t)+vid(t+1);其中vid为粒子的速度,xid为粒子的位置,w为惯性权重,c1和c2为加速度系数,r1和r2是随机数,pld为全局最优解而pgd为局部最优解;更新局部最优解pbesti和整体最优解gbest;整体最优解gbest达到设定的阈值或者已经达到最大迭代次数,终止计算;否则跳转至在每次迭代过程中,每个粒子更新自己的位置和速度步骤;

通过状态监控模块监控液冷式服务器工作状态参数;根据需要先设置监控液冷式服务器工作状态参数,得到被测液冷式服务器组成的网络整体的散射参数,包括反射参数和传输参数;其次对散射参数进行预处理,对数据序列进行补零,进行快速傅里叶变换;根据傅里叶逆变换后时域脉冲的分布情况和分辨率的要求,选择不同的窗函数对傅里叶变换前的数据进行处理;

单片机控制模块调度供液模块进行供应液;

通过动力模块采用水泵抽取储液胶管进行液体循环;通过制冷模块对液体进行冷却;

通过故障定位模块定位服务器主板硬件故障位置。

通过状态监控模块监控液冷式服务器工作状态参数;进一步包括:

步骤一,利用傅里叶逆变换,将频域测得的散射参数变换到时域,得到时域冲击响应,反射参数对应时域反射响应,传输参数对应时域传输响应;

步骤二,根据反射响应和传输响应中前两个脉冲在时间轴上的位置,分别构造四个时域选通函数;

步骤三,利用步骤二中选通函数,对步骤一中时域的反射响应和传输响应进行选通,分别提取出反射响应和传输响应中的前两个脉冲;

步骤四,将时域选通后的时域脉冲分别通过傅里叶变换,得到频域选通数据;

步骤五,频域选通数据中包含了被测电路的信息,利用得到的信息,根据公式构造补偿因子fcf(i);利用下面的公式,构造补偿因子fcf(i):

(i=1,2…)

g1(i)~g4(i)是在上步中得到的频域选通数据;

r(i)是比率因子;

fcf(i)补偿因子;

步骤六,利用遮蔽补偿公式,得到没有遮蔽误差的反射参数fs11(i)和传输参数fs21(i)。

步骤六,利用下面的遮蔽补偿公式,得到没有遮蔽误差的反射参数fs11(i)和传输参数fs21(i):

(i=1,2…);

在步骤六之后需要消除数据预处理,舍弃添加零点位置处的数据,得到的反射参数和传输参数除以窗函数,消除加窗产生的影响,得到最终的补偿后的反射参数fs11_c(i)和传输参数fs21_c(i):

(i=1,2…)

w(i)数据预处理中的窗函数。

状态监控方法进一步包括:

(1)对多个服务器进行智能型平台管理接口ipmi带外硬件巡检以获取每个所述服务器的硬件状态;

(2)根据所述硬件状态和预设故障知识库对每个所述服务器进行故障等级过滤并获取每个所述服务器的故障信息和故障等级;

(3)对所述故障等级和故障信息进行分析,根据分析结果选择性地将故障信息推送至事务处理平台以由所述事务处理平台对故障进行排除。

故障定位方法包括:

首先,按照时序信号的先后关系选取三个时序信号,将时序信号连接至cpld的输入管脚,将输入到cpld内部的时序信号通过主板led指示灯的方式显示出来,三个时序信号对应三个led指示灯;

然后,当三个信号中的一个优先发生异常时,就会点亮主板上对应的led指示灯;

所述输入到cpld内部的时序信号通过主板led指示灯的方式显示出来具体包括在cpld内部对时序信号状态通过硬件描述语言进行处理;处理完成的信号通过cpld的输出管脚传递到主板硬件线路;主板硬件线路根据cpld输出的结果将主板上对于的led指示灯点亮。

本发明提供的输入到cpld内部的时序信号通过主板led指示灯的方式显示出来具体包括在cpld内部对时序信号状态通过硬件描述语言进行处理;处理完成的信号通过cpld的输出管脚传递到主板硬件线路;主板硬件线路根据cpld输出的结果将主板上对于的led指示灯点亮。

在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用全部或部分地以计算机程序产品的形式实现,所述计算机程序产品包括一个或多个计算机指令。在计算机上加载或执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(dsl)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输)。所述计算机可读取存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,dvd)、或者半导体介质(例如固态硬盘solidstatedisk(ssd))等。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1