一种服务器时钟故障自动检测修复系统及方法与流程

文档序号:12464063阅读:493来源:国知局
一种服务器时钟故障自动检测修复系统及方法与流程

本发明属于服务器时钟管理领域,具体涉及一种服务器时钟故障自动检测修复系统及方法。



背景技术:

系统时钟是服务器系统中非常重要的组成部分,在服务器中多用来为CPU(中央处理器)、PCH、PCIE槽、BMC(管理控制器)等设备提供时钟。系统时钟需要满足一定的频率要求,当系统时钟频率超出允许范围时,服务器会发生计时不准、可靠性降低、甚至是宕机等问题。

目前的服务器系统设计中,很少对系统时钟质量进行监控。有的设计虽然采用的冗余的时钟,但是又不支持时钟故障的识别和自动切换,需要手动切换时钟源。当系统因时钟问题而出现故障时,既不能保证系统自动恢复正常工作,又不能快速定位系统问题所在,而需要工程师现场调试分析。这不利于服务器的稳定性和易维护性。

此为现有技术不足之处。因此,针对现有技术中的上述缺陷,提供设计一种服务器时钟故障自动检测修复系统及方法,是非常有必要的。



技术实现要素:

本发明的目的在于,针对上述服务器系统时钟故障不能识别和自动切换的缺陷,提供一种服务器时钟故障自动检测修复系统及方法,以解决上述技术问题。

为实现上述目的,本发明给出以下技术方案:

一种服务器时钟故障自动检测修复系统,包括第一时钟源,与第一时钟源连接的时钟分路单元,与时钟分路单元连接的若干终端、时钟检测单元,与时钟检测单元连接的参考时钟源、管理控制器;

第一时钟源,用于提供时钟信号;

时钟分路单元,用于将第一时钟源提供的时钟信号分路;

若干终端,使用第一时钟源分路后的系统时钟;

时钟检测单元,用于检测第一时钟源分路后的时钟信号,并发送时钟质量检测结果;

参考时钟源,用于给时钟检测单元提供计时时间;

管理控制器,用于接收时钟检测单元的时钟质量检测结果,并在管理界面报告时钟故障信号。

进一步地,第一时钟源和时钟分路单元之间还包括时钟选通单元,时钟选通单元还连接至少一个冗余时钟源;

冗余时钟源用于提供备用时钟信号给时钟选通单元;时钟选通单元用于接收管理控制器的时钟选通信号,并切换时钟信号提供给时钟分路单元。

进一步地,所述参考时钟源为晶振,晶振为32.768kHZ的晶振。

进一步地,所述终端包括中央处理器CPU,南桥芯片PCH,PCIE槽,管理控制器。

进一步地,时钟检测单元采用复杂可编程逻辑器件CPLD、现场可编程门阵列FPGA或者数字电路;时钟分路单元采用时钟缓冲器或者南桥芯片PCH。

进一步地,第一时钟源设置在主板上或者独立的板卡上,冗余时钟源设置在独立的板卡上;第一时钟源和冗余时钟源可以设在同一个独立的板卡上,也可以设在不同的独立板卡上。

本发明还提供如下技术方案:

一种服务器时钟故障自动检测修复方法,包括如下步骤:

步骤1. 通过第一时钟源提供时钟信号;

步骤2. 通过时钟分路单元分路时钟信号;

步骤3. 通过时钟检测单元检测时钟信号;

步骤4. 通过时钟检测单元发送时钟质量检测结果给管理控制器;

步骤5. 若时钟信号正常,回到步骤3;

若时钟信号不正常,管理控制器报告时钟故障信号。

进一步地,步骤5之后包括如下步骤:

步骤6. 通过管理控制器向时钟选通单元发送时钟选通信号;

步骤7. 通过时钟选通单元切换时钟信号,回到步骤2。

进一步地,步骤3中检测时钟信号的步骤如下:

步骤31.系统时钟频率记为F;设置参考时钟源的计时时间为T;

步骤32.在计时时间T内,对系统时钟进行计数,数目记为n;

步骤33.比较理论计数值T*F与实际计数值n之间的关系;

步骤34.设定允许的误差范围为δ;

若|T*F-n|/(T*F)大于δ,则判定为系统时钟信号异常;

若|T*F-n|/(T*F)小于等于δ,则判定为系统时钟信号正常。

进一步地,所述步骤34中设定允许的误差范围根据允许的时钟频率偏差和允许的参考时钟源计时偏差设定。

本发明的有益效果在于:本发明对服务器系统时钟增加了监控和自动切换机制,当时钟存在故障时,管理控制器在管理界面报告该故障,并控制时钟选通单元切换时钟源,保证系统正常工作。

此外,本发明设计原理可靠,结构简单,具有非常广泛的应用前景。

由此可见,本发明与现有技术相比,具有突出的实质性特点和显著的进步,其实施的有益效果也是显而易见的。

附图说明

图1为本发明系统的连接示意图;

图2为本发明的方法流程图;

其中,1.管理控制器;2.时钟选通单元;3.第一时钟源;4.冗余时钟源;5.时钟分路单元;6.时钟检测单元;7.终端;8.参考时钟源。

具体实施方式:

为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明具体实施例中的附图,对本发明中的技术方案进行清楚、完整地描述。

如图1所示,一种服务器时钟故障自动检测修复系统,包括第一时钟源3,与第一时钟源3连接的时钟分路单元5,与时钟分路单元5连接的若干终端7、时钟检测单元6,与时钟检测单元6连接的参考时钟源8、管理控制器1;

第一时钟源3,用于提供时钟信号;

时钟分路单元5,用于将第一时钟源3提供的时钟信号分路;

若干终端7,使用第一时钟源3分路后的系统时钟;

时钟检测单元6,用于检测第一时钟源3分路后的时钟信号,并发送时钟质量检测结果;

参考时钟源8,用于给时钟检测单元6提供计时时间;

管理控制器1,用于接收时钟检测单元6的时钟质量检测结果,并在管理界面报告时钟故障信号。

第一时钟源3和时钟分路单元5之间还包括时钟选通单元2,时钟选通单元2还连接至少一个冗余时钟源4;

冗余时钟源4用于提供备用时钟信号给时钟选通单元2;时钟选通单元2用于接收管理控制器1的时钟选通信号,并切换时钟信号提供给时钟分路单元5。

所述参考时钟源8为晶振,晶振为32.768kHZ的晶振。

所述终端7包括中央处理器CPU,南桥芯片PCH,PCIE槽,管理控制器。

时钟检测单元6采用复杂可编程逻辑器件CPLD、现场可编程门阵列FPGA或者数字电路;时钟分路单元5采用时钟缓冲器或者南桥芯片PCH。

第一时钟源3设置在主板上或者独立的板卡上,冗余时钟源4设置在独立的板卡上;第一时钟源3和冗余时钟源4可以设在同一个独立的板卡上,也可以设在不同的独立板卡上。

如图2所示,一种服务器时钟故障自动检测修复方法,包括如下步骤:

步骤1. 通过第一时钟源提供时钟信号;

步骤2. 通过时钟分路单元分路时钟信号;

步骤3. 通过时钟检测单元检测时钟信号;

步骤4. 通过时钟检测单元发送时钟质量检测结果给管理控制器;

步骤5. 若时钟信号正常,回到步骤3;

若时钟信号不正常,管理控制器报告时钟故障信号。

步骤5之后包括如下步骤:

步骤6. 通过管理控制器向时钟选通单元发送时钟选通信号;

步骤7. 通过时钟选通单元切换时钟信号,回到步骤2。

步骤3中检测时钟信号的步骤如下:

步骤31.系统时钟频率记为F;设置参考时钟源的计时时间为T;

步骤32.在计时时间T内,对系统时钟进行计数,数目记为n;

步骤33.比较理论计数值T*F与实际计数值n之间的关系;

步骤34.设定允许的误差范围为δ;

若|T*F-n|/(T*F)大于δ,则判定为系统时钟信号异常;

若|T*F-n|/(T*F)小于等于δ,则判定为系统时钟信号正常。

所述步骤34中设定允许的误差范围根据允许的时钟频率偏差和允许的参考时钟源计时偏差设定。

本发明的实施例是说明性的,而非限定性的,上述实施例只是帮助理解本发明,因此本发明不限于具体实施方式中所述的实施例,凡是由本领域技术人员根据本发明的技术方案在本发明的精神和原则之内所做的任何修改、等同替换、改进等得出的其他的具体实施方式,同样属于本发明保护的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1