一种内存告警的优化方法

文档序号:9667239阅读:232来源:国知局
一种内存告警的优化方法
【技术领域】
[0001]本发明涉及计算机服务器技术领域,尤具体地说是一种实用性强、内存告警的优化方法。
【背景技术】
[0002]内存是服务器与计算机中必须的设备,尤其是在服务器系统中内存的可靠性对整体服务器系统的影响具有至关重要的决定性,在服务器系统运行过程中,随着时间的推移,内存的电子电器物理特性下降,会产生内存读写错误,大部分内存的读写错误都是可修复的,即系统具有自我修复特性,通过ECC机制可以修正内存错误,但是如果内存条发生故障,即物理损坏就会出现大量可修复的内存错误,影响系统整体性能,最终可能影响系统宕机,给客户造成不可挽回的损失。
[0003]基于以上所提,内存告警机制被提出应用到服务器系统上,即当内存上有错误发生时,通过日志提醒、点亮故障内存灯等方式告知客户,及时排除隐患。传统内存告警方法,内存以rank为单位设置内存错误计数器i,设置错误阈值N,当在这个rank上出现一个错误后i++,到i等于N时触发告警并清零,指示内存该rank上发生内存错误,该方法存在一定的问题,即系统开机后,随着系统的不断运行,难免会产生内存错误,随着时间的推移,内存错误计数器i终会等于阈值N触发告警,但是此时系统运行并没有问题,这属于误告警。
[0004]鉴于存在的问题,本发明提出一种内存告警的优化方法,即在传统方法的基础上设置时间计时器t与时间阈值T,只有在规定时间阈值T内达到错误阈值N时才告警,否则不告警。相对传统方法,本发明更加优化内存告警机制,延长内存使用周期,提高产品质量,具有重要的应用价值。

【发明内容】

[0005]本发明的技术任务是针对以上不足之处,提供一种实用性强、内存告警的优化方法。
[0006]—种内存告警的优化方法,其具体实现过程为:
设置步骤,即设置错误阈值N、时间计时器t与时间阈值T ;
告警步骤,即当在规定时间阈值T内达到错误阈值N时进行告警,否则不告警。
[0007]所述设置步骤的具体过程为:
内存以rank为单位设置内存错误计数器i,设置错误阈值N,当在这个rank上出现一个错误后i++,到i等于N时触发告警并清零,指示内存该rank上发生内存错误;
在上述步骤的基础上以rank为单位增加时间计时器t,用来记录时间,设置时间阈值
T0
[0008]所述告警步骤的具体过程为:
基于设置步骤设置的内容,当在该rank上有内存错误发生时,错误计数器i开始计数,同时时间计时器t开始记录时间,只有在规定时间阈值T内达到错误阈值N时才告警,错误计数器i与时间计时器t分别清零,重新统计;当在规定时间阈值T内达不到错误阈值N时则不告警,同样错误计数器i与时间计时器t分别清零,重新统计。
[0009]本发明的一种内存告警的优化方法,具有以下优点:
本发明的一种内存告警的优化方法,相对传统方法,本发明更加优化内存告警机制;结合主板设计、系统特性以及内存品质特性的实际测试,选取合适的错误阈值N与时间阈值T可以起到延长内存使用寿命,提高服务器系统产品质量的作用,该方法在服务器内存告警领域具有非常重要的应用价值,实用性强,易于推广。
【附图说明】
[0010]附图1为本发明的实现流程图。
【具体实施方式】
[0011]下面结合附图和具体实施例对本发明作进一步说明。
[0012]本发明提供一种内存告警的优化方法,即在传统方法的基础上设置时间计时器t与时间阈值T,只有在规定时间阈值T内达到错误阈值N时才告警,否则不告警。相对传统方法,本发明更加优化内存告警机制;结合主板设计、系统特性以及内存品质特性的实际测试,选取合适的错误阈值N与时间阈值T可以起到延长内存使用寿命,提高服务器系统产品质量的作用,该方法在服务器内存告警领域具有非常重要的应用价值。
[0013]其具体实现过程为:
设置步骤,即设置错误阈值N、时间计时器t与时间阈值T ;
告警步骤,即当在规定时间阈值T内达到错误阈值N时进行告警,否则不告警。
[0014]结合附图1,上述步骤的具体实现过程为:
S10:内存以rank为单位设置内存错误计数器i,设置错误阈值N,当在这个rank上出现一个错误后i++,到i等于N时触发告警并清零,指示内存该rank上发生内存错误。
[0015]S11:在S10基础上以rank为单位增加时间计时器t,用来记录时间,设置时间阈值T。
[0016]S12:结合S10与S11,当在该rank上有内存错误发生时,错误计数器i开始计数,同时时间计时器t开始记录时间,只有在规定时间阈值T内达到错误阈值N时才告警,错误计数器i与时间计时器t分别清零,重新统计;如果在规定时间阈值T内达不到错误阈值N则不告警,同样错误计数器i与时间计时器t分别清零,重新统计。
[0017]上述【具体实施方式】仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述【具体实施方式】,任何符合本发明的一种内存告警的优化方法的权利要求书的且任何所述技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。
【主权项】
1.一种内存告警的优化方法,其特征在于,其具体实现过程为: 设置步骤,即设置错误阈值N、时间计时器t与时间阈值T ; 告警步骤,即当在规定时间阈值T内达到错误阈值N时进行告警,否则不告警。2.根据权利要求1所述的一种内存告警的优化方法,其特征在于,所述设置步骤的具体过程为: 内存以rank为单位设置内存错误计数器i,设置错误阈值N,当在这个rank上出现一个错误后i++,到i等于N时触发告警并清零,指示内存该rank上发生内存错误; 在上述步骤的基础上以rank为单位增加时间计时器t,用来记录时间,设置时间阈值To3.根据权利要求2所述的一种内存告警的优化方法,其特征在于,所述告警步骤的具体过程为:基于设置步骤设置的内容,当在该rank上有内存错误发生时,错误计数器i开始计数,同时时间计时器t开始记录时间,只有在规定时间阈值T内达到错误阈值N时才告警,错误计数器i与时间计时器t分别清零,重新统计;当在规定时间阈值T内达不到错误阈值N时则不告警,同样错误计数器i与时间计时器t分别清零,重新统计。
【专利摘要】本发明公开了一种内存告警的优化方法,其具体实现过程为:设置步骤,即设置错误阈值N、时间计时器t与时间阈值T;告警步骤,即当在规定时间阈值T内达到错误阈值N时进行告警,否则不告警。该一种内存告警的优化方法与现有技术相比,提高服务器系统产品质量的作用,该方法在服务器内存告警领域具有非常重要的应用价值,实用性强,易于推广。
【IPC分类】G06F11/30
【公开号】CN105426288
【申请号】CN201510759302
【发明人】李道童, 颜伟, 刘冰
【申请人】浪潮电子信息产业股份有限公司
【公开日】2016年3月23日
【申请日】2015年11月10日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1