服务器系统、非临时计算机可读存储介质以及用以增强服务器系统中的存储器容错率的方法与流程

文档序号:11949875阅读:来源:国知局

技术特征:

1.一种服务器系统,包括:

至少一处理器;以及

一存储器装置,包括多个指令,当上述指令被上述至少一处理器所执行时,使得上述服务器系统进行下列步骤:

检测在上述服务器系统的至少一存储器装置中的至少一存储器错误;

当检测到上述至少一存储器错误时,决定上述服务器系统中的一目前的存储器拓扑;

当上述目前的存储器拓扑相较于一先前的存储器拓扑并无改变时,将与上述至少一存储器错误相关的一信息载入至一存储器遮蔽清单,上述信息包括与上述至少一存储器错误相关的多个物理存储器地址;以及

禁止上述至少一存储器装置中的上述物理存储器地址被上述服务器系统的软件元件或其他硬件元件所存取。

2.如权利要求1所述的服务器系统,其中上述服务器系统包括一个或多个节点,上述一个或多个节点中的每个节点包括一基板管理控制器、一基本输入输出系统和一服务器,上述服务器至少包括一处理器,上述基板管理控制器用于管理一对应节点上的服务器系统软件与多个硬件元件间的一接口,且当上述指令被执行时,还使得上述服务器系统进行下列步骤:

当上述服务器系统中的一节点的上述软件元件与硬件元件的至少一参数超出与上述节点的一潜在性错误所相关的一预设极限时,借由上述基板管理控制器通过一网络传送一警示至上述服务器系统中的一微控制器或一系统管理员。

3.如权利要求1所述的服务器系统,其中上述服务器系统包括一存储器测试元件,上述存储器测试元件用以比较来自至少一存储器装置中的数据与一参考数据,且至少根据一比较结果,决定在上述至少一存储器装置中是否发生上述存储器错误。

4.如权利要求3所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

写入一数据至上述至少一存储器装置;

从上述至少一存储器装置读取上述数据;

比较所写入的上述数据与从上述至少一存储器装置中所读取的数据;以及

当上述所读取的数据中的至少一者不同于所写入的上述数据时,指出上述存储器错误已发生。

5.如权利要求3所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

写入一数据至上述至少一存储器装置;

从上述至少一存储器装置读取上述数据;

比较从上述至少一存储器装置中所读取的数据;以及

当从上述至少一存储器装置之一者所读取的数据不同于从上述至少一存储器装置的另一者所读取的数据时,指出上述存储器错误已发生。

6.如权利要求1所述的服务器系统,其中上述目前的存储器拓扑包括上述服务器中至少一存储器控制器和上述至少一存储器装置之间的连接信息。

7.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

于上述存储器遮蔽清单中,增加一预定范围的物理存储器地址,上述预定范围的物理存储器地址相邻于上述存储器错误所对应的上述物理存储器地址;以及

禁止上述至少一存储器装置中的上述预定范围的物理存储器地址被上述服务器系统的上述软件元件与上述硬件元件所存取。

8.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

于上述存储器遮蔽清单中,增加上述存储器错误所对应的一个或多个晶片的多个物理存储器地址和上述一个或多个晶片的至少一邻近晶片的多个物理存储器地址;以及

禁止对应于上述存储器错误的上述一个或多个晶片的物理存储器地址和上述至少一邻近晶片的物理存储器地址被上述服务器系统的上述软件元件与上述硬件元件所存取。

9.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

动态保留上述至少一存储器装置的至少一部分做为一保留存储器,用以 复制上述至少一存储器装置所存储的数据;以及

当对应于上述存储器错误的上述物理存储器地址被禁止存取时,从上述保留存储器中取回对应于上述物理存储器地址的数据。

10.如权利要求1所述的服务器系统,其中上述服务器系统还包括一个或多个节点,上述一个或多个节点中的每个节点包含一基本输入输出系统,用以初始化或至少部分地测试上述至少一存储器装置。

11.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

当对应于上述存储器错误的上述物理存储器地址被禁止存取时,借由使用一或多组错误更正码恢复存储于上述物理存储器地址的数据。

12.如权利要求1所述的服务器系统,其中当上述指令被执行时,还使得上述服务器系统进行下列步骤:

当上述现在的存储器拓扑相较于上述先前的存储器拓扑已发生改变或接收用以清除上述存储器遮蔽清单的一用户指令时,清除上述存储器遮蔽清单,以便开启一用以检测新的存储器错误的新流程。

13.一种增强服务器系统中的存储器容错率的方法,由一计算机系统所实现,上述方法包括:

检测一服务器系统的至少一存储器装置中的至少一存储器错误;

当检测到上述至少一存储器错误时,决定上述服务器系统中的一目前的存储器拓扑;

当上述目前的存储器拓扑相较于一先前的存储器拓扑并无改变时,与上述至少一存储器错误相关的一信息载入至一存储器遮蔽清单,上述信息包括与上述至少一存储器错误相关的多个物理存储器地址;以及

禁止上述至少一存储器装置中的上述物理存储器地址被上述服务器系统的软件元件或其他硬件元件所存取。

14.如权利要求13所述的增强服务器系统中的存储器容错率的方法,还包括:

于上述存储器遮蔽清单中,增加一预定范围的物理存储器地址,上述预定范围的物理存储器地址相邻于上述存储器错误所对应的上述物理存储器地址;以及

禁止上述至少一存储器装置中的上述预定范围的物理存储器地址被上述 服务器系统的上述软件元件与上述硬件元件所存取。

15.如权利要求13所述的增强服务器系统中的存储器容错率的方法,还包括:

动态保留上述至少一存储器装置的至少一部分做为一保留存储器,用以复制上述至少一存储器装置所存储的数据;以及

当对应于上述存储器错误的上述物理存储器地址被禁止存取时,从上述保留存储器中取回对应于上述物理存储器地址的数据。

16.如权利要求13所述的增强服务器系统中的存储器容错率的方法,还包括:

于上述存储器遮蔽清单中,增加上述存储器错误所对应的一个或多个晶片的多个物理存储器地址和上述一个或多个晶片的至少一邻近晶片的多个物理存储器地址;以及

禁止对应于上述存储器错误的上述一个或多个晶片的物理存储器地址和上述一个或多个晶片的至少一邻近晶片的上述物理存储器地址被上述服务器系统的上述软件元件与上述硬件元件所存取。

17.如权利要求13所述的增强服务器系统中的存储器容错率的方法,还包括:

当对应于上述存储器错误的上述物理存储器地址被禁止存取时,借由使用一或多组错误更正码恢复存储于上述物理存储器地址的数据。

18.一种非临时计算机可读存储介质,包括多个指令,当上述指令被一服务器系统中的至少一处理器指令所执行时,导致上述服务器系统进行下列步骤:

检测在上述服务器系统的至少一存储器装置中的至少一存储器错误;

当检测到上述至少一存储器错误时,决定上述服务器系统中的一目前的存储器拓扑;

当上述目前的存储器拓扑相较于一先前的存储器拓扑并无改变时,将与上述至少一存储器错误相关的一信息载入至一存储器遮蔽清单,上述信息包括与上述至少一存储器错误相关的多个物理存储器地址;以及禁止上述至少一存储器装置中的上述物理存储器地址被上述服务器系统的软件元件或其他硬件元件所存取。

19.如权利要求18所述的非临时计算机可读存储介质,其中当上述指令 被执行时,还导致上述服务器系统进行下列步骤:

当上述服务器系统中的一节点的软件与多个硬件元件的至少一参数超出与上述节点的一潜在性错误所相关的一预设极限时,借由上述基板管理控制器通过一网络传送一警示至上述服务器系统中的一微控制器或一系统管理员。

20.如权利要求18所述的非临时计算机可读存储介质,其中当上述指令被执行时,还导致上述服务器系统进行下列步骤:

写入一数据至上述至少一存储器装置;

从上述至少一存储器装置读取上述数据;

比较所写入的上述数据与从上述至少一存储器装置中所读取的数据;以及

当上述所读取的数据中的至少一者不同于所写入的上述数据时,指出上述存储器错误已发生。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1