一种多核操作系统容错管理方法与流程

文档序号:13891332阅读:来源:国知局
一种多核操作系统容错管理方法与流程

技术特征:

1.一种多核操作系统容错管理方法,其特征在于,包括,

S1,构建全局任务列表和一个n×n的核间故障检测矩阵,其中n为处理器核数;

S2,在系统正常运行期间,每个处理器核利用所述核间故障检测矩阵定期检测系统中其他处理器核是否发生故障;

S3,如果某一个处理器核连续的故障计数超过预设故障计数最大值M,则判断该处理器核发生故障,此时将该发生故障的处理器核上的任务和中断转移到其他处理器核上;

其中,步骤S2中的每个处理器核的故障检测包括:S21,通过定时器设置定时监测周期,保证每个处理器核在同一时刻对其他处理器核进行状态监测;S22,在每个定时监测周期起始,各个处理器核在核间故障检测矩阵中各自对应的一列k中的元素设置为TRUE;S23,在每个定时监测周期末尾,各个处理器核查看矩阵中各自对应的一行j中的元素,如果其中某一个元素ejk不为TRUE,则认为与该列对应的处理器核k发生了故障,并将其故障计数加1,最后将行j中的元素全部清零;其中,j为核间故障检测矩阵的行数,取1、2、3……n,k为核间故障检测矩阵的列数,取1、2、3……n,ejk为核间故障检测矩阵中的元素。

2.根据权利要求1所述的多核操作系统容错管理方法,其特征在于,在步骤S1和步骤S2之间包括,

S12,使每个处理器核上运行一个调度器实例,每个调度器实例的功能是在发生中断或本地有任务状态发生变化时,按照任务调度算法从全局任务列表中挑选一个就绪态任务调度运行。

3.根据权利要求2所述的多核操作系统容错管理方法,其特征在于,调度器实例为固定优先级调度算法或动态优先级调度算法。

4.根据权利要求1所述的多核操作系统容错管理方法,其特征在于:所述构建全局任务列表,具体包括:步骤S10,在操作系统内核中构建一个全局任务列表,所述全局任务列表中包括任务ID、任务优先级、任务状态、任务堆栈地址、任务寄存器、任务所运行于的处理器核。

5.根据权利要求4所述的多核操作系统容错管理方法,其特征在于:所述将该发生故障的处理器核上的任务和中断转移到其他处理器核上,具体包括:通过所述全局任务列表,根据任务控制块中任务所运行于的处理器核信息,找到故障处理器核上当前正在运行的任务,将所述任务恢复为就绪状态,使之能够被其他的处理器核调度运行,并利用核间中断使所有处理器核进行一次任务调度。

6.根据权利要求5所述的多核操作系统容错管理方法,其特征在于,通过修改中断屏蔽寄存器方式,使运行正常的处理器核响应故障处理器核上的中断。

7.根据权利要求5所述的多核操作系统容错管理方法,其特征在于,根据对应功能的不同,所述故障处理器核的中断为所有处理器核均响应的中断或单个处理器核负责响应的中断;只需转移仅故障处理器核负责响应的中断。

当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1