一种资源约束性多节点计算系统的可靠性评估方法_3

文档序号:9750767阅读:来源:国知局
并可最终得到最终的 最优化计算机或多核CPU系统。
[0009] 实施例: 步骤1:建立基本BDD模型计算机集群组织,并对BDD模型计算机集群组织中的各个运算 或工作的节点(1)中的单个服务器或运算核心及其运行的部件状态依照布尔型变量进行编 码(2),单个服务器或运算核心及其运行的部件在下文中都统一代称为节点;节点所有运行 状态形式编码为X,当X节点为工作状态时为编码1,状态表示X=1;当X节点为故障状态时编 码0,状态表示X=〇;且X=1的连接状态编码为1,X=〇的连接状态编码为0;节点接受来自各下 属或平级节点的运算数据,设定模型图为如1所示。
[0010] 并设置接受数据时0和1分支(3)时的运行状态出现概率P,概率P来自于节点制造 者的制造数据、检测数据、或实验数据等,运行状态出现概率P的值为大于0%小于100%。
[0011] 步骤2:继续利用BDD模型,对BDD模型计算机集群组织的系统级状态进行编码,将 BDD模型计算机集群组织的各个节点在空间中按照X轴γ轴进行排列编号,使其在系统级BDD 模型中的位置平面横纵轴坐标化,并可根据实际节点数量沿横纵轴坐标排列扩展,并且模 型位置坐标结构必须呈现为方形,且服务器的数量也就是节点的设定值为N;模型图为图2 所示。
[0012] 步骤3.依靠步骤2编排坐标后,在BDD模型计算机集群组织的节点工作(量)状态需 求,设定启动工作的节点不多于K并且不少于L,1 < L < K < N,K的值根据具体通信资源的容 量而定,L的值根据计算任务的性能需求而定,计算任务的最低性能需求为M,每个节点的性 能为X,则L=M/X,单个节点需要的通信资源为Y,系统总的通信资源为C,则L=C/Y ; 并在节点的位置平面横纵轴坐标化的基础上,再采用下面的方法对系统级BDD模型计 算机集群组织各节点之间的系统级运行状态编码: 1)当节点布尔型变量的纵坐标〇 < Υ〈Κ_1时,节点布尔变量的横坐标取值范围为0 < X < Ν- Κ; a) 设置横纵轴(X,Υ)位置上的节点的变量名为"Χ+Υ+1" ; b) 当X= N-K时,该节点的0分支连接到常数节点0;否则该节点的0分支连接到(X+l,Y) 位置上名为"X+Y+2"的节点; c) 当Y=L时,该节点的1分支连接到常数节点1;否则该节点的1分支连接到(X,Y+1)位 置上名为"X+Y+2"的节点; 2 )当节点布尔型变量的纵坐标Y=K-1时,节点布尔型变量的横坐标取值范围为0 < X < Ν-Κ; a) 设置(X,Υ)位置上的节点的变量名为"Χ+Υ+1" ; b) 当X〈 N-1时,该节点的0分支连接到(X+l,Y)位置上名为"X+Y+2"的节点;并且该节 点的1分支连接到(X,Y+1)位置上名为"X+Y+2"的节点; c) 当N-L < X〈N-K时,该节点的0分支连接到(X+l,Y)位置上名为"X+Y+2"的节点;并且 该节点的1分支连接到常数节点1; d) 当X=N-K时,该变量的0分支连接到常数节点0;并且该节点的1分支连接到常数节点 1; 3)当节点布尔型变量的纵坐标K-1〈Y < L时,节点布尔型变量的横坐标取值范围为0 < X < N-L-1 ; a) 设置(X,Y)位置上的节点的变量名为"Χ+Υ+Γ ; b) 当X= η-L-l时,该节点的0分支连接到常数节点1;否则该节点的0分支连接到(Χ+1, Y)位置上名为"X+Y+2"的节点; c) 当Y=L时,该节点的1分支连接到常数节点0;否则该节点的1分支连接到(X,Y+1)位 置上名为"X+Y+2"的节点; 参考上述步骤,如图3所示:BDD模型计算机集群组织的参数为K=2,L=3,N=5时,系统级 状态编码对应构造的BDD模型; 如图4所示:BDD模型计算机集群组织的参数为K=2,L=4,N=5时,系统级状态编码对应 的BDD模型; 如一般化的,K)D模型计算机集群组织的系统级状态编码对应的K)D模型如图5所示。
[0013]如图7-12所示,步骤4:得到步骤3所构造的BDD模型计算机集群组织后,利用系统 级BDD模型对得到的BDD模型计算机集群组织进行可靠性评估;利用系统级BDD模型进行可 靠性评估是基于如下两个规则: 1) 从坐标为(〇,〇)的状态变量节点(4)到常数节点(5)0的任意一条路径对应着BDD模型 计算机集群组织的一个故障状态;状态变量节点为节点的编码和节点统称,坐标为(〇,〇)的 状态变量节点即编码1节点,常数节点〇则为常数编码为〇的常数节点; 2) 从坐标为(0,0)的状态变量节点(即编码1节点对应的节点)到常数节点1的任意一条 路径对应着BDD模型计算机集群组织的一个工作状态; 系统可靠性评估就是计算或该BDD模型计算机集群组织自动计算自身,K)D模型计算机 集群组织所有工作状态的概率之和;由于存在多个BDD模型计算机集群组织的工作状态,所 以需要将所有BDD模型计算机集群组织的工作状态的概率进行累加;根据上述规则可知, BDD模型计算机集群组织的工作状态和常数1路径是一一对应的关系,所以我们只需将常数 1路径的概率进行累加; BDD模型计算机集群组织可靠性评估的"将常数节点1路径的概率进行累加"这一运算 的步骤为: 3) 根据步骤1给BDD模型计算机集群组织中每个状态变量节点的0分支和1分支各设置 相应的概率值P; 4 )给常数节点0设定初始概率值P为0%,给常数节点1设定的初始概率值P为100%(获得 了概率值后再到此处进行赋值);或给常数节点〇设定初始值〇,给节点常数1设定的初始初 始值1; 5) 在获得的BDD模型计算机集群组织中按照节点的编码号从大到小的顺序,先计算节 点"N"的对应的概率值,直至获得节点"Γ对应概率值; 6) 运算输出点"Γ对应概率值的结果,即为本BDD模型计算机集群组织的可靠度或需求 构成的BDD模型计算机集群组织的可靠度; 由此得到本次构造而成的计算机系统的可靠度,并可利用反推法并可最终得到最终的 最优化计算机或多核CHJ系统。
[0014]由步骤4设定参数,BDD模型计算机集群组织系统(K=2, L=4,N=5)的可靠度计算过 程举例,假设所有计算节点的正常工作的概率为0.999。
[0015 ]该系统的系统级状态编码对应的BDD模型如图7所示; 首先计算节点"5"的对应的概率值。由于给定计算节点5的正常工作的概率为0.999,所 以〇分支的概率为1-0.999=0.001,1分支的概率为0.999。又由于常数0设定概率值为0,给常 数1设定的概率值为1。所以,坐标为(3,0)的节点"5"的对应的概率值为:0.999*1+0.001*0= 0.999,坐标为(0,3)的节点"5"的对应的概率值为:0.999*0+0.001 * 1 =0.001。结果如图8所 示; 然后计算节点"4"的对应的概率值,结果如图9所示; 然后计算节点"3"的对应的概率值,结果如图10所示; 然后计算节点"2"的对应的概率值,结果如图11所示; 然后计算节点"Γ的对应的概率值,结果如图12所示; 由此可得出然后本次构建的K)D模型计算机集群组织系统的可靠度为0.00399。
[0016] 传统的枚举法进行多计算节点系统可靠性评估会出现状态过多,存储困难,计算 效率低的问题;本发明采用高效的二进制决策图(BDD)数据结构对通信资源约束型多节点 计算系
当前第3页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1