面向通讯同步的多处理器阵列重构的算法的制作方法

文档序号:11950139阅读:235来源:国知局
面向通讯同步的多处理器阵列重构的算法的制作方法与工艺

本发明涉及通信技术领域,特别涉及一种面向通讯同步的多处理器阵列重构的算法。



背景技术:

随着超大规模集成电路(Very Large Scale Integrated,VLSI)和晶片规模集成(Wafer Scale Integration,WSI)技术的不断发展,单一芯片上能集成更多的处理器单元(Processing Elements,PEs),但在制造和运行过程中PEs发生故障的可能性随之增加。故障种类包括PEs的物理损坏和其寿命不均造成的硬故障,以及超负荷而引起的PEs过热和被其他应用程序占用引起的软故障。尤其在某些特定的环境下会导致VLSI/WSI发生故障的可能性增大。例如空间飞行器中维护芯片较为困难且没有办法进行更换,因此在空间飞行器中装载的芯片很容易发生故障。所以几乎不可能保证系统内所有的处理器单元在它的工作时间内都是不发生故障的,而处理器的这些故障的发生也必然会影响整个系统的可靠性。

因此,针对含有故障PEs的VLSI阵列,需要提出有效的容错技术,以提高系统的稳定性和可靠性。



技术实现要素:

本发明的目的在于克服现有技术的缺点与不足,首次提出了如何构造用户所需大小的目标阵列及其实现同步通讯性能的优化问题,并针对该问题提出了三个启发式算法和一个计算最大通讯延时下界的算法。

本发明的目的通过以下的技术方案实现:

三个面向通讯同步的拓扑重构算法,是基于三种逻辑列的剔除策略,其主算法框架是一致的,包含以下步骤:

S1、使用剔除策略对逻辑阵列的逻辑列进行剔除,剩余的逻辑列即目标阵列的初始阵列;

S2、将剔除后生成的初始阵列进行LDP算法优化;

S3、最后将优化后的阵列使用SPO算法进行同步性能的提升,作为我们的目标阵列。

所述步骤S1中的剔除策略具体为:1)基于分治思想的均匀剔除、2)基于长链接数的贪心剔除和3)基于分治与长链接数的混成剔除。

所述步骤S2的LDP算法是Wu Jigang等人在“Reconfiguration Algorithms for Power Efficient VLSI Subarrays with 4-Port Switches”论文中提出的一种基于动态规划思想的算法。

所述步骤S3的SPO算法是张元瑞等人在“可重构阵列的同步性能优化算法”论文中提出的一个同步性能优化算法。

最大通讯延时下界的求解算法如下,如图5所示:

给定的逻辑阵列L={l1,l2,…,ls},令lowb表示L通讯延时的下界,li表示最长的逻辑列。lowb的计算起始于最长逻辑列的长链接数,即lowb的初始值设定为这条li的长链接数。然后逐次计算两条逻辑列li与lj(j≠i)构成的子阵列{li,lj}的最大通讯延时,而其他逻辑列的通讯延时此时设定为0.检测lj的每一条长链接的可移动范围是否被li的长链接的移动范围涵盖。若没有被涵盖,则子阵列{li,lj}的最大通讯延时在lowb的基础上不得不增加1个单位,即使lj的长链接可以与其他逻辑列的长链接保持同步。这一检测过程对每一个子阵列{li,lj}(j=1,2,…,s,j≠i)都要计算一次,累计lowb的值,并更新长链接的可移动范围。

本发明与现有技术相比,具有如下优点和有益效果:

本发明面向高性能计算中阵列处理器结构的特点,针对如何构造用户指定大小、并且同步通讯性能优良的逻辑子阵列进行拓扑重构的探索性研究。本文基于不同的逻辑列剔除策略提出了三个面向通讯同步的拓扑重构算法。如图2-4所示,即基于分治思想剔除逻辑列的重构算法(SCA_01)、优先剔除长逻辑列的贪心重构算法(SCA_02)和基于分治与长链接数的混成重构算法(SCA_03).三个算法在不同的情况下各具优势,算法SCA_01能够使得被优化的逻辑列相对均匀的分布在物理阵列中;算法SCA_02能够使得被优化的逻辑列的长链接总数最少;算法SCA_03将某一区域内的最长逻辑列剔除,且尽可能将剩余逻辑列均匀分布在物理阵列中。同时,本发明对逻辑阵列的最大通讯延时给出了下界的求解算法。

附图说明

图1是本发明所提三个剔除操作的子算法伪代码。

图2是本发明算法SCA_01的实例,算法输入的阵列如图2(a)所示,要在该阵列上剔除3条逻辑列。图2(b)是剔除逻辑列后的效果图,而最终的目标阵列如图2(c)所示。

图3是本发明算法SCA_02的实例,算法输入的阵列如图3(a)所示,要在该阵列上剔除3条逻辑列。图3(b)是剔除逻辑列后的效果图,而最终的目标阵列如图3(c)所示。

图4是本发明算法SCA_03的实例,算法输入的阵列如图4(a)所示,要在该阵列上剔除3条逻辑列。图4(b)是剔除逻辑列后的效果图,而最终的目标阵列如图4(c)所示。

图5是本发明所提的计算最大通讯延时下界算法的流程图。

具体实施方式

下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。

三个算法的剔除操作的子算法的算法思想说明如下,如图1所示:

(1)基于分治思想的均匀剔除:子算法Extract_01是基于分治策略的思想,剔除各个区域中处于中间位置的逻辑列。子算法Extract_01先将整个阵列作为一个区域,选区域处于中间位置的逻辑列剔除,若逻辑列个数为偶数,则选择左边的逻辑列剔除。将该区域以剔除的逻辑列为分界线分为两个子区域。然后分治剔除每个区域中处于中间位置的逻辑列并对区域以剔除的逻辑列为分界线进行划分,直至所剩逻辑列数满足要求(逻辑列数等于s)时为止

(2)基于长链接数的贪心剔除:子算法Extract_02基于贪心策略的思想,依次剔除最左边的最长逻辑列。首先对输入的阵列中的每条逻辑列的长链接数进行统计,依次剔除长链接数最多且最靠近左边的逻辑列,直至所剩逻辑列数满足要求(逻辑列数等于s)时为止。

(3)基于分治与长链接数的混成剔除:子算法Extract_03是采用分治策略的思想,剔除各个区域中最靠近中间位置的最长逻辑列。子算法Extract_03是首先将整个阵列视为一个区域,将该区域中长链接数最多的逻辑列剔除;若长链接数最多的逻辑列不止一条,则选择最靠近中间位置的逻辑列剔除。以选中剔除的逻辑列为分界线,将该区域分为两个子区域。然后剔除每个子区域中长链接数最多的列并进行区域划分。直至所剩逻辑列数满足要求(逻辑列数等于s)时为止。

上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1