多级多处理单元的可重构阵列的网络互连架构的制作方法

文档序号:6634489阅读:192来源:国知局
多级多处理单元的可重构阵列的网络互连架构的制作方法
【专利摘要】本发明涉及集成电路【技术领域】,为提供实现可重构处理单元阵列的装置,能够保证数据交互速率的前提下最大限度的实现互连的灵活性并减少互连线数目,降低功耗。为此,本发明采取的技术方案是,多级多处理单元的可重构阵列的网络互连架构,包括三级互连架构:第一级互连:二维mesh网络连接;第二级互连:在相邻处理单元数据可直接交互的基础上能够进行二级互连,即每4个可重构处理单元与一个开关盒相连,这4个基本处理单元之间通过开关盒进行任意两个的数据交互;第三级互连是开关盒之间的二维mesh网络的连接。本发明主要应用于集成电路设计、生产。
【专利说明】多级多处理单元的可重构阵列的网络互连架构

【技术领域】
[0001]本发明涉及集成电路【技术领域】,特别涉及一种用于可重构处理阵列的互连结构。技术背景
[0002]可重构阵列是由一定数量的处理单元通过一定的互连方式对不同的算法进行并行处理的一种处理器。相较于传统…X的设计周期长、设计成本高和其专用性以及通用处理器的不能充分利用算法并行性而只能实现指令级并行,可重构处理器有能够在性能、灵活性和成本等方面进行很好的平衡。基于可重构阵列的处理器可以很容易的解决阵列规模与算法计算规模的匹配问题,可以较灵活的实现块级和宏级并发执行操作。同时,基于可重构阵列的处理器简化了数据流的控制难度,其访存代价比基于指令的处理器小得多,并且具有同样的通用性,优势明显。
[0003]目前主流的可重构处理单元阵列大多采用点对点全局和部分互连的方式进行连接,全局互连能够快速的进行任意处理单元之间的数据交互,但过多的互连线导致阵列面积的增加和功耗的损失。而部分互连则是阵列中部分的阵列单元进行互连,减少互连线数量进而降低功耗和面积,但是部分互连使得算法映射难度增大,这是因为在算法映射过程中要考虑处理单元之间是否能够互连,从而确定映射方案。部分互连一般有二维网络互连,二维网络互连以及行/列间相邻处理单元互连,二维网络互连以及行/列间相邻处理单元互连和行/列间的处理单元全互连,棋盘距离为2的处理单元互连等。
[0004]综上所述,不论采用全局或部分互连都属于点对点互连且都有一定的弊端。


【发明内容】

[0005]为了克服现有技术的不足,提供实现可重构处理单元阵列的装置,能够保证数据交互速率的前提下最大限度的实现互连的灵活性并减少互连线数目,降低功耗。为此,本发明采取的技术方案是,多级多处理单元的可重构阵列的网络互连架构,包括三级互连架构:
[0006]第一级互连:二维腕也网络连接,即相邻的处理单元能够直接进行数据交互;
[0007]第二级互连:在相邻处理单元数据可直接交互的基础上能够进行二级互连,即每4个可重构处理单元与一个开关盒相连,这4个基本处理单元之间通过开关盒进行任意两个的数据交互,4个处理单元之间可以通过3种方式进行基于开关盒的数据交互:通过开关盒,每一个可重构处理单元都能够与其他三个处理单元进行数据交互;
[0008]第三级互连是开关盒之间的二维!116811网络的连接。
[0009]第三级互连是开关盒之间的二维1116811网络的连接是通过增加第二级互连中的开关盒端口得以实现,具体为开关盒端口数为11+4个,除与4个可重构处理单元相连外,其余端口与周边开关盒相连,形成开关盒二维06811网络。
[0010]每个开关盒端口为6或8个,其中4个端口用于和4个可重构处理单元相连,余下的2或4个对应与周围的2个或4个开关盒相连,形成开关盒二维腕也网络。
[0011]与已有技术相比,本发明的技术特点与效果:
[0012]本发明所采用的二维!116811网络互连与开关盒的两种逻辑互连结构相结合的方式能够使得整个可重构阵列的互连可以根据算法的不同进行配置,使得其灵活性与全互连相当,但互连线数目大大减少,并且两种逻辑互连结构相结合的方式能够在可重构阵列中某条路径出现故障时以降低系统性能为代价继续运行,使得整个可重构阵列结构的稳定性大大提闻。

【专利附图】

【附图说明】
[0013]图1 16个可重构处理单元的二维1116811网络逻辑互连结构。
[0014]图2 4个处理单元与开关盒之间逻辑互连结构。
[0015]图3 4端口开关盒示意图(虚线代表开关盒,实线为所有可能连接方式,图中连线两两不相交)。
[0016]图4与同一开关盒相连的处理单元通过开关盒相连的3种方式(虚线为开关盒,图中连线两两不相交
[0017]图5 8端口开关盒每个端口的连接方式(虚线为开关盒,每种配置下,至多有4条通路保证端口两两互连,图中连线两两不相交)。
[0018]图6 16个处理单元的可重构阵列逻辑互连结构。

【具体实施方式】
[0019]本发明是基于二维!116811网络与开关盒结合的多处理单元可重构阵列逻辑互连结构。如图1所示,这里我们以4x4阵列为例,但该发明不只限于该尺寸,它可应用于任意尺寸的二维腕也网络架构。
[0020]本发明中,可重构处理单元阵列首先进行一级互连,二维!116811网络连接,即相邻的处理单元可以直接进行数据交互。这种交互方式是本发明所涉及的互连方式中数据交互速度最快的。这种互连方式保证了对相邻两个处理单元能够分享上一个计算周期计算结果的需求,这是最基本的算法映射需求。腕也网络为网状网络。
[0021]以16个处理单元为例,其二维!11681!结构如图1所示。在相邻处理单元数据可直接交互的基础上可进行二级互连,即每4个可重构处理单元与一个开关盒相连,如图2所示。这4个基本处理单元之间可以通过开关盒进行任意两个的数据交互。其具体的连接方式如图3所示。图3中给出的是4个端口的开关盒示意图。4个处理单元之间可以通过3种方式进行基于开关盒的数据交互,如图4所示。通过开关盒,每一个可重构处理单元都可以与其他三个处理单元进行数据交互。其中前两种连接方式是针对相邻两个可重构处理单元的。它们是对数据直接交互的一种补充连接方式。当直接相连的某条互连通路出现故障或数据拥堵时,可利用开关盒将相关通路上的这两个相邻处理单元连接起来,进行数据交互。第三种连接方式是针对对角线上的两个处理单元之间的数据交互。在直接数据交互中,对角线上的处理单元无法直接进行数据交互,必须通过XV的路径选择,绕行其它处理单元才能够实现数据交互。这样做不仅减小了数据传输的效率,还增加了功耗。在本发明中,利用开关盒,可实现对角线处理单元通过开关盒的连接。通过这种方式,不仅避免了对于数据通路的竞争,也提高了传输效率,降低了功耗。
[0022]第三级互连是开关盒之间的二维!11681!网络的连接,如图6所示。每个开关盒可以通过直连与其余三个开关盒进行数据交互。如图6所示的4x4的1116811网络架构中,由于需要连接四个可重构处理单元和至少两个开关盒,因此每一个开关盒至少需要6个数据端口。如图5所示,为了保证结构的可扩展性,每个开关盒具有8个输入输出端口,其中包括与其相连的4个可重构处理单元连接以及与其相邻的4个开关盒之间的连接,这8个端口之间可以根据配置进行两两互连,从而使不相邻的两个处理单元之间进行数据交互,并且可以组成多种不同的互连结构,以适应不同的算法要求,与同一个开关盒相连的处理单元中的每个可重构处理单元可以通过两种方式进行互连,即二维1116811网络中的点对点直接互连以及通过开关盒的互连,由此增加了结构的可靠性。8端口开关盒与图3、4中的4个端口开关盒类似。这样,每一个开关盒便可以与周围4个可重构处理单元以及上下左右4个相邻开关盒相连,进行数据的直接交互。当然,开关盒的数据端口不仅限于8个,可根据具体的实现方案进行调整。
[0023]综上所述,这三级互连的组合便构成了整体的多处理单元的可重构阵列逻辑互连结构。该互连结构可以实现相邻可重构处理单元的直接互连以及通过开关盒的对角线上的可重构处理单元的数据交互,在此基础上,通过相邻开关盒的连接,可实现不相邻处理单元之间的间接数据交互。该交互方式为数据交互提供了多种选择,可降低数据通路的拥堵和竞争,提高数据的传输效率,特别是那些对时序要求严格的数据交互,降低了系统的功耗,提升了系统的性能。从图5,图6中,还可以看出本发明所提出的开关盒的连接方式有很多种,在此不作一一列举。在面对不同的需求时,用户可根据应用的不同要求自定义不同的连接方案以提高互连的效率。从图中还可看出这些开关盒能够形成闭合回路,所以在不相邻的可重构处理单元之间通过开关盒的连接方式也有多种,比如说,从处理单元?[11传输数据到?1^33,可以通过开关盒8.130X^12和来进行数据传输;也可以通过开关盒8.130X^21和来进行数据传输。这也大大提高了可重构处理单元阵列的灵活性和通用性。
[0024]采用如图5所示的16个处理单元的逻辑互连结构为例,本发明中所提出的多级多处理单元的可重构阵列逻辑互连结构可以分3级:
[0025]第一级为二维1116811网路逻辑互连,如图1所示,二维1116811网络的互连结构是最为基础的逻辑互连结构,它可以实现相邻处理单元间的直接数据交互。该结构能够在使用较少互连线的基础上适应一般算法映射要求。
[0026]第二级为每4个处理单元与一个开关盒的逻辑互连,如图2,图5所示。?【11,?【12,?【21,?^22分别与5」30叉」1互连;同理?^13,?^14,?^23,?【24与5」30叉」2互连;?^31,?132,?141,?142 与 330x^1 互连;?^33,?^34,?^43,?^44 与 330x^2互连,这4个与开关盒相连的处理单元占用4个开关盒端口。这些处理单元之间可通过开关盒进行数据交互,而无需通过其它处理单元。
[0027]第三级互连开关盒之间的互连。如图6所示。在16个处理单元阵列中,共采用4个开关盒,那么在此例中,开关盒的端口数量便可以定义为6个,从而节省硬件资源。每个开关盒的2个端口用来与其他开关盒进行互连,形成第三级网络架构。
[0028]通过这三级互连结构,整体的这16个可重构处理单元阵列互连架构能够实现部分处理单元的两种互连方式:通过二维网络点对点直接互连以及通过开关盒的间接互连。这两种互连方式相辅相成,能够在处理单元阵列某些互连线出现故障或拥堵时,以降低性能为代价继续运行可重构系统,提高系统的可靠性。通过4个开关盒能够实现16个处理单元中任意两个处理单元的互连,当然互连线路也可根据配置不同而改变,这样提高可重构阵列的灵活性和通用性。
【权利要求】
1.一种多级多处理单元的可重构阵列的网络互连架构,其特征是,包括三级互连架构: 第一级互连:二维腕也网络连接,即相邻的处理单元能够直接进行数据交互; 第二级互连:在相邻处理单元数据可直接交互的基础上能够进行二级互连,即每4个可重构处理单元与一个开关盒相连,这4个基本处理单元之间通过开关盒进行任意两个的数据交互,4个处理单元之间可以通过3种方式进行基于开关盒的数据交互:通过开关盒,每一个可重构处理单元都能够与其他三个处理单元进行数据交互; 第三级互连是开关盒之间的二维腕也网络的连接。
2.如权利要求1所述的多级多处理单元的可重构阵列的网络互连架构,其特征是,第三级互连是开关盒之间的二维1116811网络的连接是通过增加第二级互连中的开关盒端口得以实现,具体为开关盒端口数为=+4个,除与4个可重构处理单元相连外,其余端口与周边开关盒相连,形成开关盒二维06811网络。
3.如权利要求1或2所述的多级多处理单元的可重构阵列的网络互连架构,其特征是,每个开关盒端口为6或8个,其中4个端口用于和4个可重构处理单元相连,余下的2或4个对应与周围的2个或4个开关盒相连,形成开关盒二维1116811网络。
【文档编号】G06F15/78GK104391819SQ201410653241
【公开日】2015年3月4日 申请日期:2014年11月17日 优先权日:2014年11月17日
【发明者】史再峰, 周佳慧, 庞科, 刘江明, 徐江涛, 李斌桥 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1