面向静态XY路由算法的二维网格NoC路由器优化设计方法

文档序号:7743001阅读:229来源:国知局
专利名称:面向静态XY路由算法的二维网格NoC路由器优化设计方法
技术领域
本发明涉及一种路由器优化设计方法,具体地说是一种面向静态XY路由算法的 二维网格NoC路由器优化设计方法。
背景技术
随着半导体工艺技术的快速发展,系统芯片(System-on-Chip,SoC)逐渐成为微 电子领域关注的焦点。然而,随着芯片所能集成的晶体管数目越来越为庞大,电路本身也变 得越来越复杂,此时,片上通信问题成为集成电路设计的新瓶颈,为此,NoC这一概念被人们 提出,并受到业界广泛的关注。NoC(Network-on-Chip, NoC,片上网络)的核心思想是将计算机网络技术移植到 集成电路设计中来,从体系结构上彻底解决片上通信的瓶颈问题,并同时解决全局时钟同 步问题。它充分借鉴了分布式计算机系统的通信方式,用路由和分组交换技术替代传统的 总线通信方式。由一系列通讯节点组成的结构化网络互连可以更好地控制连线的电气特 性,提供更高的带宽,并能够支持多重并行通信。二维网格架构NoC及其通讯节点如图1 (a)、(b)所示,它由资源节点(Resource)、 通讯节点(Router)、通道(Channel)和网络接口(Network Interface)组成,而通讯节点本 身则由若干对输入、输出通道组成,在本架构中,其通道数为5对,即东(E)、南(S)、西(W)、 北(N)以及本地(L)通道。因此,作为NoC关键部件的通讯节点设计,即路由器的设计在整个系统设计中显 得尤为重要,其设计的优劣将直接影响整个NoC系统的性能。

发明内容
本发明的目的是提供一种面向静态XY路由算法的二维网格NoC路由器优化设计 方法,该方法中对路由器各输入通道及输出通道分别进行优化设计,并根据其在网格中所 处位置的不同,采用通讯节点异构设计,满足整个系统对通讯性能的要求,提高了 NoC系统 中通讯网络的最大工作频率,降低了硬件开销。本发明的目的是通过以下技术方案来实现的一种面向静态XY路由算法的二维网格NoC路由器优化设计方法,其特征在于该方 法根据二维网格结构NoC中静态XY路由算法的特点,对路由器中各输入通道及输出通道分 别进行优化设计,并根据路由器在网格中所处位置的不同,采用通讯节点异构设计,具体如 下对于输入通道,南、北方向的输入通道不向东、西方向的输出通道发出请求,且任 一输入通道都不产生回传请求;网络中的数据包首先沿着X方向传输,当到达目标节点所 在列时再沿着Y方向传输,直至目标节点,并且不允许数据包沿180度方向回传;网络中的 节点通过比较数据包的目标地址与自身地址以选择向某一输出通道发出传输请求;在输入 通道中,对于南、北方向输入通道的路由单元简化为一次逻辑比较;对于本地输入通道的路由单元简化为两层逻辑比较;对于东、西方向输入通道的路由单元为三层逻辑比较;对于输出通道,用作东面或西面的输出通道支持2个输入请求,用于南面、北面和 本地的输出通道支持4个输入请求; 路由器位于网格不同位置时通道数不同,采用异构设计,位于网格中央为5对输 入输出通道,网格边缘为4对输入输出通道,网格拐角处为3对输入输出通道。本发明中,输入通道包括缓冲器和路由单元,路由单元从缓冲器提取包头,缓冲器 分为两种=IBO和IB1,其中,IBO使用异步时钟实现,用于本地输入通道中;IBl使用相同时 钟,用于东、西、南、北输入通道。每个输入通道中的缓冲器深度均通过参数进行配置;状态 控制器根据输出通道的响应情况对缓冲器的读操作进行控制。输出通道包括仲裁器、多路选择器和输出控制器,有两个以上输入通道同时向同 一输出通道发出请求时,输出通道根据仲裁器的仲裁结果有选择地响应请求;仲裁器采用 轮转优先级仲裁机制,当其检测到包头标志时,表示数据包传输开始;当检测到数据包结束 标志时,表示当前数据包传送结束,并开始新一轮仲裁;多路选择器根据仲裁器的仲裁结果 选择某一路数据输出;输出控制器根据仲裁结果和下游通道的状态控制数据的输出。本发明面向实际应用,对于最常见的基于静态XY路由算法的二维网格结构NoC路 由器设计提出了一种有效的优化方法,其有益效果是提高了 NoC路由器最大工作频率,减 少了硬件开销,对改善NoC整体通讯性能有着积极良好的应用价值。


图1 (a)是NoC整体架构示意图;图1 (b)是NoC中通讯节点示意图;图2是路由器输入通道结构示意图;图3(a)是非优化路由算法逻辑示意图;图3(b)是优化路由算法东面输入通道逻辑示意图;图3 (C)是优化路由算法南面输入通道逻辑示意图;图3 (d)是优化路由算法本地输入通道逻辑示意图;图4是路由器输出通道结构示意图;图5(a)是位于二维网格西侧边缘的路由器通道示意图;图5(b)是位于二维网格西北拐角的路由器通道示意图;图6是实施例1中优化与非优化设计的通讯节点实现结果比较示意图;图7是4*4规模二维网格规则NoC结构示意图;图8是实施例2中优化与非优化设计的通讯节点实现结果比较示意图。
具体实施例方式实施例1一种面向静态XY路由算法的二维网格NoC路由器优化设计方法,该方法对路由器 中各输入通道及输出通道分别进行优化设计,并根据路由器在网格中所处位置的不同,采 用通讯节点异构设计。 首先,对于输入通道,其主要由缓冲器和路由单元构成,其结构示意图如图2所示。路由单元的功能是完成数据包的路径选择。在输入通道设计中,缓冲器的输出延时比 较大(路由单元从缓冲器提取包头),且路由单元的逻辑设计相对较复杂。所以优化路由单 元的设计即缩短该关键时序路径,对于通讯节点工作速度的提高有重要意义。缓冲器分为两种ΙΒ0和IB1。前者使用异步时钟实现,用于本地输入通道(INL) 中;后者使用相同时钟,用于其余输入通道。同时,缓冲器的设计采用虫孔交换模型以降低 节点的包延迟。因为根据任务特征恰当配置网络通道中缓冲器的深度有利于提高通信效率 和降低资源消耗,因此在本设计中,每个输入通道中的缓冲器深度均可通过参数进行配置。 状态控制器根据输出通道的响应情况对缓冲器的读操作进行控制。静态XY路由算法是简单、易于实现的路由方法。在这种路由方法下,网络中的数据包首先沿着X方向传输,当到达目标节点所在列时再沿着Y方向传输,直至目标节点,并 且不允许数据包沿180度方向回传。网络中的节点通过比较数据包的目标地址(Xd,Yd)与 自身地址(X,Y)以选择向某一输出通道发出传输请求。该路由过程是由输入通道中的路由 单元模块完成的。通过对静态XY路由方法的分析可以发现,南、北方向的输入通道不向东、西方向 的输出通道发出请求,且任一输入通道都不产生回传请求。采用传统的方法设计通讯节点 时,各个路由单元的设计皆考虑向五个输出通道发出传送请求的可能性,每个通道都需要 进行三层逻辑比较,于是其组合逻辑较复杂,限制了节点性能的提高,具体逻辑判断过程如 图3(a)所示。为了提高通讯节点的工作频率,对各个输入通道中的路由单元分别进行优化设 计,从而简化其逻辑设计。图3(b)、3(c)、3(d)分别给出了优化设计时东面、南面和本地输入通道(即INE, INS和INL)的路由算法,北面通道(INN)的设计与INS类似,而西面通道(INW)的设计与 INE类似。由图3可知,INS、INN中的路由单元只需一次逻辑比较;而本地通道INL中的路 由单元只需两层逻辑比较。虽然INW和INE仍需要三层逻辑比较,但同未优化时相比逻辑 判断过程也已经得到有效简化。本实施例中路由单元的设计采用静态XY路由算法,它从缓冲器提取数据包包头, 并通过比较包头中的目标地址与本地地址选择向某一输出通道发出传送请求。鉴于本发 明,在此分别设计了五类路由单元模块,并进一步设计了五类输入通道,分别用作通讯节点 不同方向的通道。考虑到INW和INE中路由单元的逻辑复杂度,在其缓冲器与路由单元之 间增加一级流水线以缩短关键路径。对于输出通道,其示意图如图4所示。在传统设计中,各输出通道完全一样,因此 每个输出通道皆需按照处理5个输入请求来设计,从而使设计较为复杂,除了会增加路径 延迟外也浪费不少资源。仔细分析静态XY路由算法可以发现,东面和西面输出通道(0UTE, OUTff)只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求,由此可以对各 输出通道的仲裁器进行分别设计。而仲裁器作为输出通道中的主要部件,其设计复杂度理 论上与K2 (K为请求仲裁的输入通道数目)成正比,因此优化设计有利于降低输出通道复杂 度。传统上,搭建NoC网络的方法是通过例化同一通讯节点(同构节点)模块来实现 网格中的所有节点,这势必会造成资源的浪费,因为处于网格边缘和拐角的节点并不需要5对输入输出通道。例如处在拐角的节点只需要3对通道,而处在边缘的节点只需要4对通 道。因此,通过设计异构的通讯节点,可以降低NoC的资源消耗。
一个边缘节点由4对输入输出通道构成,图5(a)是边缘节点(西侧)的结构框图。 它包含输入通道INE、INN、INS和INL各一个;还包含一个0UT2和三个0UT4 ;其余边缘节点 的结构与之相似。图5(b)是拐角节点(西北角)的结构图,它由3对输入输出通道构成, 分别是INE(0UT2)、INS(0UT2)、INL(0UT2);其余拐角节点的设计与之类似。本实施例设计了两类输出通道0UT2和0UT4。二者结构相类似,皆由仲裁器、多路 选择器和输出控制器组成,如图4所示。区别在于前者支持2个输入请求,用作东面或西面 的输出通道(0UTE和0UTW);而后者支持4个输入请求,适用于0UTS、0UTN及0UTL。当有两 个以上输入通道同时向同一输出通道发出请求时,输出通道根据仲裁器的仲裁结果有选择 地响应请求。仲裁器采用轮转优先级仲裁机制,当其检测到包头标志(Bop)时,表示数据包 传输开始;当检测到数据包结束标志(Eop)时,表示当前数据包传送结束,并开始新一轮仲 裁。多路选择器根据仲裁器的仲裁结果选择某一路数据输出;输出控制器根据仲裁结果和 下游通道的状态控制数据的输出。为了与现有技术对比,在此采用传统方式设计了一个结构相似的通讯节点,并将 两者在Altera FPGA(Stratiχ II EP1080F1020C3)上的综合结果进行了比较。为了便于比 较,将两类通讯节点的所有输入通道的缓冲器深度皆配置为4。结果表明,与传统方法设计 的通讯节点相比,采用本发明设计的节点使用ALUT的数量减少35%,这是因为本发明大大 降低了通讯节点的复杂度;节点复杂度的降低进一步将时钟频率提高了约15%。而两种设 计所消耗寄存器数量相当,这是因为寄存器的使用量主要由缓冲器深度决定。其具体数值 如图6所示实施例2基于本发明,搭建一个真实的二维网格架构NoC,其网络规模为4*4,采用的路由 算法为静态XY路由算法,其整体结构框图如图7所示。基于本发明讨论的NoC路由器设计优化方法,设计出五种输入通道(INE,NIS, INE, INN, INL)和两类输出通道(0UT2,0UT4),并以此为基础为二维网格架构NoC设计九类 通讯节点中央节点、边缘节点(4种)和拐角节点(4种),从而组建异构通讯节点的NoC通 讯网络。将采用本发明方法构建的通讯网络在FPGA上综合,并将其结果与采用同构通讯 节点(即全部采用中央通讯节点结构)搭建的相同规模NoC网络进行比较。结果表明,异 构节点实现的NoC通讯网络比同构节点实现的NoC通讯网络所消耗的ALUT减少33%,所耗 的寄存器减少23 %,而最大时钟频率提高52 %。其具体结果如图8所示。本发明可以有效提高NoC路由器最大工作频率,大幅减少其硬件开销,对改善片 上网络整体通讯性能有着积极良好的应用价值。
权利要求
一种面向静态XY路由算法的二维网格NoC路由器优化设计方法,其特征在于该方法根据二维网格结构NoC中静态XY路由算法的特点,对路由器中各输入通道及输出通道分别进行优化设计,并根据路由器在网格中所处位置的不同,采用通讯节点异构设计,具体如下对于输入通道,南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求;网络中的数据包首先沿着X方向传输,当到达目标节点所在列时再沿着Y方向传输,直至目标节点,并且不允许数据包沿180度方向回传;网络中的节点通过比较数据包的目标地址与自身地址以选择向某一输出通道发出传输请求;对于南、北方向输入通道的路由单元简化为一次逻辑比较;对于本地输入通道的路由单元简化为两层逻辑比较;对于东、西方向输入通道的路由单元为三层逻辑比较;对于输出通道,用作东面或西面的输出通道支持2个输入请求,用于南面、北面和本地的输出通道支持4个输入请求;路由器位于网格不同位置时通道数不同,采用异构设计,位于网格中央为5对输入输出通道,网格边缘为4对输入输出通道,网格拐角处为3对输入输出通道。
2.根据权利要求1所述的面向静态XY路由算法的二维网格NoC路由器优化设计方法, 其特征在于输入通道包括缓冲器和路由单元,路由单元从缓冲器提取包头,缓冲器分为两 种IB0和IB1,其中,IBO使用异步时钟实现,用于本地输入通道中;IBl使用相同时钟,用 于东、西、南、北输入通道。
3.根据权利要求2所述的面向静态XY路由算法的二维网格NoC路由器优化设计方法, 其特征在于每个输入通道中的缓冲器深度均通过参数进行配置;状态控制器根据输出通 道的响应情况对缓冲器的读操作进行控制。
4.根据权利要求1所述的面向静态XY路由算法的二维网格NoC路由器优化设计方法, 其特征在于输出通道包括仲裁器、多路选择器和输出控制器,有两个以上输入通道同时向 同一输出通道发出请求时,输出通道根据仲裁器的仲裁结果有选择地响应请求;仲裁器采 用轮转优先级仲裁机制,当其检测到包头标志时,表示数据包传输开始;当检测到数据包结 束标志时,表示当前数据包传送结束,并开始新一轮仲裁;多路选择器根据仲裁器的仲裁结 果选择某一路数据输出;输出控制器根据仲裁结果和下游通道的状态控制数据的输出。
全文摘要
本发明公开了一种面向静态XY路由算法的二维网格片上网络路由器优化设计方法,该方法分别对路由器的输入和输出通道进行优化设计,并根据路由器在网格中的不同位置,对其进行异构设计。在输入通道中,由于静态XY路由算法中南、北方向的输入通道不向东、西方向的输出通道发出请求,且任一输入通道都不产生回传请求,因此对各输入通道中的路由逻辑分别进行简化。在输出通道中,东、西方向输出通道只需处理2个输入通道的请求,而其余通道也只需处理4个输入请求。对于二维网格结构的NoC,位于网格边缘和拐角的路由器分别只需4对和3对输入、输出通道。本发明可以有效提高片上网络路由器的最大工作频率,减小其硬件开销,有着良好的应用价值。
文档编号H04L12/56GK101808032SQ20101011858
公开日2010年8月18日 申请日期2010年3月4日 优先权日2010年3月4日
发明者刘刚, 李丽, 李伟, 李明, 潘红兵, 王佳文, 高明伦 申请人:南京大学;中国电子科技集团公司第十四研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1