面向外设需求的片上网络通讯的优化方法

文档序号:7703265阅读:506来源:国知局
专利名称:面向外设需求的片上网络通讯的优化方法
技术领域
本发明涉及计算机体系结构中的处理核优化方法,尤其是涉及一种面向外 设需求的片上网络通讯的优化方法
背景技术
近几年来计算机科学与技术的发展成果,已经呈现在个人手头的桌面电脑 以及各种各样的数码产品上。从体系架构的角度看,他们的共同特征是性能越 来越强大,功耗越来越小,这也是最符合人们对此的需求的。
无论在学术界还是工业界,计算机体系结构的研究,已经从单纯提高一个 处理核心的性能转变到一个晶片上集成多个处理模块上,谓之多核。在体系结 构发展中,多核成为趋势与主流,得益于硅工艺的进步与硅材质的本身缺陷 前者使单位面积上能集成的晶体管数量越来越多(摩尔伪定律),后者使得处理 核的频率提升受到限制(光速上限,布线延迟相对于门电路越来越长)。这样直 接导致的后果便是单核频率提升有限和晶体管数量不能充分利用,加上功耗的 控制,多核便应运而生。
为了满足日益增长的高密集型、高吞吐量型应用程序的需求,探索比传统 共享总线更好的片内通讯方式成为人们思考的问题。
各种功能部件(处理器、内存以及外围i/o控制器等)在片上网络上通过发包的
形式来进行通讯的方式叫做片上网络。在通讯、多媒体和消费电子等方面,片 上系统(SoC)通过整合各种功能部件到单一芯片上,能够满足体型和功耗等苛
刻的需求。然而这样基于共享总线的SoC系统具有设计复杂,功能难以设计正 确以及各个模块难以复用的严重缺点。所以Network-on-Chip (简称NoC )技 术首先应用到SOC系统的研究中。
NoC正是为了克服传统共享总线架构的问题而提出来的,因而比基于总线 有不可比拟的优点。下面是主要的,不是全部。
l.NoC具有很好的可扩展性,并具有比总线更好的并发性。所有的功能模块 (节点)通过网络接口 (NetworkInterface)统一连接到基于路由(router)的网 络上。路由具有转发包的能力,并且,通过路由,全局连线变成有几段短线连 接而成,保证了信号不被扭曲。这样从理论上讲可以扩展至成千上万个节点。 所有路由间的连线可以并发进行数据的发送与接收,提高了并发性。2. 模块高度可复用化。如上所述,各个功能模块通过NI互联,这样便有了 统一的接口。电子产品更新换代,而网络基本上保持不变,因而模块得到复用 化。这样给设计人员减少了重复设计的工作量,降低了成本,也加速了产品上 市时间。
3. 全局信号控制变得简单(包括时钟)。各个功能模块是相对独立的,没有 全局或基本没有全局的协调机制,使全局信号扭曲降到最低。同时各个功能模 块可以采用自己的时钟,系统变就成了分布式的,使不必即时监视其他模块的 状态。
由于NoC的研究处于起步阶段,目前还没有商业的系统出现,但前景是可 观的。可以遇见不久的将来,NoC的模型会越来越清晰。未来的几个问题包括 各组成部件将会被标准化来增加模块的复用性,但是性能却会有损耗,因此需 要反复权衡;片上系统的模拟系统也未确定,性能评价标准的benchmark需要 重新设计;功耗是现有芯片设计的重要指标,在NoC设计中也不会例外。
在传统共享总线架构中,各个功能部件直接连接在总线上,因此从物理上 看完全处于对称的位置。逻辑上的不同也仅限于请求总线服务的优先级不同。 这样一来,传统的架构设计中不存在各个部件之间的拓扑问题。
而在NoC的系统中,各个功能部件(也称节点)连接在一个网络上,也因 此引入了一个与传统网络中的类似的一个网络互联拓扑问题。 一般来说,由于 路由的分布性和能力的有限性,各个节点在网络中的位置并不是完全对称的, 只能是部分对称。综上所述, 一个可行的NoC拓扑结构不可避免的带有节点地 理位置差异性。

发明内容
本发明的目的在于提供一种面向外设需求的片上网络通讯的优化方法,通 过地理位置的差异性通过合适的节点位置设计,任务映射方式,优化片上网络 通讯。
本发明解决其技术问题采用的技术方案如下
1) 面向外设10的外围连接设计
对基于片上网络处理核的拓扑结构纳入设计范围,因外设IO吞吐的需求, 一个可行的NoC拓扑结构不可避免的带有节点地理位置差异性;而这种地理位 置的差异性通过指定的节点位置设计,任务映射方式,使这种差异性问题带来 的影响最小化;
2) 划分虚拟子网络片上网络存在着n个节点,各个节点之间通过统一的路由器相连,由于任 务的簇拥性, 一个外设通道和一组处理节点构成了一个任务的硬件资源需求, 即构成了一个临时的、具有显著通讯的虚拟子网络;在该网络中,相比与不在 同一组其他节点,有着更多的通讯近亲关系;
3)平衡通讯流量
划分成虚拟子网络后,子网络内部具有相对大量的通讯需求,另外各个虚 拟子网络之间也存在着少量的通讯需求。利用通讯的平衡性以优化路由器设计, 通过平衡通讯流量,并使整个系统处于一种较优的通讯工作状态,此状态的获 取遵循"欧姆定律"。
与背景技术相比,本发明具有的有益的效果是
本发明是一种面向外设通讯需求的片上网络类型处理核设计中的一种必要 优化设计方式,是未来基于片上网络通讯核设计中的考虑因素之一。本发明将 NoC针对IO需求,划分成虚拟网络,将NoC分为多个逻辑独立的网络,平衡 外设IO与内部线程(或任务)的通讯流量,以既支持了计算密集型的计算需求, 又支持IO密集型的计算需求。
(1) 独立性、可靠性和高效性。本方法通过于片上网络的通讯需求的满足, 设计中与其他因素相对独立,各个子块之间异步工作,极大地增加了片上网络 的可靠性。各个功能模块通过NI互联,这样便有了统一的接口。全局信号控制 变得简单(包括时钟)。各个功能模块是相对独立的,没有全局或基本没有全局 的协调机制,使全局信号扭曲降到最低。同时各个功能模块可以采用自己的时 钟,系统变就成了分布式的,使不必即时监视其他模块的状态。各个节点的通 讯相对平衡,没有特别拥挤的中心点,处于分布状态,因而是高效的。
(2) 良好的可扩展性,更好的并发性。所有的功能模块(节点)通过网络接 口 (NetworkInterface)统一连接到基于路由(router)的网络上。路由具有转发 包的能力,并且,通过路由,全局连线变成有几段短线连接而成,保证了信号 不被扭曲。这样从理论上讲可以扩展至成千上万个节点。所有路由间的连线可 以并发进行数据的发送与接收,提高了并发性。各个外围通道的通讯需求在逻 辑上被划分成了几个虚拟子网络,各个子网络之间的"干扰"达到最小。


图1是本发明的外设通道连接示意图。 图2是本发明的虚拟子网络划分方法图。 图3是组内网络最优的状态分布图。图4是两个通路可以到达目的地示意图。
具体实施例方式
本本发明是一种计算机体系结构中面向外设通讯需求的片上网络类型处理 核设计中的一种必要优化设计方式。目前的NoC发展期望大多对密集计算有着 质的提升,而忽视了快速外围设备IO的需求。本发明将NoC针对IO需求,划 分成虚拟网络,将NoC分为多个逻辑独立的网络,平衡外设IO与内部线程(或 任务)的通讯流量,以既支持了计算密集型的计算需求,又支持IO密集型的计 算需求。
下面结合图l、图2说明其具体实施过程。 1)面向外设IO的外围连接设计
本优化设计方法对基于片上网络处理核的拓扑结构纳入考虑范围,因外设IO 吞吐的需求, 一个可行的NoC拓扑结构不可避免的带有节点地理位置差异性。 而这种地理位置的差异性通过合适的节点位置设计,恰当的任务映射方式等, 可以使这种问题带来的影响最小化。
图1中,LVDS,PCI-E和MEM controller都是高流量外设通到,可以看到, 假设从节点0需要分别发一个包给节点1和节点15,最优的路由算法中到节点 1的延迟显然比到节点15的延迟要短,而且到节点15的通信代价更高。而从节 点0的逻辑视角上看,节点1和节点15是完全等同的。这种现象可以成为拓扑 网络架构的地理位置差异。这种差异型除了带来直观上的延迟外,将会消耗更 多的资源,如路由和连线等。这种差异是不能被完全消除的。本发明中,首先 固定了大吞吐量的外设通道的位置,如图中的快速显卡通道、内存控制器通道 等。其次,利用线程(任务)在处理核(节点)中位置不固定的事实,采用通 讯量大时安排最近的位置,通讯量小时安排较远的位置,设计外设通道与片上 网络处理核的连接设计。 2)划分虚拟子网络
从图2中,core代表片上网的处理单元,即片上网络存在着n个节点,各 个节点之间通过基本统一的路由相连。由于任务的簇拥性, 一个外设通道和一 组处理节点构成了一个任务的硬件资源需求。正是基于这样的考虑,构成了一 个临时的、具有显著通讯的虚拟子网络。在该网络中,相比与其他节点,有着 更多的通讯近情关系,因此基于此也是高效的。
由于芯片面积的限制,而应用程序需要更多的计算核。因而片内无法整合 进一些除处理核外的其他设备控制器。可以简单的移植到现有共享总线架构,而片内处理核通讯采用NoC的方式,从而降低总线的压力,形成一种混合的通 讯方式的计算机系统。这样的设计是对传统总线结构的兼容,以达到降低成本 的目的。
这样的处理核设计方式一般应用于高密度计算,适用于i/o吞吐量较小,或 者I/0通道十分稀少的情况,使用条件极易受到限制。当外围端口,如图2中的 VGA,需要大量数据交换时,他连接的路由(router)会产生负荷过 重。原因是所有需要进行V G A数据交换的节点产生的数据都要通过这个路由 来转发数据,就像一条水沟处于下游的时候。
这种结构的NoC系统一般在映射应用程序时,根据应用程序对IO的需求,以 及结合了自身核之间的通讯需求,逻辑是上划分了类似虚拟网络的架构,如图2 中的曲线框所示。自身核间通讯代价大的节点一般安排在离所需IO端口较远 的地方,相反,对I O端口有直接大量数据交换的节点就需要十分靠近该I 0 端口。这样来平衡各个节点中路由的负载达到大致平衡。这样可以较好的支持 一些高速IO通道, 一般化地减少核间通讯的代价。 3)平衡通讯流量
划分成虚拟子网络后,子网络内部具有相对大量的通讯需求,另外各个子网 络之间也存在着少量的通讯需求。利用通讯的平衡性以优化路由设计,并使整 个系统处于一种较优的通讯工作状态;
(1) ,当一个虚拟子网络到来时,总是以此网络最优的状态分布各个节点的 位置。参看图3。
(2) , 一对节点之间的通道是重要的通讯硬件资源,当通讯量为空时存在自 身"电阻值"x。当一个通道存在负荷时,即增加这个通道的"电阻值"x'。可见, 当一对必要的通讯可以以最近的通道通过时,却未必是最优的。假设现在需要 从节点0向节点1通讯,然而最短路径中己经存在通讯量10 (电阻值),此时选 择从节点0-3-4-1的方式进行传输,因为在此条通道上的通讯量为2+2+2=6<10。 这个平衡通讯量的方式符合电流的走向,即"欧姆定律",即把通讯量看做是增加 的电阻,电流的走向即为本发明的通讯路径的选择。
(3) ,即使两个节点之间无通讯量,也不是选择两点之间作为所有通讯负荷, 而是,参看图4,存在两个通路可以到达目的地。假设通讯量为10,则在0-1 之间存在通讯量8,而0-3-4-1之间仍旧存在通讯量2。这个比列符合"欧姆定律"。 至于具体通讯量的大小,取决于"电阻值的设定",这个设定来源于具体实验数据 和经验,以达到系统优化的目的。
权利要求
1、一种面向外设需求的片上网络通讯的优化方法,其特征在于1)面向外设IO的外围连接设计对基于片上网络处理核的拓扑结构纳入设计范围,因外设IO吞吐的需求,一个可行的NoC拓扑结构不可避免的带有节点地理位置差异性;而这种地理位置的差异性通过指定的节点位置设计,任务映射方式,使这种差异性问题带来的影响最小化;2)划分虚拟子网络片上网络存在着n个节点,各个节点之间通过统一的路由器相连,由于任务的簇拥性,一个外设通道和一组处理节点构成了一个任务的硬件资源需求,即构成了一个临时的、具有显著通讯的虚拟子网络;在该网络中,相比与不在同一组其他节点,有着更多的通讯近亲关系;3)平衡通讯流量划分成虚拟子网络后,子网络内部具有相对大量的通讯需求,另外各个虚拟子网络之间也存在着少量的通讯需求。利用通讯的平衡性以优化路由器设计,通过平衡通讯流量,并使整个系统处于一种较优的通讯工作状态,此状态的获取遵循“欧姆定律”。
全文摘要
本发明公开了一种面向外设需求的片上网络通讯的优化方法。本发明将NoC针对IO需求,划分成虚拟网络,将NoC分为多个逻辑独立的网络,平衡外设IO与内部线程(或任务)的通讯流量,以既支持了计算密集型的计算需求,又支持IO密集型的计算需求。通过地理位置的差异性通过合适的节点位置设计,任务映射方式,优化片上网络通讯。
文档编号H04L12/56GK101540786SQ20091009764
公开日2009年9月23日 申请日期2009年4月13日 优先权日2009年4月13日
发明者汪达舟, 超 王, 蒋冠军, 剑 陈, 陈天洲 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1