基于RapidIO交换的多DSP阵列ATCA刀片设计方法

文档序号:6339966阅读:549来源:国知局
专利名称:基于RapidIO交换的多DSP阵列ATCA刀片设计方法
技术领域
本发明属于针对于计算机领域中标准ATCA刀片,为其提供了一种多DSP阵列的专用ATCA刀片的设计方法。
背景技术
ATCA (Advanced Telecom Computing Architecture)标准即先进的电信计算平台,它脱胎于在电信、航天、工业控制、医疗器械、智能交通、军事装备等领域应用广泛的新一代主流工业计算技术——CompactPCI标准。是为下一代融合通信及数据网络应用提供的一个高性价比的,基于模块化结构的、兼容的、并可扩展的硬件构架。目前参与开发ATCA 的公司已经达到100多家。这些公司包括电信设备制造商、计算机OEM厂商、应用计算平台提供商和第三方硬件和软件厂商。数字信号处理器(DSP),伴随着微电子技术的迅速发展和数字信号处理器理论与技术的不断完善而开发的现代高速数字信号处理单片机,是电子信息领域的新型高科技产品。DSP能够实时完成高速高运算量的计算,已广泛应用于各种信号处理、电信设备及雷达、 声纳等领域。RapidIO架构是一种基于包交换的高速串行互连技术,用于芯片之间和底板内的互连。该技术是专门针对嵌入式系统设计的,主要面向信号处理、网络和通信市场。由对等的嵌入式处理器,DSP、FPGA和ASIC组成的集群系统中RapidIO架构是最理想的互连技术。但是纵观目前市场提供的ATCA刀片,绝大部分是基于X86的高性能CPU服务器, 而随着目前数字运算量的爆发性增长,DSP芯片的优势在实际应用中越来越明显。大规模处理器系统中专用的DSP处理必将提高整个系统的效率。

发明内容
本发明采用将多个高性能DSP采用RapidIO交换方式进行芯片间紧耦合连接,可实现单片DSP多倍处理能力,大大提升了对高速数字信号的处理能力。由于在ATCA系统中越来越多的专用任务,比如雷达信号处理,图像处理,通讯基站等等涉及的数据传输带宽大而且处理方式愈发复杂,通用的CPU刀片虽然也能处理,但是其能效比要远低于DSP。这是与DSP的硬件结构有关系的,DSP中大量的都是硬件实现的乘加单元,完全是为数字信号处理运算而设计的微处理器,取决与工艺等其它因素的限制,目前单DSP或者少数几个DSP的结合并不能完全满足大数据处理的需求。所以,基于RapidIO交换的多高性能DSP将可以组成具有一定规模的DSP阵列,结合ATCA形式,并继续保留ATCA系统原有的网络,在系统中与ATCA其它的处理器刀片结合使用,将能有效提高系统效能。


图1表示基于RapidIO交换的多DSP阵列ATCA刀片的框图结构图2表示RapidIO包交换框图结构
具体实施例方式通过对ATCA板面积的计算,考虑到将ATCA的背板网络部分保留,并结合目前高性能DSP芯片的实际情况,选择TI的最新的TMS320TCI6486多核DSP,板上最高数目可以设计到20颗。该款6核3GHz器件可通过并行处理来实现性能可扩展性,并允许多个内核在单颗芯片上处理多条线程。还可通过器件共享硬件队列来显著提升分组驱动的处理性能,是众多多核器件的理想解决方案之一。配备非常灵活的内存,如共享内存和局部内存,还有高度集成的网络接口和各种外设。新一代处理器的功率低达4W,而相同处理性能的单核处理器则高达8W,功效是以前的2到3倍,在内存方面也有三倍的增加。另外,接口的带宽也有较大的提高,主要特点在于提供RapidIO端口,速率有1. 25Gb/S,2. 5Gb/S或3. 125Gb/S三个档次可做选择。而在关键的RapidIO交换方面选择采用I~Si578串列RapidIO交换机。其采用0. 13 微米CMOS技术,27mmX 27mm 675球FCBGA封装技术包装。该设备需要使用1. 2V和3. 3V电源,适合在产业和商业环境温度下使用,增强的^rDes大大降低了功耗;这款交换机可向 64000多个端点发送资料包,采用独立的单播与群播路由机制,具有向光纤控制器预先发送问题通知的错误管理辅助功能,适用于ATCA与MicroTCA背板或处理连接的理想平台;这款交换机可将支援串列RapidIO的处理器与周边设备互连,支援80(ib/S的总带宽。这款交换机具有非常高的伸缩性,可广泛应用于联网、无线与视频基础架构领域,因此,设计人员可以充分利用配置选件有效地管理电源需求,从而进一步提高性能;Tsi578可灵活地支援多达8个乜mode或16个Ix mode的端口,每个端口可配置为1. 25Gb/S、2. 5Gb/S或3. 125Gb/ S。交换机的所有端口完全独立,可支援各种宽度与速度配置。考虑到对外需提供不低于20路的RapidIO端口,而现有的Tsi578芯片只能满足 16路单链路通讯的需求,所以设计采用级连2片Tsi578来构造成整RapidIO网络,根据 Tsi578的特点,将其配置成10路单倍速率端口和3个4倍速率端口的混合速率模式,单倍速率端口用于连接DSP,4倍速率中两个用于Tsi578之间的连接,另一个用于ATCA构架的 Z0NE3区的信号连接。DSP之间的数据传输利用主要利用高速RapidIO的组包发送方式,在高性能计算中,涉及计算的中间结果无需在处理单元与主处理器之间、不同的处理单元与处理单元之间进行数据交互,进一步降低了系统的通信开销。
权利要求
1. 一种基于RapidIO交换的多DSP阵列的先进的电信计算平台ATCA刀片设计方法,其特征在于,在ATCA刀片上增加RapidIO交换电路与配置调试电路,对多DSP完成片间紧耦合,考虑到端口数量的问题,电路设计主要采用两块交换芯片互连,在固件配置上实现输入输出带宽平衡。
全文摘要
本发明为基于RapidIO交换的多DSP阵列的先进的电信计算平台ATCA刀片设计方法,属于计算机技术领域,旨在为符合ATCA形式的多DSP互连提供方法,通过在ATCA刀片上增加RapidIO交换电路与配置调试电路,对多DSP完成片间紧耦合,考虑到端口数量的问题,电路设计主要采用两块交换芯片互连,在固件配置上实现输入输出带宽平衡。此方法可将DSP芯片的处理能力引入ATCA应用领域,为高效能计算奠定基础。
文档编号G06F1/16GK102566671SQ20101060624
公开日2012年7月11日 申请日期2010年12月22日 优先权日2010年12月22日
发明者谢光伟, 谢智勇 申请人:上海红神信息技术有限公司, 华东计算技术研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1