一种基于dsp的并行计算装置及系统的制作方法

文档序号:6618046阅读:159来源:国知局
专利名称:一种基于dsp的并行计算装置及系统的制作方法
技术领域
本实用新型关于计算机并行计算技术,具体的讲是一种基于DSP的并行计算 装置及系统。
背景技术
科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交 叉学科,是数学及其计算机实现在高科技领域应用的必不可少的纽带和工具。并行计算可以利用并行计算机或分布式计算机系统提供单个处理器所不具 备的计算能力。人们在研制新一代计算机的努力中, 一个共同的特点就是采用 并行技术。增加同一时间间隔内操作数量的技术即所谓并行处理技术;为并行 处理所设计的计算机统称之为并行计算机;在并行计算机上求解问题称之为并 行计算;在并行计算机上实现求解问题的算法可称之为并行算法。并行性(parallelism)有两种含义 一是同时性(simutaneity),亦即并行 性指两个或多个事件在同一时问发生;二是并发性(ncuirency),指两个或多个 事件在同 一 时间间隔内发生。.现有技术中,机群系统是利用高速通用网络将一组高性能工作站或高档PC 机,按某种结构连接起来,在并行程序设计以及可视化人机交互集成开发环境 支持下,统一调度,协调处理,实现高效并行处理的系统。从结构和结点间的 通信方式来看,它属于分布存储系统。机群系统中的主机和网络可以是同构的, 也可以是异构的。机群系统的特点是性能高,速度快,但是价格高昂,功耗巨大,占地面积 很大。机群系统目前已经成为高性能计算机的发展方向,世界上t叩500排行榜 的高性能计算机系统绝大多数是机群系统。尽管机群式并行系统具有超强的性能,速度达几百万亿次/秒,但是现在一 些大规模和超大规模HPC (高性能计算)用户已经把能耗(每瓦特计算性能Fl叩s/W)和占地面积(每平方米计算性能Flops/m2)作为HPC选购的重要指标关 注。 一些HPC供应商也把降低能耗和减少系统占地面积作为战略课题来研究,甚 至已经将功耗控制课题提高到体系结构设计的高度。中国实用新型专利申请00814367.6公开了一种并行计算机体系结构、使用这种体系结构的信息处理单元,该实用新型申请所公开的技术方案被合并于此 以作为本实用新型的现有技术。实用新型内容本实用新型提供一种基于DSP的并行计算装置及系统,用以解决并行计算设 备的高成本、高占地面积、高功耗的问题。本实用新型的技术方案为一种基于DSP的并行计算装置,所述的装置包括显示控制单元、至少一个 并行交换单元和至少两个运算单元;其中,所述的显示控制单元包括第一DSP, 以及与该第一DSP相联接的第一微处理器、第一可编程控制逻辑器件、显示器和 至少二个通信接口;所述的并行交换单元包括第二DSP,以及与该第二DSP相 联接的第二微处理器、第二可编程控制逻辑器件和至少三个通信接口;所述的 运算单元包括第三DSP,以及与该第三DSP相联接的第三可编程控制逻辑器件、 存储器和通信接口;并且,所述并行交换单元的一个通信接口与所述显示控制 单元的一个通信接口相连接,所述并行交换单元的另两个通信接口分别与两个 所述运算单元的通信接口相连接。一种基于DSP的并行计算系统,该系统包括,计算机;所述的系统还包括 基于DSP的并行计算装置;该基于DSP的并行计算装置包括,显示控制单元、至 少一个并行交换单元和至少两个运算单元;其中,所述的显示控制单元包括第一DSP,以及与该第一DSP相联接的第一微处理器、第一可编程控制逻辑器件、 显示器和至少二个通信接口;所述的并行交换单元包括第二DSP,以及与该第 二DSP相联接的第二微处理器、第二可编程控制逻辑器件和至少三个通信接口 ;所述的运算单元包括第三DSP,以及与该第三DSP相联接的第三可编程控制逻 辑器件、存储器和通信接口;并且,所述的计算机与所述的显示控制单元的一 个通信接口相连接,所述显示控制单元的另一个通信接口与所述并行交换单元 的一个通信接口相连接,所述并行交换单元的另两个通信接口分别与两个所述 运算单元的通信接口相连接。本实用新型的有益效果在于采用DSP作为并行运算核心,将计算机输出的 并行运算任务通过显示控制单元和并行转换单元分配给多个运算单元进行并行 运算,由于显示控制单元、并行转换单元和多个运算单元可集中安装在一个小 机壳内,所以本实用新型装置即可完成并行运算任务,又实现了的低成本、很 小的占地面积、低功耗的良好的实用新型效果。

图l是本实用新型装置运算单元的结构框图; 图2是本实用新型装置并行交换单元的结构框图; 图3是本实用新型装置显示控制单元的结构框图; 图4是本实用新型装置的结构框图; 图5是本实用新型系统具体实施方式
的结构框图; 图6是本实用新型装置的机壳示意图; 图7是本实用新型系统具体实施方式
的连接示意图; 图8是本实用新型装置显示控制单元的工作流程图; 图9是本实用新型装置并行交换单元的工作流程图; 图10是本实用新型装置运算单元的作流程图; 图ll是本实用新型装置运算单元的电源电路图; 图12是本实用新型装置运算单元的以太网接口电路图; 图13是本实用新型装置并行交换单元的网络开关电路图; 图14是本实用新型装置显示控制单元的接口电路图; 图15是本实用新型装置显示控制单元的微控制器(MCU)电路图;图16是本实用新型装置显示控制单元的可编程逻辑器件(CPLD)电路图; 图17是本实用新型实施例并行运算任务分配示意图。
具体实施方式
以下结合附图说明本实用新型的具体实施方式
。如图1所示,为本实用新型具体实施方式
的一种基于DSP的并行计算装置的显示控制单元,该显示控制单元 包括第DSP1,以及与DSP1相联接的微处理器(MCU1)、可编程控制逻辑器件 (CPLD1)、显示器(LCD)和以太网开关l (Ether Switch ),该以太网开关l 至少连接二个以太网接口;该显示控制单元被制成一块显示控制板(S-cnct PCB)。如图2所示,为本实用新型具体实施方式
的一种基于DSP的并行计算装置的 并行交换单元,该并行交换单元包括DSP2,以及与该DSP2相联接的、CPLD2 和以太网开关2 (Ether Switch ),该以太网开关2至少连接三个以太网接口 ; 该并行交换单元被制成一块并行交换板(U-cnct PCB)。如图3所示,为本实用新型具体实施方式
的一种基于DSP的并行计算装置的 运算单元,该运算单元包括DSP3,以及与该DSP3相联接的CPLD3、存储器和 一个以太网接口;该运算单元被制成一块运算单元板(Unit PCB)。如图4所示,为本实用新型具体实施方式
的一种基于DSP的并行计算装置,并且所述并行交换单元的一个通信接口与所述显示控制单元的一个通信接口相 连接,所述并行交换单元的另两个通信接口分别与两个所述运算单元的通信接 口相连接。如图6所示,为本实用新型具体实施方式
的一种基于DSP的并行计算装置, 所述的显示控制板(S-cnct PCB)、并行交换板(U-cnct PCB)和运算单元板 (UnitPCB)安装在一个机壳601内;显示器604透出机壳601,用于显示并行运 算任务和湿度等参数。以太网接口605用于与外部连接。机壳601上还安装有电 源开关602和多个按键603,多个按键603用于对基于DSP的并行计算装置进行操9实施例如图5、 7所示,为本实用新型系统的一实施例。其中,如图7所示将一笔记 本电脑与基于DSP的并行计算装置相连接组成本实施例系统,以进行并行运算。如图5所示,本实施例的基于DSP的并行计算装置由一块显示控制板(S-cnct PCB)、五块并行交换板(U-cnctPCB)和四十块运算单元板(Unit PCB)组成, 并且将这些PCB板安装在一个机壳601内。所述的显示控制板(S-cnct PCB)包括DSP1,以及与DSP1相联接的微处理 器(MCU1)、可编程控制逻辑器件(CPLD1)、显示器(LCD)、以太网开关和 六个以太网接口。五个并行交换板(U-cnctPCB)中的每一个都相同,该并行交换板(U-cnct PCB)包括DSP2,以及与该DSP2相联接的、CPLD2、以太网开关2 (Ether Switch )和九个以太网接口。四十块运算单元板(UnitPCB)中的每一个都相同,且该运算单元板(Unit PCB)包括DSP3,以及与该DSP3相联接的CPLD3、存储器和一个以太网接口。所述显示控制板(S-cnct PCB)的六个以太网接口中的一个以太网接口与 笔记本电脑的以太网接口相连接,用于接收笔记本电脑发出的并行运算任务和 向笔记本电脑输出并行运算结果。另外五个以太网接口分别连接一个并行交换 板(U-cnct PCB),用于向五个并行交换板(U-cnct PCB)(并行交换板IOO 一500)传送并行运算任务和从五个并行交换板(U-cnctPCB)接收反馈的并行 运算结果。每个并行交换板(U-cnct PCB)的九个以太网接口中的一个以太网接口用 于与显示控制板(S-cnct PCB)连接,接收显示控制板(S-cnct PCB)传来的 并行运算任务和反馈并行运算结果,另外八个以太网接口分别连接一个运算单 元板(Unit PCB);用于向运算单元板(Unit PCB)(共有五组运算单元板, 每组8个运算单元板,即:运算单元板101 — 108、 201 — 208、 ......、 501 — 508)10传送并行运算任务和接收反馈的并行运算结果。如图8所示,是显示控制单元的工作流程图。系统启动后,先对MCU1进行 初始化,然后判断是否有中断请求,如果有中断请求,则开外部中断,如果没 有中断请求,则返回。开外部中断后,等待进一步的中断,并显示DSP1的工作 状态和温度、湿度等参数。对运算任务是否全部完成进行判断,如果未完成, 则返回,如果已经完成全部运算任务,则结束本次并行运算任务。如图9所示,是并行交换单元的工作流程图;系统启动后,先对MCU2进行 初始化,然后判断是否有中断请求,如果有中断请求,则开8路外部中断,如果 没有中断请求,则返回。开8路外部中断后,等待进一步的中断,并显示DSP2 的工作状态和温度、湿度等参数。对运算任务是否全部完成进行判断,如果未 完成,则返回,如果已经完成全部运算任务,则结束本次并行运算任务。如图10所示,是运算单元的作流程图;系统启动后,先判断是否有中断请 求,如果有中断请求,则开网络中断和外部中断,如果没有中断请求,则返回。 开网络中断和外部中断后,等待网络中断、接受并行运算任务,执行运算任务, 等待新中断。对运算任务是否全部完成进行判断,如果未完成,则返回,如果 已经完成全部运算任务,则结束本次并行运算任务。在本实施例中,运算单元中的DSP3采用TI 6000系列浮点DSP,运算能力,双 精度浮点,2400MFL0PS; 512MB运算内存;以40单元为例,运算能力为2400 x40 =96000MFLPs = 96 GFLOPs。支持10/100Mbit Ethernet协议。具备高度优化的 供电系统,高精度时钟源,用户可编程的片上可编程逻辑器件。如图ll所示为 运算单元的电源电路图。如图12所示是运算单元的以太网接口电路图。并行交换单元,内嵌Ethernet网络交换系统,具有9端口 10/100Mbit Ethernet;具备高度优化的供电系统,高精度时钟源,用户可编程的片上可编 程逻辑器件。如图13所示,是并行交换单元的网络开关电路图。显示控制单元,内嵌Ethernet网络交换系统,具有6端口 10/100Mbit Ethernet;具备高度优化的供电系统,高精度时钟源,用户可编程的片上可编程逻辑器件。带有字符型24x2 LCD显示器,带有系统设置与复位开关。如图14 所示,是显示控制单元的接口电路图;如图15所示,是显示控制单元的微控制器 (MCU)电路图;如图16所示,是显示控制单元的CPLD电路图。本实施例系统的软件包括关于运算电磁学、内容管理,视频检索、图像 检索等的算法库;各功能板卡底层驱动程序代码(包括DSP,MCU) ,CPLD逻辑代 码;ethernet设备端驱动代码;PC端关于ethernet的驱动代码,管理软件代码, 应用软件代码;本实施例还可为笔记本电脑无线传输的天线设计。接受任务后通过PC将运 算任务分配到40个运算单元,各单元运行GEMS1.0电磁仿真软件,运算完成后, 将结果汇总到PC端。对数据进行分析,存储等。如图17所示,是本实用新型实施例处理视频图像数据并行运算任务的视频 数据分配示意图。H. 264标准规定一个帧(Frame)可划分为多个片段(slice), 每个片段的编码不依赖于同一帧其它片段。根据此特点,同一帧内的各个片段 可以并行编码。如图17所示,任何一帧图像(包括I帧、B帧、P帧)可以在显示 控制板(S-cnct PCB)被分成40个片段通过5个并行交换板(U-cnct PCB)分送 给40个所述的运算单元板(Unit PCB)去处理。每个片段对应一个运算单元板 (Unit PCB)的DSP,使得40个片段同时进行编码。与frame级并行算法相比, slice级并行算法不用考虑前后帧之间的参考问题。同一个frame内的各个slice 可以按任意顺序编码,使并行编码具有更大的自由度,有利于提高并行化效率。 但是对一个slice中宏块的编码不能用另一个slice中的宏块作参考,降低了宏 块之间的相关性,这就使数据压縮率有所下降。因而在采取slice级并行前,需 对图像质量、数据压縮率和并行效率三者做权衡。本实施例的并行运算以Slice作为基本的任务调度单元,对H. 264的视频编 码任务进行合理的分配和调度后,由各个所述的运算单元板(Unit PCB)进行 并行编码。在并行运算时是由显示控制板(S-cnctPCB)读入原始的视频码流, 确定参数设置后,将一幅图像划分为有限数目(比如40个)的Slice,并将其通过并行交换板(U-cnct PCB)平均依次分配给各个所述的运算单元板(Unit PCB) 进行并行编码。各所述的运算单元板(Unit PCB)编码工作完成后,再将码流 经并行交换板(U-cnct PCB)传回显示控制板(S-cnct PCB),由显示控制板 (S-cnctPCB)负责将收集到的压縮比特流进行组合,形成符合H. 264视频编码 标准格式的码流。此外,显示控制板(S-cnct PCB)还负责各处理器间的同步。 这种并行运算简单,便于实现,显示控制板(S-cnct PCB)的负载能基本达到 平衡。以上具体实施方式
仅用于说明本实用新型,而非用于限定本实用新型。
权利要求1.一种基于DSP的并行计算装置,其特征是,所述的装置包括显示控制单元、至少一个并行交换单元和至少两个运算单元;其中,所述的显示控制单元包括第一DSP,以及与该第一DSP相联接的第一微处理器、第一可编程控制逻辑器件、显示器和至少二个通信接口;所述的并行交换单元包括第二DSP,以及与该第二DSP相联接的第二微处理器、第二可编程控制逻辑器件和至少三个通信接口;所述的运算单元包括第三DSP,以及与该第三DSP相联接的第三可编程控制逻辑器件、存储器和通信接口;并且,所述并行交换单元的一个通信接口与所述显示控制单元的一个通信接口相连接,所述并行交换单元的另两个通信接口分别与两个所述运算单元的通信接口相连接。
2. 根据权利要求1所述的基于DSP的并行计算装置,其特征是,所述的显示 控制单元还包括第一以太网开关,并且所述的显示控制单元包括至少二个通信 接口是指,该显示控制单元具有六个以太网接口;所述的装置包括五个并行交换单元,每个所述的并行交换单元还包括第二以太网开关,并且所述的并行交换单元包括至少三个通信接口是指,每个并行 交换单元具有九个以太网接口;所述的装置包括至少两个运算单元是指,所述的装置包括四十个所述的运 算单元;其中,所述显示控制单元的六个以太网接口中的一个以太网接口用于接收外部的 并行运算任务和输出并行运算结果,另外五个以太网接口分别连接一个所述的 并行交换单元,用于向所述的并行交换单元传送并行运算任务和接收反馈的并 行运算结果;每个所述的并行交换单元的九个以太网接口中的一个以太网接口用于接收 所述显示控制单元传来的并行运算任务和反馈并行运算结果,另外八个以太网接口分别连接一个所述的运算单元;用于向所述的运算单元传送并行运算任务 和接收反馈的并行运算结果;所述运算单元的通信接口为一个以太网接口,用于接收并行交换单元传来 的并行运算任务、执行并行运算和输出并行运算结果。
3,根据权利要求1所述的基于DSP的并行计算装置,其特征是,所述显示控 制单元的两个通信接口中的一个接口用于接收外部的并行运算任务和输出并行 运算结果,另外一个接口连接一个所述的并行交换单元,用于向所述的并行交 换单元传送并行运算任务和接收反馈的并行运算结果;所述的并行交换单元的三个通信接口中的一个接口用于接收所述显示控制 单元传来的并行运算任务和反馈并行运算结果,另外两个接口分别连接一个所 述的运算单元;用于向所述的运算单元传送并行运算任务和接收反馈的并行运 算结果;所述运算单元的通信接口用于接收并行交换单元传来的并行运算任务、执行并行运算和输出并行运算结果。
4. 根据权利要求1所述的基于DSP的并行计算装置,其特征是,所述显示控制单元还包括第一以太网开关;所述并行交换单元还包括第二以太网开关;所述的通信接口为以太网接口。
5. 根据权利要求1至4任意一项所述的基于DSP的并行计算装置,其特征是,所述的显示控制单元、并行交换单元和运算单元安装在一个机壳内;所述的显 示器透出机壳,用于显示并行运算任务和湿度等参数。
6. —种基于DSP的并行计算系统,该系统包括,计算机;其特征是,所述 的系统还包括基于DSP的并行计算装置;该基于DSP的并行计算装置包括,显 示控制单元、至少一个并行交换单元和至少两个运算单元;其中,所述的显示控制单元包括第一DSP,以及与该第一DSP相联接的第一微处 理器、第一可编程控制逻辑器件、显示器和至少二个通信接口;所述的并行交换单元包括第二DSP,以及与该第二DSP相联接的第二微处理器、第二可编程控制逻辑器件和至少三个通信接口;所述的运算单元包括第三DSP,以及与该第三DSP相联接的第三可编程控 制逻辑器件、存储器和通信接口;并且,所述的计算机与所述的显示控制单元的一个通信接口相连接,所述显示控 制单元的另一个通信接口与所述并行交换单元的一个通信接口相连接,所述并 行交换单元的另两个通信接口分别与两个所述运算单元的通信接口相连接。
7. 根据权利要求6所述的基于DSP的并行计算系统,其特征是,所述的显示 控制单元还包括第一以太网开关,并且所述的显示控制单元包括至少二个通信 接口是指,该显示控制单元具有六个以太网接口;所述的装置包括五个并行交换单元,每个所述的并行交换单元还包括第二 以太网开关,并且所述的并行交换单元包括至少三个通信接口是指,每个并行 交换单元具有九个以太网接口;所述的装置包括至少两个运算单元是指,所述的装置包括四十个所述的运 算单元;其中,所述显示控制单元的六个以太网接口中的一个以太网接口用于接收外部的 并行运算任务和输出并行运算结果,另外五个以太网接口分别连接一个所述的 并行交换单元,用于向所述的并行交换单元传送并行运算任务和接收反馈的并 行运算结果;每个所述的并行交换单元的九个以太网接口中的一个以太网接口用于接收 所述显示控制单元传来的并行运算任务和反馈并行运算结果,另外八个以太网 接口分别连接一个所述的运算单元;用于向所述的运算单元传送并行运算任务 和接收反馈的并行运算结果;所述运算单元的通信接口为一个以太网接口,用于接收并行交换单元传来 的并行运算任务、执行并行运算和输出并行运算结果。
8. 根据权利要求6所述的基于DSP的并行计算系统,其特征是,所述显示控 制单元的两个通信接口中的一个接口用于接收外部的并行运算任务和输出并行运算结果,另外一个接口连接一个所述的并行交换单元,用于向所述的并行交 换单元传送并行运算任务和接收反馈的并行运算结果;所述的并行交换单元的三个通信接口中的一个接口用于接收所述显示控制 单元传来的并行运算任务和反馈并行运算结果,另外两个接口分别连接一个所 述的运算单元;用于向所述的运算单元传送并行运算任务和接收反馈的并行运 算结果;所述运算单元的通信接口用于接收并行交换单元传来的并行运算任务、执 行并行运算和输出并行运算结果。
9. 根据权利要求6所述的基于DSP的并行计算系统,其特征是,所述显示控 制单元还包括第一以太网开关;所述并行交换单元还包括第二以太网开关;所 述的通信接口为以太网接口。
10. 根据权利要求6至9任意一项所述的基于DSP的并行计算系统,其特征是, 所述的基于DSP的并行计算装置还具有一个机壳;所述的显示器透出机壳,用于 显示并行运算任务和湿度等参数;所述显示控制单元的一通信接口透出机壳, 用于与所述的计算机相连接。
专利摘要本实用新型提供一种基于DSP的并行计算装置及系统,所述的装置包括显示控制单元包括第一DSP,以及与该第一DSP相联接的第一微处理器、第一可编程控制逻辑器件、显示器和至少二个通信接口;并行交换单元包括第二DSP,以及与该第二DSP相联接的第二微处理器、第二可编程控制逻辑器件和至少三个通信接口;运算单元包括第三DSP,以及与该第三DSP相联接的第三可编程控制逻辑器件、存储器和通信接口;并且,所述并行交换单元的一个通信接口与所述显示控制单元的一个通信接口相连接,所述并行交换单元的另两个通信接口分别与两个所述运算单元的通信接口相连接。用以解决并行计算设备的高成本、高占地面积、高功耗的问题。
文档编号G06F15/16GK201111037SQ200720173859
公开日2008年9月3日 申请日期2007年10月30日 优先权日2007年10月30日
发明者余文华, 锐 吕, 湃 王, 王金涛, 初 裘, 高鹏东, 鲁永泉 申请人:中国传媒大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1