数字信号处理器及基带通信设备的制作方法

文档序号:6496857阅读:240来源:国知局
数字信号处理器及基带通信设备的制作方法
【专利摘要】为了提高效率,数字信号处理器(200)包括向量执行单元(203,205),其设置为用以执行要对向量形式的多个数据进行操作的指令,所述向量执行单元包括向量控制器(720),其设置为用以判断指令是否为向量指令,若是,则通知设置为用以保存向量长度的计数寄存器(732),所述向量控制器进一步设置为用以接收发出信号并基于该发出信号控制指令的执行,所述向量执行单元的特征在于,其包括本地队列(730),其中本地队列设置为用以从程序存储器接收指令并在本地队列中保存该指令,直到满足预定条件为止;向量控制器包括设置为用以控制所述本地队列的队列控制装置(732,721)。
【专利说明】数字信号处理器及基带通信设备
【技术领域】
[0001]本发明涉及基于SMT的数字信号处理器。
【背景技术】
[0002]多数移动通信设备使用包括一个或多个数字处理器(DSP)的射频收发器。
[0003]目前,为了提高性能和可靠性,多数移动终端使用一种称为基带处理器(BBP)的DSP,其用于执行与处理接收的无线电信号和准备用于发射的信号相关的多种信号处理功能。有利的是将这些功能与主处理器分开,因为这种功能具有高度的定时依赖性,并且可能需要实时操作系统。所希望地是,这种基带处理器要尽可能的灵活以适应不断发展的标准并使硬件能重复使用。基于此,已开发了可编程基带处理器PBBP。
[0004]这种处理器中频繁执行的多数功能是针对大量采样数据而完成的。因此,采用一种称为单指令多数据流(Single Instruction Multiple Data, SIMD)处理器的处理器,因为它可以实现单个指令操作多个数据项,而不是一次操作一个数据项。
[0005]作为SIMD架构的进一步改进,已经开发出单指令流多任务流(SingleInstruction Multiple Tasks, SIMT)架构。通常,SIMT架构中已具有与作为内核处理器一部分的整数执行单元相关的一个或两个SIMD类向量执行单元。
[0006]国际专利申请W02007/018467公开了一种根据SMT架构的DSP,其具有包括整数处理器和程序存储器的处理器内核,以及与内核连接但未集成在内核中的两个向量执行单元。该向量执行单元可以为复杂算法逻辑单元(Complex Arithmetic Logic Units, CALU)或复杂乘法累加单元(CMAC,Complex Multiply-Accumulate Units)。该内核具有向执行单元分配指令的程序存储器。在WO 2007/018467专利文献中,每一向量执行单元具有单独的指令解码器。这可以有效地方式实现向量执行单元的使用在彼此之间独立,以及与处理器的其他部分之间独立。
[0007]用于SMT处理器的指令集架构通常可包括三类混合指令。
[0008]-RISC指令,其操作16位整数操作数。RISC指令类包括大多数面向控制的指令,并可在处理器内核的整数执行单元中执行。
[0009]-DSP指令,其处理具有实部和虚部的复值数据。该DSP指令可在一个或多个SMD集群上执行。
[0010]-向量指令。向量指令可视为DSP指令的扩展,因为其操作大数据集并使用先进的寻址模式和向量支持。
[0011]因此,SIMT架构在提供任务级和SMD向量计算的性能的同时还具有足够的RISC控制灵活性。
[0012]因此,在SMT架构中具有若干执行单元。通常每个时钟周期里,可由程序存储器向执行单元中的一个单元发出一条指令。由于向量运算通常处理大向量,因此,在一个时钟周期里一个向量执行单元中接收的指令将要花费数个时钟周期来进行处理。因此,在随后的时钟周期里,可向处理器的其他计算单元发出指令。由于向量指令运行在长向量上,因此许多RISC指令可与向量操作同时执行。
[0013]多种基带算法可分解为更小的基带任务链,其中在任务之间几乎没有后向依赖性。该属性不仅容许在向量执行单元上并行执行不同任务,它也可通过使用上述指令集架构而加以利用。
[0014]为提供控制流同步并控制该数据流,“空”指令通常可用于中止控制流直到给定的向量操作完成。“空”指令将中止进一步的指令提取直到满足特定条件。该条件可以是向量执行单元中的向量指令的完成。
[0015]DSP任务通常包括具有一至十条指令的序列,下文将对其进行更详细地讨论。这表明向量执行单元将接收向量指令来进行运算,并在提供的数据向量上执行该向量指令直到整个向量完成为止。下一条指令将是处理该结果并将其存储在存储器中,理论上这可在对整个向量执行计算后随即发生。然而,向量执行单元通常得等待几个时钟周期才能得到它的下一条指令,因为处理器内核忙于等待其他向量单元完成操作,这导致向量执行单元的低效利用。随着系统中向量执行单元数量的增长,向量执行单元处于非活动状态的可能性增大。

【发明内容】

[0016]本发明的目的在于使SMT架构中的向量指令的处理更有效率。
[0017]根据本发明通过在数字信号处理器中使用向量执行单元来实现所述发明目的,所述向量执行单元设置为用以执行包括针对向量形式的多数据进行操作的向量指令的指令,其中,向量执行单元包括向量控制器,其设置为用以判断指令是否为向量指令,若是,通知用以保存该向量长度的计数寄存器,所述向量控制器进一步设置为用以控制指令的执行,所述向量执行单元的特征在于其包括设置为用以接收来自程序存储器的至少第一指令和第二指令的本地队列,并在本地队列中保存第二指令直到预定条件满足为止,并且该向量控制器包括设置为用以控制本地队列的队列控制装置。
[0018]优选的是,向量控制器基于从内核接收的发出信号来控制指令的执行。或者,该发出信号可由向量执行单元本身在本地处理。
[0019]由于为各个向量执行单元提供本地队列,因此可同时为向量单元提供针对一个向量单元的包括数条指令的一批指令。为使本地队列中的指令与向量指令的执行同步,提供称为SYNC指令的指令,其将暂停从本地队列读取指令直到满足条件为止,该条件通常为数据通路准备好接收并执行另一指令。这两个特征共同使得指令序列能够即刻发送到指令执行单元,存储在本地队列中,并在向量执行单元中依序处理,以使得向量执行单元一旦完成一条指令就能开始下一条指令。采用这种方式,每一向量执行单元可在最少的非活动时间情况下工作。
[0020]由于向量执行单元可彼此更加独立地工作,因此通过增加处理器的并行性,可使根据本发明的数据处理更有效。本发明基于如下认知:现有技术中已完成向量指令的向量执行单元通常不能立即接收下一指令,因为全部向量执行单元从同一队列(即处理器内核中的程序存储器)中接收其命令。当向量执行单元准备好接收新指令而程序存储器中的第一条命令用于另一处于繁忙状态的向量执行单元时,上述情况将会发生。在此情况下,没有一个向量执行单元能接收新命令直到其他向量执行单元准备好接收其下一命令为止。[0021 ] 在一优选实施例中,向量执行单元进一步包括:
[0022]-指令寄存器,设置为用以接收和存储指令;
[0023]-指令解码器,设置为用以对存储在指令寄存器中的指令进行解码;
[0024]-由指令解码器控制的多个数据通路。
[0025]本地队列优选配置为暂停指令的读取直到数据通路准备好接收并执行另一指令。这将优化向量指令中的队列处理,以及该向量执行单元所属的处理器中的指令的整体处理。
[0026]队列控制装置优选包括设置为用以保存涉及队列的状态信息(例如队列的排满程度)的队列控制器,并控制从本地队列到向量执行单元的指令的发送以便执行。队列控制器也可设置为用以在新指令发送到队列且队列是排满的情况下产生错误信息。
[0027]队列控制装置可设置为用以发出特定信号,该特定信号命令本地队列暂停从本地队列读取指令直到特定条件例如数据通路准备好接收新指令这一条件满足为止。
[0028]向量控制器优选设置为用以使得要发送至数字信号处理器的程序流控制单元的信号来指示该单元准备好接收新指令。该信号的发送可基于从指令解码器发送到向量控制器的关于任意给定时刻执行的指令的信息。该信号也可基于当前队列中指令的数量,例如,队列中是否还存在用于更多指令的空间。
[0029]本发明还涉及一种数字信号处理器,包括:
[0030]-处理器内核,包括配置为用以执行整数指令的整数执行单元;以及
[0031]-与处理器内核分开并与之耦合的至少第一和第二向量执行单元,其中,每一向量执行单元分别为如上所述的向量执行单元;
[0032]-所述数字信号处理器包括程序存储器和发出逻辑,其中,程序存储器设置为用以保存用于第一和第二向量执行单元的指令,发出逻辑用于向第一和第二向量执行单元发出包括向量指令的指令。
[0033]如上所述,该数字处理器能够使其向量执行单元实现更多的并发使用。
[0034]通常,程序存储器设置在处理器内核中,并设置为用以为整数执行单元保存指令。
[0035]本发明还涉及一种适于多模有线和无线通信的基带通信设备,包括:
[0036]-前端单元,设置为用以发送和/或接收通信信号;
[0037]-耦合至模拟前端单元的可编程数字信号处理器,其中可编程数字信号处理器为如上所述的数字信号处理器。
[0038]在优选的实施例中,本文通篇提及的向量执行单元为SIMD类向量执行单元或者为用以操作向量数据的可编程协处理器。
[0039]本地队列可以为具有期望长度如4至8条指令的先入先出(FIFO)队列。它也可以为任意其他类型的合适队列。
[0040]根据本发明实施例的处理器对于数字信号处理器尤其是基带处理器而言特别有用。前端单元可以为模拟前端单元,其设置为用以发送和/或接收射频或基带信号。
[0041]这种处理器广泛用于不同类型的通信设备中,例如移动电话、电视接收器和线缆调制解调器。因此,基带通信设备可设置用于蜂窝通信网络的通信,例如作为移动电话或者移动数据通信设备。基带通信设备也可设置用于根据其他无线标准例如蓝牙或者WiFi的通信。它也可以为电视接收器、线缆调制解调器、WiFi调制解调器,或者能够向其处理器发送基带信号的任意其他类型的通信设备。应该理解术语“基带”仅指处理器内部处理的信号。实际接收和/或发送的通信信号可以为在有线或无线连接上接收的任意合适类型的通信信号。这些通信信号通过该设备的前端单元以适当的方式转换为基带信号。
【专利附图】

【附图说明】
[0042]以下通过举例并参照附图对本发明进行更详细的说明。
[0043]图1为包括基带处理器的典型移动终端的系统概图;
[0044]图2显示了 SIMT架构的示例;
[0045]图3为根据本发明实施例的基带处理器的框图;
[0046]图4为显示图2中处理器内核的一个实施例的指令发出管线的示意图;
[0047]图5显示了 SMT处理器内的指令发出逻辑;
[0048]图6显示了根据现有技术的SMT单元;
[0049]图7显示了具有本发明总体实施例的附加特征的SMT单元;
[0050]图8显示了根据本发明优选实施例的SIMT单元;
[0051]图9显示了根据本发明实施例的本地队列的工作原理。
【具体实施方式】
[0052]图1显示了包括将作为本发明主题的基带处理器3的示例性移动终端I。如本领域常见的,终端I包括用于接收和发射通信信号的装置。在本示例中,该装置包括连接到模拟前端单元7上的天线5,该模拟前端单元7包括针对接收方向的模数转换器ADC,以及针对发射方向的数模转换器DAC。模拟前端单元7连接到基带处理器3上。如本领域常见的,基带处理器3通常包括(但不是必需)前向纠错(FEC)处理器9,以实现诸如交织、维特比解码等纠错功能。基带处理器3通常又连接到MAC单元11上,而该MAC单元11又连接到应用处理器13上。
[0053]终端I通常具有(但不必需)将基带处理器、MAC单元11和应用处理器13进行互连的总线和存储子系统15。该终端还包括用于用户输入/输出的外围接口 17,通常包括键盘、摄像头接口以及用于连接到其他单元的接口如USB接口。
[0054]如本领域技术人员将会理解的,所述模拟前端可设置为用以处理包括射频信号、基带信号以及其他信号的任意类型的输入和输出信号,并向基带处理器3提供基带信号。
[0055]图2显示了根据SMT架构的基带处理器200的示例。处理器200包括控制器内核201、第一向量执行单元203以及第二向量执行单元205,以下将对其详细讨论。如图1中描述的FEC单元206连接至片上网络。当然,在具体实现中FEC单元206可包括几个不同的单元。
[0056]主机接口单元207提供到图1所示的主机处理器的连接(图2未示出)。如果MAC处理器按图1所示那样提供,那么将该MAC处理器连接在主机接口单元207与主机处理器之间。数字前端单元209以现有技术公知的方式提供到图1所示的ADC/DAC单元的连接。
[0057]如本领域常见的,控制器内核201包括程序存储器211以及指令发出逻辑和多环境支持功能。针对各个支持的执行环境或者线程,其包括程序计数器、堆栈指针和寄存器文件(在图2中未明确示出)。通常支持2-3个线程。[0058]控制器核心201也包括整数执行单元212,该整数执行单元包括寄存器文件RF、内核整数存储器ICM、乘法器单元MUL以及算术逻辑/移位单元(ALSU, Arithmetic andLogic/Shift Unit)。ALSU也可实现为两个单兀,算术单兀(Arithmetic Unit)和逻辑移位单元(Logic and Shift Unit)。这些单元是本领域中已知的,因此未在图2中示出。
[0059]本示例中的第一向量执行单元203为CMAC向量执行单元,包括向量控制器213、向量载入/存储单元215以及多个数据通路217。第一向量执行单元的向量控制器通过发出逻辑连接至控制器内核201的程序存储器211,以接收与来自程序存储器的指令相关的发出信号。如上所述,发出逻辑对指令字解码以获得发出信号并将该发出信号做为单独的信号发送至向量执行单元。也可使向量执行单元的向量控制器在本地生成发出信号。在本示例中,发出信号是由向量控制器基于指令字以与发布逻辑中相同的方式而产生的。
[0060]第二向量执行单元205为包括向量控制器223、向量载入/存储单元225以及多个数据通路227的CALU向量执行单元。第二向量执行单元的向量控制器223也通过发出逻辑连接至控制器内核201的程序存储器211,以接收与来自程序存储器的指令相关的发出信号。
[0061]数据通路217,227和向量载入/存储单元215,225的功能将在下文中讨论。
[0062]向量执行单元可设置为任意数量,包括仅CMAC单元、仅CALU单元或者适当数量的各种类型单元。也可具有除了 CALU和CMAC之外的其他类型的向量执行单元。如上所述,向量执行单元是能够处理向量指令的处理器,这意味着单个指令完成对多个数据单元的同一功能。数据可以为复数或实数,并且其被分组为字节或字,进而封装为由向量执行单元操作的向量。在本文中,虽然CALU和CMAC用作示例,但应注意的是向量执行单元可用于针对数据向量完成任合合适的功能。
[0063]为使多个向量操作同时发生,处理器优选具有分布式存储系统,其中存储器分为多个存储体,在图2中表示为第O存储体230至第N存储体231。各个存储体230,231分别具有各自的复数存储器232,233,以及地址生成单元AGU234,235。由于可并行进行多地址计算,因此这种设置结合片上网络提高了存储系统的功效和处理器的处理容量。图2中的PBBP也包括一个或多个整数存储体238,其包括存储器239和地址生成单元240。
[0064]如本领域已知的,通常可连接若干加速器242,因为其能有效实施诸如信道编码和交织的某些基带功能。这种加速器在本领域中是公知的,因此这里不再赘述。加速器是可配置的以根据多种不同标准重复使用。
[0065]片上网络244连接控制器内核201、数字前端单元209、主机接口单元207、向量执行单元203,205、存储体230,232、整数存储体238和加速器242。
[0066]各个向量执行单元203,205包括向量载入/存储单元215,225,其设置为用作网络端口和向量执行单元的数据通路之间的接口。执行单元203,205通常通过网络244连接至存储体230,231,但是也可支持到其他单元如加速器242和其他向量执行单元的连接。载入功能用于从连接到网络244的其他单元(例如从存储体)提取数据,而存储功能用于通过网络244将数据从执行单元203,205存储到例如存储单元230,231中。数据也可从其他向量执行单元获取,和/或计算结果可转发至其他向量执行单元以进行进一步处理。各个向量执行单元还包括向量控制器213,223,其设置为用以接收来自程序存储器PM211的指令。向量载入单元215,225可采用两种不同模式载入数据。在第一种模式中,如上所述,可从多个存储体230,232或其他来源加载多个数据项。在另一种模式中,一次可加载一个数据项,然后分发至给定执行单元中的SMD数据通路。后一模式可在执行单元处理连续数据时用于减少访问存储器的次数。
[0067]在图示的实施例中,如本领域常见的,第二向量执行单元205显示为包括四条独立的数据通路227的四路复杂ALU,每条通路具有复杂短乘法器-累加器(CSMAC,complexshort multiplier-accumulator)。CALU205可执行向量指令,在下文中将作更详细的描述。在一个实施例中,CALU205尤其适于执行复向量指令。CALU205的独立数据通路227中的每个通路还可同时执行复向量指令。
[0068]第一向量执行单元203显示为具有可同时运行或分别运行的四条复数据通路的四路CMAC。四条复数据通路包括乘法器、加法器和累加寄存器(图2中未全部示出)。因此,在本实施例中,CMAC203可称为四路CMAC数据通路。除乘法和加法外,CMAC203还可执行取整和比例操作并支持饱和度,如本领域中已知的那样。
[0069]在一个实施例中,CAMC203操作可划分为多个管线步骤。另外,四条复数据通路217中的各条通路可在一个时钟周期内计算复数乘法和累加。CMAC203 (即四条数据通路一起)可在N/4时钟周期内执行N元向量的操作,以支持复向量计算(例如复卷积、共轭复卷积和复向量的点积)。进一步地,CMAC203也可支持对累加器寄存器中存储的复数值的操作(例如复数加法、减法、共轭等)。例如,CMAC203可在一个时钟周期内计算诸如(AR+JAI)*(BR+JBI)的复数乘法以及在一个时钟周期内计算复数累加,并支持复向量计算(例如复数卷积、共轭复数卷积和复向量的点积)。
[0070]在一个实施例中,针对处理器内核201的指令集架构可包括三类复合指令。第一类指令为RISC指令,其对16位整数操作数进行操作。RISC指令类包括大多数面向控制的指令,并且可在处理器内核201的整数执行单元212中执行。下一类指令为DSP指令,其处理具有实数部分和虚数部分的复值数据。该DSP指令可在一个或多个向量执行单元203,205上执行。第三类指令为向量指令。向量指令可认为是DSP指令的扩展,因为其操作大数据集并使用先进的寻址模式和向量支持。向量指令可处理复数或实数数据类型。
[0071]图3为根据本发明的实施例的基带处理器PBBP200的框图。PBBP200包括处理器内核,其包括RISC类型的执行单元,并用RISC数据通路510表示。PBBP还具有多个向量执行单元520,530,各个单元分别包括向量控制单元275和SMD数据通路525,535。如本领域常见的,各条数据通路525,535可包括若干数据通路。例如,数据通路535通常可具有四条并行的CMAC数据通路,它们共同构成数据通路525。
[0072]为了对多个向量执行单元进行控制,内核硬件500包括耦合至程序计数器502的程序流控制单元501,该程序计数器502又耦合至程序存储器(PM)503。PM503耦合至复用器504、单元字段提取器508。复用器504耦合至指令寄存器505,其耦合至指令解码器506。指令解码器506进一步耦合至控制信号寄存器(CSR)507,其又耦合至RISC数据通路510的剩余部分。
[0073]类似的,向量执行单元520和530中的每一个还设置为用以接收来自位于内核的程序存储器503的指令。向量执行单元包括各自的向量长度寄存器521,531、指令寄存器522,532、指令解码器523,533以及CSR524,534,它们耦合至各自的数据通路525和535。以下结合图5将会更详细地就与本发明相关的方面说明这些单元及其功能。[0074]图4为现有技术中处理从程序存储器到不同向量执行单元的指令的示例,用以说明本发明的基本问题。图4左列表示时间(单位为执行时钟周期)。其余列从左向右依次表示第一和第二向量执行单元(更确切地说是CMAC203和CALU205的数据通路)和整数执行单元的执行管线以及发到此处的指令。更具体地说,在第一时钟周期内,复向量指令(如CMAC256)被发到CMAC203。如图所示,向量指令需要多个周期来完成。在下一时钟周期里,向量指令被发到CALU205。在下一时钟周期里,整数指令被发到整数执行单元510。在随后的几个周期内,当执行向量指令时,可将任意数量的整数指令发到整数执行单元510。要注意的是,尽管图中未示出,其余向量执行单元也可以相似的方式同时执行指令。
[0075]在某些情况下,“空闲(idle)”指令可包括在指令序列中,以阻止内核程序流控制器从程序存储器提取指令。例如,为了使程序流与向量指令的完成同步,“空闲”指令可用于将指令的提取挂起直到特定条件已满足为止。该条件通常是涉及的向量执行单元已执行完在先的向量指令并能接收新的指令。在此情况下,涉及的向量执行单元520,530的向量控制器275向程序流控制器501发送诸如标志的指示,表示该向量执行单元准备好接收另一指令。
[0076]空闲指令可在同一时刻用于多个向量执行单元。在此情况下,不再从程序存储器503发送进一步的指令,直到涉及的向量执行单元520,530中的每一个单元已发送了指示其准备好接收新指令的标志为止。
[0077]在图4的示例中,“空闲”指令在上述整数指令之后发出。在本示例中,空闲指令用于中止控制流直到由CMAC203执行的向量操作完成为止。
[0078]接下来将基于具有任意数量的执行单元的SIMT DSP来讨论随后的示例。为简单起见,本示例中假设全部单元为CMAC向量执行单元,但实际上不同类型的单元可混合并一起使用。
[0079]在许多基带处理算法和程序中,算法可分解为若干DSP任务,分别包括“前言(Prolog)”、向量操作和“结语(epilog)”。前言主要用于在向量操作可执行之前清空累加器、设定寻址模式和指针以及类似操作。当向量操作已完成时,向量操作的结果可进一步由任务中“结语”部分的代码处理。在SMT处理器中,通常只需要一条向量指令来完成向量操作。
[0080]以下通过根据现有技术的示例性任务来举例说明一个DSP任务的典型布局:
[0081]本示例中的代码片段执行超过512个复数数值的复数点积运算,然后再次将结果
存储到存储器中。该例程要求由处理器内核提取如下指令。
[0082]
【权利要求】
1.一种用于数字信号处理器(200)的向量执行单元(203,205,520,530),所述向量执行单元设置为用以执行指令,所述指令包括要对向量形式的多个数据进行操作的向量指令,所述向量执行单元包括向量控制器(720,720’),其设置为用以判断指令是否为向量指令,若是,通知设置为用以保存向量长度的计数寄存器(721),所述向量控制器(720,720’)进一步设置为用以控制指令的执行, 所述向量执行单元的特征在于 -其包括本地队列(730),所述本地队列设置为用以从程序存储器接收至少第一和第二指令,并在本地队列中保存所述第二指令直到满足预定条件,以及 -所述向量控制器(720,720’)包括设置为用以控制所述本地队列的队列控制装置(732,721)。
2.根据权利要求1所述的向量执行单元,其中,所述向量执行单元进一步设置为用以接收发出信号并基于所述发出信号控制指令的执行。
3.根据权利要求1或2所述的向量执行单元,其中,所述向量执行单元进一步包括 -指令寄存器(722),其设置为用以接收并存储指令, -指令解码器(723 ),其设置为用以解码存储在指令寄存器中的指令, -由所述指令解码器控制的多条数据通路。
4.根据上述权利要求中任一项所述的向量执行单元,其中,所述本地队列(730)设置为用以暂停指令的读取直到所述数据通路准备好接收并执行另一指令为止。
5.根据上述权利要求中任一项所述的向量执行单元,其中,所述队列控制装置(732)包括队列控制器,其设置为用以保存与队列相关的如本地队列(730)的排满程度的状态信息,并用以控制从本地队列(730)到向量执行单元(203,205, 520, 530)的指令的发送以便执行。
6.根据权利要求5所述的向量执行单元,其中,所述队列控制器设置为,如果新指令发送至该队列并且该队列是排满的,则生成错误信息。
7.根据权利要求6所述的向量执行单元,其中,所述队列控制装置(732)设置为用以发出特定信号,该特定信号指示本地队列暂停从本地队列中读取指令直到满足条件为止。
8.根据上述权利要求中任一项所述的向量执行单元,其中,所述向量控制器(720,720’)设置为用以产生将要发送至所述数字信号处理器的程序流控制器(703)的信号,以指示该单元准备好接收新的指令。
9.根据上述权利要求中任一项所述的向量执行单元,其中,所述指令解码器(723)设置为用以向所述向量控制器(720,720’)通知任意给定时刻正在执行的指令。
10.根据上述权利要求中任一项所述的向量执行单元,其中,本地队列(730)为先进先出队列。
11.一种数字信号处理器(200),其中,包括: -处理器内核(201),包括配置为用以执行整数指令的整数执行单元(212);以及 -与处理器内核(201)分开并与其连接的至少第一和第二向量执行单元(203,205,520,530),其中每个向量执行单元(203,205)为根据以上任一项权利要求所述的向量执行单元; -所述数字信号处理器包括程序存储器(211)和发出逻辑,其中,程序存储器配置为用以保存用于第一和第二向量执行单元(203,205)的指令,发出逻辑用于向所述第一和第二向量执行单元发出包括向量指令的指令。
12.根据权利要求11所述的数字信号处理器,其中,所述程序存储器(211)还设置为用以为所述整数执行单元(212)保存指令。
13.根据权利要求11或12所述的数字信号处理器,其中,所述程序存储器(211)设置在所述处理器内核(201)中。
14.一种适用于多模有线和无线通信的基带通信设备,包括 -配置为发送和/或接收通信信号的前端单元(7); -耦合至所述模拟前端单元的可编程数字信号处理器(3),其中所述可编程数字信号处理器为如权利要求9-12中任一项所述的数字信号处理器。
15.根据权利要求14所述的基带通信设备,其中,前端单元(7)为模拟前端单元,其设置为用以发送和/或接收射频或基带信号。
16.根据权利要求14或15所述的基带通信设备,其中,所述基带通信设备用于如蜂窝通信网络的无线通信网络中的通信。
17.根据权利要求14所述的基带通信设备,其中,所述基带通信设备为电视接收器。
18.根据权利 要求14所述的基带通信设备,其中,所述基带通信设备为线缆调制解调器。
【文档编号】G06F9/30GK103890718SQ201280051515
【公开日】2014年6月25日 申请日期:2012年9月17日 优先权日:2011年10月18日
【发明者】安德斯·尼尔森 申请人:联发科技瑞典有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1