一种处理器的制作方法

文档序号:6342711阅读:133来源:国知局
专利名称:一种处理器的制作方法
技术领域
本实用新型涉及一种处理器。
背景技术
在信号处理中,为了提高处理速度,数字信号处理器已经配备了地址生成单元,这 些地址生成单元根据当前地址来生成下一个地址。有些地址生成单元支持几种寻址方式, 其利用多个寄存器来计算地址。用于处理信号的处理器包括四个相同的处理元件,其中每个处理元件都具有多个 功能单元,每个处理元件都包括作为功能单元的地址生成单元。地址生成单元支持七种寻 址方式直接寻址、基址加偏址寻址、间接/变址寻址、基址加变址寻址、环形变址寻址和处 理元件相对寻址,对于每个寻址方式而言,都利用寄存器来计算地址。指令包括每个处理元件的指令槽。将寻址方式表示为指令的一部分,寄存器属于 处理器上下文的一部分,并且能够像作为该上下文的一部分的其它寄存器被加载、保护和 恢复。与用于存储的宽存储器相结合地使用处理器,每个存储行存储一个指令。对于每条 所取出的并且被直接馈送到译码逻辑并控制多重执行单元的执行的指令,要访问存储器。已知的处理器的处理元件是单指令多数据流处理器,亦称矢量处理器,对于信号 处理而言,矢量处理器潜在地具有很高的性能。往往要求这种性能的信号处理任务,像用于 移动通信标准的软件调制解调器,通常是能够被矢量化的多个子任务组成的,矢量处理会 导致这类子任务相对快速地加以完成,在这个上下文中完成也涵盖已经处理了一个数据块 以及在不久的时刻将为新数据块重新开始处理(通常是在固定周期数内)的情形,因此,子 任务之间的切换也相对频繁地发生。上下文切换要求用于当前停止的任务的一个或多个 当前寄存器保存起来,并且把用于新激活的或重新激活的任务所保存的寄存器都加载到所 涉及的相关寄存器中。但是随着处理器性能的增加,在配置地址生成单元的寄存器上花费的时间日渐变 成了瓶颈,在常规的处理器结构中,在一个存储器周期内只能保存或恢复一个寄存器,这导 致在等待将利用正确数据来初始化(配置)的地址生成单元的过程中浪费了很多时间。

实用新型内容本实用新型的目的在于提出一种处理器,能够更好地用于高性能任务,特别是用 于移动通信系统的信号处理。为达此目的,本实用新型采用以下技术方案一种处理器,包括1个存储器端口、不少于1个处理单元、地址生成单元和存储器 单元,所述处理单元和所述地址生成单元分别与所述存储器端口连接,所述存储器端口与 所述存储器单元连接。还包括不少于2个寄存器,所述不少于2个寄存器与所述地址生成单元连接。还包括不少于1个地址生成单元,所述地址生成单元与所述寄存器一对一关联。[0012]采用了本实用新型的技术方案,能够在消费者电子设备应用中,特别是移动通信 使用中,实现显著的加速。

图1是本实用新型具体实施方式
中处理器的结构示意图。
具体实施方式

以下结合附图并通过具体实施方式
来进一步说明本实用新型的技术方案。图1是本实用新型具体实施方式
中处理器的结构示意图。如图1所示,该处理器 包括1个存储器端口、多个处理单元、多个地址生成单元、多个寄存器和存储器单元,处理 单元和地址生成单元分别与存储器端口连接,存储器端口与存储器单元连接,多个寄存器 与地址生成单元连接,多个地址生成单元与多个寄存器一对一对应关联。随着处理器性能的增加,在配置地址生成单元的寄存器上花费的时间日渐变成了 瓶颈,在常规的处理器结构中,在一个存储器周期内只能保存或恢复一个寄存器,这导致在 等待将利用正确数据来初始化(配置)的地址生成单元的过程中浪费了很多时间,为了克 服这个问题,要能够保存至少两个寄存器,这是由一个用于保存或恢复一些或所有地址生 成单元寄存器的操作-比如上下文切换或显示指令来加以触发的。为此,处理器的存储器 单元包括一个连接器和分割器,用于多个地址生成单元寄存器映射到一个存储器字上。根 据本实用新型的地址生成单元和存储器单元原则上能够用在任何处理器中,优选地,地址 生成单元和存储器单元都用在矢量处理器中。迄今为止,矢量处理器没有被广泛地用于信 号处理。这就是说,这一部分的原因是由如下事实所引起的,因为常规矢量处理器结构对于 不可100%矢量化的应用而言是低效的,这意味着当50%的代码能被矢量化时,实现了小 于2的总加速(而不是理论上的最大加速32)。这是因为仍有50%的代码不能被矢量化, 由此不能为这部分代码实现加速,即使90%的代码能被矢量化,加速也仍然小于因数8。为 了供消费者电子设备应用中使用,特别是供移动通信中使用,如果能够实现显著的加速,则 只能证明使用矢量处理器的额外成本是合理的,根据本实用新型的地址生成单元和存储器 单元有助于通过为处理数据和/或指令循环提供最佳的支持以及有效地处理跳转和上下 文切换来实现。存储器单元可操作来在物理存储器的一个读/写周期内执行保存/加载。照此, 能够快速地进行地址生成单元配置。优选地,在一个操作中保存/加载所有地址生成单元 寄存器。处理器具有几组寄存器,其中每组寄存器都使地址生成单元能生成地址。具备了 提高的性能,处理器就能够并行地执行更多的任务,并由此能够得益于使用一组以上的寄 存器,对于数据或指令循环的有效处理而言,可以每个循环都使用一组寄存器,为了加速配 置多个组,能够通过将几组寄存器都连接到一个存储器字,来在一次操作中保存一组以上 的寄存器,处理器可以具有几个地址生成单元,其中每个地址生成单元都具有它自己的寄 存器组,不同的地址生成单元在功能上可以是相同的(由此具有相同数量的寄存器)。如果 期望这样的话,则就可以将不同的地址生成单元分配给不同的地址计算方案,且因此不同 的地址生成单元可以具有不同数量的寄存器。优选地,能够利用一个存储器字而在一个操作中保存/加载至少两个地址生成单元中的所有寄存器,作为选择,地址生成单元也可以 与一组以上的寄存器相关联,其中每个组寄存器都优选地,在为信号处理而最优化的处理 器中使用地址生成单元和存储器单元,这类处理器可以是任何其它适合的处理/微控器。 在能力非常强的标量/矢量处理器中使用所述单元,可以独立地或与另一个处理器相结合 地使用这类处理器。三个主要组件都经由总线相连,连接这三个组件的总线可以是任何适合的总线, 主要组件包括功能单元和局部数据存储器的可编程标量/矢量处理器、包括有限芯片内程 序和数据存储器的微控制器或接口块。标量/矢量处理器主要用于内部循环的处理,该标量/矢量处理器包括矢量处理 功能,照此,它为将要执行的可矢量化的部分代码提供了大规模的并行性,所有信号处理的 绝大多数都将有标量/矢量处理器的矢量部分加以执行。例如,使用一个执行相同指令的 32个相同处理元件阵列的话,它提供了高度的并行性。同32字的宽存储器接口组合起来, 这以低成本和适度的功耗达成了前所未有的可编程性能级别。然而,完全地利用这种并行 性并不总是可行的,因为许多算法都没有呈现正确形式的充足的数据并行性。在使可直接 矢量化额代码部分矢量化之后,大部分的时间都花费在其余代码上,其余代码能够分成四 类地址相关的指令(例如利用求模寻址来把指针增加到环形缓冲器中)、规则的标量操作 (即相当于矢量处理器的主循环的标量操作)、循环、不规则的标量操作。用于这些类别中的每一类的小部分代码都高度地依赖于被执行的算法,地址相关 的指令和循环的性能能够通过利用根据本实用新型的地址生成单元/存储器单元得以最 优化。规则的标量操作能够通过将标量和矢量处理紧密地集成在一个处理器中而得以最优 化,对于调制解调器的所有相关算法的研究都已经显示出小部分的不规则标量操作时非常 有限的。这种特性使标量/矢量处理器与微控器之间的任务能被分开,其中独立的微控制 器执行不规则的任务,并且最后也控制标量/矢量处理器和微控制器之间的接口(例如,经 由共享存储器)处理通信和(例如,经由共享存储器和状态信号)处理同步。接口最好是 存储映像式的。接口块允许处理器与系统的其余部分进行交互。在优选实施例中,标量/矢量处 理器用作为移动网络的软件调制解调器(收发器)。对于这类软件调制解调器功能来讲,接 口块可以包括作为前端的专用硬件,其主要任务就是在微控制器的控制之下把控制字和数 据字传递给矢量存储器,然后,由标量/矢量处理器处理矢量存储器中的数据。标量/矢量处理器可以是到总线的从设备,而微控制器和接口块可以充当主设 备,所有的通信(它可以是程序、数据或控制)都最好是存储映像式的。处理器包括流水线式矢量处理部分,为了支持该矢量部分的操作,标量/矢量处 理器包括被设置成并行地对该矢量部分进行操作的标量处理部分。优选地,该标量处理部 分也是流水线式的。为了支持矢量部分的操作,矢量部分的至少一个功能单元也提供相应 的标量部分的功能,例如,移位功能单元的矢量部分在功能上可以对矢量进行移位,其中由 移位功能单元的标量部分来提供标量分量(或者将标量分量传送至移位功能单元的标量 部分)。照此,移位功能单元既涵盖矢量部分由涵盖标量部分,其中矢量部分和标量部分能 够通过交换标量数控来协同操作。功能单元的矢量部分提供原始的处理能力,其中相应的 标量部分(既,相同功能单元的标量部分)通过支持和/或耗用标量数据来支持矢量部分
5的操作,经由矢量流水线来提供矢量部分的矢量数据。标量/矢量处理器包括下列六个专用功能单元。指令分配单元包含程序存储器,读取连续的指令,并向6个功能单元分配每条指 令的6个分段。优选地,它包含一个支持多达零开销循环的三个嵌套层的循环单元。矢量存储器单元包含矢量存储器,在每条指令期间,它能够从矢量存储器中发送 一行或一个矢量或是将一行接收到矢量存储器中。相同的指令另外还可以规定标量一个发 送操作和/或接收一个操作,是连接外界即连接于外部总线的唯一功能单元。代码生成单元是在有限运算中专用的,例如,代码生成单元能够用于生成代码芯 片的矢量以及相关函数,比如像通道编码。矢量操作单元是在规则的整数和定点运算中专用的,它支持矢量间操作,其中计 算式逐元素地对多个矢量执行的。在一个优选的实施例中,还提供一些矢量内操作,其中对 单个矢量内的元素执行运算。混洗单元能够根据指定的洗牌模式来重新安排矢量的元素。左移位单元能够按单位_比如字、双字或四倍长字对矢量的元素进行向左移位。 把产生的标量提供给她的标量部分。依据发出的矢量操作的类型,所耗用的标量要么是零 要么取自它的标量部分。右移位单元类似于左移位单元,但是向右移位。另外,它具有合并来自矢量内操作 的连续结果的能力。以上所述,仅为本实用新型较佳的具体实施方式
,但本实用新型的保护范围并不 局限于此,任何熟悉该技术的人在本实用新型所揭露的技术范围内,可轻易想到的变化或 替换,都应涵盖在本实用新型的保护范围之内。因此,本实用新型的保护范围应该以权利要 求的保护范围为准。
权利要求一种处理器,其特征在于,包括1个存储器端口、不少于1个处理单元、地址生成单元和存储器单元,所述处理单元和所述地址生成单元分别与所述存储器端口连接,所述存储器端口与所述存储器单元连接。
2.根据权利要求1所述的一种处理器,其特征在于,还包括不少于2个寄存器,所述不 少于2个寄存器与所述地址生成单元连接。
3.根据权利要求2所述的一种处理器,其特征在于,还包括不少于1个地址生成单元, 所述地址生成单元与所述寄存器一对一关联。
专利摘要本实用新型公开了一种处理器,包括1个存储器端口、不少于1个处理单元、不少于1个地址生成单元和存储器单元,所述处理单元和所述地址生成单元分别与所述存储器端口连接,所述存储器端口与所述存储器单元连接。采用了本实用新型的技术方案,能够在消费者电子设备应用中,特别是移动通信使用中,实现显著的加速。
文档编号G06F9/30GK201681380SQ201020156960
公开日2010年12月22日 申请日期2010年4月13日 优先权日2010年4月13日
发明者谭啸 申请人:江苏芯动神州科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1