一种高速低功耗的近似4-2压缩器的制作方法

文档序号:16246200发布日期:2018-12-11 23:36阅读:393来源:国知局
一种高速低功耗的近似4-2压缩器的制作方法

本发明属于集成电路技术领域,具体涉及一种高速低功耗的近似4-2压缩器。

背景技术

在集成电路领域,对于低功耗设计一直是一个非常严峻的挑战,研究者们从工艺、器件和电路等多个方面来降低电路的功耗。尤其随着便携式设备和物联网的兴起,更低的功耗就意味着设备可以在有限的能量下有效运转更长的时间。于是,近似计算逻辑作为一种通过牺牲一定计算精度,可以大幅降低电路复杂度和电路功耗的设计方法开始逐渐被人们采用,这种方法需要系统具有容错性,常见的应用场合包括数字信号处理、多媒体、模糊逻辑、神经网络、数据挖掘等。

乘法器一直是许多应用的基本运算单元,对应用电路的延迟、功耗、面积等有很大的影响。目前较常见的树型乘法器先通过与门阵列或布斯编码的部分积产生模块产生部分积;再使用半加器、全加器、4-2压缩器等压缩单元构成树形部分积压缩模块,把部分积产生模块的输出压缩成两行部分积。其中,树形部分积压缩模块往往占据着乘法器中最大的面积、最长的延迟和最多的功耗;同时,4-2压缩器相比全加器和半加器有更高的压缩效率,在快速乘法器的树形压缩部分被广泛使用。因为树形部分积压缩模块在面积、延迟和功耗方面占据最大的比例,所以优化乘法器的树形部分积压缩模块是至关重要的。

传统的精确4-2压缩器通常组成较为复杂,如图1所示是一种常用的实现精确4-2压缩器运算逻辑的门级电路图,有74根晶体管。用两个全加器构成一个精确4-2压缩器也是常见的方法,其结构图如图2所示,其中如图3所示是一种典型的28管全加器结构图,则两个全加器结构的精确4-2压缩器有56根晶体管,这种结构依然具有较高的复杂度,且比图1结构的传统门级4-2压缩器具有更长的延迟。



技术实现要素:

针对上述传统精确4-2压缩器存在的结构复杂、延迟长和功耗大等问题,本发明提出了近似4-2压缩器,并给出了近似4-2压缩器的两种电路实现形式,与传统精确4-2压缩器相比具有更简单的电路结构、更低的延迟和功耗,能够用于乘法器的树形压缩模块,使乘法器在保证一定精度的情况下大大降低复杂度和功耗。

本发明的技术方案为:

一种高速低功耗的近似4-2压缩器,其中一种实现形式包括第一与非门nand1、第二与非门nand2、第三与非门nand3、第四与非门nand4、第一或门or1、第一或非门nor1、第一异或门xor1和第二异或门xor2;

第一与非门nand1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第三与非门nand3和第一或门or1的第一输入端;

第二与非门nand2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第三与非门nand3和第一或门or1的第二输入端;

第三与非门nand3的输出端输出第一输出信号carry;

第一异或门xor1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第一或非门nor1的第一输入端;

第二异或门xor2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第一或非门nor1的第二输入端;

第四与非门nand4的第一输入端连接第一或门or1的输出端,其第二输入端连接第一或非门nor1的输出端,其输出端输出第二输出信号sum。

一种高速低功耗的近似4-2压缩器的另一种实现形式,包括第五与非门nand5、第六与非门nand6、第七与非门nand7、第一与门and1、第二与门and2、第三与门and3、第二或门or2、第三或门or3、第三异或门xor3和第四异或门xor4;

第五与非门nand5的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第七与非门nand7的第一输入端;

第六与非门nand6的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第七与非门nand7的第二输入端;

第七与非门nand7的输出端输出第一输出信号carry;

第一与门and1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第三与门and3的第一输入端;

第二与门and2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第三与门and3的第二输入端;

第三异或门xor3的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第二或门or2的第一输入端;

第四异或门xor4的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第二或门or2的第二输入端;

第三或门or3的第一输入端连接第三与门and3的输出端,其第二输入端连接第二或门or2的输出端,其输出端输出第二输出信号sum。

本发明的有益效果为:与传统精确4-2压缩器相比具有更低的硬件复杂度,具有高速和低功耗的特点,适用于要求低延迟、低功耗且可以容忍一定误差的运算场景。

附图说明

图1为传统的精确4-2压缩器的门级电路图。

图2为传统的由两个全加器构成的精确4-2压缩器的结构示意图。

图3为一种28管的全加器的电路结构示意图。

图4为本发明中提出的一种高速低功耗的近似4-2压缩器的一种电路实现示意图。

图5为本发明中提出的一种高速低功耗的近似4-2压缩器的另一种电路实现示意图。

图6是本发明提出的一种高速低功耗的近似4-2压缩器的真值表。

具体实施方式

下面结合附图和具体实施例详细描述本发明的技术方案。

如图1和图2所示,传统的精确4-2压缩器都有5个输入(分别是第一输入信号x1、第二输入信号x2、第三输入信号x3、第四输入信号x4和cin信号)和3个输出(分别是第一输出信号carry、第二输出信号sum和cout信号),其中第一输入信号x1、第二输入信号x2、第三输入信号x3、第四输入信号x4与第二输出信号sum具有相同的权重,第一输出信号carry的权重是第二输出信号sum权重的2倍,精确4-2压缩器接收一个来自前一个4-2压缩器产生的二进制数值cout作为其cin信号,并输出一个cout信号到后一个4-2压缩器,传统4-2压缩器的功能表达式为:

x1+x2+x3+x4+cin=sum+2(carry+cout)

本发明提出的近似4-2压缩器首先将cin信号和cout信号同时取消,与传统精确4-2压缩器相比简短了关键路径和延迟时间,因此本发明提出的近似4-2压缩器的功能表达式为:

x1+x2+x3+x4=sum+2carry

此时,当第一输入信号x1、第二输入信号x2、第三输入信号x3、第四输入信号x4都为1的时候,等式是必然不成立的。其他情况下,如果满足上面的等式,本发明提出的近似4-2压缩器就能精确的完成计算。

本发明中的近似4-2压缩器真值表如图6所示,其中第一输入信号x1、第二输入信号x2、第三输入信号x3、第四输入信号x4与第二输出信号sum具有相同的权重,第一输出信号carry的权重是第二输出信号sum权重的2倍;在确定真值表时,假定乘法器输入概率为1的概率为“1/2”的情况下,可以得到第一输入信号x1、第二输入信号x2、第三输入信号x3和第四输入信号x4每种情况发生的概率。为了在化简电路时不引入过大的误差,采用了以下思路:首先,需要避免在高概率输入情况下的近似,通过这种方式可以控制错误的概率。其次,一些情况下(第一输出信号carry与第二输出信号sum的精确值不同时为1)第一输出信号carry与第二输出信号sum的误差可以相互补偿,通过这种方式可以使误差发生时实际产生的误差不会过大。例如当输入为“1000”且准确值为1时,如果第一输出信号carry近似为“1”,第二输出信号sum依然为1的话,则近似值为3,准确值与近似值之间的差值为2,通过将第二输出信号sum近似为“0”,误差可以减少到1。在上述方法下,只有在精确值为1和2的情况下,第一输出信号carry和第二输出信号sum的误差可以相互补偿,选取其中输入情况的发生概率较小的情况,并考虑用较简单的电路实现第一输出信号carry的输出功能,可以得到图6所示的真值表。

对于与门产生部分积的乘法器,假设乘数和被乘数任一位为“1”的概率是1/2,则部分积的任一位为“1”的概率是1/4,则当4-2压缩器输入确定的情况下其产生的概率如图6所示。图6中的误差定义为近似值与精确值的差。通过图6可以看出,近似4-2压缩器用于与门阵列产生部分积的第一级压缩,只有在第一输入信号x1、第二输入信号x2、第三输入信号x3和第四输入信号x4为0101、0110、1001、1011和1111时会产生误差,每种情况出现的概率分别为9/256、9/256、9/256、9/256和1/256,则产生误差的概率较低只有37/256,并且产生的误差都很小。

等价地,根据图6所示的真值表可以得到本发明所提出的近似4-2压缩器的逻辑表达式为:

一种可以实现上述逻辑表达式的电路结构如图4所示,包括第五与非门nand5、第六与非门nand6、第七与非门nand7、第一与门and1、第二与门and2、第三与门and3、第二或门or2、第三或门or3、第三异或门xor3和第四异或门xor4;第五与非门nand5的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第七与非门nand7的第一输入端;第六与非门nand6的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第七与非门nand7的第二输入端;第七与非门nand7的输出端输出第一输出信号carry;第一与门and1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第三与门and3的第一输入端;第二与门and2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第三与门and3的第二输入端;第三异或门xor3的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第二或门or2的第一输入端;第四异或门xor4的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第二或门or2的第二输入端;第三或门or3的第一输入端连接第三与门and3的输出端,其第二输入端连接第二或门or2的输出端,其输出端输出第二输出信号sum。

将图4中第二输出信号sum对应的电路结构通过德·摩根定律进行了等价转化可以得到近似4-2压缩器的另一种优化电路实现结构,如图5所示,优化后的4-2压缩器包括第一与非门nand1、第二与非门nand2、第三与非门nand3、第四与非门nand4、第一或门or1、第一或非门nor1、第一异或门xor1和第二异或门xor2;第一与非门nand1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第三与非门nand3和第一或门or1的第一输入端;第二与非门nand2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第三与非门nand3和第一或门or1的第二输入端;第三与非门nand3的输出端输出第一输出信号carry;第一异或门xor1的第一输入端连接第一输入信号x1,其第二输入端连接第二输入信号x2,其输出端连接第一或非门nor1的第一输入端;第二异或门xor2的第一输入端连接第三输入信号x3,其第二输入端连接第四输入信号x4,其输出端连接第一或非门nor1的第二输入端;第四与非门nand4的第一输入端连接第一或门or1的输出端,其第二输入端连接第一或非门nor1的输出端,其输出端输出第二输出信号sum。

转化后第二输出信号sum的逻辑表达式为:

虽然逻辑表达式看上去复杂了,但对应电路图得到了简化,门的数量进一步减小,并且用更多的与非逻辑和或非逻辑可以减少晶体管数量,缩短关键路径。

根据数字电路的基本知识可知,反相器包括2根晶体管,二输入与非门包括4根晶体管,与门包括6根晶体管,或非门包括4根晶体管,或门包括6根晶体管,异或门包括6根晶体管,异或非门包括6根晶体管。则图1所示的经过门级优化的传统精确4-2压缩器有74根晶体管,图2所示的由两个28管全加器构成的传统精确4-2压缩器有56根晶体管,本发明提出的图4结构的近似4-2压缩器有54根晶体管,而本发明提出的图5结构的近似4-2压缩器只有38根晶体管,可以看出相比传统的精确4-2压缩器,本发明提出的近似4-2压缩器具有更少的晶体管,经过实验仿真得出面积减少了47.3%,延迟时间降低了58.8%,功耗降低了68.2%,能耗降低了86.89%。

综上所述,本发明提出的近似4-2压缩器,取消了精确4-2压缩器的cout信号和cin信号,减短了4-2压缩器的关键路径和延迟时间,提高了运算速度;在传统精确4-2压缩器的基础上进行了逻辑近似,得到了近似逻辑表达式并给出了图4所示的该近似逻辑表达式的一种电路实现形式,对该近似表达式进行等价变化得到图5所示的更加简化的电路结构;通过优化电路结构减少了使用的晶体管,与传统精确4-2压缩器相比具有更低的硬件复杂度,从而具有更低的延迟和功耗;经过实验仿真得到,图5结构的近似4-2压缩器与图2所示的传统精确4-2压缩器相比,面积减少了47.3%,延迟时间降低了58.8%,功耗降低了68.2%,能耗降低了86.89%。

值得说明的是,虽然本发明只给出了两种近似4-2压缩器的电路实现形式,但是本发明提出的近似4-2压缩器不仅有这两种实现形式,其他基于本发明的转换思想得到的近似4-2压缩器的优化形式仍然在本发明的保护范围内。本发明适用于要求低延迟、低功耗、且可以容忍一定误差的运算场景,将本发明提出的近似4-2压缩器用于乘法器的树形压缩模块中代替传统精确4-2压缩器,可以使乘法器在保证一定精度的情况下大大降低复杂度,同时降低了乘法器的延迟和功耗。

本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1