一种超低功耗且高性能的微处理器及其运行方法

文档序号:9374759阅读:180来源:国知局
一种超低功耗且高性能的微处理器及其运行方法
【技术领域】
[0001]本发明涉及微处理器领域,尤其涉及一种超低功耗且高性能的微处理器及其运行方法。
【背景技术】
[0002]嵌入式微处理器(MCU)是嵌入式系统的核心,是控制、辅助系统运行的硬件单元。根据微处理器的应用领域,微处理器大致可以分为三类:通用高性能微处理器、嵌入式微处理器和数字信号处理器、微控制器,其应用范围极其广阔,从最初的4位处理器,目前仍在大规模应用的8位单片机,到最新的受到广泛青睐的32位、64位嵌入式MCU。目前仍在大规模应用的8位MCU产品的工艺节点一般会停留在较为成熟的、非最先进的工艺节点上,比如说0.13 μπι、0.18 μ m等工艺节点,而且在这些工艺节点上,芯片面积也不是其主要考虑的问题。这些8位MCU产品的主要特征是功耗很低,特别是待机功耗很低,因此适合于低功耗的应用,但是其最佳性能不高,无法满足越来越多的嵌入式应用对微处理器性能的要求,因此为了满足嵌入式应用对微处理器性能的要求,高位宽的微处理器就诞生了,比如32位的微处理器。随着高位宽微处理器技术的成熟,越来越多的应用开始从低位宽的微处理器向高位宽微处理器上移植。
[0003]高位宽的微处理器一般实现在先进的工艺节点上,比如说40nm等先进工艺节点,在这些工艺节点上,为了控制产品的成本,微处理器的面积是一个要考虑的问题,而且在这些先进的工艺节点上,由于模拟电路的面积不会随着工艺节点变小而巨幅缩小,因此会进一步增大微处理器的面积及成本。这些高位宽的微处理器的性能很高,处理嵌入式应用的速度要快于低位宽的微处理器,因此高位宽微处理器的动态功耗要小于低位宽的微处理器,但是这些实现在先进工艺节点的高位宽微处理器的漏电流较大,所以高位宽的微处理器的静态功耗要远远大于低位宽的微处理器,特别是待机功耗很大,因此低功耗对于高位宽的微处理器是一个巨大的挑战,特别是应用于物联网设备和可穿戴设备中的微处理器,如果在先进工艺节点上高位宽的处理器要实现超低功耗,必须采用动态电压频率调节(Dynamic Voltage and Frequency Scaling,简称DVFS)技术,也就是说需要增加动态电压频率调节(DVFS)模块,因此会增加芯片面积从而使芯片成本增大。因而,低功耗和高性能往往不可兼得。而目前大多数的嵌入式应用都是基于低位宽的微处理器开发的,如果现在全部向高位宽的微处理器移植,移植过程比较复杂,需要消耗大量的时间,从而造成产品的上市时间的延迟。
[0004]在这里我们以8位微处理器和32位微处理器为例来进行说明。假设对于某一特定客户的某一特定应用来说,基于8位MCU开发的应用程序为App8_l,App8_l移植到32位MCU上的应用程序为App32_l,应用程序App8_l和App32_l实现的功能完全相同。我们统计一定时间内8位微处理器处理应用程序App8_l和32位微处理器处理应用程序App32_l的功耗,下面我们分两种情况进行分析:
[0005](I) 二者在某一段时间范围内的处理应用程序的功耗对比如图1所示。可以看出,用32位MCU处理应用程序App32_l的速度明显快于用8位MCU处理应用程序App8_l的速度,32位的MCU的最佳性能要显著优于8位MCU的最佳性能,而8位MCU的优势体现在极低的静态功耗,特别是两次执行应用程序的间隔时间较长时(比如应用于物联网领域的应用程序),8位MCU的待机功耗要远小于32位MCU的待机功耗,所以这段时间内8位MCU消耗的总能量E8要低于32位MCU消耗的总能量E 32,即Es〈E32。因此,对低功耗要求比较高的客户应用来说,采取8位MCU更适用。在这里我们定义在一定时间T (T>0)内,如果应用程序Χ8在8位MCU上执行所消耗的总能量小于应用程序Χ32在32位MCU上执行所消耗的总能量,那么我们就说该应用程序适合运行在8位的MCU上,其中应用程序Χ8移植到32位MCU上的应用程序为Χ32,也就是说应用程序Χ8和应用程序Χ32实现相同的功能;
[0006](2)若二者在某一段时间范围内的处理功耗对比如图2所示。8位MCU在处理该应用程序时由于性能太低导致处理时间要大于32位MCU处理该应用程序所用的时间,因此8位MCU处理应用程序Αρρ8_1所消耗的总能量E8要大于32位MCU处理应用程序Αρρ32_1消耗的总能量E32,即Es>E32。比如需要大量调用ALU进行操作的应用程序。因此对于对处理性能要求高的客户应用来说,采用32位MCU更适用。在这里我们定义在一定时间Τ(Τ>0)内,如果应用程序X8在8位MCU上执行所消耗的的总能量大于应用程序X32在32位MCU上执行所消耗的总能量,那么我们就说该应用程序适合运行在32位的MCU上,其中应用程序X8移植到32位MCU上的应用程序为X32,也就是说应用程序X8和应用程序X32实现相同的功能。
[0007]随着信息技术和传感器技术等的发展,物联网已经应用在生活中的方方面面,物联网应用往往既包含适合运行在8位MCU上的应用程序又包含适合应用在32位MCU上的应用程序。8位MCU解决方案通常无法满足高性能要求而32位MCU解决方案又失去了超低待机功耗的特征,并且8位与32位MCU之间的代码移植也是非常困难的任务。

【发明内容】

[0008]鉴于上述问题,本申请记载了一种超低功耗且高性能的微处理器,其特征在于,包括通过芯片堆叠方式封装的第一裸片和第二裸片,所述第一裸片包括至少一个第一处理器核,所述第二裸片包括至少一个第二处理器核,所述第一处理器核的位宽低于所述第二处理器核。
[0009]较佳的,所述第一处理器核能够开启或者关闭所述第二处理器核。
[0010]较佳的,所述第一裸片还包括非易失性存储器,用于存储数据和/或应用程序。
[0011]较佳的,所述非易失性存储器包括第一区间单元,用以存储所述第一处理器核执行所需的数据和/或应用程序;以及
[0012]第二区间单元,用以存储所述第二裸片执行所需的数据和/或应用程序。
[0013]较佳的,所述第一裸片和所述第二裸片的堆叠工艺包括有引线键合技术或硅通孔技术。
[0014]本发明还提供了一种超低功耗且高性能的微处理器的运行方法,所述方法包括步骤:
[0015]第一微处理器核根据客户请求,执行位于第一区间单元中的第一应用程序;
[0016]当第二应用程序需要被执行,所述第一微处理器核控制第二裸片上电并唤醒第二微处理器核;
[0017]所述第二微处理器核将存储于第二区间单元中的所述第二应用程序传输至所述第二裸片中的片上缓存中;
[0018]所述第二微处理器核执行或处理所述片上缓存中的所述第二应用程序;
[0019]所述第二应用程序执行完成后,所述第一微处理器核关闭所述第二裸片的电源以及所述第二微处理器核。
[0020]较佳的,当应用程序的从所述非易失性存储器中传输到所述第二裸片上的所述片上缓存所消耗的能量为E1,所述第二微处理器核执行或处理与所述应用程序具有相同功能的应用所消耗的能量为E2,所述第一微处理器核执行或处理所述应用程序所消耗的能量为
E3,
[0021]当Ei+E2> E3时,所述应用程序为第一应用程序;
[0022]当EJE2S E 3时,所述应用程序为第二应用程序。
[0023]较佳的,当所述第二微处理器核能够直接从所述第二区间单元执行所述第二应用程序时,在所述步骤所述第一微处理器核控制第二裸片上电并唤醒第二微处理器核之后执行步骤:
[0024]所述第二微处理器核直接访问并执行所述第二应用程序。
[0025]较佳的,在所述步骤所述第二微处理器核直接访问并执行所述第二应用程序之后执行所述步骤:
[0026]所述第二应用程序执行完成后,所述第一微处理器核关闭所述第二裸片的电源以及所述第二微处理器核。
[0027]上述技术方案具有如下优点或有益效果:本发明提出的微处理器结构及其运行方法,在执行客户
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1