一种图形处理器光栅化单元的自适应低功耗时钟门控结构的制作方法

文档序号:12064704阅读:218来源:国知局

本发明涉及计算机硬件技术领域,尤其涉及图形处理器光栅化单元的自适应低功耗时钟门控结构。



背景技术:

随着图形化应用的不断增加,早期单靠CPU进行图形绘制的解决方案已经难以满足成绩和技术增长的图形处理需求,图形处理器(Graphic Processing Unit,GPU)应运而生。从1999年Nvidia发布第一款GPU产品至今,GPU技术的发展主要经历了固定功能流水线阶段、分离染色器架构阶段、统一染色器架构阶段,其图形处理能力不断提升,应用领域也从最初的图形绘制逐步扩展到通用计算领域。GPU流水线高速、并行的特征和灵活的可编程能力,为图形处理和通用并行计算提供了良好的运行平台。

目前,我国尚无基于统一染色架构的GPU,各领域显示控制系统中大量采用国外进口的商用GPU芯片。尤其是在军用领域中,国外进口商用GPU芯片存在温度和环境适应性差、无法保证电路本身或配套软件没有“后门”、包含大量军用领域不需要的冗余功能单元,功耗指标无法满足要求、商用GPU芯片更新换代快,随时面临停产、断档,难以满足武器装备持续保障等缺陷,在安全性、可靠性、保障性等方面的存在重大隐患。而且,出于政治、军事、经济等原因,国外对我国实行技术“封锁”和产品“垄断”,难以获得GPU芯片的底层技术资料,如寄存器资料、详细内部微架构、核心软件源码等,导致GPU功能、性能无法充分发挥,且移植性较差;上述问题严重制约了我国显示系统的独立研制和自主发展。

尤其是图形处理器低功耗设计技术,是GPU图形处理体系结构的核心技术,而光栅化单元是GPU的关键核心模块,突破GPU光栅化单元低功耗设计关键技术,研制高性能图形处理器芯片迫在眉睫。



技术实现要素:

本发明公开了一种图形处理器光栅化单元的自适应低功耗时钟门控结构,能够实时的检测到当前图元顶点命令的类型,并根据图元顶点命令类型对处于空闲状态的图元光栅化模块的工作时钟进行动态门控,从而降低光栅化单元的功耗。

本发明的技术解决方案是:

一种图形处理器光栅化单元的自适应低功耗时钟门控结构,包含光栅化模块(1)和时钟与功耗控制模块(2);

所述光栅化模块(1)中包含点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)、Early-Z单元(16)、片元输出单元(15),以及图元顶点命令类型判定单元(14)、顶层命令解析单元(17);

顶层命令解析单元(17)接收图元顶点命令进行解析,如果解析的图元顶点命令为点图元光栅化命令,发送给点图元光栅化模块(11);如果解析的图元顶点命令为直线图元光栅化命令,发送给直线图元光栅化模块(12);如果解析的图元顶点命令为三角形图元光栅化命令,发送给三角形图元光栅化模块(13);

点图元光栅化模块(11)执行点图元光栅化命令,完成点图元光栅化功能,片元属性数据发送给Early-Z单元(16);

直线图元光栅化模块(12)执行直线图元光栅化命令,完成直线图元光栅化功能,片元属性数据发送给Early-Z单元(16);

三角形图元光栅化模块(13)执行三角形图元光栅化命令,完成三角形图元光栅化功能,片元属性数据发送给Early-Z单元(16);

Early-Z单元(16)对所述执行结果进行提前深度测试,剔除最终不会被看到的片段,将剔除片段的片元属性数据发送给片元输出单元(15);

片元输出单元(15)将所述剔除片段的片元属性数据输出;

图元顶点命令类型判定单元(14)根据顶层命令解析单元(17)接收到的图元顶点命令的类型向时钟与功耗控制模块(2)发送光栅化单元的门控时钟控制信号,所述光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,1为有效,0为无效;

时钟与功耗控制模块(2)独立产生光栅化模块(1)中点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的工作时钟,并连接到上述三个功能模块中;时钟与功耗控制模块(2)包含分别针对点图元光栅化模块(11)、直线图元光栅化模块(12)、三角形图元光栅化模块(13)的相关时钟门控电路;解析光栅化单元的门控时钟控制信号,将门控时钟控制信号对应位为0的相应光栅化单元的工作时钟关闭。

本发明的技术效果是:

1、通常来说,光栅化单元是一个完整的功能模块,已有的低功耗技术都是把这个完整的功能模块作为整体进行控制,如工作电压的动态调整技术、时钟频率的动态缩放技术等。考虑到在GPU的实际绘制过程中,光栅化单元内部对三个不同类型图元的光栅化模块-点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,在同一时刻只有一个处于工作状态,其它两个处于空闲状态。从低功耗的角度来说完全可以对三个光栅化模块的工作时钟进行独立控制。因此,本发明所提方案,不但能够实现将整个光栅化单元作为整体进行时钟门控,而且还能够在更细粒度的层面实现三种不同类型光栅化模块的独立时钟门控,从而实现可以根据图形绘制场景的行为特征和实现对光栅化单元的多个工作时钟的实时动态门控。既能够动态调节光栅化单元功耗,还能够显著增强对光栅化单元功耗控制的灵活性。

附图说明

图1是本发明图形处理器光栅化单元的自适应低功耗时钟门控结构图。

具体实施方式

下面结合附图和具体实施例,对本发明的技术方案进行清楚、完整地表述。显然,所表述的实施例仅是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域技术人员在没有做出创造性劳动前提所获得的所有其它实施例,都属于本发明的保护范围。

本发明提供一种图形处理器光栅化单元的自适应低功耗时钟门控结构,包含光栅化模块1和时钟与功耗控制模块2;

所述光栅化模块1中包含点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13、Early-Z单元16、片元输出单元15,以及图元顶点命令类型判定单元14、顶层命令解析单元17;

顶层命令解析单元17接收图元顶点命令进行解析,如果解析的图元顶点命令为点图元光栅化命令,发送给点图元光栅化模块11;如果解析的图元顶点命令为直线图元光栅化命令,发送给直线图元光栅化模块12;如果解析的图元顶点命令为三角形图元光栅化命令,发送给三角形图元光栅化模块13;

点图元光栅化模块11执行点图元光栅化命令,完成点图元光栅化功能,片元属性数据发送给Early-Z单元16;

直线图元光栅化模块12执行直线图元光栅化命令,完成直线图元光栅化功能,片元属性数据发送给Early-Z单元16;

三角形图元光栅化模块13执行三角形图元光栅化命令,完成三角形图元光栅化功能,片元属性数据发送给Early-Z单元16;

Early-Z单元16对所述执行结果进行提前深度测试,剔除最终不会被看到的片段,将剔除片段的片元属性数据发送给片元输出单元15;

片元输出单元15将所述剔除片段的片元属性数据输出;

图元顶点命令类型判定单元14根据顶层命令解析单元17接收到的图元顶点命令的类型向时钟与功耗控制模块2发送光栅化单元的门控时钟控制信号,所述光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,1为有效,0为无效;

时钟与功耗控制模块2独立产生光栅化模块1中点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13的工作时钟,并连接到上述三个功能模块中;时钟与功耗控制模块2包含分别针对点图元光栅化模块11、直线图元光栅化模块12、三角形图元光栅化模块13的相关时钟门控电路;解析光栅化单元的门控时钟控制信号,将门控时钟控制信号对应位为0的相应光栅化单元的工作时钟关闭。

实施例

如图1所示,光栅化单元中包括点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块。在任意时刻,上述三个不同类型的光栅化模块只有一个处于工作状态。

图元顶点命令类型判定单元位于光栅化单元内部,根据图元顶点命令接收模块接收到的图元顶点命令类型向时钟与功耗控制模块发送光栅化单元的门控时钟控制信号。光栅化单元的门控时钟控制信号至少包括3位,分别对应点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块,时钟与功耗控制模块根据来自图元顶点命令类型判定单元的时钟门控控制信号决定应该如何对三个光栅化模块的工作时钟进行门控。

门控时钟控制信号的某一位如果为0,则表示将其对应的时钟关闭,即被门控;门控时钟控制信号的某一位如果为1,则表示将其对应的时钟打开。

时钟与功耗控制模块为光栅化单元中的3个独立的光栅化功能子模块提供独立的工作时钟,即使PLL产生3个光栅化单元的工作时钟;3个光栅化单元的工作时钟分别连接到时钟与功耗控制模块的3个独立的时钟门控电路中。经过门控电路处理后,输出的时钟分别连接到光栅化单元的点图元光栅化模块、直线图元光栅化模块、三角形图元光栅化模块中。

时钟与功耗控制模块包含针对光栅化单元中的3个独立的光栅化功能子模块的3个独立的时钟门控电路。每一个时钟门控电路与一个光栅化功能子模块相对应,在光栅化单元中的图元顶点命令类型判定单元输出的时钟门控控制信号对应位为0的情况下,将对相应光栅化功能子模块的工作时钟关闭,从而实现对相应光栅化功能子模块工作时钟的门控。

如果光栅化单元接收到的是点图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为100,表示将点图元光栅化模块的工作时钟打开,将直线图元光栅化模块和三角形图元光栅化模块的工作时钟关闭。

如果光栅化单元接收到的是直线图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为010,表示将直线图元光栅化模块的工作时钟打开,将点图元光栅化模块和三角形图元光栅化模块的工作时钟关闭。

如果光栅化单元接收到的是三角形图元对应的图元顶点命令,则图元顶点命令类型判定单元输出的时钟门控控制信号为001,表示将三角形图元光栅化模块的工作时钟打开,将点图元光栅化模块和直线图元光栅化模块的工作时钟关闭。

最后应说明的是,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解;其依然可以对前述各实施例记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1