数据处理装置及其操作方法

文档序号:9929499阅读:464来源:国知局
数据处理装置及其操作方法
【技术领域】
[0001]本发明涉及一种数据处理装置及其操作方法。
【背景技术】
[0002]目前图形处理单元(Graphics Processing Unit,以下称GPU)的运算能力已经到达千兆级,即每秒可以处理数千兆个绘图命令。目前计算机绘图的趋势是大分辨率图像(例如4K by 4K)和复杂的绘制(rendering)。因此,计算能力以及在GPU与系统间的接口传输带宽是越强大越好。然而对一些运算平台(例如手持式电子装置)而言,拥有强大的计算能力(伴随极大的耗电量)和大的传输带宽是不实际的。因此在手持式电子装置的GPU内可能配置了区块化引擎(tiling engine),以便将一个画面分割成多个区块。以区块为基础的绘制架构(tile-based rendering architecture)有助于更好地利用本地内存存取,使传输带宽的使用可以更有效率。
[0003]如何降低GPU和系统之间的传输带宽,及/或减少在GPU中绘图管线的计算量,是本领域的课题。一些现有技术利用自适应可扩展纹理压缩(Adaptive Scalable TextureCompress,以下称ASTC)和事务处理消除(Transact1n Eliminat1n)来减少GPU和系统之间的传输带宽,进而降低了功耗。ASTC是一种利用纹理颜色照度的压缩技术。「事务处理消除」可以比较目前帧(frame)的某一个经绘制像素和先前帧中相同位置的一个经绘制像素,以节省传输带宽。现有技术是像素在完成绘制后,也就是在完成光栅化(Rasterizat1n)阶段后,才进行事务处理消除。也就是说,像素必须经过绘制计算后才进行事务处理消除,因此现有技术在绘图管线中减少计算量的效果有限。

【发明内容】

[0004]本发明提供一种数据处理装置与其操作方法,以在数据处理管线中尽早地节省区块计算。
[0005]本发明的实施例中提供一种数据处理装置。数据处理装置包括区块化电路以及后段处理电路。区块化电路经配置以接收输入数据。区块化电路可以将输入数据的目前帧划分为至少一区块,以及检查所述至少一区块中的目前区块的移动状况。后段处理电路耦接至区块化电路,以接收该目前区块。后段处理电路可以依据目前区块的移动状况,而决定将目前区块进行包括光栅化的后段处理而产生目前帧的经处理目前区块,或是决定取先前帧的经处理对应区块作为目前帧的该经处理目前区块。
[0006]本发明的实施例中提供一种数据处理装置的操作方法,包括:由区块化模块将输入数据的目前帧划分为至少一区块;由区块化模块检查所述至少一区块中的目前区块的移动状况;以及依据该目前区块的移动状况,决定由后段处理模块将目前区块进行包括光栅化的后段处理而产生目前帧的经处理目前区块,或是由后段处理模块取先前帧的经处理对应区块作为目前帧的该经处理目前区块。
[0007]基于上述,本发明实施例所述数据处理装置与其操作方法,其可以在进行后段处理之前,依据该目前区块的移动状况,决定是否取先前帧的经处理对应区块作为目前帧的经处理目前区块,以节省目前帧的所述经处理目前区块的后段处理(即节省区块计算/绘制)。因此,所述数据处理装置与其操作方法可以在进行后段处理之前,尽早地节省区块计笪
[0008]为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合所附图式作详细说明如下。
【附图说明】
[0009]图1是依照本发明一实施例的一种数据处理装置的模块方块示意图。
[0010]图2是依照本发明一实施例的一种数据处理装置的操作方法的流程示意图。
[0011]图3示意照本发明一实施例说明图2所示步骤S250的操作示意图。
[0012]图4是依照本发明一实施例说明图1所示数据处理装置的模块方块示意图。
[0013]图5是依照本发明一实施例说明图2所示操作方法的流程示意图。
[0014]图6是依照本发明一实施例说明像素进行不同空间转换的示意图。
[0015]图7是依照本发明一实施例说明转换矩阵的不同转换类型的示意图。
[0016]图8是依照本发明一实施例说明图5所示步骤S510的判断操作范例示意图。
【具体实施方式】
[0017]在本发明申请文件(包括权利要求书)中所使用的「耦接」一词可指任何直接或间接的连接手段。举例而言,若文中描述第一装置耦接于第二装置,则应该被解释成该第一装置可以直接连接于该第二装置,或者该第一装置可以透过其他装置或某种连接手段而间接地连接至该第二装置。另外,凡可能之处,在图式及实施方式中使用相同标号的元件/构件/步骤代表相同或类似部分。不同实施例中使用相同标号或使用相同用语的元件/构件/步骤可以相互参照相关说明。在图式及实施方式中所述「模块」可以被实现为硬件、软件、韧体、或是从硬件、软件与韧体中选择其二者(或更多)的任何组合。
[0018]图1是依照本发明一实施例的一种数据处理装置100的模块方块示意图。数据处理装置100包括区块化模块(例如区块化电路110)、后段处理模块(例如后段处理电路120)以及帧内存130。图2是依照本发明一实施例的一种数据处理装置的操作方法的流程示意图。请参照图1与图2,区块化模块(例如区块化电路110)经配置以接收输入数据Din(步骤S210),以及将输入数据Din的目前帧划分为一个或多个区块(tile)(步骤S220)。于不同实施例中,所述区块可以是一整个帧或子帧。区块的大小可以视实际设计需求来决定。依据数据处理装置100的不同应用情境,输入数据Din可以包括绘图数据。
[0019]区块化电路110经配置以检查目前帧的这些区块中的一个目前区块的移动状况。举例来说,区块化电路110可以依据目前区块的移动状况,来判断所述目前区块是否需要进行后段处理(步骤S230)。后段处理模块(例如后段处理电路120)耦接至区块化电路110,以接收该目前区块。当区块化电路110依据目前区块的移动状况判断所述目前区块需要进行后段处理时,区块化电路110可以决定由后段处理电路120将所述目前区块进行后段处理,以便产生目前帧的经处理目前区块(步骤S240)。在一些实施例中,若将数据处理装置100应用于图形处理单元中,则输入数据Din可以包括绘图命令,而后段处理电路120进行的所述后段处理可以包含光栅化操作。此光栅化操作为公知技术,故不再赘述。
[0020]后段处理电路120可以将所述经处理目前区块存入帧内存130。以此类推,目前帧的其他区块可以经由后段处理电路120处理后,将这些经由后端处理电路120处理后的经处理区块存入帧内存130,而获得完整的目前帧。
[0021]当区块化电路110依据目前区块的移动状况判断所述目前区块不需要进行所述后段处理时,区块化电路110可以决定去禁能(disable)后段处理电路120的所述后段处理操作。在后段处理电路120的所述后段处理操作被禁能的情况下,后段处理电路120可以从帧内存130取先前帧的经处理对应区块,作为目前帧的经处理目前区块(步骤S250)。
[0022]举例来说,图3示意照本发明一实施例说明图2所示步骤S250的操作示意图。图3左半部绘示一个先前帧F(1-l),而右半部绘示一个目前帧F(i)。先前帧F(1-l)表示曾经于先前时段中已被后段处理电路120处理过后所产生的影像帧。后段处理电路120可以从帧内存130存取先前帧F(1-l)。于图3所示范例中,目前帧F(i)包含区块321、322、323与324。在此假设区块322是所述目前区块。区块化电路110可以检查目前帧F(i)的目前区块322的移动状况。例如,区块化电路110可以依据目前区块322在先前帧F(1-l)中寻找最相似的一个对应区块312,并获知移动向量311。因为在先前帧F(1-l)中的对应区块312相似于目前帧F(i)的目前区块322,所以可以节省目前区块322的计算(即所述后段处理)。当目前区块322被判断为不需要进行所述后段处理时,后段处理电路120可以依据移动向量311从帧内存130取出先前帧F(1-l)的经处理对应区块312,作为目前帧F(i)的经处理目前区块322。
[0023]图1与图2所示实施例可以被应用于多种数据处理装置,例如应用于绘图数据处理装置或是其他数据处理装置。以下将以图形处理单元作为图1与图2所示实施例的应用范例。
[0024]图形处理单元配置有图形绘制管线。图形绘制管线被分成两部分:几何处理阶段和像素处理阶段(fragment processing stage)。几何处理阶段包括一个可编程顶点着色器(programmable vertex shader)或可编程统一着色器(programmable unified shader)和一个
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1