一种指令移除装置及其方法

文档序号:6650393阅读:325来源:国知局
专利名称:一种指令移除装置及其方法
技术领域
本发明涉及一种指令移除装置及其方法,尤指一种可用于图像处理程序中的简单指令移除装置及其方法。
背景技术
像素着色器(Pixel Shader,PS)可用于处理在3D图像处理器(3-Dimensional Graphic Processor,GPU)或3D图像加速器(3-DimensionalGraphic Accelerator,GPU整合入系统芯片组的情形)中像素的可程序化(Programmable)部份。近来,一些绘图应用程序接口(Application ProgramInterface,API)加入像素着色器于其中,如DirectX规格由8.0版起加入的像素着色器,及OpenGL由1.5版加入的图像片段处理器(FragmentProcessor),都各自定义了类似汇编语言(Assembly Language)的着色器语言(Shader Language)。
请参阅图1,传统的图像处理器的处理程序包括若干主要步骤用以对像素进行处理。首先,由顶点处理程序(Vertex Processing Procedure)用以执行几何转换与光线处理程序(Transform and Lighting Process,T&LProcess)902,并执行程序904以将该顶点切割(Clipping)至视窗(Viewport)。接着,用一个三角形图像设定程序(Triangle Setup Process)906来结合该顶点使成为各个三角形图像,并以二维像素铺满每个三角形图像。这些二维像素会被传送出去以执行像素处理程序。在像素处理程序中,有一个材质处理单元(Texture Unit,TU或称为材质单元)908,可依据像素位置及对应三角形顶点中的材质坐标(Texture Coordinate),进行内插运算(Interpolate)从而求出该二维像素的材质坐标。该二维像素的材质坐标从材质图(Texture Map)中取样(Sample)出像素的材质颜色。同时,一个色彩内插器(Color Interpolator,CI)910依据像素位置及对应三角形顶点中的顶点颜色,内插运算出各像素的顶点颜色。而后,由混色程序(BlendingProcedure)912用以处理该材质颜色与像素颜色以获得该像素的最终颜色。最后,用深度处理程序(Depth Processing Procedure)914来比较出最靠近视窗的像素并将其最终颜色画出,以产生完整的画面(Frame)。
在近来的绘图应用程式接口中,该顶点处理程序与像素处理程序已被改变为可程序化,以符合为处理更多图形特效所采用的硬件加速运算的要求。如图2所示,在DirectX规格中的顶点着色器916(在OpenGL规格中为顶点处理器,vertex processor)即用以取代前述像素处理程序中的混色程序。顶点着色器916与像素着色器926为具有特殊指令的通用处理器(GeneralPurpose Processor)用以执行相应着色器语言的程序。顶点着色器916执行顶点着色器程式(Vertex Shader Program)以处理顶点层次的特效,而像素着色器926执行一像素着色器程式样(Pixel Shader Program)以处理更精致的特效。因此,更多特效可藉由顶点着色器程式与像素着色器程式的配合来达成,以改进硬件的效能。
另一现有技术的像素着色器如图3所示,其即由在像素处理程序中材质颜色与顶点颜色的可程式化混色程序所演进而来。由材质着色器932所得到的材质颜色与由色彩内插器934所得到的顶点颜色会被像素着色程式与像素着色器936进行混色处理,以获得各像素的最终颜色与深度,再传给深度处理程序进行处理。
请续参阅图4。目前最新的像素着色器可执行更复杂的运算处理以实现更精致的光影特效与表面处理特效。像素着色器946被要求可处理算术运算指令(Algorithmic Instruction)以对来自材质处理单元942的材质坐标执行内插运算,再以特殊的材质撷取指令(Texture Load Instruction,如DirectX规格中的texld指令)将处理后的坐标传回材质处理单元942从材质图中取样出材质颜色,再传回像素着色器946做混色处理。
图5为在DirectX规格中像素着色器程式的一个实例。DirectX规格的像素着色器定义了数组缓存器,包括一般缓存器rn、材质坐标缓存器tn、材质编号缓存器sn、顶点颜色缓存器vn及最终颜色缓存器oCn。材质坐标系由材质处理单元950进行内插运算获得,而材质编号则用以指定材质处理单元950中的材质编号。该像素着色器程式包括四个主要阶段(a)坐标运算;(b)材质处理;(c)混色处理;及(d)指令发出。
(a)在坐标运算阶段,tn值与rn值被进行一般算术运算,运算所得的结果存于该一般缓存器rn中;
(b)在材质处理阶段,将材质坐标缓存器tn与一般缓存器rn中所存的坐标以一材质撷取指令texld通知材质处理单元950从材质编号缓存器sn所指定的材质图中取样出材质颜色。该材质颜色信息将被传回至一般缓存器rn;(c)在混色处理阶段,将存于一般缓存器rn的材质颜色与存于顶点颜色缓存器vn的顶点颜色以一般算术运算混色,并将该运算结果存于一般缓存器rn中;(d)在指令发出阶段,将存于一般缓存器rn中的最终颜色信息传出以执行一深度处理程序。
图6为某一现有技术之像素着色器的组件方块图。首先,像素着色器程式由被输入至指令阵列(Instruction Queue)970,由三角形图像设定程序得到像素方块(Tile)中的每个像素必须被以指令队列970中的所有指令执行过一次,然后由最后发出阶段的指令将结果传给深度处理程序972。程式计数器(Program Counter,PC)965撷取该指令并交由译码器(Decoder)966进行译码,以执行算术逻辑单元(Algorithmic Logic Unit,ALU)968的运算。
在指令间存在有资料相依性(Data Dependency)和控制相依性(ControlDependency)的问题,但像素间并不存在有资料或控制相依性。所谓资料相依性意是指若一个在后指令必须根据其在前指令的执行结果才能加以执行,则该在后指令就必须等待该在前指令处理完成后,才能开始进行处理。所谓控制相依性意是指除非具有复杂的资料相依性判别装置来实现乱序执行(Out-of-order Execution),否则某一程式会根据各指令本身的顺序来依序执行,亦即,每个指令都要等前一个指令完成,才能开始执行。因此,在一个执行时脉(Execution Cycle)中可同时处理数个像素,而且像素着色器可累积相同指令的多个时脉,在同一处理批次(Batch)中处理数个像素的执行时脉。藉此,在该处理批次的最后时脉所处理的像素发出后,该处理批次的最初时脉所处理的像素已处理完成且可被发出,因此可避免或减少资料相依性所造成的管线阻滞(Pipeline Bubble)。然而,假设在同一处理批次中可处理N个像素,则像素着色器的规格即必须设置N组缓存器以存放N个像素于像素着色器960中。
假设算术逻辑单元968可于一时脉中同时执行W个像素,且其处理常用指令的最长执行时脉为L个时脉,则像素着色器960需要N个缓存器来储存在同一处理批次中须同时执行的N个像素,其中N必须等于或大于L×W。否则,当在同一处理批次中所有可同时执行的像素都已执行,但最初执行的像素却尚未完成,就无法继续执行下个指令,而造成管线的间断性节流(Pipeline Throttling)。
由于材质撷取指令texld须进行复杂的内插运算,故其为常用指令中执行时脉最长的指令。材质撷取指令texld必须由材质处理单元956从指定的材质图中取样出材质颜色,再传回给像素着色器960。而取样的动作是很复杂的内插运算,且材质图又是存放在内存中,就算以内存快取(Memory Cache)来加速,都要30个时脉以上,当发生快取失误(Cache Miss)时更要上百个时脉来由内存读取。随着每一代像素着色器新规格的缓存器数量倍增(目前约由300bit/pixel增至600bit/pixel),以及算术逻辑单元968每个时脉可平行执行的像素运算倍增(近期由1pixel/cycle增至16pixel/cycle),像素着色器960愈来愈不可能存放足够的缓存器数量。如此会造成大量的管线间断性节流,使得增加的运算频宽无用化,而随着材质图愈来愈精致,内存快取的失误率(Miss Rate)也会愈来愈高。因此,具有长执行时脉的材质撷取指令texld会造成影响像素处理效能的严重问题。
近来愈来愈多的光线与阴影特效也会造成更高的快取失误率,如曲面法线贴图(Normal Map)技术。曲面法线贴图技术为一种先进的皱面贴图(Bump-mapping)技术,其包含多边形对象详细信息的特殊材质资料。然而,曲面法线贴图技术需要更大的资料量,因而会导致更高的材质快取失误率。
这种管线严重的间断性节流起因是因为材质撷取指令texld和其它指令有数据和控制相依性。如图7所示的例子,某程式的第一个指令为一个材质撷取指令texld,其后为其它指令。在此例中仅有一个材质撷取指令texld在此程式中。图7例示管线的执行排程并标示出像素着色器与材质处理单元的执行与闲置状态。假设该像素着色器以具有Lpixel/cycle频宽(bandwidth)的算术逻辑单元在同一处理批次可执行N个像素。该材质处理单元根据一材质撷取指令texld取样出材质颜色后传回给像素着色器,而其它指令必须等到材质处理单元处理完该材质撷取指令texld后方可开始执行。由于N小于L,故像素着色器在执行其它指令前必须闲置L-N个时脉。接着,在像素着色器处理完其它指令前,由于材质处理单元将无法收到下N个像素的材质撷取指令texld,故材质处理单元必须闲置。此时材质处理单元变成效能瓶颈,故其闲置时间会造成显著的管线间断性节流。并且当其它指令的数量i增加时,材质处理单元的闲置时间将会倍增为N×i。
美国专利公告第5,978,871号揭示一种分解高速缓存操作与特定结构功能的分层方法,其利用一快取控制器以允许复杂的运算可被分解为数个相等的简单运算。可将基本操作的结构变化态样转换成独立的高速缓存和结构性,并且加以分别处理。以该逻辑运算可简化复杂的操作并且提高效能。然而,该分解高速缓存操作与特定结构功能的分层方法并不适用于指令无法被分解为数个相同简单指令的情况。
美国专利公告第6,609,190号揭示了一种处理器、数据处理系统和处理器执行指令的相关方法。该处理器可分派指令至一个发出单元。该发出单元包括主要发出阵列和次要发出阵列。如果当前的指令不满足被发出的条件,则被存储在主要发出阵列中。如果当前的指令满足被发出的条件,则被存储在次要发出阵列中。处理器从主要发出阵列的指令中确定要发出的下一个指令。如果指令依赖于另一个指令的执行结果,则可以从主要发出阵列中转移到次要发出阵列中。然而,被分派至次要发出阵列的指令仍须在处理器的执行管线中等待,直到该指令被判定为可执行或去除。
综上所述可知,即使指令间不存在数据相依性,材质撷取指令texld与其它指令间的控制相依性仍会造成严重的管线间断性间断性节流。因此必须消除材质撷取指令texld与其它指令间的控制相依性以增进图像处理效能。

发明内容本发明的目的在于提供一种指令移除装置及其方法,其可用以移除在图像处理程序中的简单指令。
本发明的另一目的在于提供一种指令移除装置及其方法,其可用以降低在一个图像处理程序中材质处理单元的闲置时间。
为实现上述目的,本发明采用如下技术方案本发明指令移除装置及其方法,该指令移除装置可扫描图像处理程式以决定其中是否具有简单材质撷取指令。而该简单材质撷取指令将会被直接传送至材质处理单元并从一个材质指令集中器中移除,以避免像素着色器在该材质处理单元处理该简单材质撷取指令之前先执行该指令。
该方法用以侦测与移除该简单材质撷取指令,其包括以下步骤步骤一开始;步骤二载入原始像素处理程式;步骤三清除材质指令表;步骤四扫描该原始像素处理程式中的一指令;步骤五对该指令进行译码;步骤六判别该指令是否为简单材质指令,若该指令为简单材质指令则进行步骤七,否则进行步骤八;步骤七检查该材质指令表是否已满,若该材质指令表已满则进行步骤八,否则进行步骤九;步骤八将该指令写入新像素处理程式中;步骤九将该简单材质指令写入该材质指令表中;步骤十判断是否仍有其它指令,若有其它指令则进行步骤四,否则进行步骤十一;步骤十一 准备执行该新像素处理程式并将材质处理命令传送至材质处理单元;步骤十二 结束。
与现有技术相比,本发明具有以下优点(1)可改进图像处理程序的效能;(2)可减少该材质处理单元的闲置时间;以及(3)可提供简单指令移除装置与方法以有效地利用被指派给该图像处理程序的实体缓存器。

下面结合附图和实施例对本发明进一步说明图1为一现有技术图像处理器的处理程序图。
图2为另一现有技术图像处理器的处理程序图。
图3为一现有技术像素处理程序图。
图4为另一现有技术像素处理程序图。
图5为DirectX规格中像素着色器程序的一个例子。
图6为一现有技术像素着色器的组件方块图。
图7为现有技术像素着色器与材质处理单元的执行排程示意图。
图8为具有本发明指令移除装置的图像处理器的组件方块图。
图9为本发明扫描与移除简单材质撷取指令的一个实施例。
图10为本发明扫描与移除简单材质撷取指令的另一个实施例。
图11为本发明指令移除装置的一个实施例。
图12为本发明指令移除装置的简化实施例。
图13为本发明指令移除装置的执行排程图。
图14为本发明指令移除装置的像素着色器与材质处理单元的执行排程图。
图15为本发明指令移除装置的像素着色器与材质处理单元的另一执行排程图。
图16为本发明指令移除方法的步骤流程图。
图17为本发明指令移除方法的另一步骤流程图。
主要元件符号说明22简单指令移除装置24指令扫描装置26材质撷取指令集中器27材质撷取指令转换单元28、29材质撷取指令表30指令过滤器32材质处理单元34像素着色器36、38、48原始图像处理程序42原始像素着色器程序44、50简单材质撷取指令46新像素着色器程序52新图像处理程序
具体实施方式本发明一种指令移除装置及其方法,其可用以移除在图像处理程序中的简单指令。请注意以下的实施例是以DirectX规格来说明与例示。而本发明所揭示的新颖架构与方法亦可实现于其它图像处理程式语言或硬件中,如OpenGL的着色器语言及硬件。
本发明中,简单材质撷取指令意指该材质撷取指令的材质坐标是直接由材质处理单元经内插运算所得出的材质坐标,亦即该材质撷取指令的材质坐标未经过像素着色器(或其它像素处理单元)处理。在DirectX规格中就是指该材质撷取指令的材质坐标为tn的情形,若该材质撷取指令并非为简单材质撷取指令,则该材质坐标为rn。一个简单材质撷取指令的操作要素(Operation Factor)包括一目标缓存器rn、一材质编号缓存器sn及一材质坐标来源缓存器tn。在DirectX规格中简单材质撷取指令的格式为[texldrn,sn,tn]。材质处理单元可直接存取该简单材质撷取指令之材质而无须经过像素着色器的处理。故该简单材质撷取指令可从须先经由该像素着色器的程式中移除。
图8为具有本发明指令移除装置的图像处理器的组件方块图。图像处理器20包括简单指令移除装置22、材质处理单元32与像素着色器34。该简单指令移除装置22包括指令扫描装置24、材质撷取指令集中器26与指令过滤器30。指令过滤器30可对一原始程式36中的指令进行译码与扫描,以根据该指令的静态模式(Static Status or Non-dynamic Status)来判断该指令是否为简单材质撷取指令,在DirectX规格中即意指该材质撷取指令的材质坐标为tn。
图9为扫描与移除一简单材质撷取指令的一个例子。当一个简单材质撷取指令[texld r1,s1,t0]在原始程式中被简单指令移除装置22发现时,该简单材质撷取指令[texld r1,s1,t0]会被存放于一个材质撷取指令表29中。在简单指令移除装置22的指令扫描装置24扫描过该原始程式后,指令过滤器24会将该简单材质撷取指令[texld r1,s1,t0]从该原始程序中滤除,而此时该简单材质撷取指令[texld r1,s1,t0]已被写入该材质撷取指令表29。
图10为本发明扫描与移除简单材质撷取指令的另一个实施例。与图9中所示实施例相较,此实施例是以一个材质撷取指令转换单元27替代材质撷取指令集中器26。材质撷取指令转换单元27用以转换该简单材质撷取指令并将其传送至材质处理单元32以供执行。
请参阅图11,常见的像素着色器程式42中的一个简单材质撷取指令会由本发明的指令移除装置22移除。指令移除装置22先扫描原始程式42并发现一个简单材质撷取指令[texld r2,s1,t2](即该简单材质撷取指令[texld r2,s1,t2]的材质坐标为t2),接着简单材质撷取指令[texld r2,s1,t2]会被传送至材质处理单元32以直接取得该简单材质撷取指令[texldr2,s1,t2]的材质信息。同时该简单材质撷取指令[texld r2,s1,t2]会被从原始程式42中移除。在像素着色器所执行的原始程式中的指令具有程式计数器(Program Counter)所产生的顺序关系,而在材质处理单元中的材质撷取指令并无控制相依性。因此,材质处理单元可更有效率地存取材质信息而不受控制相依性的限制。
本发明指令移除装置可以硬件或软件的方式来实现。以软件方式实现时,该指令移除装置可为一个独立的应用程式(Application Program)、一个程式载入程式(Program Loader)或一个装置驱动程式(Device Driver Program)的一部份。若为装置驱动程式的一部份,则可附加于一程式编辑器(ProgramCompiler)上。而以硬件方式实现时,该指令移除装置可内含于一个图像处理器(Graphic Processor,GPU)或像素着色器中,该指令移除装置须位于像素着色器指令撷取(Fetch)或译码(Decode)之前。
图12为本发明指令移除装置的一个简化实施例。原始程式48包括两指令[texld r1,s1,t0]与[mov oC0,r1]。由于该指令[texld r1,s1,t0]为简单材质撷取指令(因其材质坐标为t0),故指令移除装置22将把该简单材质撷取指令[texld r1,s1,t0]从原始程式48中移除并将该指令传送至材质处理单元32。
请参阅图13。其上半部为不具有简单材质撷取指令移除装置的指令执行流程图,而下半部则为具有简单材质撷取指令移除装置的情形。在图13的上半部的情形时,由于简单材质撷取指令并未从原始程式中被移除,故当像素着色器在处理非简单材质撷取指令时,材质处理单元必须闲置N×i个时脉,其中N代表该像素着色器在同一批次可执行的像素数量,而i代表非简单材质撷取指令的数量。在图13下半部的情形时,该简单材质撷取指令由材质处理单元直接执行,故此时像素着色器可同时执行下一批N个像素材质撷取的动作。由于简单材质撷取指令不须依照该像素着色器的控制顺序或频宽,故简单材质撷取指令无须等待该像素着色器的执行结果。此外,该指令移除装置亦可设计为可检查原始程式在静态模式下的资料相依性,以节省必须设置复杂的像素处理硬件来检查资料相依性的成本。因此,本发明之指令移除装置可减少材质处理单元的闲置时间,使材质处理单元保持连续运作,以提升图像处理程序之效能。
图14为较详细的像素着色器与材质处理单元的处理流程图,以比较具备有指令移除装置与不具有指令移除装置的情形。在该例中,假设像素着色器与材质处理单元在同一批次可执行N个像素,而材质处理单元执行每个指令需要L个时脉。如同图13的上半部所示,图14上半部不具有指令移除装置的情形时,材质处理单元必须闲置等待像素着色器执行完同一批次中的非简单材质撷取指令,才能继续执行。而在图14下半部具有指令移除装置的情形时,材质处理单元可连续地执行简单材质撷取指令而无须等待该像素着色器的执行结果。因此,与不具备指令移除装置的情形相比,该材质处理单元每执行N个像素可节省N×i个时脉,其中N代表该像素着色器在同一批次可执行的像素数量,而i代表非简单材质撷取指令的数量。
相较于图14所示,图15为一更详细的像素着色器与材质处理单元的处理流程图。在图15所示的例子中,该原始程序包含一个简单材质撷取指令[texld r1,s1,t0]与一其它指令[mov oC0,r1],且该像素着色器与材质处理单元在同一批次可执行4个像素。如同对图14的说明,则具有指令移除装置的该材质处理单元每执行4个像素可节省4个时脉。
图16为本发明指令移除方法的步骤流程图。该指令移除方法包括以下步骤步骤202 开始;步骤204 载入原始像素处理程式;步骤206 清除材质撷取指令表;步骤208 扫描该原始像素处理程式中的一个指令;步骤210 对该指令进行译码;步骤212 判别该指令是否为简单材质指令,若该指令为简单材质指令则进行步骤214,否则进行步骤216;步骤214 检查材质撷取指令表是否已满,若该材质撷取指令表已满则进行步骤216,否则进行步骤218;步骤216 将该指令写入新像素处理程序中;步骤218 将该简单材质指令写入该材质撷取指令表中;步骤220 判断是否仍有其它指令,若有其它指令则进行步骤208,否则进行步骤222;步骤222 准备执行该新像素处理程序并将材质处理命令传送至材质处理单元;步骤224 结束。
请参阅图17,为本发明指令移除方法的另一步骤流程图。图10所示的实施例是以材质撷取指令转换单元27替代图9中所示的材质撷取指令集中器26,而图17配合图10实施例的指令移除方法步骤流程图。该指令移除方法包括以下步骤步骤302 开始;步骤304 载入原始像素处理程式;步骤306 令K值为0,其中K为正整数;步骤308 扫描该原始像素处理程式中的一个指令;步骤310 对该指令进行译码;步骤312 判别该指令是否为简单材质指令,若该指令为简单材质指令则进行步骤314,否则进行步骤316;步骤314 检查该K值是否与材质处理单元中所预设的材质撷取指令表的容量相等,若该K值相等于材质撷取指令表的容量则进行步骤316,否则进行步骤318;步骤316 将该指令写入新像素处理程式中;步骤318 将该简单材质指令转换为材质撷取命令,并发出该材质撷取命令至材质处理单元,同时令K=K+1;步骤320 判断是否仍有其它指令,若有其它指令则进行步骤308,否则进行步骤322;步骤322 准备执行该新像素处理程式;步骤324 结束。
本发明的指令移除装置及其方法,可扫描图像处理程式中是否具有简单材质撷取指令,该简单材质撷取指令将会被直接传送至材质处理单元并从材质指令集中器中移除,以避免像素着色器在材质处理单元处理简单材质撷取指令之前先执行该指令,本发明指令移除装置及其方法除了可改进图像处理程序的效能与减少材质处理单元的闲置时间之外,还可以使该图像处理程序的实体缓存器得到有效的利用。
权利要求
1.一种指令移除装置,其包括指令扫描装置,其扫描一指令,以判定该指令是第一类型指令还是第二类型指令;材质处理单元;及像素处理单元;其中该指令扫描装置将被判定为第一类型指令的指令传送至该材质处理单元,并将被判定为该第二类型指令的指令传送至该像素处理单元,且该材质处理单元对该第一类型的指令进行处理后传送至该像素处理单元。
2.如权利要求1所述的指令移除装置,其中该指令扫描装置根据该指令是否已经过该像素处理单元处理来判定其指令类型。
3.如权利要求1所述的指令移除装置,其中该第一类型指令为简单材质撷取指令,而该第二类型指令为非简单材质撷取指令。
4.如权利要求1所述的指令移除装置,还包括一个指令集中器,用以收集该第一类型指令。
5.如权利要求4所述的指令移除装置,其中该指令集中器可转换该第一类型指令为一个材质着色命令。
6.如权利要求4所述的指令移除装置,其中该指令集中器包括指令表,用以储存该第一类型指令。
7.如权利要求4所述的指令移除装置,还包括一个指令转换单元用以转换该第一类型指令为一个材质着色命令。
8.如权利要求4所述的指令移除装置,其中该材质处理单元包括一个命令表用以储存该材质着色命令。
9.如权利要求1所述的指令移除装置,其中该第二类型指令被传送至该像素处理单元。
10.如权利要求1所述的指令移除装置,其中该像素处理单元是一个像素着色器。
11.如权利要求10所述的指令移除装置,其中该指令扫描装置根据该指令是否已经过该像素着色器处理来判定其指令类型。
12.如权利要求1所述的指令移除装置,还包括一个指令过滤器用以防止该第一类型指令被直接传送至该像素处理单元。
13.一种用于图像处理装置的指令移除方法,该图像处理装置包括像素处理单元、材质处理单元与指令扫描器,该指令移除方法包括以下步骤步骤一该指令扫描器根据一指令是否已经过像素处理单元处理来判定该指令为第一类型指令还是第二类型指令;步骤二将该第一类型指令储存至一个指令表;步骤三对储存至该指令表的该第一类型指令的格式进行转换;步骤四将该第一类型指令传送至该材质处理单元;步骤五将该第一类型指令从原始图像处理程式中移除;及步骤六产生新程式并将该新程式传送至该像素处理单元。
14.如权利要求13所述的指令移除方法,其中该第一类型指令为简单材质撷取指令而该第二类型指令为非简单材质撷取指令。
15.如权利要求13所述的指令移除方法,在判定该指令类型的步骤之前,还包括对该指令进行译码的步骤。
16.如权利要求13所述的指令移除方法,在判定该指令类型的步骤之后,还包括检查该指令表状态的步骤。
17.一种用于图像处理装置的指令移除方法,该图像处理装置包括像素处理单元、材质处理单元与指令扫描器,该指令移除方法包括以下步骤步骤一该指令扫描器根据一指令是否已经过像素处理单元处理来判定该指令为第一类型指令还是第二类型指令;步骤二转换该第一类型指令的格式;步骤三将该第一类型指令传送至该材质处理单元;步骤四将该第一类型指令从原始图像处理程式中移除;及步骤五产生新程式并将该新程式传送至该像素处理单元。
18.如权利要求17所述的指令移除方法,其中该第一类型指令为简单材质撷取指令而该第二类型指令为非简单材质撷取指令。
19.如权利要求17所述的指令移除方法,在判定该指令类型的步骤之前,还包括对该指令进行译码的步骤。
20.如权利要求17所述的指令移除方法,在传送该第一类型指令至该材质处理单元的步骤之后,还包括将该第一类型指令储存至该材质处理单元中的一个指令表的步骤。
全文摘要
本发明公开了一种指令移除装置及其方法。该指令移除装置可扫描图像处理程式以决定其中是否具有简单材质撷取指令。该简单材质撷取指令将会被直接传送至材质处理单元、并从原始图像处理程式中移除,以避免像素着色器在该材质处理单元处理该简单材质撷取指令之前先执行该指令。
文档编号G06T15/00GK1971614SQ20051011964
公开日2007年5月30日 申请日期2005年11月25日 优先权日2005年11月25日
发明者徐日明 申请人:矽统科技股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1