用于视频编解码器的多总线体系结构的制作方法

文档序号:7644676阅读:140来源:国知局

专利名称::用于视频编解码器的多总线体系结构的制作方法
技术领域
:本发明总地涉及集成的松流水线视频编解码器,并且更具体地涉及改善编码性能和能量消耗的视频编解码器体系结构内的多总线体系结构。
背景技术
:本领域技术人员很清楚数字视频技术的重要性。在过去的数年中,响应于视频压缩方面的进步和允许使用者通过网络录制(record)、操作、储存和发送(transmit)数字视频的应用,数字视频市场已经得到了迅猛的发展。由于压缩技术已经进步,发送和显示高质量数字视频的能力已经显著改善。此外,视频市场已经看到在录制、发送、接收和显示数字视频内容的视频设备的大小和能量消耗方面的有意义的减少。数字架构内的视频表征需要生成、发送、储存和处理非常大量的二进制数据。视频压缩通过在数字视频流内使用空间图像和时间运动压缩技术两者减少这种数据的量。许多压缩算法已经被发展为在空间域和时间域两者上压缩和编码数字视频数据。一种实例是限定方法和参数的H.264标准,在H.264标准中数字视频可以被编码和解码。图1一般地图示说明可以根据H.264标准被使用的视频编码体系结构。视频帧从外部源被接收并被分割为包括亮度块和色度块的视频分量宏块(macroblock)。这些宏块被处理来确定优选的编码或预测模式。用于宏块的预测模式的识别表征耗时的计算密集的方法,其中一组多样化像素数据被处理、操作、从存储器获取和储存于存储器。此外,该像素数据在视频编解码器内传送(delivery)到处理设备常常需要格式化过程,例如输入数据信号的并行化(deserialization)或解复用,从而处理部件可以适当地对数据执行操作。使过程更加复杂的是,适合的预测模式的识别是极度时间敏感的,其中所述模式必须在非常有限的时间窗内被确定。一般地,所有这些因素导致这样的设计,即牺牲压缩质量以满足视频编解码器的时序约束(timingrestraints)、能量消耗标准或者占用要求(footprintrequirements)。在帧间(inter)模式预测期间,当前宏块被提供到运动估计模块170并且从所述当前宏块时间上定位的(temporallylocated)参考帧从存储储存器190被获取。运动估计模块170相对于当前宏块迭代地分析多个参考块,以识别适合的运动矢量。如果这样的适合的运动矢量被识别,则帧间预测模块160可以通过对时间上定位的参考块执行一半和/或四分之一像素运算,来细微地调整运动矢量。由于所执行的非常大量的算术运算和在存储器中执行的读取和写入操作的次数,这些一半和四分之一像素运算可以是极度计算密集的。在帧内(intra)模式预测期间,帧内预测模块150相对于同一帧内在空间上定位的参考块分析该帧内的宏块。该分析试图识别参考块和用于宏块的相应帧内预测模式。该预测分析需要针对在测试下的每个参考块被生成和压缩的残差(residual)。该残差表征当前宏块和参考块之间的差别,所述残差被提供到直接整数变换模块110。所述残差使用整数变换被变换为一组空间频率系数。该变换类似于从时域信号到频域信号的变换。所述频率系数被提供到缩放和量化模块120,缩放和量化模块120随后生成量化和缩放的信号。实际上,量化过程以整数缩放因数来分割所述频率系数,从而截断所述信号。该过程通常在压缩的块中引入修正(modification),这在所述块稍后被再生时需要补mteο由编码过程引入视频信号的误差的量可以通过重构编码的帧被确定。重构通过去量化(dequantization)和去缩放(descaling)模块与逆整数变换模块140进行,去量化和去缩放模块与逆整数变换模块140反量化视频信号,导致再缩放的信号。该再缩放的信号然后被逆变换以产生重构的宏块。该重构的宏块可以与原始的宏块进行比较以识别由压缩过程引入的误差。因此,不同的预测模式的效果可以被比较以识别用于特定块的优选模式。一旦优选的模式已经被识别,熵编码器130编码所述宏块以进行发送。由于数字视频不断地在当今科技中起到越来越重要的作用并且数字视频市场迅速发展,优化数字视频的压缩和编码的重要性是显而易见的。这种优化中的一个重要因素是对减少计算延迟的需求。这对于这样的实时视频应用而言是尤为重要的,即包括视频会议、安全和监控、交互式游戏及其他的实时视频应用。这种优化中的另一重要因素是在视频编解码器体系结构内更有效地管理多样化的数据组的传输的能力。
发明内容本发明的实施方案涉及视频编解码器内的多总线体系结构,所述体系结构在所述视频编解码器内分离地(discretely)且有效地传输视频分量。该多总线体系结构提供相对地且本质上更有效的传输机制,因为各种总线被设计来特定地寻址在所述编解码器中被处理的视频分量或参数的独特特征。相比较,现有技术中,集中式系统试图在系统范围传输和处理体系结构内“配合(fit)”视频数据,这导致编解码器效率低下。在本发明的特定实施方案中,多总线体系结构支持流水线系统或松流水线系统,其中数据处理以大量并行体系结构执行。该体系结构使用分离的总线(discretebuses)传输视频块或数据(下称“对象”),所述分离的总线被设计来有效地发送特定的对象类型和/或分类。视频对象可以基于被传输的视频或数据的大小、功能和/或类型被限定。这些总线连接在特定处理部件中的相应并行逻辑单元内,从而对象被并行地传输和处理以改善编码性能和能量消耗。松流水线系统可以被认为是这样的系统,其中所述系统从这样的角度来看不是紧流水线的,即不是所有处理部件同时都是繁忙的,所述处理部件处理不同宏块的不同阶段。然而,存在同时地工作的处理部件,例如熵编码器和直接整数变换处理部件,所述直接整数变换处理部件被用于预测优化并且利用预测处理部件被同时地提供时钟。在本发明的一个实施方案中,多总线体系结构包括至少一个亮度总线、至少一个色度总线、至少一个运动矢量总线以及至少一个参数总线。这些总线的每个的特征涉及被传输于其上的对象的属性和在一个或更多个处理部件中对象的处理需求。这些总线结构允许硬件编码器以简单的方式操作大量数据集合并且导致可以以有效的方式被处理和整合到一起的一组硬件部件。例如,亮度总线的宽度可以是非常大的,从而对亮度块执行的操作可以对大量的并联规模执行,而无需并行化或解复用所述对象。在其他实施例中,多总线体系结构允许有效的数据获取过程,其中参考块从编解码器体系结构内的分布式高速缓冲存储器被有效地取回。尽管本发明的特征和优点被总地描述在本
发明内容部分和下面的实施方案内容中的具体说明部分,应当理解的是,本发明的范围不应被限定到这些特定的实施方案。许多附加的特征和优点对本领域技术人员来说,在阅读本文的附图、说明书和权利要求书的基础上将会是明显的。(17)现在将参照本发明的实施方案,本发明的实施例可以在附图中被图示。这些附图意图是图示说明性的而非限制性的。尽管本发明是在这些实施方案的上下文中进行描述的,但是应该理解,并非意图将本发明的范围限于这些特定实施方案。图1总地图示说明H.264标准所规定的典型的视频编解码器。图2是根据本发明的各种实施方案的多总线视频编解码器体系结构的系统等级示意图。图3是在根据本发明的各种实施方案的视频编解码器系统内的处理部件的总体示意图。图4是可以在根据本发明的各种实施方案的多总线视频编解码器体系结构内传送的不同对象类型和分类的实施例。图5是根据本发明的各种实施方案的帧内和帧间预测模块及相关联的总线接口的实施例。图6根据本发明的各种实施方案图示说明与帧间预测/运动估计模块连接的多个总线上的相关总线宽度的实施例。图7根据本发明的各种实施方案图示说明帧间预测/运动估计模块及其中的特定相关联处理逻辑单元的多总线接口。图8根据本发明的各种实施方案图示说明示例性并行运动估计处理逻辑单元和并行帧间预测逻辑单元,两者都具有相关联的总线接口。图9根据本发明的各种实施方案图示说明与帧内预测模块连接的多个总线上的相关的总线宽度的实施例。图10是根据本发明的各种实施方案的示例性熵编码器及相关联的总线接口。具体实施例方式在如下的说明中,出于解释说明的目的,阐明具体细节以提供对本发明的理解。然而,对本领域技术人员来说将会清楚的是,本发明无需这些细节也可以实现。本领域技术人员将理解,下面描述的本发明的实施方案可以以各种方式且使用各种装置来实现。本领域技术人员还将理解,附加的修改、变通以及实施方案落入本发明的范围,本发明可以提供实用性的附加领域也落入本发明的范围。因此,下面描述的实施方案为本发明的具体实施方案的示例,并且是意图要避免模糊本发明。说明书中提及“一个实施方案”、“实施方案”等是指结合所述实施方案所描述的具体的特征、结构、特性或功能被包含在本发明的至少一个实施方案中。在说明书不同地方出现的短语“在一个实施方案中”、“在实施方案中”或类似的短语不是必定都是指相同的实施方案。本发明提供视频编解码器内的多总线体系结构,所述体系结构提供传输系统,在所述传输系统中视频分量和参数被有效地发送。在本发明的特定实施方案中,多总线体系结构支持流水线/松流水线系统,其中数据处理以大量地并行的体系结构执行。该体系结构使用分离的总线传输视频或数据块(下称“对象”),所述分离的总线被设计来有效地发送特定对象类型和/或分类。这些总线连接在特定处理部件中的相应并行逻辑单元内,从而对象被传输和处理以改善编码性能、计算延迟和能量消耗。图2根据本发明的各种实施方案总地图示说明集成视频编解码器,其中使用多总线体系结构在所述编解码器内传输不同对象。该多总线体系结构提供相对更有效的视频传输机制,因为各种总线被设计来特定地寻址在所述编解码器内被处理的独特视频分量或参数。相对地,现有技术中,集中式系统试图在系统范围传输和处理体系结构内“配合”视频数据,这导致编解码器效率低。参照图2,多总线体系结构包括色度总线210、亮度总线220、运动矢量总线230以及参数总线MO,其中每个在所述集成编解码器内分离地传输对象类型和/或分类。这些不同对象类型和分类中的每个(稍后提供更加具体的描述)包括由相应的一个或更多个总线寻址的不同特征和处理需求。根据本发明的各种实施方案,亮度总线220传输亮度宏块、亮度参考块、亮度子块(例如,4x4对象、4x8对象……8x16对象)以及水平与垂直亮度像素矢量。色度总线210传输8x8色度对象和水平与垂直色度像素矢量。运动矢量总线230传输运动矢量对象(即,x、y运动矢量数据)。参数总线240传输数据对象,所述数据对象可以包括结构对象(例如,切片(slice)、最近邻(nearestneighbor)信息)和参数对象(例如,量化模式、预测模式等)。图2还提供一个实施例,其中多总线体系结构在所述集成编解码器内的各种处理部件之间提供相互连通性。本领域技术人员将意识到的是,在本发明的范围内,可以实现集成编解码器的许多其他相互连通性设计。该多总线体系结构的一个优点在于,数据以与处理部件内的并行逻辑单元等同和/或相关的并行格式被传送到处理部件,从而无需中间部件,例如串行化器和并行化器。如所示出的,帧间预测/运动估计处理部件250从分布式高速缓冲存储器280接收色度和亮度对象,并且从熵编码器235接收运动矢量信息,从而针对特定宏块的运动估计和帧间预测操作可以被执行。帧内预测估计处理部件255也从分布式高速缓冲存储器280接收色度和亮度对象(其中许多包括水平和垂直亮度像素矢量)。本领域技术人员将意识到的是,各种分布式高速缓冲存储器实施(包括将所述高速缓冲存储器分解为支持帧间预测处理部件250和帧内预测处理部件255的分离的高速缓冲存储器模块)可以被使用。复用器265或其他交换器件被提供来基于特定标准,从帧间预测处理部件250或帧内预测处理部件255选择亮度和色度对象。在一个实施方案中,该选择过程基于所述帧间预测处理部件是否能够在限定的一段时间内成功地识别适合的参考帧。如果这样的帧间预测参考帧没有被按时识别,则帧内模式预测被选择并且相应的预测亮度和色度对象被进一步发送到流水线中。残差处理部件260沿相应的总线接收色度和亮度对象两者并且生成针对这些部件的残差。这些残差在相应的色度和亮度总线上被传送到直接整数变换/量化和缩放处理部件观0,从而生成色度和亮度被变换、量化和缩放的系数。这些系数沿相应的色度和亮度总线被传输到熵编码器处理部件275。熵编码器处理部件275又沿对应于被编码的宏块的运动矢量总线接收运动矢量信息。熵编码器275根据若干不同的编码模式中的一个编码所述宏块。本领域技术人员将意识到,对于在集成编解码器内提供分离的亮度、色度、运动矢量以及参数总线的诸多益处。由于对象以有效且大量的并行方式被传输遍及(throughout)所述系统并且被传送到其中的所有必要的处理部件,诸如以下的性能问题全部被改善,即跨流水线处理部件的时序、集成存储器的大小和分布、能量消耗以及计算延迟。图3图示说明示出这样的方式的实施例,以所述方式视频可以被分割为相应的对象类型和对象分类。视频可以基于其大小、功能和/或类型被划分为对象。如所示的,视频被分割为包括亮度对象、色度对象和运动矢量对象的视频对象。亮度对象可以包括一维对象(例如水平和垂直亮度像素矢量)和二维对象(包括16x16宏块、4x4亮度对象、4x8亮度对象、8x4亮度对象、8x8亮度对象、8x16亮度对象、16x8亮度对象)以及一半和/或四分之一像素对象。这些各种亮度对象在不同的处理部件之间被传送在一个或更多个分离的亮度总线上。色度对象也可以包括一维对象(例如水平和垂直色度像素矢量信息)或二维对象(例如8x8色度对象)。运动矢量对象包括x、y运动矢量信息,所述x、y运动矢量信息使跨一个或更多个视频帧的宏块与参考块时间上相关。数据对象包括结构对象、内容对象和参数对象。结构对象包括与切片数据、最近邻数据等相关的信息。参数对象包括与量化模式、预测模式等相关的信息。内容对象包括与残差的直接整数变换中非零系数的数目相关的信息。由编码器处理的块具有相关联的内容nC。一般地,常量nC被估算为nA和nC的平均值,其中nA是左相邻(leftneighbor)中非零系数的数目,而nB是顶相邻(topneighbor)中非零系数的数目。在特定实施方案中,内容nC确定用于代码查询的表项目(tableentry)并且针对由编码器处理的块被动态地估笪弁。本领域技术人员将意识到的是,其他视频或数据信息可以被包括在对象中并且沿相应的总线在多总线编解码器体系结构内被传输。在并行流水线系统或松流水线系统中实施多总线体系结构允许在流水线中各种处理部件内被执行的操作的更有效时序。例如,当与对另一处理部件的后续操作所需的时间相比时,特定处理部件可以仅需要特定量的时间来完成其操作。在特定实施方案中,被传送到处理部件的并行数据的量可以根据处理所述数据所需的量和/或时间而改变。由于跨不同的处理部件执行的操作的量显著不同,跨处理部件的时序保持是一个挑战。具体地,特定处理部件可以需要大于流水线或松流水线中其他处理部件百倍的计算。在这样的流水线中保持时序的一个重要因素是,以并行格式传送数据块(即对象)的能力,这使能需要相对更大量计算的针对那些块的大量并行处理。图4是根据本发明的各种实施方案的处理部件的总体示意图。该示说明能够以这样的方式将大量并行对象传送到处理部件的优点,即对应于所述部件自身中内部并行处理路径的量的方式。这种能力通过移除一般在许多现有技术的系统中需要的格式化部件(例如SERDES(串行化器/并行化器))急剧减少总线接口硬件的大小。为清楚起见,大量并行总线可以被限定为具有大于132位的位宽。参照图4,处理部件具有多个耦合到不同总线的分离的总线接口。在该特定实施例中,处理部件410在第一总线415上接收第一对象。该第一总线具有对应于X并行位的第一总线宽度(I)。该第一对象被传送到第一组并行处理逻辑单元430,所述第一组并行处理逻辑单元430具有等于或大致等于宽度(I)的宽度(A)。因此,第一组并行处理逻辑单元430能够以在二者之间利用最少的格式化部件的方式无缝地连接第一总线415。第二对象在第二总线420上被传送,所述第二总线420具有对应于Y并行位的第二总线宽度(II)。该第二对象被传送到第二组并行处理逻辑单元440,所述第二组并行处理逻辑单元440具有等于或大致等于宽度(II)的宽度(B)。正如所述第一对象,所述第二对象以在二者之间利用最少的格式化部件的方式从第二总线420被无缝地传送到第二组并行处理逻辑单元430。本领域技术人员将意识到的是,所述第一和第二总线/并行处理逻辑单元之间宽度上的差别允许设计者改善所述第一和第二对象之间操作的时序。在这种情况下,假设所述第二对象需要比所述第一对象更多的计算,通过使第二总线420和第二处理逻辑单元440的宽度相对地大于第一总线415和处理逻辑单元430,在所述处理部件中每个对象的处理时间可以大致上是相等的。在本发明的特定实施方案中,通过使输出总线450、460的宽度对应于并行处理逻辑单元和输入总线,处理部件410中对象的有效通行(pass-through)被进一步加强。通过在处理部件上提供不同的时钟频率,在流水线/松流水线内跨处理部件保持时序的能力可以被进一步加强。如所示的,处理部件410具有被用于限定计算发生在所述部件上的速度的内部时钟470。如果特定部件具有比其他部件显著更大量的计算,则在这些特定部件上的时钟可以被增加以补偿计算计数微分并且使所述部件的时序更加一致。如上所示的,在流水线视频编解码器内使用不同总线大小传送不同对象的能力可以显著地改善流水线/松流水线内处理部件的相关时序和计算延迟性能。为进一步改善该性能,特定处理部件可以在流水线/松流水线内以并行方式操作或至少部分以并行方式操作,以进一步改善延迟性能。图5根据本发明的各种实施方案图示说明这样的实施例,在所述实施例中,帧内预测操作和帧间预测操作以并行方式被执行。在该实施例中,帧内预测计算和帧间预测计算两者都是在用于宏块的预测模式的选择之前以并行方式被执行。帧间和帧内计算的这种并行方式减少编码所述宏块所需的总时间。帧间预测处理部件520接收与运动估计相关的各种信息以及一半和/或四分之一像素计算。在该实施例中,参考亮度宏块在亮度总线522上从集成的高速缓冲存储器被接收。参考色度宏块在色度总线523上从所述集成的高速缓冲存储器被接收。运动矢量524在运动矢量总线5M上从运动估计模块或高速缓冲存储器被接收。参数信息(例如预测模式)在参数总线525上被接收。这些总线中的每个具有不同总线宽度,部分原因在于,被传输的对象类型和在帧间预测处理部件520内被执行的计算的量。帧内预测处理部件510接收与宏块的空间压缩相关的各种信息,包括χ和y平面上的相邻像素信息。在该实施例中,来自相邻块的水平和垂直亮度信息在亮度总线512上被接收。来自相邻块的水平和垂直色度信息在色度总线513上被接收。最近邻参数信息(例如帧内预测模式)在参数总线514上被接收。与帧间预测一样的是,这些总线中的每个具有不同总线宽度,部分原因在于,被传输的对象类型和在帧内预测处理部件510内被执行的计算的量。在本发明的特定实施方案中,基于给予帧间模式预测的优先权选择预测模式。如果帧间预测处理部件520能够识别时间上定位在另一帧中的可接受的参考块,则相应的预测模式被选择。然而,如果帧间预测处理部件520不能识别可接受的参考块,则帧内模式被选择。因为帧间预测和帧内预测处理部件以并行方式操作,在帧间模式处理部件520完成其计算之前,帧内预测处理部件510至少已经执行了其计算的一些。在许多情况下,帧间预测处理部件520需要执行显著地多于帧内预测处理部件510的操作。在本发明的特定实施方案中,帧间预测处理部件520以比帧内预测处理部件510更高的频率被提供时钟,以保持这两个部件之间的时序。此外,帧间预测处理部件510上的亮度总线接口522是充分宽的,从而一半像素和/或四分之一像素操作可以以实时的方式被执行,而无需储存参考块先前的一半和/或四分之一像素计算。相反,每当需要该数据时,针对参考宏块的一半和/或四分之一像素计算在短暂的时间段(即单个时钟周期)内被执行。因此,在一半和/或四分之一像素操作期间,存储器存取被显著地减少,进一步改善计算延迟。复用器580或其他选择器件被耦合到帧间和帧内预测处理部件上的输出总线。基于所选择的模式,一组总线被选择并从复用器580输出。在任何情况下,复用器580的输出包括亮度总线阳0、色度块555以及参数总线560,其中在亮度总线550上预测亮度块被传输,在色度块555上预测色度块被传输,在参数总线560上相应的参数信息被传输。本领域技术人员将意识到这样的多总线体系结构在并行处理部件之间提供使能适当时序的优点。此外,如稍后将被讨论的,多总线体系结构显著地减少在帧间预测中所需的存储器获取的次数,这进一步允许这两个处理部件之间的时序对称并且减少计算延迟。图6根据本发明的各种实施方案图示说明帧间预测/运动估计处理部件的多总线连通性。如所示的,帧间预测/运动估计处理部件610被耦合到不同总线,在所述不同总线上不同类型的对象被接收和发送。这些总线中每个的宽度都是不同的,以便利在总线上从并行对象到处理部件610中相应并行逻辑单元的相对无缝转换。不同总线上的这些变化的宽度支持被执行在通过处理部件610改进(progressing)的特定对象上的大量并行计算。帧间预测/运动估计处理部件610在其输入上被耦合到对色度总线620、亮度总线625和参数总线630。大部分计算被执行在亮度对象上,从而亮度总线625及相关联的内部并行逻辑单元包括数量最多的并行位,被示为Y。注意的是,总线宽度没有受到缩放,并且在许多实施方案中,亮度总线625的宽度显著地大于色度总线620或参数总线630。该大量并行总线允许处理部件针对亮度对象和亮度参考块内的非常大量的位,以并行方式执行操作。在特定实施方案中,该亮度总线625的宽度是充分大的,以使四分之一和一半像素计算能够在单个时钟周期内被执行,这避免在高速缓冲存储器内储存这样的计算的必要性以及显著地提高四分之一和一半像素操作可以被执行的速度,并且减少计算延迟。帧间预测/运动估计处理部件610还在其输出上被耦合到色度总线620、亮度总线625、参数总线630和运动矢量总线650。这些输出发送预测色度和亮度对象以及相关联的参数信息。在运动估计操作期间,输出运动矢量总线650输出计算的运动矢量。同样,这些总线中每个的宽度对应于被传送的对象的类型。图7根据本发明的各种实施方案图示说明在不同总线上且对应于帧间预测/运动估计处理部件内的内部并行处理逻辑单元的并行对象的更具体的表征。该图还图示说明在运动估计模块和帧间预测模块之间的处理部件内的并行总线结构。在该图中,帧间预测/运动估计处理部件710在色度总线715上接收色度对象,在亮度总线720上接收亮度对象并且在参数总线725上接收参数对象。同样,这些总线中每个的宽度将根据被传输的对象的类型而改变。色度对象在具有X-I位宽度的色度总线715上被传输到处理部件710,并且被并行色度处理逻辑单元730处理。预测色度块在色度总线760上被生成并传输。在本发明的一个实施方式中,预测色度块排他地基于被执行在相应亮度块上的操作被识别,从而并行色度处理逻辑单元730主要是在相应亮度块上提供来自分析的预测色度块的通行逻辑单元。在另一实施方式中,并行色度处理逻辑单元730连接帧间预测逻辑单元,所述预测色度块从所述帧间预测逻辑单元被生成。亮度对象在具有Y-I位宽度的亮度总线720上被传输到处理部件710,并且被并行运动估计处理逻辑单元735处理。该并行运动估计处理逻辑单元735具有与亮度总线720相同的宽度或者大致相同的宽度。并行运动估计处理逻辑单元735使用内部多总线结构740提供粗预测亮度块和运动矢量信息到帧间预测模块745。并行帧间预测逻辑单元745执行与时间预测中细微调整相关的特定计算,并且生成细预测亮度块和相应的运动矢量信息。细预测亮度块在亮度总线765上被传输,并且运动矢量信息在运动矢量总线770上被传输。另外,在特定实施方案中,细预测色度块在色度总线760上被传输。参数对象在具有Z-I位宽度的参数总线735上被传输到处理部件710,并且被并行参数处理逻辑单元750处理。参数对象相应于预测亮度和色度被生成并且在参数总线775上被传输。围绕帧间预测/运动估计处理部件710和在帧间预测/运动估计处理部件710内的该多总线体系结构允许对象时序通过处理部件710被保持。具体地,亮度对象需要基本上比色度对象和参数对象更多的计算。此外,在特定实施方案中,运动矢量排他地基于亮度对象上的计算被识别。因此,通过使用亮度总线和亮度处理逻辑单元,亮度对象、色度对象和参数信息之间的时序可以被保持。图8根据本发明的各种实施方案图示说明在运动估计模块和帧间预测模块之间的总线连通性的更具体的示意图。如所示的,当前亮度宏块或对象在第一亮度总线830上被提供,并且参数宏块在第二亮度总线835上被提供。使用当前亮度对象和参考宏块两者,相应的运动估计计算可以被逻辑单元执行。该实施例重点在于这样的事实,即实际上特定总线可以以并行方式提供多个对象,这将会进一步提高系统性能。并行运动估计处理逻辑单元还可以在接口825上接收状态、时钟和控制信息。并行运动估计处理逻辑单元生成粗预测亮度对象信息,所述信息可以包括预测亮度参考宏块和预测当前亮度对象及相应的运动矢量。预测亮度参考宏块在亮度总线845上被传输到并行帧间预测逻辑单元820。预测当前亮度对象在亮度总线840上被传输到并行帧间预测逻辑单元820。相应的运动矢量在具有N-I位宽度的运动矢量总线850上被传输到并行帧间预测逻辑单元820。并行帧间预测逻辑单元820在一半和/或四分之一像素分析中执行细时间预测。由于参考宏块的大量并行传送,针对参考宏块的四分之一和/或一半像素计算可以在非常短暂的时间段(例如一个或两个时钟周期)内被执行。因此,这些四分之一和一半像素计算并不需要被储存和后续获取,只是每当需要该信息时,这些四分之一和一半像素计算需要以实时的方式被执行。图9根据本发明的各种实施方案图示说明围绕帧内预测处理部件910的多总线体系结构。具体地,所述对象使用多个总线被传送到处理部件910并从处理部件910被发送。色度对象在色度总线915上被提供,在帧内预测处理部件910内被处理并且在色度总线940上被发送。如前面所讨论的,色度总线915和色度总线940的宽度等于或大致等于帧内预测处理部件910内的内部色度处理逻辑单元。亮度对象在亮度总线920上被提供,在帧内预测处理部件910内被处理并且在亮度总线950上被发送。亮度总线920可以传输亮度宏块或子块(所述宏块内的其他二维块)以及可以被用于帧内预测的水平或垂直相邻像素。同样,该总线的大量宽度允许帧内预测计算以并行方式被执行,从而帧内预测模式可以相对快速地被计算而减少针对参考块的存储器存取次数,减少计算延迟。参考对象在参考总线925上被提供,在帧内预测处理部件910内被处理并且在参数总线960上被发送。该参数对象可以包括参数信息,例如针对帧内预测块被识别的帧内模式。图10根据本发明的各种实施方案图示说明围绕熵编码器1010的多总线体系结构。熵编码器1010根据多个可用的编码模式中的一个来编码被变换、量化和缩放的残差宏块。这些编码模式的实施例可以包括由H.264标准定义的那些编码模式。为执行这些编码操作,熵编码器1010必须已经以及时的方式接收亮度、色度、运动矢量以及参数信息。根据本发明的各种实施方案,这些对象使用多个接口被传送到熵编码器1010。色度对象在色度总线1025上被提供,在熵编码器1010内被编码并且在压缩的视频流1020内被插入。色度总线1025的宽度可以被限定为X-I位宽并且对应于熵编码器1010内的处理逻辑单元。亮度对象在亮度总线1030上被提供,在熵编码器1010内被编码并且在压缩的视频流1020内被插入。亮度总线1030的宽度可以被限定为Y-I位宽并且也对应于熵编码器1010内的特定处理逻辑单元。在许多情况下,亮度总线1030的宽度将大于色度总线1025的宽度。运动矢量对象在运动矢量总线1035上被提供,在熵编码器1010内被编码并且在压缩的视频流1020内被插入。运动矢量总线1035的宽度可以被限定为N-I位宽并且同样也对应于熵编码器1010内的具体处理逻辑单元。在大多数情况下,运动矢量总线1035将小于色度总线1025和亮度总线1030。参数对象在参数总线1040上被提供,所述参数对象被用于编码其他对象。例如,参数对象可以包括编码模式,在所述编码模式中特定对象要被编码。另外,状态、时钟和控制信息也可以被提供到熵编码器1010。本领域技术人员将意识到的是,多总线体系结构可以被应用于编解码器体系结构内的各种处理部件。另外,本领域技术人员将意识到不同总线在长度上可以变化以支持不同类型的对象。此外,多总线体系结构可以支持单个高速缓冲存储器实施方式以及分布式高速缓冲存储器实施方式。尽管本发明存在各种修饰和可替换的形式,本发明的具体实施例已经在附图中被示出并且在本文中以细节被描述。然而,应当理解的是,本发明不被限制到所公开的特定形式,相反,本发明要覆盖落入所附的权利要求书的精神和范围内的所有修饰、等同内容以及可替换的内容。权利要求1.一种多总线视频编解码器体系结构,所述体系结构包括多个处理部件;高速缓冲存储器,所述高速缓冲存储器储存由所述多个处理部件中的至少一个处理部件使用的数据,以处理在所述视频编解码器体系结构中被编码的宏块;至少一个亮度总线,所述至少一个亮度总线耦合到所述多个处理部件中的至少两个处理部件,所述至少一个亮度总线具有第一宽度并且在所述至少两个处理部件之间传输多个亮度对象;至少一个色度总线,所述至少一个色度总线耦合到所述至少两个处理部件,所述至少一个色度总线具有第二宽度并且在所述至少两个处理部件之间传输多个色度对象;以及至少一个运动矢量总线,所述至少一个运动矢量总线耦合到所述至少两个处理部件,所述至少一个运动矢量具有第三宽度并且在所述至少两个处理部件之间传输多个运动矢M.fn息。2.如权利要求1所述的多总线视频编解码器体系结构,还包括耦合到所述至少两个处理部件的至少一个参数总线,所述至少一个参数总线具有第四宽度并且在所述至少两个处理部件之间传输参数信息。3.如权利要求2所述的多总线视频编解码器体系结构,其中所述第四宽度是与所述第一宽度、所述第二宽度和所述第三宽度不同的宽度。4.如权利要求1所述的多总线视频编解码器体系结构,其中所述第一宽度、所述第二宽度和所述第三宽度是不同的长度。5.如权利要求1所述的多总线视频编解码器体系结构,其中所述多个处理部件被设置在流水线处理系统中。6.如权利要求1所述的多总线视频编解码器体系结构,其中所述多个处理部件包括识别用于宏块的帧间模式的帧间预测/运动估计处理部件,所述帧间预测/运动估计处理部件耦合到所述至少一个色度总线、所述至少一个亮度总线和所述至少一个运动矢量总线。7.如权利要求6所述的多总线视频编解码器体系结构,其中所述至少一个亮度总线将从所述宏块时间上定位的多个参考块从所述高速缓冲存储器传输到所述帧间预测/运动估计处理部件。8.如权利要求7所述的多总线视频编解码器体系结构,其中所述高速缓冲存储器是分布式高速缓冲存储器。9.如权利要求7所述的多总线视频编解码器体系结构,其中所述帧间预测/运动估计处理部件包括并行色度处理逻辑单元,所述并行色度处理逻辑单元具有等于或大致等于所述至少一个色度总线的宽度。10.如权利要求7所述的多总线视频编解码器体系结构,其中所述帧间预测/运动估计处理部件包括并行亮度处理逻辑单元,所述并行亮度处理逻辑单元具有等于或大致等于所述至少一个亮度总线的宽度。11.如权利要求7所述的多总线视频编解码器体系结构,其中所述帧间预测/运动估计处理部件包括并行参数处理逻辑单元,所述并行参数处理逻辑单元具有等于或大致等于所述至少一个参数总线的宽度。12.如权利要求7所述的多总线视频编解码器体系结构,其中所述帧间预测/运动估计处理部件包括通过第一色度总线、第一亮度总线和第一运动矢量总线耦合的运动估计模块和帧间预测模块。13.如权利要求12所述的多总线视频编解码器体系结构,其中所述帧间预测模块被耦合到第二亮度总线,参考块在所述第二亮度总线上从所述高速缓冲存储器被取回,所述第二亮度总线具有足以允许在单个时钟周期内对所述参考块执行四分之一像素计算的宽度。14.如权利要求1所述的多总线视频编解码器体系结构,其中所述多个处理部件包括识别用于所述宏块的帧内模式的帧内预测处理部件,所述帧内预测处理部件耦合到所述至少一个色度总线和所述至少一个亮度总线。15.如权利要求14所述的多总线视频编解码器体系结构,其中所述帧内预测处理部件包括并行色度处理逻辑单元,所述并行色度处理逻辑单元具有等于或大致等于所述至少一个色度总线的宽度。16.如权利要求14所述的多总线视频编解码器体系结构,其中所述帧内预测处理部件包括并行亮度处理逻辑单元,所述并行亮度处理逻辑单元具有等于或大致等于所述至少一个亮度总线的宽度。17.如权利要求14所述的多总线视频编解码器体系结构,其中所述帧内预测处理部件包括并行参数处理逻辑单元,所述并行参数处理逻辑单元具有等于或大致等于至少一个参数总线的宽度。18.一种用于在视频编解码器内传输一组多样化对象的方法,所述方法包括从数字视频流生成多个色度块和多个亮度块;在视频编解码器内的分离的色度总线上传输所述多个色度块中的至少一个色度块,所述分离的色度总线具有第一宽度;在所述视频编解码器内的分离的亮度总线上传输所述多个亮度块中的至少一个亮度块,所述分离的亮度总线具有大于所述第一宽度的第二宽度;以及使用所述至少一个亮度块生成运动矢量并且在所述视频编解码器内的分离的运动矢量总线上传输所述运动矢量,所述运动矢量总线具有小于所述第一和第二宽度的第三宽度。19.如权利要求18所述的方法,其中所述视频编解码器以松流水线处理体系结构被配置。20.如权利要求18所述的方法,还包括以下步骤生成与所述至少一个色度块和所述至少一个亮度块相关联的参数信息;以及在具有小于所述第一和第二宽度的第四宽度的分离的参数总线上传输所述参数信息。21.如权利要求18所述的方法,其中所述分离的亮度总线被耦合到高速缓冲存储器并且获取用于帧间预测分析的参考亮度块。22.如权利要求21所述的方法,其中所述高速缓冲存储器为分布式高速缓冲存储器。23.如权利要求22所述的方法,其中四分之一像素计算在帧间预测分析中被执行,而没有从所述分布式高速缓冲存储器获取先前执行的四分之一像素数据。24.如权利要求18所述的方法,其中所述运动矢量总线被耦合在运动估计模块和帧间预测模块之间,并且所述运动矢量被生成在所述运动估计模块中并在所述运动矢量总线上被提供到所述帧间预测模块。25.一种多总线松流水线编解码器体系结构内的处理部件,所述处理部件包括第一总线接口,所述第一总线接口具有第一宽度,第一对象在所述第一总线接口上被接收,所述第一对象与压缩视频块的第一视频分量相关;第一组并行处理逻辑单元,所述第一组并行处理逻辑单元耦合到所述第一总线接口,所述第一组并行处理逻辑单元具有第二宽度,所述第二宽度等于或大致等于所述第一宽度,所述第一组并行处理逻辑单元对所述第一对象执行第一组算数运算;第二总线接口,所述第二总线接口具有第三宽度,第二对象在所述第二总线接口上被接收,所述第二对象与所述压缩视频块的第二视频分量相关;第二组并行处理逻辑单元,所述第二组并行处理逻辑单元耦合到所述第二总线接口,所述第二组并行处理逻辑单元具有第四宽度,所述第四宽度等于或大致等于所述第三宽度,所述第二组并行处理逻辑单元对所述第二对象执行第二组算数运算;以及时钟,所述时钟耦合到所述第一和第二组并行处理逻辑单元,所述时钟为所述第一和第二组算数运算提供时序。26.如权利要求25所述的处理部件,其中所述处理部件是运动估计/帧间预测处理部件并且所述第一总线接口是色度总线接口而所述第二总线接口是亮度总线接口。27.如权利要求25所述的处理部件,其中所述处理部件是帧内预测处理部件并且所述第一总线接口是色度总线接口而所述第二总线接口是亮度总线接口。28.如权利要求25所述的处理部件,其中所述时钟具有与所述松流水线体系结构内的至少一个其他处理部件中的至少一个时钟不同的频率。29.如权利要求28所述的处理部件,其中所述处理部件是运动估计/帧间预测处理部件并且所述至少一个其他处理部件是帧内预测处理部件。全文摘要本发明的实施方案涉及视频编解码器内的多总线体系结构,所述体系结构在所述编解码器内分离地且有效地传输视频分量。该多总线体系结构提供相对更有效的传输机制,因为各种总线被设计来特定地寻址在所述编解码器中被处理的视频分量或参数的独特特征。文档编号H04N7/26GK102238383SQ201110100518公开日2011年11月9日申请日期2011年4月21日优先权日2010年4月22日发明者A·鲁亚科斯,J·鲁宾斯坦申请人:美信集成产品公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1