专利名称:在可重构处理器上映射和实现的运动补偿算法的方法
技术领域:
本发明涉及视频图像处理方法,特别是涉及一种在可重构处理器上映射和实现的运动补偿算法的方法。
背景技术:
在计算机技术与应用的发展历程中,人们对计算性能的追求是无止境的。传统上性能的获得有两种方式一是ASIC (Application SpecificIntegrated Circuit即专用集成电路)方式,针对特定的计算任务设计专用的集成电路。这种方法具有很高的执行速度和运算精度,但功能单一,灵活性差,要想实现不同的算法必须重新设计集成电路,开发成本和周期都很高;在现在深亚微米的工艺条件下,随着特征尺寸缩小,设计难度加大,制造成本飞速增加。当需要多种不同功能时,需要使用多种ASIC,给电路板级设计带来困难。另一种是GPP(General Purpose Processor即通用指令集处理器)方式。该方法灵活高,通过编写软件指令就可改变系统的功能。但指令的串行执行以及指令集的有限性、有限的运算单元、存储器带宽等限制使得GPP的性能、功耗等并不理想。由于新一代媒体处理要求高处理能力、低功耗和高灵活性,另一方面,媒体标准的多样化,未来标准的可扩展性要求,通用处理器以及固定的专用芯片无法实现这些方面的统一,而可重构的媒体处理则可以很好的实现要求,故可重构处理器为媒体处理提供了新的发展方向。可重构处理器主要由嵌入式处理器、PE阵列以及内存访问控制器、总线仲裁器等组成。其中,嵌入式处理器主要负责系统控制和进行小规模的,不规则的数据运算;PE阵列主要负责进行大规模的、高度并行的数据运算,是可重构处理器的核心运算单元。在嵌入式处理器的控制下,PE阵列的功能和结构可以进行重新配置。经过重新配置以后,PE阵列即转化成为类似于硬线连接(Hardwired)的逻辑,具备硬线连接逻辑(例如ASIC)的绝大多数优秀特征(如高性能、低功耗等)。PE阵列的这种特性,集中体现了“可重构”的理念,是可重构处理器与其他类型处理器,如依靠指令实现可编程(从而可以实现不同功能)的CPU 和DSP,的最本质区别。视频压缩算法(如H. 264, MPEG2等)有两种类型的计算一种是不可并行的计算(可由可重构处理器中的嵌入式处理器负责),其计算中控制和数据相关性强,有较多的转移分支;另一种则是可并行计算(可由可重构处理器中的PE阵列负责),可以归纳为基于块和宏块的并发操作、规则的数据依赖关系以及计算复杂度的高度集中三个方面。其中,具有并行计算特点的算法的计算量占整个编解码中的绝大多数,以H264帧间预测的所采用的MC(Motion Compensation即运动补偿算法)最具有代表性。经过标准测试码流 (foreman)评定,H. 264 HiP(High Profile)解码算法中MC占其比例的52%。故此,如果 MC算法的执行效率,对于解码H. 264Η Ρ 1080P030帧/秒的实现具有很高的意义。当前的可重构架构的实现方案中,如M. K. A. Ganesan “H. 264Decoder at HD Resolution on a Coarse Grain Dynamically ReconfigurableArchitecture,,in FieldProgrammable Logic and Applications, 2007. FPL2007. (XPP PACT 架构),只是集中研究了 MC算法中计算密集型任务部分,而并没有涉及MC算法的整体实现。一个典型算法在可重构类型的处理器上实现主要由三个子任务构成配置可重构阵列(66% ),数据通信 (27%),计算(7%)。由此可见,计算只占整体运行时间很少的一部分。另外,不论是在当前的可重构实现方案还是ASIC实现方案中,如S. Z.Wang,“ A new motion compensation design for H. 264/AVC decoder," in 2005 IeeeInternational Symposium on Circuits and Systems,都没有深入挖掘算法的并行性。使得数据传输的带宽非常大,计算效率不高。故在算法的实现的过程中,如何最大限度的挖掘程序间的并行性,动态协调PE阵列和嵌入式处理器的关系(软硬件划分),使之以较低的配置代价(时间代价与空间代价),最小的能耗代价,达到最优的实现结果,是算法实现的核心问题。
发明内容
本发明所要解决的技术问题是提供一种在可重构处理器上映射和实现的运动补偿算法的方法,能够减少配置可重构阵列的时间,减少数据通信代价以及提高算法的并行性。为了解决上述问题,本发明公开了一种在可重构处理器上映射和实现的运动补偿算法的方法,包括以下步骤步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写;步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。进一步地,所述采用嵌入式处理器进行软件执行包括以下步骤选择参考帧;解码并计算运动向量值,并对向量值进行编码;控制PE阵列的配置功能。进一步地,所述预测模式为单向预测,采用PE阵列进行硬件执行包括以下步骤内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。进一步地,所述预测模式为双向预测,采用PE阵列进行硬件执行包括以下步骤内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作;加权平均运算。进一步地,所述根据预测模式及宏块的分割模式对配置信息进行划分并编写包括以下步骤对亮度配置信息的划分,包括以下子步骤Cl,根据预测模式判断是否需要进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3 ;C2,进行转置操作;
C3,进行6抽头滤波的第一步操作;C4,判断是否需要进行四舍五入操作,如果需要,则进行四舍五入;反之,则进行步骤C5 ;C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,如果需要,则进行步骤C6,反之,则返回步骤C2 ;C6,进行6抽头滤波的第二步操作;对色度配置信息的划分,包括以下子步骤D1,根据子块的分割方式,对子块所有的数据,进行乘法操作;D2,根据子块的分割方式,对Dl步骤得到的数据进行加权相加;根据划分的亮度及色度配置信息进行编码。进一步地,所述对亮度配置信息的划分在子步骤C6之后,还包括以下子步骤C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤 C8 ;C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。进一步地,所述方法还包括步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作;步骤105,则采用第二次预测设定的配置信息重复步骤103得到第二次预测数据;步骤106,将两次预测得到的数据进行加权求平均,得到最终值。进一步地,Cl步骤中,如果预测模式满足y = 0或χ = 2中其中一个条件,则该预测模式不需要进行转置操作。进一步地,Cl步骤中需要进行转置操作的预测模式包括(2,0)、(1,0), (3,0), (1,1)、(1,3), (3,1)、(3,3), (2,1)、(2,3)。进一步地,C5步骤中,需要进行6抽头滤波的第二步操作的预测模式包括(0,2)、 (0,1) > (0,3), (2,0), (1,0), (3,0), (1,1)、(1,3), (3,1)、(3,3)。进一步地,C7步骤中需要进行转置操作的预测模式包括(1,1)、(1,3), (3,1)、 (3,3)、(2,0)、(1,0)、(3,0)、(2,2)、(1,2)、(3,2) ;C8步骤中需要进行加权平均操作的预测模式包括(1,1)、(1,3), (3,1)、(3,3), (2,1)、(2,3), (0,1)、(0,3), (1,0), (3,0), (1,2), (3,2)。与现有技术相比,本发明具有以下优点本发明的在可重构处理器上映射和实现的运动补偿算法的方法中,对于子块大小固定,子块的预测模式固定的情况下,具体的执行步骤是固定的,利用数据之间的并行性及可重构阵列,将操作步骤进行划分,也即是将具体的操作步骤分配到不同的配置信息上。采用并行流水操作,一套配置信息通过流水并行尽量完成一个子块内所有数据的一种类型的操作,如6抽头滤波的一步操作等,这样就可以减少一个子块内的数据进行同一操作而使得配置信息的不断切换,以减少配置信息的切换,另外采用流水操作,也可以提高执行效率。进一步地,由于H. 264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。其块尺寸范围很广泛(从16X16到4X4),每个宏块(16X16像素)可以4种方式分割一个16X16,两个16X8,两个8X16,四个8X8其运动补偿也相应有四种。而 8X8模式的每个子宏块还可以四种方式分割一个8X8,两个4X8或两个8X4及4个 4X4。更进一步,每个子块色度都有16种预测模式,亮度有64种预测模式。在宏块(16x16)的不同位置,子块大小相同,预测模式相同的情况下,其计算操作步骤相同,故不用严格按照块的分割方式从左到右从上到下来进行计算,可采用变换子块的执行次序,使得子块并行,以此来减少配置信息的切换次数,已达到减少配置信息操作时间的目的
图1是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例一的流程图;图2是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例二的流程图;图3是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中单向预测类型的宏块的分割方式及预测模式分布图;图4是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中的预测模式配置信息的划分流程图;图5是本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中的亮度的宏块分割方式及PE阵列划分的示意图。
具体实施例方式为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式
对本发明作进一步详细的说明。参照图1,示出本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例一,包括以下步骤步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行。其中,软件执行包括以下步骤Al,选择参考帧。宏块的不同子块对应于不同的参考帧位置,需要分别计算。A2,解码并计算运动向量值,并对向量值进行编码,使之变成配置信息组的索引号。A3,控制PE16xl6阵列(Processing Element,阵列处理单元)的配置功能。通过选择相应的配置信息来配置PE阵列,使PE阵列完成不同功能。前述三个方面计算中数据相关性较强且具有较多的转移分支,因此采用嵌入式处理器进行操作。进一步地,硬件执行包括以下步骤Bi,内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。B2,加权平均运算。
需要说明的是,对于硬件执行方面,若单向预测只用完成步骤Bi,双向预测需要完成步骤Bl和B2。步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写。配置信息是由预测模式以及宏块的分割模式所决定,计算复杂度差别很大,但是最基本的操作是相同的-6抽头滤波(亮度),4抽头滤波(色度)。另外,计算步骤在同一子块内部是相同的,行与行之间,列与列之间是相对独立的运算。具体的,对配置信息进行划分并编写包括以下步骤步骤1021,对亮度配置信息的划分。亮度配置信息的划分包括以下步骤Cl,根据预测模式判断是否进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3 οC2,进行转置操作,并将数据存储到PE8x8阵列(Processing Elemer^8x8即8x8 阵列处理单元,将PE16xl6分成4个PE8x8)内部的存储单元中后进行步骤C3。C3,进行6抽头滤波的第一步操作,并将中间数据存储到PE8x8阵列内部的存储单元中。C4,判断是否需要进行四舍五入操作,如果需要则进行四舍五入操作,反之,则直接进行步骤C5。C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,若是,则进行步骤C6,反之,则返回步骤C2。C6,进行6抽头滤波的第二步操作。此步操作需要根据预测模式选择对应于不同的参数配置。C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤 C8。C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。其中,Cl步骤中,进行转置操作的是为了将列数据操作通过转置后变成行操作,行操作可以减少重复数据的传输以及使操作规整化,因此如果预测模式满足y = 0或χ = 2 中其中一个条件,则该预测模式不需要进行列方向的滤波,即不需要进行转置操作,因此, 如果预测模式为(2,0)、(1,0), (3,0), (1,1)、(1,3), (3,1)、(3,3), (2,1)、(2,3)的其中
一种,则需要进行转置操作。C2步骤中,在进行转置操作时,还可以根据数据的不同规模对转置操作进行修正。C3步骤中,将6抽头滤波分成两个操作步骤,这是因为PE8x8内部计算单元的限制,同时为了实现最大限度流水并行操作。另外,因为在某些预测模式中,6抽头滤波操作并不需要进行第二步的运算。C4步骤中增加判断是否进行四舍五入操作的原因是保证块大小相同、但预测模式不同情况下,6抽头滤波的两步操作相同,以减少配置信息的套数来节省存储空间。其中, 如果预测模式为(1,2)、(3,2)、0,1) (2,3),(2,2)的其中一种,则需要进行四舍五入操作。 需要说明的是,对于某些已经判断是否需要进行四舍五入操作的预测模式,若在后续步骤中需要返回C2步骤进行转置操作后,则可以跳过C4步骤,无需进行第二次是否需要四舍五入操作的判断。C5步骤中,对于比较简单的预测模式,如(y,χ) = (0,2)-以1/4为精度,只需要进行步骤Cl到C6即可。对于较为复杂的操作如(y,χ) = (2,1)等,则需要进行前述的所有操作。其中,如果预测模式为(0,2)、(0,1)、(0,3)、0,0)、(1,0)、(3,0)、(1,1)、(1,3), (3,1)、(3,3)的其中一种,则需要进行6抽头滤波的第二步操作的预测模式。C7 步骤中,如果预测模式为(1,1)、(1,3)、(3,1)、(3,3)“2,0)、(1,0)、(3,0)“2,
2)、(1,2)、(3,2)的其中一种,则需要进行转置操作。C8 步骤中,如果预测模式为(1,1)、(1,3)、(3,1)、(3,3) “2,1) “2,3)、(0,1)、(0,
3)、(1,0)、(3,0)、(1,2)、(3,2)的其中一种,则需要进行加权平均操作。步骤1022,对色度配置信息的划分。对色度配置信息的划分包括以下步骤D1,根据子块的分割方式,对子块所有的数据,按照4抽头滤波的要求,对所有像素点进行乘法操作。采用此种方式可以减少冗余数据的传输,并将中间数据存储。D2,根据子块的分割方式,对前一步骤得到的数据进行加权相加。其中,宏块的色度成分为相应亮度的一半(水平和垂直各一半)。色度块采用和亮度块同样的分割模式,只是尺寸减半(水平和垂直方向都减半)。例如8x8的亮度块相应色度块尺寸为4x4。步骤1023,根据划分的亮度及色度配置信息进行编码。如果预测模式固定,则相应的配置信息的操作也固定,可将最终所得到的配置信息及中间数据的存取操作固定下来,连接成配置信息组,并且进行编码,则嵌入式处理器只需提供给PE阵列配置组编号,PE阵列则可查到相应的配置。进一步地,即使有些操作是固定的,配置信息中同样存在动态可变因素,如有些配置参数的选取,一套配置信息的循环次数等,这些可由嵌入式处理器根据具体实例情况进行调配。步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。具体操作如下E1,根据宏块的分割方式对PE16xl6阵列进行划分。其中,最小划分单元是PE8x8。E2,判断宏块的各个子块,将子块大小相同,预测模式相同的子块合并到同一个 PE8x8中,其余的子块按照原始的宏块分割方式和位置分配到剩下的几个PE8x8中。E3,嵌入式处理器提供相应的配置组序号进行配置,PE阵列进行计算。其中,先进行亮度的计算,然后进行色度的计算。本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例中,对于子块大小固定,子块的预测模式固定的情况下,具体的执行步骤是固定的,利用数据之间的并行性及可重构阵列,将操作步骤进行划分,也即是将具体的操作步骤分配到不同的配置信息上。采用并行流水操作,一套配置信息通过流水并行尽量完成一个子块内所有数据的一种类型的操作,如6-抽头滤波的一步操作等,这样就可以减少一个子块内的数据进行同一操作而使得配置信息的不断切换,以减少配置信息的切换,另外采用流水操作,也可以提高执行效率。
由于H. 264帧间预测是利用已编码视频帧/场和基于块的运动补偿的预测模式。 其块尺寸范围很广泛(从16X16到4X4),每个宏块(16X16像素)可以4种方式分割 一个16X16,两个16X8,两个8X16,四个8X8其运动补偿也相应有四种。而8X8模式的每个子宏块还可以四种方式分割一个8X8,两个4X8或两个8X4及4个4X4。更进一步,每个子块色度都有16种预测模式,亮度有64种预测模式。在宏块(16x16)的不同位置,子块大小相同,预测模式相同的情况下,其计算操作步骤相同,故不用严格按照块的分割方式从左到右从上到下来进行计算,可采用变换子块的执行次序,使得子块并行,以此来减少配置信息的切换次数,已达到减少配置信息操作时间的目的。参照图2,示出本发明的在可重构处理器上映射和实现的运动补偿算法的方法实施例二,进一步地,在实施例一的基础上还包括以下步骤步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作;步骤105,采用第二次预测设定的配置信息重复步骤103得到第二次预测数据;步骤106,将两次预测得到的数据进行加权求平均,得到最终值。下面结合具体实例对本发明的在可重构处理器上映射和实现的运动补偿算法的方法进行详细的说明。参照图3,示出一个单向预测类型的宏块(16x16)的分割方式及预测模式分布图。 其中0,1),(1,1), (0.,2), (0,1)代表不同的色度预测模式,亮度预测模式并未画出,主要原因是色度的64个位置的预测模式,对于与相同块大小操作均相同,只是配置的参数(64 组参数)不同。在算法的软硬件划分时,软件执行方面需要进行的操作是择参考帧。BlockO, blockl, block3是8x8模式的子块,其每个子块对应于不同的参考帧或者是同一参考帧不同位置,block2是8x8模式下的4x4子块,每个4x4子块对应于同一参考帧的不同位置,故需要逐个计算。解码并计算运动向量值,并对向量值进行编码。对预测模式0,1)的8x8子块进行编码使之成为9 ;对预测模式(0,1)的8x8子块进行编码使之成为1,以此类推,分别对4 个4x4子块对应的预测模式进行编码。(1,1)编码成为5,(2,1)编码成为9,(0,2)编码成为2。注意4x4子块,同8x8子块的即使第一步编码结果相同,由于其属于不同的分割模式,使得对应的配置信息组也是不同的,需要在第一步编码完成后,增加分块模式基数 (子块8x8基数为0,子块4x4基数为16)。硬件执行方面需要进行的操作则是由配置信息决定,具体配置信息如下对应的宏块分割方式以及预测模式,需要对8x8模式子块的(2,1),(1,1)两种预测模式进行配置, 对4x4子块的(1,1),(2,1), (0,2)进行相应的配置信息编写。由于模式较多,此处选择较为复杂的8x8模式子块(2,1)预测模式进行说明,其他的预测模式于此相似。参照图4,8x8模式子块(2,1)预测模式的亮度划分步骤如下经过判断得知,需要先将参考数据进行转置操作,转置完后,将数据暂存。进行6抽头滤波第一步操作,得到数据组1,中间数据暂存。
对数据组1的数据进行四舍五入操作得到数组2。经判断,数据组1和数据组2都需要进行转置操作,转置后,得到数据组3和数据组4,将数据组暂存。对转置后的数据组4进行6抽头滤波的第一步操作,得到的数据组5暂存,并且此处得到的数据不需要转置处理。进行6抽头滤波的第二步操作,此处将数据组3与数据组5的数据同时进行操作, 得到数据组6和数据组7,都是8x8数据组。经过判断可知此处不需要转置运算,需要进行加权求平均操作。对得到的两套8x8的数据组6和7进行加权求平均操作得到最终值。8x8模式子块(2,1)预测模式的色度划分步骤如下首先对4x4色度块(对应于8x8亮度块),进行4抽头滤波的第一步操作,并将中间数据暂存。采用不同的参数,对前一步得到的数据进行加权求平均操作。对2x2色度块亦采用同样的操作,但因为数据规模较小,可以将两步合并成一步操作,以减少配置信息的套数,及中间数据的传输。参照图5,然后将PE阵列(16x16)进行划分,分成4个PE8x8。针对于亮度,由于8x8模式子块其blockO与block3预测模式相同,可将其合并, 对并且通过嵌入式处理器对配置信息的动态可变部分进行调控。其具体实现分到PE16xl6 阵列左上角PE8x8。Blockl 分到 PE16xl6 阵列右上角 PE8x8。将4x4子块中预测模式相同的两个子块进行合并,具体实现分到PE16xl6阵列 (左下角PE8x8)4x4子块的剩余两个子块分配到PE16xl6阵列右下角PE8x8。针对于色度,则按照子块的分割模式,以8x8分割方式为基本单位,分配到对应的 4 个 PE8x8 上。因为此示例是单向预测,所以可以直接跳到结束位置。以上对本发明所提供的在可重构处理器上映射和实现的运动补偿算法的方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
权利要求
1.一种在可重构处理器上映射和实现的运动补偿算法的方法,其特征在于,包括以下步骤步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写; 步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。
2.如权利要求1所述的方法,其特征在于,所述采用嵌入式处理器进行软件执行包括以下步骤选择参考帧;解码并计算运动向量值,并对向量值进行编码; 控制PE阵列的配置功能。
3.如权利要求2所述的方法,其特征在于,所述预测模式为单向预测,采用PE阵列进行硬件执行包括以下步骤内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作。
4.如权利要求2所述的方法,其特征在于,所述预测模式为双向预测,采用PE阵列进行硬件执行包括以下步骤内插像素计算-以1/4为精度进行亮度的内插操作,以1/8为精度进行色度的内插操作;加权平均运算。
5.如权利要求1至4所述的方法,其特征在于,所述根据预测模式及宏块的分割模式对配置信息进行划分并编写包括以下步骤对亮度配置信息的划分,包括以下子步骤Cl,根据预测模式判断是否需要进行转置操作,如果需要,则进行步骤C2,反之,则进行步骤C3 ;C2,进行转置操作;C3,进行6抽头滤波的第一步操作;C4,判断是否需要进行四舍五入操作,如果需要,则进行四舍五入;反之,则进行步骤C5 ;C5,根据预测模式判断,是否需要进行6抽头滤波的第二步操作,如果需要,则进行步骤C6,反之,则返回步骤C2;C6,进行6抽头滤波的第二步操作;对色度配置信息的划分,包括以下子步骤Dl,根据子块的分割方式,对子块所有的数据,进行乘法操作;D2,根据子块的分割方式,对Dl步骤得到的数据进行加权相加;根据划分的亮度及色度配置信息进行编码。
6.如权利要求5所述的方法,其特征在于,所述对亮度配置信息的划分在子步骤C6之后,还包括以下子步骤C7,根据预测模式判断是否进行转置操作,若是,则返回步骤C2,反之,则进行步骤C8 ;C8,根据预测模式判断是否进行加权求平均操作,若是,则根据流水操作,并发处理及最大限度减少重复数据传输的要求,进行配置实现。
7.如权利要求1所述的方法,其特征在于,所述方法还包括步骤104,判断是否是双向预测,如果是,则进行步骤105,反之,则结束操作;步骤105,则采用第二次预测设定的配置信息重复步骤103得到第二次预测数据;步骤106,将两次预测得到的数据进行加权求平均,得到最终值。
8.如权利要求5所述的方法,其特征在于,Cl步骤中,如果预测模式满足y= 0或χ = 2中其中一个条件,则该预测模式不需要进行转置操作。
9.如权利要求5所述的方法,其特征在于,Cl步骤中需要进行转置操作的预测模式包括(2,0)、(1,0), (3,0), (1,1)、(1,3), (3,1)、(3,3), (2,1)、(2,3)。
10.如权利要求5所述的方法,其特征在于,C5步骤中,需要进行6抽头滤波的第二步操作的预测模式包括(0,2)、(0,1)、(0,3)、(2,0)、(1,0)、(3,0)、(1,1)、(1,3)、(3,1)、(3, 3)。
11.如权利要求6所述的方法,其特征在于,C7步骤中需要进行转置操作的预测模式包 :(1,1) > (1,3), (3,1)、(3,3), (2,0), (1,0), (3,0), (2,2), (1,2), (3,2) ; C8 步骤中需要进行加权平均操作的预测模式包括(1,1)、(1,3)、(3,1)、(3,3)、(2,1)、(2,3)、(0,1)、(0, 3)、(1,0), (3,0), (1,2), (3,2)
全文摘要
本发明提供了一种在可重构处理器上映射和实现的运动补偿算法的方法,包括步骤101,算法的软硬件划分,采用嵌入式处理器进行软件执行,PE阵列进行硬件执行;步骤102,根据预测模式及宏块的分割模式对配置信息进行划分并编写;步骤103,根据宏块的分割方式对PE阵列进行划分,嵌入式处理器提供相应的配置组序列号,PE阵列进行计算。本发明的在可重构处理器上映射和实现的运动补偿算法的方法,能够减少配置可重构阵列的时间,减少数据通信代价以及提高算法的并行性。
文档编号H04N7/32GK102572415SQ20101059380
公开日2012年7月11日 申请日期2010年12月17日 优先权日2010年12月17日
发明者刘雷波, 尹首一, 耿同生, 魏少军 申请人:清华大学