对视频数据进行内编码的方法和设备的制作方法

文档序号：7706297阅读：72来源：国知局

专利名称：：对视频数据进行内编码的方法和设备的制作方法
技术领域：
：本发明涉及对传输或存储的视频数据进行压缩和对显示的视频数据进行解压的视频系统。更具体地说，本发明涉及对视频凌t据进行内编石马的^L频系统和方法。
背景技术：
：-现频系统传输、处理和存储大量^L频数据。为创建视频显示，如视频电影，渲染视频系统将视频数据显示为多个数字图像，也称为"帧，，，由此模拟运动。为实现具有可接受的视频质量的视频显示，或使能够完全传输和存储，常规的视频系统在传输或存储之前修改视频数据。例如，视频系统对视频数据进行压缩和编码，以减少用于存储和传输的比特率。在常规的^L频系统中，使用视频编码器对视频数据进行压縮和编码，并使用视频解码器对视频数据进行解压和解码。视频编码器输出比特率降低和冗余减少的视频数据。也就是说，视频压缩技术可以去除视频帧内的空间冗余或连续视频帧之间的时间冗余。视频编码器和视频解码器可以配置为应用两类编码之一压缩视频流，即内编码和间编码(intercoding)。这两类编码以视频帧的统计特性为基础。当使用内编码对视频帧进行编码时，压缩基于通过使用帧内的空间冗余而包含在单个帧(要压缩的帧)中的信息。因此，内编码与任何其它帧无关。相反，间编码使用至少一个其它帧作为参考，并对要压缩的帧和参考帧之间的差异进行编码。因此，间编码基于视频数据中连续帧之间的时间冗余。视频压缩领域受国际标准的限制，如定义视频编码和解码统一要求的各种国际电信同盟(ITU)标准。通常，这些标准的发展基于来自行业的影响。此外，视频编码器和解码器的制造商也会根据国际标准修改或建立，并实现视频压缩的附加专有技术。尽管存在着国际标准和专有技术，但是仍然有改进视频压缩技术的需要。例如，由于显示的视频电影的质量直接取决于所用的视频压缩技术，所以视频压缩技术的任何改进均可使视频电影的观众更为满意。通过阅读以下的详细说明并参考附图，本发明的这些和其它方面、优点和新颖特点将变得非常明显。图1是具有编码端和解码端的视频应用系统的高级框图。图2是一个帧及其在宏块和子块中分割的高级说明。图3是一个说明方向的子块，根据该方向可以对子块进^f亍编码，其中每个方向表示根据本发明的八种预测模式之一。图4是根据本发明的一个选择预测模式的实施例的流程图。图5显示三个相邻的子块，其中两个子块用于对第三个子块进行编码。图6显示一个具有编码器和解码器的4见频装置，根据一个实施例结合了本发明的编码/解码理论。图7显示一个具有可记录媒体的制造产品，包含本发明的编码器/解码器的软件实现，设计用于根据一个实施例对装置进行编程以使其配备有本发明的编码/解码能力。图8显示一个具有视频发送装置和视频接收装置的系统，根据一个实施例结合本发明的编码/解码理论。图9a-9c显示4艮据三个备选实施例用于分别预测8x8、8x4和4x8子块的周围像素。具体实施例方式在以下说明中，参照构成其部分的附图，附图中通过举例说明的方式给出一些可实施本发明的具体实施例。应当理解，可采用其它实施例并可在不脱离本发明的范围的情况下啦支出结构上的更改。如有可能，在所有附图中将使用相同的标号表示相同或相似的元件。阐明了大量具体的详细资料，以便透彻地理解本发明。但是，本领域的技术人员将十分清楚，本发明可以无需这些具体详细资料或使用某些与此处说明同等的备选装置和方法实现。在其它情况下，对众所周知的方法、过程、元件和装置不作详细说明，以免不必要地混淆本发明的各个方面。各种操作将以一种有助于理解本发明的方式依次被描述为多个分立步骤，但是，描述的顺序不应被理解为意味着这些操作一定是顺序相关的。具体地说，这些操作不需要按介绍的顺序执行。短语"在一个实施例中"被反复使用。但是，该短语一般不表示同一个实施例，但它也可能表示同一个实施例。术语"包含"、"具有"和"包括"是同义词，除非在上下文中另有说明。图1是^L频压缩和解压系统1(以下称作'4见频系统1")的高级框图，具有编码设备3以及通过介质9连接到编码设备3的解码设备5。编码设备3包含视频编码器2、模式选择器14和緩沖器8。解码设备5包含緩沖器10、视频解码器12和模式选择器16。编码设备3接收视频序列20(一见频输入)，并对碎见频序列20进行编码以许多可能格式之一产生编码并由此压缩的显示。格式可以是适合于编码显示的"现场"流的隔行扫描格式。格式也可以是单个文件格式，其中每个编码显示存储在一个文件内的毗连块中。输入到编码设备3的^L频序列20可以是现场信号，例如由摄像机提供的，或以预定格式预先录制的序列。视频序列20包括数字视频的帧、由数字音频組成的音频片断、视频、图形、文本和/或音频(多媒体应用程序)的组合，或上述的模拟形式。如有必要，可以转换各种类型的输入信号，如模拟视频或先前压缩和编码的视频，以产生到编码设备3的适当输入。在一个实施例中，编码设备3可以接收RGB或YUV格式的视频。但是，只要提供适当的转换机制，编码设备3可以适合接收任何输入格式。用于将一种格式的信号转换为另一种格式的信号的转换机制在本领域是众所周知的。介质9可以是存储装置或传输介质。在一个实施例中，视频系统1可以在计算机上实现。编码设备3将编码的视频流(显示)发送到实现为存储装置的介质9。存储装置可以是视频服务器、硬盘驱动器、CD刻录机、读/写DVD驱动或任何其它能存储并允许检索编码的视频数据的装置。存储装置连接到可以选择性地从存储装置读取并对编码的视频序列解码的解码设备5。在解码设备5对选定的一个编码视频序列进行解码时，它会生成视频序列20的再现，例如用于在计算在另一个实施例中，介质9提供到另一台计算机的连接，该计算机可以是接收编码:，见频序列的远程计算才几。介质9可以是网纟各连接，如LAN、WAN、因特网等等。远程计算机内的解码设备5对其中包含的编码显示进行解码，并可以在远程计算机屏幕或监视器上生成视频序列20的再现。可以结合和补充图1所示和上述的一见频系统1的方面，以实现其它实施例。有许多其它实现符合本发明的范围。此类其它实现无需限制于视频，而可以包括音频或其它媒体形式。先有的视频编码技术通常将一帧(画面)分解成称为宏块的较小像素块。每个宏块可以由一个像素矩阵组成，通常是16x16的矩阵，定义进行编码的信息单元。因此，像素矩阵;故称为16x16的宏块。这些视频编码技术通常将每个16x16宏块进一步分解为更小的像素矩阵，例如8x8^f象素矩阵或4x4像素矩阵。以下将此类矩阵称为子块。在本发明的一个实施例中，一个16x16宏块^皮分为16个4x4子块。在另一个实施例中，一个16x16宏块浮皮分为8x8子块、8x4子块或4x8子块。本领域的技术人员将理解到，本发明同样适用于或轻易适合于使用其它子块或仅使用16x16宏块而无需将其分解为子块的系统。此外，先有的编码技术利用运动矢量提供运动补偿和运动估计。动作矢量描述通过x分量和y分量表示的方向以及16x16宏块或其各自子块的运动量，并作为比特流的一部分发送到解码器。如本领域已知，运动矢量用于双向编码的画面(B画面)和预测的画面(P画面)。视频编码器2进行离散余弦变换(DCT)对视频序列20进行编码和压缩。简言之，视频编码器2将视频序列20从空间、时间域转换为频域。视频编码器2的输出是被称为"DCT系数"的一组信号幅度。量化器接收DCT系数，并在编码期间为每个DCT系数值范围(或步长)分配一个值，如小的整数。量化允许更紧密地表示数据，但是导致了某些数据的丟失。在较精密标度上的量化导致较不紧密的表示(较高比特率)，但丟失的数据也较少。在较粗略标度上的量化导致较紧密的表示(较低比特率)，但丟失的数据也较多。模式选择器14与视频编码器2通信，并监视和控制视频序列20的编码。模式选择器14依照本发明确定预测模式，根据该预测模式视频编码器2对视频序列20进行编码。模式选择器14可以是处理器或一个或多个配置为依照本发明的方法操作的软件模块。为便于说明，图l将模式选择器14显示为与视频编码器2分离的组件。本领域的技术人员将理解到，模式选择器14的功能性可以和视频编码器2的功能性相结合。编码设备3的緩沖器8从视频编码器2接收编码和压缩的视频序列(以下称作"编码的视频序列")，并在将编码的视频序列发送到介质9之前调整其比特率。可能需要緩冲，因为各个视频图像可能包含不同数量的信息，导致从图像到图像的编码效率有所不同。由于緩冲器8的大小有限，所以可以使用到量化器的反馈环路以避免緩冲器8的溢出或下溢。表示的比特率是为了提供实时表示所必需处理的表示数据的比率。解码设备5执行编码设备3的相反功能。緩冲器10还用于调整输入的编码视频序列的比特率。视频解码器12结合模式选择器16对输入的视频序列进行解码和解压，重建视频序列。模式选择器16确定预测模式，根据该预测模式视频编码器2对输入的视频序列进行编码。解码设备5输出解码和解压的视频序列24,表示为"视频输出"(以下称作"解码的视频序列24")。视频解码器12从緩冲器10接收表示编码的视频序列的比特流(图1)。在一个实施例中，视频解码器是包含解码器控制器、VLC解码器(可变长编码，VLC)和重建模块的常规视频解码器，如MEPG-x解码器。本领域的技术人员了解这些元件的操作和功能。本领域的技术人员了解这些元件，并且这些元件在通常可得到的MPEG文档和出版物中描述了。图2是说明视频序列20的一部分视频帧30的图表。如上所述，已知的视频编码技术通常将视频帧30分解为宏块36、36a、36b、36c、36d。例如，视频帧30被分为16x16宏块36、36a、36b、36c、36d的矩阵。视频系统1从上到下从左到右对宏块36、36a、36b、36c、36d逐行进行编码，如通过虚线34所示，说明了例如内编码的次序。在所示的实施例中，虚线34在宏块36a即下一个要编码的宏块处结束。所有之前的宏块36、36b、36c、36d均已编码。宏块36a，作为所有宏块36、36a、36b、36c、36d的代表，在视频帧30下面更详细地示出了。视频系统1的视频编码技术将每个宏块36、36a、36b、36c、36d进一步分解为像素矩阵38,以下称作子块38。在一个实施例中，子块38是一个4x4的像素矩阵，其中16个像素标记为a、b、c.....p(以"行先"的方式)。位于宏块36a的子块38正上方的邻近宏块36b的相邻子块的边界像素，被标记为A、B、C、D。此外，位于子块38右上方的宏块36b的子块的边界像素，被标记为E、F、G、H。同样，位于宏块36a的子块38正左侧的邻近宏块36c的相邻子块的边界^f象素，被标记为I、J、K、L。位于子块38左下方的宏块36c的子块的边界像素，被标记为M、N、O、P。位于宏块36a的子块38左上方的宏块36d的子块的边界像素，^^史标记为Q。本发明的视频系统1将每个宏块36编码为内宏块。内宏块在没有运动补偿预测的情况下被转换编码。因此，内宏块不涉及之前或之后帧的解码数据。I帧是指完全由内宏块组成的帧。因此，I帧在不涉及之前或之后帧的情况下编码。I帧也称为"帧内"。图3是说明可能方向的子块38,根据该可能方向可以对子块38进4亍编码。才艮据本发明，可以对宏块36、36a、36b、36c、36d的子块以下面列出的九种模式(模式O、模式l.....模式9)之一进行内编码。也就是说，特定子块38可以从当前解码的当前子块上方的子块预测("垂直预测")、从当前子块的左侧子块预测("水平预测，，)或同时从左侧和上方子块预测("对角线预测，，)。模式l-8按预定的方向预测子块，并且模式0使用统一的平均，不按预定的方向预测。在图3中，每个方向表示根据本发明的八种预测模式之一。模式0:在此模式中，每个像素a-p通过下面的公式预测LjX+5+C+_D+/+1/+ii:+^+48。预期在此模式及以下模式中，"除法，，表示将结果向"负无穷大，，(-oo)舍入。例如，在模式0中，"+4"确保除法产生最接近整数的舍入。这也适用于其它模式。如果像素a-p的四个在当前编码的当前画面(帧)之外，则使用其余四个像素的平均进行预测。如果所有八个像素均在画面之外，则这个子块中所有像素的预测是128。因此在模式0中总是可以对子块进行预测。模式l.-如果像素A、B、C、D在当前画面之内，则以垂直方向预测像素a-p，如图3所示。也就是说，按以下方式预测像素a-p:<table>tableseeoriginaldocumentpage14</column></row><table>模式2:如杲^f象素I、J、K、L在当前画面之内，则以水平方向预测4象素a-p。也就是说，按以下方式预测像素a-p:<table>tableseeoriginaldocumentpage14</column></row><table>模式3:如果所有像素a-p均在当前画面之内，则使用此模式。此模式对应于以对角线方向预测，如图3所示。按以下方式预测像素a-p:<table>tableseeoriginaldocumentpage15</column></row><table>模式4:如果所有像素a-p均在当前画面之内，则使用此模式。这也是对角线预测。<table>tableseeoriginaldocumentpage15</column></row><table>模式5:如杲所有像素a-p均在当前画面之内，则使用此模式。这也是对角线预测。<table>tableseeoriginaldocumentpage16</column></row><table>模式6:如杲所有像素a—p均在当前画面之内，则使用此模式。这是对角线预测。<table>tableseeoriginaldocumentpage16</column></row><table>模式7:如果所有像素a-p均在当前画面之内，则使用此模式。这是对角线预测。<table>tableseeoriginaldocumentpage16</column></row><table><table>tableseeoriginaldocumentpage17</column></row><table>模式&如果所有像素a-p均在当前画面之内，则使用此模式。这是对角线预测。<table>tableseeoriginaldocumentpage17</column></row><table>在本发明的一个实施例中，模式选择算法确定选择九种^^莫式之一的标准。然后按照所选的模式对子块38进行编码。下面详细说明模式选择算法。图4是一个说明根据本发明的方法的过程流程图，其对包含视频帧流的视频数据进行编码，并选择一种预测模式(模式0-8)。在一个实施例中，该方法对视频帧的亮度部分(Y)进行编码。在步骤28中，例如当用户启动视频系统1时，该过程初始化视频系统1。初始化过程包括例如确定编码设备3是否运行以及是否正确连接以接收视频帧流。在步骤30中，该过程接收视频帧流，并将每个视频帧分为多个子块的矩阵，其中每个子块包含多个像素。如上所述，多个子块的矩阵可以包括宏块的一部分的4x4子块38。在步骤32中，该过程定义九种预测模式(模式0-8)，其中每种预测模式确定对目前的子块进行编码的模式。例如，该过程可以执行子程序以计算并定义模式(模式0-8)。在步骤34中，该过程选择九种预测模式(模式0-8)之一以对目前的子块38进行编码。在一个实施例中，该过程为每种模式计算误差值，确定提供最小误差值的模式并选择该模式对目前的子块38进行编码。一旦该过程选择了"最好的"预测模式对目前的子块38的像素进行编码，该过程就对最小误差值进行编码，并将压缩的比特流内的编码的最小误差值发送到解码器。最小误差值表示目前子块的预测像素与子块的原始像素之间的差异。差异可以使用如本领域已知的DCT、系数量化和可变长编码进行编码。解码器使用预测的像素和与原始像素的差异来准确地重建视频帧。该过程在步骤36结束。该过程提供了依照九种预测模式(模式0-8)之一对每个4x4子块38进行编码。由于如果直接编码这可能需要相当数量的比特，所以冲艮据本发明的视频系统1可以应用更有效的方式对模式信息进行编码。子块的预测模式与相邻子块的预测模式相关。图5通过三个示范子块A、B、C说明这一点。子块C是要在预测模式已知的子块A、B的帮助下进行编码(预测)的子块。子块A位于子块C上方，而子块B位于子块C左侧。在这种情况下，给出了子块C的最可能、次最可能等的预测模式的排序。下面列出了这种排序表的一个示例。该表分为十个分组(分组1-分组10)。在每个分组中，子块A的各自预测模式是恒定的(如在分组2中子块A的模式0是恒定的)，而子块B的预测模式改变。也就是说，一个分组内子块A的(恒定的)预测模式可以与该分组内子块B的九种预测模式之一相结合。对于子块A和B的每个预测模式组合，给出了一个九个数字的序列，一个数字对应于九种才莫式0-9中的一种。例如在分组3中，如果子块A和子块B的预测模式都是模式1，则字符串"l62530487"指示模式1即字符串中的第一数字是子块C的最可能的模式。模式6即字符串中的第二数字是下一个最可能的模式。在示范字符串中，模式7是最不可能的，因为数字7是字符串中的最后一个数字。该字符串将是表示编码的视频序列的比特流的一部分。因此，比特流包含表示子块C所用的模式的信息(ProbO-1)(见表l)。例如，该信息可能指出下一个最可能的内预测模式是模式6。注意，表中的"-"表示这种情况不会出现。表l中使用的术语"外部"指"帧外"。如果子块A或B在帧内，但不是内编码(如在P帧中，子块C可能是内编码，但子块A或子块B可以不是内编码)，则没有预测模式。本发明过程假定对此类子块使用模式O。<table>tableseeoriginaldocumentpage19</column></row><table><table>tableseeoriginaldocumentpage20</column></row><table><table>tableseeoriginaldocumentpage21</column></row><table><table>tableseeoriginaldocumentpage22</column></row><table><table>tableseeoriginaldocumentpage23</column></row><table>表1.关于预测模式的信息可通过将两个子块38的预测模式信息结合在一个码字中，进行有效地编码。然后，比特流包含结果码字，其中每个码字表示两个子块的预测模式。表2列出了0和80之间的编码号(CodeNo.)的示范二进制码字。第一子块的模式的可能性表示为ProbO,而第二子块的模式的可能性表示为Probl。<table>tableseeoriginaldocumentpage24</column></row><table><table>tableseeoriginaldocumentpage25</column></row><table><table>tableseeoriginaldocumentpage26</column></row><table><table>tableseeoriginaldocumentpage27</column></row><table>表2在九种预测模式(表1)和模式可能性(表1、表2)中，模式选择算法确定预测特定子块所根据的模式。在本发明的一个实施例中，该算法使用像素a-p和原始帧中的相应像素之间的绝对差之和(SAD)和上述模式可能性，来选择模式。SAD和可能性表用于为特定子块38选择模式。该算法对九种可能模式(模式0-8)的每一种计算参数uError。提供最小uError的模式即为子块38选择的模式。按照如下方式计算uError:uError=SAD((a，…,p),(原始帧〉)+rd—quant[uMBQP]*uProb,其中SAD((a,…,p)，(原始帧))是像素a-p和原始帧中的相应像素之间的绝对差之和，其中rd—quant[uMBQP]是由量化参数uMBQP索引的恒值表。uMBQP由下式主合出constU8rd一quarzt[32]=(U,1，1,U，2,2,2,2,3,3,3，4,4,5,5,6,7,7,8,9,1U2,13，15，17,19，21,24,27,30};以及其中uProb是模式出现的可能性，由在模式可能性表(表1)中的位置而定。例如，子块A的预测模式是模式1,且子块B的预测模式是模式1。字符串"162530487"表示模式1也是子块C的最可能模式。模式6是第二最可能的模式等等。这样，在该算法计算模式O的uError时，可能性uProb为5。此外，对于模式l，可能性uProb为0，对于模式2,可能性uProb为2，对于模式3，可能性uProb为4，以此类除对视频帧的亮度部分(Y)进行编码之外，本发明的视频系统1还可以预测视频帧的色度部分(U、V)。色度部分可以视为色度平面(u面和v面)。通常，色度平面(u面和v面)是亮度平面的四分之一大小。因此，在16xl6宏块中，相应的8x8像素块同时存在于U面和V面中。这些8x8的块被分成4x4的块。一4殳来讲，对色度块不传送单独的预测模式。而是将为Y面块传送的模式用作为U面和V面块的预测模式。图6示出了根据一个实施例结合本发明的理论的视频装置。如图所示，视频装置600包含编码器610和解码器620,分别连接到装置的输入和输出。如之前所述，编码器610设计用于4矣收视频帧数据，将各自的帧数据分为宏块和子块，并如上所述对子块进行选择性地内编码。解码器620设计用于接收内编码的子块，并还原视频帧数据，如上所述。编码器610和解码器620与如上所述的编码i殳备1和解码设备5的构成相似。在各种实施例中，编码器610和解码器620可以共享至少部分其构成表和编码/解码逻辑(如编码器610和解码器620的交叉块所示的)。在各种实施例中，视频装置600可以是无线移动电话、手掌大小的计算装置如个人数字助理、膝上型计算装置、台式计算装置、服务器以及其它类似的计算装置。在其它实施例中，视频装置600可以是电路板元件，如视频"附力。，，电路板(也称为子电路板)、母板以及其它类似的电路板。在另一些其它实施例中，而不是同时具有编码器610和解码器620,视频装置600可以只包含编码器610,如在视频摄像机的情况下，或只包含解码器620,如在DVD播放机、电3见机、显示监视器或机顶盒的情况下。图7显示了包含可记录々某体700的制造产品，该可记录々某体700具有实现上述编码设备1和/或解码设备5的软件实施例的编程指令。编程指令设计用于对视频装置710进行编程，以使^L频装置710配备有本发明的编码和解码能力。对于该实施例，视频装置710包含存储媒体712以存储至少部分实现编码设备1和/或解码设备5的软件实施例的工作备份，以及至少一个连接到存储媒体712的处理器714以执行编程指令。视频装置712可以是任何一个之前列举的示范装置或其它类似的寺见频装置。产品710可以是例如磁盘、光盘(CD)、DVD或其它类似的计算机可读媒体。在其它实施例中，产品710可以是分发服务器，通过专用和/或公共网络如因特网在线分发编码设备1和/或解码设备5。在一个实施例中，产品710是网页服务器。图8显示具有相互通信连接的视频发送器802和碎见频接收器804的示范系统，视频发送器802依照本发明的理论对视频进行编码，并将编码的视频提供给视频接收器802，而视频接收器802又对编码的-現频进行解码以再现3见频。-见频发送器802和一见频4娄收器804分别配备有上述编码设备1和解码设备5。视频发送器802的一个实例是视频服务器，而视频接收器的实例是连接到视频发送器802的客户装置。在各种备选实施例中，模式4和6的编码被简化，在预测要编码的子块的像素值中只使用要编码的子块上方的相邻子块的像素。更确切地说，在模式4和6下，要编码的子块的像素值按以下方式预测简化的模式43=(A+2*B+C+2)/4b,e=(B+2*C+D+2)/4c,f,i=(c+2*DE+2)/4d,g,j,m=(D+2*E+F+2)/4h,k,n-(E+2*F+G+2)/41,o=(F+2*G+H+2)/4P=(G+3*H+2)/4简化的模式63=(A+B+1)/2;b,i=(B+C+1)/2;c,j=(c+D+1)/2;d,k=(D+E+1)/2;1=(E+F+1)/2,=(A2*B+C+2〉/4f,m-(B+2*C+D+2)/4g,n-(c2*D+E+2)/4h,o-(D+2*E+F+2)/4P=(E+2*F+G+2)/4此外，模式7的编码被简化，在预测要编码的子块的像素值中只使用要编码的子块左侧的相邻子块的像素。更确切地说，要编码的子块的像素值按以下方式预测简化的模式73=(工+J"+1)/2;b=(工++K+2)/c,s=(J+K+1)/2;d,f=(J+2*K+L+2)/g.i=(K+Ij+1)/2;.h,j=(K+2化+Li+2)/4'.m,o,p=L;在另一些其它实施例中，宏块可以分为MxN子块，其中MxN可以是8x8、8x4或4x8代替。为了便于这部分的说明，如图9a-9c所示，MxN子块的像素将被称为Pij,其中下标i表示子块的行位置，并且在8x8和8x4子块的情况下可以假定为1到8的值，或在4x8子块的情况下假定为1到4的值，而下标j表示子块的列位置，并且同样在8x8和4x8子块的情况下可以々i定为1到8的值，或在8x4子块的情况下假定为1到4的值。如图所示，要编码的子块上方的相邻子块的预测器像素被称为to到t15，而要编码的子块左侧的相邻子块的预测器像素被称为1。到115。对于才莫式0-2，MxN子块的l象素值，无论MxN是8x8、8x4还是4x8,均按以下方式预测模式0如VtN和1o-1m可用，Pij=(to+…+tN+10+."+1M+N/2+M/2)/(M+N);否则，如只有t。-tN可用，py=(t0+…+tN+N/2)/N;否则，如只有1。-1m可用，Pij=(l0++lM+M/2)/M;否则Pij=128;i=0-(N-l),j-O-(M-l)。模式l如to-tfj可用i=0-(N-l)，j=0-(M-l)。模式2如V1n可用p『ii;i=0-(N-l),j=0-(M-l)。对于模式3-8,MxN子块的像素值按以下方式预测模式3如所有t(rtN和1()-1M均可用于预测<table>tableseeoriginaldocumentpage32</column></row><table>模式4如所有t(rtN和1Q-1M均可用于预测<table>tableseeoriginaldocumentpage32</column></row><table><table>tableseeoriginaldocumentpage33</column></row><table>模式5如所有t。-tN和1。-1M均可用于预测，则<table>tableseeoriginaldocumentpage33</column></row><table><table>tableseeoriginaldocumentpage34</column></row><table><table>tableseeoriginaldocumentpage35</column></row><table>模式7如所有to-tw和1o-1m均可用于预测<table>tableseeoriginaldocumentpage35</column></row><table>模式8如所有to-tN和10-1M均可用于预测，则<table>tableseeoriginaldocumentpage36</column></row><table>总结和后记因此，从上述说明中可以看出，已经描述了一种对一见频帧数据进行内编码和解码的新颖方法，包括编码器、解码器以及结合该方法的装置和系统。虽然根据以上实施例和应用实例对本发明进行了描述，但本领域的技术人员必须认识到，本发明并不限于所述实施例和应用实例。在所附权利要求的思想和范围之内，可以对本发明进行修改和变更。具体地说，本发明的部分或全部(如各种操作逻辑)可以在专用集成电路(ASIC)中实现。因此，描述应被-现为说明性的而不是对本发明的限制。权利要求1.一种设备，包括存储媒体；以及存储在所述存储媒体中的多个指令，所述指令设计为至少执行(a)对视频数据宏块进行内编码和(b)对内编码的视频数据宏块进行解码中选择的一项，其中内编码的宏块包含在第一预测模式下预测的像素值的4×4子块，其中像素值对角线依照以下中选择的一项进行预测a＝(A+2＊B+C+2)/4；b，e＝(B+2＊C+D+2)/4；c，f，i＝(C+2＊D+E+2)/4；d，g，j，m＝(D+2*E+F+2)/4；h，k，n＝(E+2＊F+G+2)/4；1，o＝(F+2＊G+H+2)/4；以及p＝(G+3*H+2)/4；其中a-d是4×4子块第一行的预测像素值，e-h是4×4子块第二行的预测像素值，i-1是4×4子块第三行的预测像素值，m-p是4×4子块第四行的预测像素值，以及A-H是4×4子块上相邻子块的像素的像素值。2.如权利要求1所述的设备，其中，所述指令还设计为执行对宏块进行内编码和对内编码的宏块进行解码中选择的一项，其中内编码的宏块包含在第二预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进行预测<formula>formulaseeoriginaldocumentpage3</formula>3.如权利要求2所述的设备，其中，所述指令还设计为执行对宏块进行内编码和对内编码的宏块进行解码中选^^的一项，其中内编码的宏块包含在第二预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进行预测<formula>formulaseeoriginaldocumentpage3</formula>其中I-L是4x4子块左侧的相邻子块的像素的像素值。4.如权利要求1所述的设备，其中，所述指令还设计为执行对宏块进行内编码和对内编码的宏块进行解码中选择的一项，其中内编码的宏块包含在第二预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进行预测a=(工+J+1〉/2;b=(I+2*J+K+2)/4;c,e=(J+K+1)/2;d,f=(J+2*K+L+2)/4;g,i=(K+L+1)/2;h,j=(K+2化+L+2)/4;l,n,k,m,o,p=其中I-L是4x4子块左侧的相邻子块的像素的像素值。5.如权利要求1所述的设备，其中，所述设备还包括连接到所述存储媒体的处理器以执行所述指令。6.如权利要求1所述的设备，其中，所述设备至少包括具有所述存储媒体和所述指令的编码器和解码器中选择的一项。7.如权利要求6所述的设备，其中，所述设备包括手掌大小的计算装置、无线移动电话、个人数字助理、膝上型计算装置、台式计算装置、机顶盒、服务器、光盘播放器、数字通用盘播放器、电视机和显示监视器中选择的一项。8.如权利要求6所述的设备，其中，所述设备包括具有集成视频能力的母板和视频子卡。9.一种设备，包括存储媒体；以及存储在所述存储媒体中的多个指令，所述指令设计为执行对视的一项，其中内编码的宏块包含在第一预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进行预测3=(A+B+1)/2;b,i=(B+C+1)/2;c,j=(c+D+1)/2;d,k=(D+E+1)/2;1=(E+F+1)/2;s=(A+2*B+C+2)/4f,m=(B+2*C+D+2)/4g,n=(c+2*D+E+2)/4h,o=(D+2*E+F+2)/4P=(E+2*F+G+2)/4其中a-d是4x4子块第一行的预测像素值，e-h是4x4子块第二行的预测像素值，i_l是4x4子块第三行的预测像素值，m-p是4x4子块第四行的预测像素值，以及A-H是4x4子块上方的相邻子块的像素的像素值。10.如权利要求8所述的设备，其中，所述指令还设计为执行对宏块进行内编码和对内编码的宏块进行解码中选择的一项，其中内编码的宏块包含在第二预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进行预测a=(I+0"+l)/2;b=(I+2*J+K+2)/4;c,e=(J+K+1)/2;d,f=(J+2*K+L+2)/4;g,i=(K+Ii+1)/2;h,j=(K+2*L+Ij+2)/4,.l,m,k,m,o,p=Ij;其中I-L是4x4子块左侧的相邻子块的像素的像素值。11.如权利要求9所述的设备，其中，所述设备还包括连接到所述存储々某体的处理器以执行所述指令。12.如权利要求9所述的设备，其中，所述设备至少包括具有所述存储媒体和所述指令的编码器和解码器中选择的一项。13.—种设备，包括存储媒体；以及存储在所述存储媒体中的多个指令，所述指令设计为执行对视频数据宏块进行内编码和对内编码的视频数据宏块进行解码中选择的一项，其中内编码的宏块包含在预测模式下预测的像素值的4x4子块，其中像素对角线依照以下中选择的一项进4亍预测a=(I+vJ+l)/2;b=(I+2*J+K+2)/4;c,e=(J+K+1)/2;d,f=(J+2*K+L+2)/4/g,i=(K+Ij+1)/2;h,j=(K+2*Li+Ij+2)/4;l,n,k,m,o,p=其中a-d是4x4子块第一行的预测像素值，e-h是4x4子块第二行的预测像素值，i-l是4x4子块第三行的预测像素值，m-p是4x4子块第四行的预测像素值，以及I-L是4x4子块左侧的相邻子块的像素的像素值。14.如权利要求13所述的设备，其中，所述设备还包含连接到所述存储i某体的处理器以执行所述指令。15.如权利要求13所述的设备，其中，所述设备至少包括具有所述存储媒体和所述指令的编码器和解码器中选择的一项。全文摘要提供简化的预测方法，以在多种预测模式下，对要编码的视频数据宏块的4×4子块的像素值进行预测。此外，提供预测方法，以在多种预测模式下，对要编码的视频数据宏块的非4×4M×N子块的像素值进行预测，包括8×8、8×4和4×8子块。本发明可以在视频设备的编码器和/或解码器中实现。对视频数据进行内编码的方法和设备。文档编号H04N7/34GK101505429SQ200910128919公开日2009年8月12日申请日期2003年6月12日优先权日2000年12月6日发明者G·J·孔林申请人:真实网络公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G.J.孔林
技术所有人：真实网络公司
我是此专利的发明人

上一篇：码分多址(cdma)无线系统的接收站及方法
上一篇：电子数据分发系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。