视频编码方法

文档序号：6416407阅读：174来源：国知局

专利名称：视频编码方法
技术领域：
本发明涉及一种从数字音频和/或视频信号或从由模拟信号数字化的音频和/或视频信号生成具有可变比特速率的压缩数据流的编码方法，其中数据流的总的比特量不超过规定的极限。
本发明还涉及一种用于从数字音频和/或视频信号或从由模拟/数字变换器数字化的模拟音频和/或视频信号生成具有可变比特速率的压缩数据流的编码系统，其中数据流的总的比特量不超过规定的极限。
本发明还涉及一种可被装载到数字计算机的内部存储器的计算机程序产品，并且它包括软件代码部分以执行从音频和/或视频信号生成的具有可变比特速率的压缩数据流的编码方法，其中数据流的总的比特量不超过规定的极限。
这种编码方法和这种编码系统是从文件GB 2 349 025 A获知的，其中在第一步骤预先存储的视频材料整体地受到压缩，其传递第一编码的比特流，其总的比特量大大地超过规定的极限。在第二步骤，进行单次或重复地重编码第一比特流，以便从它生成以可变比特速率的、具有低于规定的极限的总的比特量的第二比特流。这个方法被提供用于DVD创作的应用。
一般原理是，在存储或传输音频视频材料时，诸如MPEG之类的信号压缩方法经常必须被使用，以便音频/视频材料可被记录在具有有限的存储容量的存储介质或经由有限带宽的传输信道被传输。另一方面，信号压缩通常与信息损失有关，信息损失越大，信号被压缩越强。信号可以这样的方式被压缩，即结果得到了具有恒定的比特速率的数据流，这意味着对于记录介质的给定的存储容量可以保证一定的记录时间。然而，由于音频和视频序列的复杂度随时间变化，所以这最终意味着在简单的序列的情形下浪费存储容量，而在更复杂的序列的情形下必须承受质量损失。所以，实际上，必须设置适当高的比特速率(以可能的记录持续时间为代价)，以便即使在最高复杂度的情形下，最终得到的信号仍达到良好的质量。
另一方面，通过诸如MPEG之类的现代压缩方法，生成的数据流的压缩深度和由此最终得到的比特速率可被动态地改变，使得有可能在记录期间按照要压缩信号的瞬时复杂度选择比特速率，其中必须同时仍旧保证平均数据速率不超过规定的极限，以便在存储介质上的打算的记录持续时间可以被遵守。然而，对于具有许多复杂的序列的音频或视频记录，这会导致所记录的数据流的质量变得更加糟糕，因为在记录期间不知道后面的视频序列将如何复杂。
为了克服这个朝着音频或视频记录的末端质量降低的问题，在专业应用中，正如在引用的文件GB 2 349 025 A中关于DVD创作描述的，整个-未压缩的-预先存储的视频材料在第一次运行中被分析，以便建立对于各个视频序列存在的比特速率要求，以便达到尽可能均匀地高的记录质量。只有在第二次运行或在重复多次的运行中才按照以前的分析结果进行材料的最后编码。
对于已知的编码方法和已知的编码系统已经出现的缺点是不可能实时地进行音频或视频材料的存储和压缩或处理。虽然这在专业应用中是可接受的，其中高质量的存储结果比起实现它所需要的时间来说是主要的考虑，但不合理的是期望私人用户在实际记录时间后必须花费相当大的附加时间，用于分析和最后存储他的音频或视频记录。
本发明的目的是创建按照在第一段中规定的通用类型的编码方法、按照在第二段中规定的通用类型的编码系统和按照在第三段中规定的通用类型的计算机程序产品，其中避免了上述的缺点。为了达到上述的目的，在这种编码方法中提供了以下的进一步的步骤-把音频和/或视频信号放置在临时缓冲器的中间存储器中，-相对于信号波形的复杂度来分析音频和/或视频信号，以便得到复杂度信息，-放置在临时缓冲器的中间存储器中的音频和/或视频信号被划分成各个分段，-音频和/或视频信号被从临时缓冲器中逐个分段地读出，并且与分配给它们的复杂度信息一起受到用于信号压缩的压缩方法的处理，其最后提供具有可变的比特速率的数据流，其中比特速率作为复杂度信息和为所讨论的分段而提供的分段总比特量的函数被分布在该分段内，以及-数据流被存储在存储装置中或经由数据传输设备被发送。
为了达到上述的目的，在这种编码系统中还提供以下的部件-临时缓冲器，其中可以写入音频和/或视频信号，-分析装置，用于相对于信号波形的复杂度来分析音频和/或视频信号，其中可以生成复杂度信息，-控制装置，用于把存储在临时缓冲器中的音频和/或视频信号划分成各个分段，-压缩装置，用于把音频和/或视频信号变换成具有可变比特速率的压缩数据流，其中音频和/或视频信号可以从临时缓冲器逐个分段地被读出，并与分配给它们的复杂度信息一起被传送给压缩装置，其中压缩装置以这样一种方式被控制，即生成的数据流的比特速率作为复杂度信息和为所讨论的分段而提供的分段总比特量的函数被分布在该分段内，以及-存储装置或数据传输装置，用于存储或发送数据流。
作为按照本发明的特征的结果，达到了较高的记录质量而没有对于用户出现用于音频和/或视频信号的分析的可觉察的等待时间。实际上，按照本发明的方法可被实时地实施，并且按照本发明的系统可被实时地运行，因为在临时缓冲器的第一分段用音频和/或视频信号进行写入之前只发生了小的时间位移，从该时间起可以实时进行信号的分析和压缩。如果硬盘被用作存储器介质，则由于写访问引起的附加时间位移处在毫秒的量级，所以可被忽略。对于传统的方法，实施时间需要在实现完全压缩之前的要被处理的音频和/或视频材料的两个完整操作，与传统的方法相比较，所需要的附加时间由此限于写入一个分段的持续时间。
此外，作为按照本发明的特征的结果，不再存在下述的风险如果基本的音频和/或视频序列是非常复杂的，则最终得到的数据流的质量在记录或发送的末尾将降低。
按照如权利要求2和10中所要求的措施，得到了临时缓冲器的分段划分可以非常灵活地处理的优点。
按照如权利要求3和11中所要求的措施，得到了下述的优点可以避免在独立的存储区域或临时缓冲器的存储单元之间的访问冲突。当例如音频和/或视频信号被写入到第一存储区时，信号可以同时从第二存储区被读出、分析和压缩，如果必要的话。一旦分段被处理，就在两个存储区之间进行切换。
当存储在临时缓冲器中的音频和/或视频信号被划分成相等长度的分段时，得到了在技术上实现起来简单的本发明的实施例。实施起来更复杂但相对于可达到的质量是更有利的本发明的实施例是这样的其中存储在临时缓冲器中的音频和/或视频信息的分段的长度可以作为信号复杂度的函数以自适应的方式进行改变。这意味着，如果分析揭示在分段中存在高复杂度的序列，则随后的序列在时间上被缩短，或分配给它们的分段总的比特量增加，预期将发生另外的复杂序列。
按照如权利要求6和13中所要求的措施，得到了下述的优点音频和/或视频信号相对较弱地被预压缩，即以高的质量被预先存储，这简化了它们后面最终的压缩，并且尤其是能够减小临时缓冲器的大小。在本发明的一个尤其有利的实施例中，与它们的预压缩同时进行的是就音频和/或视频信号波形的复杂度来分析它们，并将从而得到的复杂度信息与音频和/或视频信号一起存储在临时缓冲器中，用来在以后的压缩过程中进一步使用。由此得到的复杂度信息可包括例如从MPEG压缩得到的运动矢量。
按照如权利要求8中所要求的措施，在编码过程期间，可以完成用于以后分段的编码的比特量的保留。
按照如权利要求14中所要求的措施，并行并互相独立地运行的程序进程可以保证按照本发明的编码系统的最大运行可靠性和稳定性。
按照如权利要求15中所要求的措施，提供了一种计算机程序产品，它可被直接装载到数字计算机的内部存储器并且它包括软件代码部分，其中当该产品在计算机中运行时，按照本发明的编码方法的步骤利用计算机来实施。
下面说明本发明的另外的特征和优点。
参照附图上示出的实施例的例子将进一步描述本发明，然而，本发明并不限于所述实施例的例子。

图1以方框图的形式示出了按照本发明的编码系统的第一实施例。
图2以方框图的形式示出了按照本发明的编码系统的第二实施例。
图3以方框图的形式示出了按照本发明的编码系统的第二实施例的变型。
图1以方框图的形式示意性地示出了按照本发明的编码系统。编码系统开头包括具有模拟/数字变换器1的输入级，其把输入的模拟音频和/或视频信号AN-AV变换成数字信号，并把它们发送到预压缩装置2。数字音频和/或视频信号DIG-AV可以通过不用准备就发送到预压缩装置2的输入端而被直接处理。预压缩装置2作为任选项被提供，以便轻微地预压缩输入的音频和/或视频信号，从而导致减小系统中的数据流速率和所需要的存储器的容量的结果。预压缩装置2可包括例如用于MPEG压缩的集成电路。然而，信号也可以由预压缩装置2不压缩地被馈送通过。
未压缩的和稍微预压缩的音频和/或视频信号P-AV从预压缩装置2传送到临时缓冲器3的输入端，其中它们在控制装置8的控制下被写入到存储器。临时缓冲器3可包括诸如硬盘之类的磁盘驱动器或诸如RAM模块之类的半导体存储器。在当前情形下，临时缓冲器3包括两个半导体存储区3a1和3a2，它们也可以采取分开的单元的形式。转换开关3c1和3c2确保在写入和读出数据期间可以在两个存储区之间进行的转换，以便预压缩的音频和/或视频信号P-AV例如可被写入到存储区3a1，而同时从存储区3a2读出以前存储的数据，用于以后分析。一完成写入和读出过程，就在存储器之间进行转换，结果可以排除访问冲突。写入和读出由此以分段的方式来进行，其中存储区的尺寸规定了特定分段s1、s2的最大尺寸。
控制装置8负责把要写入到临时缓冲器的音频和/或视频信号划分成各个分段s1、s2，其中固定的分段长度或分段长度自适应地调节到匹配于特定的信号复杂度是可能的。
从临时存储器3的分段s2读出的音频和/或视频信号被发送到分析装置4，在其中相对于它们的波形的复杂度来分析它们，并且由此得到的信息然后用作复杂度信息C-INF，用于音频和/或视频信号的最终压缩。
音频和/或视频信号的最终压缩在压缩装置5中进行，在其中读入的音频和/或视频信号被逐个分段地变换成具有可变比特速率的数据流CAV，其中生成的数据流的比特速率作为复杂度信息C-INF和为特定的分段而提供的总比特量的函数被分布在该分段内，以便得到最终得到的信号的均匀的高质量。在所有的情形下，最终得到的数据流CAV的总的比特量/速率保持为低于规定的极限，该规定的极限取决于其中存储数据流CAV的存储装置6或经由它发送数据流CAV的发送装置7的性质。所使用的存储装置是磁的、磁-光的、或光的存储介质，例如硬盘、DVD+R(W)、DVD-R(W)等等。压缩装置5可以按照例如MPEG2或MPEG4标准运行。
所给出的编码系统例如可以被实现为存储在存储介质(软盘、CD-ROM、硬盘)上的软件产品，其被装载到传统的个人计算机的内部存储器中，所述计算机配备有用于处理和存储音频和/或视频信号的适当的接口卡。也可能将整个编码系统作为可被安装在DVD记录器中的、称为CODEC的高度集成的半导体芯片来提供。对于PC中的编码系统的方案和作为CODEC的方案，该系统都是内部地被计算机程序控制，其中多个计算机进程(任务)在运行，并且第一程序进程控制音频和/或视频信号的处理，直到并包括它们在临时缓冲器中的存储，以及并行运行的第二程序进程控制音频和/或视频信号的处理，将它们从临时缓冲器中逐个分段地读出，直到最终得到的数据流被存储或被发送。
图2以方框图的形式示意性地示出了按照本发明的另一个编码系统。像第一实施例那样，第二实施例包括具有模拟/数字变换器1的输入级，用于把输入的模拟音频和/或视频信号AN-AV变换成数字信号，以便把它们发送到预压缩装置2。数字音频和/或视频信号DIG-AV被直接发送到预压缩装置2。然而，与图1的实施例相反，预压缩装置2直接与分析装置4一起运行，这样与音频和/或视频信号的预压缩同时进行的是关于它们的复杂度的这些信号的分析，并且最终得到的复杂度信息C-INF在控制装置8的控制下与预压缩的音频和/或视频信号P-AV一起被存储在临时缓冲器3中，其中控制装置8使用来自分析装置4的信息，用来对临时缓冲器3进行分段。
缓冲器3由此被设计为环形缓冲器3b，它具有多个分段s1、s2、...、si，其尺寸可由控制装置8控制。写入到分段s1、s2到si和从分段s1、s2到si读出顺序地进行，其中在分段si后再次寻址到分段s1。
图2所示的编码系统的其余的设计相应于图1所示的设计。与复杂度信息C-INF一起，预压缩的音频和/或视频信号P-AV从缓冲器3中被逐个分段地读出，并被传送到压缩装置5，在其中进行变换到具有可变比特速率的数据流CAV，其中生成的CAV的比特速率作为复杂度信息C-INF和被提供用于所讨论的分段的总比特量的函数被分布在该分段内，以便得到最终得到的信号的均匀的高质量。
数据流CAV然后被存储在存储装置6中或经由发送装置7发送。像第一实施例那样，这个实施例也可以例如在传统的个人计算机中或作为硬件Codec被实现，可以具有适当的计算机程序控制。
图3以方框图的形式示意性地示出了如图2所示的按照本发明的编码系统的实施例的变型。这个第三实施例与第二实施例的不同点在于，预压缩装置2不直接与分析装置4一起运行，而是与它分开。从预压缩装置2发出的音频和/或视频信号P-AV被写入到临时缓冲器3，并且也被引导到分析装置4，在其中音频和/或视频信号被分析，并且最终得到的复杂度信息C-INF被加到在临时缓冲器3中的预压缩的音频和/或视频信号P-AV，以便进一步使用。所以在这个实施例中，信号分析是在音频和/或视频信号的中间存储期间进行的。用于这个实施例的计算机程序控制可包括三个进程，其中第一进程负责信号处理，直至音频和/或视频信号被写入到临时缓冲器3，第二进程负责分析，以及第三进程从临时缓冲器3中读出存储的音频和/或视频信号和复杂度信息C-INF，并且负责把音频和/或视频信号最后压缩成CAV信号。
如图3所示的压缩系统的实施例的剩余部件相应于图2所示的部件。所以，对于这些部件的描述，可参考以上的说明。
权利要求
1.一种从数字音频和/或视频信号(DIG-AV)或从由模拟信号(AN-AV)数字化的音频和/或视频信号(P-AV)生成具有可变比特速率的压缩数据流的编码方法，其中数据流的总的比特量/速率不超过规定的极限，其特征在于-把音频和/或视频信号(P-AV)放置在临时缓冲器(3)的中间存储器中，-相对于信号波形的复杂度来分析音频和/或视频信号，以便得到复杂度信息(C-INF)，-放置在临时缓冲器(3)的中间存储器中的音频和/或视频信号被划分成各个分段(s1，s2…si)，-音频和/或视频信号从临时缓冲器(3)被逐个分段地读出，并且与分配给它们的复杂度信息(C-INF)一起受到用于信号压缩的压缩方法的处理，其最后提供具有可变比特速率的数据流(CAV)，其中比特速率作为复杂度信息和为所讨论的分段而提供的分段总比特量的函数被分布在该分段内，以及-数据流被存储在存储装置(6)中或经由数据发送设备(7)被发送。
2.如权利要求1中要求的编码方法，其特征在于，临时缓冲器(3)被组织为环形缓冲器(3b)。
3.如权利要求1中要求的编码方法，其特征在于，临时缓冲器(3)包括至少两个独立的存储区(3a1，3a2)或存储单元，音频和/或视频信号(P-AV)可以逐个分段地被交替地写入其中或从其中读出。
4.如权利要求1中要求的编码方法，其特征在于，存储在临时缓冲器(3)中的音频和/或视频信号被划分成相等长度的分段。
5.如权利要求1中要求的编码方法，其特征在于，存储在临时缓冲器(3)中的音频和/或视频信号的分段的长度可以作为信号复杂度的函数自适应地改变。
6.如权利要求1中要求的编码方法，其特征在于，音频和/或视频信号在其被存储在临时缓冲器(3)中之前受到预压缩。
7.如权利要求6中要求的编码方法，其特征在于，在预压缩期间，音频和/或视频信号相对于它们的信号波形的复杂度被分析，并且由此得到的复杂度信息(C-INF)连同音频和/或视频信号(P-AV)一起被存储在临时缓冲器(3)中，以便在后面压缩过程中进一步使用。
8.如权利要求1中要求的编码方法，其特征在于，在为一个分段而提供的分段总比特量由于信号的低复杂度而没有全部使用的情形下，剩余部分被分配给后面的分段。
9.一种从数字音频和/或视频信号(DIG-AV)或从由模拟/数字变换器数字化的模拟(AN-AV)音频和/或视频信号生成具有可变比特速率的压缩数据流的编码系统，其中数据流的总的比特量/速率不超过规定的极限，其特征在于-临时缓冲器(3)，其中可以写入音频和/或视频信号(P-AV)，-分析装置(4)，用于关于音频和/或视频信号的波形的复杂度分析来分析它们，其中可以生成复杂度信息(C-INF)，-控制装置(8)，用于把存储在临时缓冲器(3)中的音频和/或视频信号划分成各个分段(s1，s2…si)，-压缩装置(5)，用于把音频和/或视频信号变换成具有可变比特速率的压缩数据流(CAV)，其中音频和/或视频信号可以从临时缓冲器(3)逐个分段地被读出，并与分配给它们的复杂度信息(C-INF)一起被传送给压缩装置(5)，其中压缩装置可以这样一种方式被控制，即生成的数据流(CAV)的比特速率作为复杂度信息和为所讨论的分段而提供的分段总比特量的函数被分布在该分段内，以及-存储装置(6)或数据发送装置(7)，用于存储或传送数据流。
10.如权利要求9中要求的编码系统，其特征在于，临时缓冲器(3)被组织为环形缓冲器(3b)。
11.如权利要求9中要求的编码系统，其特征在于，临时缓冲器(3)包括至少两个独立的存储区(3a1，3a2)或存储单元，音频和/或视频信号可以逐个分段地被交替地写入其中或从其中读出。
12.如权利要求9中要求的编码系统，其特征在于，存储在临时缓冲器(3)中的音频和/或视频信号的分段的长度可以作为信号复杂度的函数由控制装置(8)来调整。
13.如权利要求9中要求的编码系统，其特征在于预压缩装置(2)，用于在音频和/或视频信号被存储在临时缓冲器之前预压缩音频和/或视频信号。
14.如权利要求9中要求的编码系统，其特征在于，它可借助于计算机程序控制来运行，其中第一程序进程控制音频和/或视频信号的处理直到并包括它们在临时缓冲器中的存储，以及同时运行的第二程序进程控制音频和/或视频信号的处理，将它们逐个分段地从临时缓冲器读出直至最终得到的数据流被存储或被发送。
15.一种计算机程序产品，其可被直接装载到数字计算机的内部存储器，并且它包括软件代码部分，其中当该产品在计算机中运行时，如权利要求1中要求的编码方法的步骤利用计算机来实施。
16.如权利要求15中要求的计算机程序产品，其中计算机程序产品被存储在计算机可读的介质上。
全文摘要
在从数字音频和/或视频信号生成具有可变比特速率的压缩数据流(CAV)的、对于数据流的总的比特量/速率有规定的极限的编码方法和编码系统中，信号被写入到临时缓冲器(3)的分段(s1，s2)，以及在分析装置(4)中被分析关于信号的复杂度。与由此得到的复杂度信息(C－INF)一起，从临时缓冲器(3)逐个分段地读出的音频和/或视频信号在压缩装置(5)中被变换成具有可变比特速率的数据流(CAV)，其中生成的数据流的比特速率作为复杂度信息和被提供用于所讨论的分段的分段总的比特量的函数被分布在分段内。数据流(CAV)可被存储在存储装置(6)中或经由数据发送装置(7)被发送。
文档编号G06T9/00GK1682311SQ03821936
公开日2005年10月12日申请日期2003年8月29日优先权日2002年9月17日
发明者G·恩格尔曼申请人:皇家飞利浦电子股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：G.恩格尔曼
技术所有人：皇家飞利浦电子股份有限公司
我是此专利的发明人

上一篇：晶片标记的不取向光学字符识别的制作方法
上一篇：辅助内容传递系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。