对数字视频信号编码的方法和装置的制作方法

文档序号：7572944阅读：195来源：国知局

专利名称：对数字视频信号编码的方法和装置的制作方法
技术领域：
本发明涉及一种用于对数字视频信号编码的方法和装置。
为了未来的数字电视广播(DVB＝Digital Video Broadcasting)和与此相联系的交互式通讯服务，借助于合适的编码设备视频数据必须在它们的数据量方面得到实质上的减少。为了能够经由现存的频道传送更多的节目或者在已经存在的窄带传输路径里传播活动图像序列，这一步骤是必需的。为这个目的所提供的一种编码方法是MPEG2标准(ISO/IEC 13818)。
为了在编码期间得到最大可能的压缩因子，输入图像在MPEG情况下被组合为图像组(GOP)。在这样的一个图像组内对各个图像进行不同的编码。根据MPEG，一个组总是由一个帧内编码帧(I帧)以及通常的多个P帧(预测帧)和/或B帧(双向计算帧)组成，在此处以及在下文中“帧”也可以被“场”替代。
用于从该组传送一帧所必须的数据率取决于相关的帧类型(I，P或B)以及当前图像内容。在一图像组内数据的最大相对容量分配给I帧。它们包含了在解码器中用于完成重构所要求的所有数据。相反，P帧是从I帧或是一个先前P帧预测的，也就是说相关图像组中整个I帧的存在对于接收端P帧的重构是必须的。为了这个目的，随后仅须编码先前I或P帧的差值。另一方面，B帧基本上是从已经重构的I或P帧计算(内插)的。必须用于B帧传送的数据量相对较少。某些图像类型也可以包含其他图像类型的各个宏块，例如I宏块可以出现在图像摘录的P和B图像中，该图像摘录另外仅以不足够的效率编码。
虽然上述将帧分为不同帧类型的分类使得有一个非常高的编码效率，但是它给予不同帧类型对于传输误差不同程度的敏感性。这样，B帧内的传输或重构误差仍然限制在相应的B帧，而错误的I和P帧会影响整个的图像组(GOP)。在最频繁地选择每GOP 12帧的MPEG 2参数的情况下，用于这样做时间持续期间可能延续达接近半秒钟(在50Hz帧频率，在60或59.94Hz帧频率相应短一些)，因此，这对于观看者有很大的干扰。
在正片编码期间当在图像组内在图像场景上发生变化时，有关误差减少的相似效果也会发生。在这种情况下，因为编码器的内部控制，对于当前的图像组没有用于B和P帧预测的合理的基础存在，相反，新场景的第一个图像主要是用帧内宏块编码。因为用于P帧的数据的分配容量并未大到足够用好的质量对大部分图像帧内编码，所以解码器重构结果仍将是不满意的。只有在下面的图像组中对于编码处理再次出现稳定的条件下，才可得到满意的重构。
用于数据简缩的先前的编码处理基于数据量(图像序列)的输送，这产生于电视电影扫描器，例如持续产生数据简缩位流的MPEG编码器。以这种概念，原始胶片的场景剪辑完全人为地与由编码器确定的帧类型相一致，这可能导致在图像组内上述误差减少。
本发明的目的是提出一种编码过程与当前的场景变化同步的方法。
本发明的另一目的是提供一种应用根据本发明的方法的装置。
为了这个目的，场景检测器被连接在图像发生器(电视电影扫描器，摄像机，记录设备或另一个信号源)和编码器之间。所述场景检测器产生一个合适的控制信号并在场景变化的情况下导致编码处理，开始一新的图像组，也就是说一个I编码图像。这有益地防止了场景变化落到图像组的中间，例如使得质量降低的重构不会发生在解码器上。这个测量有益地不要求在解码器上有额外的费用而且因此不会导致复杂性的增加，以及在终端单元上，也就是说在顶置盒或电视机/录像机/DVD播放机(数字视盘)中的解码器上花费的增加。
原理上，根据本发明的方法事实上包括对数字视频信号编码，其中在有一个确定序列的每种情况下，一个帧内编码图像和至少一个用于另一个图像或另外的图像的其他的图像编码类型被用于一组连续的图像，从一个图像到另一个图像变化很大的像素值或有很大变化的图像内容在检测器中确定并且以这样一种方式控制进一步的编码即对具有很大变化像素值或有很大变化的图像内容的图像实行帧内编码，而与图像组内这个图像的位置无关。
原理上，本发明的装置用于编码数字视频信号，其中在有一个确定序列的每种情况下，一个帧内编码图像(I)和至少一个用于另一个图像或另外的图像的其他的图像编码类型(P，B)被用于一组连续的图像，本发明用于编码数字视频信号的装置包含
一个检测器，用于确定从一个图像到另一个图像有很大变化的像素值或有很大变化的图像内容；一个编码器，由检测器以这样一种方式控制它，即对具有很大变化像素值或有很大变化图像内容的图像实行帧内编码，而与图像组内这个图像的位置无关。
参照附图描述了本发明的示范实施例，其中

图1示出一场景控制的MPEG编码器的例子。
视频信号从图像发生器1引出，发生器1可以是电视电影扫描器，电视摄影机或任何要求的模拟图像源(例如磁带记录设备)。这个信号首先馈给一个模/数转换器2，使得数字输入数据能够用于编码器。如果可得到的信号发生器已经是一个数字信号源，则这个源能够经由输入端3连接到电路装置。在输入端3的信号然后馈给场景检测器10，它包括例如一个帧存储器4，一个减法级5和一个阈值判定电路6。信号源的当前帧n可在帧存储器4的输入端获得并且被延迟一帧周期的先前帧n-1可以在输出端获得。两帧像素之间的绝对值差值之和，例如借助于减法级5计算。然后这个总和值馈给阈值判定电路6。根据这个总和值，阈值判定电路产生一个用于MPEG编码器8的控制信号。在这种情况下阈值判定电路的特性是以这样一种方式计算的，即由例如移动物体或慢摄像机全景拍摄引起的在同一图像场景中的差值不触发控制信号或一个第一控制信号(在一个相对小的总和值的情况下)，然而具有完全不同的图像信息特征的场景变化则导致明显的控制信号或一个第二控制信号(在一个相对大的总和值的情况下)。
为了使控制信号在编码器8与场景变化同时出现，信号源的帧必须在缓冲器7中相应地延迟一个帧周期。然后编码器8从控制信号识别出现在它的输入端的帧是否属于一个新的图像场景，并且如果是这种情况则导致编码算法开始一个新的图像组而且开始I编码图像。数据简缩输出信号可以在输出端9获得。
例如为了照此识别较大的摄像机全景拍摄，场景检测器10也能够在全局预测器11中内部实现一个全局的视频信号预测。这样一种全局预测器在例如EP-A-0414133中作了描述。为了这个目的，存储器4的输入信号和输出信号馈给预测器11。如果这个预测器识别出在图像中的全局运动，则减法级5，阈值判定电路6和/或编码器8以这样一种方式被控制，即编码器8不会脱离正常的I图像序列。全局运动参数可由预测器11向前送到编码器8。这样做的好处是具有全局运动的图像能够如P或B图像一样以良好的效率编码，所以，I编码图像数和数据率不必做不需要的增长，也就是说可检测的(全局的)摄像机全景拍摄不被理解为随场景变化。这有益地使这种全局预测的结果可能被包括在编码器的“正常”预测期间。这使得在编码器8的预测被简化或改进。
在本发明的另一个示范实施例中，可减少场景检测器的存储容量。场景变化也能根据场来识别。于是存储器4和7是场存储器并且两个相邻场的像素值随后在减法器5中相互作相应地处理。两个场也可以从相邻帧中产生。
借助于存储器4的输入前端的视频数据简缩能够在存储容量上作不同的或进一步缩减，并且借助于在相应方向上的与二次采样有关的视频数据的水平和/或垂直低通滤波，也可能在缓冲器7上实现。
在场景变化的情况下，或者I编码能够被另外插入当前序列。或者正常的序列能够从场景变化再次继续，换言之，例如每12个图像一个I图像，随着场景变化的图像是这些I图像中的第一个。
本发明并不限于摄影室部分，也可以使用在消费者部分的数据媒体上，尤其是包含根据本发明编码的视频数据的光盘。例如，以所示出的方式本发明能用于改进数字家庭录像机或DVD记录设备上的视频信号的记录质量。在这种情况下，场景检测器不被认为是图像发生器的部分，而是作为记录单元的附加电路元件实现。
在接收的视频信号采用固定的GOP长度编码的情况下，这些信号可以首先被解码然后用该记录的不同GOP长度加以编码。在数字视频信号记录期间根据本发明编码的这些数字视频信号被提供相应的，可变的GOP长度信息并且被公开传送，或者在仅仅再现预记录的数据媒体的情况中，记录单元中的场景检测器被省略或有可能不估计其用于记录的输出信号。
本发明不限于MPEG2或MPEG1编码标准。本发明能够应用于将视频数据分段为图像组的所有编码过程，例如MPEG4。
权利要求
1.一种用于对数字视频信号编码(8)的方法，其中，在具有一确定序列的每种情况下，一个帧内编码图像(I)和至少一个用于另一个图像或另外的图像的其他的图像编码类型(P，B)被用于一组(GOP)连续的图像，其特征在于从一个图像到另一个图像变化很大的像素值或有很大变化的图像内容在检测器(10)中确定，并且以这样一种方式控制进一步地编码(8)，即对具有很大变化像素值或有很大变化图像内容的图像实行帧内编码，而与图像组(GOP)内这个图像的位置无关。
2.如权利要求1所述的方法，其中，在检测器(10)中，两个相邻帧(n，n-1)或场的像素之间的绝对值之差的总和被形成(5)并与一个阈值比较(6)以产生一个用于后续编码(8)的控制信号。
3.如权利要求1或2所述的方法，其中，在绝对值之差形成之前，视频数据被水平地和/或垂直地低通滤波并在相应方向二次采样。
4.如权利要求1到3中一个或多个所述的方法，其中，在检测器(10)中，借助于预测对全局运动参数进行搜索并且如果这些参数存在，就不实行附加的帧内编码。
5.如权利要求4所述的方法，其中全局运动参数被使用或在进一步编码(8)期间被考虑。
6.一种用于对数字视频信号编码(8)的装置，其中在具有一确定序列的每种情况下，一个帧内编码图像(I)和至少一个用于另一个图像或另外的图像的其他的图像编码类型(P，B)被用于一组(GOP)连续的图像，其特征在于一个检测器(10)，用于确定从一个图像到另一个图像变化很大的像素值或有很大变化的图像内容；一个编码器(8)，其由检测器以这一种方式控制即对具有很大变化的像素值或有很大变化图像内容的图像实行帧内编码，而与图像组(GOP)内这个图像的位置无关。
7.如权利要求6所述的装置，其中检测器(10)包含一个确定全局运动参数的预测器(11)，并且如果这些参数存在，以这样一种方式控制编码器即不实行附加的帧内编码。
8.数据媒体，特别是光盘，包含了使用根据权利要求1的方法编码的视频数据。
全文摘要
对数字视频信号编码的方法和装置。为了未来的数字电视广播和与此相联系的交互式通讯服务,借助于合适的编码设备视频数据必须在它们的数据容量方面得到实质上的减少。为此规定的一种编码方法是MPEG2标准。如果在编码期间在连续的图像组内在图像场景中发生变化,则对于当前图像组没有用于B和P帧预测的合理的基础存在。结果,在解码器中的重构结果仍然是不满意的。根据本发明,这种场景变化被检测并且新场景的第一个图像是帧内编码的。
文档编号H04N7/32GK1171017SQ9711397
公开日1998年1月21日申请日期1997年6月27日优先权日1996年6月28日
发明者卡斯藤·赫佩尔, 尤威·里曼申请人:德国汤姆逊-布朗特公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：卡斯藤.赫佩尔;尤威.里曼
技术所有人：德国汤姆逊-布朗特公司
我是此专利的发明人

上一篇：数字移动电话的制作方法
上一篇：多载波信号频率校正的方法和相关装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。