视频信号处理方法及装置的制造方法

文档序号:9402440阅读:407来源:国知局
视频信号处理方法及装置的制造方法
【技术领域】
[0001]本发明涉及视频信号处理方法及装置,更详细地,涉及对视频信号进行编码或解码的视频信号处理方法及装置。
【背景技术】
[0002]压缩编码是指用于通过通信线路传送经数字化处理的信息或以适合于存储介质的形式存储经数字化处理的信息的一连串信号处理技术。压缩编码的对象有声音、影像、字符等,尤其,以影像作为对象来进行压缩编码的技术被称作视频影像压缩。通过考虑空间上的相互关系、时间上的相互关系、概率上的相互关系等来对视频信号去除冗余信息来形成对视频信息的压缩编码。但是,随着近来多种媒体及数据传送介质的发展,更高效的视频信号处理方法及装置成为了一种需求。
[0003]另一方面,近来在多种多媒体环境下,随着网络状况或终端的分辨率等用户环境的变化,用于从空间上、时间上和/或图像质量等方面分级提供视频内容的可分级视频编码方式的需求逐渐增加。

【发明内容】

[0004]要解决的技术问题
[0005]本发明的目的在于提高视频信号的编码效率。尤其,本发明的目的在于,提供对可分级视频信号有效进行编码的方法。
[0006]解决问题的手段
[0007]为了解决如上所述的问题,根据本发明实施例的视频信号处理方法的特征在于,包括:接收包含基础层和增强层的可分级视频信号的步骤;接收用于表示对层间预测的限制是否适用于上述基础层的标志的步骤;对上述基础层的图片进行解码的步骤;以及利用被解码的上述基础层的图片,来对上述增强层的图片进行解码的步骤,若上述标志表示对层间预测的限制适用于上述基础层,则上述基础层图片的已设定的区域不用于上述增强层图片的层间预测。
[0008]并且,根据本发明实施例的视频信号处理装置的特征在于,包括:解复用器,用于接收包含基础层和增强层的可分级视频信号及用于表示对层间预测的限制是否适用于上述基础层的标志;基础层解码器,用于对上述基础层的图片进行解码;以及增强层解码器,利用被解码的上述基础层的图片,来对上述增强层的图片进行解码,若上述标志表示对层间预测的限制适用于上述基础层,则上述基础层图片的已设定的区域不用于上述增强层图片的层间预测。
[0009]发明的效果
[0010]根据本发明的实施例,可对采用多路解码(mult1-loop decoding)方式的可分级视频信号有效支持随机访问。
【附图说明】
[0011]图1为本发明实施例的视频信号编码器装置的简要框图。
[0012]图2为本发明实施例的视频信号解码器装置的简要框图。
[0013]图3为示出根据本发明实施例来分割编码单元的一例的图。
[0014]图4为不出以分级方式表不图3中分割结构的方法的一实施例的图。
[0015]图5为示出本发明实施例的各种大小及形式的预测单元的图。
[0016]图6为本发明实施例的可分级视频编码系统的简要框图。
[0017]图7及图8为示出本发明实施例的即时解码刷新(IDR)图片、完全随机访问(CRA)图片及引导图片的图。
[0018]图9为示出在采用多路解码方式的可分级视频信号中执行随机访问的一实施例的图。
[0019]图10为示出在采用多路解码方式的可分级视频信号中执行随机访问的本发明的第一实施例的图。
[0020]图11为示出在采用多路解码方式的可分级视频信号中执行随机访问的本发明的第二实施例的图。
【具体实施方式】
[0021]在本说明书中所使用的术语在考虑在本发明中的功能的情况下,尽可能选择了当前广泛使用的普通术语,但这可根据本发明所属技术领域的技术人员的意图、惯例或新技术的出现等而不同。并且,在特定情况下,还存在申请人任意选定的术语,在此情况下,将在相应的发明说明部分记述其含义。因此,需明确,在本说明书中所使用的术语应以该术语所具有的实质性的含义和本说明书的全部内容为基础来解释,而非术语的单纯字面含义。
[0022]在本发明中,以下术语可按如下基准来解释,即使是未记载的术语,也可按如下主旨来解释。根据情况,可将编码解释为编码或解码,并且信息(informat1n)作为包含值(values)、参数(parameter)、系数(coefficients)、元素(elements)等全部的术语,可根据情况解释成不同含义,因而本发明并不限定于此。“单元”用作指定影像(图片)处理的基本单位或图片的特定位置的含义,可根据情况与“块”、“分区(partit1n) ”或“区域”等术语相互混用。并且,在本说明书中,单元可以作为包含编码单元、预测单元、变换单元等全部的概念来使用。
[0023]图1为本发明一实施例的视频信号编码装置的简要框图。参照图1,本发明的编码装置100大致包括变换部110、量化部115、逆量化部120、逆变换部125、滤波部130、预测部150及熵编码部160。
[0024]变换部110通过变换所接收的视频信号的像素值来获得变换系数值。例如,可采用离散余弦变换(Discrete Cosine Transform,DCT)或小波变换(Wavelet Transform)等。尤其,离散余弦变换可通过使所输入的图片信号分为规定大小的块形式来执行变换。在变换的过程中,编码效率可根据变换区域内的多个值的分布和特性而不同。
[0025]量化部115对从变换部110输出的变换系数值进行量化。在逆量化部120,对变换系数值进行逆量化,而在逆变换部125,利用所逆量化的变换系数值来复原成原来的像素值。
[0026]滤波部130执行用于改善所复原的图片的品质的滤波运算。例如,可包括去块效应滤波器及自适应环路滤波器等。为了进行输出或用作参考图片,经滤波的图片存储于解码图片缓冲器(Decoded Picture Buffer) 156。
[0027]为了提高编码效率,并不对图片信号直接进行编码,而是采用以下方法:通过预测部150,利用已经被编码的区域来预测图片,并在所预测的图片加上原图片和预测图片之间的残值(residual value)来获得复原图片。帧内预测部152在当前图片内执行帧内预测,
帧间预测部154利用存储于解码图片缓冲器156的参考图片来预测当前图片。帧内预测部
152通过从当前图片内的复原的区域执行帧内预测,来向熵编码部160传递帧内编码信息。
帧间预测部154还可包括运动估计部154a及运动补偿部154b。在运动估计部154a,通过参考复原的特定区域来获得当前区域的运动矢量值。在运动估计部154a,通过向熵编码部
160传递参考区域的位置信息(参考帧、运动矢量等)等,来可使比特流包含参考区域的位置信息。在运动补偿部154b,利用从运动估计部154a传递的运动矢量值来执行帧间运动补m
Iz? O
[0028]熵编码部160对量化的变换系数、帧间编码信息、帧内编码信息及从帧间预测部154输入的参考区域信息等进行熵编码,来生成视频信号比特流。其中,在熵编码部160采用可变长编码(Variable Length Coding, VLC)方式和算术编码(arithmetic coding)等。在可变长编码(VCL)方式中,将所输入的多个符号变换成连续的码字,而码字的长度可变。例如,以短的码字表示经常发生的多个符号,以长的码字表示不经常发生的多个符号。作为可变长编码方式,可采用基于上下文的自适应可变长编码(Context-based AdaptiveVariable Length Coding, CAVLC)方式。算术编码将连续的多个数据符号变换成一个小数,而算术编码可得到表示各个符号所需的最佳小数位(bit)。作为算数编码,可采用基于上下文的自适应算数编码(Context-based Adaptive Binary Arithmetic Code,CABAC)。
[0029]所生成的上述比特流以网络抽象层(Network Abstract1n Layer,NAL)单元为基本单位来被封装。网络抽象层单元包括被编码的片段,上述片段由整数个编码树单元(Coding Tree Unit)构成。为了在视频解码器中对比特流进行解码,首先使比特流以网络抽象层单元为单位进行分离,之后对所分离的各个网络抽象层单元进行解码。
[0030]图2为本发明一实施例的视频信号解码装置200的简要框图。参照图2,本发明的解码装置200大致包括熵解码部210、逆量化部220、逆变换部225、滤波部230、及预测部250。
[0031]熵解码部210对视频信号比特流进行熵解码,来抽取各个区域的变换系数、运动矢量等。逆量化部220对经熵解码的变换系数进行逆量化,逆变换部225利用经逆量化的变换系数来复原原来的像素值。
[0032]另一方面,滤波部230通过对图片执行滤波来提高图像质量。其中,可包括用于减少块扭曲现象的去块效应滤波器和/或用于去除图片整体扭曲的自适应环路滤波器等。经滤波的图片,或者进行输出,或者为了用作对下一帧的参考图片而存储于解码图片缓冲器(Decoded Picture Buffer)256。
[0033]并且,本发明的预测部250包括帧内预测部252及帧间预测
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1