有分级装置的视频信号编码方法和设备的制作方法

文档序号:7566205阅读:172来源:国知局
专利名称:有分级装置的视频信号编码方法和设备的制作方法
技术领域
本发明涉及一种视频信号编码系统,更具体地说,涉及使用变换和分级矢量量化技术而不传输视频信号的级信息编码视频信号的一种方法和设备。
在各种各样的电子/电气应用中,诸如高清晰度电视和可视电话系统,一个视频信号常需要以数字的形式传输。当包含一系列视频“帧”的视频信号被表示为数字化的形式时,必然会出现数量很大的数字数据,其中,一幅视频帧的每一行都被定义为一系列被称作“象素”的数字数据单元。然而由于一条常规传输信道的可用频率带宽是有限的,为了通过信道传输数量很大的数字数据,必须使用视频信号编码系统来压缩或减少需要传输的数据的数量。
视频信号可被正常地压缩,而不会严重影响它的整体性,因为在一幅单独帧的象素之间和相邻的视频帧之间,通常都存在着某种相关性或冗余度。
数据压缩的基本目标之一,是减小传输比特率同时保持可接受的图象质量。许多数据压缩技术已被发展,如差分脉冲编码调制(DPCM),统计或熵编码,变换编码(TC),量化,以及这些技术根据应用的适当变型。在DPCM中,数据压缩是通过对一个样本和它的预测值之间的差值进行编码来实现的。熵编码实现数据压缩的方法是利用输入数据之间的统计冗余度。
TC技术可减少或消除图象数据之间的空间冗余度,将数字图象数据转换成一组变换系数数据。图象数据压缩最常用的一种TC技术是基于块变换编码的DCT(离散余弦变换)技术,即将一幅数字图象数据块,例如一幅8×8个象素的数据块,变换成一组变换系数数据。这一技术在Chen和Pratt所著的“场景自适应编码器”,IEEE Transactions on Communication,COM-32,No.3,pp 225-232(March 1994)一文中有所描述。块变换编码的缺点之一就是会出现令人烦恼的人为现象,即常说的块效应(blocking effect),特别是在低比特率的情况下。
DWT(离散子波变换)是最近出现的一种用于低比特率图象压缩的功能强大的技术(参见Oliviev Rioul等的“子波和信号处理”,IEEESPMAGINE pp. 14-38(October,1991))。DWT本质上是一种分级的子频带编码技术,因此,在图象数据被分解为许多子频带时,不会出现块效应。
根据Shannon的速率-失真理论,一种良好性能的数据压缩,应采用矢量量化技术而不是标量量化。特别是,在很低的比特率下,分级矢量量化(CVQ)和非分级矢量量化相比,可提高编码效率和减小边缘失真(参见Nasser M.Nasyabadi等的“使用矢量量化的图象编码回顾”,“IEEE Transactions on Communications,36,No.8,PP. 957-971(August,1988))。
在一个使用CVQ的图象编码系统中,一个输入矢量首先被分级成许多级中的一个,确定一个相应的码本(codebook);从码本中选了一个代表矢量,即和输入矢量最佳匹配的候选矢量;表示输入矢量级的级信息和代表矢量的码字索引号,通过使用例如VLC(可变长度编码)的方法进行编码,用于传输。
在各种用于低比特率图象压缩的将变换编码和矢量量化编码相结合的编码方案中,Y.Huh等在“使用矢量量化的分级子波变换编码”,SPIE,2308,pp. 207-213 (September,1994)一文中提出一种分级子波变换/矢量量化技术,利用子频带或层之中大量多余的冗余度,使用DWT和CVQ技术,提高编码效率。在这个方案中,DWT系数被重新安排而形成一些输入矢量,其中,每一个输入矢量由来自所有子频带的相应的DWT系数组成。每一个输入矢量,根据其包含的系数的方向状态(activities)被分成四级,并用其自身的码本被编码。
在上述方案中,表示级别的附加信息和已编码的图象信号一起被传输到一个解码器来重新形成图象,从而减轻总的编码效率的损失。
因此,本发明的首要目的是提供改进的视频信号编码方法和设备,通过使用变换和分级矢量量化技术,而不必传输视频信号的级信息编码视频信号,从而提高系统的总体编码效率。
根据本发明的一个方面,提供一种对输入视频信号的编码方法,包括以下几个步骤把输入视频信号变换为含有变换系数的众多子频带,其中,在最低频带中的一个子频带包含一个或多个DC系数,而其余的子频带分别包含多个AC系数;把包含在众多子频带中的变换系数转换成若干个具有预先确定的大小相同的装配块,每一个装配块有一个DC系数和众多的AC系数;为每一个装配块生成一个表示该块级别的选择信号;对装配块中的DC系数编码,从而形成第一编码视频信号;响应选择信号对每一个装配块中的AC系数编码,从而形成第二编码视频信号;以及对第一和第二编码视频信号进行格式化。
根据本发明的另一方面,提供一种对输入视频信号编码的设备,包括一种装置,用于把输入视频信号变换为含有变换系数的众多子频带,其中在最低频带中的一个子频带包含一个或多个DC系数,而其余的子频带分别包含许多AC系数;一种装置,用于把包含在众多子频带中的变换系数转换成若干个预先确定的大小相同的装配块,每一个装配块有一个DC系数和众多的AC系数;一种装置,用于为每一个装配块生成一个表示该块级别的选择信号;第一编码装置,用于对装配块中的DC系数编码,从而生成第一编码视频信号;第二编码装置,响应选择信号用于对每一个装配块中的AC系数编码,从而生成第二编码视频信号;以及一种装置,用于对第一和第二编码视频信号进行格式化。
本发明的上述目的和特征,通过下面结合附图,对优选实施例的说明,将变得显而易见,其中

图1表示本发明的包括分级装置的本发明的视频信号编码设备的方框图;图2表示图1中的分级装置的详细方框图;图3A至3D描述一个块为分级矢量量化而重新排布的过程;以及图4以图形说明在分级装置中确定级别的方法的过程。
参看图1,该图给出本发明具有分级装置140的一种新颖的视频信号编码设备。
视频信号编码系统包括离散子波变换(DWT)电路110,矢量装配装置112,第一、第二和第三视频信号编码单元116、120和124,第一和第二开关电路118和128,格式化电路134以及分级装置140。
一个输入图象的数字视频信号,加到离散子波变换(DWT)电路110上,该电路用来将输入图象的象素数据从空间域变换到频率域,以产生多个被分解的子频带。如果一幅图象包含N×N,例如512×512个象素,如图3A所示,而且分解层次是S,例如3,这样就被DWT电路110变换为十个被分解的子频带,即SBO至SB9,如图3B所示。在这种情况下,包含在每一子频带范围内的DWT系数的数目的范围为64×64至256×256,如图3B所示。进一步说,存在于最低的频带的子频带SB0,包含64×64个DC系数;其余的子频带即SB1至SB9,包含AC系数。包含在被分解的许多子频带中的DWT系数被送到矢量装配装置112。
在矢量装配装置112中,将来自DWT电路110的DWT系数重新排布形成P×P,例如64×64的装配块,或者说矢量,其中,每一块包含M×M,例如8×8个取自所有子频带的DWT系数,如图3B和3C所示。在这种情况下,每一个装配块包含一个DC系数和63个AC系数。对熟悉本领域技术的人员可显见,另一些变换技术,例如离散余弦变换技术,可以用来提供一系列与DWT提供的装配块相应的变换数据。
回到图1,包含在装配块中的DC系数与那里的AC系数被分别处理。这就是说,所述包含在各装配块中每一DC系数被送到第一视频编码单元116和分级装置140,而且块中的AC系数则被送到分级装置140。第一视频信号编码单元116包括一个差分信号产生器116a和一个熵编码器116b。
在差分信号产生器116a中,采用DPCM技术对DC系数进行编码,这就是说,如图3D所示,由矢量装配装置112提供的第一块B(0)的DC系数DC(0)首先从预设的预测器中减掉,产生DC(0)和预测器之间的差值,然后预测器更新为刚刚编码的系数值,即块B(0)的DC系数。而后,第二块B(1)的DC系数DC(1)从更新了预测器中减掉,并且预测器又更新为DC(1)的值,这一过程一直继续到对所有的DC系数被处理完毕。此后,由差分信号产生器116a产生的差值,被提供给第一熵编码器116b,该编码器使用例如行程长度和可变长度编码(VLC)组合技术,对差值进行编码,从而向格式化电路134提供被编码的DC信号。
依照本发明,分级装置140为每一装配块提供一个选择信号,例如SC1,用以表示送到第一和第二开关电路118和128的输入矢量的级,并向第一开关电路118提供输入矢量。
现在再看图2,该图是图1所示分级装置140的详细方块图。分级装置140包括一个级参数估算器141,一个子级确定单元142,一个转置存储器145,一个第三开关电路146和一个选择信号产生器147。
级参数估算器141被用来估算水平和垂直两个级参数,例如CH和CV,它们代表水平和垂直方向上的DC系数的状态。依照本发明优选实施例,一个块的水平和垂直方向上的级参数分别由沿着该块所在位置的行和列上的各个块的DC系数来决定,例如,包含在p×p个DWT系数的装配块中的第i块的水平级参数CH(i),由下式导出 其中,Aj是预先确定的加权因子;Q是预先确定的正整数,其最大窗口大小为(2Q+1);DC(i+j)是第(i+j)块的DC系数,并且将与第i块B(i)不在同一行的所有块的DC系数置为零。
类似的,垂直级参数CV(i)由下式确定 其中,Bj是预先确定的加权因子,其他项含义与式(1)给出的含义相同。
由式(1)和(2)可以看出,水平和垂直两个级参数CH(i)和CV(i)中的每一个都可分别利用例如技术上普遍了解的常规带通滤波器得到。此后,由级参数估算器141得出这些水平和垂直级参数CH和CV被提供给级确定单元142,该单元包括子级确定器143和存储器144。
子级确定器143根据来自级参数估算器141的水平和垂直级参数,确定每个块的子级,预先确定的阈值和斜率因子,即从存贮器144提取的TH-U和K,子级确定器产生表征被确定的那些子级的子级信息,即在均匀的、水平的、垂直的和纹理的子级中选择的一种。
在本发明优选实施例中,如果水平和垂直级参数CH(i)和CV(i)存在于如图4表示的阈值范围U内,也就是说,|CH(i)|和|CV(i)|不大于阈值TH-U,则第i块B(i)被确定为均匀的子级;如果水平和垂直级参数是在W1或者W3范围内,即|CH(i)/CV(i)|等于或小于斜率因子K,则该块被确定为垂直子级,其中TH-U和K是正数。如果水平和垂直级参数CH(i)和CV(i)在W2和W4范围内,即|CH(i)/CV(i)|不大于K,则该块被确定为水平子级;其余的,则确定为纹理子级。
可以明了,预先存在存储器144中的预先确定的阈值和斜率因子TH-U和K,可根据图象类型和用来决定两个预定的码本的系列矢量的数目来确定,这两个码本预先存在第二和第三视频编码单元120和124中,后面将参照图1对比加以说明。
由子级确定器143产生的子级信息,供给第三开关电路146和选择信号产生器147。
转置存储器145用来转置来自矢量装配装置112的例如63个各AC系数块。换句话说,块中的位于第K列和第r行的一个AC系数,被存储在转置存储器145的一个与块的第r 和第k行相对应的存储位置中。依照本发明,实现与垂直子级相应的一个块的转置是基于这样的事实在被转置的那些块中的系数的能量分布特性,类似于相应的水平子级块。通过转置属于垂直子级的那些块,可以使量化垂直和水平子级块用的码本最小。来自图1所示的矢量装配装置112的AC系数,和来自转置存储器145的块的AC系数,同时被提供到第三开关电路146。
第三开关电路146根据来自子级确定器143的子级信息,有选择地将来自转置存储器145的被转置的AC系数块,或者将来自矢量装配装置112的AC系数块,送到图1所示的第一开关电路118。也就是说,如果第三开关电路146的输入是表示垂直子级的子级信息,则将转置存储器145来的被转置的AC系数接到第一开关电路118;如果上述输入是表示水平、均匀和纹理之中的一种子级信息,则将来自矢量装配装置112的AC系数接到第一开关电路118。把第三开关电路146的输出,也就是相应于垂直子级的被转置的AC系数,或者相应于水平、均匀和纹理子级之一的块中的非转置AC系数送到第一开关电路118,作为输入矢量。
同时,选择信号产生器147把以子级信息表征的四个子级分成例如两类,以此提供选择信号SC1用于控制如图1所示的第一和第二开关电路118和128。
在本发明一种优选实施例中,均匀、垂直和水平子级被分类为确定类,因为它们有确定的系数能量分布;纹理子级被分类为随机类,因为它的能量是随机分布的。在本发明另外一种优选实施例中,将四个子级分成三类,即均匀子级为确定类,垂直和水平子级为方向类,纹理子级为随机类。在本发明的优选实施中,选择信号产生器147产生一逻辑信号作为选择信号SC1,对于确定类产生一逻辑高信号,而对于随机类产生一逻辑低信号,然后将选择信号SC1送到第一和第二开关电路118和128。
返回来参看图1,第一开关电路118响应选择信号SC1,有选择地从图2所示选择信号产生器147选取相应的输入矢量送到第二和第三视频信号编码单元120和124中的一个。也就是说,响应逻辑高选择信号SC1时,相应输入矢量送到第二信号编码单元120,该单元用来量化符合于确定类的输入矢量;而响应逻辑低选择信号时,将相应输入矢量送到第三图象信号编码单元124,该单元用于量化符合于纹理类的输入矢量。
第二图象信号编码单元120包括第一矢量量化器121和第二熵编码器122。第一矢量量化器121备有一个码本,该码本包括一组预先确定的候选矢量和与相应的一组码字索引号。在第一矢量量化器121中,每一个输入矢量单独量化,或者映象为一个最类似的候选矢量,即有代表性的矢量,以便使映象失真即量化误差最小。使用为每个代表矢量设计的索引号来实现压缩,也就是用码本索引号来代替矢量本身,达到经济的目的。通常,码本表现为查表的形式,量化过程被执行为一种表格查找操作,由第一矢量量化器121确定的每一输入矢量的码字索引号,被送到第二熵编码器122。
第二熵编码器122,运用例如行程长度和可变长度混合编码方法对来自第一矢量量化器121的码字索引号进行编码,产生确定类AC信号。然后,由第二熵编码器122产生的确定类AC信号被提供给第二开关电路128。
第三视频信号编码单元124,包括第二矢量量化器125和第三熵编码器126,采用与第二视频信号编码单元120相类似的形式,处理每一个随机类的输入矢量,并由此向第二开关电路128提供一个随机类AC信号。第三视频信号编码单元124基本上和第二视频信号编码单元120相同,只是一组候选矢量以及包含在其中的可变长度编码,被代之以随机类的输入矢量。
第二开关电路128根据来自分级装置140的逻辑高和逻辑低信号,有选择地将确定类AC信号和随机类AC信号送到格式化电路134。
格式化电路134来格式化来自第一熵编码器116b的编码DC信号,以及来自第二开关电路128相应于每个输入矢量的输出信号,然后,格式化电路将格式化的数字图象信号提供给发送器(图中未示出)发送。
结果是,使用分级矢量量化的方法量化变换系数,而不必传输输入矢量的级信息,从而提高总的编码效率。在接收端,级信息可从传输来的DC系数重新构造。由上面可以看出,视频信号解码系统可以包括一个逆格式化电路,多个熵解码器,多个逆矢量量化器,一个逆矢量装配装置,以及一个逆离散子波变换电路。
本发明已经参照具体的实施例进行了描述,很明显,对于熟悉本领域的人员来说,在不偏离如所附的权利要求中所限定的精神和范围的情况下,可以做许多变动和修改。
权利要求
1.一种对输入视频信号编码的方法,包括以下步骤把输入视频信号变换为含有变换系数的众多子频带,其中,在最低频带中的一个子频带包含一个或多个DC系数,而其余的子频带分别包含许多AC系数;把包含在众多子频带中的变换系数转换成若干个预先确定的大小相同的装配块,每一个装配块有一个DC系数和众多的AC系数;为第一个装配块生成一个表示该块级别的选择信号;对装配块中的DC系数编码,从而生成第一编码视频信号;对每一个装配块中的AC系数根据选择信号编码,从而生成第二编码视频信号;以及对第一和第二编码视频信号进行格式化。
2.如权利要求1所述方法,其特征在于采用离散子波变换方法,可导出多个子频带。
3.如权利要求2所述方法,其特征在于每个装配块包含M×M个变换系数,其中M是正整数。
4.如权利要求3所述方法,其特征在于产生所述选择信号的步骤包括产生第一和第二级参数,它们代表所有装配块中在水平和垂直方向上的DC系数的状态。根据第一和第二级参数,以及预先确定的阈值和斜率因子确定和产生一个或多个子级;根据所述的一个或多个子级,产生选择信号。
5.一种对由象素数据组成的输入视频信号进行编码的方法,包括以下几个步骤把象素数据的输入视频信号变换为多个变换系数块,这些块中的每一块有一个DC系数和多个AC系数;产生代表每一块的级别的选择信号;对所有块中的DC系数进行编码,由此产生第一编码视频信号;根据选择信号,对每一块中的AC系数进行编码,由此产生第二编码视频信号;以及对第一和第二编码图象信号进行格式化。
6.如权利要求5所述方法,其特征在于采用离散余弦变换(DCT)方法,可导出多个块。
7.一种对输入视频信号编码的设备,包括一种装置,用于把输入视频信号变换为含有变换系数的众多子频带,其中在最低频带中的一个子频带包含一个或多个DC系数,而其余的子频带分别包含许多AC系数;一种装置,用于把包含在众多子频带中的变换系数转换成若干个预先确定的大小相同的装配块,每一个装配块有一个DC系数和众多的AC系数;一种装置,用于为每一个装配块生成一个表示该块级别的选择信号;第一编码装置,用于对装配块中的DC系数编码,从而生成第一编码视频信号;第二编码装置,用于响应选择信号对每一个装配块中的AC系数编码,从而生成第二编码视频信号;以及一种装置,用于对第一和第二编码视频信号进行格式化。
8.如权利要求7所述设备,其特征在于采用离散子波变换方法,可导出多个子频带。
9.如权利要求8所述设备,其特征在于每个装配块包含M×M个变换系数,其中M是正整数。
10.如权利要求9所述设备,其特征在于产生所述选择信号的装置包括用于产生第一和第二级参数的装置,这些参数代表所有装配块中在水平和垂直方向上的DC参数的状态;用于根据第一和第二级参数,以及预先确定的阈值和斜率因子,确定和产生一个或多个子级的装置;用于根据所述的子级,产生选择信号的装置。
全文摘要
提高总体压缩效率的设备,包括变换器,把输入视频信号变换为众多的变换系数的子频带;转换器,把包含在众多子频带中的变换系数转换成若干个预先确定的大小相同的装配块;产生选择信号的产生器,该选择信号表示每个装配块的级;第一编码器,对装配块中的DC系数编码,从而生成第一编码视频信号;第二编码器,对每个装配块中的AC系数根据选择信号进行编码,从而形成第二编码视频信号;及格式化器,对第一编码视频信号和第二编码视频信号进行格式化。
文档编号H04N7/30GK1134085SQ95105458
公开日1996年10月23日 申请日期1995年5月12日 优先权日1995年3月20日
发明者朴学载 申请人:大宇电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1