音频信号的编码、解码方法及音频传输方法

文档序号:2821833阅读:316来源:国知局
专利名称:音频信号的编码、解码方法及音频传输方法
技术领域
本发明涉及对音频信号进行预测编码、压缩的音频编码装置、光记录介质、音频解码装置及音频传输方法。
作为对音频信号进行预测编码的方法,本发明者在以前的申请(特愿平9-289159号)的方案中提出了一种方法,该方法对单声道的原数字音频信号,通过特性不同的多个预测器计算出在时间域中从过去信号到现在信号的多个线性预测值,从原数字音频信号及该多个线性预测值计算出每个预测器的预测残差,选择该多个预测残差最小值。
但是,在上述方法中,当原数字音频信号在取样频率=96kHz、量化位数=20位时,可以得到某种程度的压缩效率,可是在近年来的DVD音频盘中使用2倍的取样频率(=192kHz),另外量化位数也有使用24位的倾向,所以需要改善压缩率。
本发明的目的在于提供一种在对音频信号进行预测编码时可以改善压缩率的音频编码装置、光记录装置、音频解码装置及音频传输方法。
本发明为了达到上述目的,对两个系统的音频信号的和信号和差信号的各差分进行了预测编码。
即,根据本发明所提供的音频编码装置中包括加法装置,计算第一和第二两个系统的音频信号的和信号;减法装置,计算上述第一和第二两个系统的音频信号的差信号;第一差分计算装置,计算上述和信号的差分;第二差分计算装置,计算上述差信号的差分;
第一预测编码装置,计算上述和信号的差分的多个预测值,计算该多个预测值和上述和信号的差分的各预测残差,选择该多个预测残差的最小值;第二预测编码装置,计算上述差信号的差分的多个预测值,计算该多个预测值与上述差信号的差分的各预测残差,选择该多个预测残差的最小值。
本发明还提供一种光记录介质,对权利要求1所述的音频编码装置中所选择的预测残差最小值进行格式化并进行记录。
本发明还提供一种音频解码装置,其特征在于从权利要求1所述的音频编码装置中所选择的预测残差最小值计算出预测值,从该预测值复原上述第一和第二两个系统的音频信号。
本发明还提供一种音频传输方法,其特征在于对权利要求1所述的音频编码装置中所选择的预测残差最小值,通过通信线路进行传输。
本发明的优点及特征将通过结合附图对本发明的实施例的描述而得到进一步说明,在这些附图中图1是表示本发明所涉及的音频编码装置及音频解码装置的第1
图2是详细表示图1的编码器的方框图。
图3是表示图2的多路转换器进行多重化的1帧的格式说明图。
图4是表示DVD包的格式说明图。
图5是表示DVD的音频包的格式说明图。
图6是详细表示图1的解码的方框图。
图7是详细表示第2实施例的编码器的方框图。
图8是详细表示第2实施例的解码器的方框图。
图9是详细表示第3实施例的编码器的方框图。
图10是详细表示第3实施例的解码器的方框图。
图11是表示音频传输方法的流程图。
图12是表示音频传输方法的流程图。
下面参照


本发明的实施例。图1是表示本发明所涉及的音频编码装置及音频解码装置的第一实施例的方框图。图2是详细表示图1的编码器的方框图,图3是表示由图2的多路转换器进行多重化的1帧的格式说明图,图4是表示DVD包的格式说明图,图5是表示DVD音频包的格式说明图,图6是详细表示图1的解码器的方框图。
图1中表示的声道相关电路A中具有加法电路1a和减法电路1b。加法电路1a算出各声道(以下用ch表示)的例如取样频率=192kHz、量化位数=24位的立体声2ch信号L、R的和信号(L+R),输出给和ch用的1ch无损失编码器2D1,减法电路1b算出差信号(L-R),输出给差ch用的1ch无损失编码2D2。如图2详细所述,编码器2D1、2D2分别将和信号(L+R)、差信号(L-R)的差分Δ(L+R)、Δ(L-R)进行预测编码,经过记录介质及通信媒体传输。
而且,在解码端如图6详细所示,解码器3D1、3D2分别将各ch的预测编码的数据解码为和信号(L+R)、差信号(L-R),接着声道相关电路B将该和信号(L+R)、差信号(L-R)复原为立体声2ch信号L、R。
参照附图2对编码器2D1、2D2进行详细说明。和信号(L+R)、差信号(L-R)按每1帧来存放在1帧缓冲器10中。然后1帧的各取样值(L+R)、(L-R)分别加到差分运算电路11D1、11D2中,算出这次和上次的差分Δ(L+R)、Δ(L-R),即差分PCM(DPCM)数据。各帧的头部取样值(L+R)、(L-R)加到多路转换器19中。
通过差分运算电路11D1算出的差分Δ(L+R)加到预测系数不同的多个预测器12a-1-12a-n和减法器13a-1-13a-n上。而且,预测器12a-1-12a-n分别根据各预测系数算出差分Δ(L+R)的各预测值,减法器13a-1-13a-n分别算出该预测值和差分Δ(L+R)的各预测残差。缓冲器·选择器16D1暂时存储该多个预测残差,在每个由选择信号发生器17指定的子帧中选择最小的预测残差,输出到包装电路18。该子帧具有帧的数十分之一左右的取样长度,例如1帧为80子帧。预测器12a-1-12a-n和减法器13a-1-13a-n构成和信号ch的预测电路15D1,而该预测电路15D1和缓冲器·选择器16D1构成和信号ch的预测编码电路。
同样,通过差分运算电路11D2算出的差分Δ(L-R)加到预测系数不同的多个预测器12b-1-12b-n和减法器13b-1-13b-n中。而且,预测器12b-1-12b-n根据各预测系数分别算出差分Δ(L-R)的各预测值,由减法器13b-1-13b-n分别算出各预测值与差分Δ(L-R)的各预测残差。缓冲器·选择器16D2暂时储存该多个预测残差,在每个由选择信号发生器17指定的子帧中选择最小的预测残差,输出到包装电路18中。预测器12b-1-12b-n和减法器13b-1-13b-n构成差信号ch的预测电路15D2,而该预测电路15D2和缓冲器·选择器16D2构成了差信号ch的预测编码电路。
选择信号发生器17将预测残差的位数标志(5位)加到包装电路18和多路转换器19,另外将表示预测残差最小的预测器的预测器选择标志(该数n为2-9个,3位)加到多路转换器19中。包装电路18将由缓冲器·选择器16D1、16D2所选择的2ch的预测误差按照由选择信号发生器17指定的位数标志以指定位数进行包装。
接着,多路转换器19如图3所示,对1个帧的量多重化为●帧头(40位);●和信号ch(L+R)的1帧的头部取样值(25位);
●差信号ch(L-R)的1帧的头部取样值(25位);●和信号ch(L+R)的每个子帧的预测器选择标志(3位×80);●差信号ch(L-R)的每个子帧的预测器选择标志(3位×80);●和信号ch(L+R)的每个子帧的位数标志(5位×80);●差信号ch(L-R)的每个子帧的位数标志(5位×80);●和信号ch(L+R)的预测残差数据串(可变位数);●差信号ch(L-R)的预测残差数据串(可变位数)。
作为可变速率位流输出。根据这样预测编码,原信号例如取样频率=192kHZ、量化位数=24位,2声道时可以实现59%的压缩率。
当将该可变速率位流数据记录在DVD音频盘中时,被包装在图4所示的压缩PCM的音频(A)包中。该包中除了2034字节的用户数据(A分组、V分组)之外,还加有4字节的包起始信息、6字节的SCR(System Clock Reference系统时钟基准参照值)、3字节的Mux速率和1个字节的填充,合计14字节的包头(1包=合计2048字节)。这时,将计时标记SCR信息在ACB单元内的头部包中以“1”在同一标题内连续,就可以管理同一标题内的A包的时间。
压缩PCM的A分组如图5详细所示,由17、9及14字节的分组头、专用头、图3所示格式的1-2011字节的音频压缩PCM数据构成。压缩PCM的专用头由以下部分构成●1字节的子流ID;●2字节的UPC/EAN-ISRC(Universal Product Code/EuropeanArticle Number-International Standard Recording Code)编号、及UPC/EAN-ISRC数据;1字节的专用头长度;2字节的第1存取单元指针;8字节的音频数据信息(ADI);0-7字节的填充字节。
下面参照图6对解码器D1、D2进行说明。图3中所示的格式的可变速率位流数据,通过信号分离器21按帧头进行分离。而且,和信号ch(L+R)及差信号ch(L-R)的1帧的前部取样值分别加到累积运算电路25a、25b上,和信号ch(L+R)及差信号ch(L-R)的预测器选择标志分别作为预测器(24a-1-24a-n)、(24b-1-24b-n)的各选择信号输入,和信号ch(L+R)及差信号ch(L-R)的位数标志和预测残差数据串加到拆包电路22上。在此预测器(24a-1-24a-n)、(24b-1-24b-n)分别与编码端的预测器(12a-1-12a-n)、(12b-1-12b-n)具有相同的特性,由预测器选择标志选择同一特性的信号。
拆包电路22按每个位数标志对和信号ch(L+R)及差信号ch(L-R)的预测残差数据串进行分离,分别输出给加法电路23a、23b。在加法电路23a、23b上,从拆包电路22输出的和信号ch(L+R)和差信号ch(L-R)的此次预测残差数据与预测器(24a-1-24a-n)、(24b-1-24b-n)中通过预测器选择标志选择的各自一个预测的上次预测值相加,算出此次的预测值。该此次的预测值通过图2所示的差分电路11a、11b分别算出的差分Δ(L+R)、Δ(L-R)即DPCM数据,加到预测器(24a-1-24a-n)、(24b-1-24b-n)和累积运算电路25a、25b上。
累积运算电路25a、25b分别对1帧的前面取样值按每个取样,累积相加差分Δ(L+R)、Δ(L-R),输出和信号ch(L+R)、差信号ch(L-R)的各PCM数据。该和信号(L+R)、差信号(L-R)如图1所示那样,通过加法电路4a算出2L信号,同时通过减法电路4b算出2R信号。然后,2L信号和2R信号分别通过除法器5a、5b除成1/2,恢复到原来的立体声2声道信号L、R。
下面参照图7、图8对第2实施例进行说明。在上述实施例中的构成只将和信号(L+R)、差信号(L-R)的各差分Δ(L+R)、Δ(L-R)即DPCM数据进行预测编码。但是在该第2实施例中的构成是将和信号(L+R)、差信号(L-R)即PCM数据或其各差分Δ(L+R)、Δ(L-R)即DPCM数据进行选择预测编码。
为此,图7所示的编码装置在图2所示的构成中增加了分别对和信号(L+R)、差信号(L-R)进行预测编码的预测电路15A、15S和缓冲器·选择器16A、16S。选择信号发生器17根据由缓冲器·选择器16A、16S分别选择的和信号(L+R)、差信号(L-R)和由缓冲器·选择器16D1、16D2分别选择的差分Δ(L+R)、Δ(L-R)的各预测残差的最小值,判断PCM数据和DPCM数据的哪一个压缩率高,并选择其中压缩率高的数据。这时增加该PCM/DPCM的选择标志(预测电路选择标志)进行多重化。
在此,图7所示的和信号(L+R)的预测电路15A和差分Δ(L+R)的预测电路15D1具有同样的构成,当差信号(L-R)的预测电路15S和差分Δ(L-R)的预测电路15D2是同样的构成时,解码装置如图8所示就没必要设置PCM数据和DPCM数据两个预测电路了,而一个数据量的预测电路即可。而且,根据从编码装置传输的预测电路选择标志由选择器26a、26b在DPCM数据情况下选择累积运算电路25a、25b的输出,而在PCM数据情况下选择加法电路23a、23b的输出。
如图9所示,第3实施例的构成是在原信号L、R(PCM数据)、和信号(L+R)、差信号(L-R)(PCM数据)及其各差分Δ(L+R)、Δ(L-R)(DPCM数据)三组之一选择地进行预测编码。
为此,如图9所示的编码装置与图7所示的构成相比增加了对原信号L、R分别进行预测编码的预测电路15L、15R和缓冲器·选择器16L、16R。另外,选择信号发生器17根据缓冲器·选择器16L、16R所选择的原信号L、R及由缓冲器·选择器16A、16S所选择的和信号(L+R)、差信号(L-R)及缓冲器·选择器16D1、16D2所选择的各差分Δ(L+R)、Δ(L-R)的各预测残差的最小值,选择压缩率高的一组数据。这时,增加该选择标志(预测电路选择标志)进行多重化。
当图9所示的3组预测电路是同样构成时,如图10所示,解码装置没有必要设置3组预测电路。只要1组的预测电路即可。而且,根据从编码装置传输的的预测电路选择标志,在DPCM数据的情况下选择累积运算电路25a、25b的输出,而对PCM数据则选择加法电路23a、23b的输出,通过声道相关电路B恢复原信号L、R。然后再通过选择器27a、27b,对原信号L、R组选择加法电路23a、23b的输出,而在其他情况时选择声道相关电路B的输出。
经过网络传输由编码端进行预测编码的可变速率位流数据时,编码端如图11所示,按传输用进行分组(步骤S41),接着加上分组头(步骤S42),然后将该分组传送到网络上(步骤S43)。在解码端如图12所示,除去头部(步骤S51),接着复原数据(步骤S52),然后将该数据存放在存储器中等待解码(步骤S53)。
正如以上说明,由于本发明将两个系统的音频信号的和信号和差信号的各差分进行预测编码,因此在对音频信号进行预测编码时可以改善压缩率。
权利要求
1.一种音频编码解码方法,对音频信号进行编码解码,该方法包括下述步骤声道转换步骤,对数字数据化的第1和第2系统的音频信号进行矩阵运算,并将其转换为彼此相关的声道;无损失编码步骤,包括(a)线性预测编码步骤,对通过所述声道转换步骤所转换的2个相关声道信号进行线性预测编码时,按规定时间的帧单位获得头部取样值,同时按把所述帧分频后的子帧单位选择线性预测方法,进行线性预测编码;(b)格式化步骤,容纳预测编码数据并将其格式化为可变速率位流,该预测编码数据包含具有头部信息及其后续用户数据的格式的、并通过所述线性预测编码步骤在该用户数据中选择的头部取样值和预测残差和线性预测方法;(c)输出步骤,输出所述可变速率位流的数据,无损失解码步骤,包括(d)抽取步骤,输入所述可变速率位流数据,并抽取各个相关声道的预测编码数据;(e)算出步骤,根据由所述抽取步骤抽取的各个声道的预测编码数据,算出各个相关声道的信号预测值;(f)第1还原步骤,从由所述算出步骤算出的预测值还原各个相关声道信号,第2还原步骤,对由所述无损失解码步骤还原的2个相关声道信号进行矩阵运算,并还原所述第1和第2系统的音频信号。
2.根据权利要求1所述的音频编码解码方法,其特征在于,在所述线性预测编码步骤中,对由所述声道转换步骤转换的2个相关声道信号的每个声道,响应输入的音频信号按规定时间的帧单位获得头部取样值,同时在根据时间区间的过去信号预测的当前信号的多个预测值中,按所述子帧单位选择其预测值为最小值的线性预测方法,进行预测编码。
全文摘要
本发明公开一种对音频信号进行预测编码时改善压缩率的装置。加法电路1a计算出立体声2声道信号L、R的和信号(L+R),减法电路1b计算出差信号(L-R)。由差分运算电路11D1、11D2计算出本次与上次的差分Δ(L+R)、Δ(L-R),由于预测编码电路(15D1、15D2、16D1、16D2)计算出差分Δ(L+R)、Δ(L-R)的多个预测值,计算出多个预测值与差分Δ(L+R)、Δ(L-R)的各预测残差,选择最小的预测残差。
文档编号G10L19/00GK1440133SQ0312048
公开日2003年9月3日 申请日期2003年3月19日 优先权日1998年10月13日
发明者渕上德彦, 植野昭治, 田中美昭 申请人:日本胜利株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1