立体声编码装置、立体声解码装置及其方法

文档序号:2829249阅读:297来源:国知局
专利名称:立体声编码装置、立体声解码装置及其方法
技术领域
本发明涉及对立体声信号实施编码的立体声编码装置、与其对应的立体声解码装置以及其方法。
背景技术
正像通过便携式电话进行通话那样,现在移动通信系统中的语音通信以单声道方式进行的通信(单声道通信)为主流。但是,今后像第四代移动通信系统那样,随着进一步的传输速率的比特速率高速化的实现,因为能够确保用于传输多个信道的频宽,所以期待着在语音通信中普及通过立体声方式的通信(立体声通信)。
比如,通过将音乐存储于装载了HDD(硬盘)的便携式音频播放器(audioplayer),并在该播放器安装用于立体声的耳塞式耳机或头戴式耳机等来欣赏立体声音乐的用户数量越来越多,考虑到这样的现状可以预测到,今后将便携式电话与音乐播放器结合在一起,在使用用于立体声的耳塞式耳机或头戴式耳机等的配件的同时,进行通过立体声方式的语音通信的生活方式将广为普及。另外,在逐渐普及起来的电视会议等的环境中,为了能够进行具有高保真度的对话,预计将进行立体声通信。
另一方面,在移动通信系统和有线方式的通信系统等中,为了减轻系统的负荷,一般通过事先对传输的语音信号进行编码而谋求降低传输信息的比特速率。
因此,最近对立体声语音信号进行编码的技术颇受瞩目。比如存在使用跨信道预测(cross-channel prediction)提高编码预测残差信号的编码效率的编码技术(参照非专利文献1),所述预测残差信号为对立体声语音信号的CELP编码施以加权处理的预测残差信号。
S.A.Ramprashad、“Stereophonic CELP coding using crosschannel prediction,”、In Proc.of the 2000 IEEE Workshop、pp.136-138、2000

发明内容
发明要解决的问题但是,在非专利文献1所公开的技术中,分别对两个信道的语音信号具有自适应代码本和固定代码本等,对每个信道产生不同的驱动音源信号,并生成合成信号。也就是说,对每个信道进行语音信号的CELP编码,并将得到的每个信道的编码信息输出到解码端。因此,存在生成与信道数量相应的编码信息,从而增大编码信息量(编码比特速率)的问题。
因此,本发明旨在提供立体声编码装置、立体声解码装置及其方法,能够防止解码信号的音质的恶化,同时削减编码信息量(编码比特速率)。
解决该问题的方案本发明的立体声编码装置采用的结构,包括校正单元,通过校正第一信道信号以及第二信道信号的双方或者其中一方,提高所述第一信道信号以及所述第二信道信号之间的相似度;第一编码单元,使用单一的音源,对提高了相似度的所述第一信道信号以及第二信道信号进行编码;以及第二编码单元,对有关所述校正单元的校正的信息进行编码。
发明有益效果根据本发明,能够防止解码信号的音质的恶化,同时削减编码信息量(编码比特速率)。


图1是实施方式1的立体声编码装置的功能块图;图2是表示在不同位置对来自同一发生源的声音进行拾音而得到的信号的波形谱的一例的图;图3是实施方式1的立体声解码装置的功能块图;图4是表示实施方式1的立体声语音编码装置的主要结构的方框图;图5是表示实施方式1的语音编码单元内部的主要结构的方框图;图6是表示实施方式1的空间信息处理单元内部的主要结构的方框图;图7是表示实施方式2的立体声语音编码装置的主要结构的方框图;图8是表示实施方式3的语音编码单元的主要结构的方框图;以及图9是表示实施方式3的空间信息赋予单元内部的主要结构的方框图。
具体实施例方式
以下,参照附图详细说明本发明的实施方式。另外,在此以对由两个信道构成的立体声信号进行编码的情形为例来说明。
(实施方式1)图1是用来说明本发明的实施方式1的立体声编码方法的概念的图,也就是本实施方式的立体声编码装置的功能块图。
在本实施方式的立体声编码装置中,首先对作为编码对象的立体声信号的L信道信号以及R信道信号的相互之间的特性的不同进行校正。通过该校正处理来提高两个信道信号之间的相似度。然后,在后续的编码处理中,利用在两个信道共用的单一的音源对校正后的两个信道信号进行编码,从而得到单一的编码参数(当通过多个编码参数来表现单一的音源时,为一组编码参数)。因为两个信道信号处于互相非常相似的状态,所以能够利用两个信道共用的音源来进行编码。
一般而言,即使是来自同一发生源的声音,根据麦克风的设置位置,也就是根据拾音位置,信号波形也呈现不同的特性。作为简单的示例,对应于离开发生源的距离,立体声信号的能量发生衰减,同时到达时间也发生延迟,由此根据拾音位置呈现不同的波形频谱。像这样,立体声信号受到如拾音环境的空间因素的较大的影响。
为了详细地说明因该拾音环境的不同而产生的立体声信号的特性,图2表示在不同的两个位置对来自同一发生源的声音进行拾音而得到的信号(L信道信号SL、R信道信号SR)的波形频谱的示例。
从该图可以看出L信道信号以及R信道信号分别呈现不同的特性。该呈现不同特性的现象能够理解为在原有的信号的波形上,加上因拾音位置而异的新的空间特性后,通过麦克风等的拾音设备,声音被拾取的结果。该特性在本说明书中称为空间信息(Spatial Information)。比如,在图2的示例中,当将L信道信号SL延迟时间Δt则成为L信道信号SL’。接下来,将L信道信号SL’的振幅按照一定的比例减小而使振幅差ΔA消失的话,因为L信道信号SL’为来自同一发生源的信号,所以在理想的情况下能够期待与R信道信号SR相匹配。也就是说,可以考虑为L信道信号以及R信道信号的特性上的不同,能够通过去除两个信道的空间信息的差而进行校正。
于是,本实施方式通过对上述L信道信号以及R信道信号的各自的空间信息的双方或者一方施加适当的校正,而使两个信道信号的波形接近,从而提高这些信号的相似度。由此,能够共有用于编码处理的音源,而且作为编码参数,即使不对两个信道的信号生成各自的编码参数,也能够通过生成单一的(或者一组)编码参数而得到精确的编码信息。
如果更加详细地说明的话,空间信息为有关声音的发生源和各个拾音设备之间的空间的信息。比如,根据拾音设备的位置,各个信道信号的振幅发生变化或者相位发生变化,由该事实可以考虑各个信道信号包含有关从音源到各个拾音设备为止的空间的信息。而且,由于该空间信息,立体声信号能够赋予人在听觉上的纵深感。另外,对于各个信道之间也可以同样地考虑,比如可以考虑,在L信道信号中,包含有关L信道以及R信道的各个拾音设备之间的空间的信息。因此,通过操作包含于各个信道信号中的空间信息,能够使各个信道信号互相相似,使各个信道信号相似于音源信号,或者使各个信道信号相似于某个虚拟信道的信号。本发明人着眼于该点,完成了本发明。
另外,如果提高两个信道的相似度的话,能够在L信道信号以及R信道信号之间共有音源。因此,作为对L信道信号以及R信道信号进行的校正,不仅通过校正空间信息,而且通过校正空间信息以外的其它的特性也能够提高两个信道的相似度。
图1所示空间信息分析单元101、相似度提高单元102以及信道信号编码单元103通过进行以下的操作而实现上述的处理。
空间信息分析单元101分析对于L信道信号(SL)以及R信道信号(SR)的空间信息,并将分析结果输出到相似度提高单元102以及空间信息编码单元104。相似度提高单元102根据从空间信息分析单元101输出的分析结果,通过校正对于L信道信号以及R信道信号的空间信息的不同,提高L信道信号以及R信道信号的相似度。相似度提高单元102将提高了相似度后的L信道信号(SL”)以及R信道信号(SR”)输出到信道信号编码单元103。信道信号编码单元103利用两个信道共用的音源,分别对该SL”以及SR”进行编码,并输出得到的一组编码信息(信道信号编码参数)。空间信息编码单元104对从空间信息分析单元101输出的空间信息的分析结果进行编码,并输出得到的编码信息(空间信息编码参数)。
虽然在上述的说明中,以校正SL以及SR的双方的波形,并从相似度提高单元102输出由此提高相似度的两个信号(SL”、SR”)的情形为例进行了说明,但是也可以进行校正,以便使SL以及SR的其中一方的波形接近另一方的波形。在该情形下,比如对SL施加校正,则相似度提高单元102的输出为SL”和SR。也就是说,与SR不经由相似度提高单元102而直接被输出到信道信号编码单元103的构成实质上相同。
另外,作为上述的空间信息的具体例有以下的示例。
比如,可以将两个信道之间的能量比以及延迟时间差的两个参数作为空间信息来使用。这些都是易于定量化的参数。另外,作为变化例还可以使用每个频带的传播特性,比如相位差和振幅比。
图3为对应于上述的立体声编码装置的本实施方式的立体声解码装置的功能块图。
空间信息解码单元151对空间信息编码参数进行解码,并将得到的空间信息输出到信道信号复原单元153。信道信号解码单元152对信道信号编码参数进行解码而得到特定的信道信号。该信道信号为校正L信道信号以及R信道信号的两个信道的空间信息,提高了L信道以及R信道的两个信道之间相似度的共用的信道信号。该L信道以及R信道共用的信道信号被输出到信道信号复原单元153。信道信号复原单元153利用从空间信息解码单元151输出的空间信息,将从信道信号解码单元152输出的信道信号复原为L信道信号以及R信道信号,并输出结果。
像这样,根据本实施方式的立体声编码方法以及立体声解码方法,通过校正立体声信号的各个信道信号而提高各个信道信号的相似度,然后利用各个信道共用的音源对各个信道信号进行编码,使得能够削减编码信息量(编码比特速率)。另外,编码端还对各个信道之间的空间信息的差进行编码并输出结果,使得在解码端能够利用该结果对各个信道信号进行精确再现。
虽然在上述说明中,以提高各个信道信号的相似度后,利用各个信道共用的音源对两个信道实施编码的情形为例进行了说明,但是两个信道的相似度已经提高,因此也可以只选择其中一个信道作为编码对象,并只输出该选择信道的编码信息。此外在该情形下,在解码端,也能够对选择信道的编码信息进行解码而再现该选择信道的信号,并且即使对于在编码端未被选择的未选择信道,也能够利用从编码端输出的空间信息,从选择的信道来再现该未选择信道而不会使质量实质上恶化。
另外,在相似度提高单元102,两个信道信号的空间信息的校正方法有多种。比如有以下方法从两个信道信号中完全去除空间信息,从L信道信号以及R信道信号复原为音源信号(在音源生成的语音信号),或将L信道信号以及R信道信号的算术平均[(L+R)/2]认为是伪单声道信号,并从两个声道信号中分别去除预定的空间信息而变换成伪单声道信号。但是,虽然从理论上来讲,能够将L信道信号以及R信道信号变换成上述的音源信号和伪单声道信号,但是实际上声音只在两个麦克风(L信道以及R信道)被设置的位置获得,并且编码装置能够取得的只是L信道信号以及R信道信号。
于是,在本实施方式的更为详细的实施例中,设L信道信号或者R信道信号的一方为主信道信号,而设另外一方为副信道信号,并通过从副信道信号中去除预定的空间信息,由此使该信号相似于主信道信号。因为编码装置取得L信道信号以及R信道信号的双方,所以能够通过对两个信道信号进行比较分析而求取上述的预定的空间信息,也就是L信道信号以及R信道信号的空间信息的差。
接下来,利用图4以及图5进一步详细地说明本实施方式的立体声编码方法。
图4为表示本实施方式的立体声语音编码装置(也就是实现图1所示的立体声编码方法的概念的立体声语音编码装置)的主要构成的方框图。在此,表示在下面的第一信道语音信号以及第二信道语音信号,分别表示为L信道语音信号以及R信道语音信号,或者表示与此相反的R信道语音信号以及L信道语音信号。
本实施方式的立体声语音编码装置包括语音编码单元100、MC选择单元105以及MC选择信息编码单元106。语音编码单元100具有对应于图1所示的功能块整体的结构。
MC选择单元105设输入的第一信道语音信号以及第二信道语音信号的其中一方为主信道,而将另外一方设为副信道,并将主信道信号(MC)以及副信道信号(SC)输出到语音编码单元100。
语音编码单元100首先对主信道信号与副信道信号进行比较分析,并求取两个信道之间的空间信息的差。接下来,语音编码单元100从副信道信号中去除该求取出来的空间信息的差,并使其相似于主信道信号,利用两个信道共用的音源,对主信道信号以及相似于主信道信号的副信道信号进行编码,并输出得到的编码信息(信道信号编码参数)。另外,语音编码单元100还对求取出来的空间信息的差进行编码,并输出该编码信息(空间信息编码参数)。
MC选择信息编码单元106对MC选择信息进行编码,并输出该编码信息(MC选择信息编码参数),所述MC选择信息表示MC选择单元1 05将哪个信道作为主信道。该MC选择信息编码参数与语音编码单元100生成的信道信号编码参数以及空间信息编码参数一起,作为编码信息传送到解码装置。
图5是表示上述语音编码单元100的内部的主要结构的方框图。在此以作为语音信号的编码方法利用CELP编码的情形为例进行说明。
该语音编码单元100主要具有MC编码单元110-1,对主信道信号(MC)进行编码;SC编码单元110-2,对副信道信号(SC)进行编码;空间信息处理单元123以及两个信道共用的自适应代码本、固定代码本等。另外,空间信息处理单元123对应于图1所示的功能块中的空间信息分析单元101、相似度提高单元102以及空间信息编码单元104。
虽然编码对象的信号各异,但是MC编码单元110-1与SC编码单元110-2的内部的基本结构相同。因此,对于相同的结构要素,在相同的标注上将号码1、2加在连字符后来区别表示MC编码单元110-1、SC编码单元110-2。并且,只说明MC编码单元110-1端的结构,而基本上省略对SC编码单元110-2端的说明。
语音编码单元100对由声道信息和音源信息构成的主信道信号、副信道信号进行编码,其中,对于声道信息,通过求取LPC参数(线性预测系数)进行编码;对于音源信息,通过求取索引进行编码,所述索引为指定使用预先存储的语音模式中的哪一个的索引,也就是指定通过自适应代码本117以及固定代码本118生成什么样的语音矢量的索引。
具体而言,语音编码单元100的各个部分进行以下的操作。
LPC分析单元111-1对主信道信号进行线性预测分析,求取频谱包络信息的LPC参数,并将结果输出到LPC量化单元112-1以及听觉加权单元115-1。另外,SC编码单元110-2的LPC分析单元111-2对由空间信息处理单元123实施了的规定处理后的副信道信号进行上述处理。有关空间信息处理单元123的处理将在后面论述。
LPC量化单元112-1对由LPC分析单元111-1得到的LPC参数进行量化,将得到的量化LPC参数输出到LPC合成滤波器113-1,并将量化LPC参数的索引(LPC量化索引)作为编码参数输出。
另一方面,自适应代码本117存储着由LPC合成滤波器113-1以及LPC合成滤波器113-2的双方共同使用的过去的驱动音源,并根据对应于由失真最小化单元116指示的索引的自适应代码本延迟量(lag),从存储着的驱动音源生成相当于一个子帧的音源矢量。该音源矢量作为自适应代码本矢量被输出到乘法器120。
固定代码本118预先存储着多个预定形状的音源矢量,并将对应于由失真最小化单元116指示的索引的音源矢量作为固定代码本矢量输出到乘法器121。
上述自适应代码本117被用于表现例如有声语音的、周期性强的分量;另一方面,固定代码本118被用于表现例如白噪声的、周期性弱的分量。
增益代码本119根据来自失真最小化单元116的指示,生成用于从自适应代码本117输出的自适应代码本矢量的增益(自适应代码本增益)以及用于从固定代码本118输出的固定代码本矢量的增益(固定代码本增益),并将其分别输出到乘法器120和121。
乘法器120将从增益代码本119输出的自适应代码本增益,乘以从自适应音源代码本117输出的自适应代码本矢量,并将该结果输出到加法器122。
乘法器121将从增益代码本119输出的固定代码本增益,乘以从固定代码本118输出的固定代码本矢量,并将该结果输出到加法器122。
加法器122将从乘法器120输出的自适应代码本矢量和从乘法器121输出的固定代码本矢量相加,并将相加后的音源矢量作为驱动音源输出到LPC合成滤波器113-1以及LPC合成滤波器113-2。
LPC合成滤波器113-1利用将从LPC量化单元112-1输出的量化LPC参数作为滤波器系数,并且将自适应代码本117以及固定代码本118生成的音源矢量作为驱动音源的滤波函数,也就是利用LPC合成滤波器来生成合成信号。该合成信号然后被输出到加法器114-1。
加法器114-1从主信道信号(在加法器114-2去除了空间信息后的副信道信号)减去在LPC合成滤波器113-1生成的合成信号,由此计算误差信号,并将该误差信号输出到听觉加权单元115-1。另外,该误差信号相当于编码失真。
听觉加权单元115-1使用听觉加权滤波器,对从加法器114-1输出的编码失真进行听觉加权处理,并将结果输出到失真最小化单元116,所述听觉加权滤波器将从LPC分析单元111-1输出的LPC参数作为滤波器系数。
失真最小化单元116同时考虑从听觉加权单元115-1以及听觉加权单元115-2输出的编码失真的双方,对每个子帧求取自适应代码本117、固定代码本118以及增益代码本119的各自的索引(代码本索引),使得上述双方的编码失真的和成为最小,并将这些索引作为编码信息输出。
具体而言,编码失真以作为编码对象的原信号与合成信号之间的差的二次方来表示。因此,设从听觉加权单元115-1输出的编码失真为a2,并且从听觉加权单元115-2输出的编码失真为b2,失真最小化单元116求取自适应代码本117、固定代码本118以及增益代码本119的各自的索引(代码本索引),其中这些编码失真的和a2+b2成为最小。
另外,基于上述的自适应代码本117以及固定代码本118生成合成信号,并求取该信号的编码失真的一系列处理构成闭环(反馈环),失真最小化单元116通过将指示各个代码本的索引在一个子帧中进行各种各样的变化来搜索各个代码本,并输出最终得到的、使两个信道的编码失真成为最小的各个代码本的索引。
另外,使编码失真成为最小时的驱动音源对于每个子帧被反馈到自适应代码本117。自适应代码本117通过该反馈来更新所存储的驱动音源。
图6是表示空间信息处理单元123内部的主要结构的方框图。主信道信号以及副信道信号的双方被输入到该空间信息处理单元123。
空间信息分析单元131然后通过对主信道信号和副信道信号进行比较分析,求取两个信道信号的空间信息的差,并将得到的分析结果输出到空间信息量化单元132。
空间信息量化单元132对通过空间信息分析单元131得到的两个信道的空间信息的差进行量化,并输出得到的空间信息的编码参数(空间信息量化索引)。而且,空间信息量化单元132然后对空间信息量化索引实施逆量化,并将结果输出到空间信息去除单元133,所述空间信息量化索引是对通过空间信息分析单元131得到的两个信道的空间信息的差进行量化而得到的。
空间信息去除单元133通过从被输入的副信道信号减去从空间信息量化单元132输出的、经逆量化的空间信息量化索引,也就是对从空间信息分析单元131得到的两个信道的空间信息的差进行量化并进行逆量化的信号,将副信道信号变换为相似于主信道信号的信号。该去除了空间信息的副信道信号被输出到LPC分析单元111-2。
接下来,利用算式来详细说明空间信息处理单元123的各个部分的处理。首先,以作为空间信息使用的两个信道之间的能量比以及延迟时间差的情形为例进行说明。
空间信息分析单元131计算两个信道之间的帧单位的能量比。首先,根据下式(1)以及下式(2)来求取主信道信号以及副信道信号的一个帧内的能量EMC以及ESC。
EMC=Σn=0FL-1xMC(n)2---(1)]]>ESC=Σn=0FL-1xSC(n)2---(2)]]>其中,n为样本号码,FL为一个帧的样本数(帧长)。其中,xMC(n)以及xSC(n)分别表示每个主信道信号以及副信道信号的第n个样本的振幅。
继而,空间信息分析单元131根据下式(3)求取主信道信号以及副信道信号的能量比的平方根C。
C=EMCESC---(3)]]>另外,空间信息分析单元131像下面一样,将延迟时间差作为两个信道信号之间的互相关成为最大的值来求取,所述延迟时间差为副信道信号相对主信道信号的、两个信道信号之间的信号的时间上的偏差量。具体而言,主信道信号以及副信道信号的互相关函数Φ根据下式(4)求取。
φ(m)=Σn=0FL-1xMC(n)·xSC(n-m)---(4)]]>其中,设m为取预先规定的从min_m到max_m的范围的值,将Φ(m)成为最大时的m=M作为副信道信号相对主信道信号的延迟时间差。
另外,上述的能量比以及延迟时间差也可以通过下式(5)来求取。在算式(5)中,求取使误差D成为最小的能量比的平方根C以及延迟时间差m,所述误差D为主信道信号和去除了对主信道信号的空间信息的副信道信号之间的误差。
D=Σn=0FL-1{xMC(n)-C·xSC(n-m)}2---(5)]]>空间信息量化单元132将上述C以及m通过预先规定的比特数进行量化,并将量化值分别设为CQ以及MQ。
空间信息去除单元133从副信道信号中根据下式(6)的变换式去除空间信息。
xSC′(n)=CQ·xSC(n-MQ) …(6)(其中,n=0,…,FL-1)如上述说明,根据本实施方式,通过校正立体声信号的各个信道信号提高各个信道信号的相似度,然后利用各个信道通用的音源对各个信道信号进行编码,因此能够削减编码信息量(编码比特速率)。
另外,因为使用通用的音源来对各个信道信号进行编码,所以无需设置用于各个信道的两组自适应代码本、固定代码本以及增益代码本组,并能够通过一组自适应代码本、固定代码本以及增益代码本组来生成音源。也就是说,由此能够削减电路规模。
另外,在以上的结构中,失真最小化单元116不仅考虑主信道信号还考虑副信道信号来进行控制,以使双方的信道的编码失真成为最小。因此,能够提高编码性能,提高解码信号的音质。
虽然在本实施方式的图5中,以将CELP编码使用于立体声语音信号的编码的情形为例进行了说明,但是如果进行提高L信道信号以及R信道信号间的相似度的校正,并且实际上两个信号能被认为是伪单一的信道信号,就能够削减编码信息量,因此编码方法不必要像CELP编码那样将预定的音源信息作为代码本。
另外,在本实施方式中,虽然以将两个信道之间的能量比以及延迟时间差的两个参数的双方作为空间信息的情形为例进行了说明,但是作为空间信息也可以只使用其中任意一方的参数。在只使用一个参数的情形下,与使用两个参数的情形相比,虽然提高两个信道的相似度的效果有所减少,但是反而具有能够进一步削减编码比特数的效果。
比如,作为空间信息只使用两个信道之间的能量比时,副信道信号的变换利用CQ,根据下式(7)来进行,所述CQ为对通过上式(3)求出的能量比的平方根C进行量化而得到的值。
xSC′(n)=CQ·xSC(n) …(7)(其中,n=0,…,FL-1)比如,作为空间信息只使用两个信道之间的延迟时间差时,副信道信号的变换利用MQ,根据下式(8)来进行,所述MQ为对使通过上式(4)求出的Φ(m)为最大的m=M进行量化而得到的值。
xSC′(n)=xSC(n-MQ) …(8)(其中,n=0,…,FL-1)(实施方式2)图7是表示本发明实施方式2的立体声语音编码装置的主要结构的方框图。该立体声语音编码装置具有与实施方式1所示的立体声语音编码装置(参照图4)相同的基本结构,对相同的构成要素赋予相同的号码,并省略其说明。
本实施方式的立体声语音编码装置计算第一信道以及第二信道的双方的语音信号的能量,并将能量较大的信道作为主信道来选择。在此,对于每个帧计算能量,主信道的选择也以每个帧为单位来进行。以下详细地说明。
能量计算单元201根据下式(9)以及下式(10)对第一信道语音信号以及第二信道语音信号的每个帧求取能量E1以及E2,并将结果输出到MC选择单元105a。
E1=Σn=0FL-1x1(n)2---(9)]]>E2=Σn=0FL-1x2(n)2---(10)]]>MC选择单元105a决定在第一信道语音信号以及第二信道语音信号中的哪一个信号作为主信道信号。具体而言,MC选择单元105a比较两个信道的帧单位的能量E1以及E2,将能量较大的信道作为主信道,将能量较小的信道作为副信道。也就是说,符合下式(11)所示的条件时,将第一信道作为主信道,将第二信道作为副信道。
E1≥E2…(11)另外,符合下式(12)所示的条件时,将第二信道作为主信道,将第一信道作为副信道。
E1<E2…(12)因为对每个帧进行主信道以及副信道的选择,所以MC选择信息编码单元106对哪个信道被选择为主信道的信息(MC选择信息)进行编码。
像这样,根据本实施方式,计算两个信道的每个帧的能量,将能量较大的信道选择为主信道。在此,一般假设能量较大的信号包含更多的信息量。因此,本实施方式通过将具有更多信息量的信道设为主信道,能够减小编码误差。
虽然在本实施方式中,以计算各个信道的能量,并将其作为基准来选择主信道的情形为例进行了说明,但是也可以直接识别各个信道的信息量,并将信息量多的信道选择为主信道。
另外,虽然在本实施方式中,以简单地将帧单位的能量作为主信道的选择基准的情形为例进行了说明,但是并不只限于此,比如使用对能量进行平滑化的值也是可以的。由此,能够抑制由于随着能量的波动而引起的主信道以及副信道之间过度地切换。这里,为了对能量进行平滑化,比如使用下式(13)以及(14)求取经平滑化处理的能量E1s以及E2s。
E1S=α1SE1S+(1-α1s)E1…(13)E2S=α2SE2S+(1-α2S)E2…(14)其中,α1s以及α2s为满足下式(15)的常数。
0<α1S,α2S<1…(15)(实施方式3)在本发明的实施方式1和2中,SC编码单元110-2的实际的编码对象为经空间信息处理单元123去除了空间信息后的副信道信号。具体而言,SC编码单元110-2从去除了空间信息后的副信道信号来生成合成信号,运行编码参数的最佳化循环并进行编码,以使该合成信号与去除了空间信息后的原来的副信道信号之间的编码失真成为最小。换言之,实施方式1和2中,在副信道的编码过程中,将去除了空间信息后的副信道信号作为编码对象,将该去除了空间信息后的副信道信号作为编码处理的对象信号而进行编码。
而在本发明的实施方式3,在副信道的编码过程中,设去除空间信息前的副信道信号(副信道信号仍包含空间信息)为编码对象,作为编码处理的对象信号而进行编码。
因为本实施方式的立体声语音编码装置的基本结构与实施方式1所示的立体声语音编码装置(参照图4)相同,所以省略该说明,下面对具有与实施方式1所示的语音编码单元100(参照图5)不同的结构的语音编码单元300进行说明。
图8是表示上述语音编码单元300的主要结构的方框图。对于与实施方式1所示的语音编码单元100相同的构成要素赋予相同的号码,并省略对其说明。
SC编码单元310对经空间信息处理单元123去除了空间信息的副信道信号,通过空间信息赋予单元301再次附加空间信息。也就是说,从空间信息处理单元123将关于副信道信号的空间信息提供给空间信息赋予单元301,并将该空间信息附加于从LPC合成滤波器113-2输出的合成信号,并将其结果输出到加法器114-2。
加法器114-2从副信道信号减去从空间信息赋予单元301输出的空间信息赋予后的合成信号,由此计算编码失真,并将该编码失真经由听觉加权单元115-2输出到失真最小化单元116。
失真最小化单元116对从MC编码单元110-1以及SC编码单元310输出的编码失真,如以上所述,对每个子帧求取各个代码本的索引以使双方的编码失真的和成为最小,并将这些索引作为编码信息输出。
另外,SC编码单元310具有不同于LPC分析单元111-2的LPC分析单元302,以便通过基于副信道信号生成的LPC系数对副信道信号进行听觉加权。
LPC分析单元302将副信道信号作为输入而进行LPC分析,并将得到的LPC系数输出到听觉加权单元115-2。
听觉加权单元115-2利用从LPC分析单元302输出的LPC系数,对从加法器114-2输出的编码失真进行听觉加权。
图9是表示上述空间信息赋予单元301内部的主要结构的方框图。
空间信息逆量化单元321对从空间信息处理单元123输出的空间信息量化索引进行逆量化,并将副信道信号相对主信道信号的空间信息的差输出到空间信息解码单元322。
空间信息解码单元322对从LPC合成滤波器113-2输出的合成信号,适用从空间信息逆量化单元321输出的空间信息的差,生成空间信息赋予后的合成信号,并输出该结果到加法器114-2。
接下来,利用算式说明用来生成副信道信号的处理,该副信道信号为在空间信息赋予单元301赋予了空间信息的副信道信号。
首先,作为空间信息以使用主信道信号与副信道信号之间的能量比以及延迟时间差的情形为例进行说明。与实施方式1相同,分别设空间信息量化索引的能量比和延迟时间差的量化值为CQ和MQ,空间信息逆量化单元321求取副信道信号相对主信道信号的空间信息的差,也即能量比C’以及延迟时间差M’。继而,空间信息解码单元322根据下式(16)求取空间信息赋予后的副信道信号。
xSC′′(n)=1C′·xSC(n+M′)---(6)]]>(其中,n=0,…,FL-1)另外,作为空间信息只利用两个信道之间的能量比时,赋予了空间信息的副信道信号根据下式(17)求出。
xSC′′(n)=1C′·xSC(n)---(17)]]>(其中,n=0,…,FL-1)另外,作为空间信息只利用两个信道之间的延迟时间差时,赋予了空间信息的副信道信号根据下式(18)求出。
xSC″(n)=xSC(N+M′) …(18)(其中,n=0,…,FL-1)像这样,根据本实施方式,在副信道的编码过程中,将去除空间信息前的副信道信号作为编码处理的对象信号进行编码,所以根据以下的理由能够比实施方式1和2进一步提高编码性能。
也就是说,在实施方式1、2中,将空间信息去除后的副信道信号作为实际的编码对象,并对该编码失真进行最小化。但是,应当作为解码信号最终输出的信号为副信道信号,而并不是空间信息去除后的副信道信号。于是,当将空间信息去除后的副信道信号作为编码处理的对象信号时,包含于作为最终的解码信号的副信道信号中的编码失真有可能未被充分地进行最小化。比如,即使副信道信号的振幅大于主信道信号的振幅时,输入到失真最小化单元116的副信道信号的编码失真,能够基于去除了与主信道信号之间的能量差后的信号而计算。但是,在解码装置中,将被另外解码的空间信息赋予给解码后的副信道信号来生成合成信号。这样的话,通过空间信息赋予,副信道信号的振幅被放大,因此原本包含于此的编码失真也将被放大。
另一方面,在本实施方式中,将空间信息未被去除的副信道信号本身作为编码对象,以在得到最终的解码信号时可能包含的编码失真为对象进行失真最小化的处理。因此,能够进一步提高编码性能。
另外,在以上的结构中,用于听觉加权处理的LPC系数是对作为SC编码单元310的输入信号的副信道信号进行另外的LPC分析而求取的。也就是说,通过反映了应当作为最终的解码信号的副信道信号本身的听觉加权而进行听觉加权处理。因此,能够得到具有很小听觉失真的编码参数。
以上,说明了本发明的各个实施方式。
本发明的立体声编码装置以及立体声编码方法,不被上述各实施方式所限定,可以加以各种变更来实施。
本发明的立体声编码装置,能够配置于移动通信系统的通信终端装置以及基站装置,并且由此能够提供具有与上述同样的作用效果的通信终端装置以及基站装置。另外,本发明的立体声编码装置以及立体声编码方法还可以利用在有线方式的通信系统中。
另外,虽然在此以通过硬件来实现本发明的情形为例进行了说明,但是本发明还可以通过软件来实现。比如,通过编程语言,对本发明的立体声编码方法的处理算法进行记述,并在内存中保存该程序并通过信息处理装置来实行,从而能够实现与本发明的立体声编码装置相同的功能。
另外,自适应代码本(adaptive codebook)有时也被称为自适应音源代码本,固定代码本(fixed codebook)有时也被称为固定音源代码本。而且,固定音源代码本也有时被称为概率代码本(stochastic codebook)或者随机代码本(random codebook)。
另外,用于说明上述的各个实施方式的各个功能模块,典型的被实现为由集成电路构成的LSI(大规模集成电路)。这些既可以分别实行单芯片化,也可以包含其中一部分或者是全部而实行单芯片化。
另外,每个功能块在此虽然称做LSI,但根据集成度的不同也可以称为“IC”、“系统LSI”、“超大LSI”和“极大LSI”等。
另外,集成电路化的技术不只限于LSI,也可以使用专用电路或通用处理器来实现。LSI制造后也可以利用能够编程的FPGA(Field ProgrammableGate Array,现场可编程门阵列),或可以利用对LSI内部的电路块的连接或设定进行重新构置的可重构置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了取代LSI集成电路化的技术,当然也可以利用该技术来实现功能块的集成化。也有适用生物技术等的可能性。
本说明书根据2004年11月30日提交的日本专利申请2004-347273号以及2005年3月3 1日提交的日本专利申请2005-100850号。该内容全部包括在此。
产业上的可利用性本发明的立体声编码装置、立体声解码装置及其方法能够适用于移动通信系统的通信终端装置、基站装置等的用途。
权利要求
1.一种立体声编码装置,包括校正单元,通过校正第一信道信号以及第二信道信号的双方或者其中一方,提高所述第一信道信号以及所述第二信道信号之间的相似度;第一编码单元,使用单一的音源,对提高了相似度的所述第一信道信号以及第二信道信号进行编码;以及第二编码单元,对有关所述校正单元的校正的信息进行编码。
2.如权利要求1所述的立体声编码装置,其中,所述校正单元校正包含于所述第一信道信号以及所述第二信道信号中的空间信息的双方或者校正其中一方,以及所述第二编码单元对有关所述空间信息的校正的信息进行编码。
3.如权利要求2所述的立体声编码装置,其中,所述空间信息包含所述第一信道信号以及所述第二信道信号的能量以及延迟时间的双方或者包含其中一方。
4.如权利要求1所述的立体声编码装置,其中,所述第一编码单元具有一组自适应代码本以及固定代码本。
5.如权利要求1所述的立体声编码装置,其中,所述第一编码单元求取使所述第一信道信号以及所述第二信道信号的双方的编码失真的和成为最小的所述音源。
6.如权利要求1所述的立体声编码装置,其中,所述校正单元求取所述第一信道信号的空间信息与所述第二信道信号的空间信息的差,并将该差从所述第一信道信号或者所述第二信道信号的任意一方去除。
7.如权利要求1所述的立体声编码装置,其中,所述校正单元将所述第一信道信号以及所述第二信道信号的信息量较多的信道信号作为主信道信号,而将另一方作为副信道信号,并进行校正以使该副信道信号的波形接近所述主信道信号的波形。
8.如权利要求7所述的立体声编码装置,其中,所述信息量多的信道信号为能量更大的一方的信道信号。
9.如权利要求1所述的立体声编码装置,其中,所述校正单元将所述第一信道信号以及所述第二信道信号的一方的信道信号作为主信道信号,而将另一方作为副信道信号,求取所述主信道信号的空间信息与所述副信道信号的空间信息的差,并将该差从所述副信道信号去除,所述第一编码单元,将去除了该差的副信道信号作为编码处理的对象信号。
10.如权利要求1所述的立体声编码装置,其中,所述校正单元将所述第一信道信号以及所述第二信道信号的一方的信道信号作为主信道信号,而将另一方作为副信道信号,求取所述主信道信号的空间信息与所述副信道信号的空间信息的差,并将该差从所述副信道信号去除,所述第一编码单元将去除该差前的所述副信道信号作为编码处理的对象信号,利用由去除了该差的所述副信道信号生成的合成信号进行编码。
11.一种立体声解码装置,包括第一解码单元,解码有关对第一信道信号以及第二信道信号的双方或者一方实施的校正的信息;第二解码单元,对有关实施了所述校正、提高了相似度的第一信道信号以及第二信道信号的信息进行解码;以及复原单元,利用有关所述校正的信息、和有关所述第一信道信号以及所述第二信道信号的信息,复原所述第一信道信号以及所述第二信道信号。
12.一种包括权利要求1所述的立体声编码装置的通信终端装置。
13.一种包括权利要求11所述的立体声解码装置的通信终端装置。
14.一种包括权利要求1所述的立体声编码装置的基站装置。
15.一种包括权利要求11所述的立体声解码装置的基站装置。
16.一种立体声编码方法,包括校正步骤,通过校正第一信道信号以及第二信道信号的双方或者校正其中一方,提高所述第一信道信号以及所述第二信道信号之间的相似度;第一编码步骤,通过单一的音源,对提高了相似度的所述第一信道信号以及所述第二信道信号进行编码;以及第二编码步骤,对有关所述校正步骤的校正的信息进行编码。
17.一种立体声解码方法,包括第一解码步骤,对有关对所述第一信道信号以及所述第二信道信号的双方或者一方所实施的校正的信息进行解码;第二解码步骤,对有关实施了所述校正、提高了相似度的所述第一信道信号以及所述第二信道信号的信息进行解码;以及复原步骤,利用有关所述校正的信息、和有关所述第一信道信号以及所述第二信道信号的信息,复原所述第一信道信号以及所述第二信道信号。
全文摘要
公开一种立体声语音编码装置,能够防止解码信号的音质的恶化,同时降低编码比特速率。在该装置中,空间信息分析单元(101)对L信道信号以及R信道信号的各个空间信息进行分析。相似度提高单元(102)根据空间信息分析单元(101)的分析结果,校正L信道信号以及R信道信号的各个空间信息的不同,从而提高L信道信号以及R信道信号之间的相似度。信道信号编码单元(103)使用两个信道共用的音源,分别对提高了相似度后的L信道信号以及R信道信号进行编码,并输出得到的单一的编码信息。空间信息编码单元(104)对空间信息分析单元(101)的分析结果进行编码,并输出得到的编码信息。
文档编号G10L19/14GK101069232SQ20058004118
公开日2007年11月7日 申请日期2005年11月28日 优先权日2004年11月30日
发明者后藤道代, 吉田幸司 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1