可扩展性编码装置以及可扩展性编码方法

文档序号:2829208阅读:372来源:国知局
专利名称:可扩展性编码装置以及可扩展性编码方法
技术领域
本发明涉及对立体声语音信号进行CELP方式的编码处理(以下有时只简称为CELP编码)从而实现可扩展性编码处理的可扩展性编码装置以及可扩展性编码方法。
背景技术
正像通过便携式电话进行通话那样,现在移动通信系统中的语音通信以单声道方式进行的通信(单声道通信)为主流。但是,今后像第四代移动通信系统那样,随着传输速率更高的比特速率高速化的实现,因为能够确保用于传输多个声道的频宽,所以期待着在语音通信中普及通过立体声方式的通信(立体声通信)。
比如,将音乐存储于装载了HDD(硬盘)的便携式音频播放器(audioplayer),并在该播放器安装用于立体声的耳塞机或耳机等来欣赏立体声音乐的用户越来越多,考虑到这样的现状可以预测到,今后将便携式电话与音乐播放器结合在一起,在使用用于立体声的耳塞机或耳机等的配件的同时,进行通过立体声方式的语音通信的生活方式将广为普及。另外,在逐渐普及起来的电视会议等的环境中,为了使富有临场感的对话成为可能,预计也要进行立体声通信。
但是可以预计,即使立体声通信得到普及,仍然要进行单声道通信。这是因为单声道通信利用低比特速率,所以可以期待降低通信成本,而且只适合单声道通信的便携式电话能够缩小电路规模而价格低廉,不需要高品质语音通信的用户可能购买只适合单声道通信的便携式电话。因此,在一个通信系统中,同时存在适合立体声通信的便携式电话和适合单声道通信的便携式电话,通信系统需要同时适合立体声通信以及单声道通信。
另外,移动通信系统通过无线信号进行通信数据的交换,因此根据传播路径环境,有时丢失一部分通信数据。因此,对于以上的情况,如果有一种便携式电话具有能够由剩余的接收数据恢复原来的通信数据的功能的话,将非常具有实用价值。
存在通过立体声信号和单声道信号构成的可扩展性编码技术,其具有如下功能能够同时支持立体声通信以及单声道通信,并且即使通信数据的一部分发生了丢失,也能够由剩余的接收数据恢复原来的通信数据,。作为具有该功能的可扩展性编码装置的例子,比如有非专利文献1所公开的装置。
ISO/IEC 14496-31999 (B.14 Scalable AAC with core coder)发明内容发明要解决的问题但是,非专利文献1所公开的可扩展性编码装置以音频信号为对象而没有考虑到语音信号,因此对语音信号原封不动地应用可扩展性编码,会发生编码效率下降的问题。特别是,对于语音信号,最佳的是应用能够高效地进行编码处理的CELP编码,但是在非专利文献1中并没有公开适用CELP方式的情形的具体配置,特别是将CELP编码处理适用于扩展层,对于未经估计的语音信号原封不动地应用最佳化的CELP编码处理,很难得到所期望的编码效率。
因此,本发明旨在提供一种可扩展性编码装置以及可扩展性编码方法,能够对立体声语音信号实现通过CELP编码处理的可扩展性编码,从而能够提高编码效率。
解决该问题的方案本发明的可扩展性编码装置,采取以下的结构,包括生成单元,由立体声语音信号生成单声道语音信号;第一编码单元,对所述单声道语音信号通过CELP方式进行编码处理,得到所述单声道语音信号的编码参数;以及第二编码单元,将所述立体声语音信号的R声道或者L声道的任意一个作为编码对象声道,对所述编码对象声道进行线性预测分析以及自适应音源代码本搜索而取得参数,求取该参数与所述单声道语音信号的编码参数的差分,并由该差分取得所述编码对象声道的编码参数。
发明有益效果根据本发明,对立体声语音信号能够实现通过CELP编码处理的可扩展性编码,从而能够提高编码效率。


图1是表示实施例1的可扩展性编码装置的主要结构的方框图;图2是表示单声道信号与第一声道信号以及第二声道信号之间的关系的图;图3是表示实施例1的CELP编码单元内部的主要结构的方框图;图4是表示实施例1的第一声道差分信息编码单元内部的主要结构的方框图;图5是表示实施例2的可扩展性编码装置的主要结构的方框图;以及图6是表示实施例2的第二声道差分信息编码单元内部的主要结构的方框图。
具体实施例方式
以下,参照附图详细说明本发明的实施例。另外,在此,说明对由2个声道构成的立体声语音信号进行编码处理的情形的例子,而且,下面表示的第一声道以及第二声道分别为L声道以及R声道,或者R声道以及L声道。
(实施例1)图1是表示本发明实施例1的可扩展性编码装置100的主要结构的方框图。该可扩展性编码装置100包括加法器101、乘法器102、CELP编码单元103以及第一声道差分信息编码单元104。
可扩展性编码装置100的各个部分进行以下的操作。
加法器101对输入到可扩展性编码装置100的第一声道信号CH1以及第二声道信号CH1进行加法处理,生成相加信号。乘法器102将该相加信号乘以1/2,使其的标量减半,生成单声道信号M。也就是,加法器101以及乘法器1 02求取第一声道信号CH1以及第二声道信号CH2的平均信号,使其作为单声道信号M。
CELP编码单元103对该单声道信号M进行CELP编码处理,并将得到的单声道信号的CELP编码参数输出到可扩展性编码装置100的外部以及第一声道差分信息编码单元104。这里,CELP编码参数为LSP参数、自适应音源代码本索引、自适应音源增益、固定音源代码本索引以及固定音源增益。
第一声道差分信息编码单元104对输入到可扩展性编码装置100的第一信道信号CH1进行基于CELP编码的编码处理,也就是通过进行线性预测分析、自适应音源代码本搜索以及固定音源代码本搜索而进行编码处理,并求取在该过程得到的编码参数与从CELP编码单元103输出的CELP编码参数的差分。另外,如果对于该编码处理也简单称为CELP编码处理的话,则以上的处理相当于对单声道信号M与第一声道信号CH1在CELP编码参数的水平(阶段)求取差分。继而,第一声道差分信息编码单元104对该有关第一声道的差分信息(第一声道差分信息)进行编码,并将得到的第一声道差分信息的编码参数输出到可扩展性编码装置100的外部。
该可扩展性编码装置100的一个特征在于由加法器101、乘法器102以及CELP编码单元103构成第一层,由第一声道差分信息编码单元104构成第二层,从第一层输出单声道信号的编码参数,从第二层输出编码参数,对该编码参数与第一层(单声道信号)的编码参数一起进行解码处理能够得到立体声信号。也就是,本实施例的可扩展性编码装置实现由单声道信号和立体声信号构成的可扩展性编码。
根据该结构,取得由上述第一层以及第二层构成的编码参数的解码装置可为同时适合立体声通信以及单声道通信的可扩展性解码装置,也可为只适合单声道通信的解码装置。另外,即使是同时适合立体声通信以及单声道通信的可扩展性解码装置,也存在由于传播路径的环境恶化,不能取得第二层的编码参数而只能取得第一层的编码参数的情形。但是,对于上述的情形,该可扩展性解码装置也能够解码单声道信号,虽然该单声道信号的质量较低。另外,该可扩展性解码装置在能够取得第一层以及第二层的编码参数时,能够利用两者的参数解码高品质的立体声信号。
在下面,说明解码装置能够利用从可扩展性编码装置100输出的第一层以及第二层的编码参数,解码立体声信号的原理。图2是表示对于单声道信号与第一信道信号以及第二信道信号之间的关系,比较编码处理前后的状态的图。
单声道信号M能够通过在第一声道信号CH1以及第二声道信号CH2的相加信号上乘上1/2,也就是通过下式等式(1)求取。
M=(CH1+CH2)/2 等式(1)也就是,设对于单声道信号M的CH1的差分(第一声道信号差分)为ΔCH1,则CH1如图2A所示,满足下式等式(2)的关系。
CH1=M+ΔCH1等式(2)
由此可以知道,当CH1为编码参数时,为了将其解码只需解码M以及ΔCH1的两者的编码参数即可。
同样地,对于第二声道信号CH2,设对于单声道信号M的CH2的差分(第二声道信号差分)为ΔCH2,则具有下式等式(3)的关系。
CH2=M+ΔCH2 等式(3)于是,如果能够像以下的等式(4)那样近似的话,上述等式(3)变化成等式(5)。
ΔCH1=-ΔCH2等式(4)CH2=M-ΔCH1 等式(5)由此可以知道,上述等式(4)的近似如果成立的话,与CH1的编码参数相同,通过解码M以及ΔCH1的两者的编码参数就可以间接地解码CH2的编码参数。
但是,经过编码处理通常会发生编码失真,如图2B所示,在经编码处理后,严格地来讲ΔCH1与ΔCH2的大小发生了变化。因此,上述等式(4)的意思为,编码处理后的第一声道差分信息以及第二声道差分信息的大小近似为相同,换句话说,在分别对第一声道以及第二声道进行编码时的两者的编码失真近似为相同。实际上,这些编码失真即使在实际的装置上也不会存在很大的变化,因此可以考虑为,即使忽视第一声道以及第二声道的编码失真的差而进行编码处理,也不会导致解码信号的音质发生显著的恶化。
于是,本实施例的可扩展性编码装置100利用上述的原理,输出M以及ΔCH1的2个编码参数。取得这些参数的解码装置通过解码M以及ΔCH1,不仅能够解码CH1,还能够解码CH2。
图3是表示CELP编码单元103内部的主要结构的方框图。
该CELP编码单元103包括LPC分析单元111、LPC量化单元112、LPC合成滤波器113、加法器114、听觉加权单元115、失真最小化单元116、自适应音源代码本117、乘法器118、固定音源代码本119、乘法器120、增益代码本121以及加法器122。
LPC分析单元111对从乘法器102输出的单声道信号M进行线性预测分析,并将作为分析结果的LPC参数输出到LPC量化单元112以及听觉加权单元115。
LPC量化单元112将从LPC分析单元111输出的LPC参数变换为适于进行量化的LSP参数后进行量化,并将得到的量化LSP参数(CL)输出到CELP编码单元103的外部。该量化LSP参数为通过CELP编码单元103得到的CELP编码参数的其中一个。另外,LPC量化单元112将该量化LSP参数再次变换为量化LPC参数后,将其输出到LPC合成滤波器113。
LPC合成滤波器113利用从LPC量化单元112输出的量化LPC参数,将由后述的自适应音源代码本117以及固定音源代码本119生成的音源矢量作为驱动音源,通过LPC合成滤波器进行合成。将得到的合成信号输出到加法器114。
加法器114反转从LPC合成滤波器113输出的合成信号的极性,通过与单声道信号M进行相加而计算误差信号,并将该误差信号输出到听觉加权单元115。该误差信号相当于编码失真。
听觉加权单元115使用基于从LPC分析单元111输出的LPC参数而构成的听觉加权滤波器,对从加法器114输出的编码失真进行听觉加权处理,并将该信号输出到失真最小化单元116。
失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121指示各种参数,以使从听觉加权单元115输出的编码失真成为最小。具体而言,失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121指示使用的索引(CA、CD、CG)。
自适应音源代码本117将过去生成的、去往LPC合成滤波器113的驱动音源的音源矢量存储于内部缓冲器,基于对应于由失真最小化单元116指示的索引的自适应音源延迟,从该被存储的音源矢量中取出相当于一个子帧的矢量,并作为自适应音源矢量输出到乘法器118。
固定音源代码本119将对应于由失真最小化单元116指示的索引的音源矢量作为固定音源矢量输出到乘法器120。
增益代码本121生成对应于由失真最小化单元116指示的索引的增益,具体而言,生成对应于来自自适应音源代码本117的自适应音源矢量以及来自固定音源代码本119的固定音源矢量的各个增益,并分别输出到乘法器118和乘法器120。
乘法器118将从增益代码本121输出的自适应音源增益乘于从自适应音源代码本117输出的自适应音源矢量,并输出到加法器122。
乘法器120将从增益代码本121输出的固定音源增益乘于从固定音源代码本119输出的固定音源矢量,并输出到加法器122。
加法器122将从乘法器118输出的自适应音源矢量和从乘法器120输出的固定音源矢量相加,并将相加后的音源矢量作为驱动音源输出到LPC合成滤波器113。另外,加法器122将得到的驱动音源的音源矢量反馈给自适应音源代码本117。
LPC合成滤波器113如上所述,从加法器122输出的音源矢量,也就是通过自适应音源代码本117以及固定音源代码本119生成的音源矢量,作为驱动音源,通过LPC合成滤波器进行合成。
像这样,利用由自适应音11源代码本117以及固定音源代码本119生成的音源矢量求取编码失真的一系列处理为闭环(反馈环),并且失真最小化单元116对自适应音源代码本117、固定音源代码本119以及增益代码本121进行指示以使该编码失真成为最小。继而,失真最小化单元116将使编码失真成为最小的各种CELP编码参数(CA、CD、CG)输出到CELP编码单元103的外部。
图4是表示第一声道差分信息编码单元104内部的主要结构的方框图。
该第一声道差分信息编码单元104对第一声道信号CH1的音源分量的参数和单声道信号M的频谱包络分量的参数之间的差分进行编码处理。这里,音源分量的参数为,自适应音源代码本索引、自适应音源增益、固定音源代码本索引以及固定音源增益,另外,频谱包络分量的参数为进行LPC分析而得到的LPC参数。
另外,在第一声道差分信息编码单元104中,LPC分析单元131、LPC合成滤波器133、加法器134、听觉加权单元135、失真最小化单元136、乘法器138、乘法器140以及加法器142与上述的CELP编码单元103中的,LPC分析单元111、LPC合成滤波器113、加法器114、听觉加权单元115、失真最小化单元116、乘法器118、乘法器120以及加法器122分别具有相同的结构,因此省略其说明,以下详细地说明与CELP编码单元103不同的结构。
差分量化单元132求取通过LPC分析单元131得到的第一声道信号CH1的LPC参数ω1(i)与在CELP编码单元103已经求出的单声道信号M的LPC参数(CL)之间的差分,通过对该差分进行量化,作为第一声道差分信息的频谱包络分量的编码参数Δω1(i),输出到第一声道差分信息编码单元104的外部。另外,差分量化单元132将第一声道信号的LPC参数的量化参数ω1(i)输出到LPC合成滤波器133。
增益代码本143基于从CELP编码单元103输出的用于单声道信号的增益代码本索引,生成与其对应的自适应音源增益以及固定音源增益,分别输出到乘法器138、140。
自适应音源代码本137将在以前的子帧中生成出的驱动音源存储于内部缓冲器。当为有声语音时,自适应音源代码本137的缓冲器的以前的驱动音源与当前帧的音调波形的驱动音源波形具有很强的相关,因此自适应音源代码本137提取(extract)相当于该音调周期的以前的驱动音源,并将以其为周期而重复的信号作为驱动音源的第一近似。继而,自适应音源代码本137对该音调周期,也就是自适应音源延迟进行编码。特别是,自适应音源代码本137对CH1的音调周期,作为与经CELP编码单元103进行编码处理过的单声道信号M的音调周期的差分进行编码。这是因为,单声道信号M为由第一声道信号CH1与第2声道信号CH2生成的信号,因此可以认为自然与第一声道信号CH1高度类似。也就是,这是因为可以认为,对于第一声道信号CH1,与其重新进行自适应音源代码本搜索,不如以对单声道信号M得到的音调周期为基准,作为与该音调周期的差分来表现第一声道信号CH1的音调周期时的编码效率高。具体而言,利用对于单声道信号已经计算出来的音调周期TM和从该值计算出的差分参数的ΔT1,将CH1的音调周期T1用下面的等式(6)表示,将用于通过对CH1进行自适应音源代码本搜索得到最佳的T1时的差分参数ΔT1编码。
T1=TM+ΔT1等式(6)固定音源代码本139对于当前帧的音源分量中不能由自适应音源代码本137基于以前的音源所生成的音源信号近似的残余差分分量,生成表现该分量的音源信号。该残余差分分量与由自适应音源代码本137生成的分量相比较,相对来讲对合成信号的贡献较小。另外,就像上述说明一样,单声道信号M和第一声道信号CH1的类似性较高。因此,固定音源代码本139使用固定音源代码本119所使用的用于单声道信号M的固定音源代码本索引作为CH1的固定音源代码本索引。这相当于,使CH1的固定音源矢量成为与单声道信号的固定音源矢量相同的信号。
增益代码本141将用于CH1的自适应音源矢量的增益通过以下两个参数来确定,即用于单声道信号的自适应音源增益和用于乘以该自适应音源增益的系数。另外,对于用于CH1的固定音源矢量的增益,增益代码本141同样地通过以下两个参数来确定,即通过用于单声道信号的固定音源增益和用于乘以该固定音源增益的系数。而且,这两个系数作为共有的增益乘数γ1被确定,并输出到乘法器144。γ1的确定方法为,从预先准备的用于CH1的增益代码本中选择最佳的增益索引,使CH1的合成信号和CH1的源信号的误差成为最小。
乘法器144对从加法器142输出的驱动音源ex1’乘以γ1得到ex1,并输出到LPC合成滤波器133。
像这样,根据本实施例,由构成立体声信号的第一声道信号CH1和第二声道信号CH2生成单声道信号,进行单声道信号的CELP编码处理,同时在对CH1进行编码处理时,将作为与单声道信号的CELP参数的差分进行编码处理。因此,能够实现比特速率低且质量高的立体声信号的编码处理。
另外,在以上的结构中,ΔCH1的编码方法为利用单声道信号的CELP编码参数和对其的差分参数,确定CELP编码的差分参数,以使由这些生成的CH1的合成信号和CH1的源信号之间的误差成为最小。
另外,在以上的结构中,第二层的编码对象不为单声道信号和第一声道信号在波形上的差分,而为在CELP编码参数的阶段求取出来的差分。该理由为,CELP编码原本为通过对人的声带/声道建模来进行编码处理的技术,可以认为在波形上求取差分的话,得到的差分信息与CELP编码的模型实际上并不对应。因此,可以认为以波形上的差分为对象进行CELP编码不能高效地进行编码处理,本发明在CELP编码参数的阶段求取差分。
另外,在以上的结构,对于单声道信号的CH2的差分ΔCH2,设通过上述的近似式等式(4)来求取,而不进行编码处理。而且,接收由本实施例的可扩展性编码装置生成出来的编码参数的解码装置能够利用接收的ΔCH1的编码参数,通过上述等式(5)的计算得到解码信号。
另外,本实施例说明了以下的例子,即固定音源代码本139使用与固定音源代码本119相同的索引的情形,也就是固定音源代码本139生成与用于单声道的固定音源矢量相同的固定音源矢量的情形。但是,本发明并不只限于此,比如为了求取与单声道信号的固定音源矢量相加的附加性固定音源矢量,对固定音源代码本139进行固定音源代码本搜索,求取用于附加于CH1的固定音源代码本索引也是可以的。此时,虽然增加了编码比特速率,但是能够实现更高音质的CH1的编码。
另外,本实施例说明了以下的例子,即如从增益代码本141输出的γ1那样,共用与自适应音源增益相乘的系数和与固定音源增益相乘的系数的情形。但是,不共用这两个系数也是可以的。也就是,设与自适应音源增益相乘的系数为γ1,设与固定音源增益相乘的系数为γ2,并分别进行编码也是可以的。在以上的情形,γ1的确定方法与共用增益的情形相同,从预先准备的用于CH1的增益代码本中选择最佳的增益索引,使CH1的合成信号和CH1的源信号的误差成为最小。此时,γ2的确定方法与γ1的确定方法相同,即从预先准备的用于CH2的增益代码本中选择最佳的增益索引,使CH2的合成信号和CH2的源信号的误差成为最小。
(实施例2)在实施例1中,表示了假设第一声道的编码失真与第二声道的编码失真近似为相等,通过第一层以及第二层的两层进行编码处理的可扩展性编码装置的结构。在本实施例中表示以下的结构,即为了更加精确地对CH2进行编码处理而追加了第三层,在该第三层,对第一声道以及第二声道的编码失真的差进行编码处理,更加具体的为下述步骤,即对包含于第一声道差分信息的编码失真和包含于第二声道差分信息的编码失真之间的差分进一步进行编码处理,并将其作为新的编码信息而输出。
具体而言,定义以下的ΔCH2’,以减少包含于ΔCH1的量化误差(编码失真)并进行编码处理。更加具体的为下述处理,对CH2的预测信号CH2’与CH2的差分信号ΔCH2’(=CH2-M+ΔCH1)进行编码处理,所述预测信号CH2’是根据经第一层编码处理的单声道信号以及经第二层编码处理的ΔCH1估计出的CH2的预测信号CH2’(=M-ΔCH1)。
这里,ΔCH2’的编码方法为确定校正参数,所述校正参数是使利用该参数和CH2的CELP编码参数生成出的CH2的合成信号与CH2的源信号之间的误差成为最小的校正参数,所述CH2的合成信号是利用通过单声道信号的CELP编码参数以及经第二层编码处理的差分CELP编码参数的两者的参数而估计出的CH2的CELP编码参数,以及对其进行校正的参数(即所述校正参数)而生成出的合成信号。与第二层相同,不对在波形上的差分本身进行CELP编码处理的理由与实施例1相同。
由此,使单声道信号与立体声信号具有可扩展性、精确度良好且高效的立体声编码成为可能。使用单声道的参数以及对于CH1的单声道的差分参数,估计CH2的CELP编码参数,并对与其对应的误差分量进行编码,通过这样的结构能够进行更有效率的编码处理。
图5是表示本发明实施例2的可扩展性编码装置200的主要结构的方框图。该可扩展性编码装置200具有与实施例1所示的可扩展性编码装置100相同的基本结构。对于相同的构成元素赋予相同的标号,并省略其说明。追加的结构为构成第三层的第二声道差分信息编码单元201。
图6是表示第二声道差分信息编码单元201内部的主要结构的方框图。
另外,在该第二声道差分信息编码单元201中,LPC分析单元211、差分量化单元212、LPC合成滤波器213、加法器214、听觉加权单元215、失真最小化单元216、自适应音源代码本217、乘法器218、固定音源代码本219、乘法器220、增益代码本221、加法器222、增益代码本223以及乘法器224与上述的第一声道差分信息编码单元的,LPC分析单元131、差分量化单元132、LPC合成滤波器133、加法器134、听觉加权单元135、失真最小化单元136、自适应音源代码本137、乘法器138、固定音源代码本139、乘法器140、增益代码本141、加法器142、增益代码本143以及乘法器144分别具有相同的结构,因此省略其说明。
第二声道延迟参数估计单元225使用单声道信号的音调周期TM和作为CH1的CELP编码参数的ΔT1,预测CH2的音调周期(自适应音源延迟),并将预测值T2’输出到自适应音源代码本217。这里,CH1的CELP编码参数ΔT1可以作为对于单声道信号的音调周期TM和CH1的音调周期T1的差分而求出。
第二声道LPC参数估计单元226使用单声道信号的LPC参数ωM(i)和CH1的LPC参数ω1(i)预测CH2的LPC参数,并将预测值ω2’(i)输出到差分量化单元212。
第二声道音源增益估计单元227利用单声道信号的驱动音源可以根据CH1以及CH2的驱动音源通过上述等式(1)求取的事实,根据CH1的增益乘数γ1通过逆向运算预测CH2的增益乘数,并将预测值γ2’输出到乘法器228。该预测值γ2’乘以从增益代码本221输出的第二声道音源增益Δγ2。
通过失真最小化单元216控制的闭环的编码处理,也就是第二声道信号CH2的音调周期(自适应音源迟延)T2的编码处理方法为,利用经编码处理的单声道信号的音调周期TM、和该TM与CH1的音调周期T1的差分的ΔT1,预测CH2的音调周期T2(预测值T2’),并对从T2到该预测出的音调周期的T2’为止的差分(误差分量)ΔT2进行编码处理而实现。首先,假设以下的等式(7)。
TM≌(Y1+T2)/2等式(7)另外,因为存在以下的等式(8)的关系,由上述等式(7),T2的预测值T2’表示为到等式(9)。
T1=TM+ΔT1等式(8)T2′=2TM-T1等式(9)将该等式(8)代入等式(9)成为以下的等式(10)。
T2′=TM-ΔT1等式(10)因此,将CH2的音调周期T2用其预测值T2’和其对应的校正值ΔT2,通过以下的等式(11)来表示。
T2=T2′+ΔAT2等式(11)将等式(10)代入等式(11)成为以下的等式(12)。
T2=(TM-ΔT1)+ΔT2等式(12)本实施例的可扩展性编码装置对校正参数ΔT2进行编码处理,所述校正参数ΔT2是对CH2进行自适应音源代码本的搜索而得到最佳的T2时的校正参数ΔT2。这里,因为ΔT2为对于预测值的差分分量,所以与ΔT1相比微不足道,从而能够更加有效地进行编码处理,所述预测值是利用单声道的参数TM以及CH1中的对于单声道的差分参数ΔT1而估计出的预测值。
固定音源代码本219与第一声道差分信息编码单元104的固定音源代码本139类似,在当前帧的音源分量中,生成对由自适应音源代码本217生成的音源信号不能近似的残余差分分量的音源信号。另外,固定音源代码本219还是与固定音源代码本139类似地,作为CH2的固定音源代码本索引,使用单声道信号M的固定音源代码本索引。也就是,使CH2的固定音源矢量成为与单声道信号的固定音源矢量相同的信号。
另外,与实施例1相同,为了求取与单声道信号的固定音源矢量相加的附加性固定音源矢量,对固定音源代码本219进行固定音源代码本搜索,并可求取用于附加于CH2的固定音源代码本索引也是可以的。此时,虽然增加了编码比特速率,但是能够实现更高品质的CH2的编码。
增益代码本221作为增益乘数γ2确定用于CH2的音源矢量的增益,该增益乘数γ2为共用乘于用于单声道信号的自适应音源增益以及固定音源矢量的增益的两者的增益乘数。具体而言,因为在CELP编码单元103中用于单声道信号的增益、在第一声道差分信息编码单元104中用于CH1的增益乘数γ1已经求出,所以增益代码本221,求取通过这些预测出的预测估计值γ2’,并通过决定对于该预测估计值γ2’的校正值Δγ2来确定CH2的乘数γ2。在增益代码本中所准备的模式中,选择使CH2的合成信号和CH2的输入信号之间的波形失真成为最小的图案来决定校正值Δγ2。
更为具体的是,增益代码本221首先根据CH1的增益乘数γ1估计对于CH2的增益乘数γ2。设单声道信号的驱动音源为exM(n),CH1的驱动音源为ex1(n)并且CH2的驱动音源为ex2(n),则成为以下的等式(13)。
exM(n)=12(ex1(n)+ex2(n))]]>等式(13)这里,设γ2的预测值为γ2’,利用以下的等式(14)、等式(15),上述等式(13)成为等式(16)。
ex1(n)=γ1·ex1′(n) 等式(14)ex2(n)=γ2′·ex2′(n)等式(15)exM(n)=12(γ1·ex1′(n)+γ2′·ex2′(n))]]>等式(16)这里,假设ex1’(n)与ex2’(n)之间的相关较高,则满足等式(17)及等式(18)的关系。
Σnex1′(n)·ex2′(n)≅ΣnexM(n)2]]>等式(17)Σnex1′(n)2≅Σnex2′(n)2≅ΣnexM(n)2]]>等式(18)另外,取等式(16)的两边的平方并求和,可以得到以下的等式(19)。
ΣnexM(n)2=14(γ12Σnex1′(n)2+γ2′2Σnex2′(n)2+2γ1·γ2′Σnex1′(n)·ex2′(n))]]>等式(19)因此,将等式(17)以及等式(18)代入等式(19)成为以下的等式(20)。
ΣnexM(n)2=14ΣnexM(n)2(γ12+γ2′2+2γ1·γ2′)]]>等式(20)通过求解等式(20)的方程式可以得到以下的等式(21)的关系。
γ2′=2-γ1,-2-γ1...等式(21)这里,通过预测值γ2’和其对应的校正系数Δγ2之间的积表示γ2,则成为以下的等式(22)。
γ2=γ2′Δγ2(其中,γ2′=2-γ1)...等式(22)继而,对得到对于CH2的最佳的γ2时的校正系数Δγ2通过增益代码本搜索进行编码处理。这里,因为Δγ2为对于预测值的校正分量,所以与γ1相比微不足道,从而能够更加有效地进行编码处理,所述预测值为利用单声道的增益以及CH1中的对于单声道的增益乘数γ1而估计出的预测值。
进行CH2信号的LPC分析而求出LPC参数,利用已经求出的单声道信号的LPC参数以及对于单声道信号的LPC参数的CH1的LPC参数的差分分量,估计CH2的LPC参数,通过量化该估计参数的校正分量(误差分量),由此得到CH2的频谱包络分量参数。
根据单声道信号的LSP参数ωM(i)、以及第一声道信号的LSP参数ω1(i)与单声道信号的LSP参数ωM(i)之间的差分Δω1(i)的两者求取CH2的LSP参数ω2(i)(其中,i=0,1,...,p-1)。
首先,假设以下的等式(23)。
ωM(i)≅12(ω1(i)+ω2(i))]]>等式(23)另外,CH1的LSP参数ω1(i)通过以下的等式(24)表示。
ω1(i)=ωM(i)+Δω1(i)等式(24)因此,ω2(i)的预测值ω2’(i)由根据等式(23)以及等式(24)成为的等式(25)表示。
ω2′(i)=ωM(i)-Δω1(i) 等式(25)将CH2的LSP的ω2(i),利用ω2(i)的预测值ω2’(i)以及其对应的校正分量Δω2(i)通过以下的等式(26)表示。
ω2(i)=ω2′(i)+Δω2(i)等式(26)将等式(25)代入等式(26)可以得到以下的等式(27)。
ω2(i)=ωM(i)-Δω1(i)+Δω2(i)等式(27)本实施例的可扩展性编码装置对Δω2(i)进行编码处理,该Δω2(i)是对ω2(i)使量化误差成为最小的校正值。这里,因为Δω2(i)为对于预测值的误差分量,所以与Δω1(i)相比微不足道,从而能够更加有效地进行编码处理,所述预测值为利用单声道的LSP参数以及CH1中的对于单声道的差分参数Δω1(i)而估计出的预测值。
如上所述,根据本实施例,在ΔCH2’的编码中确定校正参数,所述校正参数是使利用该参数和CH2的CELP编码参数生成出的CH2的合成信号与CH2的原信号之间的误差成为最小的校正参数,所述CH2的合成信号为利用通过单声道信号的CELP编码参数以及经第二层编码处理的差分CELP编码参数的两者的参数而估计出的CH2的CELP编码参数,以及对其进行校正的参数(即所述校正参数)而生成出的合成信号。因此,能够更加精确地对CH2进行编码以及解码处理。
以上说明了本发明的实施例1和2。
另外,在上述各个实施例中,虽然将单声道信号M设为CH1与CH2的平均信号,但是并不一定只限于此。
另外,自适应音源代码本有时也称为自适应代码本。另外,固定音源代码本也有可能被称为固定代码本、噪声代码本、概率代码本(stochasticcodebook)、或者随机代码本(random codebook)。
本发明的可扩展性编码装置,不被所示各实施例所限定,可以对本发明加以各种变更来实施。
本发明的可扩展性编码装置,还能够配置于移动通信系统的通信终端装置以及基站装置,并且能够提供由此具有同样作用效果的通信终端装置以及基站装置。
另外,虽然在此以通过硬件来构成本发明为例进行了说明,但是本发明还可以通过软件来实现。
另外,用于说明上述的各个实施例的各个功能模块,典型的由集成电路LSI(大规模集成电路)来实现。它们既可以分别实行单芯片化,也可以其中一部分或者是全部地包含在单个芯片中。
另外,在此虽然称做LSI,但根据集成度的不同也可以称为IC、系统LSI、超LSI、极大LSI等。
另外,集成电路化的技术不只限于LSI,也可以使用专用电路或通用处理器来实现。也可以利用LSI制造后能够编程的FPGA(Field ProgrammableGate Array,现场可编程门阵列),或可以利用对LSI内部的电路块的连接或设定为进行重新配置的可重配置处理器(Reconfigurable Processor)。
再有,如果随着半导体技术的进步或者其他技术的派生,出现了替换LSI集成电路的技术,当然也可以利用该技术来实现功能块的集成化。也有应用生物技术等的可能性。
本说明书是根据2004年9月28日提交的日本专利申请特愿第2004-282525号。该内容通过引用全部包括在此。
工业实用性本发明的可扩展性编码装置以及可扩展性编码方法能够适用于在移动通信系统中对立体声信号进行可扩展性编码处理的通信终端装置、基站装置等的用途。
权利要求
1.一种可扩展性编码装置,包括生成单元,由立体声语音信号生成单声道语音信号;第一编码单元,对所述单声道语音信号通过CELP方式进行编码处理,得到所述单声道语音信号的编码参数;以及第二编码单元,将所述立体声语音信号的R声道或者L声道的任意一个作为编码对象声道,对所述编码对象声道进行线性预测分析以及自适应音源代码本搜索而取得参数,求取该参数与所述单声道语音信号的编码参数的差分,并由该差分取得所述编码对象声道的编码参数。
2.如权利要求1所述的可扩展性编码装置,其中,所述生成单元,求取所述R声道以及所述L声道的平均来作为所述单声道语音信号。
3.如权利要求1所述的可扩展性编码装置,其中,所述第二编码单元,使用所述单声道语音信号的所述编码参数的固定音源代码本索引,作为所述编码对象声道的固定音源代码本索引。
4.如权利要求1所述的可扩展性编码装置,其中,对所述R声道以及L声道中的、所述第二编码单元的编码对象声道以外的声道不进行编码处理。
5.如权利要求1所述的可扩展性编码装置,还包括第三编码单元,将所述R声道以及L声道中的、所述第二编码单元的编码对象声道以外的声道作为编码对象,利用通过所述第一以及第二编码单元得到的编码参数来生成合成信号,并进行编码处理以使该合成信号的编码失真成为最小。
6.一种包括权利要求1所述的可扩展性编码装置的通信终端装置。
7.一种包括权利要求1所述的可扩展性编码装置的基站装置。
8.一种可扩展性编码方法,包括生成步骤,由立体声语音信号生成单声道语音信号;第一编码步骤,对所述单声道语音信号通过CELP方式进行编码处理,得到所述单声道语音信号的编码参数;以及第二编码步骤,将所述单声道语音信号的R声道或者L声道的任意一个作为编码对象声道,对所述编码对象声道进行线性预测分析以及自适应音源代码本搜索而取得参数,求取该参数与所述单声道语音信号的编码参数的差分,并由该差分取得所述编码对象声道的编码参数。
全文摘要
本发明公开一种可扩展性编码装置,能够对立体声语音信号实现通过CELP编码处理的可扩展性编码,从而提高编码效率。在该装置中,加法器(101)以及乘法器(102)求取第一声道信号CH1以及第二声道信号CH2的平均作为单声道信号M。CELP编码单元(103)对单声道信号M进行CELP编码处理。第一声道差分信息编码单元(104)对第一声道信号CH1进行基于CELP编码的编码处理,并求取在该过程得到的编码参数与从CELP编码单元(103)输出的编码参数的差分。继而,第一声道差分信息编码单元(104)对该差分进行编码处理,并输出所得到的编码参数。
文档编号G10L19/00GK101027718SQ20058003262
公开日2007年8月29日 申请日期2005年9月26日 优先权日2004年9月28日
发明者后藤道代, 吉田幸司 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1