频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法

文档序号:2819073阅读:151来源:国知局
专利名称:频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法
技术领域
本发明涉及扩展音频信号或者声音信号的频带来提高音质的方法,以及适用该方法的音频信号或者声音信号等的编码方法及解码方法。
背景技术
用低位速度压缩声音信号或者音频信号的声音编码技术和音频编码技术,在移动通信中的电波等的传输线路容量及记录媒体的有效利用上是很重要的。
将声音信号编码的声音编码中,存在由ITU-T(InternationalTelecommunication Union Telecommunication Standardization Sector,国际电信联盟电信标准化组)标准化的G726、G729等方式。这些方式中,以窄带信号(300Hz~3.4kHz)为对象,可以用8kbit/s~32kbit/s高质量地进行编码。但是,由于像这样的窄带信号的频带过窄,最大仅为3.4Hz,其质量受到限制从而导致临场感较差。
另外,在声音编码的领域中,存在把宽带信号(50Hz~7kHz)作为编码对象的方式。作为其代表性的方法,有ITU-T的G722·G722.1和3GPP(The 3rd Generation Partnership Project,第三代合作项目)的AMR-WB等。这些方式,可以用位速度6.6kbit/s~64kbit/s进行宽带声音信号的编码。编码对象的信号为声音时,虽然宽带信号质量比较高,但是以音频信号为对象时,或者即使是声音信号,要求更高临场感的质量时,也不是十分有把握。
一般地,信号的最大频率达到10~15kHz程度时,就可以得到相当于FM收音机的临场感,如果达到20kHz程度,便可得到与CD相当的质量。对于这样的信号,适合由MPEG(Moving Picture ExpertGroup,运动图像专家组)标准化的3层方式和AAC方式等所代表的音频编码。但是,在进行这些音频编码方式时,由于编码对象的频带变宽,所以位速度也变大。
在2001-521648号公报中,记载了作为用低位速度高质量地将宽频带信号编码的方法,通过把输入信号划分成低频带部和高频带部,高频带部置换代替低频带部的频谱,来降低全体位速度的技术。关于将这些以往技术适用于原信号时的处理状态,用图1A~D来说明。在这里为了便于说明,将以往技术适用于原信号的情况进行阐述。在图1A~D中,横轴表示频率,纵轴表示对数功率频谱。另外,图1A表示频带被限制在0≤K<FH的原信号的对数功率频谱,图1B表示把同信号限制在0≤K<FL时的对数功率频谱(FL<FH),图1C表示根据以往技术,使用低频带频谱来置换高频带频谱时的图,图1D表示使置换后的频谱按照频谱轮廓形状信息来调整置换频谱的形状时的图。
如果按照以往技术,为了根据频谱达到0≤K<FL的信号(图1B)来表示原信号的频谱(图1A),高频带(该图是FL≤K<FH)的频谱用低频带(0≤K<FL)的频谱置换(图1C)。另外,为了简便起见,在这里对假设FL=FH/2的关系时的情形进行了说明。接着,根据原信号的频谱包络信息,调整高频带的已置换的频谱的振幅值,求出估计原信号频谱的频谱(图1D)。

发明内容
众所周知,一般声音信号或音频信号的频谱,如图2A所示,具有在某频率的整数倍出现频谱的尖峰的谐波结构。谐波结构在保持质量上是重要的信息,如果谐波结构发生偏移,便知道质量劣化了。图2A表示频谱分析某音频信号时的频谱。如该图所示,能看到原信号中间隔T的谐波结构。在这里把根据以往技术估计原信号的频谱的图,用图2B表示。比较这2个图,从图2B中可知,置换方的低频带频谱(区域A1)和被置换方的高频带频谱(区域A2)中,虽然保持谐波结构,但是置换方的低频带频谱与被置换方的高频带频谱的连接部(区域A3),其谐波结构已崩溃。它的起因是以往技术不考虑谐波结构的形状而进行置换的缘故。把估计频谱变换成时间信号试听时,由于这样的谐波结构的混乱,主观上就降低了质量。
另外,当FL比FH/2小的时候,也就是说,在FL≤k<FH的频带必须置换2次或更多次低频带频谱时,调整频谱轮廓形状,会产生另外问题。用图3A及图3B来说明该问题。声音信号或音频信号,在一般频谱不平直的低频带能量或者高频带能量中,总有一个比较大。如此,在声音信号或音频信号中处于频谱发生倾斜的状态,高频带一方的能量比低频带的能量小的情况比较多。在这种状况下,进行频谱置换时,便产生频谱能量的不连续(图3A)。如图3A所示,仅仅在每一个预定的一定周期(子带)内进行频谱轮廓形状的调整,不能消除能量的不连续(图3B的区域A4及区域A5),这种现象是使解码信号发生异音等主观质量下降的原因。
本发明考虑到上述问题,提出了用低位速度高质量地将宽频带信号编码的技术的方案。在本发明中使用作为内部状态具有低频带频谱的滤波器,来估计高频带的频谱形状,在将表示这时滤波器特性的系数编码的频谱编码方法中,用适当子带对估计后的高频带的频谱实施频谱轮廓形状的调整。由此,可以改善解码信号的质量。


图1A是表示以往的位速度压缩技术的图。
图1B是表示以往的位速度压缩技术的图。
图1C是表示以往的位速度压缩技术的图。
图1D是表示以往的位速度压缩技术的图。
图2A是表示声音信号或音频信号的频谱中的谐波结构的图。
图2B是表示声音信号或音频信号的频谱中的谐波结构的图。
图3A是表示频谱轮廓形状调整时,产生的能量的不连续的图。
图3B是表示频谱轮廓形状调整时,产生的能量的不连续的图。
图4是表示实施方式1涉及的频谱编码装置结构的方块图。
图5是表示通过滤波计算出第2频谱估计值的过程图。
图6是表示滤波单元、搜索单元和节距因数设定单元的处理流程图。
图7A是表示滤波状态的例图。
图7B是表示滤波状态的例图。
图7C是表示滤波状态的例图。
图7D是表示滤波状态的例图。
图7E是表示滤波状态的例图。
图8A是表示存储于内部状态的第1频谱的谐波结构的另一例图。
图8B是表示存储于内部状态的第1频谱的谐波结构的另一例图。
图8C是表示存储于内部状态的第1频谱的谐波结构的另一例图。
图8D是表示存储于内部状态的第1频谱的谐波结构的另一例图。
图8E是表示存储于内部状态的第1频谱的谐波结构的另一例图。
图9是表示实施方式2涉及的频谱编码装置的结构的方块图。
图10是表示实施方式2涉及的滤波状态图。
图11是表示实施方式3涉及的频谱编码装置的结构的方块图。
图12是表示实施方式3的处理状态的图。
图13是表示实施方式4涉及的频谱编码装置结构的方块图。
图14是表示实施方式5涉及的频谱编码装置结构的方块图。
图15是表示实施方式6涉及的频谱编码装置结构的方块图。
图16是表示实施方式7涉及的频谱编码装置结构的方块图。
图17是表示实施方式8涉及的分层编码装置结构的方块图。
图18是表示实施方式8涉及的分层编码装置结构的方块图。
图19是表示实施方式9涉及的频谱解码装置结构的方块图。
图20是表示实施方式9涉及的滤波单元生成的解码频谱的状态图。
图21是表示实施方式10涉及的频谱解码装置结构的方块图。
图22是实施方式10的流程图。
图23是表示实施方式11涉及的频谱解码装置结构的方块图。
图24是表示实施方式12涉及的频谱解码装置结构的方块图。
图25是表示实施方式13涉及的分层解码装置结构的方块图。
图26是表示实施方式13涉及的分层解码装置结构的方块图。
图27是表示实施方式14涉及的音响信号编码装置结构的方块图。
图28是表示实施方式15涉及的音响信号解码装置结构的方块图。
图29是表示实施方式16涉及的音响信号发送编码装置结构的方块图。
图30是表示实施方式17涉及的音响信号接收解码装置结构的方块图。
具体实施例方式
以下参考附图详细说明本发明的实施方式。
(实施方式1)图4是表示本发明的实施方式1涉及的频谱编码装置100的结构的方块图。
从输入端子102输入有效频带为0≤k<FL的第1信号,从输入端子103输入有效频带为0≤k<FH的第2信号。接着,在频域变换单元104中对从输入端子102输入的第1信号进行频率变换,计算出第1频谱S1(K);在频域变换单元105中对从输入端子103输入的第2信号进行频率变换,计算出第2频谱S2(k)。在这里,作为频率变换法,可以适用离散傅里叶变换(DFT),离散余弦变换(DCT),以及变形离散余弦变换(MDCT)等。
接着,内部状态设定单元106使用第1频谱S1(k)设定在滤波单元107使用的滤波器的内部状态。在滤波单元107中则根据内部状态设定单元106设定的滤波器的内部状态,和节距因数设定单元109给予的节距因数T进行滤波,计算出第2频谱的估计值D2(k)。用图5说明通过滤波计算第2频谱的估计值D2(k)的过程。图5中把0≤k<FH的频谱简称为S(k)。如图5所示,S(k)中的0≤K<FL的区域,作为滤波器的内部状态存储第1频谱S1(k),FL≤k<FH区域生成第2频谱的估计值D2(k)。
在本实施方式中,就使用由下式(1)表示的滤波器的状态进行说明,在这里,T表示由系数设定单元109给予的系数。另外,本说明假设M=1。
P(z)=11-Σi=-MMβiz-T+i---(1)]]>滤波处理从频率低的一方开始依次乘以对应于只以频率T低的频谱为中心的系数βi后,通过加法运算计算出估计值。
S(k)=Σi=-11βi·S(k-T-i)---(2)]]>根据式(2)的处理,在FL≤k<FH之间进行。该结果计算出的S(k)(FL≤k<FH)作为第2频谱的估计值D2(k)来利用。
在搜索单元108中,计算出由频域变换单元105给予的第2频谱S2(k)、和由滤波单元107给予的第2频谱的估计值D2(k)的类似度。类似度存在各种各样的定义,但是在本实施方式中,就使用首先把滤波系数β-1及β1看作0,并按照根据最小平方误差定义的下式(3)计算出的类似度的情形进行说明。在该方法中,计算出最优节距因数T后,决定滤波系数βi。
E=Σk=FLFH-1S2(k)2-(Σk=FLFH-1S2(k)·D2(k))2Σk=FLFH-1D2(k)2---(3)]]>在这里,E表示S2(k)与D2(k)之间的平方误差。式(3)的右边第1项为与节距因数T无关的固定值,所以搜索生成把式(3)的右边第2项设定为最大的D2(k)的节距因数T。本实施方式中,把式(3)的右边第2项叫做类似度。
节距因数设定单元109,具有把包括在预先规定的搜索范围TMIN~TMAX里的节距因数T,依次输出到滤波单元107的功能。因此,每当由节距因数设定单元109给予节距因数T时,在滤波单元107把FL≤k<FH范围的S(k)清零后,再进行滤波,由搜索单元108计算出类似度。在搜索单元108中,从TMIN~TMAX之间决定计算出的类似度中为最大值时的节距因数Tmax,把该节距因数Tmax给予滤波系数计算单元110、第2频谱估计值生成单元115、频谱轮廓形状调整子带决定单元112、及复用单元111。图6表示滤波单元107和搜索单元108和节距因数设定单元109的处理流程。
为了便于理解本实施方式,图7A~E表示滤波状态的表示例。图7A表示存储在内部状态的第1频谱的谐波结构,图7B~D表示使用3种节距因数T0,T1,T2进行滤波而计算出的第2频谱的估计值的谐波结构的关系。根据该例,作为保持谐波结构的节距因数T,选择了形状接近第2频谱S2(k)的T1(参照图7C及图7E)。
另外,图8A~E表示存储于内部状态的第1频谱的谐波结构的另一举例。即使在该举例中,计算出保持谐波结构的估计频谱时的节距因数也是节距因数T1,从搜索单元108输出的为T1(参照图8C及图8E)。
接着,在滤波系数计算单元110中使用由搜索单元108给予的节距因数Tmax,来求滤波系数βi。求取滤波系数βi,以便使按照下式(4)的平方变形E为最小。
E=Σk=FLFH-1(S2(k)-Σi=-11βiS(k-Tmax-i))2---(4)]]>在滤波系数计算单元110中作为图表预先具有多个βi(i=-1,0,1)组合,决定使式(4)的平方变形E为最小的βi(i=-1,0,1)的组合,并把该符号给予第2频谱估计值生成单元115和复用单元111。
第2频谱估计值生成单元115使用节距因数Tmax和滤波系数βi,按照式(1)生成第2频谱的估计值D2(k),给予频谱轮廓形状调整系数编码单元113。
节距因数Tmax还被提供给频谱轮廓形状调整子带决定单元112。在频谱轮廓形状调整子带决定单元112中,根据节距因数Tmax来决定用于频谱轮廓形状调整的子带。第j个子带使用节距因数Tmax,可以表示为如下式(5)。
BL(j)=FL+(j-1)·Tmax(0≤j<J)BH(j)=FL+j·Tmax]]>
...(5)在这里,BL(j)表示第j子带的最小频率,BH(j)表示第j子带的最大频率。另外,子带数J表示为第J-1子带的最大频率BH(J-1)超过FH的最小整数。把这样决定的频谱轮廓形状调整子带的信息,给予频谱轮廓形状系数编码单元113。
在频谱轮廓形状调整系数编码单元113中,使用由频谱轮廓形状调整子带决定单元112给予的频谱轮廓形状调整子带信息,和由第2频谱估计值生成单元115给予的第2频谱估计值D2(k)和由频域变换单元105给予的第2频谱S2(k),计算出轮廓形状调整系数,并进行编码。在本实施方式中,对用每个子带的频谱功率表示该频谱轮廓形状信息的情况进行说明。这时,第j子带的频谱功率用下式(6)表示。
B(j)=Σk=BL(j)BH(j)S2(k)2---(6)]]>在这里,BL(j)表示第j子带的最小频率,BH(j)表示第j子带的最大频率。把像这样求出来的第2频谱的子带信息,看作是第2频谱的频谱轮廓形状信息。同样地,按照下式(7)计算出第2频谱估计值D2(k)的子带信息b(j)。
b(j)=Σk=BL(j)BH(j)D2(k)2---(7)]]>按照下式(8)计算出每个子带的变动量V(j)。
V(j)=B(j)b(j)---(8)]]>接着,将变动量V(j)编码,并把该符号传送到复用单元111。为了计算出更详细的频谱轮廓形状信息,也可以适用如下述的方法。把频谱轮廓形状调整子带进一步划分成带幅小的子带,计算出各个子带的频谱轮廓形状系数。例如,把第j子带划分成划分数N时,V(j,n)=B(j,n)b(j,n)---(0≤j<J,0≤n<N)---(9)]]>使用式(9)在各子带计算出N次的频谱调整系数的向量,把该向量进行向量量化后,把变形最小的代表向量的指数输出到复用单元111。在这里,B(j,n)及b(j,n)分别作为式(10),(11)计算出。
B(j,n)=Σk=BL(j,n)BH(j,n)S2(k)2---(0≤j<J,0≤n<N)---(10)]]>b(j,n)=Σk=BL(j,n)BH(j,n)D2(k)2---(0≤j<J,0≤n<N)---(11)]]>另外,BL(j,n),BH(j,n)分别表示第j子带的第n划分单元的最小频率和最大频率。
复用单元111,复用从搜索单元108得到的最优节距因数Tmax的信息;和从滤波系数计算单元110得到的滤波系数的信息;和从频谱轮廓形状调整系数编码单元113得到的频谱轮廓形状调整系数的信息后,从输出端子114输出。
在本实施方式中,就式(1)中的M=1时进行了说明,但是不限于该值,可以使用0以上(包括0)的整数。另外,在本实施方式中,还说明了使用频域变换单元104,105时的有关情况,但是这些是输入时域信号时必须的结构要素,在直接输入频谱的结构中,则不需要频域变换单元。
(实施方式2)图9是表示本发明的实施方式2涉及的频谱编码装置200的结构的方块图。在本实施方式中,由于在滤波单元使用的滤波器的结构比较简单,所以不需要滤波系数计算单元,可以用较少的运算量得到能够估计第2频谱的效果。另外,图9中,由于与图4有相同名称的构成要素具有相同的功能,所以省略了对于这样的构成要素的详细说明。譬如,图4的频谱轮廓形状调整子带决定单元112,具有与图9的频谱轮廓形状调整子带决定单元209相同的名称“频谱轮廓形状调整子带决定单元”的,所以有相同的功能。
滤波单元206使用的滤波器的结构,如下式,使用简略化的结构。
P(z)=11-z-T---(12)]]>式(12)是根据式(1),设定M=0、β0=1所表示的滤波器。把这时的滤波状态示于图10。这样,第2频谱的估计值D2(k),可以通过依次复制只距离T的低频带的频谱来求出。
另外,在搜索单元207中与实施方式1一样,搜索把式(3)设定为最小时的节距因数T来决定最优节距因数Tmax。把这样求出来的节距因数Tmax给予复用单元211。
本结构中,设定给予频谱轮廓形状调整系数编码单元210的第2频谱的估计值D2(k),是利用在搜索单元207为了搜索而一时生成的值。所以,频谱轮廓形状调整系数编码单元210由搜索单元207给予第2频谱估计值D2(k)。
(实施方式3)图11是表示本发明的实施方式3涉及的频谱编码装置300的结构的方块图。本实施方式的特点是,把FL≤k<FH的频带预先划分成多个子带,对各个子带进行节距因数T的搜索,滤波系数的计算及频谱轮廓形状的调整,并对这些信号进行编码。由此,可以得到如下效果即,可以回避由包括在置换方的0≤k<FL的频带的频谱里的频谱倾斜,引起的频谱能量的不连续的问题,而且由于每个子带都独立进行编码,因此能够实现更高质量的频带扩展。在图11中,由于与图4有相同名称的构成要素具有相同的功能,所以,省略了对于这样的构成要素的详细说明。
子带划分单元309把由频域变换单元304给予的第2频谱S2(k)的频带FL≤k<FH,划分成预先规定的J个子带。本实施方式中,设定J=4进行说明。子带划分单元309把包括在第0子带里的频谱S2(k)输出到端子310a。同样,包括在第1子带,第2子带及第3子带里的频谱S2(k)分别输出到端子310b,310c及310d。
子带选择单元312控制替换单元311,以便替换单元311依次选择端子310a,端子310b,端子310c及端子310d。也就是说通过子带选择单元312,依次选择第0子带,第1子带,第2子带及第3子带,把频谱S2(k)给予了搜索单元307,滤波单元系数计算单元313及频谱轮廓形状调整系数编码单元314。然后,以子带单位实施处理,对每个子带均求出节距因数Tmax,滤波系数βi及频谱轮廓形状调整系数,并给予复用单元315。因而,J个节距因数Tmax的信息,J个滤波系数的信息及J个频谱轮廓形状调整系数的信息被提供给复用单元315。
另外,本实施方式由于预先确定了子带,所以不需要频谱轮廓形状调整子带决定单元。
图12是表示本实施方式的处理状况的图。如该图所示,频带FL≤k<FH划分成预先规定的子带,计算出各个子带的Tmax,βi,Vq,并分别发送到复用单元。通过该结构,使从低频带频谱置换的频谱的带宽与用于频谱轮廓形状调整的子带的带宽一致,所以不会发生频谱能量的不连续问题,从而改善了音质。
(实施方式4)图13是表示本发明的实施方式4涉及的频谱编码装置400的结构方块图。本实施方式的特点是根据上述实施方式3,在滤波单元使用的滤波器的结构比较简单这一点上。因此,取得了不需要滤波系数计算单元,用较少的运算量就能够进行第2频谱的估计这样的效果。在图13中,由于与图11有相同名称的构成要素,具有相同的功能,所以省略了对于这样的构成要素的详细说明。
滤波单元406使用的滤波器的结构,如下式,使用简略化的结构。
P(z)=11-z-T---(13)]]>
式(13)是根据式(1),设定M=0,β0=1所表示的滤波器。把这时的滤波状态示于图10。这样,第2频谱的估计值D2(k),可以通过依次复制只距离T的低频带的频谱来求出。
另外,搜索单元407与实施方式1一样搜索,把式(3)设定为最小时的节距因数T来决定最适节距因数Tmax。把这样求出来的节距因数Tmax发送到复用单元414。
在本结构中,设定给予频谱轮廓形状调整系数编码单元413的第2频谱的估计值D2(k),是利用搜索单元407为了搜索,而一时生成的值。因而,第2频谱估计值D2(k),由搜索单元407提供给频谱轮廓形状调整系数编码单元413。
(实施方式5)图14是表示本发明的实施方式5涉及的频谱编码装置500的结构方块图。本实施方式的特点是,对第1频谱S1(k)和第2频谱S2(k),分别使用LPC频谱来校正频谱倾斜,使用校正后的频谱求第2频谱的估计值D2(k)。由此,便得到了消除频谱能量不连续的问题这样的效果。在图14中,由于与图13有相同名称的构成要素具有相同的功能,所以,省略了对于这样的构成要素的详细说明。另外,在本实施方式中,就对于上述的实施方式4适用频谱倾斜校正技术时的情形进行说明。但是不限于此,上述的实施方式1~3的每一个都可以适用本技术。
从输入端子505输入,通过在这里没有图示的LPC分析单元,或者LPC解码单元求出来的LPC系数,给予LPC频谱计算单元506。与此不同,可以是对从输入端子501输入的信号进行LPC分析来求出LPC系数的结构。这时,不需要输入端子505,重新追加LPC分析单元以代替它。
在LPC频谱计算单元506,根据LPC系数,按照下式(14)计算出频谱包络。
e1(k)=|11-Σi=1NPα(i)·e-j2πkiK|---(14)]]>
或者也可以按照下式(15)计算出频谱包络。
e1(k)=|11Σi=1NPα(i)γiej2πkiK|---(15)]]>在这里,α表示LPC系数,NP表示LPC系数的次数,K表示频谱分解能。另外,γ是大于等于0,并且小于1的常数,可以通过使用该γ使频谱的形状平滑。这样求出来的频谱包络e1(k),发送给频谱倾斜校正507。
在频谱倾斜校正507中,使用由LPC频谱计算单元506得到的频谱包络e1(k),按照下式(16)校正由频域变换单元503给予的第1频谱S1(k)内的频谱倾斜。
S1new(k)=S1(k)e1(k)---(16)]]>把这样求出来的、经校正后的第1频谱给予内部状态设定单元511。
另一方面,当第2频谱计算出来时,也可以进行同样处理。把从输入端子502输入的第2信号给予LPC分析单元508,进行LPC分析,求出LPC系数。在这里把求出的LPC系数,变换成适合于LSP系数等的编码的参数后,进行编码,把它的指数给予复用单元521。与此同时,将LPC系数解码,并把解码后的LPC系数给予LPC频谱计算单元509。LPC频谱计算单元509具有与上述的LPC频谱计算单元506同样的功能,按照式(14)或者式(15)计算出第2信号用的频谱包络e2(k)。频谱倾斜校正单元510具有与上述的频谱倾斜校正507同样的功能,按照下式(17)校正第2频谱内的频谱倾斜度。
S2new(k)=S2(k)e2(k)---(17)]]>
把这样求出的、校正后的第2频谱给予搜索单元513;同时给予频谱倾斜附加单元519。
在频谱倾斜附加单元519中,按照下式(18)对由搜索单元513给予的第2频谱的估计值D2(k),附加频谱倾斜度。
D2new(k)=D2(k)·e2(k)...(18)把这样计算出来的第2频谱的估计值s2new(k),给予频谱轮廓形状调整系数编码单元520。
在复用单元521中,复用由搜索单元513给予的节距因数Tmax的信息;和由频谱轮廓形状调整系数编码单元520给予的调整系数的信息;和由LPC分析单元给予的LPC系数的编码信息,然后从输出端子522输出。
(实施方式6)图15是表示本发明的实施方式6涉及的频谱编码装置600的结构方块图。本实施方式的特点,是从第1频谱S1(k)中选择频谱形状比较平直的频带,从该平直的频带开始进行节距因数T的搜索。这样,置换后的频谱的能量就很难不连续,从而得到回避频谱能量不连续问题的效果。在图15中,由于与图13有相同名称的构成要素具有相同的功能,所以省略了对于这样的构成要素的详细说明。另外,在本实施方式中,就对于上述实施方式4适用频谱倾斜校正技术时的情形进行说明,但是不限于此,关于迄今为止的上述各个实施方式,都可以适用本技术。
第1频谱S1(K),由频域变换单元603给予频谱平直部分检测单元605,从第1频谱S1(k)检测出频谱形状为平直的频带,在频谱平直部分检测单元605中,把频带0≤k<FL的第1频谱S1(k)划分成多个子带,将各个子带的频谱变动量定量化,检测出其频谱变动量最小的子带。把表示该子带的信息给予音调设定单元609及复用单元615。
在本实施方式中,作为对频谱的变动量进行定量化的单元,就使用包括在子带里的频谱的分散值时的情形加以说明。把频带0≤k<FL划分成N个子带,按照下式(19)计算出包括在各子带里的频谱S1(k)的分散值u(n)。
u(n)=Σk=BL(n)BH(n)(|S1(k)|-S1mean)2BH(n)+BL(n)+1---(19)]]>在这里,BL(n)表示第n子带的最小频率,BH(n)表示第n子带的最大频率,S1mean表示包括在第n子带里的频谱的平均绝对值。在这里,取频谱的绝对值的目的是为了检测出在频谱振幅值方面的平直频带。
比较这样求出来的各子带的分散值u(n),决定分散值最小的子带,把表示该子带的变数n发送给节距因数设定单元609及复用单元615。
在节距因数设定单元609中,将节距因数T的搜索范围限定在由频谱平直部分检测单元605决定的子带的频带中,在该限定的范围中决定节距因数T的候选。这样,由于从频谱能量变动小的频带中决定节距因数T,从而缓和了频谱能量不连续的问题。
在复用单元615中,复用由搜索单元608给予的节距因数Tmax的信息;和由频谱轮廓形状调整系数编码单元614给予的调整系数的信息;和由频谱平直部分检测单元605给予的子带信息后,从输出端子616输出。
(实施方式7)图16是表示本发明的实施方式7涉及的频谱编码装置700的结构方块图。本实施方式的特点是根据输入信号的周期性强度,使搜索节距因数T的范围自适应地变化。由此,像无声部分那样,对于周期性低的信号,由于不存在谐波结构,所以即使把搜索范围设定得非常小,也不易发生问题。另外,像有声部分那样,对于周期性高的信号,根据当时的音调周期的值来变更搜索节距因数T的范围。由此,可以减少用于表示节距因数T的信息量,从而能够降低位速度。在图16中,由于与图13有相同名称的构成要素具有相同的功能,所以省略了关于这样的构成要素的详细说明。另外,在本实施方式中,就对于上述的实施方式4适用本技术时的情形进行说明,但是不限于此,关于迄今为止的上述各个实施方式,都可以适用本技术。
从输入端子706,至少输入表示音调周期性的强度的参数和表示音调周期的长度的参数的其中一方。在本实施方式中,进行输入表示音调周期强度的参数和表示音调周期长度的参数时的说明。另外,在本实施方式中,对在这里没有图示的CELP的自适应编码帐搜索求出的音调周期P和音调增益Pg从输入端子706输入的情况进行说明。
在搜索范围决定单元707中,使用由输入端子706给予的音调周期P和音调增益Pg来决定搜索范围。首先,用音调增益Pg的大小来判断输入信号的周期性的强度。音调增益Pg与阈值比较,如果大时,认为从输入端子701输入的输入信号是有声部分,决定表示节距因数T的搜索范围的TMIN和TMAX,以便至少包括音调周期P表示的谐波结构的1个谐波。因此,音调周期P的频率大时,节距因数T的搜索范围设定得较宽,反之音调周期P的频率小时,则把节距因数T的搜索范围设定的窄一些。
音调增益Pg与阈值比较,如果小时,认为从输入端子701输入的输入信号是无声部分,当作没有谐波结构来把搜索节距因数T的搜索范围设定得非常窄。
(实施方式8)图17是表示本发明的实施方式8涉及的分层编码装置800结构的方块图。在本实施方式中,通过将上述实施方式1~7的其中任意一个适用于分层编码,可以用低位速度对声音信号或者音频信号高质量地进行编码。
从输入端子801输入音响数据,在下采样单元802生成采样速度低的信号。下采样的信号被提供给第1层编码单元803,并且该信号被编码。第1层编码单元803的编码符号被提供给复用单元807,同时被提供给第1层解码单元804。在第1层解码单元804,根据编码符号生成第1层解码信号。
然后,用上采样单元805提高第1层编码单元803的解码信号的采样速度。延迟单元806,对从输入端子801输入的输入信号给予特定长度的延迟。设定该延迟的大小,与下采样单元802和第1层编码单元803和第1层解码单元804和上采样单元805产生的时间延迟同值。
在频谱编码单元101中,适用上述实施方式1~7中的其中任意一个,把从上采样单元805得到的信号作为第1信号,把从延迟单元806得到的信号作为第2信号,进行频谱编码,把编码符号输出到复用单元807。
在第1层编码单元803求出的编码符号和在频谱编码单元101求出的编码符号,在复用单元807被复用,并作为输出符号,从输出端子808输出。
当频谱编码单元101的结构为图14及图16所示的结构时,本实施方式涉及的分层编码装置800a(为了与图17所示的分层编装置800有所区别,所以在末尾加了字母表的小写字母)的结构如图18。图18和图17的区别在于频谱编码装置101上追加了从第1层解码单元804a直接输入的信号线。它表示在第1层解码单元804被解码的LPC系数或者音调周期P和音调增益Pg被提供给频谱编码单元101。
(实施方式9)图19是表示本发明的实施方式9涉及的频谱解码装置1000的结构方块图。
在本实施方式中,可以对通过滤波器根据第1频谱估计第2频谱的高频成分而生成的编码符号进行解码,从而可以对高精度的估计频谱进行解码,而且通过对估计后的高频频谱,用适当的子带调整频谱轮廓形状,从而得到改善解码信号质量这样的效果。从输入端子1002输入由在这里没有图示的频谱编码单元编码的编码符号,被提供给分离单元1003。分离单元1003,把滤波器的信息给予滤波单元1007和频谱轮廓形状调整子带决定单元1008,与此同时,把频谱轮廓形状调整系数的信息,给予频谱轮廓形状调整系数解码单元1009。而且,从输入端子1004输入有效频带为0≤k<FL的第1信号,在频域变换单元1005中对从输入端子1004输入的时域信号进行频率变换,计算出第1频谱S1(k)。在这里,作为频率变换法,可以适用离散傅里叶变换(DFT),离散余弦变换(DCT),变形离散余弦变换(MDCT)等。
然后,在内部状态设定单元1006,使用第1频谱S1(k),设定在滤波单元1007使用的滤波器的内部状态。在滤波单元1007,根据在内部状态设定单元1006设定的滤波器的内部状态,和由分离单元1003给予的节距因数Tmax及滤波系数β,进行滤波,计算出第2频谱的估计值D2(k)。这时,在滤波单元1007使用式(1)记载的滤波器。另外,使用式(12)记载的滤波器时,由分离单元1003给予的只是节距因数Tmax。至于利用哪一个滤波器,使用与在这里没有图示的频谱编码单元使用的滤波器的种类相对应,并与该滤波器相同的滤波器。
由滤波单元1007生成的解码频谱D(k)的状态示于图20。如图20所示,在解码频谱D(k)的频带0≤k<FL中,由第1频谱S1(k)构成,在频带FL≤k<FH中,由第2频谱的估计值D2(k)构成。
频谱轮廓形状调整子带决定单元1008,使用由分离单元1003给予的节距因数Tmax,决定进行频谱轮廓形状的调整的子带。第j个子带可以使用节距因数Tmax表示为如下式(20)。
BL(j)=FL+(j-1)·TmaxBH(j)=FL+j·Tmax(0≤j<J)---(20)]]>在这里,BL(j)表示第j子带的最小频率,BH(j)表示第j子带的最大频率。另外,子带数J作为第J-1子带的最大频率BH(J-1)超过FH的最小整数来表示。把这样决定的频谱轮廓形状调整子带的信息,给予频谱调整单元1010。
在频谱轮廓形状调整系数解码单元1009中,根据由分离单元1003给予的频谱轮廓形状调整系数的信息,将频谱轮廓形状调整系数解码,把该解码的频谱轮廓形状调整系数给予频谱调整单元1010。在这里,频谱轮廓形状调整系数表示,对式(8)所示的每个子带的变动量进行量化,并在此后进行解码的值Vq(j)。
在频谱调整单元1010中,通过按照下式(21)从滤波单元1007得到的解码频谱D(k),乘以对由频谱轮廓形状调整子带决定单元1008给予的子带,由频谱轮廓形状调整系数解码单元1009解码的每个子带的变动量的解码值Vq(j),来调整解码频谱D(k)的频带FL≤k<FH的频谱形状,生成调整后的解码频谱S3(k)。
S′3(k)=D(k)Vq(j)(BL(j)≤k≤BH(j),对于所有的j)...(21)把该解码频谱S3(k)给予时域变换单元1011,变换成时域信号,从输出端子1012输出。在时域变换单元1011变换成时域信号时,根据需要进行适当的乘帧及重叠加算等处理。以避免帧间产生的不连续。
(实施方式10)图21是表示本发明的实施方式10涉及的频谱解码装置1100的结构方块图。本实施方式的特点在于预先把FL≤k<FH的频带划分成多个子带,可以使用各个子带的信息进行解码。由此,可以回避由包括在是置换方的0≤k<FL的频带的频谱里的、频谱倾斜引起的频谱能量的不连续问题。而且由于能够将对每个子带独立地进行编码的编码符号解码,所以能够生成高质量的解码信号。在图21中,由于与图19有相同名称的构成要素具有相同的功能,所以省略了关于这样的构成要素的详细说明。
在本实施方式中,如图12所示,把频带FL≤k<FH划分成预先规定的J个子带,对各个子带,将已编码的节距因数Tmax,滤波系数β,频谱轮廓形状调整系数Vq,生成声音信号解码来生成声音信号。或者,对各个子带,将已编码的节距因数Tmax,频谱轮廓形状调整系数Vq解码来生成声音信号。至于按照哪一种方法,可依据这里没有图示的频谱编码单元使用的滤波器的种类而定。前者时使用式(1)的滤波器,后者时使用式(12)的滤波器。
频带0≤k<FL中存储着第1频谱S1(k),而频带FL≤k<FH中被划分成J个子带的频谱轮廓形状调整后的频谱,由频谱调整单元1108提供给子带综合单元1109。在子带综合单元1109中连接这些频谱,生成如图20所示的解码频谱D(k)。把这样生成的解码频谱D(k)给予时域变换单元1110。本实施方式的流程图示于图22。
(实施方式11)图23是表示本发明的实施方式11涉及的频谱解码装置1200的结构方块图。本实施方式的特点在于对第1频谱S1(k)和第2频谱S2(k),分别使用LPC频谱来校正频谱倾斜,使用校正后的频谱,求出第2频谱的估计值D2(k),从而能够将得到的符号解码。由此,能够得到消除频谱能量不连续问题的频谱,并得到能够生成高质量解码信号这样的效果。在图23中,由于与图21有相同名称的构成要素具有相同的功能,所以省略了关于这样的构成要素的详细说明。另外,在本实施方式中,对于上述的实施方式10适用频谱倾斜校正技术时的情形进行说明,但是不限于此,对于上述实施方式9也可以适用本技术。
LPC系数解码单元1210,根据由分离单元1202给予的LPC系数的信息将LPC系数解码,把LPC系数给予LPC频谱计算单元1211。LPC系数解码单元1210的处理,依靠在这里没有图示的编码单元的LPC分析单元内进行的LPC系数的编码处理,实施在这里的编码处理得到的符号的解码处理。LPC频谱计算单元1211,按照式(14)或者式(15)计算出LPC频谱。至于适用哪一种方法,使用与这里没有图示的编码单元的LPC频谱计算单元中使用的方法相同方法即可。由LPC频谱计算单元1211求出的LPC频谱被提供给频谱倾斜附加单元1209。
另一方面,在这里没有图示的LPC解码单元或者LPC计算单元求出的LPC系数,从输入端子1215输入,发送给LPC频谱计算单元1216。LPC频谱计算单元1216,按照式(14)或者式(15)计算LPC频谱。至于使用哪一种方法,根据在这里没有图示的编码单元使用了什么样的方法而定。
在频谱倾斜附加单元1209中,按照下式(22)由滤波单元1206给予的解码频谱D(k)乘以频谱倾斜率,然后,把赋予频谱倾斜率的解码频谱D(k)给予频谱调整单元1207。在式(22)中,e1(k)表示LPC频谱计算单元1216的输出,e2(k)表示LPC频谱计算单元1211的输出。
D2new(k)=D2(k)e1(k)·e2(k)---(22)]]>(实施方式12)图24是表示本发明的实施方式12涉及的频谱解码装置1300的结构方块图。本实施方式的特点在于能够将通过从第1频谱S1(k)中检测出频谱的形状比较平直的频带,从该平直的频带搜索节距因数T而得到的符号解码。这样,置换后的频谱的能量不连续是很难的,从而得到了避免频谱能量不连续问题的解码频谱,而获得能够生成高质量解码信号的效果。在图24中,由于与图21有相同名称的构成要素具有相同的功能,所以省略了关于这样的构成要素的详细说明。另外,在本实施方式中,对于上述实施方式10适用本技术时的情况进行了说明,但是不限于此,上述实施方式9及实施方式11也可以适用本技术。
表示将频带0≤k<FL划分成N个子带内的哪个子带被选择的子带选择信息n,和表示把包括在第n子带里的频率内哪个位置作为置换方的起始点来使用的信息,由分离单元1302提供给节距因数Tmax生成单元1303。在节距因数Tmax生成单元1303中,根据这两个信息生成在滤波单元1307使用的节距因数Tmax,把节距因数Tmax给予滤波单元1307。
(实施方式13)图25是表示本发明的实施方式13涉及的分层解码装置1400的结构方块图。在本实施方式中,通过使上述实施方式9~12的其中任意一个适用分层解码法,可以将由上述实施方式8的分层编码法生成的编码符号解码,从而可以对高质量的声音信号或者音频信号进行解码。
从输入端子1401输入用这里没有图示的分层信号编码法进行编码的符号,然后用分离器1402分离上述符号,生成第1层解码单元用的符号和频谱解码单元用的符号。在第1层解码单元1403中,使用在分离单元1402得到的符号,上采样速度2·FL的解码信号解码,把该解码信号给予上采样单元1405。上采样单元1405把由第1层解码单元1403给予的第1层解码信号的采样频率提高到2·FH。另外,根据本结构,需要输出在第1层解码单元1403生成的第1层解码信号时,可以使其从输出端子1404输出。不需要输出第1层解码时,可以从结构中去掉输出端子1404。
由分离单元1402分离的符号,和由上采样单元1405生成的上采样后第1层解码信号,被提供给频谱解码单元1001。频谱解码单元1001,根据上述的实施方式9~12中的1个方法进行频谱解码,生成采样频率2·FH的解码信号,从输出端子1406输出。在频谱解码单元1001中,把由上采样单元1405给予的上采样后的第1层解码信号看作第1信号进行处理。
当频谱解码单元1001的结构为图23所示的结构时,本实施方式涉及的分层解码装置1400a的结构,便像图26所示那样。图25和图26的区别在于,在频谱解码单元1001上追加了从分离单元1402直接输入的信号线。这表示,在分离单元1402被解码的LPC系数或者音调周期P和音调增益Pg被提供给频谱解码单元1001。
(实施方式14)下面,参照

本发明的实施方式14。图27是表示本发明的实施方式14涉及的音响信号编码装置1500的结构方块图。本实施方式的特点在于,图27中的音响编码装置1504是由上述实施方式8所示的分层编码装置800构成。
如图27所示,本发明的实施方式14涉及的音响信号编码装置1500,包括输入装置1502,AD变换装置1503及连接于网络1505的音响编码装置1504。
AD变换装置1503的输入端子连接于输入装置1502的输出端子。音响编码装置1504的输入端子,连接于AD变换装置1503的输出端子。音响编码装置1504的输出端子连接于网络1505。
输入装置1502,把人耳听见的声波1501变换成是电信号的模拟信号后,给予AD变换装置1503。AD变换装置1503把模拟信号变换成数字信号后,给予音响编码装置1504。音响编码装置1504对输入来的数字信号进行编码,生成编码符号,输出到网络1505。
根据本发明的实施方式14,能够享有如上述实施方式8所示的效果,并且能够提供高效地对音响信号进行编码的音响编码装置。
(实施方式15)下面,参照

本发明的实施方式15。图28是表示本发明的实施方式15涉及的音响信号解码装置1600的结构方块图。本实施方式的特点在于,图28中的音响解码装置1603是由上述的实施方式13所示的分层解码装置1400构成如图28所示那样,本发明的实施方式15涉及的音响信号解码装置1600,包括连接在网络1601的接收装置1602,音响解码装置1603,及DA变换装置1604以及输出装置1605。
接收装置1602的输入端子,连接于网络1601。音响解码装置1603的输入端子,连接于接收装置1602的输出端子。DA变换装置1604的输入端子,连接于音响解码装置1603的输出端子。输出装置1605的输入端子连接于DA变换装置1604的输出端子。
接收装置1602,接收来自网络1601的数字编码音响信号,生成数字接收音响信号后,给予音响解码装置1603。音响解码信号1603,接收来自接收装置1602的接收音响信号,对该接收音响信号进行解码处理,生成数字解码音响信号后,给予DA变换装置1604。DA变换装置1604,变换来自音响解码装置1603的数字解码声音信号,生成模拟解码声音信号后,给予输出装置1605。输出装置1605,把是电信号的模拟解码音响信号,变换成空气振动,作为声波1606输出,以便人耳能够听见。
根据本发明的实施方式15,能够享有如上述实施方式13所示的效果,能够用较少的位数,高效地对编码音响信号进行解码,从而能够输出良好的音响信号。
(实施方式16)下面,参照

本发明的实施方式16。图29是表示本发明的实施方式16涉及的音响信号发送编码装置1700的结构方块图。本实施方式的特点在于,在本发明的实施方式16中,图29的音响编码装置1704是由上述实施方式8所示的分层编码装置800构成。
如图29所示,关于本发明的实施方式16的音响信号发送编码装置1700,包括输入装置1702,AD变换装置1703,音响编码装置1704,RF调制装置1705以及天线1706。
输入装置1702,把人耳听到的声波1701变换成是电信号的模拟信号后,给予AD变换装置1703。AD变换装置1703,把模拟信号变换成数字信号后,给予音响编码装置1704。音响编码装置1704,对输入来的数字信号进行编码,生成编码音响信号,给予RF调制装置1705。RF调制装置1705,对编码音响信号进行调制,生成调制编码音响信号,给予天线1706。天线1706,把调制编码音响信号作为电波1707发送。
根据本实施方式16,能够享有如上述实施方式8所示的效果,并能够用少的位数高效地对音响信号进行编码。
另外,本发明可以适用于使用音频信号的发送装置、发送编码装置或者音响信号编码装置。另外,本发明还适用于移动站装置或者基站装置。
(实施方式17)下面,参照

本发明的实施方式17。图30是表示本发明的实施方式17涉及的音响信号接收解码装置1800的结构方块图。本实施方式的特点在于,本发明的实施方式17涉及的图30中的音响解码装置1804是由上述实施方式13所示的分层解码装置1400构成。
如图30所示,本发明的实施方式17涉及的音响信号接收解码装置1800,包括天线1802,RF解调装置1803,音响解码装置1804,DA变换装置1805以及输出装置1806。
天线1802,接收作为电波1801的数字编码音响信号,生成电信号的数字接收编码音响信号后,给予RF解调装置1803。RF解调装置1803,对来自天线1802的接收编码音响信号进行解调,生成解调编码音响信号后,给予音响解码装置1804。
音响解码装置1804,接收来自RF解调装置1803的数字解调编码音响信号,进行解码处理,生成数字解码音响信号后,给予DA变换装置1805。DA变换装置1805,变换来自音响解码装置1804的数字解码声音信号,生成模拟解码声音信号后,给予输出装置1806。输出装置1806,把是电信号的模拟解码声音信号变换成空气振动,作为音波1807输出,以便人耳能够听见。
根据本发明的实施方式17,能够享有如上述实施方式13所示的效果,并且能够使用较少的位数,高效地对被编码的音响信号进行解码,从而能够输出良好的音响信号。
如上所述,根据本发明,通过使用内部状态具有第1频谱的滤波器来估计第2频谱的高频部,将与第2频谱的估计值的类似度最大时的滤波系数编码,并对第2频谱的估计值,用适当的子带来调整频谱的轮廓形状,从而能够用低位速度高质量地将频谱编码。而且,将本发明适用于分层编码,从而能够用低位速度高质量地将声音信号或音频信号编码。
而且,本发明可以适用于使用音频信号的接收装置,接收解码装置或者声音信号解码装置。另外,本发明还可以适用于移动站装置或者基站装置。
另外,在上述各实施方式的说明中使用的各功能块,其典型是以集成电路LSI来实现的。这些,可以个别地进行单片芯片化,也可以将其部分地或者全部地进行单片芯片化。
另外,在这里虽然叫做LSI,但是根据集成度的不同,也可以叫做IC、LSI系统、超大LSI,超LSI等。
再有,集成电路化的方法不限于LSI,也可以用专用电路或者通用处理程序来实现。LSI制造后,可以使用能够用于编程的FPGA(FieldProgrammable Gate Array,现场可编程门阵列),或能够对LSI的内部电路单元的连接或者设定进行再构成的可重组程序。
而且,随着半导体技术的进步或者派生出的其它技术,如果出现置换LSI的集成电路化的技术,当然也可以使用该技术进行功能块的集成化。仿生技术的自适应等也是有可能的。
本发明的频谱编码方法的第1方式包括对第1信号进行频率变换计算第1频谱的单元;对第2信号进行频率变换计算第2频谱的单元;使用作为内部状态具有0≤k<FL的频带的第1频谱的滤波器,估计FL≤k<FH频带的第2频谱的形状,将表示这时的滤波器特性的系数编码的频谱编码方法中,同时将根据表示滤波器特性的系数而决定的第2频谱的轮廓形状编码。
根据该结构,根据第1频谱S1(k),通过滤波器估计第2频谱S2(k)的高频带成分,从而仅将表示滤波器特性的系数编码即可,这样可以用低位速度高精度地估计第2频谱S2(k)的高频成分。而且由于根据表示滤波器特性的系数来将频谱的轮廓形状编码,所以不会发生频谱能量的不连续,从而可以改善质量。
本发明的频谱编码方法的第2方式包括把第2频谱划分成多个子带,对每个子带将表示滤波器特性的系数和频谱的轮廓形状编码。
根据该结构,根据第1频谱S1(k),通过滤波器估计第2频谱S2(k)的高频带成分,从而仅将表示滤波器特性的系数编码即可,这样可以用低位速度高精度地估计第2频谱S2(k)的高频成分。而且,由于是预先决定多个子带,且对每个子带将表示滤波器特性的系数和频谱的轮廓形状编码的结构,所以很难发生频谱能量不连续的问题,从而可以改善质量。
再有,本发明的频谱编码方法的第3方式在上述结构中,其中,滤波器由下式(23)表示,P(z)=11-Σi=-MMβiz-T+i---(23)]]>使用该滤波器的零输入响应进行估计。
根据该结构,能够避免在S2(k)的估计值发生的谐波结构的崩溃,从而得到改善质量的效果。
本发明的频谱编码方法的第4方式在上述结构中,其中,设定M=0,β0=1。
根据该结构,滤波器的特性只由节距因数T来决定,所以可获得能够用低位速度进行频谱估计的效果。
本发明的频谱编码方法的第5方式在上述结构中,其中,对由节距因数T规定的每个子带,决定频谱的轮廓形状。
根据该结构,由于适当规定了子带的频带宽度,所以不会发生频谱能量的不连续问题,这样可以改善质量。
本发明的频谱编码方法的第6方式在上述结构中,其中,第1信号是在低端层编码后被解码而取得的信号或者是将该信号上采样的信号,第2信号是输入信号。
根据该结构,由多层编码单元构成的分层编码中可以适用本发明,可获得能够用低位速度高质量地将输入信号编码的效果。
本发明的频谱解码方法的第1方式包括将表示滤波器特性的系数解码,对第1信号进行频率变换求出第1频谱,使用作为内部状态具有0≤k<FL的频带的第1频谱的该滤波器,生成FL≤k<FH的频带的第2频谱的估计值的频谱解码方法中,同时将根据表示滤波器特性的系数来决定的第2频谱的频谱轮廓形状解码。
根据该结构,可以将根据第1频谱S1(k),通过滤波器估计第2频谱S2(k)的高频带成分而得到的编码符号解码,所以,能够得到可将高精度的第2频谱S2(k)的高频带成分的估计值解码的效果。而且由于能够根据表示滤波器特性的系数将编码的频谱轮廓形状解码,所以不会发生频谱能量不连续的问题,从而能够生成高质量的解码信号。
而且,本发明的频谱解码方法的第2方式包括把第2频谱划分成多个子带,对每个子带,将表示滤波器特性的系数和频谱的轮廓形状解码。
根据该结构,可以将根据第1频谱S1(k),通过滤波器估计第2频谱S2(k)的高频带成分而得到的编码符号解码,所以,能够得到可将高精度的第2频谱S2(k)的高频带成分的估计值解码的效果。而且,由于预先决定多个子带,而能够对每个子带,将表示被编码的滤波器特性的系数和频谱轮廓形状解码,所以不会发生频谱能量不连续的问题,从而能够生成高质量的解码信号。
再有,本发明的频谱解码方法的第3方式在上述结构中,其中,滤波器由下式(23)表示,P(z)=11-Σi=-MMβiz-T+i---(23)]]>使用该滤波器的零输入响应,生成估计值。
根据该结构,由于能够将用避免在S2(k)的估计值产生的谐波结构崩溃的方法而得到编码符号解码,所以能够得到可将质量得到改善的频谱的估计值解码的效果。
本发明的频谱解码方法的第4方式在上述结构中,其中,设定M=0、β0=1。
由于可以根据该结构,将根据只用节距因数T规定特性的滤波器来估计频谱而得到的编码符号解码,所以能够获得可以用低位速度将频谱的估计值解码的效果。
本发明的频谱解码方法的第5方式,其中,对由节距因数T规定的每个子带,将频谱的轮廓形状解码。
通过该结构,由于能够对每个适当的频带宽的子带,将计算出的频谱轮廓形状解码,所以不会发生频谱能量不连续的问题。从而可以改善质量。
本发明的频谱解码方法的第6方式在上述结构中,其中,第1信号,从在低端层解码的信号或者将该信号上采样的信号中生成。
由于可以根据该结构,将由多层编码单元构成的分层编码得到的编码符号解码,所以能够获得可用低位速度得到高质量的解码信号的效果。
本发明的音响信号发送装置,包括把音乐或声音等的音响信号变换成电信号的音响输入装置;把从音响输入单元输出的信号变换成数字信号的A/D变换装置;对从A/D变换装置输出的数字信号,用包括如权利要求1~6所述当中的1个频谱编码方式的方法,进行编码的编码装置;对从该音响编码装置输出的编码符号进行调制处理等的RF调制装置;以及把从该RF调制装置输出的信号变换成电波后发送的发送天线。
通过该结构,就能够提供用较少的位数高效地进行编码的编码装置。
本发明的音响信号解码装置,包括接收电波的接收天线;对通过上述接收天线接收的信号进行解调处理的RF解调装置;用包括如权利要求7~12所述当中的1个频谱解码方式的方法,对通过上述RF解调装置得到的信息进行解码的解码装置;对从上述音响解码装置解码的数字音响信号进行D/A变换的D/A变换装置;以及把从上述D/A变换装置输出的电信号变换为音响信号的音响输出装置。
通过该结构,由于能够用较少的位数高效地对被编码的音响信号进行解码,所以能够输出良好的分层信号。
本发明的通信终端装置,包括上述的音响信号发送装置或者上述的音响信号接收装置中的至少一方。本发明的基站装置,包括上述的音响信号发送装置或者上述的音响信号接收装置中的至少一方。
通过该结构,能够提供用较少的位数高效地对音响信号进行编码的通信终端装置或基站装置。另外,通过该结构,还能够提供可以用较少的位数高效地对被编码的音响信号进行解码的通信终端装置或基站装置。
本说明书是根据2003年10月23日申请的第2003-363080号日本专利。其全部内容通过引用并入本文。
工业实用性本发明能够用低位速度高质量地将频谱编码,所以对于发送装置或接收装置等是有用的。而且本发明适用于分层编码,从而能够用低位速度高质量地将声音信号或音频信号编码,所以,对于移动通信系统中的移动站装置,或者基站装置等是有用的。
权利要求
1.一种频谱编码装置,包括取得频带至少被分成低频带和高频带的频谱的取得单元;使用以上述低频带频谱作为内部状态的滤波器估计上述高频带的频谱形状的估计单元;对表示上述滤波器特性的系数进行编码的第1编码单元;以及对根据上述系数决定的频谱的轮廓形状进行编码的第2编码单元。
2.如权利要求1所述的频谱编码装置,还包括将上述高频带的频谱划分成多个子带的划分单元,其中,上述第1编码单元对每个上述子带编码上述系数。
3.一种频谱解码装置,包括从编码信息中将表示滤波器特性的系数解码的第1解码单元;取得频带至少被分成低频带和高频带的频谱之中的低频带频谱的取得单元;使用作为内部状态具有上述低频带的频谱的滤波器,生成上述高频带的频谱的估计频谱的生成单元;以及对根据被解码的上述系数决定的频谱的轮廓形状解码的第2解码单元。
4.如权利要求3所述的频谱解码装置,其中,上述第1解码单元对每个上述高频带的频谱的多个子带解码上述系数。
5.一种频谱编码方法,包括以下步骤对频率k为0≤k<FL的频带的信号进行频率变换,计算出第1频谱;对频率k为0≤k<FH的频带的信号进行频率变换,计算出第2频率;使用以上述第1频谱作为内部状态的滤波器估计上述第2频谱的FL≤k<FH的频带的形状;对表示上述滤波器特性的系数进行编码;以及同时对根据表示上述滤波器特性的系数而决定第2频谱的轮廓形状进行编码。
6.如权利要求5所述的频率编码方法,其中,将上述第2频谱划分为多个子带,对每个上述子带编码表示上述滤波器特性的系数。
7.如权利要求5所述的频谱编码方法,其中,滤波器由下式表示,并且使用上述滤波器的零输入响应进行估计,P(z)=11-Σi=-MMβiz-T+i]]>其中,M表示任意的整数,T表示节距因数,βi表示滤波系数。
8.如权利要求7所述的频谱编码方法,其中,在上述滤波器中,M=0、β0=1。
9.如权利要求5所述的频谱编码方法,其中,对由节距因数T规定的每个子带,决定频谱的轮廓形状。
10.如权利要求5所述的频谱编码方法,其中,上述第1信号是在低端层编码后被解码而取得的信号,或将该信号上采样的信号,并且上述第2信号是输入信号。
11.一种频谱解码方法,包括以下步骤将表示滤波器特性的系数解码;将第1信号进行频率变换求出第1频谱,使用作为内部状态具有频率k为0≤k<FL的频带的第1频谱的滤波器,生成频率k为FL≤k<FH的频带的第2频谱的估计值;以及同时将根据表示上述滤波器特性的系数来决定的第2频谱的频谱轮廓形状解码。
12.如权利要求11所述的频谱解码方法,其中,将上述第2频谱划分成多个子带,对每个上述子带解码表示上述滤波器特征的系数。
13.如权利要求11所述的频谱解码方法,其中,滤波器由下式表示,并且使用上述滤波器的零输入响应生成估计值,P(z)=11-Σi=-MMβiz-T+i]]>其中,M表示任意的整数,T表示节距因数,βi表示滤波系数。
14.如权利要求13所述的频谱解码方法,其中,在上述滤波器中,M=0、β0=1。
15.如权利要求11所述的频谱解码方法,其中,对由节距因数T规定的每个子带,将频谱轮廓形状解码。
16.如权利要求11所述的频谱解码方法,其中,上述第1信号从在低端层解码的信号或将该信号上采样的信号中生成。
17.一种音响信号发送装置,包括将音响信号变换为电信号的音响输入单元;将从上述音响输入单元输出的信号变换为数字信号的A/D变换单元;将从上述A/D变换单元输出的数字信号,用如权利要求5所述的频谱编码方法编码的编码装置;将从上述编码装置输出的编码符号调制为无线频率信号的RF调制单元;以及将从上述RF调制单元输出的信号变换成电波发送的发送天线。
18.一种音响信号接收装置,包括接收电波的接收天线;将由上述接收天线接收的信号解调的RF解调单元;根据在上述RF解调单元取得的信息,使用如权利要求11所述的频谱解码方法进行解码的解码装置;将从上述解码装置输出的信号变换为模拟信号的D/A变换单元;以及将从上述D/A变换单元输出的电信号变换为音响信号的音响输出单元。
19.一种通信终端装置,包括如权利要求17所述的音响信号发送装置。
20.一种通信终端装置,包括如权利要求18所述的音响信号接收装置。
21.一种基站装置,包括如权利要求17所述的音响信号发送装置。
22.一种基站装置,包括如权利要求18所述的音响信号接收装置。
全文摘要
提供一种能以低位速度高质量地进行编码的频谱编码装置。该装置包括对第1信号进行频率变换,计算出第1频谱的单元;对第2信号进行频率变换,计算出第2频谱的单元;使用作为内部状态具有0≤k<FH的频带的第1频谱的滤波器,估计FL≤k<FH的频带的第2频谱形状的单元;以及将根据表示这时的滤波器特性的系数来决定的第2频谱的轮廓形状编码的单元。
文档编号G10L21/02GK1871501SQ20048003065
公开日2006年11月29日 申请日期2004年10月25日 优先权日2003年10月23日
发明者押切正浩 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1