语音编码中的脉冲分配方法

文档序号:2830004阅读:310来源:国知局
专利名称:语音编码中的脉冲分配方法
技术领域
本发明涉及语音编码中的脉冲分配方法。
背景技术
一般而言,在语音编码中,使用声道模型来合成尽可能相似于原始语音
的语音信号。作为这种语音编码之一,有用于3GPP系统的自适应多速率宽 带(AMR-WB: Adaptive MultiRate - WideBand)语音编码(参照非专利文献1)。 该AMR-WB语音编码也是作为ITU-T建议G722.2(非专利文献2)由ITU-T 选定并承认的。下面,举例说明采用23.85kbps的比特率的AMR-WB语音编 码。
作为AMR-WB语音编码的重要的结构元素之一,有固定码本(图l)的搜 索。在AMR-WB语音编码中,将具有下采样后的256个样本的语音样本的 帧,分割成各自具有64个样本的4个子帧。在搜索固定码本的过程中,将该 子帧分割成4个音轨。在AMR-WB语音编码的模式8,从各个音轨可取得的 16个脉冲位置中,对每个音轨选择6个脉冲位置。也就是说,各个子帧的 脉沖的^:目^^皮设定为p 。 ~ p 2 3的24个。并且,对这些p 。 ~ p 2 3的24个脉 沖的位置进行编码,而形成用于合成对应于各个子帧的语音的码本索引(参照 非专利文献1)。
另外,在ITU-T建议G.722.2中,目前虽然支持对单声道语音信号的 AMR-WB语音编码,但没有支持对立体声语音信号的AMR-WB语音编码。
另一方面,近年来,随着移动通信和IP通信中的传输频带的宽带化以及 服务的多样化,在语音通信中,对高音质化和更强的现场感的需求日益增高。 例如,可以预料今后对下述的服务的需求会增多,即,电视电话服务中的免 提(Handsfree)形式的通话、在电视会议中的语音通信、在多个地点多个说话 人同时进行会话的多地点语音通信、在保持现场感的同时能够传输周围的声 音环境的语音通信等。那时,人们期待实现比单声道信号现场感更强并能够 识别多个说话人的说话位置的使用立体声语音的语音通信的。为了实现这样
的使用立体声语音的语音通信,必须对立体声语音进行编码。作为立体声语
音信号的编码方法之一,有对各个声道的语音信号独立地进行编码的方法(双 重单声道编码)。
(非专利文献1) "AMR Wideband Speech Codec; General Description", 3GPP TS 26.171, V5.0.0 (2001-03)
(非专利文献2) "Wideband Coding of Speech at Around 16 kbit/s Using Adaptive Multi-Rate Wideband (AMR-WB)", Geneva, ITU-T Recommendation G.722.2 (2003-07)

发明内容
本发明需要解决的问题
然而,对立体声语音信号单纯地进行使用AMR-WB语音编码的双重单 声道编码时,必须对各个声道的语音信号分别进行上述的固定码本的搜索, 因此/人编码效率和处理效率的观点而言,不够理想。
本发明的目的是,提供能够对立体声语音信号高效率地进行编码的脉冲 分配方法。
解决问题的方案
本发明的脉沖分配方法是,在对立体声信号的语音编码中,进行固定码 本搜索时所使用的脉沖分配方法,基于立体声信号的各个声道的特性和各个 声道间的相似程度,决定分配给各个声道的脉冲数。
本发明的有益效果
根据本发明,能够对立体声语音信号高效率地进行编码。


图1是AMR-WB语音编码的固定码本。
图2是本发明实施方式1的语音编码的处理流程。
图3是本发明实施方式1的固定码本搜索的主要的处理流程。
图4是本发明实施方式1的固定码本搜索的详细处理流程。
图5是本发明实施方式1的脉冲分配的一个例子。
图6是本发明实施方式1的脉沖分配的一个例子。 图7是本发明实施方式1的通知例。
图8是本发明实施方式1的语音解码的处理流程。
图9是本发明实施方式2的通知例。
图10是本发明实施方式2的语音解码的处理流程。
具体实施例方式
下面,参照附图详细地说明本发明的实施方式。另外,在以下说明中, 举一例说明AMR-WB语音编码。另夕卜,在以下的说明中,说明采用AMR-WB 语音编码的编码模式中的模式8的情况下的实施方式,但各个实施方式同样 可适用于其它编码模式。
在AMR-WB语音编码的^^莫式8中,固定码本矢量(创新矢量)包括24个 脉沖。如上述图l所示,在各个子帧中有0 63的64个可取的脉沖位置,这 些脉沖位置,以各个音轨包含6个脉沖的方式,被分割成1 4的4个音轨。
(实施方式1)
在本实施方式,基于输入立体声信号的各个声道间的相似程度,以及各 个声道的周期性和稳定度,决定对各个声道的脉沖数的分配。基于相似程度、 周期性和稳定度,对各个声道分配所需数目的脉沖。对各个声道的分配脉冲 数决定后,进行与 一般的AMR-WB语音编码相同的脉沖搜索,决定对各个 声道的脉冲位置。将这些脉沖作为码字组进行编码,并作为语音比特流中的 参数之一的码本索引发送。
图2表示本实施方式的语音编码的主要的处理流程。
首先,在ST(步骤)ll,对立体声信号进行预处理,该预处理包括下采样 和使用高通滤波器和预加重滤波器的滤波处理。
在ST12,对预处理后的立体声信号进行LPC分析,获得立体声信号的L 声道(左声道)和R声道(右声道)的各个声道的LPC参数。将LPC参数变换成 ISP(Immittance Spectrum Pair)和对各个声道的量化矢量。
在ST13,对各个声道进行基音搜索,对各个帧估两次计开环基音延迟。
在ST14,使用估计出的基音延迟(估计基音延迟),对于各个子帧,对估 计基音延迟的周边进行使用闭环基音的自适应码本搜索,获得自适应码本矢 量。 在ST15,使用自适应码本矢量,进行伴随脉沖分配的固定码本搜索,获
得对各个声道的固定码本矢量。
然后,在ST16,为了下一个子帧的运算,更新滤波器记忆和样本数据。
另外,在本实施方式中,除图2所示的处理外,与上述非专利文献l所 记载的处理相同。
接着,图3表示固定码本搜索(ST15)的主要的处理流程。主要通过 ST21 ST25的处理来进行固定码本搜索(ST15)。
在ST21,对各个子帧进行立体声信号的比较,而判断L声道和R声道的 相似性,即声道间的相似程度。
在ST22,进行立体声信号的分类,判断信号的特性。
在ST23,基于声道间的相似程度和立体声信号的特性,对L声道和R 声道,各自分配所需数目的脉沖。
在ST24,执行AMR-WB语音编码的脉沖搜索,决定对各个声道的脉冲 位置。
在ST25,将在ST24所决定的脉沖,作为码字组进行编码,并作为语音 比特流中的参数之一的码本索引,发送到语音解码装置。
下面,使用图4更详细地说明图3所示的处理流程。特别对脉沖分配(ST23) 进4亍i羊细的i兌明。
在ST301,对各个子帧的L声道和R声道进行比较。通过该比较,在进
多少程度的相似性)。在判断相似程度时,可利用相互相关、在时域中的信号 包络的比较、在频域中的频语信号或频语能量的比较以及中侧(Mid-Side)运算等。
在ST302,在L声道和R声道非常相似时(例如,相互相关值大于阈值时), 或者在L声道和R声道相同时(也就是单声道信号时),双方声道使用共同的 脉沖组。也就是说,在ST303,将对L声道的脉沖数Num—Pulse(L)设定为P, 将对R声道的脉冲数Num—Pulse(R)设定为0。或者相反地,将对L声道的脉 沖数Num—Pulse(L)设定为0,将对R声道的脉沖数Num—Pulse(R)设定为P。 例如,AMR-WB语音编码的模式8时,设定为P=24。图5A表示在ST303 设定Nun^Pulse的情况。在此例中,P=24。因为对L声道或R声道的任意一 方分配全部的,24个脉沖,所以如图6A所示,对双方声道^[吏用p 。 ~ p 23
的共同的一个脉沖组。以下将图6A所示的脉沖分配的类型称为"类型0"。
在ST302,在L声道和R声道不相似时(例如,相互相关值为阈值以下时), 在ST304进行信号的分类判断,并确认在L声道或R声道中是否存在"稳定 有声,,信号。L声道信号或R声道信号在具有周期性且稳定时,被判定为"稳 定有声",而在不具有周期性且不稳定时,被判定为其它类型的信号。在L声 道或R声道的任何一方为"稳定有声"时,进至ST305,而在L声道和R声道 都不是"稳定有声"时,进至ST310。另外,在判断信号是否为"稳定有声"时, 可利用基于自相关方法的自相关值运算、基音预测增益、自适应码本增益等 等。另外,也可使用各个声道的能量电平或信号电平等,来判断是否为"稳定 有声"。
在ST305,如果L声道和R声道都被判断为"稳定有声"(具有稳定性且周 期性的),则该双方声道各自具有脉冲组。也就是说,此时,在ST306,将P 个(P二24)脉沖分配给L声道和R声道,将对L声道的脉冲数Num—Pulse(L)设 定为脉冲数K,P,而将对R声道的脉冲数Num—Pulse(R)设定为脉沖数(l-K,)P。 这里,假设K产1/2。也就是说,对双方声道分配相等数目的脉沖。图5B表 示在ST306设定Num—Pulse的情况。因为以图5B所示的方式设定NumJPulse, 所以将P二24个脉沖均等地对两个声道各分配12个。因此,如图6B所示, 对各个声道使用不同的脉沖组。但是,各个脉冲组所包含的脉冲数是同数(这 里是12个)。以下将图6B所示的脉冲分配的类型称为"类型1"。
另外,在图6B中,脉沖p^的ch表示该脉冲所属的声道(L声道或R声 道),i表示该脉冲的位置。在图6C和图6D中也是一样。
在ST305 ,如果判断为 一方的声道是"稳定有声",但另 一方的声道不是"稳 定有声",则不在双方声道间均等地分配脉沖数P。此时,脉冲数的分配,基 于哪一方的声道需要更多的脉冲而进行。 一般而言,"稳定有声,,的声道只需 要较少数目的脉沖,因此,对"稳定有声"的声道分配较少数目的脉沖。这是 因为,对于"稳定有声"的声道,自适应码本能够有效地发挥功能而生成声源 信号,因而固定码本搜索只需要较少数目的脉冲。
也就是说,在ST307,在判断L声道是"稳定有声",R声道不是"稳定有 声"时,在L声道只需要较少数目的脉冲,因此,与R声道相比,对L声道 分配较少数目的脉冲。即,在ST308,将对L声道的脉冲数Num—Pulse(L)设 定为脉沖数K2P,而将对R声道的脉冲数Num—Pulse(R)设定为脉沖数(l-K2)P,
将P个(P二24)脉沖分配给L声道和R声道。这里,々支设K2=l/3。由此,对L 声道分配8个脉沖,对R声道分配16个脉沖,与R声道相比,对L声道分 配较少数目的脉沖。
另一方面,在ST307,在判断L声道不是"稳定有声",而R声道是"稳定 有声"时,与L声道相比,对R声道分配较少数目的脉沖。即,在ST309,将 对L声道的脉沖数Nun^Pulse(L)设定为脉沖数(l-K2)P,而将对R声道的脉沖 数Num—Pulse(R)设定为脉沖数K2P,对L声道和R声道分配P个(P:24)脉冲。 这里,与上述同样地,假设K^1/3。由此,对R声道分配8个脉沖,对L声 道分配16个脉沖,与L声道相比,对R声道分配较少数目的脉沖。
图5C和图5D表示在ST308和ST309,设定Num_Pulse的情况。因为 P=24iLK2=l/3, Nmr^Pulse成为8个脉冲(图5C)和16个脉冲(图5D)。因此,
以下将图6C所示的脉冲分配的类型称为"类型2",将图6D所示的脉沖分配 的类型称为"类型3"。在类型2,与R声道相比,对L声道分配较少数目的脉 冲,在类型3,与L声道相比,对R声道分配较少数目的脉冲。这样,在类 型2和类型3,对L声道和R声道不均等地分配24个脉沖。
在ST304,如果L声道和R声道都不是"稳定有声",则基于各个声道的 最大自相关系数(MAF: Maximum Autocorrelation Factor)来决定脉冲分配。通 过式(1)来定义MAF。在式(l)中,x(n)(n=0,...,N-l )是对L声道或R声道的 编码对象子帧的MAF的计算对象区间的输入信号,N是该计算对象区间的区 间长度(样本数),T是延迟。另外,作为x(n),可使用LPC残差信号以代替输 入信号,该LPC残差信号使用LPC逆滤波器而求得的。
在ST310,在L声道的MAF大于R声道的MAF时,在ST312,与ST308 同样地,将对L声道的脉沖数Num—Pulse(L)设定为脉沖数K2P,而将对R声 道的脉沖数Num—Pulse(R)设定为脉冲数(1 -K2)P ,对L声道和R声道分配P 个(P3W脉沖。这里,假设K产l/3。也就是说,对L声道分配8个脉沖,对 R声道分配16个脉沖,与R声道相比,对L声道分配较少数目的脉沖。因此, 脉沖分配的类型为类型2(图6C)。
…式(1)
另一方面,在ST310,R声道的MAF为L声道的MAF以上时,在ST311, 与ST309同样地,将对R声道的脉沖数Nun^Pulse(R)设定为脉冲数K2P,而 将对L声道的脉冲数Num—Pulse(L)设定为脉冲数(l-K2)P,对L声道和R声道 分配P个(P-24)脉沖。这里,与上述同样地,假设K尸1/3。也就是说,对R 声道分配8个脉冲,对L声道分配16个脉冲,与L声道相比,对R声道分 配较少数目的脉沖。因此,脉冲分配的类型为类型3(图6D)。
在ST303、 ST306、 ST308、 ST309、 ST311和ST312,如上述决定对各 个声道分配的脉沖数后,在ST313,对各个声道进行脉沖位置的搜索。
然后,在搜索出L声道和R声道的两个声道的脉沖位置后,在ST314, 使用在ST313所搜索出的脉沖来生成码字组,在ST315生成对各个声道的码 本索引。
另外,在ST304中,对于L声道和R声道都不是"稳定有声,,时的脉沖分
配,也可以不是如上述这样基于各个声道的MAF决定,而是对各个声道总是 分配相等数目的脉沖。
这里,如上述在将K,和K2设为固定值时,基于脉冲分配的4个类型(类 型0 "唯一地决定分配给各个声道的脉冲数,因此向语音解码端通知对各个 声道分配了的脉冲数时,如图7所示,有两个比特就足够。也就是说,将类 型0(对L声道和R声道共同地分配24个脉冲的情况)设为码字'00,,将类型 l(对L声道和R声道各分配12个脉冲的情况)设为码字'01',将类型2(对L 声道分配8个脉沖,对R声道分配16个脉冲的情况)设为码字'10',将类型 ^对L声道分配16个脉冲,对R声道分配8个脉沖的情况)设为码字'ir,并 通知给语音解码端。
图8表示在语音解码端的处理流程。
在S1701,从比特流提取处于对脉沖数据进行了量化的状态的码本索引。 另外,从比特流提取表示脉冲分配的类型的上述2比特的信息。
在S1702,基于上述2比特的信息,并参照上述图7所示的表,判断脉 沖分配的类型。
在ST7(B,在脉沖分配的类型是类型0时,进至ST704,而在是类型1 3 时,进至ST707。
在脉沖分配的类型是类型0时,由两个声道共同使用同一码本。也就是 说,在ST704,将全部的P二2々个脉沖都设定给预先决定的一方的声道(规定
声道),并在ST705,对于该规定声道,将P二24个脉冲解码。然后,在ST706, 将在ST705所解码的脉沖复制到另一方的声道。
另一方面,在脉沖分配的类型是类型1 3时,基于各个类型,设定对各 个声道的脉沖数。即,在类型1时,对L声道和R声道分别设定U个脉冲, 在类型2时,对L声道设定8个脉冲,对R声道设定16个脉冲,在类型3 时,对L声道设定16个脉沖,对R声道设定8个脉冲。
假设规定声道是L声道,则在ST707设定对L声道的脉沖数PL,在ST708 设定对R声道的脉冲数pr。然后,在ST709,将Pt个脉冲作为对L声道的 码本数据解码,在ST710,将pr个脉沖作为对R声道的码本数据解码。
另夕卜,在规定声道为R声道时,处理流程成为ST708、 ST707、 ST710、 ST709的次序。
这样,根据本实施方式,基于声道间的相似程度和各个声道的特性(周 期性和稳定度)而决定脉沖数的分配,因此能够对各个声道分配最适合的数 目的脉沖。
(实施方式2)
在本实施方式中,基于语音信号的特性而决定K,、 K2,并使各个声道间 的脉冲分配自适应地变化。例如,能够基于各个声道的语音信号的周期性和 MAF而求对各个声道的脉冲数的分配比例。
例如,在L声道和R声道的双方都是"稳定有声,,时,通过式(2)来求K,。 K,
r'+r" …式(2)
在式(2)中,化、Tr分別是L声道的基音周期和R声道的基音周期,a,是 用于微调K,的系数。根据式(2),能够对具有越短的基音周期的,即越高的基 音的声道,分配越多的脉沖。
另外,在一方的声道是"稳定有声",另一方的声道不是"稳定有声,,时, 通过式(3)来求K2。
<formula>formula see original document page 10</formula>…式(3)
在式(3)中,Cuv为不是"稳定有声"的一方的声道的MAF, C。 Cr分別是 L声道的MAF和R声道的MAF, (12是用于微调K2的系数。根据式(3),能 够对"稳定有声"的声道,分配较少数目的脉冲。<formula>formula see original document page 11</formula> …式(4)
另外,在式(3)中,卩是使"稳定有声,,的声道确实具有至少为最小数的脉 冲的参数,通过式(4)来定义。
<formula>formula see original document page 11</formula>
在式(4)中,L是一个帧内的样本数,Tch是"稳定有声"的声道的基音周期, P是子帧内的总脉沖数。因此,比例IAch基本上是一个帧内的周期数。例如, 假设L为256、 Kh为77,则比例IAch(—个帧内的周期数)成为4。由此,在
各个基音周期确实存在至少一个脉冲。
基于式(2) (4)所求出的Kj和K2 ,用于对L声道和R声道的脉冲数的分 配。被分配到L声道和R声道的脉冲数可取满足式(5)和式(6)的条件的最小值 MIN—PULSE和最大值MAX—PULSE 。
MIN—PULSE ^ Num—Pulse(channel) ^ MAX—PULSE ...式(5) Num—Pulse(L) + Num—Pulse(R) = TOTAL—PULSE ...式(6)
在式(5)和(6)中,MIN_PULSE和MAX_PULSE是对特定的声道的每个子 帧所能分配的脉冲数的最小值和最大值,TOTAL—PULSE是对双方声道的每 个子帧所能分配的合计的脉冲数。例如,典型的值是MIN—PULSE=4、 MAX—PULSE=20、 TOTAL—PULSE=24 。另外,还可以将所计算出的脉沖数 取整为1、 2或4的倍数中,最接近的倍数值。
道分配了的脉冲数通知给语音解码端。但是,对一方的声道的分配数,通过 从两个声道的所有脉冲数减去另一方的声道的分配数而能够导出,因此,将 任意一方的声道定为规定声道,并仅通知该规定声道的分配数即可。例如, 将L声道定为规定声道,通知对L声道的脉沖数Num一Pulse(L),并通过式(7) 来求对R声道的脉沖数Num—Pulse(R)。
Num—Pulse(R) = TOTAL PULSE - Num—Pulse(L) ...式(7) 以下示出对规定声道的脉沖数的通知方法。
在对各个声道的脉冲数为4的倍数时,对规定声道的脉冲数有4个脉冲、 8个脉冲、12个脉沖、16个脉冲、20个脉沖的5个可能性。因此,为了区别 这5个脉冲数,有3比特就足够。另外,在对各个声道的脉冲数为2的倍数 时,对规定声道的脉沖数有4个脉冲、6个脉冲、8个脉冲、10个脉沖、12 个脉沖、14个脉冲、16个脉冲、18个脉冲、20个脉冲的9个可能性。因此,
为了区别这些9个脉冲数,需要4比特。再者,对各个声道的脉沖数为从4 到20的按一个个脉冲递增的数目时,有17个可能性,因此为了区别17个脉 沖数,需要5比特。由此,能够将这些脉冲数总结为图9所示的表。在语音 编码端,参照该表将脉冲数变换成3 5比特的码字并通知,在语音解码端, 同样地参照该表,从所通知的码字导出对各个声道分配的脉沖数。 图IO表示在语音解码端的处理流程。
在ST901,从比特流提取处于对脉沖数据进行了量化的状态的码本索引。 另外,从比特流提取表示脉冲数的码字(3 5比特)。
在ST902,基于表示脉冲数的码字,并参照上述图9所示的表,判断规 定声道的脉沖数。这里,假设规定声道是L声道。
在ST903,通过式(7)来计算另一方的声道,即R声道的脉沖数。
在ST904,在任何一方的声道的脉沖数为0时,进至ST905,在除此之 外的情况下,进至ST卯7。
在任意一方的声道的脉冲数为0时,由两个声道共同使用同一码本。也 就是说,在ST905,将全部P^24个脉沖都设定给规定声道,并对于该规定声 道,将P二24个脉冲解码。然后,在ST906,将在ST905所解码的脉冲复制到 另一方的声道。
另一方面,在ST907,参照上述图9所示的表设定对L声道0见定声道) 的脉冲数PL,将PL个脉冲作为对L声道的码本数据进行解码。并且,在ST908, 通过式(7)设定对R声道的脉冲数PR,将PR个脉冲作为对R声道的码本数据解码。
另外,在失见定声道是R声道时,处理流程成为ST908、 ST907的次序。 这样,根据本实施方式,基于语音信号的特性而决定K,和K2,使各个
声道间的脉沖分配自适应地变化,因此,能够在声道间进行更加灵活且正确
的脉冲数的分配。
另外,在上述各个实施方式中,假设对各个声道分配的合计的脉沖数为 固定(在上述各个实施方式中,固定为P-24个)而进行说明,但也可以使对各 个声道分配的合计的脉沖数,基于声道间的相似程度和各个声道的特性(周期 性和稳定度)而变化。例如,在实施方式l,在脉冲分配的类型为"类型0"时, 即,在L声道和R声道非常相似时(例如,在相互相关值大于阈值时),或者, 在L声道和R声道相同时(也就是单声道信号时),可以将少于其它类型的合
计的分配脉冲数(在上述各个实施方式中,P^24个)的^t目的脉沖,只分配纟会
R声道或L声道的任意一方。由此能够更加提高传输效率。
另外,上述各个实施方式的处理流程,可在语音编码装置和语音解码装 置中实施。另外,还可以将该语音编码装置和语音解码装置,装载于在移动 通信系统中所使用的无线通信移动台装置和无线通信基站装置等无线通信装置。
另外,上述实施方式的处理流程,通常被作为集成电路的LSI来实现。 这些既可以被单独地集成为一个芯片,也可以一部分或全部被集成为一个芯片。
虽然此处称为LSI,但根据集成程度,可以被称为IC、系统LSI、超大 LSI(Super LSI)、或特大LSI(Ultra LSI)。
另外,实现集成电路化的方法不仅限于LSI,也可使用专用电路或通用 处理器来实现。也可以使用在LSI制造后,可编程的FPGA(Field Programmable Gate Array),或者可重构LSI内部的电路单元的连接和设定的可重构处理器。
出现替代LSI集成电路化的新技术,当然可利用新技术进行功能块的集成化。 还存在着适用生物技术等的可能性。
本说明书是根据2005年2月10日申请的日本专利申请第2005-034984
号。其内容全部包含于此。
工业实用性
本发明可适用于移动通信系统或使用因特网协议的分组通信系统等中的 通信装置。
权利要求
1.一种脉冲分配方法,该脉冲分配方法为在对立体声信号的语音编码中,进行固定码本搜索时所使用的脉冲分配方法,基于立体声信号的各个声道的特性和各个声道间的相似程度,决定分配给各个声道的脉冲数。
2. 如权利要求1所述的脉冲分配方法,在所述相似程度为阈值以上时,对任意一方的声道分配所有的脉沖。
3. 如权利要求1所述的脉冲分配方法,基于各个声道的稳定度、周期性和最大自相关系数中的至少一个,判断 所述特性。
4. 如权利要求3所述的脉沖分配方法,对所述稳定度、所述周期性和所述最大自相关系数越大的声道,分配越 少的脉冲数。
5. 如权利要求1所述的脉冲分配方法, 在各个声道的特性相等时,对各个声道均等地分配脉沖数。
6. 如权利要求1所述的脉冲分配方法,将表示已分配给各个声道的脉冲数的码字,通知给语音解码端。
全文摘要
能够对立体声语音信号高效率地进行编码的脉冲分配方法。在该脉冲分配方法的固定码本搜索(ST21~ST25)中,对各个子帧进行立体声信号的比较,判断声道间的相似性(ST21),判断立体声信号的特性(ST22),基于声道间的相似性和立体声信号的特性,决定对各个声道分配的脉冲数(ST23),进行脉冲搜索并决定对各个声道的脉冲位置(ST24),并对在ST24所决定的脉冲进行编码(ST25)。
文档编号G10L19/00GK101116137SQ20068000453
公开日2008年1月30日 申请日期2006年2月9日 优先权日2005年2月10日
发明者吉田幸司, 后藤道代, 张峻伟, 梁世丰 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1