解码方法和设备的制作方法

文档序号:7598338阅读:174来源:国知局
专利名称:解码方法和设备的制作方法
技术领域
本发明涉及解码被可选择地保护免于传输路径中产生的差错的编码参数的方法和设备,以及程序装备介质。
背景技术
已经公开了许多编码方法用于通过在包含话音和声信号的音频信号的时域和频域上采用静态特性,和人的心理声学特性执行信号压缩。作为这些编码方法,在所谓的CELP(编码激励线性预测)编码系统下分类的VSELP(矢量和激励线性预测)编码系统或PSI-CELP(音调同步创新-CELP),将注意力吸引到低比特率话音编码系统。
在波形编码系统中,例如这种CELP编码系统,输入话音信号利用该输入话音信号的预置的多个采样形成块或帧作为编码单元,并且通过利用在基于块或帧的时域语言波形上的综合方法分析执行最佳矢量的闭环查找以便执行波形的矢量量化从而输出矢量索引。
同时,利用具有低的比特率,诸如2kbps或4kbps的话音编码系统获得的编码位,被广泛用于通信、计算机或广播作为不受特定音频信息内容限制的一般音频。因而,需要强有力地保护这些编码位使其免于传输路径上产生的差错。
如果在传输路径上接连产生差错,则在话音解码中会长时间接连出现声音漏失,因此降低了话音质量。
本发明已经在日本待审专利H-11-122120中阐明,一种有效免除传输路径上出现的差错以便可观地提高声音质量的编码方法和设备以及一种解码方法和设备。
在这个编码方法和设备中,输入话音信号在时间轴上被分为每个预置编码单元和从一个编码单元向下一个编码单元编码以便输出多种编码话音参数。在这些多种编码话音参数中,选择心理声学决定性位组并且从这个决定性位组中,产生一个差错检验码。这个差错检验码和该决定性位组要进行卷积编码以保护该心理声学决定性位组使其免于传输路径上出现的差错。
为了解码在卷积编码该差错检验码和决定性位组中和在合并成除该决定性位组以外的位组中产生的、发送编码数据,该解码方法和设备利用卷积解码处理该卷积编码的输出,卷积解码加入该差错检验码的决定性位组,和除该决定性位组之外的该位组,输出卷积解码输出,利用加到该卷积解码输出的差错检验码检验传输差错,根据差错检验的结果调整该卷积解码输出并且利用话音解码处理该调整过的卷积解码输出,因此使话音解码能够抑制由于传输路径上出现的差错带来的声音质量的降低。
同时,在上述的解码方法和设备中,当利用附加干卷积解码输出的差错检验码响应关于传输差错的差错检测结果调整解码的输出时必须保持话音解码之后的话音信号的信号连续性。

发明内容
因此本发明的一个目的是提供一种解码方法和设备,借此保持话音信号的信号连续性使能够高质量地话音解码。
在一个方面,本发明提供一种解码设备,用于解码相应于输入话音信号的发送的编码参数,该输入话音信号已经通过编码设备从按照时间轴的一个预置编码单元到另一个预置编码单元编码并且该输入话音信号已经根据对传输路径差错的心理声学敏感性位分类,其中该解码设备包括传输路径解码装置用于使用附加到预置分类的编码参数的差错检验码检测差错和根据在该编码单元产生的编码参数中的差错提供不同的帧屏蔽(masking)处理。
优选地,编码设备中的编码处理使用多个矢量量化器执行,表示每个编码矢量的索引根据相对传输路径差错的心理声学敏感性位分类并且在这个分类状态下传输。传输路径解码装置检测附加到一个预置分类的索引中的差错检验码以便根据在该编码单元产生的索引差错提供不同的帧屏蔽处理。
优选地,使用通过交替学习准备的多级矢量量化器执行编码设备中的编码处理,并且表示每个编码矢量的索引根据相对传输路径差错的心理声学敏感性位分类并且在这个分类状态下传输。传输路径解码装置检测加到一个预置分类的索引中的差错检验码以便根据在多个索引中是否检测到差错提供不同的帧屏蔽处理。
其中,在该编码设备中的编码处理是对利用一个通过交替学习的两级矢量量化器量化和传输话音频谱信息的编码处理,并且其中所述传输路径解码装置执行帧屏蔽处理,当表示由两个矢量量化器输出的编码矢量的索引同时出错时抑制低范围。
根据本发明的另一方面,提供一种解码设备,用于解码相应于输入话音信号的发送的编码参数,该输入话音信号已经由编码设备从时间轴上的一个预置编码单元编码到另一个预置编码单元,并且,该输入话音信号已经根据对传输路径差错的心理声学敏感性位进行了分类,该解码设备包括传输路径解码装置,用于使用附加到预置分类的所述编码参数的差错检验码来检测差错和根据在所述编码单元产生的编码参数中的差错来提供不同的帧屏蔽处理,其中,在时间轴上作为预置编码单元的一个或多个连续的帧中检测到差错以后,如果接收到第一正常帧,则该传输路径解码装置执行抑制信号电平的帧屏蔽处理,该第一正常帧是有声的和在差错出现之后的最后一个正常帧是无声的。
在本发明的解码方法和设备中,能够保持话音信号的连续性以便解码高声音质量的话音。


图1是表示体现本发明的便携式电话机设备结构的方框图;图2是表示构成便携式电话设备的话音编码器的基本结构的方框图;图3是表示该话音解码器的详细结构的方框图;图4示出比特率为2kbps和4kbps所共有的参数;图5示出仅适合4kbps的参数;图6示出具有2kbps比特率的有声话音参数的分类划分;图7示出具有2kbps比特率的无声声音参数的分类划分;图8示出具有4kbps比特率的有声话音参数的分类划分;图9示出具有4kbps比特率的无声声音参数的分类划分;图10示出对于具有2kbps比特率的信道编码器的有声话音参数的输入序列;图11示出对于具有2kbps比特率的信道编码器的无声声音参数的输入序列;图12示出对于具有4kbps比特率的分类I比特信道编码器的有声话音参数的输入序列;图13示出对于具有4kbps比特率的分类II到V比特信道编码器的有声话音参数的输入序列;图14示出对于具有4kbps比特率的分类VI和分类VII比特信道编码器的有声话音参数的输入序列;图15示出对于具有4kbps比特率的分类I比特信道编码器的无声声音参数的输入序列;图16示出对于具有4kbps比特率的分类II到V比特信道编码器的无声声音参数的输入序列;图17示出对于具有4kbps比特率的分类VI和分类VII比特信道编码器的无声声音参数的输入序列;图18示出2kbps的有声话音的分类I到VI和2kbps的有声话音的分类II到VII的比特指定;图19示出说明构成便携式电话设备的传输路径解码器操作的状态转换;图20示出在等式(7)中使用的插值系数P的值;图21说明用于控制响应状态变量state值的输出话音的音量的静噪变量mute的设置;图22示出在等式(10)中使用的值s[i];图23是表示话音解码器基本结构的方框图;图24是表示话音解码器详细结构的方框图;图25是说明由便携式电话设备执行的编码方法的流程图;图26是说明由便携式电话设备执行的解码方法的流程图;图27是可以应用本发明的传输系统的方框图;图28是构成上面的传输系统的服务器的方框图;图29是表示构成该传输系统的客户终端的方框图。
具体实施例方式
参见附图,将详细说明本发明的优选实施例。该说明的实施针对例如图1所示的具有作为本发明的解码方法和设备的具体例子的解码设备的一种便携式电话设备。该便携式电话设备还包括一个编码器设备用于利用如2或4kbps的低比特率对话音编码。
该编码设备将输入话音信号在时间轴上分成每个编码单元并且从一个编码单元到另一个编码单元编码将该话音信号以便产生多种话音编码参数。比特根据对话音编码参数的传输路径差错的心理声学敏感性位分配给多个保护分类。例如,如果比特率是2kbps或4kbps,则该比特分别分配给6和7类。分类分配和话音编码参数将随后详细说明。
首先,本便携式电话设备的编码设备包括一个话音编码器3,一个分类划分和输入序列判定单元23和一个传输路径编码器4。话音编码器3根据预置的编码单元在时间轴上划分该输入话音信号并且对该输入信号进行每个编码单元编码以便输出多种话音编码参数。如果比特率分别是2kbps或4kbps,则该分类划分和输入序列判定单元23在判定该比特输入序列到达下一级的传输路径编码器4的同时,根据对传输路径差错的心理声学敏感性位,将来自话音编码器3的多种话音编码参数分成6和7类。传输路径编码器4根据由分类划分和输入序列判定单元23获得的分类及该比特输入序列,产生CRC(循环冗余校验)码,并且将该CRC码提供给该比特。传输路径编码器4对该比特除采用CRC码以外有时采用卷积编码作为保护。传输路径编码器4有时不执行保护。
分类划分和输入序列判定单元23包括一个比特控制器23a和RAM23b。比特控制器23a在判定该比特输入序列的同时,使用AM23b作为工作区根据对传输路径差错的心理声学敏感性位将来自话音编码器3的该多个话音编码参数分类。
传输路径编码器4包括一个CRC码计算单元5和一个卷积编码器6。CRC码计算单元5产生CRC(循环冗余校验)码。卷积编码器6有时对已经加入CRC码计算单元5中的CRC码的比特组采用卷积编码。传输路径编码器4有时只将该比特组输出到已经加入CRC码计算单元5的CRC码的比特组。传输路径编码器4还在不执行其中任何处理的情况下根据该分类发送该比特组。
在该便携式电话设备中,采用根据本发明的解码方法和设备的解码设备,包括一个卷积解码器16,适于卷积解码具有仅在其上附加纠错码的该决定性位组,和除该决定性位组之外的比特组,并且用于输出该卷积解码的结果,和一个CRC码比较器-帧屏蔽单元15用于将加到卷积解码器16的卷积解码输出的CRC码与从除该决定性位组以外的比特组计算的CRC码作比较以便判断卷积解码输出。该解码设备还包括一个话音解码器17用于对CRC码比较器-帧屏蔽单元15的卷积解码输出进行话音解码。
在本便携式电话设备中,在话筒1的传输中输入的话音信号,由A/D变换器2变换成数字信号,接着该信号由话音编码器3编码为2kbps/4kbps低比特率的编码参数。这些编码的参数由分类划分和输入序列判定单元23处理用于分类和输入序列判定。来自分类划分和输入序列判定单元的参数被发送到传输路径编码器4,此处该参数被编码从而传输路径的质量不太易于影响话音质量。接着该编码的参数被调制器7调制并且因此处理成输出比特,该输出比特通过来自天线10的天线-共同用户9发送。
在接收中,由天线10捕获的电波,由接收机11通过天线共同用户9接收并且由解调器13解调以便接着由话音编码器17纠正传输差错并且由D/A变换器18变换成在扬声器19输出的模拟话音信号。
控制器20在合成器12将发送/接收频率给予发送机8和接收机11的同时控制上述提到的可变部分。使用键盘21和LCD指示器22作为人机接口。
在上述的便携式电话设备中,构成传输路径编码器4的CRC码计算单元5,选择部分或全部线谱对(LSP)参数,这些参数一般定义被分类的并且具有其在该分类划分和输入序列判定单元23中确定的输入序列的话音信号的频谱形状,表示话音信号是有声的(V)还是无声的(UV)的所有的有声的(V)/无声的(UV)判定参数,当话音信号是有声声音时的部分或所有的音调参数,当话音信号是有声声音时的表示线形预测编码(LPC)的残余信号的频谱包络的部分或全部频谱代码本索引和增益索引,和当话音信号是无声声音时的线形预测编码(LPC)的残余信号的部分或全部的噪声代码本索引和增益代码本索引,以便从其中产生CRC码。
这些话音编码参数在话音编码器3中获得。由话音编码器3执行的话音编码方法,包括用于发现输入话音信号的短预测残余的短预测残余计算步骤,正弦波分析和编码计算的短期预测误差的正弦波分析编码步骤,和由波形编码对输入话音信号编码的波形编码步骤。现在参见图2和3说明这个话音编码器3。
图2的话音编码器3的基本原理在于采用第一编码单元110,用于发现短期预测误差,例如输入话音信号的LPC(线形预测编码)残余,以便执行正弦分析编码,例如谐波编码,和第二编码单元120,用于利用关于该输入话音信号的波形编码显示阶段可重现性对输入话音信号编码,并且在于采用第一编码单元110和第二编码单元120,用于分别对该输入话音信号的有声(V)部分和无声(UV)部分编码。
第一编码单元110在LPC残余上采用执行正弦分析编码的结构,例如谐波编码或多波段激励(MBE)编码。第二编码单元120例如通过合成方法分析闭环查找最佳矢量,使用采用矢量量化的代码激励线形预测(CELP)编码结构。
在图2的例子中,发送到输入终端101的话音信号被发送到第一编码单元110的LPC反向滤波器111和LPC分析量化单元113。从LPC分析量化单元113得到的LPC系数,或所谓的α-参数,被发送到,恢复该输入话音信号的线形预测残余(LPC残余)的反向滤波器111。从LPC分析量化单元113中,取出LSP(线谱对)的量化输出并且发送到一个输出终端102。来自LPC反向滤波器111的LPC残余被发送到适于执行音调检测,计算频谱包络幅度和利用V/UV(有声/无声)判定单元115的V/UV判定的正弦分析编码单元114。来自正弦分析编码单元114的频谱包络幅度数据被发送到矢量量化单元116。作为频谱包络的矢量量化输出的来自矢量量化单元116的代码本索引通过开关117发送到输出终端103。正弦分析编码单元114的输出通过开关118发送到输出终端103。来自V/UV判定单元115的V/UV判定输出在被另外发送到开关117,118作为因此的控制信号的同时还发送到输出终端105,使得,如果输入话音信号是有声的(V),则选择并分别在输出终端103,104取出索引和声调。
图2的第二编码单元120具有一个代码激励线形预测(CELP)编码结构并通过一个闭环查找方法执行时域波形的矢量量化,该闭环查找方法特征在于利用一个加权合成滤波器合成噪声代码本121的输出,将产生的加权话音发送到减法器123以便从加到输入终端101的话音中取出误差并且通过一个音质加权滤波器125传送,并且在于发送该误差给距离计算电路124以便计算距离和查找将最小化该误差的矢量。该CELP编码用于将该无声话音编码为代码本索引,作为来自CELP编码的UV数据通过开关127在输出终端107取出,该开关当来自V/UV判定单元115的V/UV判定结果表示无声(UV)声音时被打开。
图3示出话音编码器3的更为详细的结构。在图3中,相应于图2中的部件或单元由相同的标号表示。
在话音编码器3中,如图3所示,加到输入终端101的话音信号由一个高通滤波器(HPF)109滤波以便消除不需要的频率范围的信号。该滤波的输出被发送到LPC(线形预测编码)分析量化单元113的LPC分析电路132和LPC反向滤波器111。
LPC分析量化单元113的LPC分析电路132采用具有大约256个采样作为一块的输入信号波形长度的汉明窗,以便通过自动纠错方法发现线形预测系数,这是所谓的α-参数。作为数据输出单位的成帧间隔大约是160个采样。利用采样频率fs,例如8kHz,帧间隔是160个采样或20毫秒。
来自LPC分析电路132的α-参数被发送到α-LSP变换电路133用于变换线谱对(LSP)参数。这将发现作为直线型滤波器系数的α-参数变换为例如10,即5对LSP参数。这个变换例如通过牛顿-亥普森方法。进行变换为LSP参数的原因是LSP参数在对α-参数的插值特性方面优越。
来自α-LSP变换电路133的LSP参数是由LSP量化器134矩阵-量化或矢量-量化的。在这种情况下,帧内插值在矢量量化之前进行,或多个帧放在一起并且进行矩阵量化。这里,一帧20毫秒,每20毫秒计算的两个LSP参数帧,被放在一起并且进行矩阵量化和矢量量化。
在终端102取出LSP量化器134的量化输出,即LSP量化的索引,同时该量化的LSP矢量被发送到LSP插值电路136。
LSP插值电路136每20毫秒或每40毫秒内插LSP矢量,以便提高采样率8倍系数,从而LSP矢量将每2.5毫秒更新一次。原因是,如果残余波形是由谐波编码/解码方法分析-合成的,则该合成波形的包络特别光滑,使得,如果LPC系数特别快地变化,则趋向产生无关声音。即,如果LPC系数只逐渐每2.5毫秒改变,则可以防止产生这种无关声音。
对于如果输入话音使用基于2.5毫秒插值的LSP矢量时执行反向滤被,LSP参数由LSP-→α变换电路137变换为作为具有大约10倍数量级的直型滤波器系数的α-参数。LSP-→α变换电路137的输出发送到LPC反向滤波电路111,此处以每2.5毫秒更新的α-参数执行反向滤波以便实现光滑输出。LPC反向滤波电路111的输出发送到正交变换电路145,例如正弦分析编码单元114的离散傅立叶变换电路,具体地说,一种谐波编码电路。
来自LPC分析量化单元113的LPC分析电路132的α-参数发送到音质加权滤波器计算电路139,此处发现对于心理声学敏感性的数据。这个加权数据发送到音质加权矢量量化单元116,第二编码单元120的音质加权滤波器125,和音质加权合成滤波器122。
在正弦分析编码单元114中,例如谐波编码电路,由谐波编码方法分析LPC反向滤波电路111的输出。即,正弦分析编码单元114检测音调,计算每个谐波幅度Am和执行V/UV鉴别。这个正弦分析编码单元114还在尺寸上将随音调改变的变换幅度Am或谐波包络的个数变换成常数。
在正弦分析编码单元114的具体例子中,如图3所示,预先假定常规谐波编码。特别是,在多频带激励(MBE)编码中,假设有声部分和无声部分出现在一个并行时间的每个频率范围或频带,即在相同的块或帧中,执行建模。在谐波编码的其它形式中,关于在一块或帧中的话音是有声还是无声进行一个可选判定。在下面的说明中,帧基础上的V/UV意味着在采用MBE编码的情况下当整个频带是UV时一个给定帧内的V/UV。同时,由本受让人提出的日本未审专利H-5-265487,公开了一个利用MBE分析方法合成的具体例子。
一个来自输入终端101的输入信号馈入图3的正弦分析编码单元114的开环音调查找单元141,同时一个来自高通滤波器(HPF)109的信号馈入一个过零计数器142。来自LPC反向滤波电路111的LPC残余或线性预测残余馈入正弦分析编码单元114的正交变换电路145。开环音调查找单元141取出该输入信号的LPC残余以便通过取该输入信号的LPC残余执行相对大致的音调查找。取出的大致音调数据发送到一个高精度音调查找单元146,此处执行后面说明的通过闭环的高精度音调查找(好的音调查找)。从开环音调查找单元141中,与大致音调数据一起取出在标准化LPC残余的自相关的最大值中得到的最大的标准化的自相关值r(p),并且发送到V/UV判定单元115。
正交变换电路145执行正交变换处理,例如离散余弦变换(DFT),以便在时间轴上将LPC残余变换为频谱幅度数据。正交变换电路145的输出发送到高精度音调查找单元146和频谱估计单元148。
由开环音调查找单元141取出的相对大致音调的大致音调数据和由开环音调查找单元141取出的频域上的数据馈入高精度(好)音调查找单元146。在这个高精度音调查找单元146中,音调数据以大致音调数据值作为中心,在±几个采样之间摆动,以便接近具有最佳十进制小数点(浮点)的好音调数据值。作为好的查找技术,使用通过合成方法的所谓的分析并且选择音调使得合成的功率谱距正交话音的功率谱最近。来自利用闭环的高精度音调查找单元146的音调数据通过开关118发送到输出终端104。
在频谱估计单元148中,根据作为LPC残余的正交变换输出的音调和频谱幅度估计作为其设置的每个谐波和频谱包络的幅度。估计的结果发送到高精度音调查找单元146,V/UV判定单元115和音质加权矢量量化单元116。
在V/UV判定单元115中,根据正交变换电路145的输出,来自高精度音调查找单元146的最佳音调,来自频谱估计单元148的幅度数据,来自开环音调查找单元141的最大标准化自相关值r(p)和来自过零计数器142的过零值给出所述的帧的V/UV判定。在MBE编码下的基于频带的V/UV判定结果的边界位置还可以用作所述的帧的V/UV判定的条件。通过输出终端105取出V/UV判定单元115的判定输出。
频谱估计单元148的输出或矢量量化单元116的输入具有多个数据变换单元119,它是一种采样速率变换单元。由于考虑到在频域上分开的频带数随音调变化,所以这些数据变换单元用于设置包络的幅度数据|Am|为一个常数并且因此数据数变化。即,如果有效频带可达3400kHz,则这个有效频带根据该音调被分为8到63个频段,使得从频带到频带得到的幅度数据|Am|的个数mMX+1也在从8到63的范围内变化。所以,数据变换单元119的个数将这个数据mMX+1幅度数据变换为一个常数M,例如44。
上述的常数M,例如44,根据预置个数的数据,例如44个数据,将来自在频谱估计单元148的输出和矢量量化单元116的输入提供的数据变换单元的个数的幅度数据和包络数据联系在一起,作为应该进行加权矢量量化的矢量。这个加权由音质加权滤波器计算电路139的输出给予。来自矢量量化单元116的上述包络的索引idS通过开关117在输出终端103输出。同时,采用适当泄漏系数的帧内插值可以作为由在加权矢量量化之前预置个数的数据组成的矢量。
下面说明第二编码单元120。第二编码单元120具有所谓的CELP(代码激励线性预测)并且特别用于编码输入话音信号的无声部分。在这个用于无声话音部分的CELP编码结构中,作为噪声代码本或所谓的随机代码本121的代表输出的相应于无声话音的LPC残余的噪声输出,通过增益电路126发送到音质加权合成滤波器122。加权的合成滤波器122 LPC-合成该输入噪声以便发送产生的加权的无声话音信号到减法器123。减法器被馈入从输入终端101经高通滤波器(HPF)109提供的话音信号,并且该信号已经被音质加权滤波器125音质加权,以便从合成滤波器122取出信号插值或误差。应该注意音质加权合成滤波器122的零输入响应从音质加权滤波器125的输出的开始减去。这个误差发送到距离计算电路124以便进行距离计算以查找由噪声代码本121最小化该误差的代表值矢量。使用依次采用合成方法分析的闭环查找的时域波形被矢量量化。
取出来自噪声代码本121的代码本的形状索引idSI和来自增益电路126的代码本的增益索引idGI作为来自使用CELP编码结构的第二编码单元120的UV(无声)部分的数据。在作为增益电路126的UV数据的增益索引idGI通过开关127g发送到输出终端107g的同时,作为来自噪声代码本121的UV数据的形状索引idSI通过开关127s发送到输出终端107s。
这些开关127s,127g和上述开关117,118都是根据来自V/UV判定单元115的U/UV鉴别结果被开/关控制的。当现在将要发送的该帧的话音信号是无声声音(UV)时打开开关127s,127g的同时,当现在将要发送的该帧的话音信号的V/UV判定结果表示有声声音(V)时打开开关117,118。
由上述话音编码器3输出的参数,即频谱包络的LSP参数LSP,有声/无声鉴别参数VUV,音调参数PCH,代码本参数idS和增益索引idG,噪声代码本参数idSI和增益索引idGI被分为2k/4kbps编码并且分配的比特数也如图4和图5所示的表示。图4示出比特率为2kbps和4kbps所共有的参数,而图5示出仅适合4kbps的参数。图4和图5示出的参数是每帧的参数。
LSP参数被分为LSP0,LSP2,LSP3,LSP4和LSP5。LSP0是10阶LSP参数的代码本索引,并且用作该包络的基本参数。在20毫秒帧中,5比特分配给LSP0。LSP2是用于5阶低频范围纠错的LSP参数的代码本索引并且分配给7比特。LSP3是用于5阶高频范围纠错的LSP参数的代码本索引并且分配给5比特。LSP5是用于10阶全频范围纠错的LSP参数的代码本索引并且分配给8比特。在这些中,LSP2,LSP3和LSP5是用于补偿前级误差的索引并且当LSP0不能够足以表示包络时被另外使用。LSP4是1比特选择标记用于选择编码时的编码模式是直线模式还是差分模式。具体地,它表示以在由量化发现的直线模式的LSP和由量化差分发现的LSP之间的较小LSP差分的模式选择。如果LSP4是0或1,则模式分别直线模式或差分模式。
VUV参数是表示预置的帧中的编码的话音数据是有声或无声(有声/无声)的标记,并且具有两个分配给它的比特。
PCH参数是音调参数,并且是如上所述利用闭环从高精度音调查找单元146查找的音调数据。给这个音调参数分配7比特。
如果频谱包络的代码本参数idS是2kbps,则代码本参数被分为表示为idS0的第零个LPC残余频谱代码本索引和由idS1表示的第一LPC残余代码本索引。第零和第一LPC残余频谱代码本索引是与各个代码本有关的索引。LPC残余频谱由另外两个从此选择的代码本形成。idG是LPC残余频谱增益代码本索引和具有分配给它的比特。如果频谱包络的代码本参数idS是4kbps,则它被分为由idS0-4k表示的第零扩展残余频谱代码本索引,由idS1-4k表示的第一扩展残余频谱代码本索引,由idS2-4k表示的第二扩展残余频谱代码本索引和由idS3-4k表示的第三扩展残余频谱代码本索引。对于idS0-4k,idS1-4k,idS2-4k和idS3-4k,分别分配7,10,9和6比特。
应该注意在利用idS0,idS1和idG得到的量化LPC残余频谱之间的idS0-4k等纠错单元,和纠错范围被从低频范围向idS3-4k的高频范围分配。
残余参数用于无声声音。具体地说,具有SL,例如idSL00或idSL11的参数,指定噪声代码本索引,然而具有GL,例如idGL00或idGL11的参数,表示噪声代码本增益代码本索引。对于idSL00,idSL01,idGL00和idGL01,分别分配6,6,4和4比特,5比特分配给idSL10,idSL11,idSL12和idSL13,而3比特分配给idGL10,idGL11,idGL12和idGL13。
图4和图5所示的参数根据对传输路径误差的心理声学敏感性位被分类划分和输入序列判定单元23分成多个类。
如果传输速率是3.5kbps,比特率是2kbps,则分类划分和输入序列判定单元23将有声声音和无声声音分成例如6类,如图6和图7所示,其中后缀“p”和“c”分别表示前一帧和当前帧。即,这里考虑的是两帧,即前一帧p和当前帧c。分类号码越小,则比特越重要。
参见图6,说明有声话音的情况。以LSP参数的10阶代码本索引LSP0,前一帧p和当前帧c二者的整个5个比特都属于分类I。在LSP参数的5阶低频范围纠错的代码本索引LSP2的前一帧p和当前帧c中,两个比特都属于分类I,剩下的5个比特都属于分类VI。利用LSP参数的5阶高频范围纠错的代码本索引LSP3,前一帧和当前帧c的5个比特之一都属于分类I,剩下的四个比特属于分类VI。利用LSP参数的直接模式/差分模式选择标记LSP4,前一帧p和当前帧c受到分类I的保护。
在前一帧p和当前帧c中有声/无声标记的两个比特由分类I保护。关于音调参数,对于前一帧p和当前帧c,7个比特中的6个属于分类I剩下的1个比特属于分类VI。
LPC残余频谱增益代码本索引idG的5个比特当属于分类I时对于前一帧p和当前帧c都被保护。前一帧p和当前帧c的第零LPC残余频谱代码本索引idS0都属于分类II,但是,当前帧c的第零LPC残余频谱代码本索引idS0都属于分类IV。另一方面,前一帧p的第一LPC残余频谱代码本索引idSI的四个比特都属于分类III,但是当前帧c的第一LPC残余频谱代码本索引idSI都属于分类V。
参见图7,下面说明传输速率是3.5kbps,声音是无声声音,比特率是2kbps的情况。
在用于纠正LSP参数的5阶低频范围差错的代码本索引LSP2中,前一帧p和当前帧c的7个比特的4个属于分类I,残余3个比特属于分类VI。在用于纠正LSP参数的5阶高频范围差错的代码本索引LSP3中,前一帧p和当前帧c的5个比特的2个属于分类I,残余3个比特属于分类VI。对于前一帧p和当前帧c,直接模式/差分模式选择标记利用分类I保护。
对于前一帧p和当前帧c,有声/无声声音标记VUV的两比特利用分类I保护。
对于前一帧p和当前帧c,噪声代码本索引idG00的四个比特利用分类I保护。对于前一帧p和当前帧c,噪声代码本增益代码本索引idG01的四个比特利用分类I保护。对于前一帧p和当前帧c,噪声代码本增益代码本索引idG00的6个比特被设置为分类VI。对于前一帧p和当前帧c,噪声代码本增益代码本索引idG01的6个比特被设置为分类I在这个无声话音中,分类VI的比特部分被保护为从II到V的分类比特。但是,如果检测到差错,则不采取测量,如在其它分类VI的比特的情况一样。
如果比特率是4kbps(传输率是6.2kbps),则分类划分和输入序列判定单元23将有声声音和无声声音分成例如7类,如图8和图9所示。在这些图中,后缀“p”和“c”再次分别表示前一帧和当前帧。即,这里考虑的是两帧,即前一帧p和当前帧c。又是分类号码越小,则比特越重要。
参见图8说明有声话音的情况。在LSP参数的10阶代码本索引LSP0中,前一帧p和当前帧c二者的5个比特都属于分类I。在纠正LSP参数的5阶低频范围差错的代码本索引LSP2中,前一帧p和当前帧c的7个比特中的4个属于分类I,剩下的3个比特属于分类VII。在用于纠正LSP参数的5阶高频范围差错的代码本索引LSP3中,前一帧和当前帧c的5个比特之一都属于分类I,剩下的四个比特属于分类VII。对于前一帧p和当前帧c,LSP参数的直接模式/差分模式选择标记LSP4,利用分类I保护。
对于前一帧p和当前帧c有声/无声标记VUV的两个比特由分类I保护。另一方面,对于前一帧p和当前帧c,音调参数PCH的7个比特中的6个被设置为分类I,剩下的1个比特属于分类VII。
另外,LPC残余频谱增益代码本索引idG的5个比特被设置为分类I并且被保护。另一方面,前一帧p的第零LPC残余频谱代码本索引idS0被设置为分类II,而当前帧c的第零LPC残余频谱代码本索引idS0的所有四个比特被设置为分类V。前一帧p的第一LPC残余频谱代码本索引idSI的四个比特都被设置为分类IV,但是,当前帧c的第一LPC残余频谱代码本索引idSI的四个比特都属于分类III,但是当前帧c的第一LPC残余频谱代码本索引idSI的四个比特都被设置为分类VI另一方面,对于前一帧p和当前帧c,第零扩展LPC残余频谱代码本索引idS0-4k的7个比特的5个被设置为分类I,但是,残余2个比特被设置为分类VII。对于前一帧p和当前帧c,第一扩展LPC残余频谱代码本索引idSI-4k的10个比特的每一个被设置为分类II,但是,残余9个比特被设置为分类II。对于前一帧p和当前帧c,第一扩展LPC残余频谱代码本索引idS2-4k的10个比特之一被设置为分类I,而残余9个比特被设置为分类II。对于前一帧p和当前帧c,第一扩展LPC残余频谱代码本索引idS3-4k的6个比特之一被设置为分类I,而残余8个比特被设置为分类II。而且,对于前一帧p和当前帧c,第三扩展LPC残余频谱代码本索引idS3-4k的6个比特的每一个被设置为分类I,而残余5个比特被设置为分类II。
参见图9,声音是无声声音,具有比特率是4kbps(传输率是6.2kbps)的情况。在LSP参数的10阶代码本索引LSP0中,前一帧p和当前帧c的所有5个比特被设置为分类I。
在用于纠正LSP参数的低频范围差错的代码本索引LSP2中,前一帧p和当前帧c的7个比特的4个被设置为分类I,残余3个比特被设置为分类VII。在LSP参数的5阶高频范围纠错的代码本索引LSP3中,前一帧p和当前帧c的5个比特之一被设置为分类I,残余4个比特被设置为分类VII。在LSP参数的直接模式/差分模式选择标记LSP4中,直接模式/差分模式选择标记LSP4都利用分类I保护。在10阶全范围纠错的代码本索引LSP5中,前一帧p和当前帧c的8个比特之一被设置为分类I,残余7个比特被设置为分类VII。
对于前一帧p和当前帧c,有声/无声声音标记VUV的相应2个比特利用分类I保护。
对于前一帧p和当前帧c,有声/无声声音标记VUV的各自2个比特被设置为分类I并且被保护。对于前一帧p和当前帧c,噪声代码本索引idGL01的四个比特被设置为分类I并被。
另一方面,对于前一帧p和当前帧c,噪声代码本增益代码本索引idSL00的六个比特利被设置为分类VII并被保护,而噪声代码本增益代码本索引idGL01的六个比特利被设置为分类VII。
对于前一帧p和当前帧c,噪声代码本增益代码本索引idGL10的3个比特被设置为分类II并被保护。而且,对于前一帧p和当前帧c,噪声代码本增益代码本索引idGL11的三个比特被保护为分类I。对于前一帧p和当前帧c,噪声代码本增益代码本索引idGL12的3个比特被设置为分类I。对于前一帧p和当前帧c,噪声代码本增益代码本索引idGL13的3个比特中的两个比特被设置为分类I,但是残余一个比特被设置为分类VII。
对于前一帧p和当前帧c,噪声代码本增益代码本索引idSL10的所有五个比特被设置为分类VII。对于前一帧p和当前帧c,噪声代码本增益代码本索引idSL11的五个比特都被设置为分类VII,而对于前一帧p和当前帧c,噪声代码本增益代码本索引idSL13的五个比特都被设置为分类VII。
又是,分类VII的比特部分被保护为从分类II到分类VI的比特。如果比特出差错,则不采取测量,使得出错比特如在其它分类VII的比特的相同方式一样处理。
参照图10和图11说明对于传输路径编码器(信道编码器)4从分类I到分类VI的2kbps的有声和无声声音的各个参数的输入序列。如上所述,该输入序列再次由分类划分和输入序列判定单元23确定。比特排列序列响应于对传输路径差错的心理声学敏感性位。在这些图中,下标“p”和“c”也分别表示前一帧和当前帧,而比特0表示LSB。
在图10中,有声声音的分类I的输入序列依次是前一帧p的有声/无声声音标记VUV的第一比特,后跟前一帧p的有声/无声声音标记VUV的第零比特,后跟前一帧p的直接模式/差分模式选择标记LSP4的第零比特,后跟前一帧p的LPC残余频谱增益代码本索引idG的第四,第三,第二,第一和第零比特,后跟前一帧的LSP参数的10阶代码本索引LSP0的第四,第三,第二,第一和第零比特,后跟前一帧p的音调参数PCH的第六,第五,第四,第三,第二,第一和第零比特。到这时的输入序列是从第0到第18输入到传输路径编码器4。从第19开始,输入序列在前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP2的第六比特,如第19,前一帧p的LSP参数的5阶高频范围纠错的代码本索引LSP3的第四比特,如第20和前一帧p的LSP参数的代码本索引LSP2的第五比特的序列中继续。输入序列还后续当前帧c的参数,以这种方式,第0到第21的序列被重复为第22到第43。
有声话音的分类II比特的输入序列(第44到47)如图10所示被确定为前一帧p的第零LPC残余频谱代码本索引idS0的从第三到第零比特的四个比特。
有声话音的分类III比特的输入序列(第48到51)如图10所示被确定为前一帧p的第一LPC残余频谱代码本索引idS1的从第三到第零比特的四个比特。
有声话音的分类IV比特的输入序列(第52到55)如图10所示被确定为前一帧p的第零LPC残余频谱代码本索引idS0的从第三到第零比特的四个比特。
有声话音的分类V比特的输入序列(第56到59)如图10所示被确定为前一帧p的第一LPC残余频谱代码本索引idS1的从第三到第零比特的四个比特。
以这个顺序,有声话音的分类VI比特的输入序列(第60到79)为前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP2的第四,第三,第二,第一和第零比特。到目前为止的输入序列是第60到第64输入到传输路径编码器4。以这个顺序,输入序列后续前一帧p的LSP参数的5阶高频范围纠错的代码本索引LSP3的第三,第二,第一和第零比特,如第60到第64。以这个顺序,输入序列还后续前一帧p的LSP参数的5阶高频范围纠错的代码本索引LSP3的第三,第二,第一和第零比特,如第65到第68。第69 比特是前一帧p的音调参数PCH的第零比特。以这个顺序,输入序列还后续前一帧p的LSP参数的5阶高频范围纠错的代码本索引LSP2的第四,第三,第二,第一和第零比特,如第70到第74。以这个顺序,输入序列还后续前一帧p的LSP参数的5阶高频范围纠错的代码本索引LSP3的第四,第三,第二,第一和第零比特,如第75到第78。最后第79比特是当前帧c的音调参数PCH的第零比特。
参见图11,无声声音的输入序列是前一帧p的有声/无声声音标记VUV的第一和第零比特,后续前一帧p的直接模式/差分模式选择标记LSP4的第零比特,前一帧p的噪声代码本索引增益代码本idGL00的第三,第二,第一和第零比特,并且以这个顺序后续前一帧p的LSP参数的10阶代码本索引LSP0的第四,第三,第二,第一和第零比特。到现在为止的输入序列是从第0到第15输入到传输路径编码器4。第16到第19的比特是前一帧p的LSP参数的5阶低频范围纠错代码本索引LSP2的第六,第五,第四,第三,第二,第一和第零比特。第20到第21的比特是前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP3的第三和第四比特。在第22到第43中,输入当前帧的参数作为重复从第0到第21的上述序列。
无声声音的分类II的输入序列是前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP2的从第二到第零比特的三个比特,总共三个比特和前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP3的第二比特(从第44到第47)。
无声声音的分类III的输入序列是前一帧p的LSP参数的5阶低频范围纠错的代码本索引LSP3的第一(第48)和第零比特(第49),总共三个比特和前一帧p的噪声代码本索引的第五(第50)和第四比特(第51)。
无声声音的分类IV的输入序列是当前帧c的LSP参数的5阶低频范围纠错的第二到和第零比特,总共三个比特和5阶低频范围纠错的代码本索引的第二比特(第52到第55)。
无声声音的分类V的输入序列是当前帧c的LSP参数的5阶低频范围纠错的代码本索引LSP3的第一(第56)和第零比特(第57)。第58和第59是当前帧c的噪声代码本idSL00的第五和第四比特。
无声声音的分类IV比特的输入序列(从第60到第79)是前一帧p的噪声代码本idSL00的第三,二,一和零比特。到目前为止的输入序列是从第60到到第63输入到传输路径编码器4。在该输入序列中,第64到第69是前一帧p的噪声代码本idSL00的第五,四,三,二,一和零比特。该输入序列后续当前帧c的噪声代码本idSL00的第三,二,一和零比特,作为第70到第73。该输入序列还后续当前帧c的第五,四,三,二,一和零比特,作为第74和第79。
图12到图14和图15到图17示出4kbps的从分类I到分类VII的有声和无声声音的各个参数的传输路径编码器4的输入序列。这里,如上所述,输入序列由分类划分和输入序列判定单元23确定。比特排列序列响应于对传输路径差错的心理声学敏感性位。在这些图中,下标“p”和“c”也分别表示前一帧和当前帧,而比特0表示LSB。
图12示出有声声音的分类I的输入序列。设置从第0到第65的总共66比特的输入序列。这个输入序列是前一帧p的有声/无声声音标记VUV的第一比特,依次后跟前一帧p的有声/无声声音标记VUV的第零比特,前一帧p的直接模式/差分模式选择标记LSP4的第零比特,并且后跟前一帧p的LSP残余频谱增益代码本索引idG0的第四,第三,第二,第一和第零比特。该输入序列后跟前一帧的LSP参数的10阶代码本索引LSP0的第四,第三,第二,第一和第零比特。该输入序列还后跟前一帧p的音调参数PCH的第六,第五,第四,第三,第二,第一和第零比特。到这时的输入序列是从第0到第18输入到传输路径编码器4。从第19开始,输入序列后续前一帧p的LSP参数的低频范围纠错的代码本索引LSP2的第六,第五(第20),第四(第21)和第三(第22)比特。该输入序列还后续前一帧p的第零扩展LPC残余频谱代码本索引LSP3-4k的第六,五,四,三比特,作为第23到第27。对于第28和第29,排列前一帧p的5阶高频范围纠错的代码本索引LSP3的第四比特和前一帧p的10阶全范围纠错的LSP参数的代码本索引LSP5的第七比特。对于第30到第32,是第一扩展LPC残余频谱代码本索引idS3-4k的第九比特,第二扩展LPC残余频谱代码本索引idS3-4k的第八比特和第三扩展LPC残余频谱代码本索引idS3-4k的第五比特。对于第33到第65,以重复从第0到第32的序列的方式输入当前帧c的参数。
有声话音的从分类II到分类V的输入序列在图13示出。分类II的总共44比特输入到从第66到第109的序列中。从第66到第74,排列前一帧的第一扩展LPC残余频谱代码本索引idS3-4k的第八,七,六,五,四,三,二,一和零比特。对于第75到第82,排列前一帧的第二扩展LPC残余频谱代码本索引idS3-4k的第七,六,五,四,三,二,一和零比特。对于第83到第87,排列前一帧的第三扩展LPC残余频谱代码本索引idS3-4k的第四,三,二,一和零比特。对于第88到第109重复从第66到第87的总共22比特的当前帧c的相关比特。
对于分类II的四个比特,排列前一帧p的第零LPC残余频谱代码本索引idS0的第三,二,一和零比特作为第110到第113。
对于分类IV的四个比特,排列前一帧p的第零LPC残余频谱代码本索引idS1的第三,二,一和零比特作为第114到第117。
对于分类V的四个比特,排列当前帧c的第零LPC残余频谱代码本索引idS0的第三,二,一和零比特作为第118到第121。
有声声音的分类VI和VII的输入序列在图14示出。从第122到第125的分类VI的总共四个比特排列在当前帧c的第一LPC残余频谱代码本索引idS1的第三,二,一和零比特的序列中。
分类VII的总共34比特如下分配在第126到第159即,对于第126到第128,排列前一帧p的5阶低频范围纠错的代码本索引LSP2的第二,第一和第零比特。对于第129到第132,排列前一帧p的5阶低频范围纠错的代码本索引LSP3的第三,第二,第一和第零比特。对于第133到第139,排列10阶满带纠错的LSP参数的代码本索引LSP5的第六,五,四,三,二,一和第零比特。对于第140,分配前一帧的音调参数PCH的第零比特。对于第141到第142,分配第零扩展LPC残余频谱代码本索引idS0-4k的第一和第零比特。对于第143到第159,重复与从第126到第142的总共17比特的当前帧c的相关比特。
有声声音的分类VI和VII的输入序列在图15中示出。确定从第0到第65的总共66比特的输入序列。该输入序列是前一帧p的有声/无声声音标记VUV的第一和第零比特,后跟前一帧p的有声/无声声音标记VUV的第零比特,后续前一帧p的LSP参数的直接模式/差分模式选择标记LSP4的第零比特,和前一帧p的噪声代码本索引增益代码本idGL00的第三,二,一和第零比特,后续前一帧的噪声代码本索引增益代码本idGL01的第三,二,一和第零比特并后续前一帧p的LSP参数的10阶代码本索引LSP0的第四,三,二,一和第零比特。到这时为止的输入序列是从第0到第15输入到传输路径编码器4。从第16到第19,是前一帧p的LSP参数的低频范围纠错的代码本索引LSP2的第六,第五,第四和第三比特。对于第20到第21,排列前一帧p的5阶高频范围纠错的第四比特和前一帧p的10阶全波纠错的LSP参数的代码本索引LSP5的第七比特。对于第22到第24,排列前一帧p的噪声代码本索引增益代码本idGL10的第二,一和零比特。对于比特第25到第27,排列前一帧p的噪声代码本索引增益代码本idGL11的第二,一和零比特。对于比特第28到第30,排列前一帧p的噪声代码本索引增益代码本idGL12的第二,一和零比特。
对于比特第31和第32,排列前一帧p的噪声代码本索引增益代码本idGL13的第二和一比特。对于比特第33和第65,输入当前帧c的参数重复比特第0到第32的序列。
有声声音的分类II和III的输入序列在图16中示出。尽管图9中未示出,分类VII部分利用作为分类II到VI的比特的CRC保护,但是,如果出现差错,则不进行测量并且与分类VII的比特相同地处理该比特。首先,作为比特第66,输入前一帧p的噪声代码本索引增益代码本idGL13的第零比特。对于比特第67到第69,排列前一帧p的5阶低频范围纠错的代码本索引LSP2的第二,一和零比特。对于比特第70到第73,排列前一帧p的5阶高频范围纠错的代码本索引LSP3的第三,二,一和零比特。对于比特第74到第80,排列前一帧p的全频范围纠错的代码本索引LSP3的第六,五,四,三,二,一和零比特。对于比特第81到第86,排列前一帧p的噪声代码本索引增益代码本idGL00的第六,五,四,三,二,一和零比特。对于比特第87,排列前一帧p的噪声代码本索引增益代码本idGL01的第五比特。对于比特第88到第109,输入当前帧c的参数重复比特第66到第87的序列。
作为无声声音的分类III的总共四个比特,对于比特第110到第113排列前一帧p的噪声代码本索引增益代码本idGL01的第四,三,二和第一比特。
无声声音的从分类IV到分类VII的总共46个比特的输入序列在图17示出。尽管在图9中未示出,分类VII部分利用作为分类II到VI的比特的CRC保护,但是,如果出现差错,则不进行测量并且与分类VII的比特相同地处理该比特。
首先,作为分类IV的比特第114,对于分类IV的第114比特,排列前一帧p的噪声代码本索引增益代码本idGL01的第零比特。对于比特第115到第117,排列前一帧p的噪声代码本索引增益代码本idGL01的第四,三和第二比特。
对于分类V的总共四个比特,排列前一帧p的噪声代码本索引增益代码本idSL10的第四,三,二和第一比特作为比特第115到第117。
作为分类VI的比特第122,排列当前帧c的噪声代码本索引增益代码本idSL10的第零比特作为分类VI的第122比特。对于比特第123到第125,排列当前帧的噪声代码本索引增益代码本idSL10的第四,三和二比特。
分类VII的总共34个比特被如下分配作为第126到159对于第128到第132,排列前一帧p的噪声代码本索引增益代码本idSL10的第四,三,二,第一和第零比特。对于比特第133到第137,排列前一帧p的噪声代码本索引增益代码本idSL12的第四,三,二,第一和第零比特。对于比特第138到第142,排列前一帧p的噪声代码本索引增益代码本idSL13的第四,三,二,第一和第零比特。对于比特第143到第159,重复与从第126到第142的17个比特的当前帧c相关的比特。
在图10和图11所示的的输入序列中具有2kbps比特率的有声和无声声音的编码参数到图1所示的传输路径编码器4。另一方面,在图12和图17所示的的输入序列中具有4kbps比特率的有声和无声声音的编码参数到图1所示的传输路径编码器4。
接着如果需要,传输路径编码器4的CRC码计算单元5通过下面等式(1)所示的CRC多项式发现CRC码CRC[i]
R(x)=Σi=05CRC[i]·xi...(1)]]>对于分类I,根据比特率2kbps和4kbps的差和根据分类。在分类II等,使用适当的CRC多项式类似得到CRC码。
在上面的等式中,x6Σi=0NP[i]·xi=Q(x)·GCRC(x)+R(x)...(2)]]>和GcRc(x)=1+x2+x3+x5+x6…(3)仅对于2kbps的分类I,II,IV和V,CRC码计算单元5使用上面的等式(1)到等式(3)得到CRC码CRC[i]。尽管可以处理有声和无声声音,但是在本发明中主要预期判断与根据加到有声声音的除分类I以外的相关分类的CRC码检测到的差错一致的解码设备的输出。
2kbps的有声话音的从分类I到分类VI的比特的总数在图18中示出,其中还示出4kbps的有声话音的从分类I到分类VII的比特的总数。
利用2kbps的有声声音的分类I,作为目标,CRC码计算单元5从音频帧44个比特中计算6比特CRC码CRC[i](CRC奇偶校验)。当分类II作为目标时,CRC码计算单元5从音频帧4比特中计算1-比特CRC奇偶校验。如果分类VI作为目标,则不计算CRC奇偶校验。
使用通过等式(1)到等式(3)得到的CRC码CRC[i],和图10所示的输入序列P[i],形成如等式(4)所示的比特串CVin[i] 利用4kbps的有声分类的分类I,作为目标,CRC码计算单元5从66比特的音频帧中计算6-比特CRC奇偶校验。利用分类II作为目标,CRC码计算单元5从44个比特的音频帧中计算6-比特CRC奇偶校验。利用分类III到VI作为目标,CRC码计算单元5从4个比特的音频帧中计算1-比特CRC奇偶校验。如果分类VII作为目标,则不计算CRC奇偶校验。
使用由等式(1)到(3)找到的CRC码CRC[i],和图12到图14所示的输入序列P[i],形成如等式(4)所示的比特串CVin[i]。
卷积编码器6对设置为在必要时使用的从CRC码计算单元5发送的CRC码的比特使用卷积编码,即比特串CVin[i]。在这个编码设备中,只对用于保护的比特率为2kbps和4kbps的分类I比特一致的比特串CVin[i]使用卷积编码。
卷积编码器6对与比特率为2kbps和4kbps的分类I比特一致的比特串CVin[i]使用卷积编码不需要尾比特,例如在H.223附件C中使用的SRCPC(与系统率相容的收缩卷积码)。以双倍的编码率,如图18所示的8/16执行这个卷积编码器6中的卷积编码。这样,2kbps分类I的比特的总数是(音频帧44个比特+CRC奇偶校验6个比特)x2=100比特,而4kbps分类I的比特的总数是(音频帧66个比特+CRC奇偶校验6个比特)x2=144比特。
对于2kbps的分类II到分类V,只使用CRC码,而不执行卷积编码。因此,比特总数(音频帧4比特+CRC奇偶校验位)x1=5比特。另一方面,因为在分类VI中不产生CRC码,只有音频帧的20比特是比特总数。
因为对于4kbps的分类II到分类VI不是用卷积编码,所以分类II的比特总数是(音频帧44个比特+CRC奇偶校验6个比特)x1=50比特,如图18所示,分类III到分类VI的比特总数是(音频帧4比特+CRC奇偶校验1比特)x1=5比特。对于分类VII,其中不产生CRC码,只有音频帧的34个比特给出比特总数。
因此,利用2kbps源编码器,其中整个分类的总数是140比特,比特率是3.5kbps。
利用4kbps源编码器,其中整个分类的总数是248比特,比特率是6.2kbps。
根据对传输路径差错的心理声学敏感性位由分类划分和输入序列判定单元23分类并根据该分类在传输路径编码器4中保护的多种编码参数,由调制器7调制。调制器7的输出比特被处理用于由发射机8发射和经天线10发射。
在解码设备侧,作为由天线-共同用户9,接收机11和解调器13解调的编码输出的比特串,由卷积解码器16卷积解码。解码的比特串发送到CRC码比较器-帧屏蔽单元15,此处附加到卷积解码器16的卷积解码输出的该CRC码与从除决定性位组以外的比特组计算的CRC纠错码进行比较以便根据比较结果判断卷积解码输出。
CRC码比较器-帧屏蔽单元15执行差错检测处理用于使用加到从卷积解码器16执行的卷积解码步骤得到的卷积解码输出的纠错码检查传输差错和执行输出判断步骤,即根据在差错检查步骤的差错检查结果判断卷积解码输出。
特别是,如果CRC码不一致,即如果检测到CRC差错,并且使用所述的数据帧解码话音,则话音质量会略微变坏。因此,根据差错级联度执行差错保护处理(帧屏蔽)。
当前帧的帧屏蔽状态根据分类I的CRC解码结果更新。图19示出帧屏蔽处理的状态转换。各个状态(状态0和状态7)在由箭头指示的方向上经历转换。转换从状态0出现。在转换线上,“1”和“0”分别表示在差错变坏帧情况下的转换方向和在无差错帧情况下的转换方向。
根据状态值执行下面的参数替换。在无差错状态下,状态值是0并且处理接收的话音帧比特。状态7表示恢复状态。
在解码上面的LSP参数中,如果状态变量state是“状态1”到“状态6”,则LSP参数由以前帧的LSP参数代替。
在恢复状态7中,如果LSP=0表示LSP模式是直接类型,则从整个LSP码中计算LSP参数。如果LSP=4表示LSP模式具有差分类型,则从下面的等式(5)计算LSP参数LSPbase(n)=p·LSPprev(n)+(1-p)LSPU/V(n)Forn=1…10…(5)从而,在差分模式下,来自LSP0的LSP参数被插入前一帧的LSP参数。
在上面的等式(5)中,LSPbase(n)是基本层的LAP参数,LSPprev(n)是前一帧的LSP参数和LSPoth(n)是从LSP0码解码的参数。另一方面,P是插值系数并且根据分类I正好前面的CRC差错帧的序号(帧)在从0.7到0.0的范围内每次变化0.1。例如,如果以前的差错帧号是0,则使用P=0.7,基本层的LSPbase(n)是0.7LSPprev(n)+0.3LSPoth(n)。LSP2,LSP3和LSP5码被忽略并且LSPbase(n)用作现在的LSP参数。
如图21所示设置根据状态变量state的值控制输出声音的音量的静噪变量mute。例如,如果状态变量state是0,则静噪变量mute被设置为1.000。如果状态变量state是6,则静噪变量mute被设置为0.000。对于状态变量state=7,使用的静噪变量mute是平均值1.0和前一帧的平均值。但是,如果平均值超过0.8,则使用0.8。
有声声音参数的替换和增益控制如下执行如果有声/无声判定参数VUV是V,并且状态变量state是1到6,则代码本参数idS0,IDS1,LPC残余频谱增益代码本索引idG和对于4kbps的频谱参数idS0-4k到idS3-4k由前一帧的参数替换。为了控制输出话音的音量,如下面等式(6)对LPC残余信号的谐波电平参数Am
增益控制Am[i]=mute*Am(org)[i]fori=0…127…(6)此处已经从频谱参数中计算出AM(org)[i]。
在状态7,如果恢复为有声话音的正好前面的帧是无声的,则使用下面的等式(7)Am[i]=0.6*muteAm(org)[i]…(7)代替等式(6),为了抑制增益以便保持连续性,换句话说,为了使波形不受前端和后端频谱部分的差干扰。
同时第零LPC残余频谱代码本索引idS0和第一LPC残余频谱代码本索引idS1的前一帧p和当前帧c每个帧的4比特具有除对于2kbps的分类I和分类VI以外的其它分类,如图6所示,使得,从图18中,这些比特由1CRC比特单独保护。在状态0或状态7中,即在正常状态期间或恢复中,如果同时检测到对于相同帧的这些分类的CRC差错,则固定维数的量化谐波电平参数Am
从原始的Amqnt(org)[1..44]变换用于抑制低频率范围电平,如下面等式(8)所示Amqnr[i]=s[i]*Amqnt(org)[i]…(8)在这个等式(8)中,s[i]是抑制Amqnt(org)的系数并且如图22所示被设置。
对于4kbps,第一扩展LPC残余频谱代码索引idS1-4k,第二扩展LPC残余频谱代码索引idS2-4k和第三扩展LPC残余频谱代码索引idS3-4k的几乎所有比特当是分类II比特时由多个CRC比特保护。如果在分类II中检测到差错,则忽略该扩展层的频谱包络。
例如,如果VUV判定参数是UV,并且状态变量state=1到6,则噪声代码本增益参数idGL00,idGL01和噪声代码本增益参数idGL10到idGL13或4kbps由前一帧的参数代替。在相似的情况下,噪声代码本增益参数idGL00,idGL01可以由前一帧的idGL01代替,而对于4kbps的噪声代码本增益参数idGL10到idGL13可以由前一帧的idGL13代替。对于4kbps使用的噪声代码本增益参数idGL00,idGL01和噪声代码本增益参数idGL10到idGL13是在在各个比特数范围内产生统一随机数中得到的那些参数。
为了控制输出声音的音量,LPC残余信号res
如下面等式(9)所示的被增益控制res[i]=mute*resorg[i] (0≤i≤159) …(9)此处从该噪声代码本参数中找到res[i]。
由CRC码比较器-帧屏蔽单元15帧屏蔽的卷积编码输出,被发送到话音解码器17。
图23,24示出话音解码器17的结构。从CRC码比较器-帧屏蔽单元15中,通过终端202取出相应于LSP(线谱对)的量化输出的代码本索引,而通过终端203到205取出作为包络量化输出的索引,音调和VUV参数和通过终端207取出索引UV(无声的)数据。在CRC码比较器帧屏蔽单元15的CRC中得到的CRC差错信号被发送到无声声音合成单元220。
作为从终端203输出的包络量化的索引被发送到矢量去量化器212用于矢量去量化以便找到发送到有声声音合成单元211的LPC残余的频谱包络。有声声音合成单元211利用正弦曲线合成合成有声声音部分的LPC残余并且从终端204,205输出的音调和有声/无声判定输出馈入有声声音合成单元211。来自有声声音合成单元211的有声声音的LPC残余被发送到LPC合成滤波器214。来自终端207的UV数据的索引被发送到无声声音合成单元220,此处涉及噪声代码本以便取出LPC残余作为无声部分的激励向量。这些LPC残余还发送到LPC合成滤波器214,此处有声部分的LPC残余和无声部分的LPC残余利用LPC合成分别处理。可选地,LPC合成可以关于有声部分的LPC残余和无声部分的LPC残余的和执行。来自终端202的LSP索引被发送到LPC参数重放单元213以便取出发送到LPC合成滤波器214的LPC的α-参数。在输出终端204取出由LPC合成滤波器214关于LPC合成得到的话音信号。
图24示出图23所示的话音解码器17的更为具体的结构。在图24中,在下面的描述中,与图23所示的部件或单元相同的部件或单元由相同的标号叙述。
通过CRC码比较器-帧屏蔽单元15发送到输入终端202的LSP的矢量量化输出,即所谓的代码本索引。
该LSP索引被发送到LPC参数重放单元213的矢量去量化器231,此处利用矢量去量化处理该LSP数据。产生的数据被发送到LSP插值电路232,233用于LSP插值并且由此发送到LSP→α转换器234,235用于转换成LPC(线性预测编码)的α-参数。这个α-参数发送到LPC合成滤波器214。LSP插值电路232和LSP→α转换器234 是对于有声声音(V)的,而LSP插值电路233和LSP→α转换器235是对于无声声音(UV)的。LPC合成滤波器214分开用于有声声音236的LPC合成滤波器和用于无声声音237的LPC合成滤波器。即,对于有声和无声部分分别执行LPC系数插值以便防止由于在转换点的完全不同性质的LSP插值另外引起的从有声变成无声部分或从无声变成有声部分的不利效果。
频谱包络Am的加权矢量量化代码索引数据经过CRC码比较器-帧屏蔽单元15馈入输入终端203。音调参数PCH的数据通过CRC码比较器-帧屏蔽单元15馈入输入终端204,而有声/无声判定数据通过CRC码比较器-帧屏蔽单元15馈入输入终端205。
来自输入终端203的频谱包络Am的矢量量化的索引数据发送到矢量去量化器212用于矢量去量化,它是相应于数据个数变换的反向变换。该频谱包络的产生的数据被发送到有声声音合成单元211的正弦曲线合成电路215。
如果在编码中矢量去量化之前取帧到帧的差分,则在矢量去量化之后执行帧到帧差分的解码,后接数据个数变换以便产生频谱包络数据。
来自输入终端204的音调和来自输入终端205的V/UV判定数据馈入正弦曲线合成电路215。从正弦曲线合成电路215中,取出相应于图2和图3的LPC反向-滤波器111的输出的LPC残余数据并且发送到加法器218。这种正弦曲线合成的特别技术在以本受让人姓名申请的日本待审专利平-5-265487和日本待审专利平-8-063197中公开。
来自矢量去量化器212的包络数据和来自输入终端204,205的音调和V/UV判定数据被发送到噪声合成电路16用于加入有声(V)部分的噪声。噪声合成电路216的输出通过加权的加权加法电路217发送到加法器218。这样做的原因是因为,通过正弦曲线合成证明的到有声声音的LPC滤波器的输入的激励在低音调声音例如男性声音上给出一种充满的感觉并且声音质量在有声(V)和无声(UV)声音之间突然变化从而给人一种不自然的感觉,所以考虑了从编码的话音数据例如音调,频谱包络幅度,一帧中或残余信号电平中的最大幅度得到的参数的噪声,被加入到LPC合成滤波器输入的LPC残余信号的有声部分,那就是有声部分的激励。
加法器218的和输出发送到合成滤波器236用于LPC合成滤波器214的有声话音经历LPC合成处理以便产生一个时域波形信号,接着该信号由用于有声话音238v的一个后滤波器滤波并且由该处发送到加法器239。
作为UV数据的波形索引和增益索引被分别发送到输入终端207s和207g,如图24所示,并且由该处提供给无声声音合成单元220。来自终端207s的形状索引被发送到无声声音合成单元220的噪声代码本221,而来自终端207g的增益索引被发送到增益电路222。从噪声代码本221读出的代表值输出是相应于无声声音的LPC残余的噪声信号部分并且在增益电路222中具有预置增益幅度。接着该噪声信号部分被发送到窗口电路223,此处它被开窗口以便平滑有声声音部分的接合处。
作为无声声音合成电路单元220的输出的窗口电路223的输出,被发送到无声(UV)声音237的合成滤波器,此处利用LPC合成处理该输出以便证实由无声部分238u的后滤波器滤波并且由此处提供给加法器239的无声部分的时间波形数据。
在加法器239中,对来自有声部分238v的后滤波器的有声部分的时间波形信号与来自无声部分238u的后滤波器的无声部分的时间波形信号求和。在输出终端201取出产生的数据。
在这个输出终端201取出的解码的话音输出,由D/A变换器18变换成模拟信号,它通过扬声器作为话音发出。
图25和图26示出共同表示由便携式电话设备执行的编码方法和话音解码方法的流程图。
具体地,由便携式电话设备的编码设备执行的话音编码方法是步骤S1的通过话音编码处理编码输入话音信号的处理,根据步骤S1从多种话音编码参数中选出关于传输路径差错具有高心理声学敏感性的一个决定性位组,从该决定性位组计算CRC码,并将在步骤S2算出的CRC码卷积编码为在步骤话音编码器中的决定性位组。
由该便携式电话设备的解码设备执行的话音解码处理是在步骤S11的卷积解码来自另一个便携式电话设备的卷积编码输出的处理并且在步骤S12通过具有保护性位的分类的CRC码比较检测差错。在步骤S13,帧屏蔽状态变量state根据对CRC码比较的响应更新。
如果在步骤S13没有检测到差错,则程序进入步骤S16。如果变量被更新为state=7,则程序进入步骤S17以便在步骤S18核对该变量mute是否已经超过作为整个帧的变量mute(p)和1的平均结果0.8。如果该变量尚未超过0.8,则程序进入步骤S19以便设置mute=0.8。
如果在步骤S20核对LSP=1,具有差分模式,则程序进入步骤S21以便根据前一个分类I的差错数设置插值系数。LSP解码在步骤S22完成。不对相应于差错分量的分量LSP2,LSP3和LSP5求和。在步骤S20如果LSP不等于1,则程序进入步骤S23以便执行程序LSP解码。
如果状态变量state是0或7,并且如果在步骤S24该帧是有声帧(VUV>0),则程序进入步骤S25以便通过idS0,idS1和idG解码该LPC残余频谱Am。如果在步骤S26从分别加到idS0和idS1的CRC比特同时检测到差错,则在S27采用低范围抑制。
同时,因为Am已经变换成固定的维数,所以在步骤S28实现维数变换用于恢复到基于音调的固有维数。
如果在步骤S29速率是4kbps,则程序进入步骤S30,此处检查作为Am扩展分量的覆盖id2-4k,id3-4k和id4-4k的CRC比特。只有当没有检测到差错时该扩展分量在步骤S31求和。
如果在步骤S32state=7,和表示无声声音的prevVUV(前一帧的VUV)=0,则程序进入步骤S33以便抑制Am。
具有作为传输端编码设备的传输路径编码器4和编码器3的便携式电话设备能够输出强抗传输路径差错的编码数据。
而且,具有实现在接收端的本发明的解码方法和设备的传输路径解码器和话音解码器的便携式电话设备能够抑制另外由传输路径插座引起的声音质量的降低。
上面说明了具有实现本发明解码设备和方法的便携式电话设备。但是,本发明不限于便携式电话设备的解码设备,而是可适用于例如传输系统。
图27表示实现本发明的传输系统的实施例的示意结构。同时,该系统意味着多种设备的逻辑装配,而不考虑各个设备是否处于相同的外壳中。
在这个传输系统中,解码设备由客户终端63拥有,而编码设备由服务器61拥有。客户终端63和服务器61通过网络62,诸如因特网,ISDN(综合业务数字网),LAN(局域网)或PSTN(公共交换电话网)互连。
如果对于例如音乐号的音频信号的请求从客户终端63向服务器61发出,则相应于请求的音乐号的音频信号的编码参数被保护以响应心理声学敏感性位使免于网络62上的传输路径差错并且传输到客户终端63,该终端接着解码来自服务器61的被保护免于传输路径差错的编码参数,响应于解码方法以便从输出设备例如扬声器输出解码的信号作为话音。
图28示出图27的服务器61的示意性硬件结构。
ROM(只读存储器)71在其中了,例如IPL(初始程序装载)程序。CPU(中央处理单元)72根据存储在ROM71中的IPL程序执行OS(操作系统)程序。在OS控制下,执行存储在一个外部存储设备76中的预置应用程序以便保护音频信号的保护处理和在编码中得到的编码以便执行到客户终端63的编码数据的传输处理。RAM(随机存取存储器)73存储CPU72的操作需要的程序或数据。输入设备74诸如由键盘,鼠标,话筒或外部接口构成,并且当输入必要数据或命令时起作用。输入设备74也适于作为用于从来自装备在客户终端63的数字音频信号的外部接受输入的接口。输出设备75诸如由显示器,扬声器或打印机组成,并且显示和输出必要信息。外部存储器76例如包括,具有存储在其中的上述OS或预置应用程序的硬盘。通信设备77执行通过网络62通信所必需的控制。
存储在外部存储器76中的预置应用程序是使话音编码器3,传输路径编码器4或调制器7的功能由CPU72执行的程序。
图29示出图27所示的客户终端63的示意硬件结构。
客户终端63由ROM81到通信设备87组成并且被基本配置为与由ROM71到通信设备77构成的服务器61的配置相似。
应该注意外部存储器86在其中存储了程序,作为用于执行本发明的解码方法的应用程序,用于解码来自服务器61的编码数据或用于执行现在将作说明的其它处理的程序。通过执行这些应用程序,CPU82解码或重放被保护免于传输路径差错的编码的数据。
具体地,外部存储器86在其中存储了使CPU82执行解调器13,传输路径解码器14和话音解码器17的功能的应用程序。
这样,客户终端63能够实现作为软件而无需图1所示的硬件结构存储在外部存储器86中的解码方法。
对于客户终端63存储从服务器61向外部存储器86发送的编码数据和在所需的时间读出编码的数据以便执行该编码方法在所需的时间输出话音也是可能的。该编码的数据也可以存储在另一个外部存储器中,例如磁光盘或其它记录介质。
而且,作为服务器61的外部存储器76,诸如磁光盘或磁记录介质的记录介质,可以用于在这些记录介质上记录该编码的数据。
权利要求
1.一种解码设备,用于解码相应于输入话音信号的发送的编码参数,该输入话音信号已经由编码设备从时间轴上的一个预置编码单元编码到另一个预置编码单元,并且,该输入话音信号已经根据各位对传输路径差错的心理声学敏感性进行分类,该解码设备包括传输路径解码装置,用于使用附加到预置分类的所述编码参数的差错检验码来检测差错和根据在所述编码单元产生的编码参数中的差错来提供不同的帧屏蔽处理,其中,在时间轴上作为预置编码单元的一个或多个连续的帧中检测到差错以后,如果接收到第一正常帧,则该传输路径解码装置执行抑制信号电平的帧屏蔽处理,该第一正常帧是有声的和在差错出现之后的最后一个正常帧是无声的。
全文摘要
在低比特率话音编码系统中,解码侧使用加到卷积解码输出的差错校验码检查传输差错并且根据传输差错的校验结果判断解码输出。卷积解码器16卷积解码来自编码设备的卷积编码的输出以提供具有附加的差错校验码的决定性位组和除决定性位组外的位组的卷积解码输出。CRC码比较器-帧屏蔽单元将加到来自卷积解码器的卷积解码输出的CRC校验码和从除决定性位组外的位组计算的CRC校验码作比较以判断卷积解码的输出。
文档编号H04L1/00GK1604483SQ200410083498
公开日2005年4月6日 申请日期2000年6月17日 优先权日1999年6月17日
发明者前田祐児 申请人:索尼公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1