声音信号编解码方法、编解码装置和声音信号处理系统的制作方法

文档序号:2833267阅读:265来源:国知局
专利名称:声音信号编解码方法、编解码装置和声音信号处理系统的制作方法
技术领域
本发明涉及声音信号编码方法、声音信号解码方法、编码装置、解码装置、声音信号处理系统、声音信号编码程序以及声音信号解码程序。
背景技术
为了降低语音/音乐信号(声音信号)的通信、放送、蓄积所需要的成本,将语音/音乐信号压缩为低比特率的编码技术是很重要的。为了高效地对语音信号和音乐信号双方进行编码,切換利用适于语音信号的编码方式和适于音乐信号的编码方式的复合型编码方式是有效的。在使用复合型编码方式的情况下,通过在语音序列的中途进行编码方式的切换,即使在输入信号的性质随时间而变化的情况下,也能够高效地进行编码。复合型编码方式通常包含适于语音信号编码的CELP方式(CELP :Code ExcitedLinear Prediction Coding、代码激励线性预测编码)的编码作为构成要素。一般地,CELP方式的编码器在内部保持与过去的残差信号有关的信息作为自适应码本,以便对通过对输入信号应用线性预测逆滤波器而得到的残差信号进行编码。由于在编码中利用该自适应码本,所以实现了高编码效率。对语音信号和音乐信号进行编码的技术例如记载在专利文献I等中。在专利文献I中记载了对语音信号和音乐信号双方进行编码的编码算法等。专利文献I的技术使用语音信号和音乐信号双方共同的线性预测(LP)合成滤波器。LP合成滤波器根据语音信号或音乐信号的编码,分别对语音激励振荡器和转换激励振荡器进行切換。在语音信号的编码中使用现有的CELP技术,在音乐信号的编码中应用新的非対称重复相加转换技木。在进行共同的LP合成滤波时,对重复相加操作区域的信号进行LP系数的插值。在语音序列的中途从CELP方式以外的其他编码方式切换为基于CELP方式的编码方式的情况下,由于在编码器中不保持与切換前的语音对应的残差信号的信息作为自适应码本,所以在编码方式刚刚切換之后的帧中,编码效率低下,由此,可能产生导致语音品质劣化的问题。作为利用基于CELP方式以外的其他编码方式的编码结果对CELP方式中的编码器的内部状态进行初始化的方法的相关现有技术,公知有作为在3rd GenerationPartnership Project(3GPP)中被标准化的语音编码方式的Adaptive MultiRate Widebandplus (AMR-WB+、非专利文献I)。AMR-WB+的编码器求出对输入信号进行线性预测逆滤波器处理而得到的残差信号,然后,通过切换利用CELP方式和Transform Coded Excitation(TCX)方式这两个编码方式,来进行残差信号的编码。AMR-WB+的编码器在从TCX方式切換为CELP方式的情况下,使用TCX方式中的激励信号对CELP方式中的自适应码本进行更新。
现有技术文献专利文献专利文献I :日本特开2003-44097号公报非专利文献I :3GPP TS26. 290 “Audio codec processing functions;ExtendedAdaptive Multi-Rate-ffideband (AMR-WB+) codec; Transcoding functions,,· [online] ·[retrieved on 5 March 2009]Retrieved fromthe Internet <URL http //www. 3gpp.org/ftp/Specs/html-info/26290. htm>.

发明内容
发明要解决的课题但是,在使用切換利用基于CELP方式的编码方式和不使用线性预测编码的编码方式的复合型编码方式的情况下,在基于不使用线性预测编码的编码方式的编码过程中,难以得到激励信号。因此,在从不使用线性预测编码的编码方式切換为基于CELP方式的编码方式的情况下,难以通过与切換前的语音对应的激励信号对CELP方式中的自适应码本进行初始化。本发明的目的在于,在从不使用线性预测的编码方式切换为基于线性预测编码的编码方式的情况下,将基于线性预测编码的编码方式的编码单元或解码单元的内部状态的初始值设定为适当的值,改善刚刚切換之后的帧中的语音品质。用于解决课题的手段本发明的声音信号编码方法使用基于线性预测编码方式的第I编码单元和基于与线性预测编码方式不同的编码方式的第2编码单元,对由多个帧构成的声音信号进行编码,其特征在干,该声音信号编码方法具有如下步骤切換步骤,在通过所述第2编码单元对所述声音信号的第I帧进行了编码后,将对紧挨着该第I帧之后的第2帧进行编码的编码单元从所述第2编码单元切換为所述第I编码单元;以及初始化步骤,在所述切换步骤之后,通过规定方法对所述第I编码单元的内部状态进行初始化。根据本发明的声音信号编码方法,即使在利用与线性预测编码方式不同的编码方式对通过该线性预测编码方式进行编码的第2帧前面的第I帧进行了编码的情况下,通过对基于线性预测编码方式的第I编码单元的内部状态进行初始化,也能够通过线性预测编码方式进行第2帧的编码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理。进而,在本发明中,优选所述第I编码单元的所述内部状态是自适应码本的内容或用于求出零输入响应的线性预测合成滤波器的延迟要素所保持的值,优选在所述初始化步骤中,使用所述第I帧对所述第I编码单元的内部状态进行初始化,优选在所述初始化步骤中,使用残差信号进行所述第I编码单元的初始化,所述残差信号是针对所述第2编码单元编码前的所述第I帧、或者在所述第2编码单元编码后进行解码而得到的所述第I帧中的任意一方应用所述线性预测逆滤波器而得到的,优选在所述初始化步骤中,使用所述第I编码单元对位于所述第I帧前面的第3帧进行了编码时的线性预测系数,针对所述第2编码单元编码前的所述第I帧、或者在所述第2编码单元编码后进行解码而得到的所述第I帧中的任意一方应用所述线性预测逆滤波器。或者,优选在所述初始化步骤中,在所述第2帧的码中包含所述第I帧的线性预测系数的情况下,使用该第2帧的码中包含的线性预测系数,针对所述第2编码单元编码前的所述第I帧、或者在所述第2编码单元编码后进行解码而得到的所述第I帧中的任意一方应用所述线性预测逆滤波器。而且,在本发明中,也可以在所述初始化步骤中,使用所述第I编码单元对位于所述第I帧前面的帧进行了编码时的所述第I编码单元的内部状态,对该第I编码单元的内部状态进行初始化。并且,作为用于求出零输入响应的线性预测合成滤波器中的线性预测系数,优选使用所述第I编码单元对位于所述第I帧前面的第3帧进行了编码时的线性预测系数、或者在所述第2帧的码中包含所述第I帧中的线性预测系数的情况下在该第2帧的编码时计算出的所述第I帧中的线性预测系数、或者对它们应用了听觉加权滤波器而得到的线性预测系数。本发明的声音信号解码方法使用基于线性预测编码方式 的第I解码单元和基于与线性预测编码方式不同的编码方式的第2解码单元,对由多个帧构成的编码声音信号进行解码,其特征在于,该声音信号解码方法具有如下步骤切换步骤,在通过所述第2解码单元对所述编码声音信号的第I帧进行了解码后,将对紧挨着该第I帧之后的第2帧进行解码的解码单元从所述第2解码单元切換为所述第I解码单元;以及初始化步骤,在所述切换步骤之后,通过规定方法对所述第I解码单元的内部状态进行初始化。根据本发明的声音信号解码方法,在通过与线性预测编码方式不同的编码方式对使用该线性预测编码方式进行解码的第2帧前面的第I帧进行了解码的情况下,通过对基于线性预测编码方式的第I解码单元的内部状态进行初始化,也能够通过线性预测编码方式进行第2帧的解码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的解码处理。进而,在本发明中,优选所述第I解码单元的所述内部状态是自适应码本的内容或线性预测合成滤波器的延迟要素所保持的值,优选在所述初始化步骤中,使用所述第I帧对所述第I解码单元的内部状态进行初始化,优选在所述初始化步骤中,使用残差信号进行所述第I解码单元的初始化,所述残差信号是针对所述第2解码单元解码后的所述第I帧应用所述线性预测逆滤波器而得到的,优选在所述初始化步骤中,使用由所述第I解码单元对位于所述第I帧前面的第3帧进行了解码时的线性预测系数,针对所述第2解码单元解码后的所述第I帧应用所述线性预测逆滤波器。或者,优选在所述初始化步骤中,在所述第2帧的码中包含所述第I帧的线性预测系数的情况下,使用该第2帧的码中包含的线性预测系数,针对所述第2解码单元解码后的所述第I帧应用所述线性预测逆滤波器。而且,在本发明中,也可以在所述初始化步骤中,使用所述第I解码单元对位于所述第I帧前面的帧进行了解码时的所述第I解码单元的内部状态,对该第I解码单元的内部状态进行初始化。本发明的编码装置具有基于线性预测编码方式的第I编码单元和基干与所述线性预测编码方式不同的其他编码方式的第2编码单元,使用所述第I编码单元和所述第2编码单元对声音信号进行编码,其特征在干,该编码装置具有第I编码判定単元,其判定利用所述第I编码单元或所述第2编码单元中的哪ー个对所述声音信号中包含的作为编码对象的编码对象帧进行编码;第2编码判定単元,其在由所述第I编码判定単元判定为通过所述第I编码单元对所述编码对象帧进行编码的情况下,判定是通过所述第I编码单元对紧挨着所述编码对象帧之前的编码之前帧进行编码,还是通过所述第2编码单元对所述编码之前帧进行编码;编码内部状态计算単元,其在由所述第2编码判定単元判定为通过所述第2编码单元对所述编码之前帧进行编码的情况下,对所述编码之前帧的编码结果进行解码,使用该解码结果计算所述第I编码单元的内部状态;以及编码初始化単元,其使用由所述编码内部状态计算单元计算出的所述内部状态,对所述第I编码单元的内部状态进行初始化,在所述编码初始化单元对所述内部状态进行了初始化后,所述第I编码单元对所述编码对象帧进行编码。根据本发明的编码装置,在通过基于与线性预测编码方式不同的编码方式的第2编码单元对通过基于该线性预测编码方式的第I编码单元进行编码的编码对象帧前面的编码之前帧进行了编码的情况下,通过对第I编码单元的内部状态进行初始化,也能够通过线性预测编码方式进行编码对象帧的编码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理。本发明的解码装置具有基于线性预测编码方式的第I解码单元和基干与所述线性预测编码方式不同的其他编码方式的第2解码单元,使用所述第I解码单元和所述第2解码单元对编码声音信号进行解码,其特征在干,该解码装置具有 第I解码判定単元,其判定利用所述第I解码单元或所述第2解码单元中的哪ー个对所述编码声音信号中包含的 作为解码对象的解码对象帧进行解码;第2解码判定単元,其在由所述第I解码判定単元判定为通过所述第I解码单元对所述解码对象帧进行解码的情况下,判定是通过所述第I解码单元对紧挨着所述解码对象帧之前的解码之前帧进行了解码,还是通过所述第2解码单元对所述解码之前帧进行了解码;解码内部状态计算単元,其在由所述第2解码判定单元判定为通过所述第2解码单元对所述解码之前帧进行了解码的情况下,使用所述解码之前帧的解码结果计算所述第I解码单元的内部状态;以及解码初始化単元,其使用由所述解码内部状态计算单元计算出的所述内部状态,对所述第I解码单元的内部状态进行初始化,在所述解码初始化单元对所述内部状态进行了初始化后,所述第I解码单元对所述解码对象帧进行解码。根据本发明的解码装置,即使在通过基于与线性预测编码方式不同的编码方式的第2解码单元对使用基于该线性预测编码方式的第I解码单元进行解码的解码对象帧前面的解码之前帧进行解码的情况下,通过对第I解码单元的内部状态进行初始化,也能够通过线性预测编码方式进行解码对象帧的解码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的解码处理。本发明的声音信号处理系统的特征在于,该声音信号处理系统具有所述编码装置和所述解码装置,所述解码装置对由所述编码装置进行了编码的编码声音信号进行解码。根据本发明的声音信号处理系统,即使在通过基于与线性预测编码方式不同的编码方式的第2编码单元对通过基于该线性预测编码方式的第I编码单元进行编码的编码对象帧前面的编码之前帧进行了编码的情况下,通过对第I编码单元的内部状态进行初始化,也能够通过线性预测编码方式进行编码对象帧的编码。即使在通过基于与线性预测编码方式不同的编码方式的第2解码单元对使用基于该线性预测编码方式的第I解码单元进行解码的解码对象帧前面的解码之前帧进行了解码的情况下,通过对第I解码单元的内部状态进行初始化,也能够通过线性预测编码方式进行解码对象帧的解码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理和解码处理。本发明的声音信号编码程序的特征在于,为了使用基于线性预测编码方式的第I编码单元和基干与所述线性预测编码方式不同的其他编码方式的第2编码单元对声音信号进行编码,该声音信号编码程序使计算机装置发挥以下単元的功能第I编码判定単元,其判定利用所述第I编码单元或所述第2编码单元中的哪ー个对所述声音信号中包含的作为编码对象的编码对象帧进行编码;第2编码判定単元,其在由所述第I编码判定単元判定为通过所述第I编码单元对所述编码对象帧进行编码的情况下,判定是通过所述第I编码単元对紧挨着所述编码对象帧之前的编码之前帧进行编码,还是通过所述第2编码单元对所述编码之前帧进行编码;编码内部状态计算単元,其在由所述第2编码判定単元判定为通过所述第2编码单元对所述编码之前帧进行编码的情况下,对所述编码之前帧的编码结果进行解码,使用该解码结果计算所述第I编码单元的内部状态;编码初始化单元,其使用由所述编码内部状态计算单元计算出的所述内部状态,对所述第I编码单元的内部状态进行初始化;以及编码单元,其在通过所述编码初始化单元进行了所述内部状态的初始化之 后,由所述第I编码单元对所述编码对象帧进行编码。根据本发明的声音信号编码程序,即使在通过基于与线性预测编码方式不同的编码方式的第2编码单元对通过基于该线性预测编码方式的第I编码单元进行编码的编码对象帧前面的编码之前帧进行了编码的情况下,通过对第I编码单元的内部状态进行初始化,也能够通过线性预测编码方式进行编码对象帧的编码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理。本发明的声音信号解码程序的特征在于,为了使用基于线性预测编码方式的第I解码单元和基干与所述线性预测编码方式不同的其他编码方式的第2解码单元对编码声音信号进行解码,该声音信号解码程序使计算机装置发挥以下単元的功能第I解码判定単元,其判定利用所述第I解码单元或所述第2解码单元中的哪ー个对所述编码声音信号中包含的作为解码对象的解码对象帧进行解码;第2解码判定単元,其在由所述第I解码判定単元判定为通过所述第I解码单元对所述解码对象帧进行解码的情况下,判定是通过所述第I解码单元对紧挨着所述解码对象帧之前的解码之前帧进行解码,还是通过所述第2解码单元对所述解码之前帧进行解码;解码内部状态计算単元,其在由所述第2解码判定单元判定为通过所述第2解码单元对所述解码之前帧进行了解码的情况下,使用所述解码之前帧的解码结果计算所述第I解码单元的内部状态;解码初始化単元,其使用由所述解码内部状态计算单元计算出的所述内部状态,对所述第I解码单元的内部状态进行初始化;以及解码单元,其在通过所述解码初始化单元进行了所述内部状态的初始化之后,由所述第I解码单元对所述解码对象帧进行解码。根据本发明的声音信号解码程序,即使在通过基于与线性预测编码方式不同的编码方式的第2解码单元对使用基于该线性预测编码方式的第I解码单元进行了解码的解码对象帧前面的解码之前帧进行了解码的情况下,通过对第I解码单元的内部状态进行初始化,也能够通过线性预测编码方式进行解码对象帧的解码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的解码处理。发明效果根据本发明,在从不使用线性预测的编码方式切換为基于线性预测编码的编码方式的情况下,将基于线性预测编码的编码方式的编码单元或解码单元的内部状态的初始值设定为适当的值,能够改善刚刚切換之后的帧中的语音品质。


图I是示出实施方式的编码装置和解码装置的结构的图。图2是示出实施方式的编码装置的结构的图。图3是用于说明实施方式的编码装置的动作的流程图。图4是示出实施方式的解码装置的结构的图。图5是用于说明实施方式的解码装置的动作的流程图。
具体实施例方式下面,參照附图详细说明本发明的优选实施方式。另外,在附图的说明中,在可能的情况下,对同一要素标注同一符号并省略重复的说明。实施方式的声音信号处理系统具有对输入的声音信号进行编码的编码装置10以及对编码装置10所编码的编码声音信号进行解码的解码装置20。图I和图2是示出实施方式的编码装置10的结构的图。编码装置10对所输入的语音/音乐信号(声音信号)进行编码并输出。语音/音乐信号是被预先分割成具有有限长度的帧之后输入到编码装置10中的信号。在语音/音乐信号是语音信号的情况下,编码装置10根据第I编码方式进行编码,在语音/音乐信号是音乐信号的情况下,编码装置10根据第2编码方式进行编码。第I编码方式是基于具有自适应码本的线性预测编码的ACELP等CELP方式。第2编码方式与第I编码方式不同,是不利用线性预测的编码方式。第2编码方式例如假设为AAC等转换编码。编码装置10在物理上具有包含CPUlOa、ROMlOb, RAMlOc、存储装置IOd和通信装置IOe等的计算机装置,这些CPUlOa 通信装置IOe与总线IOf连接。CPUlOa通过将存储在ROMlOb等内置存储器中的规定计算机程序(例如用于执行图3所示的流程图的处理的声音信号编码程序)加载到RAMlOc中执行,对编码装置10进行统ー控制。存储装置IOd是写入/读出自如的存储器,存储各种计算机程序、执行计算机程序所需要的各种数据等(例如在第I编码方式的编码中使用的自适应码本和线性预测系数、其他的基于第I编码方式和第2编码方式的编码所需要的各种參数、规定数的编码前后的帧等)。存储装置IOd至少存储最后(之前)编码的ー个帧的语音/音乐信号。并且,编码装置10在功能上具有编码方式切換部12 (第I编码判定単元、第2编码判定単元)、第I编码部13 (第I编码单元)、第2编码部14 (第2编码单元)、码复用部15、内部状态计算部16 (编码内部状态计算単元)、内部状态初始化方法确定部17 (编码初始化单元)。这些编码方式切換部12 内部状态初始化方法确定部17是通过CPU IOa执行存储在ROM IOb等编码装置10的内置存储器中的上述计算机程序、使图I所示的编码装置10的各结构部动作而实现的功能。CPU IOa通过执行上述声音信号编码程序(使用编码方式切換部12 内部状态初始化方法确定部17),执行图3的流程图所示的处理。接着,參照图3说明编码装置10的动作。语音/音乐信号是被预先分割成具有有限长度的帧之后输入到编码装置10的通信装置IOe中的信号。当经由通信装置IOe输入语音/音乐信号后,编码方式切換部12根据该编码对象帧,判定通过第I编码方式或第2编码方式中的哪ー个编码方式对该语音/音乐信号的编码对象帧(作为编码对象的帧)进行编码,根据该判定結果,向通过第I编码方式对语音/音乐信号进行编码的第I编码部13或通过第2编码方式对语音/音乐信号进行编码的第2编码部14中的任意一方发送编码对象帧(步骤Sll ;第I切换步骤)。在步骤Sll中,在编码对象帧是语音信号的情况下,编码方式切換部12判定为通过第I编码方式进行编码,在编码对象帧是音乐信号的情况下,编码方式切換部12判定为通过第2编码方式进行编码。然后,在该第I切换步骤之后,执行用于对第I编码部13的内部状态(自适应码本的内容或用于求出零输入响应的线性预测合成滤波器的延迟要素所保持的值等,以下相同)进行初始化的第I初始化步骤(步骤S12 S18)。编码方式切換部12在步骤Sll中判定为编码对象帧是音乐信号、通过第2编码方 式对编码对象帧进行编码的情况下(步骤SI I ;第2编码部),向第2编码部14发送编码对象帧,第2编码部14通过第2编码方式对从该编码方式切換部12发送的编码对象帧进行编码,经由通信装置IOe输出该编码后的编码对象帧(编码语音/音乐信号)(步骤S18)。编码方式切換部12在步骤Sll中判定为编码对象帧是语音信号、通过第I编码方式对编码对象帧进行编码的情况下(步骤Sll ;第I编码部),參照存储装置IOd的内容,判定是通过第I编码部13对紧挨着编码对象帧之前的帧(编码之前帧)进行编码,还是通过第2编码部14对编码之前帧进行编码(步骤S12)。位于编码对象帧前面的规定数的帧(包含编码之前帧)的编码结果和编码前的帧本身均存储在存储装置IOd中。编码方式切換部12在步骤S12中判定为通过第I编码部13对编码之前帧进行了编码的情况下(步骤S12 ;是),向第I编码部13发送编码对象帧,第I编码部13通过第I编码方式对从该编码方式切換部12发送的编码对象帧进行编码,经由通信装置IOe输出该编码后的编码对象帧(编码语音/音乐信号)(步骤S17)。编码方式切換部12在步骤S12中判定为通过第2编码部14对编码之前帧进行了编码的情况下(步骤S12 ;否),内部状态计算部16对存储在存储装置IOd中的编码之前帧的编码结果进行解码,得到编码之前帧的解码结果(步骤S13)。通过内置于编码装置10中的解码器(省略图示)或后述的解码装置20得到编码装置10使用的解码結果。另外,为了省略解码所需要的运算,也可以代替对编码之前帧的编码结果进行解码后的解码结果,而使用第2编码部14进行编码前的编码之前帧。该编码前的编码之前帧存储在存储装置IOd中。在步骤S13之后,内部状态计算部16使用编码之前帧的解码结果,计算第I编码部13的内部状态(步骤S14)。内部状态计算部16进行的第I编码部13的内部状态的计算处理存在如下处理作为对编码之前帧的解码结果进行处理并计算内部状态的例子,根据编码之前帧的解码结果(或者第2编码部14进行编码前的编码之前帧),使用协方差法等方法求出线性预测系数,然后,使用该求出的线性预测系数对解码结果应用线性预测逆滤波器,从而求出残差信号。另外,由于根据编码之前帧的解码结果求出线性预测系数的处理的运算量大,所以内部状态计算部16也可以代替根据编码之前帧的解码结果求出线性预测系数,而使用在编码之前帧附近通过第I编码方式编码的帧(位于编码之前帧前面的帧)中的线性预测系数(存储在存储装置IOd中)作为上述处理(第I编码部13的内部状态的计算处理)的线性预测系数,或者,还可以使用在帧间内插了该线性预测系数而得到的值作为上述处理(第I编码部13的内部状态的计算处理)的线性预测系数。进而,内部状态计算部16也可以使用通过使用编码之前帧附近的通过第I编码方式编码的帧中的线性预测系数进行外插而得到的值、或者通过使用在帧间内插了这些线性预测系数后的值进行外插而得到的值,作为上述处理(第I编码部13的内部状态的计算处理)的线性预测系数。内部状态计算部16也可以针对将线性预测系数转换为线谱频率后的值实施外插,将该外插结果再次转换为线性预测系数。并且,在编码对象帧的码中包含编码之前帧的线性预测系数的情况下,内部状态计算部16也可以使用该编码对象帧的码中包含的线性预测系数作为上述处理(第I编码部13的内部状态的计算处理)的线性预测系数。并且,内部状态计算部16也可以不计算线性预测系数,而直接使用编码之前帧的解码结果作为残差信号的替代品。进而,也可以使用在针对位于编码之前帧附近的通过第I编码方式编码的帧(位于编码之前帧前面的帧)进行编码的过程中得到的内部状态(表示该内部状态的信息被存储在存储装置IOd中),对第I编码部13的内部状态进行初始化。并且,也可以不针对帧全体而仅针对帧的一部分进行对编码之前帧的解码结果应用线性预测逆滤波器的处理。在步骤S14之后,内部状态初始化方法确定部17根据编码对象帧或者编码之前帧 的解码结果,确定使用由内部状态计算部16计算出的内部状态对第I编码部13的内部状态进行初始化、或者利用“O”进行初始化等预先确定的初始化方法中的任意一种初始化方法(步骤S15)。然后,内部状态初始化方法确定部17通过在步骤S15中确定的初始化方法,对第I编码部13的内部状态进行初始化(步骤S16)。由内部状态初始化方法确定部17进行的第I编码部13的内部状态的初始化,是使用由内部状态计算部16计算出的内部状态对第I编码部13的内部状态进行初始化的处理,但是,也可以包含对在第I编码方式的残差信号的计算中使用的第I编码部13的线性预测合成滤波器的内部状态(延迟要素所保持的值)进行初始化的处理。并且,在确定第I编码部13的内部状态的初始化方法的情况下,内部状态初始化方法确定部17例如可以使用包含上述2个初始化方法在内的多个初始化方法,分别对编码对象帧尝试基于第I编码方式的编码,其结果,选择平方误差或听觉加权误差小的初始化方法。在步骤S16中内部状态初始化方法确定部17对第I编码部13的内部状态进行了初始化之后,第I编码部13通过第I编码方式对编码对象帧进行编码,经由通信装置IOe输出该编码后的编码对象帧(编码语音/音乐信号)(步骤S17)。另外,也可以构成为,码复用部15在基于第I编码方式的编码结果中复用内部状态初始化方法确定部17在步骤S15中选择出的初始化方法的信息,作为辅助信息。并且,还可以构成为,根据在第I编码部13和第2编码部14与解码器(内置于编码装置10中的解码器或解码装置20)之间共同得到的信息(參照下述),确定第I编码部13的内部状态的初始化方式,该情况下,码复用部15不在编码结果中复用表示第I编码部13的内部状态的初始化方法的辅助信息。例如,在第I编码方式中的编码对象帧的自适应码本较大的情况下、或者编码之前帧中的解码结果的周期性较高的情况下等,内部状态初始化方法确定部17可以使用由内部状态计算部16计算出的内部状态对第I编码部13的内部状态进行初始化。并且,也可以构成为,省略内部状态初始化方法确定部17,第I编码部13始终使用由内部状态计算部16计算出的内部状态对自身的内部状态进行初始化。并且,构成为在通过编码方式切換部12刚从第2编码方式切换为第I编码方式之后(第I切换步骤之后),内部状态计算部16和内部状态初始化方法确定部17对编码对象帧进行上述处理(第I初始化步骤),但是不限于此,也可以构成为,在对通过编码方式切換部12正要从第2编码方式切换为第I编码方式之前(编码对象帧之前)的编码之前帧进行编码吋,内部状态计算部16和内部状态初始化方法确定部17进行上述处理。并且,例示了在第I编码方式(第I编码部13)和第2编码方式(第2编码部14)的2个编码方式之间进行切換的结构,但是,也可以构成为,存在多个与第I编码方式不同的编码方式,在3个以上的编码方式之间进行切换。 图I和图4是示出实施方式的解码装置20的结构的图。解码装置20在物理上具有包含CPU20a、R0M20b、RAM20c、存储装置20d和通信装置20e等的计算机装置,这些CPU20a 通信装置20e与总线20f连接。CPU20a通过将存储在R0M20b等内置存储器中的规定计算机程序(例如用于执行图5所示的流程图的处理的声音信号解码程序)加载到RAM20c中执行,对解码装置20进行统ー控制。存储装置20d是写入/读出自如的存储器,存储各种计算机程序、执行计算机程序所需要的各种数据等(例如在第I编码方式的解码中使用的自适应码本和线性预测系数、其他的基于第I编码方式和第2编码方式的解码所需要的各种參数、规定数的解码前后的帧等)。存储装置20d至少存储最后(之前)解码的ー个中贞的语音/音乐信号。并且,解码装置20在功能上具有编码方式判定部22(第I解码判定単元、第2解码判定単元)、码分离部23、第I解码部24 (第I解码单元)、第2解码部25 (第2解码单元)、内部状态初始化方法确定部26 (解码初始化単元)、内部状态计算部27 (解码内部状态计算单元)。这些编码方式判定部22 内部状态计算部27是通过CPU 20a执行存储在ROM 20b等解码装置20的内置存储器中的上述计算机程序、使图I所示的解码装置20的各结构部动作而实现的功能。CPU 20a通过执行上述声音信号解码程序(使用编码方式判定部22 内部状态计算部27),执行图5的流程图所示的处理。接着,參照图5说明解码装置20的动作。编码方式判定部22判定使用第I编码方式和第2编码方式中的哪ー个编码方式对被编码的经由通信装置20e输入的编码语音/音乐信号的解码对象帧进行编码,根据该判定結果,向通过第I编码方式进行解码的第I解码部24或通过第2编码方式进行解码的第2解码部25中的任意一方发送解码对象帧(步骤S21 ;第2切换步骤)。在步骤S21中,在通过第I编码方式对解码对象帧进行编码的情况下,编码方式判定部22判定为通过第I解码部24进行解码,在通过第2编码方式对解码对象帧进行编码的情况下,编码方式判定部22判定为通过第2解码部25进行解码。然后,在该第2切换步骤之后,执行用于对第I解码部24的内部状态(自适应码本的内容或线性预测合成滤波器的延迟要素所保持的值等,以下相同)进行初始化的第2初始化步骤(步骤S22 S27)。编码方式判定部22在步骤S21中判定为通过第2编码方式对解码对象帧进行编码(即通过第2解码部25进行解码)的情况下(步骤S21 ;第2解码部),向第2解码部25发送解码对象帧,第2解码部25通过第2编码方式对从该编码方式判定部22发送的解码对象帧进行解码,经由通信装置20e输出该解码后的解码对象帧(解码语音/音乐信号)(步骤S27)。编码方式判定部22在步骤S21中判定为通过第I编码方式对解码对象帧进行编码(即通过第I解码部24进行解码)的情况下(步骤S21 ;第I解码部),參照存储装置20d的内容,判定是通过第I编码方式对紧挨着解码对象帧之前的帧(解码之前帧)进行了编码(即通过第I解码部24进行了解码),还是通过第2编码方式对解码之前帧进行了编码(即通过第2解码部25进行了解码)(步骤S22)。位于解码对象帧前面的规定数的帧(包含解码之前帧)的解码结果和解码前后的帧本身均存储在存储装置20d中。编码方式判定部22在步骤S22中判定为通过第I编码方式对解码之前帧进行了编码(即通过第I解码部24进行了解码)的情况下(步骤S22 ;是),向第I解码部24发送解码对象帧,第I解码部24通过第I编码方式对从该编码方式判定部22发送的解码对象帧进行解码,经由通信装置20e输出该解码后的解码对象帧(解码语音/音乐信号)(步骤S26)。编码方式判定部22在步骤S22中判定为通过第2编码方式对解码之前帧进行了编码(即通过第2解码部25进行了解码)的情况下(步骤S22 ;否),向码分离部23发送解码之前帧,码分离部23将解码之前帧的复用的码分离为基于第I编码方式的码和表示第I解码部24的内部状态的初始化方法的辅助信息(例如由内部状态初始化方法确定部17确定的表示第I编码部13的内部状态的初始化方法、即在对解码之前帧进行编码时使用的初始化方法的信息)。然后,内部状态计算部27使用解码之前帧的解码結果,计算第I解码部24 的内部状态(步骤S23)。内部状态计算部27进行的第I解码部24的内部状态的计算处理存在如下处理作为对编码之前帧的解码结果进行处理来计算内部状态的例子,根据解码之前帧的解码结果,利用协方差法等方法求出线性预测系数,然后,使用该求出的线性预测系数对解码结果应用线性预测逆滤波器,从而求出残差信号。另外,由于根据解码之前帧的解码结果求出线性预测系数的处理的运算量大,所以内部状态计算部27也可以代替根据解码之前帧的解码结果求出线性预测系数,而使用位于解码之前帧附近的通过第I编码方式编码的帧(位于解码之前帧前面的帧)中的线性预测系数(通过第I解码部24解码时的线性预测系数,存储在存储装置20d中)作为上述处理(第I解码部24的内部状态的计算处理)的线性预测系数,或者,还可以使用在帧间内插了该线性预测系数而得到的值作为上述处理(第I解码部24的内部状态的计算处理)的线性预测系数。进而,内部状态计算部27也可以使用通过使用位于解码之前帧附近的通过第I编码方式编码的帧中的线性预测系数进行外插而得到的值、或者通过使用在帧间内插了这些线性预测系数后的值进行外插而得到的值,作为上述处理(第I解码部24的内部状态的计算处理)的线性预测系数。内部状态计算部27也可以针对将线性预测系数转换为线谱频率后的值实施外插,将该外插结果再次转换为线性预测系数。并且,在解码对象帧的码中包含解码之前帧的线性预测系数的情况下,内部状态计算部27也可以使用该解码对象帧的码中包含的线性预测系数作为上述处理(第I解码部24的内部状态的计算处理)的线性预测系数。或者,通过省略线性预测逆滤波器的应用,也可以省略线性预测系数的计算。进而,也可以使用在针对位于解码之前帧附近的通过第I编码方式编码的帧(位于解码之前帧前面的帧)进行解码的过程中得到的内部状态(表示该内部状态的信息被存储在存储装置20d中),对第I解码部24的内部状态进行初始化。并且,也可以不针对帧全体而仅针对帧的一部分进行对解码之前帧的解码结果应用线性预测逆滤波器的处理。在步骤S23之后,内部状态初始化方法确定部26根据表示解码之前帧的复用的码中包含的表示第I解码部24的内部状态的初始化方法的辅助信息,确定使用由内部状态计算部27计算出的内部状态对第I解码部24的内部状态进行初始化、或者利用“O”进行初始化等预先确定的方法中的任意一种初始化方法(步骤S24)。然后,内部状态初始化方法确定部26通过在步骤S24中确定的初始化方法,对第I解码部24的内部状态进行初始化(步骤S25)。由内部状态初始化方法确定部26进行的第I解码部24的内部状态的初始化,是使用由内部状态计算部27计算出的内部状态对第I解码部24的内部状态进行初始化的处理,但是,也可以包含对根据第I编码方式的残差信号计算输出信号的第I解码部24的线性预测合成滤波器的内部状态(延迟要素所保持的值)进行初始化的处理。在步骤S25中内部状态初始化方法确定部26对第I解码部24的内部状态进行了初始化之后,第I解码部24通过第I编码方式对解码对象帧进行解码,经由通信装置20e输出该解码后的解码对象帧(解码语音/音乐信号)(步骤S26)。另外,也可以不在解码之前帧的码中复用表示第I解码部24的内部状态的初始化方法的辅助信息,而使用第I编码方式中的对象编码帧的固定码本增益、或对解码之前帧中的解码结果的周期性进行了分析的结果等(使用在第I解码部24和第2解码部25与编码器(内置于解码装置20中的编码器或第I编码部13)之间共同得到的信息),确定第I解码部24的内部状态的初始化方法。并且,也可以构成为,省略内部状态初始化方法确定部 26,第I解码部24始终使用由内部状态计算部27计算出的内部状态对自身的内部状态进行初始化。该情况下,不需要使用表示初始化方法且在解码之前帧的码中复用的辅助信息。并且,内部状态计算部27的动作和内部状态初始化方法确定部26的动作是通过第2编码方式对解码之前帧进行了编码、通过第I编码方式对解码对象帧进行了编码时的动作,但是不限于此,在通过预读已经决定了通过第2编码方式对解码对象帧进行了编码、通过第I编码方式对紧挨着解码对象帧之后的帧进行编码的情况下,内部状态计算部27和内部状态初始化方法确定部26也可以分别根据预读信息进行第I解码部24的内部状态的计算和 内部状态初始化方法的选择。并且,例示了在第I编码方式和第2编码方式的2个编码方式之间进行切换的结构,但是,也可以构成为,存在多个与第I编码方式不同的编码方式,在3个以上的编码方式之间进行切換。接着,说明实施方式的编码装置10的作用效果。编码装置10具有基于线性预测编码方式的第I编码部13、以及基干与线性预测编码方式不同的其他编码方式的第2编码部14,使用第I编码部13和第2编码部14对声音信号进行编码。编码装置10还具有编码方式切換部12、内部状态计算部16和内部状态初始化方法确定部17。编码方式切換部12判定通过第I编码部13或第2编码部14中的哪ー个对声音信号中包含的作为编码对象的编码对象帧进行编码。并且,编码方式切換部12在判定为通过第I编码部13对编码对象帧进行编码的情况下,判定是通过第I编码部13对紧挨着编码对象帧之前的编码之前帧进行编码,还是通过第2编码部14对编码之前帧进行编码。在通过编码方式切換部12判定为通过第2编码部14对编码之前帧进行编码的情况下,内部状态计算部16对编码之前帧的编码结果进行解码,使用该解码结果计算第I编码部13的内部状态。内部状态初始化方法确定部17使用由内部状态计算部16计算出的内部状态对第I编码部13的内部状态进行初始化。然后,在内部状态初始化方法确定部17对内部状态进行初始化之后,第I编码部13对编码对象帧进行编码。根据编码装置10,在通过基于与线性预测编码方式不同的编码方式的第2编码部14对通过基于该线性预测编码方式的第I编码部13进行编码的编码对象帧前面的编码之前帧进行了编码的情况下,通过对第I编码部13的内部状态进行初始化,也能够通过线性预测编码方式进行编码对象帧的编码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理。接着,说明实施方式的解码装置20的作用效果。解码装置20具有基于线性预测编码方式的第I解码部24、以及基干与线性预测编码方式不同的其他编码方式的第2解码部25,使用第I解码部24和第2解码部25对编码声音信号进行解码。解码装置20还具有编码方式判定部22、内部状态计算部27和内部状态初始化方法确定部26。编码方式判定部22判定通过第I解码部24或第2解码部25中的哪 ー个对编码声音信号中包含的作为解码对象的解码对象帧进行解码。并且,在由编码方式判定部22判定为通过第I解码部24对解码对象帧进行解码的情况下,编码方式判定部22判定是通过第I解码部24对紧挨着解码对象帧之前的解码之前帧进行解码,还是通过第2解码部25对解码之前帧进行解码。在通过编码方式判定部22判定为通过第2解码部25对解码之前帧进行了解码的情况下,使用解码之前帧的解码结果计算第I解码部24的内部状态。使用由内部状态计算部27计算出的内部状态对第I解码部24的内部状态进行初始化。然后,在内部状态初始化方法确定部26对内部状态进行初始化之后,第I解码部24对解码对象帧进行解码。根据解码装置20,即使在通过基于与线性预测编码方式不同的编码方式的第2解码部25对使用基于该线性预测编码方式的第I解码部24进行解码的解码对象帧前面的解码之前帧进行了解码的情况下,通过对第I解码部24的内部状态进行初始化,也能够通过线性预测编码方式进行解码对象帧的解码。因此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的解码处理。产业上的可利用性在从不使用线性预测的编码方式切換为基于线性预测编码的编码方式的情况下,将基于线性预测编码的编码方式的编码单元或解码单元的内部状态的初始值设定为适当的值,改善刚刚切换之后的帧中的语音品质。标号说明10 :编码装置;10a、20a CPU ;10b、20b R0M ;10c、20c :RAM ; 10d、20d :存储装置;10e、20e :通信装置;10f、20f :总线;12 :编码方式切换部;13 第I编码部;14 第2编码部;15 :码复用部;16、27 :内部状态计算部;17、26 :内部状态初始化方法确定部;20 :解码装置;22 :编码方式判定部;23 :码分离部;24 :第I解码部;25 :第2解码部。
权利要求
1.ー种声音信号编码方法,该声音信号编码方法使用基于线性预测编码方式的第I编码单元和基干与线性预测编码方式不同的编码方式的第2编码单元,对由多个帧构成的声音信号进行编码,其特征在于,该声音信号编码方法具有如下步骤 切换步骤,在通过所述第2编码单元对所述声音信号的第I帧进行了编码后,将对紧挨着该第I帧之后的第2帧进行编码的编码单元从所述第2编码单元切換为所述第I编码单元;以及 初始化步骤,在所述切换步骤之后,通过规定方法对所述第I编码单元的内部状态进行初始化, 在所述初始化步骤中,通过将残差信号设定为所述第I编码单元的自适应码本的内容,对所述第I编码单元的内部状态进行初始化,所述残差信号是针对所述第2编码单元的编码前的所述第I帧、或者对基于所述第2编码单元的所述第I帧的编码结果进行解码而得到的信号应用线性预测逆滤波器而得到的, 所述第2帧的码中包含所述第I帧的线性预测系数,在所述初始化步骤中,将该线性预测系数用于所述线性预测逆滤波器。
2.ー种声音信号解码方法,该声音信号解码方法使用基于线性预测编码方式的第I解码单元和基干与线性预测编码方式不同的编码方式的第2解码单元,对由多个编码帧构成的编码声音信号进行解码,其中所述多个编码帧根据由多个帧构成的声音信号生成,其特征在于,该声音信号解码方法具有如下步骤 切换步骤,在通过所述第2解码单元对根据所述声音信号的第I帧生成的所述编码声音信号的第I编码帧进行了解码后,将对紧挨着该第I编码帧之后的第2编码帧进行解码的解码单元从所述第2解码单元切換为所述第I解码单元,其中所述第2编码帧根据所述声音信号中紧挨着所述第I帧之后的第2帧生成;以及 初始化步骤,在所述切换步骤之后,通过规定方法对所述第I解码单元的内部状态进行初始化, 在所述初始化步骤中,通过将残差信号设定为所述第I解码单元的自适应码本的内容,对所述第I解码单元的内部状态进行初始化,所述残差信号是针对由所述第2解码单元对所述第I编码帧进行解码而得到的信号应用线性预测逆滤波器而得到的, 所述第2编码帧的码中包含所述第I帧的线性预测系数,在所述初始化步骤中,将该线性预测系数用于所述线性预测逆滤波器。
3.一种编码装置,该编码装置具有基于线性预测编码方式的第I编码单元和基干与所述线性预测编码方式不同的其他编码方式的第2编码单元,使用所述第I编码单元和所述第2编码单元对声音信号进行编码,其特征在干,该编码装置具有 第I判定単元,其判定利用所述第I编码单元或所述第2编码单元中的哪ー个对所述声音信号中包含的作为编码对象的对象帧进行编码; 第2判定単元,其在由所述第I判定単元判定为通过所述第I编码单元对所述对象帧进行编码的情况下,判定是通过所述第I编码单元对紧挨着所述对象帧之前的之前帧进行了编码,还是通过所述第2编码单元对所述之前帧进行了编码; 内部状态计算単元,其在由所述第2判定単元判定为通过所述第2编码单元对所述之前帧进行了编码的情况下,针对对所述之前帧的编码结果进行解码而得到的信号应用线性预测逆滤波器而求出残差信号,从而计算所述第I编码单元的内部状态;以及 初始化单元,其通过将由所述内部状态计算单元计算出的所述残差信号设定为所述第I编码单元的自适应码本的内容,对所述第I编码单元的内部状态进行初始化, 所述对象帧的码中包含所述之前帧的线性预测系数,所述内部状态计算単元将该线性预测系数用于所述线性预测逆滤波器, 在所述初始化单元进行的所述内部状态的初始化后,所述第I编码单元对所述对象帧进行编码。
4.一种解码装置,该解码装置具有基于线性预测编码方式的第I解码单元和基干与所述线性预测编码方式不同的其他编码方式的第2解码单元,使用所述第I解码单元和所述第2解码单元对根据声音信号生成的编码声音信号进行解码,其特征在干,该解码装置具有 第I判定単元,其判定利用所述第I解码单元或所述第2解码单元中的哪ー个对所述编码声音信号中包含的作为解码对象的对象编码帧进行解码; 第2判定単元,其在由所述第I判定単元判定为通过所述第I解码单元对所述对象编码帧进行解码的情况下,判定是通过所述第I解码单元对紧挨着所述对象编码帧之前的之前編码帧进行了解码,还是通过所述第2解码单元对所述之前編码帧进行了解码; 内部状态计算単元,其在由所述第2判定単元判定为通过所述第2解码单元对所述之前編码帧进行了解码的情况下,针对对所述之前編码帧进行解码而得到的信号应用线性预测逆滤波器而计算残差信号,从而计算所述第I解码单元的内部状态;以及 初始化单元,其通过将由所述内部状态计算单元计算出的所述残差信号设定为所述第I解码单元的自适应码本的内容,对所述第I解码单元的内部状态进行初始化, 所述之前编码帧和所述对象编码帧分别根据所述声音信号的第I帧和在该声音信号中紧挨着该第I帧之后的第2帧生成,所述对象编码帧的码中包含所述第I帧的线性预测系数,所述内部状态计算単元将该线性预测系数用于所述线性预测逆滤波器, 在所述初始化単元对所述内部状态进行了初始化后,所述第I解码单元对所述对象编码帧进行解码。
5.—种声音信号处理系统,其特征在于, 该声音信号处理系统具有权利要求3所述的编码装置和权利要求4所述的解码装置, 所述解码装置对由所述编码装置进行了编码的编码声音信号进行解码。
全文摘要
本发明提供声音信号编解码方法、编解码装置和声音信号处理系统。在通过基于与线性预测编码方式不同的编码方式的第2编码部(14)对通过基于该线性预测编码方式的第1编码部(13)进行编码的编码对象帧前面的编码之前帧进行编码的情况下,通过对第1编码部(13)的内部状态进行初始化,能够通过线性预测编码方式进行编码对象帧的编码。由此,能够实现包含线性预测编码方式和与线性预测编码方式不同的其他编码方式的编码处理。
文档编号G10L19/14GK102737641SQ20121024171
公开日2012年10月17日 申请日期2010年3月3日 优先权日2009年3月6日
发明者仲信彦, 菊入圭, 辻野孝辅 申请人:株式会社Ntt都科摩
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1