使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备的制作方法

文档序号:2824763阅读:175来源:国知局
专利名称:使用自适应正弦波脉冲编码的用于音频信号的编码/解码方法及其设备的制作方法
技术领域
本发明的示范实施例涉及一种用于对音频信号进行编码和解码的方法和设备;且更具体地,涉及一种用于使用自适应正弦脉冲编码来对音频信号进行编码和解码的方法和设备。
背景技术
由于用于数据传送的带宽随着通信技术的发展而增加,所以用户对于使用多声道语音和音频的高质量服务的需求正在增加。首先,高质量语音和音频服务的提供需要能够有效地对立体声语音和音频信号进行压缩和解压缩的编码技术。因此,对于用于编码窄带(NB :300-3, 400赫兹(Hz))、宽带(WB :50_7,OOOHz)、和超宽带(SWB :50-14, OOOHz)信号的编解码器的扩展研究正在进行中。例如,ITU-T G. 729. 1 是代表性扩展编解码器,其是基于G. 729的WB扩展编解码器(NB编解码器)。此编解码器按照8千比特/秒(Icbit/s)来提供与G. 729的比特流级别的兼容性,并且按照12千比特 /秒来提供较好质量的NB信号。在14-32千比特/秒的范围中,编解码器可以对具有2千比特/秒的比特率可伸缩性的WB信号进行编码,并且输出信号的质量随着比特率增加而改

口 ο近来,正在开发能够基于G. 729. 1提供SWB信号的扩展编解码器。此扩展编解码器可以对NB、WB和SWB信号进行编码和解码。在这种扩展编解码器中,正弦脉冲编码可以用于改善所合成信号的质量。当使用正弦脉冲编码时,需要考虑输入信号的能量,以增加编码效率。具体地,当可用于正弦脉冲编码的比特的数目不足时,有效的是,优先编码对于所合成信号的质量具有较大影响的频带(即,具有相对大量能量的频带)。

发明内容
技术问题本发明的实施例针对一种用于对音频信号进行编码和解码的方法和设备,其可以使用正弦脉冲编码来改善合成信号的质量。本发明的另一实施例针对一种用于对音频信号进行编码和解码的方法和设备,其可以通过基于对于合成信号的每个子带的能量数量的考虑、而应用正弦脉冲编码,来更加有效地改善合成信号的质量。本发明的目的不限于上述的目的,并且本发明的其他目的和优点可以通过以下描述来理解,并可以参考本发明的实施例而变得明显。同样,对于本发明所属技术领域的技术人员显而易见的是,可以通过所要求保护的手段及其组合来实现本发明的目的和优点。技术解决方案根据本发明的实施例,一种用于对音频信号进行编码的方法包括将所转换的音频信号划分为多个子带;计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲编码。根据本发明的另一实施例,一种用于对音频信号进行编码的设备包括输入单元, 被配置为接收所转换的音频信号;计算单元,被配置为将所合成的音频信号划分为多个子带,计算所述子带中的每个子带的能量,并且从所述子带中选择具有相对大量能量的预定数目的子带;以及编码单元,被配置为对于所选择的子带执行正弦脉冲编码。根据本发明的另一实施例,一种用于对音频信号进行解码的方法包括接收所转换的音频信号;将所编码的音频信号划分为多个子带;计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲解码。根据本发明的另一实施例,一种用于对音频信号进行解码的设备包括输入单元, 被配置为接收所转换的音频信号;计算单元,被配置为将所编码的音频信号划分为多个子带,计算所述子带中的每个子带的能量,并且从所述子带中选择具有相对大量能量的预定数目的子带;以及解码单元,被配置为对于所选择的子带执行正弦脉冲解码。根据本发明的另一实施例,一种用于对音频信号进行编码的方法包括接收音频信号;对于该音频信号执行改进的离散余弦变换(MDCT),以输出MDCT系数;使用该MDCT系数来对高频音频信号进行合成;以及对于该高频音频信号执行正弦脉冲编码。根据本发明的另一实施例,一种用于对音频信号进行编码的设备包括输入单元, 被配置为接收音频信号;MDCT单元,被配置为对于该音频信号执行MDCT,以输出MDCT系数; 合成单元,被配置为使用该MDCT系数来对高频音频信号进行合成;以及正弦脉冲编码单元,被配置为对于该高频音频信号执行正弦脉冲编码。根据本发明的另一实施例,一种用于对音频信号进行解码的方法包括接收音频信号;对于该音频信号执行MDCT,以输出MDCT系数;使用该MDCT系数来对高频音频信号进行合成;以及对于该高频音频信号执行正弦脉冲解码。根据本发明的另一实施例,一种用于对音频信号进行解码的设备包括输入单元, 被配置为接收音频信号;MDCT单元,被配置为对于该音频信号执行MDCT,以输出MDCT系数; 合成单元,被配置为使用该MDCT系数来对高频音频信号进行合成;以及正弦脉冲解码单元,被配置为对于该高频音频信号执行正弦脉冲解码。有益效果根据本发明的示范实施例,使用正弦脉冲编码来改善合成信号的质量。另外,基于对于合成信号的每个子带的能量数量的考虑的正弦脉冲编码的应用更加有效地改善了合成信号的质量。


图1示出了用于提供与NB编解码器的兼容性的SWB扩展编解码器的结构。图2示出了根据本发明实施例的音频信号编码设备的构造。图3示出了根据本发明实施例的音频信号解码设备的构造。图4是示出了根据本发明实施例的音频信号编码方法的流程图。图5是示出了根据本发明实施例的执行正弦脉冲编码的步骤(图4中的S410)的流程图。图6是示出了根据本发明实施例的音频信号解码方法的流程图。图7示出了传统的正弦脉冲编码与根据本发明的自适应正弦脉冲编码的结果之间的比较。图8示出了根据本发明另一实施例的音频信号编码设备的构造。图9示出了根据本发明另一实施例的音频信号解码设备的构造。
具体实施例方式下面,将参考附图来更加详细地描述本发明的示范实施例。然而,本发明可以按照不同的形式来实施,并且不应被诠释为限于在这里提出的实施例。相反地,提供这些实施例,使得本公开将是彻底和完全的,并将向本领域技术人员充分地传达本发明的范围。贯穿整个公开中,贯穿本发明的各个图和实施例中,同样的附图标记表示同样的部分。图1示出了用于提供与NB编解码器的兼容性的SWB扩展编解码器的结构。一般地,扩展编解码器具有以下构造,其中将输入信号划分为多个频带,并且对相应频带中的信号进行编码或解码。参考图1,将输入信号输入到初级低通滤波器102和初级高通滤波器104。将初级低通滤波器102配置为执行滤波和下采样,使得输出输入信号的低频带信号A(0-8千赫兹(kHz))。将初级高通滤波器104配置为执行滤波和下采样,使得输出输入信号的高频带信号B(8-16kHz)。将从初级低通滤波器102输出的低频带信号A输入到次级低通滤波器106和次级高通滤波器108。将次级低通滤波器106配置为执行滤波和下采样,使得输出低低频带信号Al (0-4kHz)。将次级高通滤波器108配置为执行滤波和下采样,使得输出低高频带信号 A2 (4-8kHz)。结果,将低低频带信号Al输入到NB编码模块110,将低高频带信号A2输入到WB 扩展编码模块112,并且将高频带信号B输入到SWB扩展编码模块114。当NB编码模块110 单独地进行操作时,仅仅重新生成NB信号,并且当NB编码模块110和WB扩展编码模块112 两者进行操作时,重新生成WB信号。当NB编码模块110、WB扩展编码模块112和SWB扩展编码模块114全部都进行操作时,重新生成SWB信号。图1所示的扩展编解码器的代表性示例可以是ITU-T G.729. 1,其是基于G. 7 的 WB扩展编解码器(NB编解码器)。此编解码器按照81Ait/S来提供与G. 729的比特流级别的兼容性,并且按照121cbit/S来提供质量被大大改善的NB信号。在14-321cbit/S的范围中,编解码器可以对具有21Ait/S的比特率可伸缩性的WB信号进行编码,并且输出信号的质量由于比特率增加而改善。近来,正在开发能够基于G. 729. 1来提供SWB质量的扩展编解码器。此扩展编解码器可以对NB、WB和SWB信号进行编码和解码。在这种扩展编解码器中,可以将不同的编码方案应用于如图1所示的相应频带。 例如,G. 729. 1和G. 711. 1编解码器采用其中使用传统的NB编解码器(S卩,G. 7 和G. 711) 来对NB信号进行编码的编码方案,并且对于剩余信号执行改进的离散余弦变换(MDCT),使得对所输出的MDCT系数进行编码。在MDCT域编码的情况下,将MDCT系数划分为多个子带,对每个子带的增益和形状进行编码,并且使用代数码激励线性预测(ACELP)或正弦脉冲来对MDCT系数进行编码。扩展编解码器一般具有以下结构,其中首先对用于带宽扩展的信息进行编码,并然后对用于质量改善的信息进行编码。例如,使用每个子带的增益和形状来对7_14kHz频带中的信号进行合成,并且使用ACELP或正弦脉冲编码来改善合成信号的质量。具体地,在用于提供SWB质量的第一层中,使用诸如增益和形状之类的信息来对与7-14kHz波段对应的信号进行合成。然后,使用附加比特来应用例如正弦脉冲编码,以改善合成信号的质量。由于比特率增加,所以此结构可以改善合成信号的质量。一般地,在正弦脉冲编码的情况下,对与在给定间隔中具有最大幅度的脉冲(即, 对于质量具有最大影响的脉冲)的位置、幅度和符号有关的信息进行编码。计算的数量与这种脉冲搜索间隔成比例地增加。因此,取代了将正弦脉冲编码应用于整个帧(在时域的情况下)或整个频带,优选地将正弦脉冲编码应用于每个子帧或子带。正弦脉冲编码的有利之处在于,尽管需要相对大数目的比特来传送一个脉冲,但是可以准确地表达影响信号质量的信号。输入到编解码器的信号的能量分布取决于频率而变化。具体地,在音乐信号的情况下,频率方面的能量变化比在语音信号的情况下更加严重。具有大量能量的子带中的信号对于合成信号的质量具有更大的影响。如果存在足够的比特来对整个子带进行编码,则将不会存在问题,但是如果并非如此,则有效的是,优先编码对于合成信号的质量具有大影响的子带中的(即,具有大量能量的)信号。本发明针对音频信号的编码和解码,其可以在如图1所示的扩展编解码器的情况下,通过基于对于有限比特数目的考虑执行更有效的正弦脉冲编码,来改善合成信号的质量。在下文中,在本发明的以下描述中将简单地把语音和音频信号称作音频信号。图2示出了根据本发明实施例的音频信号编码设备的构造。参考图2,音频信号编码设备202包括输入单元204、计算单元206和编码单元 208。将输入单元204配置为接收所转换的音频信号,例如作为通过MDCT进行的音频信号的转换的结果的MDCT系数。将计算单元206配置为将已经通过输入单元204所输入的、转换后的音频信号划分为多个子带,并且计算每个子带的能量。将计算单元206配置为从子带中选择具有相对大量能量的、预定数目的子带。该预定数目通过要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目来确定。将编码单元208配置为对于计算单元206所选择的子带执行正弦脉冲编码。编码单元208可以按照能量数量的顺序,对于具有相对大量能量的、预定数目的子带来执行正弦脉冲编码。根据本发明的另一实施例,编码单元208可以按照除了能量数量的顺序之外的顺序(例如,按照带宽或索引的顺序),对于具有相对大量能量的、预定数目的子带来执行正弦脉冲编码。计算单元206可以确认在所选择的子带之中是否存在相邻的子带,并且将相邻的子带合并为一个子带。然后,编码单元208可以然后对于这样所合并的子带来执行正弦脉冲编码。图3示出了根据本发明实施例的音频信号解码设备的构造。参考图3,音频信号解码设备302包括输入单元304、计算单元306和解码单元308。将输入单元204配置为接收所转换的音频信号,例如,MDCT系数。将计算单元306配置为将已经通过输入单元304所输入的、转换后的音频信号划分为多个子带,并且计算每个子带的能量。将计算单元306配置为从子带中选择具有相对大量能量的、预定数目的子带。该预定数目通过要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目来确定。将解码单元308配置为对于计算单元306所选择的子带来执行正弦脉冲解码。解码单元308可以按照能量数量的顺序,对于具有相对大量能量的、预定数目的子带来执行正弦脉冲编码。根据本发明的另一实施例,解码单元308可以按照除了能量数量的顺序之外的顺序(例如,按照带宽或索引的顺序),对于具有相对大量能量的、预定数目的子带来执行正弦脉冲编码。图2和3所示的音频信号编码设备202和音频信号解码设备302可以包括在图1 所示的NB编码模块110、WB扩展编码模块112或SWB扩展编码模块114中。在下文中,将结合图1所示的SWB扩展编码模块114进行的音频信号的示范编码或解码,参考图4到6来描述根据本发明实施例的用于对音频信号进行编码和解码的方法。SffB扩展编码单元114将与7_14kHz对应的MDCT系数划分为多个子带,并且对每个子带的增益和形状进行编码或解码,以获得误差信号。然后,SWB扩展编码模块114对于误差信号来执行正弦脉冲编码或解码。如果存在充足数目的比特要用于正弦脉冲编码,则正弦脉冲编码可以应用于每个子带。然而,由于比特数目在大多数的情况下都很难是充足的,所以仅仅对于有限数目的子带来应用正弦脉冲编码。因此,将正弦脉冲编码应用于对于合成信号的质量具有较大影响的子带保证了在给定相同比特率的情况下获得较好的信号质量。图4是示出了根据本发明实施例的音频信号编码方法的流程图。参考图4,在步骤S402中,在SWB扩展编码模块114中包括的音频信号编码设备接收所转换的音频信号,例如,与7-14kHz对应的MDCT系数。该设备在步骤S404中将所接收到的转换后的音频信号划分为多个子带,并且在步骤S406中对所述多个子带中的每一个子带的能量进行计算。图7示出了被划分为九个子带的MDCT系数、以及每个子带的能量的相对数量。根据图7所清楚的是,子带1、4、5、6和7的能量的数量大于其他子带的能量数量。下面,表1列举了已经被划分为八个子带的MDCT系数的索引和能量。表 权利要求
1.一种用于对音频信号进行编码的方法,包括 接收所合成的音频信号;将所合成的音频信号划分为多个子带; 计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲编码。
2.根据权利要求1的方法,其中通过要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目,来确定该预定数目。
3.根据权利要求1的方法,其中所述对于所选择的子带执行正弦脉冲编码的步骤包括确认在所选择的子带之中是否存在相邻的子带; 将所述相邻的子带合并为一个子带;以及对于所合并的子带执行正弦脉冲编码。
4.根据权利要求1的方法,其中在所述对于所选择的子带执行正弦脉冲编码的步骤中,按照能量的数量的顺序,对于所选择的子带执行正弦脉冲编码。
5.一种用于对音频信号进行编码的设备,包括 输入单元,被配置为接收所转换的音频信号;计算单元,被配置为将所转换的音频信号划分为多个子带,计算所述子带中的每个子带的能量,并且从所述子带中选择具有相对大量能量的预定数目的子带;以及编码单元,被配置为对于所选择的子带执行正弦脉冲编码。
6.根据权利要求5的设备,其中该计算单元被配置为基于要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目,来确定该预定数目。
7.根据权利要求5的设备,其中该计算单元被配置为确认在所选择的子带之中是否存在相邻的子带,并且将所述相邻的子带合并为一个子带,并且该编码单元被配置为对于所合并的子带执行正弦脉冲编码。
8.根据权利要求5的设备,其中该编码单元被配置为按照能量的数量的顺序,对于所选择的子带执行正弦脉冲编码。
9.一种用于对音频信号进行解码的方法,包括 接收所转换的音频信号;将所转换的音频信号划分为多个子带; 计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲解码。
10.根据权利要求9的方法,其中通过要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目,来确定该预定数目。
11.根据权利要求9的方法,其中在所述对于所选择的子带执行正弦脉冲解码的步骤中,按照能量的数量的顺序,对于所选择的子带执行正弦脉冲解码。
12.一种用于对音频信号进行解码的设备,包括 输入单元,被配置为接收所转换的音频信号;计算单元,被配置为将所转换的音频信号划分为多个子带,计算所述子带中的每个子带的能量,并且从所述子带中选择具有相对大量能量的预定数目的子带;以及解码单元,被配置为对于所选择的子带执行正弦脉冲解码。
13.根据权利要求12的设备,其中该计算单元被配置为基于要在一个子带中进行编码的正弦脉冲的数目和用于对一个正弦脉冲进行编码所必需的比特数目来确定该预定数目。
14.根据权利要求12的设备,其中该解码单元被配置为按照能量的数量的顺序,对于所选择的子带执行正弦脉冲解码。
15.一种用于对音频信号进行编码的方法,包括 接收音频信号;对于该音频信号执行改进的离散余弦变换(MDCT),以输出MDCT系数; 使用该MDCT系数来对高频音频信号进行合成;以及对于该高频音频信号执行正弦脉冲编码。
16.根据权利要求15的方法,其中所述对于高频音频信号执行正弦脉冲编码的步骤包括将该高频音频信号划分为多个子带; 计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲编码。
17.一种用于对音频信号进行编码的设备,包括 输入单元,被配置为接收音频信号;MDCT单元,被配置为对于该音频信号执行MDCT,以输出MDCT系数; 合成单元,被配置为使用该MDCT系数来对高频音频信号进行合成;以及正弦脉冲编码单元,被配置为对于该高频音频信号执行正弦脉冲编码。
18.根据权利要求17的设备,其中该正弦脉冲编码单元被配置为将该高频信号划分为多个子带,计算所述子带中的每个子带的能量,从所述子带中选择具有相对大量能量的预定数目的子带,并且对于所选择的子带执行正弦脉冲编码。
19.一种用于对音频信号进行解码的方法,包括 接收音频信号;对于该音频信号执行MDCT,以输出MDCT系数; 使用该MDCT系数来对高频音频信号进行合成;以及对于该高频音频信号执行正弦脉冲解码。
20.根据权利要求19的方法,其中所述对于高频音频信号执行正弦脉冲解码的步骤包括将该高频信号划分为多个子带; 计算所述子带中的每个子带的能量;从所述子带中选择具有相对大量能量的预定数目的子带;以及对于所选择的子带执行正弦脉冲解码。
21.一种用于对音频信号进行解码的设备,包括 输入单元,被配置为接收音频信号;MDCT单元,被配置为对于该音频信号执行MDCT,以输出MDCT系数; 合成单元,被配置为使用该MDCT系数来对高频音频信号进行合成;以及正弦脉冲解码单元,被配置为对于该高频音频信号执行正弦脉冲解码。
22.根据权利要求21的设备,其中该正弦脉冲解码单元被配置为将该高频信号划分为多个子带,计算所述子带中的每个子带的能量,从所述子带中选择具有相对大量能量的预定数目的子带,并且对于所选择的子带执行正弦脉冲解码。
全文摘要
本发明涉及一种使用自适应正弦波形脉冲编码的用于音频信号的编码/解码方法及其设备。根据本发明实施例的用于音频信号的编码方法包括将音频信号划分为多个子带的步骤;单独地操作每个子带的能量的步骤;按照预定数目来从所有子带之中选择具有相对较大能量的子带的步骤;以及针对所选择的子带来执行整形波形脉冲编码的步骤。本发明具有以下效果,即通过在考虑到合成信号的每个子带的能量数量的情况下应用正弦波形脉冲编码来有效地增加合成信号的质量。
文档编号G10L19/08GK102396024SQ201080016829
公开日2012年3月28日 申请日期2010年2月16日 优先权日2009年2月16日
发明者李炳墡, 李美淑, 裵贤珠 申请人:韩国电子通信研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1