代码转换方法和设备的制作方法

文档序号：2834570阅读：163来源：国知局

专利名称：代码转换方法和设备的制作方法
技术领域：
本发明涉及用于以低比特率传输或存储语音信号的编解码方法，更具体而言，涉及用于以高声音质量和少量计算对代码进行转换的代码转换方法和装置，所述代码是通过根据某种方案将语音编码成能够根据另一方案被解码的代码而生成的。
背景技术：
作为以中等比特率或低比特率对语音信号进行有效编码的方法，一种广泛使用的方法是将语音信号分离为LP(线性预测)滤波器和用于驱动该滤波器的激励信号，然后编码该语音信号。一种代表性的方法是CELP(码激励线性预测)。CELP用由自适应码本(ACB)和固定码本(FCB)的和所代表的激励信号来驱动LP滤波器以生成合成语音信号，所述自适应码本代表输入语音的基音周期，所述固定码本由随机数和脉冲构成，所述LP滤波器中已设置了代表输入语音的频率特性的LP系数。在此情况下，ACB分量和FCB分量被分别被乘以增益(ACB增益和FCB增益)。关于CELP例如参见M.Schroeder的“Code excited linear predictionHigh quality speech at very low bit rates”，Proc.Of IEEE Int.Conf.on Acoust.，Speech and Signal Processing，第937-940页，1985年。
例如，假设3G(第三代)移动网络和有线分组网络之间进行互连，则会出现如下问题由于二者分别采用不同的标准语音编码方案，因此不能直接连接。为了解决这个问题，可考虑使用串接(tandemconnection)。
图1示出了基于串接的传统代码转换装置的示例，其中通过使用第一语音编码方案对语音编码所生成的代码被转换为可根据第二语音编码方案被解码的代码。第二语音编码方案一般与第一语音编码方案不同。在下文中，为了说明的简明，第一语音编码方案被简称为“方案1”，通过使用第一语音编码方案对语音编码所生成的代码被称为“第一码串数据”。类似地，第二语音编码方案被简称为“方案2”，通过使用第二语音编码方案对语音编码所生成的代码被称为“第二码串数据”。假设码串数据以帧周期(例如20毫秒的周期)被传送，所述帧周期是语音编码/解码的处理单元。关于语音编码方法和解码方法，参见上述Schroeder的文章或3GPP标准“AMR Speech codecTranscoding functions”(3GPP TS 26.090)。
参照图1，下面将给出对基于串接的传统代码转换装置的描述。
在该代码转换装置中，输入端10、语音解码电路1050、语音编码电路1060和输出端20被依次串联。语音解码电路1050利用遵循方案1的解码方法，对来自通过输入端10而向其提供的第一码串数据的语音进行解码，并将解码后语音作为第一解码语音提供给语音编码电路1060。语音编码电路1060接收从语音解码电路1050传递来的第一解码语音，并将通过根据第二语音编码方法对第一解码语音编码而生成的码串数据作为第二码串数据通过输出端20进行传递。
但是，基于串接的上述传统代码转换装置对如下的解码语音信号进行重编码，其中所述解码语音信号是通过利用方案1的语音解码电路对所提供的第一码串数据进行解码而生成的，由于即使其信号特性由于编码所产生的恶化而不适于被重编码，也会利用方案2的语音编码电路进行重编码，因此出现了这样的问题如果通过这些代码转换而生成的第二码串数据根据方案2被解码，则在最终被解码的语音中语音质量会恶化。

发明内容
本发明的一个目的是提供一种用于对经编码的语音进行解码和重编码的代码转换方法，该方法能够减轻最终生成的语音信号的语音质量的恶化。
本发明的另一个目的是提供一种用于对经编码的语音进行解码和重编码的代码转换装置，该装置能够减轻最终生成的语音信号的语音质量的恶化。
本发明的第一个目的可利用用于将遵从第一语音编码方案的第一码串数据转换为遵从第二语音编码方案的第二码串数据的代码转换方法来实现。所述方法包括以下步骤对所述第一码串数据解码，以生成第一解码语音；矫正所述第一解码语音的信号特性，以生成第二解码语音；以及根据所述第二语音编码方案对所述第二解码语音编码，以生成所述第二码串数据。
在本发明的代码转换方法中，在生成第二解码语音的步骤中，信号特性优选地被具有根据第一解码语音的特性而改变的特性的滤波器所矫正。此外，在生成第二解码语音的步骤中，第一解码语音的信号特性优选地被矫正为适于重编码的信号特性。
本发明的第二个目的是利用用于将遵从第一语音编码方案的第一码串数据转换为遵从第二语音编码方案的第二码串数据的代码转换装置来实现的。所述代码转换装置包括语音解码电路，用于对所述第一码串数据解码，以生成第一解码语音；信号特性矫正电路，用于矫正所述第一解码语音的信号特性，以生成第二解码语音；以及语音编码电路，用于根据所述第二语音编码方案对所述第二解码语音编码，以生成所述第二码串数据。
在根据本发明的代码转换装置中，信号特性矫正电路优选地将第一解码语音的信号特性矫正为适于重编码的信号特性，从而生成第二解码语音。此外，信号特性矫正电路优选地利用具有根据第一解码语音的特性而改变的特性的滤波器来矫正第一解码语音的信号特性，从而生成第二解码语音。
在本发明中，用于矫正第一解码语音的信号特性的滤波器优选地是后置滤波器的逆滤波器、具有用于强调频率的高频带分量的特性的强调滤波器，或作为所述逆滤波器和所述强调滤波器的组合的滤波器。此外，所述滤波器的特性优选地使用以下三者中的至少一个而被改变包括在所述第一码串数据中的帧类型信息、所述第一码串数据的大小以及可从所述第一解码语音计算得到的特性量。
通过利用方案1的语音解码电路进行解码而生成的解码语音信号通常具有这样的信号特性，它由于编码所产生的恶化而不适于重编码。当解码语音信号被方案2的语音编码电路照原样重编码时，从代码转换后的第二码串数据解码得到的语音信号中将有显著的声音质量恶化。在本发明中，利用方案1的语音解码电路，从第一码串数据中解码得到第一码串数据，以生成解码语音信号，该信号的信号特性被矫正，然后，矫正后的语音信号被方案2的语音编码电路重编码。结果，根据本发明，在从第二码串数据中解码得到的语音信号中，声音质量中的恶化被减轻。

图1是示出基于串接的传统代码转换装置的配置的框图；图2是示出基于本发明的代码转换的处理过程的流程图；图3是示出根据本发明第一实施例的代码转换装置的配置的框图；图4是示出根据本发明第二实施例的代码转换装置的配置的框图；以及图5是示出基于本发明的代码转换装置的另一示例性配置的框图。
具体实施例方式
图2示出了基于本发明的代码转换方法的处理的流程图。该基于本发明的代码转换方法具有以下步骤(a)到(c)(a)利用方案1的解码方法，从第一码串数据生成第一解码语音(步骤S101)；(b)使用滤波器来矫正第一解码语音，以使其具有适于重编码的信号特性，从而生成第二解码语音(步骤S102、103)；以及(c)利用第二编码方法对第二解码语音编码，以生成第二码串数据(步骤S104)。
于是在本发明中，通过利用方案1的语音解码电路对第一码串数据解码而生成的解码语音信号通过使用滤波器而被矫正，以使其具有适于重编码的信号特性，并且矫正后的解码语音信号被方案2的语音编码电路重编码。因此可减轻代码转换后从第二码串数据中解码出的语音信号的语音质量恶化，该恶化是由于方案2的语音编码电路对具有不适于重编码的信号特性的解码语音进行重编码而造成的，其中不适于重编码的信号特性是由于编码造成的恶化而导致的。
接下来，给出对基于本发明的代码转换装置的描述。在图3中示出了根据本发明第一实施例的代码转换装置，其中等同于或类似于图1中元件的元件以相同标号来标记。
图3所示的代码转换装置包括输入端10；语音解码电路1050，其被提供以来自输入端10的第一码串数据；信号特性矫正电路2070，其被提供以语音解码电路1050的输出；语音编码电路1060，其被提供以信号特性矫正电路2070的输出；以及输出端20，用于将语音编码电路1060所生成的第二码串数据传递到外部。语音解码电路1050利用方案1的解码方法，从第一码串数据生成第一解码语音。信号特性矫正电路2070使用滤波器来矫正第一解码语音，以使其具有适于重编码的信号特性，从而生成第二解码语音。语音编码电路1060利用第二编码方法对第二解码语音进行编码，以生成第二码串数据。输入端10、输出端20、语音解码电路1050和语音编码电路1060与图1所示相同。
下面给出对信号特性矫正电路2070的详细描述，信号特性矫正电路2070是图3所示的代码转换装置与图1所示的传统代码转换装置在配置上的不同之处。
信号特性矫正电路2070接收从语音解码电路1050传递来的第一解码语音，并将通过用第一解码语音驱动传输函数F(z)所代表的滤波器而生成的信号作为第二解码语音提供到语音编码电路1060。这里，滤波器F(z)具有这样的信号特性，它矫正第一解码语音以使其具有适于重编码的信号特性。
在很多情形下，在语音解码电路中采用后置滤波器来提高主观声音质量，但是如果被后置滤波的解码语音被重编码，则声音质量会恶化。因此，可通过将解码语音提供到后置滤波器的逆滤波器来提高声音质量。当后置滤波器的传输函数是P(z)时，滤波器F(z)可由公式(1)表达F(z)＝F1(z)＝1/P(z) (1)这里，有关后置滤波器的细节例如参见3GPP TS 26.090，Section 6.2中的描述。
此外，在上述声音质量的恶化中，声音的减弱感常常构成了重要因素。因此，滤波器F(z)可以是具有强调频率的高频带分量的频率特性的滤波器。在情况下中，F(z)可由公式(2)表达F(z)＝F2(z)＝1-u(1/z) (2)其中u是代表对高频带分量的强调程度的系数(例如0.2)。
此外，上述F1(z)和F2(z)可被组合。在此情况下，F(z)可由公式(3)表达F(z)＝F3(z)＝F1(z)F2(z)＝(1-u(1/z))/P(z)(3)从上文可很明显地看出，本实施例的优点在于，遵循某个标准方案的语音解码电路和语音编码电路可被原样使用，因为不需要将构成传统代码转换电路一部分的语音解码电路和语音编码电路进行适配。
接下来给出根据本发明第二实施例的代码转换装置的描述。在第二实施例中，上述实施例的代码转换装置中的信号特性矫正电路的滤波器特性变为可根据语音信号的特性而改变。在图4中示出了根据第二实施例的代码转换装置，其中等同于或类似于第一实施例的元件以相同标号来标记。
如图4所示，在第二实施例的代码转换装置中，图3所示的语音解码电路1050可被视为由代码分离电路3010和语音解码电路3050组成。类似地，图3所示的语音编码电路1060被视为由代码复用电路3020和语音编码电路3060组成。
代码分离电路3010从通过输入端10向其提供的第一码串数据中分离出头部和有效载荷。头部包括帧类型信息。通过参考帧类型信息，可辨别从该码串数据中解码所得的信号是对应于语音部分还是静音部分。这里，关于帧类型信息的细节，例如参见3GPP标准“AMR Speech codec framestructure”(3GPP TS 26.101)。有效载荷包含对应于语音参数的代码。码串数据中的语音参数例如包括LP系数、ACB、FCB以及增益(ACB增益和FCB增益)。对应于LP系数、ACB、FCB和增益的代码分别由第一LP系数代码、第一ACB代码、第一FCB代码和第一增益代码指定。代码分离电路3010将帧类型信息传递到信号特性矫正电路3070，并将第一LP系数代码、第一ACB代码、第一FCB代码和第一增益代码传递到语音解码电路3050。
语音解码电路3050接收从代码分离电路3010传递来的第一LP系数代码、第一ACB代码、第一FCB代码和第一增益代码，利用方案1的解码方法从这些代码中解码出语音，并将解码语音作为第一解码语音传递到信号特性矫正电路3070。
语音编码电路3060接收从信号特性矫正电路3070传递来的第二解码语音，利用第二编码方法对第二解码语音进行编码，从而生成LP系数代码、ACB代码、FCB代码和增益代码。然后，这些代码分别作为第二LP系数代码、第二ACB代码、第二FCB代码和第二增益代码被传递到代码复用电路3020。
代码复用电路3020接收从语音编码电路3060传递来的第二LP系数代码、第二ACB代码、第二FCB代码和第二增益代码，对其进行复用以生成码串数据，该码串数据作为第二码串数据通过输出端20被传递。
信号特性矫正电路3070接收从语音解码电路3050传递来的第一解码语音以及从代码分离电路3010传递来的帧类型信息，并将下述信号作为第二解码语音传递到语音编码电路3060，所述信号是通过用第一解码语音驱动传输函数F(z)所代表的滤波器而生成的，其中F(z)可根据帧类型信息而改变。
这里与在第一实施例的情形下一样，当语音解码电路3050中的后置滤波器具有由P(z)代表的传输函数P(z)时，滤波器F(z)可由下列公式表达。
当帧类型信息对应于语音时，滤波器F(z)由公式(4)表达F(z)＝F1(z)＝1/P(z) (4)当帧类型信息对应于非语音时，滤波器F(z)由公式(5)表达F(z)＝F1(z)＝1 (5)当滤波器F(z)是具有强调频率的高频带分量的频率特性的滤波器时，F(z)例如可由下列公式表达。
当帧类型信息对应于语音时，滤波器F(z)由公式(6)表达
F(z)＝F2(z)＝1-u(1/z) (6)当帧类型信息对应于非语音时，滤波器F(z)由公式(7)表达F(z)＝F2(z)＝1-v(1/z) (7)其中u、v是代表对高频带分量的强调程度的系数，例如u＝0.2，v＝0.1。此外，F1(z)和F2(z)可以组合。在此情况下，F(z)可由下列公式表达。
当帧类型信息对应于语音时，滤波器F(z)由公式(8)表达F(z)＝F3(z)＝F1(z)F2(z)＝(1-u(1/z))/P(z) (8)当帧类型信息对应于非语音时，滤波器F(z)由公式(9)表达F(z)＝F3(z)＝F1(z)F2(z)＝1-v(1/z) (9)在上述示例中，当采用帧类型信息而致使滤波器特性可根据语音信号的特性改变时，第一码串数据的大小可用来代替帧类型信息，或者可使用从第一解码语音中计算出的特性量。特性量代表语音信号的特性，并例如包括基音周期性、频谱梯度、功率等。当特性量对应于语音和当特性量对应于非语音时，滤波器特性F(z)可以与上述示例类似的方式改变。
例如，当考虑功率作为特性量时，作为最简单的示例，可考虑使相对较大的功率与语音相对应，而使小功率与非语音相对应。
当功率E对应于语音时，滤波器F(z)由公式(10)表达F(z)＝F3(z)＝F1(z)F2(z)＝(1-u(1/z))/P(z)，E＞Th(10)当功率E信息对应于非语音时，滤波器F(z)由公式(11)表达F(z)＝F3(z)＝F1(z)F2(z)＝1-v(1/z)，E＜Th (11)其中Th是某个常量。此外，系数u、v可采用作为E的函数的连续值。
上述每种代码转换装置都可利用计算机控制(例如数字信号处理器(DSP))来实现。图5概要地示出了当上述每个实施例中的代码转换处理由计算机实现时的装置配置。
在用于执行从记录介质600读取的程序的计算机100中，为了执行用于将利用第一编码/解码装置对语音编码而生成的第一代码转换为可被第二编码/解码装置解码的第二代码的代码转换处理，记录介质600上记录了用于执行下列步骤的程序(a)用于利用方案1的解码方法，从第一码串数据中生成第一解码语音的处理；(b)用于使用滤波器来矫正第一解码语音，以使其具有适于重编码的信号特性，从而生成第二解码信号的处理；以及(c)用于利用第二编码方法对第二解码语音进行编码，以生成第二码串数据的处理。
该程序通过记录介质阅读器500和接口400从记录介质600被读入存储器300中。该程序可存储在非易失性存储器(例如ROM和闪存等)中，而记录介质除了非易失性存储器以外还可包括诸如CD-ROM、FD、数字多用盘(DVD)、磁带(MT)和便携式硬盘驱动器等的介质。此外，这种程序可在服务器设备中被提供，从而使程序可通过通信网络被下载到计算机上。除了上面记录有这种程序的记录介质之外，本发明的范围还包括含有这种程序的程序产品以及携带这种程序以用于有线或无线传输的通信介质等等。
权利要求
1.一种用于将遵从第一语音编码方案的第一码串数据转换为遵从第二语音编码方案的第二码串数据的代码转换方法，所述方法包括以下步骤对所述第一码串数据解码，以生成第一解码语音；矫正所述第一解码语音的信号特性，以生成第二解码语音；以及根据所述第二语音编码方案对所述第二解码语音编码，以生成所述第二码串数据。
2.如权利要求1所述的代码转换方法，其中在所述生成第二解码语音的步骤中，所述信号特性是利用下述滤波器来矫正的，所述滤波器具有根据所述第一解码语音的特性而改变的特性。
3.如权利要求2所述的代码转换方法，其中所述滤波器的特性使用以下三者中的至少一个而被改变包括在所述第一码串数据中的帧类型信息、所述第一码串数据的大小以及可从所述第一解码语音计算得到的特性量。
4.如权利要求2或3所述的代码转换方法，其中所述滤波器是后置滤波器的逆滤波器、具有用于强调频率的高频带分量的特性的强调滤波器，或作为所述逆滤波器和所述强调滤波器的组合的滤波器。
5.如权利要求1所述的代码转换方法，其中在所述生成第二解码语音的步骤中，所述第一解码语音的信号特性被矫正为适于重编码的信号特性。
6.如权利要求5所述的代码转换方法，其中在所述生成第二解码语音的步骤中，所述信号特性被下述滤波器矫正，所述滤波器具有根据所述第一解码语音的特性而改变的特性。
7.如权利要求6所述的代码转换方法，其中所述滤波器的特性使用以下三者中的至少一个而被改变所述第一码串数据中所包括的帧类型信息、所述第一码串数据的大小，以及可从所述第一解码语音计算得到的特性量。
8.如权利要求6或7所述的代码转换方法，其中所述滤波器是后置滤波器的逆滤波器、具有用于强调频率的高频带分量的特性的强调滤波器，或作为所述逆滤波器和所述强调滤波器的组合的滤波器。
9.一种用于将遵从第一语音编码方案的第一码串数据转换为遵从第二语音编码方案的第二码串数据的代码转换装置，所述装置包括语音解码电路，用于对所述第一码串数据解码，以生成第一解码语音；信号特性矫正电路，用于矫正所述第一解码语音的信号特性，以生成第二解码语音；以及语音编码电路，用于根据所述第二语音编码方案对所述第二解码语音编码，以生成所述第二码串数据。
10.如权利要求9所述的代码转换装置，其中所述信号特性矫正电路利用下述滤波器来矫正所述第一解码语音的信号特性，所述滤波器具有根据所述第一解码语音的特性而改变的特性。
11.如权利要求10所述的代码转换装置，其中所述滤波器的特性使用以下三者中的至少一个而被改变包括在所述第一码串数据中的帧类型信息、所述第一码串数据的大小以及可从所述第一解码语音计算得到的特性量。
12.如权利要求10或11所述的代码转换装置，其中所述滤波器是后置滤波器的逆滤波器、具有用于强调频率的高频带分量的特性的强调滤波器，或作为所述逆滤波器和所述强调滤波器的组合的滤波器。
13.如权利要求9所述的代码转换装置，其中所述信号特性矫正电路将所述第一解码语音的信号特性矫正为适于重编码的信号特性，从而生成所述第二解码语音。
14.如权利要求13所述的代码转换装置，其中所述信号特性矫正电路使用下述滤波器来矫正所述第一解码语音的信号特性，所述滤波器具有根据所述第一解码语音的特性而改变的特性。
15.如权利要求14所述的代码转换装置，其中所述滤波器的特性使用以下三者中的至少一个而被改变所述第一码串数据中所包括的帧类型信息、所述第一码串数据的大小，以及可从所述第一解码语音计算得到的特性量。
16.如权利要求14或15所述的代码转换装置，其中所述滤波器是后置滤波器的逆滤波器、具有用于强调频率的高频带分量的特性的强调滤波器，或作为所述逆滤波器和所述强调滤波器的组合的滤波器。
17.一种用于使得计算机执行以下步骤的程序，所述步骤为对遵从第一语音编码方案的第一码串数据解码，以生成第一解码语音；矫正所述第一解码语音的信号特性，以生成第二解码语音；以及根据第二语音编码方案对所述第二解码语音编码，以生成遵从第二语音编码方案的第二码串数据。
18.一种用于使得计算机执行以下步骤的程序，所述步骤为对遵从第一语音编码方案的第一码串数据解码，以生成第一解码语音；使用下述滤波器来矫正所述第一解码语音的信号特性，以生成第二解码语音，所述滤波器具有根据所述第一解码语音的特性而改变的特性；以及根据第二语音编码方案对所述第二解码语音编码，以生成遵从所述第二语音编码方案的第二码串数据。
19.一种用于使得计算机执行以下步骤的程序，所述步骤为对遵从第一语音编码方案的第一码串数据解码，以生成第一解码语音；将所述第一解码语音的信号特性矫正为适于重编码的信号特性，以生成第二解码语音；以及根据第二语音编码方案对所述第二解码语音编码，以生成遵从所述第二语音编码方案的第二码串数据。
20.一种用于使得计算机执行以下步骤的程序，所述步骤为对遵从第一语音编码方案的第一码串数据解码，以生成第一解码语音；使用下述滤波器将所述第一解码语音的信号特性矫正为适于重编码的信号特性，以生成第二解码语音信号，所述滤波器具有根据所述第一解码语音的特性而改变的特性；以及根据第二语音编码方案对所述第二解码语音编码，以生成遵从所述第二语音编码方案的第二码串数据。
21.一种其上存储有如权利要求17到20中的任意一个所述的程序的计算机可读记录介质。
全文摘要
本发明提供了一种用于将基于第一音频编码方法的第一码串数据转换为基于第二音频编码方法的第二码串数据的代码转换方法，所述方法包括以下步骤对所述第一码串数据解码，以生成第一解码音频的步骤；矫正所述第一解码音频的信号特性，以生成第二解码音频的步骤；以及利用所述第二音频编码方法对所述第二解码音频编码，以生成所述第二码串数据的步骤。
文档编号G10L19/14GK1784716SQ20048001232
公开日2006年6月7日申请日期2004年3月31日优先权日2003年4月8日
发明者村岛淳申请人:日本电气株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：村岛淳
技术所有人：日本电气株式会社
我是此专利的发明人