在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备的制作方法

文档序号：2823252阅读：140来源：国知局

专利名称：在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备的制作方法
技术领域：
本发明涉及一种设备与方法，其用于在把基于修正离散余弦变换(MDCT)的音频译码器和不同的语音/音频译码器相结合来编解码音频信号时，减少在执行不同类型译码器转换时生成的扭曲(artifact)。
背景技术：
当根据输入信号的特征而对语音和音频相结合的输入信号应用不同的编码/解码方法时，可改善性能和音质。例如，对具有语音信号相似特征的信号应用基于码激励线性预测 CELP 的编码器(Code Excited Linear Prediction-based encoder)，而对与音频信号相同的信号应用基于变频的编码器(frequency conversion-based encoder)，是有效率的。通过应用上面所述的概念，可开发统一语音和音频编码USAC(Unified Speech and Audio Coding)。该USAC可不断地接收输入信号并在特定时间分析输入信号。然后， USAC可通过根据输入信号的特征进行切换来应用不同类型的编码设备，来编码输入信号。USAC中的信号切换(signal switching)过程中，会生成信号扭曲(signal artifact) 0由于USAC为每个区块编码输入信号，所以在应用不同类型的编码时会生成块扭曲(blocking artifact) 0为了克服这种缺点，USAC可在应用不同编码时对块应用窗口，来执行重叠相加操作。但是，这种情况下，可能会因为重叠而需要额外的比特流信息，且当频繁出现切换时，用于消除块扭曲的额外的比特流可能会增加。当比特流增加，编码效率会降低。特别是，USAC可采用基于修正离散余弦变换(MDCT)的编码设备来编码音频特征信号。MDCT方式可将时域的输入信号变换为频域的输入信号，并在块间执行重叠相加操作。 MDCT方式具有即使执行重叠相加操作，比特率也可能不会增加的优点，但存在可能会在时域中生成混叠的缺点。在这种情况下，基于MDCT方式，50 %重叠相加操作会被对相邻块执行来还原输入信号。也就是说，要被输出的当前块可基于前一个块的输出结果被解码。但是，当前一个块没有使用MDCT方式的USAC被编码时，使用MDCT方式编码的当前块，可能无法通过重叠相加操作解码，因为前一个块的MDCT信息可能无法使用。因此，在切换之后使用MDCT方式编码当前块时，USAC可能会额外要求前一个块的MDCT信息。当频繁发生切换时，用于解码的额外的MDCT信息比例可增加至切换量。在这种情况下，比特率会由于额外的MDCT信息而增加，而编码效率可能会明显降低。因此，需要一种方法，来在切换过程中去除块扭曲并尽可能减少额外的MDCT信息。

发明内容
本发明的一个方面，提供了一种编码方法及设备和解码方法及设备，其可去除块信号扭曲并尽可能减少切换时所需的MDCT信息。根据本发明的一个方面，提供了第一编码单元，其根据不同于基于MDCT的译码方式(Modified Discrete Cosine Transform-based coding scheme)白勺异质译石马方式(hetero coding scheme)来编码输入信号的语音特征信号(speech characteristic signal)；和第二编码单元，其根据基于MDCT的译码方式来编码输入信号的音频特征信号 (audio characteristic signal) 0当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点(folding point)时，所述第二编码单元，可通过应用不超过所述折点的分析窗口来执行编码。折点可以是当MDCT和反MDCT(IMDCT =Inverse MDCT) 被执行时，混叠信号被折叠处的区域。当执行N点MDCT(N-point MDCT)时，折点可位于Ν/4 和3Ν/4点处。折点可以是与MDCT相关的众所周知的特征的任何一个，用于折点的数学基础(mathematical basis)在此将不做说明。另外，MDCT和折点的概念的描述，将参照图5 详细说明。此外，为方便说明，当前一个帧信号是语音特征信号而当前帧是音频特征信号时，当连接两种不同类型特征的信号时使用的折点，以下可称为“发生切换处的折点”。同时，当后一个帧信号是语音特征信号而当前帧信号是音频特征信号时，在连接两个不同类型特征的信号时使用的折点，以下可称为“发生切换处的折点”。根据本发明的一个方面，提供了一种编码设备，包括窗口处理单元，其对输入信号的当前帧应用分析窗口；MDCT变换单元，其针对应用了分析窗口的当前帧执行MDCT变换；和比特流生成单元，其编码已进行了 MDCT变换的当前帧并生成输入信号的比特流。当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，所述窗口处理单元应用不超过折点的分析窗口。根据本发明的一个方面，提供了一种解码设备，包括第一解码单元，其根据不同于基于MDCT的译码方式的异质译码方式来解码被编码的输入信号的语音特征信号；第二解码单元，其根据基于MDCT的译码方式来解码被编码的输入信号的音频特征信号；和块补偿单元，其针对第一解码单元的结果和第二解码单元的结果来执行块补偿并还原输入信号。当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，所述块补偿单元应用不超过所述折点的合成窗口。根据本发明的一个方面，提供一种解码设备，包括块补偿单元，当输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，其对所述当前帧和从语音特征信号中提取出的额外的信息分别应用合成窗口，来还原输入信号。技术效果根据本发明的一个方面，提供了一种编码方法及设备和解码方法及设备，其可减少根据输入信号的特征在不同类型的译码器之间发生切换时所需的额外MDCT信息，并去除块信号扭曲。此外，根据本发明的一个方面，提供了一种编码方法及设备和解码方法及设备，其可减少根据输入信号的特征在不同类型的译码器之间发生切换时所需的额外MDCT信息，并阻止比特率增加，改善编码效率。

图1是示出根据本发明的一实施例的编码设备和解码设备的框图；图2是示出根据本发明的一实施例的编码设备的配置的框图；图3是示出根据本发明的一实施例的通过第二编码单元来编码输入信号的操作的示图；图4是示出根据本发明的一实施例的通过窗口处理来编码输入信号的操作的示图；图5是示出根据本发明的一实施例的MDCT (Modified Discrete Cosine Transform，修正离散余弦变换)操作的示图；图6是示出根据本发明的一实施例的异质译码操作C1、C2的示图；图7是示出根据本发明的一实施例的在Cl中生成比特流操作的示图；图8是示出根据本发明的一实施例的在Cl中通过窗口处理来编码输入信号的操作的示图；图9是示出根据本发明的一实施例的在C2中生成比特流操作的示图；图10是示出根据本发明的一实施例的在C2中通过窗口处理来编码输入信号的操作的示图；图11是示出根据本发明的一实施例的当输入信号被编码时应用的额外信息的示图；图12是示出根据本发明的一实施例的解码设备的配置的框图；图13是示出根据本发明的一实施例的通过第二解码单元来解码比特流的操作的示图；图14是示出根据本发明的一实施例的通过重叠相加操作提取输出信号的操作的示图；图15是示出根据本发明的一实施例的在Cl中生成输出信号的操作的示图；图16是示出根据本发明的一实施例的在Cl中的块补偿操作的示图；图17是示出根据本发明的一实施例的在C2中生成输出信号的操作的示图；和图18是示出根据本发明的一实施例的在C2中的块补偿操作的示图。
具体实施例方式现在将参照附图对本发明的实施例进行详细描述，所述实施例的示例在附图中被示出，其中相同的参照数字始终表示相同的元素。下面将参照数字描述实施例，以对本发明进行说明。图1是示出根据本发明的一实施例的编码设备101和解码设备102的框图。所述编码设备101可通过为每个块编码输入信号生成比特流。在这种情况下，编码设备101可编码语音特征信号和音频特征信号。语音特征信号可具有与嗓音信号相似的特征，音频特征信号可具有与音频信号相似的特征。编码结果，生成输入信号的相关比特流，并被传送到解码设备102。解码设备102可通过解码比特流来生成输出信号，并由此还原被编码的输入信号。具体来说，编码设备101可分析不断输入的信号的状态，并根据分析的结果进行切换来应用对应输入信号的特征的编码方式。由此，编码设备101可编码应用了异质译码方式处的块。例如，编码设备101可根据码激励线性预测CELP(Code Excited Linear Prediction)方式编码语音特征信号并根据修正离散余弦变换MDCT方式编码音频特征信号。相反，解码设备102，可通过根据CELP方式来解码根据CELP方式编码的输入信号，并根据MDCT方式来解码根据MDCT方式编码的输入信号，来还原输入信号。在这种情况下，当输入信号被从语音特征信号切换到音频特征信号时，编码设备 101可通过从CELP方式切换到MDCT方式来进行编码。由于每个块都进行编码，可能会生成块扭曲。在这种情况下，解码设备102可通过在块间进行重叠相加操作来去除块扭曲。此外，当输入信号的当前块根据MDCT方式被编码时，还原输入信号需要前一个块的MDCT信息。但是，当前一个块是根据CELP方式被编码时，由于前一个块的MDCT信息不存在，所以根据MDCT方式会无法还原当前块。因此，需要前一个块的额外的MDCT信息。此外，所述编码设备101可减少额外的MDCT信息从而可以防止比特率增加。图2是示出根据本发明的一实施例的编码设备的配置的框图。参照图2，编码设备101可包括块延迟单元201、状态分析单元202、信号切割单元 203、第一编码单元204、和第二编码单元205。块延迟单元201可为每个块延迟输入信号。输入信号可以为每个块被处理用来编码。块延迟单元201可后退延迟(_)或向前延迟(+)输入的当前块。状态分析单元202可确定输入信号的特征。例如，状态分析单元202可决定输入信号是语音特征信号还是音频特征信号。在这种情况下，状态分析单元202可输出控制参数。该控制参数可用于确定哪些编码方式用于编码输入信号的当前块。例如，状态分析单元202可分析输入信号的特征，并将信号周期对应下列状态的信号确定为语音特征信号，即(1)呈现出清晰并稳定谐波分量的稳定谐波 SH(steady-harmonic)状态；( 在低频率带宽呈现出强大稳定特征且呈现出较长周期的谐波分量的低稳定谐波LSH(low steady harmonic)状态；(3)稳定噪声SN(steady-noise) 状态。状态分析单元202可分析输入信号的特征，并将信号周期对应下列状态的信号确定为音频特征信号，即(4)呈现出不同的音调分量被结合的复杂和声结构的复杂谐波 CH(complex-harmonic)状态；( 包括不稳定噪声分量的复杂噪声状态。在这里，所述信号周期可对应输入信号的块单位。信号切割单元203可使块单位的输入信号成为子集。第一编码单元204可在块单位的输入信号之中编码语音特征信号。例如，第一编码单元204可根据线性预测译码LPC (Linear Predictive Coding)编码时域中的语音特征信号。在这种情况下，第一编码单元204可根据基于CELP的译码方式来编码所述语音特征信号。虽然图3示出了单一第一编码单元204，但也可以配置一个或多个第一编码单元。第二编码单元205可在块单位的输入信号之中编码音频特征信号。例如，第二编码单元205可将音频特征信号从时域变换到频域以进行编码。这种情况下，第二编码单元 205可根据基于MDCT方式的译码方式来编码音频特征信号。比特流中可生成第一解码单元204的结果和第二编码单元205的结果，且在每个编码单元中生成的比特流可通过比特流多路复用器(MUX)被控制为单一比特流。也就是说，编码设备101可通过根据状态分析单元202的控制参数进行切换，通过第一编码单元204、第二编码单元205中的任何一个来编码输入信号。同时，第一编码单元204可根据不同于基于MDCT的译码方式的异质译码方式，来编码输入信号的语音特征信号。此外，第二编码单元205可根据基于MDCT的译码方式，来编码输入信号的音频特征信号。图3是示出根据本发明的一实施例的通过第二编码单元来编码输入信号的操作的示图。参照图3，第二编码单元205可包括窗口处理单元301、MDCT变换单元302、比特流生成单元303。在图3中，X (b)可指输入信号的基本块单位。输入信号将参照图4和图6来详细说明。输入信号可被输入到窗口处理单元301，也可通过块延迟单元201被输入到窗口处理单元301。窗口处理单元301，可对输入信号的当前帧应用分析窗口。具体来说，窗口处理单元301可对当前块X(b)和延迟的块X(b-2)应用分析窗口。当前块X(b)可通过块延迟单元201被后退延迟到前一个块X (b-2)。例如，当当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，窗口处理单元301，可对当前帧应用不超过折点的分析窗口。在这种情况下，窗口处理单元 301，可应用所述分析窗口，所述分析窗口可基于所述折点被配置为具有值0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口。在这里，所述第一子块可表示语音特征信号，且所述第二子块可表示音频特征信号。由块延迟单元201执行的块延迟的度，可根据输入信号的块单位有所不同。当输入信号通过窗口处理单元301时，分析窗口可被应用，且由此{X(b-2)，x(b)} Wanalysis 可被提取。由此，MDCT变换单元302可针对应用了分析窗口的当前帧执行MDCT。此外，比特流生成单元303可编码当前帧并生成输入信号的比特流。图4是示出根据本发明的一实施例的通过窗口处理来编码输入信号的操作的示图。参照图4，窗口处理单元301，可对输入信号应用分析窗口。在这种情况下，分析窗口可以是矩形或正弦形式。分析窗口的形式可根据输入信号有所不同。当当前块X(b)被输入，窗口处理单元301可对当前块X(b)和前一个块X(b_2)应用分析窗口。在这里，前一个块X(bl)可被块延迟单元102后退延迟。例如，块X(b)可按照如下给出的公式1被设置为输入信号的基本单位。在这种情况下，两个块可被设置为单一的帧并被编码。[公式1]X(b) = [s(b-l)，s(b)]T在这种情况下，s (b)可指被配置为单一块的子块，并可被定义为[公式2]s (b) = [s ((b-Ι) · Ν/4)，s ((b_l) · Ν/4+1)，· · ·，s ((b_l) · N/4+N/4-1) ]τs (η)输入信号的一个采样。在这里，N可指输入信号的块的大小。也就是说，输入信号中可包括多个块，且每个块可包括两个子块。包含在单一块中的子块的数目可以根据系统配置和输入信号有所不同。例如，可按如下给出的公式3定义分析窗口。此外，根据公式2和公式3，对输入信号的当前块应用分析窗口的结果，可以表示为公式4。[公式3]Wanalysis = [W1, w2, W3, w4]TWi = [Wi(O),... ,Wi(N^-I)]1[公式4]Wanalysis可指分析窗口，并有对称特征。如图4所示，分析窗口可被应用到两个块。也就是说，分析窗口可被用于四个子块。此外，窗口处理单元301可针对输入信号的 N-point (N点)执行“点对点(point by point)”乘法。N-point可表示MDCT的大小。也就是说，窗口处理单元301，可将子块乘以对应分析窗口的子块的区域。MDCT变换单元302可针对分析窗口被处理处的输入信号执行MDCT。图5是示出根据本发明的一实施例的修正离散余弦变换MDCT (Modified Discrete Cosine Transform)操作的不图。配置为块单位的输入信号和应用于输入信号的分析窗口如图5所示。如上所述，输入信号可包括包括有多个块的一个帧，一个块可包含两个子块。编码设备101，可对输入信号应用分析窗口 Wanalysis。输入信号可被分为四个子块X1(Z), X2(Z), X3(Z), X4(Z)包括在当前帧中，且分析窗口可被分为W1(Z), W2(Z), Wf(Z)9W111 (Z)。此外，当MDCT/量化/反MDCT(IMDCT)被基于划分子块的折点应用于输入信号时，可发生原始区域(original area)和混叠区域(aliasing area)。解码设备102，可对编码的输入信号应用合成窗口，并通过重叠相加操作去除在 MDCT操作过程中生成的混叠(aliasing)，并由此可提取出输出信号。图6是示出根据本发明的一实施例的异质译码操作C1、C2的示图。在图6中，Cl (Change case 1)和C2 (Change case幻可指应用了异质译码方式的输入信号的边界。基于Cl位于左侧的子块s(b-5)、s(b-4)、s(b-3)、s(b-2)可指语音特征信号。基于(1位于右侧的子块8(13-1)、803)、803+1)、803+2)可指音频特征信号。此外，基于C2位于左侧的子块s (b+m-1)、s (b+m)可指音频特征信号，基于C2位于右侧的子块 s (b+m+1)、s (b+m+2)可指语音特征信号。在图2中，语音特征信号可通过第一编码单元204被编码，音频特征信号可通过第二编码单元205来编码。由此在Cl和C2中会出现切换。在这种情况下，切换可发生在子块之间的折点中。另外，输入信号的特征可能会基于Cl和C2不同，由此不同的编码方式被应用，可发生块扭曲。在这种情况下，编码根据基于MDCT的译码方式执行，解码设备102可通过重叠相加操作使用前一个块和当前块两者来去除块扭曲。但是，当如Cl和C2的语音特征信号和音频特征信号之间发生切换时，会无法执行基于MDCT的重叠相加操作。会需要额外的信息来用于基于MDCT的解码。例如，Cl中可能会要求额外的信息、(b-l)，C2中可能会要求额外的信息ShJb+m)。根据本发明的一实施例，可阻止于比特率的增加，改善译码效率并最大限度地减少额外信息S。Jb-l)和额外信息S1il (b+m)。当语音特征信号和音频特征信号之间发生切换时，编码设备101可编码额外信息来还原音频特征信号。在这种情况下，额外信息可由编码语音特征信号的第一编码单元204 编码。具体来说，在Cl中，在语音特征信号s (b-2)中对应额外信息3(^03-1)的区域可被编码为额外信息。此外，在C2中，在语音特征信号s(b+m+l)中对应额外信息Sli(b+m)的区域可被编码为额外信息。发生Cl和C2时的一种编码方法将参照图7至图11进行详细说明，且一种解码方法将参照图15至图18进行详细说明。图7是示出根据本发明的一实施例的在Cl中生成比特流操作的示图。当输入信号的块X(b)被输入，状态分析单元202会分析相应块的状态。在这种情况下，当块X (b)为音频特征信号且块X (b-幻为语音特征信号时，状态分析单元202可意识到Cl在存在于块X(b)和块X(b-2)之间的折点中发生。因此，关于生成了 Cl的控制信息可被发送至块延迟单元201、窗口处理单元301、第一编码单元204。当输入信号的块X(b)被输入，块X(b)和块X(b+》可被输入至窗口处理单元301。块X(b+2)可通过块延迟单元201被向前延迟(+2)。因此，分析窗口可应用到图6的Cl中的块X (b)和块X (b+2)。在这里，块X (b)可包括子块s (b-Ι)和s (b)，且块X (b+2)可包括子块s (b+Ι)和s (b+2)。可通过MDCT变换单元302针对分析窗口被应用了的块X (b)和块 X(b+2)执行MDCT。执行了 MDCT处的块可通过比特率生成单元303编码，由此可生成输入信号的比特流的块X (b)的比特流。此外，为针对块X (b)生成用于重叠相加操作的额外信息Sti (b-Ι)，块延迟单元201 可通过后退延迟块X (b)来提取块x(b-l)。块x(b-l)可包括子块S (b-2)和S(b-1)。此外，信号切割单元203可通过信号切割从块X (b-Ι)中提取额外信息S。Jb-l)。例如，额外信息S。Jb-l)可由下列公式决定[公式δ]Sol (b-1) = [s ((b-2) · Ν/4)，· · ·，s ((b-2) · N/4+oL-l) ]τ0 < oL ^ Ν/4在这种情况下，N可指MDCT的块的大小。第一编码单元204可编码语音特征信号的额外信息所对应的区域，来基于语音特征信号和音频特征信号之间发生切换的折点在块之间重叠。例如，第一编码单元204，可编码在是语音特征信号的子块s (b-2)中对应于额外信息区域(oL)的额外信息St^ (b-Ι)。也就是说，第一编码单元204可通过编码由信号切割单元203提取的额外信息(b-Ι)来生成额外信息Sti(b-Ι)的比特流。也就是说，当Cl发生时，第一编码单元204可只生成额外信息(b-Ι)的比特流。当Cl发生时，额外信息StJb-I)可被用作用于去除块扭曲的额外 fn息ο再比如，在编码块X(b-l)时可获得额外信息Sti(b-1)的情况下，第一编码单元204 可不编码额外信息St^ (b-1)。图8是示出根据本发明的一实施例的在Cl中通过窗口处理来编码输入信号的操作的示图。
在图8，折点可针对Cl位于零子块和子块s (b-Ι)之间，零子块可以是语音特征信号，子块s(b-l)可以是音频特征信号，且折点可以是发生从语音特征信号到音频特征信号的切换的折点。如图8所示，当块X(b)被输入时，窗口处理单元301可对输入的当前帧应用分析窗口。如图8所示，当输入信号的当前帧中存在语音特征信号和音频特征信号之间发生切换的折点时，窗口处理单元301可通过对当前帧应用不超过折点的分析窗口来执行编码。例如，窗口处理单元301，可应用分析窗口。分析窗口可基于所述折点被配置为具有值0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口。在这里，所述第一子块可表示语音特征信号，且所述第二子块可表示音频特征信号。在图8中，折点可位于被配置为具有N/4大小的子块的当前帧的N/4 点处。在图8中，分析窗口可包括对应是语音特征信号的零子块的窗口 wz，和包括对应是音频特征信号的s(b-l)子块的额外信息区域(OL)的窗口及对应是音频特征信号的S (b-1) 子块的其余区域(N/4-oL)的窗口的窗口 W2。在这种情况下，窗口处理单元301可以对是语音特征信号的零子块以值0来替换所述分析窗口 wz。同时，窗口处理单元301可根据公式6决定是音频特征信号的子块所对应的分析s (b-Ι)的窗口W2。[公式6I
权利要求
1.一种编码设备，包括第一编码单元，其根据不同于基于MDCT的译码方式的异质译码方式来编码输入信号的语音特征信号；和第二编码单元，其根据所述基于MDCT的译码方式来编码所述输入信号的音频特征信号，其中，当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，所述第二编码单元通过应用不超过所述折点的分析窗口来执行编码。
2.如权利要求1所述的编码设备，其中，所述第二编码单元应用所述分析窗口，所述分析窗口基于所述折点被配置为具有值 0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口，在这里所述第一子块表示语音特征信号，且所述第二子块表示音频特征信号。
3.如权利要求1所述的编码设备，其中，当所述当前帧被配置为具有N/4大小的子块时，所述折点被设置在N/4或3N/4点处。
4.如权利要求2所述的编码设备，其中，所述第一编码单元，为了基于所述折点在块之间进行重叠而编码第一子块中对应额外信息区域的部分。
5.一种编码设备，包括窗口处理单元，其对输入信号的当前帧应用分析窗口；MDCT变换单元，其针对应用了分析窗口的当前帧执行MDCT变换；和比特流生成单元，其编码已进行了 MDCT变换的当前帧并生成所述输入信号的比特流，其中，当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，所述窗口处理单元应用不超过折点的分析窗口。
6.如权利要求5所述的编码设备，其中，所述窗口处理单元应用所述分析窗口，所述分析窗口基于所述折点被配置为具有值 0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口，在这里所述第一子块表示语音特征信号，且所述第二子块表示音频特征信号。
7.如权利要求5所述的编码设备，其中，当所述当前帧被配置为具有N/4大小的子块时，所述折点被设置在N/4或3N/4点处。
8.如权利要求6所述的编码设备，其中，所述第一子块中的额外信息区域，为了基于所述折点在块之间进行重叠而根据不同于基于MDCT的译码方式的异质译码方式被编码。
9.一种解码设备，包括第一解码单元，其根据不同于基于MDCT的译码方式的异质译码方式来解码被编码的输入信号的语音特征信号；第二解码单元，其根据基于MDCT的译码方式来解码被编码的输入信号的音频特征信号；和块补偿单元，其针对第一解码单元的结果和第二解码单元的结果来执行块补偿并还原输入信号，其中，当所述输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，所述块补偿单元应用不超过所述折点的合成窗口。
10.如权利要求9所述的解码设备，其中，所述块补偿单元，对额外信息应用第一合成窗口，并对当前帧应用第二合成窗口来执行重叠相加操作，所述额外信息通过第一解码单元来提取，且所述当前帧通过第二解码单元来提取。
11.如权利要求10所述的解码设备，其中，所述块补偿单元应用第二合成窗口，所述第二合成窗口基于所述折点被配置为具有值0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口，在这里所述第一子块表示语音特征信号，且所述第二子块表示音频特征信号。
12.如权利要求9所述的解码设备，其中，所述第二解码单元，解码输入信号的当前帧中与折点不相邻的块，且所述块补偿单元，对输入信号的当前帧中与折点相邻的子块应用第二合成窗口。
13.如权利要求9所述的解码设备，其中，所述第一解码单元，解码根据异质译码方式编码的额外信息，来还原输入信号的当前帧中的音频特征信号。
14.如权利要求9所述的解码设备，其中，当所述当前帧被配置为具有N/4大小的子块时，所述折点被设置在N/4或3N/4点处。
15.一种解码设备，包括块补偿单元，当输入信号的当前帧中存在在语音特征信号和音频特征信号之间发生切换的折点时，其对所述当前帧和从语音特征信号中提取出的额外信息分别应用合成窗口，来还原输入信号。
16.如权利要求15所述的解码设备，其中，所述块补偿单元，通过对当前帧和额外信息应用不超过折点的合成窗口，来执行重叠相加操作。
17.如权利要求15所述的解码设备，其中，所述块补偿单元应用合成窗口，所述合成窗口基于所述折点被配置为具有值0并对应第一子块的窗口、对应第二子块中额外信息区域的窗口、具有值1并对应第二子块中其余区域的窗口，在这里所述第一子块表示语音特征信号，且所述第二子块表示音频特征信号。
18.如权利要求17所述的解码设备，其中，所述块补偿单元，对与输入信号的当前帧中的折点相邻的子块应用合成窗口。
19.如权利要求15所述的解码设备，其中，当所述当前帧被配置为具有N/4大小的子块时，所述折点被设置在N/4或3N/4点处。
全文摘要
本发明提供了在基于MDCT的译码器(205)和异质译码器(204)之间转换的编码设备(101)和解码设备。当在基于MDCT的译码器(205)和异质译码器(204)之间发生交换时，所述编码设备(101)可编码附加信息以还原根据基于MDCT的译码方式编码的输入信号。由此，能够防止生成不必要的比特流，且可编码最小限度的附加信息。
文档编号G10L19/14GK102216982SQ200980145832
公开日2011年10月12日申请日期2009年9月18日优先权日2008年9月18日
发明者姜京玉, 张大永, 朴浩综, 朴荣喆, 李泰辰, 洪镇佑, 白承权, 金珉第申请人:光云大学校产学协力团, 韩国电子通信研究院

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：白承权
技术所有人：韩国电子通信研究院
我是此专利的发明人

上一篇：噪声门、声音采集装置及噪声消除方法
上一篇：声开关及包括声开关的导管的制作方法