对音频/语音信号进行编码和解码的方法和设备的制作方法

文档序号：2823223阅读：149来源：国知局

专利名称：对音频/语音信号进行编码和解码的方法和设备的制作方法
技术领域：
示例实施例涉及一种对音频/语音信号进行编码和解码的方法和设备。
背景技术：
编解码器可被分为语音编解码器和音频编解码器。语音编解码器可使用语音建模在50Hz到7kHz的范围的频带中对信号进行编码/解码。一般来说，语音编解码器可通过对声带和声道进行建模来提取语音信号的参数，以执行编码和解码。音频编解码器可通过应用心理声学建模(如高效高级音频编码(HE-AAC))在OHz到MHz的范围的频带中对信号进行编码/解码。音频编解码器可基于人类听觉特征，通过去除不易察觉的信号来执行编码和解码。语音编解码器虽然适合于对语音信号进行编码/解码，但由于声音质量的下降，语音编解码器不适合于对音频信号进行编码/解码。此外，当音频编解码器对语音信号进行编码/解码时，可能降低信号压缩效率。

发明内容
示例实施例可提供一种对音频/语音信号进行编码和解码的方法和设备，所述方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。本总体发明构思的另外特征和效用将在下面的描述中部分地阐明，并且从描述中部分是清楚的，或者通过本总体发明构思的实施可以被得知。根据本总体发明构思的示例实施例，可提供一种对音频/语音信号进行编码的设备，所述设备包括信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；时域编码单元，基于语音建模，对由信号变换单元变换的信号进行编码；量化单元，对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。根据本总体发明构思的示例实施例，还可提供一种对音频/语音信号进行编码的设备，所述设备包括参数立体声处理单元，处理输入的音频信号或语音信号的立体声信息；处理输入的音频信号或语音信号的高频信号的单元；信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；时域编码单元，基于语音建模，对由信号变换单元变换的信号进行编码；量化单元，对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。根据本总体发明构思的示例实施例，还可提供了一种对音频/语音信号进行编码的设备，所述设备包括信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；低码率确定单元，确定变换的信号是否处于低码率；时域编码单元，当变换的信号处于低码率时，基于语音建模，对变换的信号进行编码；时间噪声整形单元，对变换的信号进行整形；高码率立体声单元，对整形的信号的立体声信息进行编码；量化单元，对来自高码率立体声单元的输出信号和来自时域编码单元的输出信号中的至少一个进行量化。根据本总体发明构思的示例实施例，还可提供一种对音频/语音信号进行解码的设备，所述设备包括分辨率确定单元，基于关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号，所述信息包括在比特流中；反量化单元，当分辨率确定单元确定所述信号是高频率分辨率信号时，对比特流进行反量化；时域，从比特流中解码出用于反线性预测的附加信息，并使用该附加信息来恢复高时间分辨率信号；反信号变换单元，将来自的输出信号和来自反量化单元的输出信号中的至少一个反变换到时域的音频信号或语音信号。根据本总体发明构思的示例实施例，还可提供一种对音频/语音信号进行解码的设备，所述设备包括反量化单元，对比特流进行反量化；高码率立体声系统/解码器，对反量化的信号进行解码；时间噪声整形器/解码器，处理由高码率立体声系统/解码器解码的信号；反信号变换单元，将处理的信号反变换到时域的音频信号或语音信号，其中，通过将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个来产生比特流。根据本总体发明构思的示例实施例，对音频/语音信号进行编码和解码的方法和设备可有效地对语音信号、音频信号以及语音信号和音频信号的混合信号进行编码和解码。此外，根据本总体发明构思的示例性实施例，对音频/语音信号进行编码和解码的方法和设备可使用较少比特执行编码和解码，从而可提高声音质量。本总体发明构思的另外效用将在下面的描述中部分地阐明，并且从描述中部分是清楚的，或者通过实施例的实施可以被得知。本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行编码的方法，所述方法包括接收至少一个音频信号和至少一个语音信号；将接收的音频信号和接收的语音信号中的至少一个变换为频率分辨率信号和时域分辨率信号中的至少一个；对变换的信号进行编码；对变换的信号和编码的信号中的至少一个进行量化。本总体发明构思的示例性实施例还提供了一种对音频信号和语音信号进行解码的方法，所述方法包括使用接收的信号的比特流中的关于时域编码或频域编码的信息，来确定当前帧信号是频率分辨率信号还是时域分辨率信号；当接收的信号是频率分辨率信号时，对比特流进行反量化；从比特流中的信息进行反线性预测，并使用该信息来恢复时域分辨率信号；将反量化的信号和恢复的时域分辨率信号中的至少一个反变换到时域的音频信号或语音信号。

从下面通过结合附图对示例实施例的描述中，本总体发明构思的这些和/或其它特征及效用将会变得清楚，并且更易于理解，其中图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图；图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图；图3是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图4是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图5是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图6是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图7是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图8是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图9是示出根据本总体发明构思的示例性实施例的对音频/ 设备的框图；图10是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图11是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图12是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图13是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图14是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图15是示出根据本总体发明构思的示例性实施例的对音频的设备的框图；图16是示出根据本总体发明构思的示例性实施例的对音频的方法的流程图；图17是示出根据本总体发明构思的示例性实施例的对音频的方法的流程图。
语音信号进行编码的语音信号进行解码的语音信号进行编码的语音信号进行编码的语音信号进行解码的语音信号进行编码的语音信号进行解码的 /语音信号进行编码 /语音信号进行解码 /语音信号进行编码 /语音信号进行解码 /语音信号进行编码 /语音信号进行解码 /语音信号进行编码 /语音信号进行解码
具体实施例方式现在将详细地参照示例实施例，其示例在附图中示出，其中，相同的标号始终表示相同的元件。以下通过参照附图描述示例性实施例以解释本公开。图1是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图1，对音频/语音信号进行编码的设备可包括信号变换单元110、心理声学建模单元120、时域编码单元130、量化单元140、参数立体声处理单元150、高频信号处理单元160和复用单元170。信号变换单元110可将输入的音频信号或语音信号变换为高分辨率信号(high frequentcy resoluteion signal)禾口 / 或高时间分辨率信号(high temporal resolution signal)0心理声学建模单元120可控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。具体地，心理声学建模单元120可计算用于量化的掩蔽阈值(masking threshold)，并至少使用计算的掩蔽阈值来控制信号变换单元110将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。时域编码单元130可至少使用语音建模来对由信号变换单元110变换的信号进行编码。具体地，心理声学建模单元120可将信息信号提供给时域编码单元130以控制时域编码单元130。在这种情况下，时域编码单元130可包括预测单元(未示出)。预测单元可通过对由信号变换单元110变换的信号应用语音建模并去除相关信息来对数据进行编码。此外，预测单元可包括短时预测器和长时预测器。量化单元140可对从信号变换单元110和/时域编码单元130输出的信号进行量化和编码。在这种情况下，量化单元140可包括码激励线性预测(CELP)单元，用于模拟去除了相关信息的信号。在图1中未示出CELP单元。参数立体声处理单元150可处理输入的音频信号或语音信号的立体声信息。高频信号处理单元160可处理输入的音频信号或语音信号的高频信息。以下，将更详细地描述对音频/语音信号进行编码的设备。信号变换单元110可将频谱系数划分为多个频带。心理声学建模单元120可分析频谱特性并确定多个频带的每个频带的时域分辨率或频域分辨率。当高时间分辨率适合于特定频带时，可由利用变换方案的反变换单元(如反调制重叠变换(IMLT)单元)来对特定频带中的频谱系数进行变换，可由时域编码单元130对变换的信号进行编码。反变换单元可包括在信号变换单元110中。在这种情况下，时域编码单元130可包括短时预测器和长时预测器。当输入的信号是语音信号时，由于提高的时域分辨率，时域编码单元130可有效地反映语音产生单元的特性。具体地，短时预测器可处理从信号变换单元110接收的数据，并可去除时域中的采样点的短时相关信息。此外，长时预测器可处理已执行短时预测的残差信号数据，从而可去除长时相关信息。量化单元140可计算输入的比特率的步长。可处理量化单元140的量化的采样点和附加信息以去除可能包括(例如)算术编码或霍夫曼编码的统计相关信息。可以以小于321cbpS的比特率来操作参数立体声处理单元150。此外，扩展运动图像专家组(MPEG)立体声处理单元可被用作参数立体声处理单元150。高频信号处理单元 160可有效地对高频信号进行编码。复用单元170可将上述单元中的一个或多个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它合适的压缩编码)来产生比特流。图2是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。参照图2，对音频/语音信号进行解码的设备可包括分辨率确定单元210、时域解码单元220、反量化单元230、反信号变换单元M0、高频信号处理单元250和参数立体声处理单元洸0。分辨率确定单元210可基于关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。反量化单元230可基于分辨率确定单元210的输出信号来对比特流进行反量化。时域220可从反量化单元230接收反量化的信号，从比特流中解码出用于反线性预测的附加信息，并至少使用所述附加信息和所述反量化的信号来恢复高时间分辨率信号。反信号变换单元240可将来自时域解码单元220的输出信号和/或来自反量化单元230的反量化的信号反变换到时域的音频信号或语音信号。反频变调制重叠变换(FV-MLT)可以是反信号变换单元M0。高频信号处理单元250可处理反变换的信号的高频信号，参数立体声处理单元 260可处理反变换的信号的立体声信息。可将比特流输入到反量化单元230、高频信号处理单元250和参数立体声处理单元沈0以对比特流进行解码。图3是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图3，对音频/语音信号进行编码的设备可包括信号变换单元310、心理声学建模单元320、时间噪声(temporal noise)整形单元330、高码率(high rate)立体声单元；340、量化单元350、高频信号处理单元360和复用单元370。信号变换单元310可将输入的音频信号或语音信号变换为高频率分辨率信号和/ 或高时间分辨率信号。改进离散余弦变换(MDCT)可被用作信号变换单元310。心理声学建模单元320可控制信号变换单元310将输入的音频信号或语音信号变换为高频率分辨率信号和/或高时间分辨率信号。时间噪声整形单元330可对变换的信号的时域噪声进行整形。高码率立体声单元340可对变换的信号的立体声信息进行编码。量化单元350可对从时间噪声整形单元330和/或高码率立体声单元340输出的信号进行量化。高频信号处理单元360可处理音频信号或语音信号的高频信号。复用单元370可将上述的单元的每个单元的输出信号输出为比特流。可使用压缩方案(如算术编码、霍夫曼编码或任何其它适合的编码)来产生比特流。图4是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。参照图4，对音频/语音信号进行解码的设备可包括反量化单元410、高码率立体声系统/解码器420、时间噪声整形器/解码器430、反信号变换单元440和高频信号处理单元450。反量化单元410可对比特流进行反量化。高码率立体声系统/解码器420可对反量化的信号进行解码。时间噪声整形器/ 解码器430可对在对音频/语音信号进行编码的设备中执行时域整形的信号进行解码。反信号变换单元440可将解码的信号反变换到时域的音频信号或语音信号。反 MDCT可被用作反信号变换单元440。高频信号处理单元450可处理反变换的解码的信号的高频信号。图5是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图5，CELP单元可包括在对音频/语音信号进行编码的设备的时域编码单元 520中，然而，CELP单元可包括在图1中的量化单元140中。也就是说，时域编码单元520可包括短时预测器、长时预测器和CELP单元。CELP 单元可指示模拟去除了相关信息的信号的激励建模模块。当信号变换单元在心理声学建模单元的控制下，将输入的音频信号或语音信号变换为高时间分辨率信号时，时域编码单元130可在不在频谱量化单元510中对高时间分辨率信号进行量化的情况下，或作为可选，通过使在频谱量化单元510中对高时间分辨率信号的量化最小化，来对变换的高时域分辨信号进行编码。包括在时域编码单元520中的CELP单元可对短时相关信息和长时相关信息的残差信号进行编码。图6是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图6，图1中示出的对音频/语音信号进行编码的设备还可包括切换单元 610。切换单元610可至少使用关于时域编码或频域编码的信息来选择任何一个或多个量化单元620的量化和时域编码单元630的编码。量化单元620可以是频谱量化单元。图7是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。参照图7，图2中示出的对音频/语音信号进行解码的设备还可包括切换单元 710。切换单元710可至少根据分辨率确定单元的确定来控制切换到时域解码单元730或频谱反量化单元720。图8是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图8，图1中示出的对音频/语音信号进行编码的设备还可包括下采样单元 810。下采样单元810可将输入的信号下采样为低频信号。可通过下采样来产生低频信号，当低频信号处于高码率和低码率的双重码率时，可执行下采样。也就是说，当以与高频信号处理单元的采样率的一半或四分之一相应的低采样率操作低频信号编码方案的采样频率时，可利用低频信号。当参数立体声处理单元包括在对音频/语音信号进行编码的设备中时，可在参数立体声处理单元执行正交镜像滤波器(QMF)合成时执行下采样。在这种情况下，高码率可以是高于641ibpS的码率，低码率可以是低于641ibpS的码率。图9是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。分辨率确定单元910可至少部分基于关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。反量化单元920可基于分辨率确定单元910的输出信号来对比特流进行反量化。时域解码单元930可从反量化单元920接收编码的残差信号，从比特流中解码出用于反线性预测的附加信息，并使用所述附加信息和所述残差信号来恢复高时间分辨率信号。反信号变换单元940可将来自时域解码单元930的输出信号和/或来自反量化单元920的反量化的信号反变换到时域的音频信号或语音信号。在这种情况下，高频信号处理单元950可在图9的对音频/语音信号进行解码的设备中执行上采样。图10是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图10，图5中示出的对音频/语音信号进行编码的设备还可包括下采样单元 1010。也就是说，可通过下采样产生低频信号。当应用参数立体声处理单元1020时，在参数立体声处理单元1020可执行QMF合成以产生缩混(downmix)信号时，下采样单元1010可执行下采样。时域编码单元1030可包括短时预测器、长时预测器和CELP单元。图11是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。分辨率确定单元1110可基于关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。所述信息可包括在比特流中。当分辨率确定单元1110确定当前帧信号是高频率分辨率信号时，频谱反量化单元1130可至少部分基于分辨率确定单元1110的输出信号来对比特流进行反量化。当分辨率确定单元1110确定当前帧信号是高时间分辨率信号时，时域解码单元 1120可恢复高时间分辨率信号。反信号变换单元1140可将来自时域解码单元1120的输出信号和/或来自频谱反量化单元1130的反量化的信号反变换到时域的音频信号或语音信号。此外，高频信号处理单元1150可在图11的对音频/语音信号进行解码的设备中执行上采样。图12是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图12，图6中示出的对音频/语音信号进行编码的设备还包括下采样单元 1210。也就是说，可通过下采样来产生低频信号。当应用参数立体声处理单元1220时，在参数立体声处理单元1220执行QMF合成时，下采样单元1210可执行下采样。图12的对音频/语音信号进行编码的设备的上/下采样因子可以是(例如)高频信号处理单元的采样率的一半或四分之一。也就是说，当以48kHz输入信号时，可通过上 /下采样使用24kHz或12kHz。图13是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。参照图13，图2中示出的对音频/语音信号进行解码的设备还可包括切换单元。也就是说，切换单元可控制切换到时域解码单元1320或频谱反量化单元1310。图14是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的设备的框图。参照图14，图1中示出的对音频/语音信号进行编码的设备和图3中示出的对音频/语音信号进行编码的设备可至少部分组合。也就是说，当作为低码率确定单元1430基于预定的低码率和高码率的确定的结果，变换的信号处于低码率时，可操作信号变换单元1410、时域编码单元1440和量化单元 1470。当变换的信号处于高码率时，可操作信号变换单元1410、时间噪声整形单元1450和高码率立体声单元1460。可基于预定标准打开/关闭参数立体声处理单元1481和高频信号处理单元1491。此外，可不同时操作高码率立体声单元1460和参数立体声处理单元1481。此外，可基于预定信息在高频信号处理确定单元1490和参数立体声处理确定单元1480的控制下，分别操作高频信号处理单元1491和参数立体声处理单元1481。图15是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的设备的框图。参照图15，图2中示出的对音频/语音信号进行解码的设备和图4中示出的对音频/语音信号进行解码的设备可至少部分组合。也就是说，当作为低码率确定单元1510的确定的结果，变换的信号处于高码率时，可操作高码率立体声系统/解码器1520、时间噪声整形器/解码器1530和反信号变换单元1540。当变换的信号处于低码率时，可操作分辨率确定单元1550、时域解码单元1560 和高频信号处理单元1570。此外，可基于预定信息在高频信号处理确定单元和参数立体声处理确定单元的控制下，分别操作高频信号处理单元1570和参数立体声处理单元1580。图16是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行编码的方法的流程图。在操作S1610中，输入的音频信号或语音信号可被变换为频域。在操作S1620中，可确定是否要执行变换到时域。还可进一步包括对输入的音频信号或语音信号进行下采样的操作。至少根据操作S 1620中确定的结果，在操作S 1630中，输入的音频信号或语音信号可被变换为高频率分辨率信号和/或高时间分辨率信号。也就是说，当将要执行变换到时域时，在操作S 1630中，输入的音频信号或语音信号可被变换为高时间分辨率信号并可被量化。当将不执行变换到时域时，在操作S 1640，输入的音频信号或语音信号可被量化并被编码。
图17是示出根据本总体发明构思的示例性实施例的对音频/语音信号进行解码的方法的流程图。在操作S 1710中，可确定当前帧信号是高频率分辨率信号还是高时间分辨率信号。在这种情况下，所述确定可基于关于时域编码或频域编码的信息，并且所述信息可包括在比特流中。在操作S 1720中，可对比特流进行反量化。在操作S 1730中，可接收反量化的信号，可从比特流中解码出用于反线性预测的附加信息，并且可使用所述附加信息和编码的残差信号来恢复高时间分辨率信号。在操作S 1740中，可将从时域解码单元输出的信号和/或来自反量化单元的反量化的信号反变换到时域的音频信号或语音信号。本总体发明构思还可实现为计算机可读介质上的计算机可读代码。计算机可读介质可包括计算机可读记录介质和计算机可读传输介质。计算机可读记录介质是可将数据存储为其后可由计算机系统读取的程序的任何数据存储装置。所述计算机可读记录介质的示例包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光学数据存储装置。所述计算机可读记录介质也可分布于联网的计算机系统上，以便所述计算机可读代码以分布方式被存储和执行。计算机可读传输介质可通过载波或信号发送(例如，通过因特网的有线数据传输或无线数据传输)。此外，本总体发明构思所属的领域的程序员可容易解释实现本总体发明构思的功能程序、代码和代码段。虽然已经示出和描述了本总体发明构思的若干示例实施例，但是本领域的技术人员应该理解，在不脱离本总体发明构思的原理和精神的范围内可对这些示例实施例进行改变，本总体发明构思的范围由权利要求及其等同物限定。
权利要求
1.一种对音频/语音信号进行编码的设备，所述设备包括信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；时域编码单元，基于语音建模，对由信号变换单元变换的信号进行编码；量化单元，对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
2.如权利要求1所述的设备，其中，量化单元包括码激励线性预测(CELP)，模拟去除了相关信息的信号。
3.一种对音频/语音信号进行编码的设备，所述设备包括参数立体声处理单元，处理输入的音频信号或语音信号的立体声信息；高频信号处理单元，处理输入的音频信号或语音信号的高频信号；信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；时域编码单元，基于语音建模，对由信号变换单元变换的信号进行编码；量化单元，对从信号变换单元和时域编码单元中的至少一个输出的信号进行量化。
4.如权利要求3所述的设备，其中，时域编码单元包括CELP，模拟去除了相关信息的信号。
5.如权利要求3所述的设备，其中，量化单元是频谱量化单元，还包括切换单元，根据变换的音频信号或语音信号是高频率分辨率信号还是高时间分辨率信号，选择来自的频谱量化单元和时域编码单元的输出信号中的任何一个。
6.如权利要求3所述的设备，还包括下采样单元，对音频信号或语音信号进行下采样。
7.如权利要求3所述的设备，其中，信号变换单元包括频变调制重叠变换(FV-MLT)和改进离散余弦变换(MDCT)中的至少一个。
8.如权利要求3所述的设备，其中，心理声学建模单元在量化期间将关于噪声的信息提供给量化单元。
9.如权利要求3所述的设备，其中，时域编码单元还包括预测单元，将语音建模应用到由信号变换单元变换的信号，并去除相关信息。
10.一种对音频/语音信号进行解码的设备，所述设备包括分辨率确定单元，基于关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号，所述信息包括在比特流中；反量化单元，当分辨率确定单元确定信号是高频率分辨率信号时，对比特流进行反量化；时域解码单元，从比特流中解码出用于反线性预测的附加信息，并使用所述附加信息来恢复高时间分辨率信号；反信号变换单元，将来自时域解码单元的输出信号和来自反量化单元的输出信号中的至少一个反变换到时域的音频信号或语音信号。
11.如权利要求10的设备，其中，所述设备还包括以下单元中的至少一个高频信号解码单元，处理反变换的信号的高频信号；参数立体声处理单元，处理反变换的信号的立体声信息。
12.—种对音频/语音信号进行编码的设备，所述设备包括信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；时间噪声整形单元，对变换的高频率分辨率信号和变换的高时间分辨率信号中的至少一个进行整形；高码率立体声单元，对变换的信号的立体声信息进行编码；量化单元，对从时间噪声整形单元和高码率立体声单元中的至少一个输出的信号进行量化。
13.如权利要求12所述的设备，还包括高频信号处理单元，处理音频信号或语音信号的高频信号。
14.一种对音频/语音信号进行解码的设备，所述设备包括反量化单元，对比特流进行反量化；高码率立体声系统/解码器，对反量化的信号进行解码；时间噪声整形器/解码器，处理由高码率立体声系统/解码器解码的信号；反信号变换单元，将处理的信号反变换到时域的音频信号或语音信号，其中，通过将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个来产生比特流。
15.如权利要求14所述的设备，还包括高频信号处理单元，处理反变换的信号的高频信号。
16.一种对音频/语音信号进行编码的设备，所述设备包括信号变换单元，将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个；心理声学建模单元，控制信号变换单元；低码率确定单元，确定变换的信号是否具有低码率；时域编码单元，当变换的信号具有低码率时，基于语音建模来对变换的信号进行编码；时间噪声整形单元，对变换的信号进行整形；高码率立体声单元，对整形的信号的立体声信息进行编码；量化单元，对来自高码率立体声单元的输出信号和来自时域编码单元的输出信号中的至少一个进行量化。
17.如权利要求16所述的设备，还包括参数立体声处理确定单元，基于预定信息确定是否操作参数立体声处理单元；参数立体声处理单元，当确定参数立体声处理单元将被操作时，处理输入的高频信号的立体声信息；高频信号处理确定单元，基于其它预定信息确定是否操作高频信号处理单元；高频信号处理单元，当确定高频信号处理单元将被操作时，处理输入的高频信号。
18.一种对音频/语音信号进行编码的方法，所述方法包括将输入的音频信号或语音信号变换为高频率分辨率信号和高时间分辨率信号中的至少一个，并基于心理声学建模控制变换的信号；至少部分基于语音建模，对变换的信号进行时间编码；对变换的信号和时间编码的信号中的至少一个进行量化。
19.一种对音频/语音信号进行解码的方法，所述方法包括至少部分基于包括在比特流中的关于时域编码或频域编码的信息，确定当前帧信号是高频率分辨率信号还是高时间分辨率信号；当所述信号被确定为高频率分辨率信号时，对比特流进行反量化；从比特流中解码出用于反线性预测的附加信息，并使用所述附加信息来恢复高时间分辨率信号；将恢复的信号和反量化的信号中的至少一个反变换到时域的音频信号或语音信号。
20.一种对音频信号和语音信号进行编码的方法，所述方法包括接收至少一个音频信号和至少一个语音信号；将接收的音频信号和接收的语音信号中的至少一个变换为频率分辨率信号和时间分辨率信号中的至少一个；对变换的信号进行编码；对变换的信号和编码的信号中的至少一个进行量化。
21.一种对音频信号和语音信号进行解码的方法，所述方法包括使用接收的信号的比特流中的关于时域编码或频域编码的信息，来确定当前帧信号高频率分辨率信号还是时间分辨率信号；当接收的信号是频率分辨率信号时，对比特流进行反量化；从比特流中的信息进行反线性预测，并使用所述信息来恢复时间分辨率信号；将反量化的信号和恢复的时域分辨率信号中的至少一个反变换到时域的音频信号或语音信号。
全文摘要
提供了一种对音频/语音信号进行编码和解码的方法和设备。输入的音频信号或语音信号可被变换为高频率分辨率信号和高时间分辨率信号中的至少一个。可通过确定合适的分辨率来对信号进行编码，可对编码的信号进行解码，从而，可处理音频信号、语音信号以及音频信号和语音信号的混合信号。
文档编号G10L19/12GK102150202SQ200980135987
公开日2011年8月10日申请日期2009年7月14日优先权日2008年7月14日
发明者吴殷美, 成昊相, 朱基岘, 金美英, 金重会申请人:三星电子株式会社

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴殷美
技术所有人：三星电子株式会社
我是此专利的发明人