变换、编码、逆变换和解码音频信号的方法和设备的制作方法

文档序号:2824584阅读:177来源:国知局
专利名称:变换、编码、逆变换和解码音频信号的方法和设备的制作方法
技术领域
本发明涉及音频信号的编码和解码,更具体地讲,涉及一种用于通过根据音频信号中的变化选择各种长度的帧的一种帧、使用不为0的窗口系数以选择的帧为单元对音频信号进行变换、编码和解码来变换音频信号的设备和方法;一种用于适应于音频信号中的变化对音频信号编码的设备和方法;一种用于逆变换音频信号的设备和方法;和一种用于适应于音频信号中的变化对音频信号解码的设备和方法。
背景技术
通常,通过以下方法对音频信号编码将音频信号变换为多个预定帧单元,并通过改变变换的音频信号的比特率和量化变换的音频信号来产生比特流。音频信号的帧的长度必须根据音频信号变化的程度来确定。具体地讲,在时域中变化快的音频信号的帧的长度必须被确定为更小,以使该音频信号可被处理到宽频带的频域中,由此产生更精确的比特流。相反,在时域中变化慢的音频信号的帧长度必须被确定为更大,以使该音频信号可被处理到窄频带的频域中,由此减少频率资源的消耗。
通常,帧的类型是有限的,例如,帧分为长帧和短帧。因此,使用过采样变换对迅速变化程度大的音频信号编码,由此引起编码的音频信号的失真。
图1是示出传统的帧类型和相关的窗口系数的表。参考图1,有长帧和短帧、通过变换长帧和短帧而分别获得的长起始帧和长停止帧。当对长起始帧和长停止帧执行加窗操作时,它们具有窗口系数0。
图2是示出使用加窗操作将具有窗口系数0的音频信号变换到频域中的图表。
现在将简要地描述变换和逆变换音频信号的方法。通常,使用改进的离散余弦变换(MDCT)将音频信号变换到频域中。根据MDCT,通过将时间轴上的输入数据乘以图2所示的窗口系数来获得z信号。接下来,通过将z信号的值代入以下方程来计算最终的频谱
Xi,k=2·Σn=0N-1zi,ncos(2πN(n+n0)(k+12)),]]>其中0≤k<N/2 ...(1)其中Xi,k表示频域的值,zi,n表示加窗的输入序列,n表示采样单元的索引,k表示频谱系数的索引,i表示帧索引,N表示帧的长度,n0表示(N/2+1)/2。
使用以下方程将编码的音频信号逆变换到时域中xi,n=2NΣk=0N2-1spec[i][k]cos(2πN(n+n0)(k+12)),]]>其中0≤n<N...(2)其中Xi,n表示通过逆变换编码的音频信号而获得的值。
如上所述,通常,当使用MDCT将音频信号变换到频域中时,使用窗口系数0对从时间轴的1538+128到2048范围的音频信号的第一帧单元的部分进行变换。在这种情况中获得的帧采样被乘以窗口系数0,因而,乘法的结果被忽略。虽然通过根据MDCT特性使用第一帧单元获得了1024频谱值,但是当窗口系数为0时MDCT的效果降低。

发明内容
本发明的一方面提供一种使用除0之外的窗口系数来变换音频信号的方法。
本发明的一方面还提供一种以根据音频信号中的变化而选择的帧为单元变换音频信号的方法。
本发明的一方面还提供一种以根据音频信号中的变化而选择的帧为单元对音频信号编码的方法。
本发明的一方面还提供一种使用除0之外的窗口系数来变换音频信号的设备。
本发明的一方面还提供一种以根据音频信号中的变化而选择的帧为单元变换音频信号的设备。
本发明的一方面还提供一种以根据音频信号中的变化而选择的帧为单元对音频信号编码的设备。
本发明的一方面还提供一种对使用除0之外的窗口系数而编码的音频信号逆变换的方法。
本发明的一方面还提供一种对以根据音频信号中的变化而选择的帧为单元编码的音频信号逆变换的方法。
本发明的一方面还提供一种对以根据音频信号中的变化而选择的帧为单元编码的音频信号解码的方法。
本发明的一方面还提供一种对使用除0之外的窗口系数而编码的音频信号逆变换的设备。
本发明的一方面还提供一种对以根据音频信号中的变化而选择的帧为单元编码的音频信号逆变换的设备。
本发明的一方面还提供一种对以根据音频信号中的变化而选择的帧为单元编码的音频信号解码的设备。
根据本发明的一个实施例,提供一种变换音频信号的方法,该方法包括确定音频信号将根据其被变换为频域中的音频信号的变换单元;和使用除0之外的窗口系数,根据确定的变换单元将时域中的音频信号变换为频域中的音频信号。
根据本发明的另一实施例,提供一种变换音频信号的方法,该方法包括将音频信号过滤为预定采样单元;当音频信号的尺寸变得大于预定阈值时,确定音频信号将根据其被变换为频域中的音频信号的适应性变换单元;和根据确定的适应性变化单元将音频信号变换为频域中的音频信号。
根据本发明的另一实施例,提供一种对音频信号适应性编码的方法,该方法包括将音频信号过滤为预定采样单元;当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换到频域中的适应性变换单元;根据确定的适应性变换单元,将音频信号变换为频域中的音频信号;将变换到频域中的音频信号进行量化;和对量化的音频信号编码。
根据本发明的另一实施例,提供一种用于变换音频信号的设备,该设备包括变换单元确定器,确定音频信号将根据其被变换为频域中的音频信号的变换单元;和频域变换器,使用除0之外的窗口系数,根据确定的变换单元,将时域中的音频信号变换为频域中的音频信号。
根据本发明的另一实施例,提供一种用于变换音频信号的设备,该设备包括过滤单元,将音频信号过滤为预定采样单元;适应性变换单元,当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换为频域中的音频信号的适应性变换单元;和频域变换器,根据确定的适应性变换单元,将音频信号变换为频域中的音频信号。
根据本发明的另一实施例,提供一种用于对音频信号适应性编码的设备,该设备包括过滤单元,将音频信号过滤为预定采样单元;适应性变换单元确定器,当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换到频域中的适应性变换单元;频域变换器,根据确定的适应性变换单元,将音频信号变换为频域中的音频信号;量化单元,对变换到频域中的音频信号进行量化;比特率控制器,控制将被量化的音频信号的比特率;和编码单元,对量化的音频信号编码。
根据本发明的另一实施例,提供一种逆变换音频信号的方法,该方法包括对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
根据本发明的另一实施例,提供一种逆变换音频信号的方法,该方法包括从音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和根据检测到的信息的适应性变换单元对音频数据进行逆变换。
根据本发明的另一实施例,提供一种对音频信号解码的方法,该方法包括对编码的音频数据解码;对解码的音频数据进行逆量化;从逆量化的音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和根据检测到的信息的适应性变换单元对音频数据进行逆变换。
根据本发明的另一实施例,提供一种用于对音频信号进行逆变换的设备,该设备包括时域逆变换器,对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
根据本发明的另一实施例,提供一种用于对音频信号进行逆变换的设备,该设备包括变换单元信息检测器,从音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和时域逆变换器,根据检测到的信息的适应性变换单元对音频数据进行逆变换。
根据本发明的另一实施例,提供一种用于对音频信号进行适应性解码的设备,该设备包括解码单元,对编码的音频数据解码;逆量化单元,对解码的音频数据进行逆量化;变换单元信息检测器,从逆量化的音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和时域逆变换器,根据检测到的信息的适应性变化单元对音频数据进行逆变换。
本发明的另外的和/或其它方面和优点将在下面的描述中部分阐述,部分从该描述是显而易见的,或可通过实施本发明来了解。


从下面结合附图进行的详细描述,本发明的以上和/或方面和优点将变得清楚和更易于理解,其中图1是示出传统的帧类型和相关的窗口系数的表;图2是示出使用加窗操作将具有窗口系数0的音频信号变换到频域中的图表;图3是根据本发明实施例的将音频信号变换到频域中的方法的流程;图4是示出根据本发明实施例的当音频信号被变换时可获得的各种类型的帧的表;图5是图3中所示的操作12的详细流程;图6是根据本发明另一实施例的变换音频信号的方法的流程图;图7是根据本发明实施例的过滤成预定帧单元的音频信号的示图,用于解释图6中所示的操作50;图8是图6中所示的操作52的详细流程;图9是图8中所示的操作74的详细流程;图10是图6中所示的操作54的详细流程;图11是根据本发明实施例的对音频信号适应性编码的方法的流程;图12是根据本发明实施例的用于变换音频信号的设备的方框图;图13是图12中所示的频域变换器的方框图;图14是根据本发明另一实施例的用于变换音频信号的设备的方框图;图15是图14中所示的适应性变换单元确定器的方框图;图16是图14中所示的频域变换器的方框图;图17是根据本发明实施例的用于对音频信号适应性编码的设备的方框图;图18是根据本发明实施例的逆变换音频信号的方法的流程;图19是根据本发明实施例的对音频信号适应性解码的方法的流程;图20是根据本发明实施例的用于逆变换音频信号的设备的方框图;图21是根据本发明另一实施例的用于逆变换音频信号的设备的方框图;和图22是根据本发明实施例的用于对音频信号适应性解码的设备的方框图。
具体实施例方式
现在将详细描述本发明的实施例,其示例在附图中说明,其中相同的标号始终表示相同的部件。以下对实施例进行描述以通过参考附图来解释本发明。
图3是根据本发明实施例的将音频信号变换到频域中的方法的流程。参考图3,音频信号将根据其被变换到频域中的帧被确定(操作10)。
图4是示出根据本发明实施例的当音频信号被变换时可获得的各种类型的帧的表。当音频信号被变换成的单元被确定为帧时,根据音频信号中的变化来选择各种长度的帧之一。
返回图3,在操作10之后,使用除0之外的窗口系数,根据确定的变换单元将音频信号变换到频域中(操作12)。
图5是图3中所示的操作12的详细流程。参考图5,使用除0之外的窗口系数,根据确定的变换单元对音频信号执行加窗操作(操作30)。所述确定的变换单元就是帧单元。加窗操作是用于最小化帧之间的信息的不连续性和当音频信号被分割为帧单元时引起的信息的失真的技术。加窗操作使用确定的窗口系数,以使可通过使用改进的离散余弦变换(MDCT)对变换的音频信号进行逆变换来恢复原始音频信号。通常,用于音频编解码器MPEG-4AAC/BSAC/TwinVQ的正弦窗口系数或Kaiser-Bessel窗口系数被用作窗口系数。然而,用于本实施例中的窗口系数是除0之外的值。在操作30中,可使用不为0的窗口系数对音频信号执行加窗操作,变成从图4中所示的帧选择的帧单元。由于没有使用窗口系数0,所以可防止变换音频信号的效果的降低。
在操作30之后,加窗的音频信号被变换为频域中的音频信号(操作32)。离散余弦变换(DCT)或MDCT可被用于变换加窗的音频信号。
图6是根据本发明另一实施例的将音频信号变换到频域中的方法的流程。参考图6,音频信号被过滤成预定采样单元(操作50)。在操作50中,根据频带对音频信号的需要的部分执行过滤。所述预定采样单元指示采样的音频信号可被分割成的长度的单元。图7是过滤成预定帧的音频信号的示图,用于解释图6中所示的操作50。参考图7,音频信号被分割,并被过滤成128位的采样单元。在图7中,X1到Xn分别表示音频信号被过滤成的128位采样单元的索引标记。
在操作50之后,当音频信号的尺寸变得大于预定阈值时,音频信号将根据其被变换到频域中的适应性变换单元被确定(操作52)。所述预定阈值是用于确定音频信号迅速变化程度是否大的参考值。所述适应性变换单元是音频信号可根据其被变换到频域中同时最小化音频信号的失真的单元,并且当音频信号迅速变化程度大时被确定。适应性变换单元的长度可如图4所示不同地确定。可从超长帧F1、长帧F2、短帧F3和超短帧F4选择适应性变换单元。在图4中,T1、T2、T3、T4和T5表示通过变换F1到F4这些帧而获得的帧。然而,本发明不限于这些帧,即,各种长度的帧可被用于变换音频信号。
图8是图6中所示的操作52的详细流程。参考图8,与过滤的音频信号中的变化程度相应的迅速变化系数被计算(操作70)。所述迅速变化系数被用于确定过滤的音频信号迅速变化程度是否大。例如,图7中所示的音频信号被过滤成的采样单元X1到Xn的每个的迅速变化系数被计算。具体地讲,采样单元X1到Xn的代表值y1到yn被确定。代表值y1到yn的每个是采样单元X1到Xn的每个的最大值。接下来,根据下式计算代表值y1到yn的每个的迅速变化系数Ak=yk/Mk...(3)其中Ak表示采样单元Xk的迅速变化系数,yk表示采样单元Xk的代表值,Mk表示采样单元X1到Xk-1的代表值y1到yk-1的平均值。
如方程(3)所示,当迅速变化系数大时,音频信号被认为是在获得该迅速变化系数的音频信号的帧,迅速变化程度大。
在操作70之后,如果迅速变化系数大于预定阈值,则迅速变化程度开始大的音频信号的迅速变化长度被测量(操作72)。如上所述,所述预定阈值是用于确定音频信号迅速变化程度是否大的参考值。所述迅速变化长度对应于音频信号的起始帧和在时域中迅速变化程度开始大的音频信号的帧的位置之间的差。迅速变化系数大于预定阈值指示在获得该迅速变化系数的点,音频信号迅速变化程度大。例如,通过将采样单元的值128乘以在其获得所述迅速变化系数的采样单元Xk的值k来计算迅速变化长度。即,根据下式计算迅速变化长度Bk=128×k ...(4)其中Bk表示迅速变化长度,128表示音频信号的采样单元的值,k表示在其获得迅速变化系数的采样单元Xk的下标k的值。
在操作72之后,通过将迅速变化长度与各种类型的帧的长度之和进行比较来确定音频信号将被变换成的帧的类型(操作74)。
图9是图8中所示的操作74的详细流程。参考图9,确定迅速变化程度开始大的音频信号的帧的长度是否等于或大于超长帧和超短帧的长度之和(操作80)。例如,参考图4,确定长度Bk是否等于或大于超长帧F1和超短帧F4的长度之和。
如果长度Bk等于或大于超长帧F1和超短帧F4的长度之和,则确定音频信号被变换成的前一帧是否是超短帧(操作82)。例如,当长度Bk等于或大于超长帧F1和超短帧F4的长度之和时,采样单元X1到Xk的总长很可能至少大于超长帧F1的长度。因此,如果迅速变化长度等于或大于超长帧和超短帧的长度之和,则超长帧或长帧被选择为音频信号将被变换成的帧。
如果前一帧不是超短帧,则超长帧被选择为音频信号将根据其被变换到频域中的帧(操作84)。例如,当前一帧不是图4的超短帧F4时,这意味着在前一帧中没有出现迅速变化。在这种情况下,即使超长帧F1被选择,当音频信号被编码时该音频信号也不会失真。因此,如果前一帧不是超短帧F4,则超长帧F1被选择为音频信号将被变换成的帧。
然而,当前一帧是超短帧时,长帧被选择(操作86)。例如,当前一帧是超短帧F4时,应该理解为至少在前一帧中出现了突变。在这种情况下,为了最小化当音频信号被编码时音频信号的失真,最好是选择长帧F2而不是超长帧F1。
如果迅速变化长度小于超长帧和超短帧的长度之和,则确定迅速变化程度开始大的音频信号的帧的长度是否等于或大于长帧和超短帧的长度之和(操作88)。例如,当长度Bk小于超长帧F1和超短帧F4的长度之和时,采样单元X1到Xk的总长很可能小于超长帧F1的长度。在这种情况下,确定长度Bk是否等于或大于长帧F2和超短帧F4的长度之和。
如果迅速变化长度等于或大于长帧和超短帧的长度之和,则图9的方法继续进行到操作86,并且长帧被选择。例如,当长度Bk等于或大于长帧F2和超短帧F4的长度之和时,采样单元X1到Xk的总长至少大于短帧F3的长度,并且长帧F2被选择。
然而,当迅速变化长度小于长帧和超短帧的长度之和时,确定迅速变化长度是否等于或大于短帧和超短帧的长度之和(操作90)。例如,当长度Bk小于长帧F2和超短帧F4的长度之和时,采样单元X1到Xk的总长很可能小于长帧F2的长度。因而,迅速变化程度开始大的音频信号的帧的长度等于或大于短帧和超短帧的长度之和。
如果迅速变化长度等于或大于短帧和超短帧的长度之和,则短帧被选择(操作92)。例如,当长度Bk等于或大于短帧F3和超短帧F4的长度之和时,采样单元X1到Xk的总长至少大于超短帧F4的长度。因此,短帧F3被选择。
然而,如果迅速变化长度小于短帧和超短帧的长度之和,则超短帧被选择(操作94)。例如,当长度Bk小于短帧F3和超短帧F4的长度之和时,采样单元X1到Xk的总长很可能小于短帧F3的长度。因而,当迅速变化长度小于短帧和超短帧的长度之和时,超短帧F4被选择。
图8中所示的操作74是非限制性示例。因此,可使用各种方法来确定音频信号将根据其被变换到频域中的帧。例如,在图9的操作80中,可将显著变化程度开始大的音频信号的帧的长度与超长帧和短帧的长度之和或者超长帧、超短帧和短帧的长度之和进行比较,而不与超长帧和超短帧的长度之和进行比较。
返回到图6,在操作52之后,以确定的帧为单元,音频信号被变换到频域中(操作54)。
图10是图6中所示的操作54的详细流程。参考图10,使用除0之外的窗口系数对音频信号执行加窗操作(操作100)。根据本实施例,与传统技术不同,窗口系数0不用于加窗操作。此外,从各种帧将一种帧选择为适应性帧单元,并且使用除0之外的窗口系数以选择的帧为单元对音频信号执行加窗操作。因此,根据本实施例,使用临界(critically)采样变换对音频信号进行变换,而不是使用现有技术中使用的过采样变换,从而最小化了当音频信号被编码时该音频信号的失真。
在操作100之后,加窗的音频信号被变换到频域中(操作102)。在操作102中,DCT或MDCT可被用于将音频信号变换到频域中。
现在将参考图11描述根据本发明实施例的对音频信号适应性编码的方法。参考图11,音频信号被过滤成预定采样单元(操作110)。在操作110中,根据频带对音频信号的需要的部分执行过滤。以上已描述了过滤音频信号的方法。
在操作110之后,当音频信号的尺寸变得大于预定阈值时,音频信号将根据其被变换到频域中的适应性变换单元被确定(操作112)。以上已描述了操作112的详细描述。
在操作112之后,以确定的适应性变换单元为单元,音频信号被变换到频域中(操作114)。以上已描述了使用除0之外的窗口系数将音频信号变换成确定的帧的方法。
在操作114之后,变换到频域中的音频信号被量化(操作116)。具体地讲,在操作116中,以根据比特分配信息的比特率对变换成频域中的频率成分的音频信号进行量化。
在操作116之后,量化的音频信号被编码(操作118)。换句话说,在操作118中,通过对量化的音频信号编码来获得编码的比特流。有损压缩或无损压缩可被用于对量化的音频信号编码。在无损压缩中,通过计算量化的音频信号的合适的概率分布并使用哈夫曼编码或算术编码对该概率分布编码来对量化的音频信号编码。
现在将参考图12来描述根据本发明实施例的用于变换音频信号的设备。该设备包括变换单元确定器200和频域变换器220。变换单元确定器200确定音频信号将被变换成的单元,并将确定的单元提供给频域变换器220。如果确定的单元是帧,则变换单元确定器200能根据音频信号中的变化从不同长度的帧选择一种帧。如果这些帧为图4中所示的超长帧F1、长帧F2、短帧F3和超短帧F4,则变换单元确定器200根据音频信号中的迅速变化选择超长帧F1、长帧F2、短帧F3和超短帧F4之一。
以由变换单元确定器200选择的帧为单元,频域变换器220使用除0之外的窗口系数将时域中的音频信号变换到频域中。
图13是图12中所示的频域变换器220的详细方框图。参考图13,频域变换器220包括加窗单元300和信号变换器320。
加窗单元300使用除0之外的窗口系数对音频信号执行加窗操作,变成确定的帧单元,并将操作结果输出给信号变换器320。由加窗单元300使用的窗口系数被确定,以使通过作为逆变换的MDCT来恢复原始音频信号。通常,用于音频编解码器MPEG-4 AAC/BSAC/TwinVQ中的正弦窗口系数或Kaiser-Bessel窗口系数被用作窗口系数,但是加窗单元300不使用窗口系数0。换句话说,加窗单元300使用除0之外的窗口系数来执行加窗操作,从而防止变换音频信号的效果的降低。
信号变换器320使用MDCT或DCT将由加窗单元300加窗的音频信号变换到频域中。
现在将与附图一起描述根据本发明的用于变换音频信号的设备。
图14是根据本发明另一实施例的用于变换音频信号的设备的方框图。该设备包括过滤单元400、适应性变换单元确定器420和频域变换器440。
过滤单元400将音频信号过滤成预定采样单元,并将过滤结果输出给适应性变换单元确定器420。过滤单元400根据频带仅过滤音频信号的需要的部分。预定采样单元是采样的音频信号被分割成的单元。例如,过滤单元400将音频信号分割并过滤成诸如图7中所示的预定采样单元的预定采样单元。
当音频信号的尺寸变得大于预定阈值时,适应性变换单元确定器420确定音频信号将根据其被变换到频域中的适应性变换单元,并将确定的适应性变换单元提供给频域变换器440。所述预定阈值是用于确定音频信号迅速变化程度是否大的参考值。所述适应性变换单元是音频信号可根据其被变换到频域中同时最小化音频信号的失真的单元,并且当音频信号迅速变化程度大时被确定。
图15是适应性变换单元确定器420的方框图。参考图15,适应性变换单元确定器420包括迅速变化系数计算器500、长度检测器520和帧类型确定器540。
迅速变化系数计算器500计算与由过滤单元400过滤的音频信号中的变化程度相应的迅速变化系数,并将迅速变化系数提供给长度检测器520。所述迅速变化系数是用于确定过滤的音频信号迅速变化程度是否大的参考值。迅速变化系数值大指示在获得该迅速变化系数的位置,音频信号迅速变化程度大。迅速变化系数计算器500使用方程(3)计算迅速变化系数。
当迅速变化系数大于预定阈值时,长度检测器520检测迅速变化程度大的音频信号的帧的长度,并将检测结果输出给帧类型确定器540。如上所述,所述预定阈值是用于确定音频信号迅速变化程度是否大的参考值。所述迅速变化长度对应于音频信号的起始帧和时域中迅速变化程度开始大的音频信号的帧的位置之间的差。当迅速变化系数大于预定阈值时,音频信号被认为是在获得该迅速变化系数的位置,迅速变化程度大。长度检测器520使用方程(4)检测迅速变换长度。
帧类型确定器540将迅速变化长度与各种类型的帧的长度之和进行比较,确定音频信号将被变换成的帧的类型,并将确定结果输出给频域变换器440。
如果帧分为超长帧、长帧、短帧和超短帧,则帧类型确定器540将迅速变化长度与这些帧的长度之和进行比较,并基于比较结果将这些帧之一选择为音频信号将被变换成的最佳帧。
根据由适应性变换单元确定器420确定的适应性变换单元,频域变换器440将音频信号变换到频域中。
图16是图14中所示的频域变换器440的详细方框图。参考图16,频域变换器440包括加窗单元600和信号变换器620。
加窗单元600使用除0之外的窗口系数对音频信号执行加窗操作,变成确定的适应性变换单元,并将操作结果输出给信号变换器620。由加窗单元600使用的窗口系数被确定,以使通过作为逆变换的MDCT来恢复原始音频信号。通常,音频编解码器MPEG-4 AAC/BSAC/TwinVQ中使用的正弦窗口系数或Kaiser-bessel窗口系数被用作窗口系数,但是加窗单元600不使用系数0。即,加窗单元600使用除0之外的窗口系数对音频信号执行加窗操作,变成与适应性变换单元相应的帧单元。
信号变换器620使用DCT或MDCT将由加窗单元600加窗的音频信号变换到频域中。
现在将参考图17来描述根据本发明实施例的用于对音频信号适应性编码的设备。该设备包括过滤单元700、适应性变换单元确定器710、频域变换器720、量化单元730、比特率控制器740和编码单元750。
过滤单元700将音频信号过滤成预定采样单元,并将过滤结果输出给适应性变化单元确定器710。过滤单元700根据频带仅过滤音频信号的需要的部分。过滤单元700的操作与过滤单元400的操作相同,因而这里将不对其进行描述。
当音频信号的尺寸大于预定阈值时,适应性变换单元确定器710确定音频信号将根据其被变换到频域中的适应性变换单元,并将确定结果输出给频域变换器720。所述适应性变换单元是音频信号可被变换成其同时减小音频信号的失真的单元,并且当音频信号迅速变化程度大时被确定。适应性变换单元确定器710的操作与适应性变换单元确定器420的操作相同,因而这里将不对其进行描述。
根据由适应性变换单元确定器710确定的适应性变换单元,频域变换器720将音频信号变换到频域中,并将变换的音频信号输出给量化单元730。频域变换器720使用除0之外的窗口系数根据确定的适应性变换单元将音频信号变换到频域中。频域变换器720的操作与频域变换器440的操作相同,因而这里将不对其进行描述。
量化单元730以由比特率控制器740分配的编码比特率对从频域变换器720输出的变换的音频信号进行量化,并将量化结果输出给编码单元750。
比特率控制器740从编码单元750接收关于比特流的比特率的信息,计算与比特流的比特率相应的比特分配参数,并将比特分配参数提供给量化单元730。比特率控制器740可将从编码单元750输出的比特流的比特率微调到期望的比特率。
编码单元750从量化单元730接收量化的音频信号,并将其编码成比特流。虽然未显示,但是编码单元750包括无损压缩单元和有损压缩单元。具体地讲,编码单元750可获得量化的音频信号的合适的概率分布,并使用诸如哈夫曼编码或算术编码的无损压缩对该概率分布进行编码。
现在将描述根据本发明实施例的逆变换音频信号的方法。在该方法中,使用除0之外的窗口系数将其编码成频域中的比特流的音频信号被逆变换到时域中。除0之外的窗口系数的使用防止了逆变换音频信号的效果的降低。
现在将参考图18来描述根据本发明另一实施例的逆变换音频信号的方法。参考图18,从音频数据获得关于音频信号根据其被变换到频域中的适应性变换单元的信息(操作800)。当时域中的音频信号被变换到频域中时,根据迅速变化程度大的音频信号的尺寸变化来确定适应性变换单元。当音频信号被编码时,关于适应性变换单元的信息被包括在头信息中,并且当变换到频域中的音频信号被逆变换到时域中时被从该头信息中获得。
在操作800之后,根据关于适应性变换单元的信息以适应性变换单元对音频数据逆变换(操作802)。在逆变换中,变换到频域中的音频信号被逆变换到时域中。
具体地讲,根据本发明的本实施例,根据适应性变换单元,使用除0之外的窗口系数而编码到频域中的音频数据被逆变换为时域中的音频信号。
现在将参考图19来描述根据本发明实施例的对音频信号适应性解码的方法。参考图19,编码的音频数据被解码(操作900)。具体地讲,以对音频数据编码的方式相反的方式处理输入的比特流。如果比特流被有损编码,则该比特流必须通过算术编码或哈夫曼编码进行无损解码。
在操作900之后,解码的音频数据被逆量化(操作902)。通过逆量化,解码的音频数据被恢复为具有原始尺寸的音频信号,该音频信号已被量化过。
在操作902之后,从逆量化的音频数据获得关于音频信号根据其被变换到频域中的适应性变换单元的信息(操作904)。如上所述,当时域中的音频信号被变换到频域中时,根据迅速变化程度大的音频信号的尺寸变化来确定适应性变换单元。当音频信号被编码时,关于适应性变换单元的信息被包括在头信息中,并且当频域中的音频信号被逆变换到时域中时被从该头信息中获得。
在操作904之后,根据关于确定的适应性变换单元的信息以适应性变换单元对音频数据逆变换(操作906)。明确地讲,逆量化的音频信号被逆变换到时域中。具体地讲,根据适应性变换单元,使用除0之外的窗口系数而编码到频域中的音频数据被逆变换为时域中的音频信号。
现在将参考附图来描述根据本发明实施例的用于逆变换音频信号的设备。
图20是根据本发明实施例的作为逆变换音频信号的设备的时域逆变换器1000的方框图。时域逆变换器1000对通过使用除0之外的窗口系数将音频信号变换到频域中而获得的比特流的音频数据进行逆变换。换句话说,时域逆变换器1000将使用除0之外的窗口系数而编码的频域音频数据逆变换为时域音频信号。
图21是根据本发明另一实施例的用于逆变换音频信号的设备的方框图。该设备包括变换单元信息检测器1100和时域逆变换器1120。
变换单元信息检测器1100从音频数据检测关于音频信号根据其被变换到频域中的适应性变换单元的信息,并将检测到的信息输出给时域逆变换器1120。当将时域中的音频信号变换到频域中时,根据迅速变化程度大的音频信号的尺寸变化来确定适应性变换单元。当音频信号被编码时,关于适应性变换单元的信息被包括在头信息中,并且当变换到频域中的音频信号被逆变换到时域中时被从该头信息获得。
时域逆变换器1120根据关于适应性变换单元的信息以适应性变换单元对音频数据逆变换。时域逆变换器1120根据适应性变换单元将频域音频信号变换为时域音频信号。详细地讲,时域逆变换器1120根据适应性变换单元对作为通过使用除0之外的窗口系数将音频信号变换到频域中而获得的比特流的音频数据进行逆变换。
现在将参考图22来描述根据本发明实施例的用于对音频信号适应性解码的设备。该设备包括解码单元1200、逆量化单元1220、变换单元信息检测器1240和时域逆变换器1260。
解码单元1200对编码的音频数据解码,并将解码的音频数据输出给逆量化单元1220。即,解码单元1200以编码单元750对音频信号编码的方式相反的方式处理输入的比特流。具体地讲,解码单元1200使用诸如算术解码或哈夫曼解码的无损解码对无损编码的比特流解码。
逆量化单元1220对由解码单元1200解码的音频数据进行逆量化,并将逆量化的音频数据输出给变换单元信息检测器1240。即,逆量化器1220将解码的音频信号恢复为具有原始尺寸的音频信号,该音频信号已被量化过。
变换单元信息检测器1240从音频数据检测关于音频信号根据其被变换到频域中的适应性变换单元的信息,并将关于适应性变换单元的信息输出给时域逆变换器1260。当在音频信号被编码时关于适应性变换单元的信息被包括在头信息中时,变换单元信息检测器1240从该头信息检测关于适应性变换单元的信息。
时域逆变换器1260根据关于适应性变换单元的信息以适应性变换单元对音频数据进行逆变换。换句话说,时域逆变换器1260根据适应性变换单元将频域音频信号变换为时域音频信号。具体地讲,时域逆变换器1260根据适应性变换单元对作为通过使用除0之外的窗口系数将音频信号变换到频域中而获得的比特流的音频数据进行逆变换。
根据本发明的上述实施例,以适应性帧为单元,音频信号被变换到频域中,所述适应性帧是根据音频信号中的突变来确定的。因此,在提高压缩效率的同时,即使以高比特率对音频信号编码,也可最小化音频信号的失真。
虽然已显示并描述了本发明的几个实施例,但是本发明不限于所述实施例。相反,本领域的技术人员应该理解,在不脱离本发明的精神和范围的情况下,可对这些实施例进行改变,本发明的范围由权利要求及其等同物所限定。
权利要求
1.一种变换音频信号的方法,包括(a)确定音频信号将根据其被变换为频域中的音频信号的变换单元;和(b)使用除0之外的窗口系数,根据确定的变换单元将时域中的音频信号变换为频域中的音频信号。
2.如权利要求1所述的方法,其中,操作(b)包括(b1)使用除0之外的窗口系数,根据确定的变换单元对音频信号执行加窗操作;和(b2)将加窗的音频信号变换为频域中的音频信号。
3.一种变换音频信号的方法,包括(a)将音频信号过滤为预定采样单元;(b)当音频信号的尺寸变得大于预定阈值时,确定音频信号将根据其被变换为频域中的音频信号的适应性变换单元;和(c)根据确定的适应性变化单元将音频信号变换为频域中的音频信号。
4.如权利要求3所述的方法,其中,操作(b)包括(b1)当所述适应性变换单元是帧时,计算与过滤的音频信号的变化程度相应的迅速变化系数;(b2)当所述迅速变化系数大于预定阈值时,检测迅速变化长度;和(b3)将所述迅速变化长度与各种类型的帧的长度之和进行比较,并选择各种类型的帧之一。
5.如权利要求4所述的方法,其中,所述各种类型的帧包括超长帧、长帧、短帧和超短帧。
6.如权利要求5所述的方法,其中,操作(b3)包括(b31)确定所述迅速变换长度是否等于或大于超长帧和超短帧的长度之和;(b32)当所述迅速变化长度等于或大于超长帧和超短帧的长度之和时,确定音频信号已被变换成的前一帧是否是超短帧;(b33)当前一帧不是超短帧时,选择超长帧;(b34)当前一帧是超短帧时,选择长帧;(b35)当所述迅速变化长度小于超长帧和超短帧的长度之和时,确定所述迅速变换长度是否等于或大于长帧和超短帧的长度之和;(b36)当所述迅速变化长度等于或大于长帧和超短帧的长度之和时,选择长帧;(b37)当所述迅速变化长度小于长帧和超短帧的长度之和时,确定所述迅速变化长度是否等于或大于短帧和超短帧的长度之和;(b38)当所述迅速变化长度等于或大于短帧和超短帧的长度之和时,选择短帧;(b39)当所述迅速变化长度小于短帧和超短帧的长度之和时,选择超短帧。
7.如权利要求3所述的方法,其中,操作(c)包括(c1)使用除0之外的窗口系数,根据确定的适应性变换单元对音频信号执行加窗操作;和(c2)将加窗的音频信号变换为频域中的音频信号。
8.一种对音频信号适应性编码的方法,包括(a)将音频信号过滤为预定采样单元;(b)当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换到频域中的适应性变换单元;(c)根据确定的适应性变换单元,将音频信号变换为频域中的音频信号;(d)对变换到频域中的音频信号进行量化;和(e)对量化的音频信号编码。
9.一种用于变换音频信号的设备,包括变换单元确定器,确定音频信号将根据其被变换为频域中的音频信号的变换单元;和频域变换器,使用除0之外的窗口系数,根据确定的变换单元,将时域中的音频信号变换为频域中的音频信号。
10.如权利要求9所述的设备,其中,所述频域变换器包括加窗单元,使用除0之外的窗口系数,根据确定的变换单元对音频信号执行加窗操作;和信号变换器,将加窗的音频信号变换为频域中的音频信号。
11.一种用于变换音频信号的设备,包括过滤单元,将音频信号过滤为预定采样单元;适应性变换单元确定器,当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换为频域中的音频信号的适应性变换单元;和频域变换器,根据确定的适应性变换单元,将音频信号变换为频域中的音频信号。
12.如权利要求11所述的设备,其中,所述适应性变换单元确定器包括迅速变化系数计算器,当所述适应性变化单元是帧时,计算与音频信号的变化程度相应的迅速变化系数;长度检测器,当所述迅速变化系数大于预定阈值时,检测迅速变化长度;和帧类型确定器,通过将所述迅速变化长度与各种类型的帧的长度之和进行比较来确定所述帧。
13.如权利要求12所述的设备,其中,所述帧类型确定器将超长帧、长帧、短帧和超短帧之一选择为音频信号将根据其被变换到频域中的帧。
14.如权利要求11所述的设备,其中,所述频域变换器包括加窗单元,使用除0之外的窗口系数,根据确定的适应性变换单元对音频信号执行加窗操作;和信号变换器,将加窗的音频信号变换为频域中的音频信号。
15.一种用于对音频信号适应性编码的设备,包括过滤单元,将音频信号过滤为预定采样单元;适应性变换单元确定器,当音频信号的尺寸大于预定阈值时,确定音频信号将根据其被变换到频域中的适应性变换单元;频域变换器,根据确定的适应性变换单元,将音频信号变换为频域中的音频信号;量化单元,对变换到频域中的音频信号进行量化;比特率控制器,控制将被量化的音频信号的比特率;和编码单元,对量化的音频信号编码。
16.一种逆变换音频信号的方法,包括对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
17.一种逆变换音频信号的方法,包括(a)从音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和(b)根据检测到的信息的适应性变换单元对所述音频数据进行逆变换。
18.如权利要求17所述的方法,其中,在操作(b)期间,根据所述适应性变换单元对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
19.一种对音频信号解码的方法,包括(a)对编码的音频数据解码;(b)对解码的音频数据逆量化;(c)从逆量化的音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和(d)根据检测到的信息的适应性变换单元对所述音频数据进行逆变换。
20.如权利要求19所述的方法,其中,在操作(d)期间,根据所述适应性变换单元对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
21.一种用于逆变换音频信号的设备,包括时域逆变换器,对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
22.一种用于逆变换音频信号的设备,包括变换单元信息检测器,从音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和时域逆变换器,根据检测到的信息的适应性变换单元对音频数据进行逆变换。
23.如权利要求22所述的设备,其中,所述时域逆变换器根据所述适应性变换单元对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
24.一种用于对音频信号适应性解码的设备,包括解码单元,对编码的音频数据解码;逆量化单元,对解码的音频数据逆量化;变换单元信息检测器,从逆量化的音频数据检测关于变换到频域中的音频信号的适应性变换单元的信息;和时域逆变换器,根据检测到的信息的适应性变化单元对所述音频数据进行逆变换。
25.如权利要求24所述的设备,其中,所述时域逆变换器根据所述适应性变换单元对音频数据进行逆变换,所述音频数据是使用除0之外的窗口系数而变换到频域中的音频信号的比特流。
全文摘要
本发明提供了一种用于变换音频信号的方法和设备、一种用于对音频信号适应性编码的方法和设备、一种用于逆变换音频信号的方法和设备、以及一种用于对音频信号适应性解码的方法和设备。所述变换音频信号的方法包括确定时域中的音频信号将根据其被变换为频域中的音频信号的变换单元;和使用除0之外的窗口系数,根据确定的变化单元将音频信号变换为频域中的音频信号。因此,在提高压缩效率的同时,即使以高速率对音频信号编码,也可最小化音频信号的失真。
文档编号G10L19/02GK1787383SQ20051012792
公开日2006年6月14日 申请日期2005年12月7日 优先权日2004年12月7日
发明者吴殷美, 金重会, 勃瑞斯·库奎舍夫, 康斯坦汀·欧西波夫 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1