用于编码和解码分音的幅度的方法和装置的制作方法

文档序号:2831782阅读:134来源:国知局
专利名称:用于编码和解码分音的幅度的方法和装置的制作方法
技术领域
与本发明一致的方法和装置涉及音频编码和解码,更具体而言,涉及在
参数编解码(parametric codec )中对分音(partials)的幅度进行编码和解码。
背景技术
参数编解码是参数编码和参数解码的组合,参数编码用于解析音频信号 和确定音频信号的参数(parametrizing ),参数解码用于将参数重构为音频信 号。图1是相关技术的参数编码方法的流程图。通过执行三种类型的分析, 即在操作101执行瞬态(transient)分析,在操作102执行正弦分析,以及在 操作103执行噪声分析,来提取每个域(domain)中音频分量的参数。
瞬态分析处理动态音频改变。正弦分析处理确定性的音频改变。噪声分 析处理随机的或非确定性的音频改变。所提取的参数在操作104被格式化成 t匕4寺^L ( formatted into a bitstream )。
在相关技术的参数编码中,正弦分析包括分析输入音频信号的正弦波以 生成分音,以及跟踪(tracking)所生成的分音。通过跟踪,分音被分成连续 分音(continuation partials)和起源分音(birth partials )。如图2所示,连续 分音与前一帧的分音相关,而起源分音是新产生的,与前一帧的分音无关。
相关技术的参数编码的连续分音多于起源分音。因此,减少用于表示连 续分音的比特数以及提高连续分音的声音质量对于减少总比特数和提高总体 音频质量具有很大影响。
参照图3,在相关技术的参数编码中,通过在操作301使用对数定标(log scale )方法获得前一帧的分音的幅度的量化值Q_P,在操作302使用对数定 标方法获得当前帧的分音的幅度的量化值Q_C,来执行连续分音的幅度编码。 接下来,在操作303获得量化值Q_P与量化值Q_C值之间的差,即 D=Q_C-Q—P,并且在操作304将所获得的差D格式化成比特流,由此减少编 码后连续分音的比特数。
然而,在连续分音的幅度编码过程中,如果连续分音的幅度逐渐增加或
5降低,这种逐渐的幅度变化(variation)不能被表示,而只有大的幅度变化能 够被表示,这导致图4所示的幅度变化的阶梯现象(step phenomenon )。
图4是示出了相对于预设幅度粒度(amp—granularity)编码前的连续分 音幅度与相对于量化值Q_C改变1的幅度变化之间的关系的示图。在图4中,
横轴表示编码前连续分音的幅度,纵轴表示量化值Qj:改变1时的幅度变化。

发明内容
技术问题
参照图4,对于amp—granularity为0的情况,在幅度变化中没有出现阶 梯现象。然而,随着amp—granularity增加,在幅度变化中出现的阶梯现象达 到较大的程度,造成再现的声音质量下降。
而且,在相关技术的连续分音的幅度编码中,使用对数定标方法获得的 前一帧的分音的幅度的量化值与也使用对数定标方法获得的当前帧的分音的 幅度量化值之间的差,即,图3中的差D,被格式化成比特流,而没有对频 域进行考虑,这导致无法有效减少连续分音的比特数。再有,大量比特被用 于表示人耳难以分辨的小幅度部分的幅度变化,这也造成无法有效减少编码 音频信号的比特数。
技术方案
本发明提供用于编码和解码分音的幅度的方法和装置,其中,在参数编 解码中,在对连续分音的幅度进行编码时,防止了幅度变化中阶梯现象的出 现,从而提高了再现的声音质量。
本发明还提供用于编码和解码分音的幅度的方法和装置,其中,能够减 少在参数编解码中用于表示连续分音的幅度的比特数。
有益效果
如上所述,根据本发明的示范性实施例,使用基于用于前一帧的分音的 逆量化幅度的函数确定的量化级别(quantization level),量化当前帧的分音的
并^高了再现的声音质量。 ^ —' 又,、''
此外,通过根据频率自适应地确定量化级别,能够减少用于表示连续分 音的编码的幅度的比特数。具体而言,减少了用于表示分音的幅度中人耳难 以察觉的小幅度部分的变化的比特数,从而减少了参数编解码中的总比特数。


通过参照附图具体描述本发明的示范性实施例,本发明的上述及其它方
面将变得更加清楚。附图中
图l是相关技术的参数编码方法的流程图2是用于解释相关技术的参数编码中的起源分音和连续分音的示图; 图3是相关技术的参数编码方法中编码连续分音的幅度的方法的流程
图4是示出相对于预设幅度粒度的编码前的连续分音的幅度与相对于当 前帧的分音的幅度的量化值改变1的幅度变化之间的关系的图形;
图;; ,、、 一 、又、'王
图6是示出相对于根据本发明示范性实施例的预设函数的分音的幅度与 相对于当前帧的分音的幅度的量化值改变1的幅度变化之间的关系的图形; 图7是用于比较图4所示图形与图6所示图形的图形; 图8是根据本发明的示范性实施例的编码分音的幅度的方法的流程图; 图9是根据本发明示范性实施例的用于解码分音的幅度的装置的框以及
图10是根据本发明示范性实施例的解码分音的幅度的方法的流程图。
具体实施例方式
根据本发明的一个方面,提供一种对分音的幅度进行编码的方法,该方 法包括获得前一帧的分音的逆量化幅度;基于用于前一帧的分音的逆量化 幅度的函数确定量化级别;以及根据所确定的量化级别量化当前帧的分音的 幅度。
根据本发明的一个方面,提供一种用于对分音的幅度进行编码的装置, 该装置包括存储单元,其存储前一帧的分音的逆量化幅度;量化级别确定 单元,其基于用于前一帧的分音的逆量化幅度的函数确定量化级别;以及量 化单元,其根据所确定的量化级别量化当前帧的分音的幅度。
根据本发明的一个方面,提供一种解码分音的幅度的方法,该方法包括 乂人比特流去格式化信号(bitstream-deformatted signal)中4企测当前帧的分音的量化值;获得前一帧的分音的逆量化幅度;基于用于前一帧的分音的逆量化 幅度的函数,确定量化级别;以及才艮据所确定的逆量化级别,逆量化纟企测到 的量化值。
根据本发明的一个方面,提供一种用于解码分音的幅度的装置,该装置 包括量化值检测单元,其从比特流去格式化信号中检测当前帧的分音的量 化值;存储单元,其存储前一帧的分音的逆量化幅度;量化级别检测单元, 其基于用于前一帧的分音的逆量化幅度的函数,检测量化级别;以及逆量化 单元,其根据所确定的量化级别,逆量化所检测的量化值。
以下将参照附图具体描述本发明的示范性实施例。应当注意到,在一个
或多个附图中示出的相同元素用相同的附图标记来表示。在随后对本发明的 描述中,为简洁和清楚起见,将省略对合并于此的公知功能和结构的详细描 述。
本发明的示范性实施例基于用于前一帧的分音的幅度的函数确定量化级 别,并基于所确定的量化级别量化当前帧的分音的幅度,以防止在参数编解 码中对于连续分音的幅度的编码结果中出现阶梯现象。此外,本发明的示范 性实施例调整所述函数,以便根据频率改变量化级别,从而减少用于表示连 续分音的幅度变化的比特数。本发明的示范性实施例还能够减少用于表示人 耳难以察觉的小幅度部分的幅度变化的比特数。
图5是根据本发明的用于编码分音的幅度的装置500的框图。参照图5, 装置500包括存储单元501、分音幅度解码单元502、量化级别确定单元503、 量化单元504和比特流^各式化单元507。
存储单元501存储当前帧的分音的幅度的逆量化幅度(或解码幅度),该 逆量化幅度是从分音幅度解码单元502提供的,并且,在相对下一帧的分音 的幅度进行量化的过程中,存储单元501提供所存储的逆量化幅度,作为前 一帧的分音的幅度的逆量化幅度prev_iq_amp (或解码幅度),其在下文中将 被称为前一帧的分音的逆量化幅度。
当从量化单元504接收到当前帧的分音的量化值D时,分音幅度解码单 元502逆量化所接收的量化值D,以便获得逆量化值。换言之,分音幅度解 码单元502通过将所接收的量化值D乘以从量化级别确定单元503提供的量 化级别,来获得逆量化值。然后,分音幅度解码单元502读取存储在存储单 元501中的前一帧的分音的逆量化幅度,并将所读: 又的逆量化幅度加上所述逆量化值的结果存储在存储单元501中,作为当前帧的分音的幅度的解码幅 度。
量化级别确定单元503基于用于前一帧的分音的逆量化幅度的预设函数 f(prev—i(Lamp)确定量化级别Q_Level,即,Q_Level = f(prev—iq_amp)。函数 f(prevjcLamp)可以被设置为与分音的频率无关的固定函数(fixed function )。 例如,如果前一帧的分音的幅度为x,为了确定量化级别,该函数可以被设 置为与频率无关的Q_Level=(x)(1/2)。
人耳能容易地识别低频域中分音的幅度的改变,但在高频域中则并非如 此。因此,可以通过为低频域和高频域设置不同的函数来确定量化级别。例 如,如果前一帧的分音的幅度为x,则为了确定量化级别,可以在低频域中 将函数设置为Q_Level=(x)(1/2),在高频域中将函数设置为Q_Levd=(x)(3/5)。
可替换地,可以为低频域、中频域和高频域而不同地设置函数。例如, 如图6所示,通过在低频域中将函数设置为Q_Level=(x)(1/2)、在中频域中将 函数设置为Q_Level=(x)(3/5)、在高频域中将函数设置为Q_Level=(x)(3/4),来确 定量化级别。图6是示出相对于用于根据分音的频率确定量化级别的函数的 编码前的分音的幅度与相对于当前帧的分音的幅度的量化值改变1的幅度变 化之间的关系的示图。从图6可以看出,在幅度变化中没有出现阶梯现象。 这是因为使用了适应于前一帧的分音的逆量化幅度而设置的量化级别来量化 当前帧的分音的幅度。量化级别确定单元503可以通过以如下方式设置函数 来确定量化级别高频域中的量化误差变得大于低频域中的量化误差。
量化单元504基于由量化级别确定单元503确定的量化级别来量化当前 帧的分音的幅度。为此,量化单元504包括差4企测单元505和量化处理单元 506。
差检测单元505检测当前帧的分音的幅度A—C与前一帧的分音的逆量化 幅度prev—iq_amp之间的差Dif&A—C-prev—iq_amp。为此,当接收到幅度A—C 时,差检测单元505读取存储在存储单元501中的逆量化幅度prev—iq_amp, 并斗企测幅度A—C与所读取的逆量化幅度prev—iq_amp之间的差。
量化处理单元506基于由量化级别确定单元503确定的量化级别,量化 由差检测单元505检测到的差,从而获得当前帧的分音的幅度的量化值D。 换言之,量化处理单元506可以基于将所述差除以所确定的量化级别的操作 Diff/Q_Level来量化幅度A—C。此时,由量化处理单元506获得的量化值D可以被定义为当前帧的分音的编码幅度。量化处理单元506可以将所获得的 量化值D应用于四舍五入(rounding)函数round(Diff/Q—Level)、向上取整 (ceiling)函数和向下取整(floor)函数中的一个。从量化处理单元506输出 的信号被发送到比特流格式化单元507,然后被发送到分音幅度解码单元 502。
比特流格式化单元507对从量化单元504发送的量化值执行比特流格式 化,并将结果值发送到用于解码当前帧的分音的幅度的装置或者用于解码音 频信号的装置。
图7是用于将图4所示图形和图6所示图形进行比较的图形。参照图7, 从基于图4的图形中可以看到,在传统分音幅度编码中,随着分音的幅度逐 渐增加,在相对于分音的幅度的量化值改变1的幅度变化中出现了阶梯现象, 而从基于图6的图形可以看出,在根据本发明的分音幅度编码中,随着分音 的幅度逐渐增加,在相对于分音幅度的量化值改变1的幅度变化中没有出现 阶梯现象。
参照图4,在基于图4的图形中,相关技术的分音幅度编码无法跟随 (follow)分音的幅度变化的逐渐增长。尽管相关技术的分音幅度编码能够表 达幅度粒度amp—granularity为0的分音的幅度变化的逐渐增长,但是需要大 量比特来表达这种逐渐增长。
另一方面,在图6的示图中,根据本发明的分音幅度编码能够表示分音 的幅度变化的逐渐增长。用于确定量化级别的函数可以被不同地设置。例如, 所述函数可以被设置为(pre—iq_amp)(1/2)、 (pre一icLamp)(3"和(prejcLamp)(3")。 通过使用心理声学(psychoacoustic )方法为不同频率"i殳置不同的量化级别, 能够减少比特量,并且能够防止声音质量下降。例如,用于确定量化级别的 函数f(prev—iqLamp)在低频域被设置为(prev—iq_amp)(1/2),在中频域被设置为 (prev_iq_amp)(3/5),在高频域被设置为(prevjCLamp)(3,
图8是根据本发明示范性实施例的编码分音的幅度的方法的流程图。
参照图8,在操作801,以与图5的分音幅度解码单元502获得当前帧的 分音的逆量化幅度相似的方式,获得前一帧的分音的逆量化幅度 prev—iq_amp。
在操作802,使用逆量化幅度prev_iq_amp确定用于量化当前帧的分音的 幅度的量化级別Q_Level。换言之,正如已经针对图5中的量化级别确定单元503所描述过的,预设函数被应用到在操作801中获得的逆量化幅度 prev—iq_amp,由此确定量化级别Q_Level。可以如参照图5所描述的那样设 置该函数。
在操作803,获得当前帧的分音的幅度A—C与在操作801中获得的前一 帧的分音的逆量化幅度prev—iq_amp之间的差Diff=A—C - prev—iq_amp。
在操作804,基于在操作802中确定的量化级别Q_Level,来量化差Diff。 换言之,通过将四舍五入函数round(DifFQJ^evel)应用于将差Diff除以量化 级别Q_Level的结果,来量化差Diff。然而,也可以通过将向上取整函数或 向下取整函数应用于所述除法的结果来量化差Diff。量化后的差即为当前帧 的分音幅度的量化值。因此,操作803和804可以被定义为基于量化级别量 化当前帧的分音的幅度的操作。在操作805,将在操作804中获得的量化值 才各式4b成比特流。
或者,4喿作801可以被改变,以便在操作801读取在操作801中存储的 前一帧的分音的逆量化幅度,并且操作805可以被改变,以便执行比特流格 式化,并获得和存储当前帧的分音的逆量化幅度,如针对图5的分音幅度解 码502所描述的那样。因此,当编码下一帧的分音的幅度时,可以读取所存 储的当前帧的分音的逆量化幅度,以作为前一帧的分音的逆量化幅度。 在图8中,处理操作802和操作803的顺序可以交换。 图9是根据本发明示例实施例的用于解码分音的幅度的装置900的框图。 参照图9,装置900包括比特流去格式化单元901、量化值检测单元902、存 储单元903、量化级别4全测单元904和逆量化单元905。
比特流去格式化单元901对接收到的比特流去格式化(de-formats )。 当从比特流去格式化单元901接收到比特流去格式化信号时,量化值检 测单元902从该比特流去格式化信号中检测当前帧的分音的幅度的量化值。 这样的检测可以通过例如从所接收的比特流去格式化信号中的预设字段检测 量化值来执行。
存储单元903存储从逆量化单元905输出的当前帧的分音的逆量化幅度, 并在对下一帧的分音的幅度的量化值进行逆量化时,提供所存储的逆量化幅 度,作为前一帧的分音的逆量化幅度。
量化级别检测单元904基于从存储单元903提供的、用于前一帧的分音 的逆量化幅度的函数,来;f全测量化级别。所述函数类似于针对图5所示的装置500描述的用于根据本发明编码分音的幅度的函数。
逆量化单元905 4艮据量化级别^f全测单元904 4企测的量化级别,逆量化由 量化值检测单元902所检测的量化值。为此,逆量化单元905包括逆量化块 卯6和逆量化幅度4企测单元907.
逆量化块906基于由量化级别^r测单元904所;险测的量化级别,逆量化 当前帧的分音的幅度的量化值,从而输出当前帧的分音的幅度的逆量化值。 逆量化幅度才企测单元907基于从逆量化块906输出的逆量化值和从存々者单元 903读取的前一帧的分音的逆量化幅度,检测当前帧的分音的逆量化幅度。 换言之,逆量化幅度检测单元907输出将前一帧得分音的逆量化幅度加到所 输出的逆量化值上得到的结果,作为当前帧的分音的逆量化幅度。所输出的 当前帧的分音的逆量化幅度被发送到存储单元903,并且还被发送到信号处 理单元(未示出)以用于音频再现。
图10是#4居本发明示例实施例的解码分音的幅度的方法的流程图。
参照图10,在操作1001,去格式化所接收到的比特流。在操作1002, 从比特流去格式化信号中检测当前帧的分音的幅度的量化值D。所述检测类 似于参照图9所描述的检测。
在操作1003,获得前一帧的分音的逆量化幅度prev_iq_amp。通过将前 一帧之前的一帧的逆量化幅度加到前一帧的分音的幅度的逆量化值上,来获 得逆量化幅度prev—iq_amp。
在操作1004,基于用于逆量化幅度prev—iq_amp的函数,确定量化级别 Q_Level。换言之,通过将预设函数应用到逆量化幅度prev—iq_amp来确定量 化级别Q_Levd。
在操作1005,基于量化值D和在操作1004确定的量化级别Q_Level来 获得当前帧的分音的幅度的逆量化值Diff。换言之,通过将量化值D乘以量 化级别Q_Level来获得逆量化值Diff。
在操作1006,基于逆量化值Diff和逆量化幅度prevJLamp,获得当前 帧的分音的逆量化幅度IQ—C或cur_iq_amp。换言之,获得将逆量化幅度 prev_iq_amp加到逆量化值Diff上的结果,以作为逆量化幅度IQ—C。
以再现音频信号的方式处理所获得的逆量化幅度IQ_C,并且所获得的逆 量化幅度IQ一C能够被存储,以便在逆量化下一帧的分音的量化值时,可用 作前一帧的分音的逆量化幅度。如果图10的方法包括存储在操作1006中获得的逆量化幅度IQ_C的操作,则操作1003可以被定义为读取所存储的前一帧的分音的逆量化幅度的操作。
因此,图10的操作1005和1006可以被定义为根据量化级别逆量化所检测的量化值的操作。
根据本发明的编码和解码分音的幅度的方法可以被具体实现为计算机可读记录介质上可由计算机读取的代码。计算机可读记录介质包括存储可由计算机系统读取的数据的所有种类的记录器件。计算机可读记录介质的例子包括只读存储器(ROM),随机存取存储器(RAM)、 CD-ROM、磁带、软盘和光数据存储器件。计算机可读记录介质还可以分布在通过网络连接的计算机系统上,以便以分布式方式存储和执行计算机可读代码。并且,本领域普通程序员能够容易的解释用于实现本发明的功能程序、代码和代码段。
尽管参照本发明的示例实施例具体示出和描述了本发明,但是本领域普通技术人员将会理解,在不脱离由权利要求所限定的本发明的精神和范围的情况下,可以进行形式和细节上的各种改变。
权利要求
1、一种对分音的幅度进行编码的方法,该方法包括获得前一帧的分音的逆量化幅度;基于用于前一帧的分音的逆量化幅度的函数,确定量化级别;以及基于所确定的量化级别,量化当前帧的分音的幅度。
2、 如权利要求1所述的方法,其中,所述量化当前帧的分音的幅度包括: 获得当前帧的分音的幅度与前一 帧的分音的逆量化幅度之间的差;以及 基于所确定的量化级别,量化所述差,其中,通过量化所述差获得的量化值是当前帧的分音的幅度的量化值。
3、 如权利要求l所述的方法,其中,所述获得逆量化幅度包括 量化前一帧的分音;逆量化所获得的量化值;以及将所述前一帧之前一帧的分音的逆量化幅度加到通过逆量化获得的逆量 化值上,由此获得前一帧的分音的逆量化幅度。
4、 如权利要求3所述的方法,其中,所述函数净皮设置成使得所述量化级 别随频率而改变。
5、 如权利要求2所述的方法,其中,基于将所述差除以所述量化级别的 操作,执行对所述差的量化。
6、 一种用于对分音的幅度进行编码的装置,该装置包括 存储单元,其存储前一帧的分音的逆量化幅度;量化级别确定单元,其基于用于前一帧的分音的逆量化幅度的函数,确 定量化级别;以及量化单元,其基于由所述量化级别确定单元确定的量化级别,量化当前 帧的分音的幅度。
7、 如权利要求6所述的装置,其中,所述量化单元包括 差4企测单元,其检测当前帧的分音的幅度与前一帧的分音的逆量化幅度之间的差;以及量化块,其基于所确定的量化级别,量化所述差,其中,由所述量化块获得的量化值是当前帧的分音的幅度的量化值。
8、 如权利要求7所述的装置,还包括分音幅度解码单元,其基于所述量化级别,解码>(人所述量化单元输出的当前帧的分音的量化值。
9、 如权利要求8所述的装置,其中,所述分音幅度解码单元逆量化所述 量化值,并在所述存储单元中存储将从所述存储单元读取的前一帧的分音的 逆量化幅度加到通过所述逆量化获得的逆量化值上而得到的结果。
10、 如权利要求8所述的装置,其中,所述函数被*没置成佳_得所述量化 级别随频率而改变。
11、 如权利要求8所述的装置,其中,所述量化单元基于将当前帧的分 音的幅度与前一帧的分音的逆量化幅度之间的差除以量化级别的操作,量化 所述差。
12、 一种解码分音的幅度的方法,该方法包括 从比特流去格式化信号中检测当前帧的分音的量化值; 获得前一帧的分音的逆量化幅度;基于用于前一帧的分音的逆量化幅度的函数,确定量化级别;以及 基于所确定的量化级别,逆量化所检测到的量化值。
13、 如权利要求12所述的方法,其中,所述逆量化所4企测到的量化值包括基于所述量化值和量化级别,获得当前帧的分音的逆量化值;以及 基于所述逆量化值和前一帧的分音的逆量化幅度,获得当前帧的分音的逆量^:幅度。
14、 如权利要求13所述的方法,其中,所述获得前一帧的分音的逆量化 幅度包括逆量化前一帧的分音的量化值;以及将前一帧之前一帧的分音的逆量化幅度加到通过逆量化获得的逆量化值 上,由此获得前一帧的分音的逆量化幅度。
15、 如权利要求12所述的方法,其中,获得前一帧的分音的逆量化幅度包括逆量化前一帧的分音的量化值;以及将前一帧之前一帧的分音的逆量化幅度加到通过逆量化获得的逆量化值 上,由此获得前一帧的分音的逆量化幅度。
16、 一种用于解码分音的幅度的装置,该装置包括 量化值检测单元,其从比特流去格式化信号中检测当前帧的分音的量化值;存储单元,其存储前一帧的分音的逆量化幅度;量化级別检测单元,其基于用于前一帧的分音的逆量化幅度的函数,检 测量化级别;以及逆量化单元,其基于由所述量化级别检测单元所检测的量化级别,逆量 化由所述量化值4全测单元所检测的量化值。
17、如权利要求16所述的装置,其中,所述逆量化单元包括逆量化块,其基于所述量化级别逆量化由所述量化值检测单元所检测的 量化值;以及逆量化幅度检测单元,其基于所述逆量化值和前一帧的分音的逆量化幅 度,检测当前帧的分音的逆量化幅度,其中,由所述逆量化幅度检测单元检测的当前帧的分音的逆量化幅度被 存储在所述存储单元中。
全文摘要
提供了用于编码和解码分音的幅度的方法和装置,其中,能够防止在参数编解码中对连续分音的幅度的编码结果中出现阶梯现象,从而提高再现的声音质量。编码分音的幅度的方法包括获得前一帧的分音的逆量化幅度;基于用于前一帧的分音的逆量化幅度的函数确定量化级别;以及基于所确定的量化级别量化当前帧的分音的幅度。
文档编号G10L19/02GK101689369SQ200880020051
公开日2010年3月31日 申请日期2008年2月29日 优先权日2007年4月12日
发明者吴宰源, 李健炯, 李男淑, 李雨, 郑钟勋 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1