音频编码与解码装置及其方法

文档序号:2830598阅读:203来源:国知局
专利名称:音频编码与解码装置及其方法
技术领域
与本发明一致的装置和方法涉及音频编码与解码装置,并且,更加具体 来说,涉及能够在低比特率时恢复高质量音频信号的音频编码与解码。
背景技术
在相关技术的音频编码装置中,已经使用了时间-频率变换编码方案。
所述时间-频率变换编码方案通过使用改进的离散余弦变换(Modified Discrete Cosine Transform, MDCT)将音频信号变换到频率空间中以便得到系 数并且将所得到的系数编码。但是,所述时间-频率变换编码方案有这样的 问题音频质量在低目标比特率时变差。
作为对低比特率的音频信号编码的方法的例子,存在一种参数编码方 法。在所述参数编码方法中,从输入音频信号中检测正弦波,并且对所述正 弦波的频率、相位和振幅进行编码。具体来说,在所述参数编码方法中对低 比特率的输入音频信号进行编码是可能的,这是因为,即使该方法通过从输 入音频信号中^r测具有大振幅的少量余弦波进行编码,它也能够具有对许多 MDCT系数编码的效果。
但是,在参数编码方法中,为了恢复高质量的音频信号,需要从输入音 频信号检测大量正弦波。根据参数方法,在输入音频信号的频率和振幅由固 定正弦波构成的情况下,可以通过编码一个振幅、 一个频率和一个相位来充 分地恢复该音频信号
发明内容
技术问题
另一方面,在通过多个正弦波来构造输入音频信号的频率和振幅的情况 下,为了恢复高质量音频信号,需要从输入音频信号中检测大量正弦波,并 且对所检测到的正弦波的振幅、频率和相位进行编码,因此编码效率降低。
参数编码方法适合于频率不随时间变化的正弦波。但是,因为正弦波的频率和相位会由于噪声等而随时间变化,所以待检测的正弦波的数量增加。 因此,参数编码方法可能效率非常低。
也就是说,随着所检测到的正弦波的数量增长,待编码的振幅、频率和 相位的数量增加,使得参数编码方法会效率低下。因此,参数编码方法适合
于具有低目标比特率的音频编码与解码装置(也即,音频编解码器(codec)),
但是它不适合于具有高质量或高目标比特率的音频编码与解码装置。 技术方案
本发明提供一种能够在低比特率时恢复高质量音频信号的音频编码与 解码装置。
有益效果
根据本发明的示范性实施例,提供一种通过以下方式编码附加基矢量的
音频编码技术;险测振幅大于一艮据目标比特率确定的振幅的正弦波,对该正 弦波进行编码,基于所推导出的正弦波的附加基矢量和残留音频信号来计算 附加基矢量的分量,并且基于使用所计算的附加基矢量和与音频编码技术相 对应的音频解码技术得到的正弦波的编码效率来确定附加基矢量的分量的 传输,从而可以实现能够以低比特率恢复高质量音频信号的音频编码与解码 方法和装置(或者音频编解码器(codec))。


通过参照附图对本发明的示范性实施例进行详细描述,本发明的上述及
其它方面将变得更加清楚,附图中
图1是示出才艮据本发明示范性实施例的音频编码装置的功能框图2是示出图1中所示的附加基矢量分量传输确定单元的示例的详细功
能冲匡图3是示出图1中所示的附加基矢量分量传输确定单元的另一示例的详 细功能框图4是示出根据本发明的示范性实施例的音频解码装置的功能框图; 图5是示出根据本发明的示范性实施例的音频编码方法的操作的流程
图6是示出与图5的音频编码方法对应的音频解码方法的操作的流程
图;图7是示出根据本发明的示范性实施例的音频编码方法的操作的流程
图8是示出图7中所示的确定附加基矢量的分量的传输的操作的详细操 作的流程图9是示出与图7中所示的音频编码方法对应的音频解码方法的流程图。
具体实施例方式
根据本发明的一个方面,提供一种音频编码方法,包括从输入音频信 号中检测至少一个正弦波;通过使用残留音频信号和正弦波的附加基矢量来 计算附加基矢量的分量;确定所述附加基矢量的分量的传输;以及当确定了 附加基矢量的分量的传输时,对正弦波的频率和/或相位和振幅进行编码,其 中,所述残留音频信号是通过从输入音频信号中排除所检测到的正弦波而得 到的。
根据本发明的另一个方面,提供一种音频解码方法,包括解析编码后 的音频信号;通过对在所述解析中得到的编码后的频率和/或编码后的相位和 编码后的振幅进行解码,来恢复正弦波;通过对解析中得到的附加基矢量的 分量进行解码,来恢复残留音频信号;以及通过将所恢复的正弦波和所恢复 的残留音频信号混合,来生成所恢复的音频信号,其中,所述残留音频信号 是在音频信号编码过程中通过从输入音频信号中排除所检测到的正弦波而 得到的。
根据本发明的另一个方面,提供一种音频编码方法,包括以特定长度 为单位分割输入音频信号;;^分割后的音频信号中检测至少一个正弦波;量 化所;险测到的正弦波的频率和/或相位和振幅;将量化后的频率和/或量化后 的相位和量化后的振幅进行去量化;基于去量化后的频率和/或去量化后的相 位、去量化后的振幅、残留音频信号和预定参考值,来确定所检测到的正弦 波的附加基矢量的分量的传输;以及对量化后的频率和/或量化后的相位、量 化后的振幅以及在确定附加基矢量的分量的传输中所生成的信号进行编码, 其中,所述残留音频信号是通过从分割后的音频信号中排除所检测到的正弦 波而得到的。
根据本发明的另一个方面,提供一种音频解码方法,包括解析编码后解析中得到的量化后的频率和/或量化后的相位和量化 后的振幅进行去量化;对在所述解析中得到的控制参数进行解码;对在所述 解析中得到的附加基矢量的分量进行解码;基于去量化后的频率和/或去量化 后的相位和去量化后的振幅,来恢复正弦波;基于去量化后的频率和/或去量 化后的相位、去量化后的振幅和解码后的控制参数,来推导附加基矢量;基 于所推导出的附加基矢量和解码后的附加基矢量的分量,来恢复残留音频信 号;以及通过将所恢复的正弦波和所恢复的残留音频信号混合,来恢复音频 信号,其中,所述残留音频信号是在音频编码过程中通过将所检测到的正弦
波从分割后的音频信号中去除而得到的。
根据本发明的另一个方面,提供一种音频编码装置,包括分割单元, 其以特定长度为单位分割输入音频信号;正弦波;险测单元,其从分割后的音 频信号中检测至少一个正弦波;量化单元,其对由正弦波检测单元检测到的 正弦波的频率和/或相位和幅度进行量化;去量化单元,其对从所述量化单元 输出的量化后的频率和/或量化后的相位和量化后的振幅进行去量化;附加基 矢量分量传输确定单元,其基于从所述去量化单元输出的去量化后的频率和 /或去量化后的相位和去量化后的振幅、残留音频信号和预定参考值,来确定 所检测到的正弦波的附加基矢量的分量的传输;和编码单元,其对从所述量 化单元输出的量化后的频率和/或量化后的相位和量化后的振幅以及从所述 附加基矢量分量传输确定单元输出的信号进行编码,其中,所述残留音频信 号是通过从分割后的音频信号中排除所述正弦波检测单元检测到的正弦波 而得到的。
根据本发明的另一个方面,提供一种音频解码装置,包括解析单元,
其解析编码后的音频信号;去量化单元,其对从解析单元输出的量化后的频
率和/或量化后的相位和量化后的振幅进行去量化;正弦波恢复单元,其基于
从去量化单元输出的去量化后的频率和/或去量化后的相位和去量化后的振
幅,来恢复正弦波;控制参数解码单元,其对从解析单元输出的控制参数进
行解码;附加基矢量推导单元,其基于从去量化单元输出的去量化后的频率
和/或去量化后的相位、去量化后的振幅以及解码后的控制参数,来推导附加
基矢量;附加基矢量分量解码单元,其对从解析单元输出的附加基矢量的分
量进行解码;残留音频信号恢复单元,其基于附加基矢量推导单元所推导出
的附加基矢量和解码后的附加基矢量的分量,来恢复残留音频信号;和混合
ii单元,其通过将正弦波恢复波恢复单元所恢复的正弦波和残留音频信号恢复 单元所恢复的残留音频信号混合,以便输出恢复后的音频信号,其中,所述 残留音频信号是在音频编码过程中通过将所检测到的正弦波从分割后的音 频信号中去除而得到的。
在下文中,将参照附图详细描述本发明的示范性实施例。
图l是示出根据本发明示范性实施例的音频编码装置100的功能框图。
参照图1,音频编码装置100包括分割单元110、正弦波4佥测单元120、量化 单元130、去量化单元140、附加基矢量分量传输确定单元150和编码单元 160。
分割单元110根据时间以特定长度L为单位分割输入音频信号。从分割 单元110输出的分割后的音频信号用S(n)表示,其中n是由『1-L定义的时 间索引。当以特定长度L为单位分割输入音频信号时,分割后的音频信号可 以与先前分割的音频信号重叠L/2或者特定长度。
正弦波检测单元120通过使用匹配跟踪方案从分割后的音频信号中检测 至少一个正弦波。首先,正弦波检测单元120检测分割后的音频信号中振幅 最大的正弦波。接下来,正弦波检测单元120检测分割后的音频信号中除上 面所检测到的正弦波之外的振幅次大的正弦波。直到所检测到的正弦波的振 幅变为预定振幅,该预定振幅是先前基于目标比特率确定的,正弦波检测单 元120重复4全测分割后的音频信号中的正弦波的操作。
因此,即使是在描述(represent)高质量音频信号的情况下,正弦波检测 单元120也不检测分割后的音频信号中振幅小于预定振幅的正弦波。正弦波 检测单元120检测到的正弦波可以用公式1表示。
<formula>formula see original document page 12</formula>
a,.表示所检测到的正弦波的每个振幅并且构成所4企测到的正弦波的基矢 量的每个分量。v,.表示所检测到的正弦波的每个基矢量并且可以由频率^和 相位炉,来表示,如公式2所示。
<formula>formula see original document page 12</formula>
'A,是用于归一化v,(")的归一化常数,以使得^v,(")等于1。 T是所检测 到的正弦波的每一个的索引。如果正弦波片全测单元120所4全测到的正弦波的数量为K,那么索引i的范围从l到K。
量化单元130对正弦波;险测单元120所纟全测到的正弦波的频率l和/或 相<立仍和4展幅a,.进4亍量化。
去量化单元140对从量化单元130输出的量化后的频率$和/或量化后的 相位《和量化后的振幅a;进行去量化。
附加基矢量分量传输确定单元150确定所检测到的正弦波的附加基矢量 的分量的传输。更加具体来说,附加基矢量分量传输确定单元150基于从量 化单元130输出的去量化后的频率和/或去量化的相位和去量化后的振幅、正
弦波检测单元120提供的残留音频信号KW以及预定参考值,确定所检测到 的正弦波的附加基矢量的分量的传输。
残留音频信号r(w)是通过从分割后的音频信号中排除正弦波4企测单元 120检测到的正弦波而得到的音频信号。因此,用公式3定义残留音频信号
/=/
在公式3中,5表示在分割后的音频信号中检测到k个正弦波。
预定参考值包括待推导的基矢量的数量F、根据待推导的基矢量的数量 F确定的频率变化k0以及用于确定附加基矢量的分量的使用是否有效率的 参考值。如果确定了附加基矢量的分量的传输,那么附加基矢量分量传输确 定单元150的输出信号包括控制参数和附加基矢量的分量。控制参数可以包 括表示附加基矢量的分量的传输的参数。此外,控制参数可以包括表示附加 基矢量的分量的传输的参数以及表示用于附加基矢量的推导方案的参数。
可以如图2中所示构造附加基矢量分量传输确定单元150。参照图2, 附加基矢量分量传输确定单元150包括附加基矢量推导器210、附加基矢量 分量计算器220、编码效率计算器230和附加基矢量分量传输确定器240。
附加基矢量推导器210推导由正弦波检测单元120检测到的正弦波的附 加基矢量。更加具体来说,附加基矢量推导器210通过使用待推导的基矢量 的数量F、根据待推导的基矢量的数量F确定的频率变化k0以及去量化后 的频率S和/或去量化后的相位《,推导所检测到的正弦波的附加基矢量。可 以从一个正弦波中推导多个基矢量。在待推导的基矢量的数量F被设为2的情况下,附加基矢量推导器210可以如公式4中所示推导附加基矢量w。,。 mA 中a的是推导出的附加基矢量的指数。 [公式4〗
<formula>formula see original document page 14</formula>
在这种情况下,由于待推导的基矢量的数量F被设为2,所以根据待推 导的基矢量的数量F确定的频率变化kO变为土1/2。由音频编码装置100和 音频解码装置400(见图4)分别确定相位河和伊f ,由此满足7>式5。<formula>formula see original document page 14</formula>
w,(")表示正交于(perpendicular to)正弦波的附加基矢量。从公式4和5 中可以理解,所推导出的基矢量和所;险测到的正弦波具有不同的频率并且互 相正交。
在待推导的基矢量的数量F被设为4的情况下,附加基矢量推导器210 可以如公式6中所示推导附加基矢量。 [公式6]
<formula>formula see original document page 14</formula>
如果在公式6中频率变化k0是1,那么频率比所;险测到的正弦波的频率 高1和低1的正弦波和余弦波成为所推导出的附加基矢量。
在公式7中,附加基矢量分量计算器220通过^f吏用残留音频信号K")和 由附加基矢量推导器210推导出的附加基矢量w。,来计算附加基矢量的分量
<formula>formula see original document page 14</formula>[公式7]
在公式7中,fe意味着"",是以特定长度L为单位分割的分割后的音频
信号的附加基矢量W。,的分量。也就是说,计算每个所推导出的附加基矢量
的附加基矢量的分量"a,。例如,在如公式4中所示所推导出的附加基矢量的数量为2的情况下,计算附加基矢量的两个分量a",,也即Z和a2,。类似 地,在如公式6中所示所推导出的附加基矢量的数量为4的情况下,得到附 加基矢量的四个分量a。,,也即a、、 、 ^,和a、。
附加基矢量分量计算器220将附加基矢量的分量发送到编码效率计算器 230。当附加基矢量分量传输确定器240确定附加基矢量的分量的传输时, 附加基矢量的分量被发送到编码单元160。
编码效率计算器230通过使用附加基矢量的分量a。,、去量化后的振幅《 以及所推导出的基矢量的预定数量F来计算每个正弦波的编码效率,如公式 8中所示。
附加基矢量分量传输确定器240将由编码效率计算器230计算出的编码 效率与预定的参考值进行比较。所述预定的参考值用于确定附加基矢量的分 量的使用是否有效率。
作为比较的结果,如果编码效率大于预定的参考值,那么附加基矢量分 量传输确定器240确定附加基矢量的分量的传输是有效率的。从而,附加基 矢量分量传输确定器240将控制参数发送到编码单元160,该控制参数用于 控制附加基矢量的分量的输出并且包括表示附加基矢量的分量的传输的参 数。
如果附加基矢量分量传输确定器240确定没有附加基矢量的分量的传输 是有效率的,那么附加基矢量分量传输确定器240不向编码单元160发送附 加基矢量分量计算器220计算的附加基矢量的分量。在这种情况下,从附加 基矢量分量传输确定器240输出的控制参数包括表示不传输附加基矢量的分 量的参数。
可以如图3所示构造附加基矢量分量传输确定单元150。参照图3,附 加基矢量分量传输确定单元150包括第一至第J附加基矢量推导器310—1至 310—J、第一至第J附加基矢量分量计算器320_1至320—J、第一至第J编码 效率计算器330—1至330—J以及附加基矢量分量传输确定器340。
第一至第J附加基矢量推导器310—1至310—J的结构和操作类似于图2 中所示的附加基矢量推导器210的结构和操作。但是,在第一至第J附加基矢量推导器310—1至310—J之间,基矢量的数量F和(根据基矢量的数量F 确定的)频率变化kO被设为不相同。例如,在第一附加基矢量推导器310—1 中,附加基矢量的数量F被设为2,频率变化kO被设为± 1/2,从而可以推 导出公式4中所示的附加基矢量。另一方面,在第J附加基矢量推导器310—J 中,附加基矢量的数量F被设为4,频率变化kO被设为士l,从而可以推导 出公式6中所示的附加基矢量。第一和第J附加基矢量推导器310一l和310j 之间的每一个附加基矢量推导器(未示出)的数量F和频率变化都^皮设为不同 于第一和第j附加基矢量推导器310—1和310—J的数量F和频率变化。
类似于图2中所示的附加基矢量分量计算器220,第一至第J附加基矢 量计算器320—1至320一J中的每一个通过在公式7中使用残留音频信号 和由附加基矢量推导器310—1至310—J中相应的附加基矢量推导器所推导出 的附加基矢量mA,来计算附加基矢量的分量"。,。例如,第一附加基矢量分 量计算器320—1对应于第一附加基矢量推导器310—1。
第一至第J编码效率计算器330—1至330_J中的每一个都通过使用由第 一至第J附加基矢量分量计算器320—1至320—J中相应的一个所计算的附加 基矢量的分量"",、去量化的振幅《、以及所推导出的基矢量的预定数量F, 来计算每个正弦波的编码效率,如公式8中所示。第一编码效率计算器330_1 对应于第一附加基矢量分量计算器320_1。
附加基矢量分量传输确定器340将由第一至第J编码效率计算器330—1 至330—J所计算的编码效率进行比较,以检测出最高的编码效率。接下来, 附加基矢量分量传输确定器340将最高编码效率与预定参考值进行比较。该 预定参考值用于确定附加基矢量的分量的使用是否是有效率的。
作为比较的结果,如果最高编码效率大于预定参考值,那么附加基矢量 分量传输确定器340就确定附加基矢量的分量的传输是有效率的。从而,附 加基矢量分量传输确定器340将控制参数发送到编码单元160,该控制参数 用于控制由对应于下述编码效率计算器的附加基矢量分量计算器计算的附 加基矢量的分量的输出该编码效率计算器检测到第一至第J附加基矢量分 量计算器320—1至320_J中的最高编码效率。
从附加基矢量分量传输确定器340输出的控制参数包括表示附加基矢量 的分量的传输的参数和表示用于附加基矢量的推导方案的参数。表示用于附 加基矢量的推导方案的参数包括与下述编码效率计算器对应的附加基矢量分量计算器的识别信息该编码效率计算器具有第一至第J附加基矢量分量
计算器320一1至320一J中最高的编码效率。例如,如果由与第一附加基矢量 推导器310—1对应的第一编码效率计算器330—1计算的编码效率是最高的, 那么表示用于附加基矢量的推导方案的参数就包括第一附加基矢量推导器 310—1的识别信息。
如果附加基矢量分量传输确定器340确定没有附加基矢量的分量的传输 是有效率的,那么附加基矢量分量传输确定器340不向编码单元160发送由 第一至第J附加基矢量分量计算器320—1至320—J计算的附加基矢量的分量。 在这种情况下,从附加基矢量分量传输确定器340输出的控制参#1包括表示 不传输附加基矢量的分量的参数。
图1中所示的编码单元160将从量化单元130输出的量化后的频率和/ 或量化后的相位、量化后的振幅以及从附加基矢量分量传输确定单元150输 出的信号进行编码,并且将编码后的音频信号输出。当发送附加基矢量的分 量时,从附加基矢量分量传输确定单元150输出的信号包括附加基矢量的分 量以及如上所述的控制参数。在如图2中所示构造附加基矢量分量传输确定 单元150时,控制参数包括表示附加基矢量的分量的传输的参数。另一方面, 在如图3中所示构造附加基矢量分量传输确定单元150时,控制参数包括表 示附加基矢量的分量的传输的参数和表示用于附加基矢量的推导方案的参 数。
当不传输附加基矢量的分量时,从附加基矢量分量传输确定单元150输 出的信号包括除了附加基矢量的分量之外的控制参数。在这种情况下,控制 参数包括表示不传输附加基矢量的分量的参数。
图4是示出根据本发明的示范性实施例的音频解码装置400的功能框 图。参照图4,音频解码装置400包括解析单元400、去量化单元420、正弦 波恢复单元430、控制参数解码单元440、附加基矢量推导单元450、附加基 矢量分量解码单元460、残留音频信号恢复单元470和混合单元480。
当输入编码后的音频信号时,解析单元410解析该解码后的音频信号并 且将量化后的频率和/或量化后的相位和量化后的振幅发送到去量化单元 420。而且,解析单元410将控制参数发送到控制参数解码单元440。此外, 解析单元410将附加基矢量的分量发送到附加基矢量分量解码单元460。
去量化单元420将量化后的频率和/或量化后的相位和量化后的振幅去
17量化。控制参数解码单元440解码控制参数。正弦波恢复单元430基于去量 化后的频率和/或去量化后的相位和去量化后的振幅恢复正弦波。如果在编码 音频信号的时候;险测到K个正弦波,那么就基于K个去量化后的频率和/或 K个去量化后的相位和K个去量化后的振幅来恢复正弦波。
附加基矢量推导单元450基于去量化单元420提供的去量化后的频率和 /或去量化后的相位和去量化后的振幅以及控制参数解码单元440提供的控 制参数,来推导附加基矢量。在如图2中所示构造音频编码装置100的附加 基矢量分量传输确定单元150的情况下,可以用图2的附加基矢量推导器210 来构造附加基矢量推导单元450,以便推导出附加基矢量。
另一方面,在如图3中所示构造音频编码装置100的附加基矢量分量传 输确定单元150的情况下,可以用图3的第一至第J附加基矢量推导器310—1 至310J来构造附加基矢量推导单元450,以便根据解码后的控制参数选择 第一至第J附加基矢量推导器310_1至310—J中的一个,并且推导附加基矢 量。可以用公式4或6来推导附加基矢量。对于附加基矢量推导单元450来 说,可以事先设置附加基矢量的数量F和根据附加基矢量的数量F确定的频 率变化k0。可替换地,在音频编码装置100发送包括附加基矢量的数量F 和频率变化k0的控制参数的情况下,附加基矢量推导单元450可以被构造 为使用控制参数解码单元440提供的附加基矢量的数量F和频率变化k0。 附加基矢量推导单元450推导出的附加基矢量被发送到残留音频信号恢复单 元470。
附加基矢量分量解码单元460对解析单元410所提供的附加基矢量的分 量进行解码。
残留音频信号恢复单元470基于附加基矢量分量解码单元460发送来的 附加基矢量的分量以及由附加基矢量推导单元450推导的附加基矢量,来恢 复残留音频信号r(w)。
混合单元480将正弦波恢复单元430恢复的正弦波和残留音频信号恢复 单元470恢复的残留音频信号混合,并且输出所恢复的音频信号。
图5是示出根据本发明的示范性实施例的音频编码方法的操作的流程图。
在音频编码方法中,AU命入音频信号中4全测出至少一个正弦波(501)。在 操作501中,检测出振幅大于根据目标比特率确定的振幅的正弦波。可以通过类似于图1的正弦波检测单元120的方式来执行检测正弦波的详细操作。 接下来,通过使用残留音频信号和正弦波的附加基矢量来计算正弦基矢
量的分量(502)。也就是说,推导出在操作501中检测到的正弦波的附加基矢 量。可以通过类似于图2的附加基矢量推导器210的方式来推导附加基矢量。 当推导正弦波的附加基矢量时,通过使用残留音频信号来计算所推导出的附 加基矢量的分量。残留音频信号是通过从输入音频信号中排除正弦波而得到 的音频信号。可以通过类似于图2的附加基矢量计算器220的方式来计算附 加基矢量的分量。
接下来,确定是否发送附加基矢量的分量(503)。也就是说,基于在操作 502计算的附加基矢量的分量计算正弦波的编码效率。可以通过类似于图2 的编码效率计算器230的方式来计算编码效率。如果所计算的编码效率高于 预定参考值,那么就确定将发送附加基矢量的分量。参考值类似于图2的附 加基矢量分量传输确定器240的参考值。
当确定将发送附加基矢量的分量时,对所检测到的正弦波的频率和/或相 位和振幅以及在操作502中计算的附加基矢量的分量进行编码,以生成编码 后的音频信号(504)。
在图6中示出与图5的音频编码方法对应的音频解码方法。图6是示出 根据本发明的示范性实施例的音频解码方法的操作的流程图。
参照图6,在音频解码方法中,当输入编码后的音频信号时,对该编码 后的音频信号进行解析(601)。当通过解析得到编码后的频率和/或编码后的 相位和编码后的振幅时,对编码后的频率和/或编码后的相位和编;马后的振幅 进行解码,以恢复正弦波(602)。此外,当通过解析得到附加基矢量的分量时, 对该附加基矢量的分量进行解码,以恢复残留音频信号(603)。残留音频信号 是通过从输入音频信号中排除在输入音频信号的编码过程中检测到的正弦 波而得到的音频信号。
接下来,恢复后的正弦波和恢复后的残留音频信号被混合,以生成恢复 后的音频信号(604)。
图7是示出根据本发明的示范性实施例的音频编码方法的操作的流程 图。将参照图1和图7描述操作的流程图。
首先,通过与图1的分割单元110的方式类似的方式,以特定长度为单 位分割输入音频信号(701)。接下来,通过与图1的正弦波检测单元120的方式类似的方式,从分割后的音频信号^r测至少 一个正弦波(702)。
接下来,通过与图1的量化单元130的方式类似的方式,对所检测到的 正弦波的频率和/或相位和振幅进行量化(703)。接下来,通过与图1的去量 化单元140的方式类似的方式,将量化后的频率和/或量化后的相位和量化后 的振幅去量化(704)。
接下来,通过与图1的附加基矢量分量传输确定单元150的方式类似的 方式,基于去量化后的频率和/或去量化后的相位和去量化后的振幅,确定是 否发送所检测到的正弦波的附加基矢量的分量(705)。
可以如图8中所示执行操作705。图8是示出确定附加基矢量的分量的 传输的搡作705的详细搡作。参照图8,通过与图2的附加基矢量推导器210 的方式类似的方式,在确定附加基矢量的分量的传输的操作705中,推导出 所;险测到的正弦波的多个附加基矢量(801)。
接下来,通过与图2的附加基矢量分量计算器220的方式类似的方式, 计算所推导出的附加基矢量的分量(802)。接下来,通过与图2的编码效率计 算器230的方式类似的方式,通过使用所检测到的正弦波的附加基矢量的分 量来计算所;险测到的正弦波的编码效率(803)。
接下来,通过与附加基矢量分量传输确定器240的方式相同的方式,基 于编码效率确定是否发送附加基矢量的分量(804)。
通过与图1的第一至第J附加基矢量推导器310—1至310—J类似的方式, 可以推导出附加基矢量的分量(801)。因此,可以基于(两个或多个)附加基矢 量的数量F和根据(这两个或多个)附加基矢量的数量F确定的频率变化k0 来推导多个附加基矢量。
通过与图3的第一至第J附加基矢量分量计算器320_1至320—J的方式 类似的方式,可以计算附加基矢量的分量(802)。因此,可以基于(两个或多 个)附加基矢量的数量F和根据(这两个或多个)附加基矢量的数量F确定的频 率变化k0来计算推导出的附加基矢量的多个分量。
通过与图3的第一至第J编码效率计算器330—1至330j的方式类似的 方式,可以计算正弦波的编码效率(803)。因此,可以通过使用所;险测到的正 弦波的附加基矢量的分量,基于(两个或多个)附加基矢量的数量F和根据(这 两个或多个)附加基矢量的数量F确定的频率变化k0来计算编码效率。
通过与图3的附加基矢量分量传输确定器340的方式类似的方式,确定
20是否发送附加基矢量的分量(804)。因此,基于最高编码效率确定是否发送附
加基矢量的分量。
如上所述,当确定了附加基矢量的分量的传输时,对量化后的频率和/ 或量化后的相位、量化后的振幅以及在确定附加基矢量的分量的传输中所生
成的信号进行编码(706)。在确定附加基矢量的分量的传输中所生成的信号包 括参照图1至图3所描述的控制参数和附加基矢量的分量。
图9是示出与图7中所示的音频编码方法对应的音频解码方法的流程 图。参照图4和图9描述音频解码方法的操作。
首先,通过与图4的解析单元410的方式类似的方式,解析编码后的音 频信号(901)。接下来,通过与图4的去量化单元420的方式类似的方式,对 解析中所得到的量化后的频率和/或量化后的相位和量化后的振幅进行去量 化(902)。通过与图4的控制参数解码单元440的方式类似的方式,将解析中 所得到的控制参数进行解码(903)。通过与图4的附加基矢量分量解码单元 460类似的方式,将在解析中得到的附加基矢量的分量进行解码(904)。
接下来,通过与图4的正弦波恢复单元430的方式类似的方式,基于去 量化后的频率和/或去量化后的相位和去量化后的振幅恢复正弦波(905)。接 下来,通过与图4的附加基矢量推导单元450的方式类似的方式,基于去量 化后的频率和/或去量化后的相位、去量化后的振幅和解码后的控制参数来推 导附加基矢量(906)。接下来,通过与图4的残留音频信号恢复单元470的方 式类似的方式,基于推导出的附加基矢量和解码后的附加基矢量的分量来恢 复残留音频信号(907)。接下来,通过与图4的混合单元480的方式类似的方 式,通过使用恢复后的正弦波和恢复后的残留音频信号来恢复音频信号 (卯8),并且输出恢复后的音频信号。
根据本发明的音频编码与解码方法还可以具体体现为计算机可读记录 介质上的计算机可读代码。计算机可读记录介质是能够存储数据的任何数据 存储设备,所述数据能够之后由计算机系统读取。
计算机可读记录介质的例子包括、但不局限于只读存储器(ROM)、随机 存取存储器(RAM)、 CD-ROM、磁带、软盘和光学数据存储设备。计算机可 读存储介质还可以分布在耦接计算机系统的网络上,以使得计算机可读代码 以分布式形式存储和运行。而且,用于实现本发明的功能程序、代码和代码 段可以被本发明所属领域的程序员容易地解释。尽管已经参照本发明的示范性实施例具体示出并描述了本发明,但是本 领域的技术人员应当理解,在不脱离如后附权利要求所定义的本发明的精神 和范围的条件下,可以在这里在形式和细节上进行各种变化。
权利要求
1.一种音频编码方法,包括从输入音频信号中检测至少一个正弦波;通过使用残留音频信号和所述正弦波的附加基矢量来计算所述附加基矢量的分量;确定所述附加基矢量的分量的传输;以及当确定了所述附加基矢量的分量的传输时,对(a)所述正弦波的频率和(b)所述正弦波的相位和振幅中的至少一个进行编码,其中,所述残留音频信号是通过从所述输入音频信号中排除所检测到的正弦波而得到的。
2. 如权利要求1所述的音频编码方法,其中,所述计算附加基矢量的分量包括推导所^r测到的正弦波的附加基矢量;以及基于所述残留音频信号来计算所推导出的附加基矢量的分量。
3. 如权利要求2所述的音频编码方法,其中,所述确定附加基矢量的分量的传输包括基于所述附加基矢量的分量计算所检测到的正弦波的每一个的编码效率;以及如果所述编码效率高于预定参考值,那么就发送所述附加基矢量的分量。
4. 一种音频解码方法,包括解析编码后的音频信号;通过对(a)在所述解析中得到的编码后的频率和(b)在所述解析中得到的编码后的相位和编码后的振幅中的至少一个进行解码,来恢复正弦波;通过对解析中得到的附加基矢量的分量进行解码,来恢复残留音频信号;以及通过将所恢复的正弦波和所恢复的残留音频信号混合,来生成所恢复的音频信号,其中,所述残留音频信号是在音频信号编码过程中通过从输入音频信号中排除所;险测到的正弦波而得到的。
5. —种音频编码方法,包括以特定长度为单位分割输入音频信号; 从分割后的音频信号中检测至少 一个正弦波;量化(a)所检测到的正弦波的频率和(b)所检测到的正弦波的相位和振幅 中的至少一个;将量化后的频率或量化后的相位和量化后的振幅进行去量化; 基于去量化后的频率或去量化后的相位、去量化后的振幅、残留音频信号和预定参考值,来确定所检测到的正弦波的附加基矢量的分量的传输;以及对量化后的频率或量化后的相位、量化后的振幅以及在确定附加基矢量 的分量的传输中所生成的信号进行编码,其中,所述残留音频信号是通过从分割后的音频信号中排除所检测到的 正弦波而得到的。
6. 如权利要求5所述的音频编码方法,其中,所述确定附加基矢量的分 量的传输包括推导所检测到的正弦波的多个附加基矢量; 计算推导出的附加基矢量的分量;基于附加基矢量的分量计算所检测到的正弦波的编码效率;以及 基于该编码效率确定附加基矢量的分量的传输。
7. 如权利要求6所述的音频编码方法,其中,在推导附加基矢量的过程 中,基于附加基矢量的预定数量F和根据附加基矢量的数量F确定的频率变 化来推导多个附加基矢量。
8. 如权利要求7所述的音频编码方法,其中,所推导出的附加基矢量的 相位与所检测到的正弦波的相位正交。
9. 如权利要求6所述的音频编码方法,其中,在计算附加基矢量的分量 的过程中,通过将残留音频信号乘以多个附加基矢量得到附加基矢量的分 量。
10. 如权利要求6所述的音频编码方法,其中,在计算编码效率的过程 中,根据下列公式,,)通过使用附加基矢量的分量a",、附加基矢量的数量F和去量化后的振 幅《来计算每一个编码效率。
11. 如权利要求6所述的音频编码方法,其中,在确定附加基矢量的分 量的传输的过程中,当编码效率高于预定参考值时,发送附加基矢量的分量。
12. 如权利要求5所述的音频编码方法,其中,所述确定附加基矢量的 分量的传输包括基于附加基矢量的数量F和根据附加基矢量的数量F确定的频率变化来 推导多个附加基矢量;计算所推导出的附加基矢量的分量;基于与附加基矢量的使用相关联的附加基矢量的数量F和根据附加基 矢量的数量F确定的频率变化k0来计算所;险测到的正弦波的编码效率;以 及基于所计算的编码效率中的最高编码效率,确定附加基矢量的分量的传输。
13. 如权利要求12所述的音频编码方法,其中,在确定附加基矢量的分 量的传输中,当最高编码效率高于预定参考值时,发送附加基矢量的分量。
14. 一种音频解码方法,包括 解析编码后的音频信号;对(a)在所述解析中得到的量化后的频率和(b)在所述解析中得到的量化 后的相位和量化后的振幅中的至少 一个进行去量化; 对在所述解析中得到的控制参数进行解码; 对在所述解析中得到的附加基矢量的分量进行解码; 基于去量化后的频率或去量化后的相位和去量化后的振幅,来恢复正弦波;基于去量化后的频率或去量化后的相位、去量化后的振幅和解码后的控 制参数,来推导附加基矢量;基于所推导出的附加基矢量和解码后的附加基矢量的分量,来恢复残留音频信号;以及通过将所恢复的正弦波和所恢复的残留音频信号混合,来恢复音频信号,其中,所述残留音频信号是通过在音频编码过程中将所检测到的正弦波 从分割后的音频信号中去除而得到的。
15. 如权利要求14所述的音频解码方法,其中,在推导附加基矢量中,基于附加基矢量的数量F和根据附加基矢 量的数量F所确定的频率变化,来推导多个附加基矢量,以及其中,通过基于解码后的控制参数选择附加基矢量中的一个来推导附加 基矢量。
16. —种音频编码装置,包括分割单元,其以特定长度为单位分割输入音频信号; 正弦波检测单元,其从分割后的音频信号中检测至少 一个正弦波; 量化单元,其对(a)由这些正弦波4企测单元4佥测到的这些正弦波的频率和 (b)由所述正弦波检测单元检测到的正弦波的相位和幅度中的至少一个进行量化;去量化单元,其对从所述量化单元输出的量化后的频率或量化后的相位和量化后的振幅进行去量化;附加基矢量分量传输确定单元,其基于从所述去量化单元输出的去量化 后的频率或去量化后的相位和去量化后的振幅、残留音频信号和预定参考 值,来确定所检测到的正弦波的附加基矢量的分量的传输;和编码单元,其对从所述量化单元输出的量化后的频率或量化后的相位和 量化后的振幅以及从所述附加基矢量分量传输确定单元输出的信号进行编 码,其中,所述残留音频信号是通过从分割后的音频信号中排除所述正弦波 检测单元4全测到的正弦波而得到的。
17. 如权利要求16所述的音频编码装置,其中,当确定附加基矢量的分量的传输时,从附加基矢量分量传输确定 单元输出的信号包括控制信号和附加基矢量的分量,以及其中,所述控制参数包括表示附加基矢量的分量的传输的参数,或者所 述控制参数包括表示附加基矢量的分量的传输的参数和表示用于附加基矢 量的推导方案的参数。
18. 如权利要求16所述的音频编码装置,其中,所述正弦波检测单元使 用匹配3艮踪方法来;f全测正弦波。
19. 如权利要求16所述的音频编码装置,其中,所述附加基矢量分量传 输确定单元包括附加基矢量推导器,其推导由所述正弦波检测单元检测到的正弦波的多 个附加基矢量;附加基矢量分量计算器,其计算由所述附加基矢量推导单元推导出的附 加基矢量的分量;编码效率计算器,其基于附加基矢量的分量计算正弦波的编码效率;和 附加基矢量分量传输确定器,其基于所述编码效率确定附加基矢量的分 量的传输。
20. 如权利要求19所述的音频编码装置,其中,所述附加基矢量推导器 基于附加基矢量的预定数目F和根据附加基矢量的数量F确定的频率变化, 来推导多个附加基矢量。
21. 如权利要求20所述的音频编码装置,其中,所述附加基矢量推导器 推导相位与所检测到的正弦波的相位正交的附加基矢量。
22. 如权利要求19所述的音频编码装置,其中,所述附加基矢量计算器 通过将残留音频信号乘以多个所推导的附加基矢量来计算附加基矢量的分 量。
23. 如权利要求19所述的音频编码装置,其中,所述编码效率计算器根 据下列公式<formula>formula see original document page 6</formula>通过使用附加基矢量的分量a",、附加基矢量的数量F和去量化后的振 幅《,来计算所述编码效率。
24. 如权利要求19所述的音频编码装置,其中,如果所述编码效率高于 预定参考值,那么所述附加基矢量分量传输确定单元就发送附加基矢量的分量。
25. 如权利要求16所述的音频编码装置,其中,所述附加基矢量分量传 输确定单元包括至少两个附加基矢量推导器,其推导由所述正弦波;险测单元^T测到的正弦波的多个附加基矢量;至少两个附加基矢量分量计算器,其对应于所述至少两个附加基矢量推 导单元,并且计算所推导出的附加基矢量的分量;至少两个编码效率计算器,其对应于所述至少两个附加基矢量分量计算 器,并且计算与至少两个附加基矢量的使用相关联的正弦波的编码效率;和附加基矢量传输确定器,其基于由所述至少两个编码效率计算器计算出 的编码效率中的最高编码效率,确定附加基矢量的分量的传输。
全文摘要
本发明提供了一种能够在低比特率时恢复高质量音频信号的音频编码与解码装置。音频编码方法包括从输入音频信号中检测至少一个正弦波;基于残留音频信号和正弦波的附加基矢量来计算附加基矢量的分量;确定所述附加基矢量的分量的传输;以及当确定了附加基矢量的分量的传输时,对正弦波的(a)频率和(b)相位和振幅中的至少一个进行编码,其中,所述残留音频信号是通过从输入音频信号中排除所检测到的正弦波而得到的。
文档编号G10L19/02GK101563848SQ200780047233
公开日2009年10月21日 申请日期2007年12月28日 优先权日2006年12月29日
发明者吴宰源, 李健炯, 李男淑, 李雨, 郑钟勋 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1