音频编码方法和设备、音频解码方法和设备及其记录介质和采用音频编码方法和设备、音...的制作方法

文档序号:2825784阅读:99来源:国知局
音频编码方法和设备、音频解码方法和设备及其记录介质和采用音频编码方法和设备、音 ...的制作方法
【专利摘要】提供一种音频编码方法。所述音频编码方法包括:针对音频频谱基于预定的子频带获取包络;基于预定的子频带对包络进行量化;获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码。因此,对音频频谱的包络信息进行编码所需的比特的数量可被减少到有限的比特范围内,从而增加对实际频谱分量进行编码所需的比特的数量。
【专利说明】音频编码方法和设备、音频解码方法和设备及其记录介质和采用音频编码方法和设备、音频解码方法和设备的多媒体装置
【技术领域】
[0001]与示例性实施例一致的设备和方法涉及音频编码/解码,更具体地讲,涉及一种能够在不增加复杂度和恢复的声音质量的恶化的情况下,通过减少在有限比特范围内对音频频谱的包络信息进行编码所需的比特的数量来增加对实际频谱分量进行编码所需的比特的数量的音频编码方法和设备、音频解码方法和设备、记录介质和采用该音频编码方法和设备、音频解码方法和设备的多媒体装置。
【背景技术】
[0002]当对音频信号进行编码时,除实际频谱分量以外的附加信息(诸如,包络)可包括在比特流中。在这种情况下,通过在使损失最小化的同时减少分配用于附加信息的编码的比特的数量,分配用于实际频谱分量的编码的比特的数量可被增加。
[0003]也就是说,当对音频信号进行编码或解码时,需要通过以特别低的比特率有效地使用有限数量的比特来构建在相应比特范围内具有最优声音质量的音频信号。

【发明内容】

[0004]技术问题
[0005]一个或更多个示例性实施例的多个方面提供一种音频编码方法和设备、音频解码方法和设备、记录介质和采用其的多媒体装置,其中,所述音频编码方法和设备能够在不增加复杂度和恢复的声音质量的恶化的情况下,在将对音频频谱的包络信息进行编码所需的比特的数量减少到有限的比特范围内的同时,增加对实际频谱分量进行编码所需的比特的数量。
[0006]解决方案
[0007]根据一个或更多个不例性实施例的一方面,提供一种音频编码方法,包括:针对音频频谱基于预定的子频带获取包络;基于预定的子频带对包络进行量化;获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码。
[0008]根据一个或更多个示例性实施例的一方面,提供一种音频编码设备,包括:包络获取单元,用于针对音频频谱基于预定的子频带获取包络;包络量化器,用于基于预定的子频带对包络进行量化;包络编码器,用于获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码;频谱编码器,用于对音频频谱进行量化和无损编码。
[0009]根据一个或更多个示例性实施例的一方面,提供一种音频解码方法,包括:从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码;通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化。
[0010]根据一个或更多个示例性实施例的一方面,提供一种音频解码设备,包括:包络解码器,用于从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码;包络反量化器,用于通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化;频谱解码器,用于对包括在比特流中的频谱分量进行无损解码和反量化。
[0011]根据一个或更多个示例性实施例的一方面,提供一种包括编码模块的多媒体装置,其中,编码模块用于针对音频频谱基于预定的子频带获取包络,基于预定的子频带对包络进行量化,获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码。
[0012]多媒体装置还可包括解码模块,其中,解码模块用于从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码,通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化。
[0013]效果
[0014]可在不增加复杂度和恢复的声音质量的恶化的情况下,通过减少在有限的比特范围内对音频频谱的包络信息进行编码所需的比特的数量,来增加对实际频谱分量进行编码所需的比特的数量。
【专利附图】

【附图说明】
[0015]通过下面结合附图的示例性实施例的描述,这些和其他方面将变得清楚和更容易理解,其中:
[0016]图1是根据示例性实施例的数字信号处理设备的框图;
[0017]图2是根据另一示例性实施例的数字信号处理设备的框图;
[0018]图3A和图3B分别不出在量化分辨率是0.5且量化步长是3.01时的相互比较的非优化的对数尺度和优化的对数尺度;
[0019]图4A和图4B分别示出在量化分辨率是I且量化步长是6.02时的相互比较的非优化的对数尺度和优化的对数尺度;
[0020]图5是分别示出相互比较的非优化的对数尺度的量化结果和优化的对数尺度的量化结果的曲线图;
[0021]图6是示出在先前子频带的量化差(delta)值被用作上下文时选择的三个组的概率分布的曲线图;
[0022]图7是示出根据示例性实施例的图1的数字信号处理设备的包络编码器中的基于上下文的编码处理的流程图;
[0023]图8是示出根据示例性实施例的图2的数字信号处理设备的包络解码器中的基于上下文的解码处理的流程图;
[0024]图9是根据示例性实施例的包括编码模块的多媒体装置的框图;
[0025]图10是根据示例性实施例的包括解码模块的多媒体装置的框图;
[0026]图11是根据示例性实施例的包括编码模块和解码模块的多媒体装置的框图。【具体实施方式】
[0027]示例性实施例可允许各种改变或修改以及形式上的各种改变,特定实施例将被示出在附图中并在说明书中被详细描述。然而,应理解特定实施例不将本发明构思限制为特定公开形式而是包括本发明构思的精神和技术范围内的所有修改的、等同的或替代的实施例。在以下描述中,由于公知的功能或构造将在不必要的细节上使本发明构思不清楚,因此不被详细描述。
[0028]尽管诸如“第一”和“第二”的术语可用于描述各种元件,但所述元件可不被所述术语限制。所述术语可用于将特定元件与另一元件分开。
[0029]在本申请中使用的术语仅用于描述特定实施例,而不具有任何限制本发明构思的意图。尽管在考虑在本发明构思中的功能的同时将当前尽可能广泛使用的通用术语选作在本发明构思中使用的术语,但它们可根据本领域的普通技术人员的意图、先前使用或新技术的出现改变。另外,在特定情况下,可使用由 申请人:有意地选择的术语,在这种情况下,将在本发明构思的相应描述中公开这些术语的意义。因此,在本发明构思中使用的术语不应仅由术语的名称而应由术语的含义和整个本发明构思中的内容来定义。
[0030]除非在上下文中单数的表达与复数的表达明显彼此不同,否则单数的表达包括复数的表达。在本申请中,应理解诸如“包括”和“具有”的术语用于指示实施的特征、数字、步骤、操作、元件、部件或它们的组合的存在,而不是预先排除一个或更多个其他特征、数字、步骤、操作、元件、部件或它们的组合的存在或添加的可能性。
[0031]在下文中,将参照示出本发明构思的示例性实施例的附图来更全面地描述本发明构思。附图中的相同的标号表示相同的元件,因此将省略它们的重复的描述。
[0032]当诸如“…中的至少一个”的表述在一列元件之后时,其修饰整列元件而不修饰列出的单个元件。`
[0033]图1是根据示例性实施例的数字信号处理设备100的框图。
[0034]图1中示出的数字信号处理设备100可包括变换器110、包络获取单元120、包络量化器130、包络编码器140、频谱归一化器150和频谱编码器160。数字信号处理设备100的组件可被集成到至少一个模块中,并可由至少一个处理器实现。这里,数字信号可指示媒体信号,诸如,视频、图像、音频或语音、或指示通过对音频和语音进行合成来获得的信号的声音,但在下文中,为便于描述,数字信号通常指示音频信号。
[0035]参照图1,变换器110可通过将音频信号从时域变换到频域来产生音频频谱。可通过使用诸如改进的离散余弦变换(MDCT)的各种公知方法来执行时域到频域的变换。例如,用于时域的音频信号的MDCT可使用等式I来执行。
[0036]
【权利要求】
1.一种音频编码方法,包括: 针对音频频谱基于预定的子频带获取包络; 基于预定的子频带对包络进行量化; 获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码。
2.如权利要求1所述的音频编码方法,其中,量化的步骤包括:调整与预定的量化索引相应的量化区域的边界,从而量化区域中的总量化误差被最小化。
3.如权利要求1所述的音频编码方法,其中,包络是相应的子频带的平均能量、平均幅度、功率和标准值中的一个。
4.如权利要求1所述的音频编码方法,其中,无损编码的步骤包括:调整相邻子频带的量化的包络之间的差值以具有特定范围。
5.如权利要求1所述的音频编码方法,其中,无损编码的步骤包括:将先前子频带的差值的范围划分为多个组,并通过使用针对所述多个组中的每个组预定义的霍夫曼表来对当前子频带的差值执行霍夫曼编码。
6.如权利要求5所述的音频编码方法,其中,所述无损编码的步骤包括:将先前子频带的差值的范围划分为第一组至第三组,并将包括用于单方使用的第一霍夫曼表和用于共享的第二霍夫曼表的两个霍夫曼表分配到第一组至第三组。
7.如权利要求6所述的音频编码方法,其中,无损编码的步骤包括:当第二霍夫曼表被共享时,按原样或在反转之后使用当前子频带的差值。
8.如权利要求1所述的音频编码方法,其中,无损编码的步骤包括:对于不存在先前子频带的第一子频带按原样地对量化的包络进行无损编码,或者当先前子频带用作上下文时,通过基于预定参考值使用差值来执行无损编码。
9.一种音频编码设备,包括: 包络获取单元,用于针对音频频谱基于预定的子频带获取包络; 包络量化器,用于基于预定的子频带对包络进行量化; 包络编码器,用于获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码; 频谱编码器,用于对音频频谱进行量化和无损编码。
10.如权利要求9所述的音频编码设备,还包括:频谱归一化器,用于通过使用基于预定的子频带的包络对音频频谱进行归一化,并将归一化音频频谱提供给频谱编码器。
11.如权利要求9所述的音频编码设备,其中,频谱编码器执行阶乘脉冲编码(FPC)。
12.—种音频解码方法,包括: 从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码; 通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化。
13.如权利要求12所述的音频解码方法,其中,包络是相应的子频带的平均能量、平均幅度、功率和标准值中的一个。
14.如权利要求12所述的音频解码方法,其中,无损解码的步骤包括:将先前子频带的差值的范围划分为多个组,并通过使用针对所述多个组中的每个组预定义的霍夫曼表来对当前子频带的差值执行霍夫曼编码。
15.如权利要求14所述的音频解码方法,其中,无损解码的步骤包括:将先前频带的差值的范围划分到第一组至第三组,并将包括用于单方使用的第一霍夫曼表和用于共享的第二霍夫曼表的两个霍夫曼表分配到第一组至第三组。
16.如权利要求15所述的音频解码方法,其中,无损解码的步骤包括:当第二霍夫曼表被共享时,按原样或在反转之后使用当前子频带的差值。
17.如权利要求12所述的音频解码方法,其中,无损解码的步骤包括:对于先前子频带不存在的第一子频带按原样地对量化的包络进行无损解码,或者当先前子频带用作上下文时,通过基于预定的参考值使用差值来执行无损解码。
18.—种音频解码设备,包括: 包络解码器,用于从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码; 包络反量化器,用于通过从作为无损解码的结果而重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化; 频谱解码器,用于对包括在比特流中的频谱分量进行无损解码和反量化。
19.如权利要求18所述的音频解码设备,还包括:频谱反归一化器,用于通过使用基于子频带的包络来对反量化的频谱分量进行反归一化。
20.如权利要求18所述的音频解码设备,其中,频谱解码器通过阶乘脉冲解码来执行无损解码。
21.一种包括编码模块的多媒体装置,其中,编码模块用于针对音频频谱基于预定的子频带获取包络,基于预定的子频带对包络进行量化,获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码。
22.一种包括解码模块的多媒体装置,其中,解码模块用于从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码,通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化。
23.一种多媒体装置,包括: 编码模块,用于针对音频频谱基于预定的子频带获取包络,基于预定的子频带对包络进行量化,获得相邻子频带的量化的包络之间的差值并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损编码; 解码模块,用于从比特流获得相邻子频带的量化的包络之间的差值,并通过将先前子频带的差值用作上下文来对当前子频带的差值进行无损解码,通过从作为无损解码的结果而被重构的当前子频带的差值获得基于子频带的量化的包络来执行反量化。
24.一种存储用于执行权利要求1所述的音频编码方法的计算机可读程序的非暂时性计算机可读记录介质。
25.一种存储用于执行权利要求12所述的音频解码方法的计算机可读程序的非暂时性计算机可读记录介质。
【文档编号】G10L19/00GK103733257SQ201280037719
【公开日】2014年4月16日 申请日期:2012年6月1日 优先权日:2011年6月1日
【发明者】安顿·普波沃, 康斯坦丁·奥斯波夫, 朱基岘 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1