能量无损编码方法和设备以及能量无损解码方法和设备与流程

文档序号:11592331阅读:288来源:国知局

本申请是向中国知识产权局提交的申请日为2012年10月22日的标题为“能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、以及音频解码方法和设备”的第201280063986.6号申请的分案申请。

本公开涉及音频编码和解码,更具体地讲,涉及一种能量无损编码方法和设备、音频编码方法和设备、能量无损解码方法和设备、音频解码方法和设备、以及利用这些方法和设备的多媒体装置,通过所述能量无损编码方法和设备,在不提高重构音频的复杂度或降低重构音频的质量的情况下,可通过在有限比特范围内减少对音频频谱的能量信息进行编码所需的比特数量来增加对实际频谱分量进行编码所需的比特数量。



背景技术:

当对音频信号进行编码时,除了实际频谱分量之外,还可将诸如能量的副(side)信息包括在比特流中。在这种情况下,通过减少被分配以最少损失对副信息进行编码的比特数量,可增加被分配对实际频谱分量进行编码的比特数量。

也就是说,当对音频信号进行编码或解码时,需要通过高效率地以特别低的比特率使用有限比特数量来在相应的比特范围中恢复具有最佳音频质量的音频信号。



技术实现要素:

技术问题

一方面是提供一种能量无损编码方法、音频编码方法、能量无损解码方法以及音频解码方法,通过所述能量无损编码方法,可以在不提高恢复音频的复杂度或降低恢复音频的质量的情况下,在有限比特范围内减少对音频频谱的能量信息进行编码所需的比特数量的同时,增加对实际频谱分量进行编码所需的比特数量。

另一方面是提供一种能量无损编码设备、音频编码设备、能量无损解码设备以及音频解码设备,通过所述能量无损编码设备,可以在不提高恢复音频的复杂度或降低恢复音频的质量的情况下,通过在有限比特范围内减少对音频频谱的能量信息进行编码所需的比特数量来增加对实际频谱分量进行编码所需的比特数量。

另一方面是提供一种计算机可读记录介质,该计算机可读记录介质存储用于执行能量无损编码方法、音频编码方法、能量无损解码方法以及音频解码方法的计算机可读程序。

另一方面是提供一种采用能量无损编码方法、音频编码方法、能量无损解码方法或音频解码方法的多媒体装置。

技术解决方案

根据一个或多个示例性实施例的一方面,提供一种无损编码方法,该无损编码方法包括:将量化系数的无损编码模式确定为无限范围无损编码模式和有限范围无损编码模式之一;在与无损编码模式确定的结果相对应的无限范围无损编码模式下对量化系数进行编码;并且在与无损编码模式确定的结果相对应的有限范围无损编码模式下对量化系数进行编码。

根据一个或多个示例性实施例的另一方面,提供一种音频编码方法,该音频编码方法包括:对从频谱系数以频带为单位获得的能量进行量化,所述频谱系数从时域中的音频信号产生;通过考虑表示能量量化系数的比特数量以及作为在无限范围无损编码模式和有限范围无损编码模式下对能量量化系数进行编码的结果而产生的比特数量,使用无限范围无损编码模式和有限范围无损编码模式之一来对能量量化系数进行无损编码;通过使用能量量化系数来分配将用于以频带为单位进行编码的比特;并且基于所分配的比特来对频谱系数进行量化和无损编码。

根据一个或多个示例性实施例的另一方面,提供一种无损解码方法,该无损解码方法包括:确定比特流中所包括的量化系数的无损编码模式;在与无损编码模式确定的结果相对应的无限范围无损解码模式下对量化系数进行解码;并且在与无损编码模式确定的结果相对应的有限范围无损解码模式下对量化系数进行解码。

根据一个或多个示例性实施例的另一方面,提供一种音频解码方法,该音频解码方法包括:确定比特流中所包括的能量量化系数的无损编码模式,并在与无损编码模式确定的结果相对应的无限范围无损解码模式或有限范围无损解码模式下对能量量化系数进行解码;对无损解码的能量量化系数进行去量化,并通过使用能量去量化系数来分配将用于以频带为单位进行编码的比特;对从所述比特流获得的频谱系数进行无损解码;并且基于所分配的比特来对无损解码的频谱系数进行去量化。

有益效果

通过使得不仅可用fpc方法而且还可用哈夫曼编码方法对无限范围能量量化系数进行编码,可减少用于对无限范围能量量化系数进行编码的比特数量,因此,可将更多数量的比特分配给频谱编码。

附图说明

图1是根据示例性实施例的音频编码设备的框图;

图2是根据示例性实施例的音频解码设备的框图;

图3是根据示例性实施例的能量无损编码设备的框图;

图4是根据示例性实施例的图3的能量无损编码设备的第二无损编码器的框图;

图5是示出根据示例性实施例的能量无损编码方法的流程图;

图6是根据示例性实施例的能量无损解码设备的框图;

图7是根据示例性实施例的图6的能量无损解码设备的第二无损解码器的框图;

图8是用于描述有限范围的能量量化系数的示图;

图9是根据示例性实施例的多媒体装置的框图;

图10是根据另一示例性实施例的多媒体装置的框图;和

图11是根据另一示例性实施例的多媒体装置的框图。

具体实施方式

本发明构思可以允许各种类型的改变或修改以及形式上的各种改变,并且在附图中将示出特定的示例性实施例,并且在本说明书中将详细描述这些示例性实施例。然而,应当理解,这些特定的示例性实施例不使本发明构思限于特定形式,而是包括在本发明构思的精神和技术范围内的每一种修改形式、等同形式或替换形式。在下面的描述中,因为公知的功能或构造将在不必要的细节上模糊本发明构思,所以不详细描述这些公知的功能或构造。

尽管诸如“第一”和“第二”的术语可用于描述各种元件,但是这些元件不能受这些术语限制。这些术语可用于区分某一元件与另一元件。

本申请中所使用的术语仅用于描述特定的示例性实施例,而不具有限制本发明构思的任何意图。尽管在考虑本发明构思中的功能时,将目前尽可能广泛地使用的通用术语选择为本发明构思中所使用的术语,但是这些通用术语可根据本领域的普通技术人员的意图、司法判例或新技术的出现而变化。另外,在特定的情况下,可使用申请人有意选择的术语,在这种情况下,将在本发明构思的相应描述中公开这些术语的含义。因此,本公开中所使用的术语不应由这些术语的简单名称定义,而应由这些术语的含义以及整个本发明构思的内容来限定。

单数表达包括复数表达,除非它们在上下文下彼此明显不同。在本申请中,应理解,诸如“包括”和“具有”的术语用于指示所实现的特征、数量、步骤、操作、元件、部件或它们的组合的存在,但不预先排除一个或多个其他特征、数量、步骤、操作、元件、部件或它们的组合的存在或添加的可能性。

现在将参照附图更充分地描述本发明构思,在附图中,示出了示例性实施例。附图中的相似的标号表示相似的元件,因此,将省略它们的重复描述。

图1是根据示例性实施例的音频编码设备的框图。

图1中所示的音频编码设备100可包括变换器110、能量量化器120、能量无损编码器130、比特分配器140、频谱量化器150、频谱无损编码器160以及复用器170。可选地可包括复用器170,并且可用用于执行比特打包功能的另一组件取代复用器170。可替换地,无损编码的能量数据和无损编码的频谱数据可形成将被存储或发送的单独的比特流。在频谱量化处理之后或之前,还可包括用于使用能量值执行归一化的归一化器。这些组件可集成在至少一个模块中并且用至少一个处理器(未示出)实现。音频信号可指示媒体信号(诸如声音)、或者音乐和语音的混合信号,媒体信号指示音乐、语音。然而,以下,为了方便描述,使用音频信号。输入到音频编码设备100的时域中的音频信号可具有各种采样率,并且将用于对频谱进行量化的能量的带配置可基于采样率而变化。因此,对其执行无损编码的量化能量的数量可变化。采样率例如为8khz、16khz、32khz、48khz等,但不限于此。可将对其确定采样率和目标比特率的时域中的音频信号提供给变换器110。

参照图1,变换器110可通过将时域中的音频信号(例如,脉冲编码调制(pcm)信号)变换为频域中的音频频谱来产生音频频谱。可通过使用各种公知的方法(诸如修改的离散余弦变换(mdct))来执行时域/频域变换。可将由变换器110获得的变换系数(例如,mdct系数)提供给能量量化器120和频谱量化器150。

能量量化器120可从变换系数获取以频带为单位的能量值,这些变换系统从变换器110提供。频带是对音频频谱的采样进行分组的单位,并且可通过反映临界带而具有一致的或不一致的长度。在不一致的情况下,可以对一个帧设置频带,使得每个频带中所包括的采样的数量从起始采样到最后一个采样增加。当支持多个比特率时,可以针对不同的比特率设置频带,使得每个频带中所包括的采样的数量相同。可预先定义一个帧中所包括的频带的数量或每个频带中所包括的采样的数量。能量值可指示每个频带中所包括的变换系数的包络,该包络可指示平均振幅、平均能量、功率值或规范值。频带可指示参数带或尺度因子带。

可通过例如等式1来获取第k频带的能量e(k)。

在等式1中,s(l)表示频谱,“start”和“end”分别表示当前频带的起始采样和最后一个采样。

能量量化器120可通过使用量化步长大小对所获取的能量进行量化来产生能量量化系数。详细地讲,可通过将第k频带的能量e(k)除以量化步长大小并且将除法结果上舍入为整数来获得能量量化系数。在这种情况下,能量量化器120可执行量化,使得能量量化系数具有不具有能量量化边界的无限范围。能量量化系数可被表示为能量量化索引。例如,如果假定原始能量值为20.2并且量化步长大小为2,则量化的值为20,并且能量量化系数和能量量化索引可被表示为10。根据示例性实施例,对于当前频带,当前频带的能量量化系数与前一频带的能量量化系数之间的差值,即,量化增量值可被无损编码。在这种情况下,当应用无限范围无损编码时,能量量化系数或差值(即,量化增量值)可用作无限范围无损编码的输入。当应用有限范围无损编码时,能量量化系数的量化增量值用作有限范围无损编码的输入,其中,通过使用通过将特定值加到输入值而获得的值来对能量量化系数进行无损编码。在这种情况下,因为第一频带的前一频带不存在,所以不将量化增量值应用于第一频带的值,并且可通过从第一频带的值减去另一个值,而不是加上特定值来产生有限范围无损编码的输入信号。

能量无损编码器130可对从能量量化器120提供的能量量化系数进行无损编码。根据示例性实施例,可以以帧为基础选择第一无损编码模式和第二无损编码模式中用于无限范围的能量量化系数的一种无损编码模式。在第一无损编码模式下,可使用对无限范围的能量量化系数进行无损编码的算法,在第二无损编码模式下,可使用对有限范围的能量量化系数进行无损编码的算法。根据另一示例性实施例,可对从能量量化器120提供的每个频带的能量量化系数获得频带之间的量化增量值,并且可对量化增量值进行无损编码。作为无损编码的结果而获得的能量数据可与指示第一或第二无损编码模式的信息一起包括在比特流中,并且可被存储或发送。

比特分配器140可通过对从能量量化器120提供的能量量化系数进行去量化来获取能量去量化系数。比特分配器140可对与目标比特率相应的比特总数以频带为基础使用能量去量化系数来计算掩蔽阈值,并使用该掩蔽阈值来以整数或小数点为单位确定每个频带的感知编码所需的所分配的比特数量。详细地讲,比特分配器140可通过使用以频带为基础获得的能量去量化系数估计容许比特数量来分配比特,并限制所分配的比特数量不超过容许比特数量。在这种情况下,可从具有更高能量值的频带顺序地分配比特数量。另外,通过根据每个频带的感知重要性对每个频带的能量值进行加权,可进行调整,使得更多数量的比特被分配给感知上更重要的频带。可通过如itu-tg.719中的心理声学加权来确定感知重要性。

频谱量化器150可通过使用以频带为基础确定的所分配的比特数量来对从变换器110提供的变换系数进行量化,并以频带为基础产生频谱量化系数。

频谱无损编码器160可对从频谱量化器150提供的频谱量化系数进行无损编码。作为无损编码算法的示例,可使用阶乘脉冲编码(fpc)。根据fpc,可在所分配的比特数量内用阶乘格式表示诸如脉冲位置、脉冲幅度和脉冲符号等信息。作为fpc的结果而获得的fpc数据可包括在比特流中并且被存储或发送。

复用器170可从从能量无损编码器130提供的能量数据和从频谱无损编码器160提供的频谱数据产生比特流。

图2是根据示例性实施例的音频解码设备的框图。

图2中所示的音频解码设备200可包括解复用器210、能量无损解码器220、能量去量化器230、比特分配器240、频谱无损解码器250、频谱去量化器260以及逆变换器270。这些组件可集成在至少一个模块中并且用至少一个处理器(未示出)实现。如音频编码设备100中那样,可选地可包括解复用器210,并且可用用于执行比特拆包功能的另一组件取代解复用器210。在频谱去量化处理之后或之前,还可包括使用能量值执行去归一化的去归一化器(未示出)。

参照图2,解复用器210可对比特流进行解析,并分别将编码的能量数据和编码的频谱数据提供给能量无损解码器220和频谱无损解码器250。

能量无损解码器220可通过对编码的能量数据进行无损解码来产生能量量化系数。

能量去量化器230可通过使用量化步长大小对从能量无损解码器220提供的能量量化系数进行去量化来产生能量去量化系数。详细地讲,能量去量化器230可通过将能量量化系数乘以量化步长大小来获得能量去量化系数。

比特分配器240可使用从能量去量化器230提供的能量去量化系数来以频带为基础以整数或小数点为单位分配比特。详细地讲,从具有更高能量值的频带顺序地分配每一采样的比特。也就是说,首先将每一采样的比特分配给具有最高能量值的频带,并通过减小相应频带的能量值来改变优先级以将比特分配给其他频带。重复该处理,直到给定帧中的所有可用比特都被分配为止。比特分配器240的操作基本上与音频编码设备100的比特分配器140的操作相同。

频谱无损解码器250可通过对编码的频谱数据进行无损解码来产生频谱量化系数。

频谱去量化器260可通过使用以频带为基础确定的所分配的比特数量对从频谱无损解码器250提供的频谱量化系数进行去量化来产生频谱去量化系数。

逆变换器270可通过对从频谱去量化器260提供的频谱去量化系数进行逆变换来重构时域中的音频信号。

图3是根据示例性实施例的能量无损编码设备的框图。

图3中所示的能量无损编码设备300可包括模式确定器310、第一无损编码器330和第二无损编码器350。第二无损编码器350可包括高位比特编码器351和低位比特编码器353。这些组件可集成在至少一个模块中并且用至少一个处理器(未示出)实现。

参照图3,模式确定器310可将能量量化系数的编码模式确定为第一无损编码模式和第二无损编码模式之一。当第一无损编码模式被确定为编码模式时,可将能量量化系数提供给第一无损编码器330。否则,当第二无损编码模式被确定为编码模式时,可将能量量化系数提供给第二无损编码器350。模式确定器310可确定对于一个帧中的所有频带,能量量化系数是否可被表示为特定数量的比特,例如,n个比特(n是等于或大于2的自然数)。如果对于至少一个频带,能量量化系数不能被表示为特定数量的比特,则模式确定器310可将能量量化系数的编码模式确定为使用无限范围无损编码算法的第一无损编码模式。否则,如果对于所有频带,能量量化系数可被表示为特定数量的比特,则模式确定器310可将能量量化系数的编码模式确定为第一无损编码模式和第二无损编码模式之一,在第一无损编码模式下,使用无限范围无损编码算法,在第二无损编码模式下,使用有限范围无损编码算法。详细地讲,模式确定器310可对于当前帧中的所有频带,在第二无损编码模式的多种模式下对高位比特能量量化系数进行编码,将作为编码的结果而使用的最少数量的比特与作为在第一无损编码模式下编码的结果而使用的比特进行比较,并且作为该比较的结果,确定第一无损编码模式和第二无损编码模式之一。响应于模式确定的结果,可产生指示能量量化系数的编码模式的1比特的第一附加信息d0,并将该第一附加信息d0包括在比特流中。当编码模式被确定为第二无损编码模式时,模式确定器310可将n个比特的能量量化系数划分为n0个高位比特和n1个低位比特,并将n0个高位比特和n1个低位比特提供给第二无损编码器350。在这种情况下,n0可被表示为n-n1,n1可被表示为n-n0。根据示例性实施例,n、n0和n1可分别被设置为6、5和1。

第一无损编码器330可执行能量量化系数的fpc。当应用增量编码时,fpc可将频带的能量量化系数之间的差值中的每个划分为符号和绝对值,如果绝对值不为0,则发送符号,并通过将绝对值表示为堆叠脉冲(即,以频带为基础有多少个脉冲堆叠)来发送绝对值。

第二无损编码器350可将能量量化系数划分为高位比特和低位比特,并通过将哈夫曼编码方法或比特打包方法应用于高位比特并且将比特打包方法应用于低位比特来对能量量化系数进行无损编码。

详细地讲,高位比特编码器351可为表示为n0个比特的高位比特数据准备2n0个符号,并用哈夫曼编码方法和比特打包方法之中需要较少比特数量的方法来对这2n0个符号进行编码。高位比特编码器351可具有m种编码模式,详细地讲,(m-1)种哈夫曼编码模式和1比特打包模式。例如,当m为4时,可产生指示高位比特的编码模式的2比特的第二附加信息d1,并且可将该第二附加信息d1与第一附加信息d0一起包括在比特流中。

低位比特编码器353可通过应用比特打包方法来对表示为n1个比特的低位比特数据进行编码。当一个帧包括nb个频带时,可使用n1×nb个比特作为总比特数量来对低位比特数据进行编码。

图4是根据示例性实施例的图3的第二无损编码器的详细框图。

图4中所示的第二无损编码器400可包括高位比特编码器410和第二比特打包单元430。高位比特编码器410可包括多个哈夫曼编码器(例如,第一至第三哈夫曼编码器411、413和415)以及第一比特打包单元417。尽管根据各种哈夫曼编码方法,包括第一至第三哈夫曼编码器411、413和415,但是多个哈夫曼编码器不限于此,并且可通过考虑用于编码的容许比特数量来在设计中改变多个哈夫曼编码器。

参照图4,当增量编码用于存在于一个帧中的所有频带时,只有当当前频带与前一频带的能量量化系数之间的差值被表示为特定数量的比特(例如,6个比特)时,第二无损编码器400才可操作。例如,当第一频带的能量量化系数差值不属于可用6个比特表示的64个种类时,无损编码可由第一无损编码器330执行。

高位比特编码器410可将模式确定器310已经确定的使用最少数量的比特的哈夫曼编码模式照原样应用于第一至第三哈夫曼编码器411、413和415以及第一比特打包单元417之中对于所有频带的高位比特编码。在这种情况下,可将相同的无损编码模式应用于一个帧中的所有频带,因此,例如,可将与能量的无损编码模式相关的相同的比特值包括在每个帧的头中。

第一至第三哈夫曼编码器411、413和415可通过使用上下文或者不使用上下文来执行哈夫曼编码。例如,第一哈夫曼编码器411可被实现为不使用上下文执行哈夫曼编码。第二哈夫曼编码器413可被实现为通过使用上下文来执行哈夫曼编码。当使用上下文时,根据示例性实施例,可使用用于前一频带的量化增量值作为上下文来对当前频带执行量化增量值的哈夫曼编码。根据另一示例性实施例,可使用高位比特(例如,用用于前一频带的量化增量值的5个比特表示的值)作为上下文。第三哈夫曼编码器415可以不使用上下文,而是与第一哈夫曼编码器411相比,用较少数量的符号来构建哈夫曼表。第一比特打包单元417可照原样对高位比特数据进行编码,并且输出例如5比特数据。

不管在第一或第二无损编码模式的确定中已经确定的高位比特的编码模式如何,高位比特编码器410都还可包括比较器(未示出),该比较器对于高位比特数据将第一至第三哈夫曼编码器411、413和415以及第一比特打包单元417的编码结果彼此进行比较,并且选择并输出需要最少数量的比特的编码模式。可将第二无损编码模式应用于一个帧中的所有频带,并且可同时将不同的哈夫曼编码模式应用于高位比特编码。

图5是示出根据示例性实施例的能量无损编码方法的流程图,其中,能量无损编码方法可由至少一个处理装置执行。另外,可以以帧为基础执行图5的能量无损编码方法。为了方便描述,假定m=4,即,用于高位比特数据的哈夫曼编码模式的数量为4个。另外,假定通过第一至第三哈夫曼编码器411、413和415以及第一比特打包单元417获得4种哈夫曼编码模式。

参照图5,在操作510中,可对输入的能量量化系数执行作为无限范围无损编码算法的fpc,并计算fpc中所使用的比特(即,e个比特)。操作510可在操作580之前执行。

在操作520中,可检查被输入用于能量无损编码的能量量化系数之间的差值来选择第一无损编码模式和第二无损编码模式之一。也就是说,当能量量化系数之间的差值中的每个用特定数量的比特表示时,在一个帧中的所有频带中,可选择与第二无损编码模式相应的哈夫曼编码。然而,当能量量化系数之间的差值不用特定数量的比特表示时,在一个帧中的至少一个频带中,可选择与第一无损编码模式相应的fpc。也就是说,如果确定不能执行哈夫曼编码,则在操作580中,可通过将与指示能量量化系数的无损编码模式的第一附加信息d0相应的1个比特加到fpc中用于相应帧的e个比特来产生第一无损编码结果。

否则,如果确定可执行哈夫曼编码,则在操作530中,可在m种哈夫曼编码模式下对高位比特数据进行编码,并且可计算这m种哈夫曼编码模式下所使用的比特,即,h0至h(m-1)个比特。h0个比特是当应用第一种哈夫曼编码模式时所使用的比特,h(m-1)个比特是当应用第m种哈夫曼编码模式时所使用的比特。

在操作540中,可通过将h0至h(m-1)个比特彼此进行比较来选择使用最少数量的比特的哈夫曼编码模式,并且可通过添加表示指示所选编码模式的第二附加信息d1的2个比特来计算用于高位比特的无损编码比特,即,h个比特。

在操作550中,可通过将低位比特的无损编码中所使用的比特(即,l个比特)加到高位比特的无损编码中所使用的比特(即,h个比特)来计算哈夫曼编码中所使用的全部比特,即,t个比特。如果低位比特的数量为1个,并且一个帧中的频带的数量为20个,则l比特的数量为20个。

在操作560中,可将在操作550中计算的全部比特的哈夫曼编码中所使用的t个比特与在操作510中计算的fpc中所使用的e个比特进行比较。也就是说,如果在哈夫曼编码中所使用的t个比特的数量少于在fpc中所使用的e个比特的数量,则可确定对高位比特执行第二无损编码,即,哈夫曼编码。

如果在操作560中确定对高位比特执行第二无损编码(即,哈夫曼编码),则在操作570中,可通过将与指示能量量化系数的无损编码模式的第一附加信息d0相应的1个比特加到哈夫曼编码中所使用的t个比特来产生第二无损编码结果。

如果在操作520中确定不能对能量量化系数执行哈夫曼编码或者在操作560中确定对高位比特执行第一无损编码(即,fpc),则在操作580中,可通过将与指示能量量化系数的无损编码模式的第一附加信息d0相应的1个比特加到fpc中所使用的e个比特来产生第一无损编码结果。

图6是根据示例性实施例的能量无损解码设备的框图。

图6中所示的能量无损解码设备600可包括模式确定器610、第一无损解码器630和第二无损解码器650。第二无损解码器650可包括高位比特解码器651和低位比特解码器653。这些组件可集成在至少一个模块中并且用至少一个处理器(未示出)实现。

参照图6,模式确定器610可对比特流进行解析,并从第一附加信息d0和第二附加信息d1确定能量数据和高位比特数据的无损编码模式。首先,检查第一附加信息d0,并且在第一无损编码模式的情况下,模式确定器610可将能量数据提供给第一无损解码器630,在第二无损编码模式的情况下,模式确定器610可将能量数据提供给第二无损解码器650。

第一无损解码器630可通过使用fpc来对从模式确定器610提供的能量数据进行无损解码。

在第二无损解码器650中,高位比特解码器651可通过检查第二附加信息d1来对从模式确定器610提供的能量数据的高位比特数据进行无损解码。低位比特解码器653可对从模式确定器610提供的能量数据的低位比特数据进行无损解码。

图7是根据示例性实施例的图6的第二无损解码器650的详细框图。

图7中所示的第二无损解码器700可包括高位比特解码器710和第二比特拆包单元730。高位比特解码器710可包括多个哈夫曼解码器(例如,第一至第三哈夫曼解码器711、713和715)以及第一比特拆包单元717。第一至第三哈夫曼解码器711、713和715以及第一比特拆包单元717可分别以与第一至第三哈夫曼编码器411、413和415以及第一比特打包单元417相同的方式实现。

参照图7,高位比特解码器710的第一至第三哈夫曼解码器711、713和715以及第一比特拆包单元717可根据第二附加信息d1来对从模式确定器610提供的能量数据的高位比特数据进行无损解码。例如,可通过下述方式来执行使用哈夫曼表的无损解码:当d1=00时,将高位比特数据提供给第一哈夫曼解码器711,当d1=01时,将高位比特数据提供给第二哈夫曼解码器713,当d1=10时,将高位比特数据提供给第三哈夫曼解码器715。当d1=11时,可通过将高位比特数据提供给第一比特拆包单元717来执行高位比特数据的比特拆包。

第二比特拆包单元719可接收能量数据的低位比特数据并且执行该低位比特数据的比特拆包。

图8是用于描述可被表示为有限范围(即,特定数量的比特)的能量量化系数的示图,其中,作为例子,n为6,n0为5,n1为1。参照图8,可用哈夫曼编码方法对5个高位比特进行编码,并且可用比特打包方法对1个低位比特进行编码。

图9是根据示例性实施例的包括编码模块930的多媒体装置的框图。

图9中所示的多媒体装置900可包括通信单元910和编码模块930。另外,根据作为编码结果而获得的音频比特流的使用,多媒体装置900还可包括用于存储该音频比特流的存储单元950。另外,多媒体装置900还可包括麦克风970。也就是说,存储单元950和麦克风970是可选的。另外,多媒体装置900还可包括任意的解码模块(未示出),例如,用于执行一般解码功能的解码模块或根据示例性实施例的解码模块。编码模块930可与多媒体装置900中所包括的其他组件(未示出)组合在一个实体中,并且被实现为至少一个处理器(未示出)。

参照图9,通信单元910可接收从外部提供的音频和编码的比特流中的至少一个,或者发送作为编码结果而获得的重构的音频和音频比特流中的至少一个。

通信单元910可被构造为经由下列网络将数据发送到外部多媒体装置并且从外部多媒体装置接收数据:无线网络,诸如无线互联网、无线内联网、无线电话网、无线局域网(wlan)、wi-fi、wi-fi直连(wfd)、第三代(3g)、第四代(4g)、蓝牙、红外线数据关联(irda)、射频标识(rfid)、超宽带(uwb)、zigbee;或近场通信(nfc);或有线网络,诸如有线电话网络或有线互联网。

根据示例性实施例,编码模块930可将通过通信单元910或麦克风970提供的时域中的音频信号变换为频域中的音频频谱,将从频域中的音频频谱获得的能量量化系数的无损编码模式确定为无限范围无损编码模式和有限范围无损编码模式之一,并根据无损编码模式确定的结果,在无限范围无损编码模式或有限范围无损编码模式下对能量量化系数进行编码。另外,当增量编码应用于无损编码模式确定时,根据当前帧中的所有频带的能量量化系数之间的差值是否被表示为预定数量的比特,可确定无限范围无损编码模式和有限范围无损编码模式之一。即使当前帧中的所有频带的能量量化系数之间的差值被表示为预定数量的比特,根据在无限范围无损编码模式和有限范围无损编码模式下对能量量化系数进行编码的结果,也可确定无限范围无损编码模式和有限范围无损编码模式之一。可产生指示对于能量量化系数确定的无损编码模式的附加信息。无限范围无损编码模式可通过fpc执行,有限范围无损编码模式可通过哈夫曼编码执行。另外,在有限范围无损编码模式下,可将能量量化系数划分为高位比特和低位比特,并且对该能量量化系数进行编码。使用多个哈夫曼表或者通过比特打包来对高位比特进行编码,并且可产生指示高位比特的编码模式的附加信息。通过比特打包来对低位比特进行编码。

存储单元950可存储由编码模块930产生的编码的比特流。另外,存储单元950可存储操作多媒体装置900所需的各种程序。

麦克风970可将用户或外部的音频信号提供给编码模块930。

图10是根据另一示例性实施例的包括解码模块的多媒体装置的框图。

图10中所示的多媒体装置1000可包括通信单元1010和解码模块1030。另外,根据作为解码结果而获得的重构的音频信号的使用,多媒体装置1000还可包括用于存储该重构的音频信号的存储单元1050。另外,多媒体装置1000还可包括扬声器1070。也就是说,存储单元1050和扬声器1070是可选的。另外,多媒体装置1000还可包括任意的编码模块(未示出),例如,用于执行一般编码功能的编码模块或者根据示例性实施例的编码模块。解码模块1030可与多媒体装置1000中所包括的其他组件(未示出)组合在一个实体中,并且被实现为至少一个处理器(未示出)。

参照图10,通信单元1010可接收从外部提供的编码的比特流和音频信号中的至少一个,或者可发送作为解码结果而获得的重构的音频和音频比特流中的至少一个。通信单元1010可被实现为基本上类似于图9的通信单元910。

根据本发明的实施例,解码模块1030可通过通信单元1010接收比特流,确定该比特流中所包括的能量量化系数的无损编码模式,并在与无损编码模式确定的结果相对应的无限范围无损解码模式或有限范围无损解码模式下对能量量化系数进行解码。无限范围无损解码模式可通过fpc执行,有限范围无损解码模式可通过哈夫曼解码执行。另外,在有限范围无损解码模式下,可将能量量化系数划分为高位比特和低位比特,并且对该能量量化系数进行解码,其中,使用多个哈夫曼表或者通过比特拆包来对高位比特进行解码,并且可通过比特拆包来对低位比特进行解码。

存储单元1050可存储由解码模块1030产生的恢复的音频信号。另外,存储单元1050可存储操作多媒体装置1000所需的各种程序。

扬声器1070可将由解码模块1030产生的重构的音频信号输出到外部。

图11是根据另一示例性实施例的包括编码模块和解码模块的多媒体装置的框图。

图11中所示的多媒体装置1100可包括通信单元1110、编码模块1120和解码模块1130。另外,根据作为编码结果或解码结果而获得的音频比特流或恢复的音频信号的使用,多媒体装置1100还可包括用于存储该音频比特流或重构的音频信号的存储单元1040。另外,多媒体装置1100还可包括麦克风1150或扬声器1160。编码模块1120或解码模块1130可与多媒体装置1100中所包括的其他组件(未示出)组合在一个实体中,并且被实现为至少一个处理器(未示出)。

因为图11中所示的组件与图9中所示的多媒体装置900的组件或者图10中所示的多媒体装置1000的组件相同,所以省略其详细描述。

多媒体装置900、1000和1100的每个还可包括语音通信专用终端(包括电话、移动电话等)、广播或音乐专用装置(包括tv、mp3播放器等)、或者语音通信专用终端和广播或音乐专用装置的复合终端装置,但不限于此。另外,多媒体装置900、1000和1100的每个可用作客户端、服务器、或者设置在客户端与服务器之间的转换装置。

当多媒体装置900、1000或1100例如为移动电话时,尽管未示出,但是移动电话还可包括诸如键盘的用户输入单元、用于显示被该移动电话处理的信息的用户界面或显示单元、以及用于控制移动电话的一般功能的处理器。另外,移动电话还可包括具有图像捕捉功能的照相机单元、以及用于执行移动电话所需的功能的至少一个组件。

当多媒体装置900、1000或1100例如为tv时,尽管未示出,但是tv还可包括诸如键盘的用户输入单元、用于显示所接收的广播信息的显示单元、以及用于控制tv的一般功能的处理器。另外,tv还可包括用于执行tv所需的功能的至少一个组件。

根据实施例的方法可被编写为计算机程序,并且可在使用计算机可读记录介质执行程序的通用数字计算机中实现。另外,在本发明的实施例中可使用的数据结构、程序指令或数据文件可以以各种方式记录在计算机可读记录介质中。计算机可读记录介质是可存储其后可被计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的示例包括:磁性记录介质,诸如硬盘、软盘和磁带;光学记录介质,诸如cd-rom和dvd;磁光介质,诸如软盘;以及被专门构造为存储并执行程序指令的硬件装置,诸如只读存储器(rom)、随机存取存储器(ram)和闪存。另外,计算机可读记录介质可以是用于传输指示程序指令、数据结构等的信号的传输介质。程序指令的示例可包括由编译器产生的机器语言代码、以及可被计算机使用解释器执行的高级语言代码。

尽管已经参照本发明构思的示例性实施例具体示出并描述了本发明构思,但是本领域的普通技术人员将理解,在不脱离由权利要求书限定的本发明构思的精神和范围的情况下,可以在这些示例性实施例中进行形式和细节上的各种改变。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1