音频信号的解码方法和解码器、介质以及编码方法与流程

文档序号:18457929发布日期:2019-08-17 01:46阅读:246来源:国知局
音频信号的解码方法和解码器、介质以及编码方法与流程

这里公开的本发明一般涉及音频编码和解码。特别地,它涉及适于执行音频信号的高频率重构的音频编码器和音频解码器。



背景技术:

音频编码系统使用用于音频编码的不同的方法,诸如纯波形编码、参数空间编码和包含频谱带复制(sbr)算法的高频率重构算法。mpeg-4标准将音频信号的sbr和波形编码进行组合。更准确地说,编码器可波形编码用于直到交叉频率的频谱带的音频信号,并且通过使用sbr编码来编码高于交叉频率的频谱带。音频信号的波形编码部分然后与在sbr编码中确定的sbr参数一起被传送到解码器。如在综述性论文brinker等人,anoverviewofthecodingstandardmpeg-4audioamendments1and2:he-aac,sscandhe-aacv2,eurasipjournalonaudio,speech,andmusicprocessing,2009卷,文章id468971中讨论的那样,基于音频信号的波形编码部分和sbr参数,解码器然后重构高于交叉频率的频谱带中的音频信号。

该方法的一个问题是,在输出中,会缺失强的声调成分,即强的谐波成分,或者通过sbr算法没有恰当地重构的高频谱带中的任何成分。

因而,sbr算法实现的是缺失谐波检测过程。通过sbr高频率重构不能适当地重建的声调成分在编码器侧被识别。这些强的声调成分的频率位置的信息被传送到解码器,在解码器处,用在解码器中产生的正弦曲线替代缺失声调成分所在的频谱带中的频谱内容。

sbr算法中提供的缺失谐波检测的优点在于,它是非常低位率的解决方案,原因是,通过或多少地简化,只有声调成分的频率位置及其振幅水平需要被传送到解码器。

sbr算法的缺失谐波检测的缺点在于,它是非常粗略的模型。另一缺点在于,当传送率低(即,当每秒可传送的位数低)并且因此频谱带宽时,将用正弦曲线替代大的频率范围。

sbr算法的另一缺点在于,它具有抹除在音频信号中出现的瞬态的趋势。一般地,在sbr重构的音频信号中将存在瞬态的前回声(pre-echo)和后回声(post-echo)。因此,需要继续改进。

附图说明

以下,参照附图更详细地描述示例性实施例,其中,

图1是根据示例性实施例的解码器的示意图;

图2是根据示例性实施例的解码器的示意图;

图3是根据示例性实施例的解码方法的流程图;

图4是根据示例性实施例的解码器的示意图;

图5是根据示例性实施例的编码器的示意图;

图6是根据示例性实施例的编码方法的流程图;

图7是根据示例性实施例的信令方案的示意图;以及

图8a~b是根据示例性实施例的交错级的示意图。

所有附图都是示意性的,并且,为了阐明本公开,一般仅示出必要的部分,而其它的部分可能被省略或仅仅被建议。除非另外指示,否则,类似的附图标记在不同的附图中指的是类似的部分。

具体实施方式

鉴于以上的情况,一个目的是提供能够改善高频率带中的声调成分和瞬态的重构的编码器和解码器及相关方法。

i.概要-解码器

这里,音频信号可以是纯音频信号、视听信号或多媒体信号的音频部分、或者元数据结合它们的任一个。

根据第一方面,示例性实施例提出用于解码的解码方法、解码装置和计算机程序产品。提出的方法、装置和计算机程序产品一般会具有相同的特征和优点。

根据示例性实施例,提供一种音频处理系统中的解码方法,该解码方法包括:接收具有直到第一交叉频率的频谱内容的第一波形编码信号;接收具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号;接收高频率重构参数;通过使用第一波形编码信号和高频率重构参数执行高频率重构,以产生具有高于第一交叉频率的频谱内容的频率扩展信号;以及交错频率扩展信号与第二波形编码信号。

这里,波形编码信号要被解释为通过波形的表示的直接量化被编码的信号;最优选,输入波形信号的频率变换的线的量化。这与信号由信号属性的一般性模型的变动表示的参数编码相对。

解码方法由此建议使用高于第一交叉频率的频率范围的子集中的波形编码数据并且使其与高频率重构信号交错。以这种方式,高于第一交叉频率的频率带中的信号的重要部分,诸如一般不能通过参数高频率重构算法很好地重构的瞬态或声调成分,可被波形编码。作为结果,高于第一交叉频率的频率带中的信号的这些重要部分的重构得到改善。

根据示例性实施例,高于第一交叉频率的频率范围的子集是稀疏的子集。例如,它可包含多个隔离的频率间隔。这是有利的,原因是,用于编码第二波形编码信号的位数低。并且,通过具有多个隔离的频率间隔,可通过第二波形编码信号很好地捕获音频信号的例如为单次谐波的声调成分。作为结果,以低的位代价实现高频率带的声调成分的重构的改善。

这里,缺失谐波或单次谐波意味着频谱的任何任意的强的声调部分。特别地,应当理解,缺失谐波或单次谐波不限于谐波系列的一个谐波。

根据示例性实施例,第二波形编码信号可代表要被重构的音频信号中的瞬态。瞬态一般限于短时间范围,诸如采样率为48khz的近百个时间采样,例如,5~10毫秒量级的时间范围,但可具有宽的频率范围。为了捕获瞬态,高于第一交叉频率的频率范围的子集可因此包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。这是有利的,原因是可以实现瞬态的改善的重构。

根据示例性实施例,第二交叉频率随时间改变。例如,第二交叉频率可在通过音频处理系统设定的时间帧内改变。以这种方式,可应对瞬态的短时间范围。

根据示例性实施例,执行高频率重构的步骤包括执行频谱带复制,即sbr。一般在诸如例如64个子带的伪正交镜像滤波器qmf域的频域中执行高频率重构。

根据示例性实施例,在诸如qmf域的频域中执行交错频率扩展信号与第二波形编码信号的步骤。一般地,为了便于实现并更好地控制这两个信号的时间和频率特性,在与高频率重构相同的频域中执行交错。

根据示例性实施例,通过使用相同的修改离散余弦变换mdct来编码接收的第一和第二波形编码信号。

根据示例性实施例,解码方法可包括根据高频率重构参数调整频率扩展信号的频谱内容,以调整频率扩展信号的频谱包络。

根据示例性实施例,交错可包含将第二波形编码信号加到频率扩展信号。如果第二波形编码信号代表声调成分,诸如当高于第一交叉频率的频率范围的子集包含多个隔离的频率间隔时,那么这是优选的选项。将第二波形编码信号加到频率扩展信号模仿sbr中已知的谐波的参数相加,并且允许使用sbr复制信号来通过适当程度的混入而避免大频率范围被单个声调成分替代。

根据示例性实施例,交错包含在与第二波形编码信号的频谱内容对应的高于第一交叉频率的频率范围的子集中用第二波形编码信号的频谱内容替代频率扩展信号的频谱内容。当第二波形编码信号代表瞬态时,例如,当高于第一交叉频率的频率范围的子集可因此包含在第一交叉频率与第二交叉频率之间延伸的频率间隔时,这是优选的选项。一般仅对于被第二波形编码信号覆盖的时间范围执行替代。以这种方式,可使得替代尽可能地少,同时仍足以替代存在于频率扩展信号中的瞬态和潜在时间抹除,并且,交错由此不限于由sbr包络时间网格规定的时间段。

根据示例性实施例,第一和第二波形编码信号可以是单独的信号,意味着它们被单独地编码。作为替代方案,第一波形编码信号和第二波形编码信号形成一个共同的联合编码信号的第一和第二信号部分。从实现的观点看,后面的这个替代方案更具吸引力。

根据示例性实施例,解码方法可包括接收包含涉及第二波形编码信号可用的一个或更多个时间范围和高于第一交叉频率的一个或更多个频率范围的数据的控制信号,其中,交错频率扩展信号与第二波形编码信号的步骤基于该控制信号。这是有利的,原因是它提供控制该交错的有效方式。

根据示例性实施例,控制信号包含指示第二波形编码信号可用于与频率扩展信号交错的高于第一交叉频率的一个或更多个频率范围的第二矢量和指示第二波形编码信号可用于与频率扩展信号交错的一个或更多个时间范围的第三矢量中的至少一个。这是方便的实现控制信号的方式。

根据示例性实施例,控制信号包含指示基于高频率重构参数在参数上被重构的高于第一交叉频率的一个或更多个频率范围的第一矢量。以这种方式,对于某个频率带,频率扩展信号可优先于第二波形编码信号。

根据示例性实施例,还提供一种计算机程序产品,包括具有用于执行第一方面的任何解码方法的指令的计算机可读介质。

根据示例性实施例,还提供一种用于音频处理系统的解码器,该解码器包括:被配置为接收具有直到第一交叉频率的频谱内容的第一波形编码信号、具有与高于第一交叉频率的频率范围的子集对应的频谱内容的第二波形编码信号、以及高频率重构参数的接收级;被配置为从接收级接收第一波形编码信号和高频率重构参数并且通过使用第一波形编码信号和高频率重构参数执行高频率重构以产生具有高于第一交叉频率的频谱内容的频率扩展信号的高频率重构级;以及被配置为从高频率重构级接收频率扩展信号并且从接收级接收第二波形编码信号并且交错频率扩展信号与第二波形编码信号的交错级。

根据示例性实施例,解码器可被配置为执行这里公开的任何解码方法。

ii.概要-编码器

根据第二方面,示例性实施例提出用于编码的编码方法、编码装置和计算机程序产品。提出的方法、装置和计算机程序产品一般会具有相同的特征和优点。

对于用于编码器的对应的特征和设置,在以上的解码器的概要中给出的关于特征和设置的优点一般会是有效的。

根据示例性实施例,提供一种音频处理系统中的编码方法,该编码方法包括以下的步骤:接收要被编码的音频信号;基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数;基于接收的音频信号识别高于第一交叉频率的频率范围的子集,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与音频信号的高频率重构交错;通过对于直到第一交叉频率的频谱带波形编码接收的音频信号而产生第一波形编码信号;以及,通过对于与高于第一交叉频率的频率范围的所识别子集对应的频谱带波形编码接收的音频信号而产生第二波形编码信号。

根据示例性实施例,高于第一交叉频率的频率范围的子集可包含多个隔离的频率间隔。

根据示例性实施例,高于第一交叉频率的频率范围的子集可包含在第一交叉频率与第二交叉频率之间延伸的频率间隔。

根据示例性实施例,第二交叉频率可随时间改变。

根据示例性实施例,通过使用频谱带复制(即sbr)编码来计算高频率重构参数。

根据示例性实施例,编码方法还可包括调整包含于高频率重构参数中的频谱包络水平,以补偿解码器中的接收的音频信号的高频率重构与第二波形编码信号的相加。由于在解码器中将第二波形编码信号加到高频率重构信号,因此,组合信号的频谱包络水平与高频率重构信号的频谱包络水平不同。可在编码器中应对频谱包络水平的这种变化,使得解码器中的组合信号得到目标频谱包络。通过在编码器侧执行该调整,可以减少在解码器侧需要的工作,或者换句话说,通过从编码器到解码器的特定的信令,使得不需要在解码器中限定如何应对该情况的特定规则。这允许通过在将来优化编码器而在将来优化系统,而不必更新潜在地广泛部署的解码器。

根据示例性实施例,调整高频率重构参数的步骤可包含:测量第二波形编码信号的能量;以及通过从与第二波形编码信号的频谱内容对应的频谱带的频谱包络水平减去测量的第二波形编码信号的能量调整频谱包络水平,这是为了控制高频率重构信号的频谱包络。

根据示例性实施例,还提供一种包括具有用于执行第二方面的任何编码方法的指令的计算机可读介质的计算机程序产品。

根据示例性实施例,提供一种用于音频处理系统的编码器,该编码器包括:被配置为接收要被编码的音频信号的接收级;被配置为从接收级接收音频信号并且基于接收的音频信号计算使得能够实现高于第一交叉频率的接收的音频信号的高频率重构的高频率重构参数的高频率编码级;被配置为基于接收的音频信号识别高于第一交叉频率的频率范围的子集的交错编码检测级,对于该子集,接收的音频信号的频谱内容要被波形编码并且随后在解码器中与音频信号的高频率重构交错;被配置为从接收级接收音频信号并且通过对于直到第一交叉频率的频谱带波形编码接收的音频信号而产生第一波形编码信号并且从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集并通过对于与接收的频率范围的所识别子集对应的频谱带波形编码接收的音频信号而产生第二波形编码信号的波形编码级。

根据示例性实施例,编码器还可包括:被配置为从高频率编码级接收高频率重构参数并从交错编码检测级接收高于第一交叉频率的频率范围的所识别子集,并且基于接收的数据调整高频率重构参数以补偿随后的在解码器中的接收的音频信号的高频率重构与第二波形编码信号的交错的包络调整级。

根据示例性实施例,编码器可被配置为被执行这里公开的任何编码方法。

iii.示例性实施例-解码器

图1示出解码器100的示例性实施例。解码器包括接收级110、高频率重构级120、以及交错级130。

现在参照示出解码器200的图2的示例性实施例和图3的流程图更详细地解释解码器100的操作。解码器200的目的是,在要被重构的音频信号的高频率带中存在强的声调成分的情况下,对于高频率给予改善的信号重构。接收级110在步骤d02中接收第一波形编码信号201。第一波形编码信号201具有直到第一交叉频率fc的频谱内容,即,第一波形编码信号201是限制为低于第一交叉频率fc的频率范围的低带信号。

接收级110在步骤d04中接收第二波形编码信号202。第二波形编码信号202具有与高于第一交叉频率fc的频率范围的子集对应的频谱内容。在图2的示出例子中,第二波形编码信号202具有与多个隔离的频率间隔202a和202b对应的频谱内容。第二波形编码信号202可由此被视为由多个带限信号构成,每个带限信号与隔离的频率间隔202a和202b中的一个对应。在图2中,仅示出两个频率间隔202a和202b。一般地,第二波形编码信号的频谱内容可与宽度变化的任意数量的频率间隔对应。

接收级110可接收作为两个单独的信号的第一和第二波形编码信号201和202。作为替代方案,第一和第二波形编码信号201和202可形成由接收级110接收的一个共同信号的第一和第二信号部分。换句话说,可例如通过使用相同的mdct变换联合编码第一和第二波形编码信号。

一般地,通过使用诸如mdct变换的重叠窗口变换编码由接收级110接收的第一波形编码信号201和第二波形编码信号202。接收级可包含被配置为将第一和第二波形编码信号201和202变换到时域的波形解码级240。波形解码级240一般包含被配置为执行第一和第二波形编码信号201和202的逆mdct变换的mdct滤波器组。

接收级110进一步在步骤d06中接收由在后面公开的高频率重构级120使用的高频率重构参数。

第一波形编码信号201和由接收级110接收的高频率参数然后被输入到高频率重构级120。高频率重构级120一般在频域中,优选地在qmf域中对信号进行操作。在输入到高频率重构级120之前,第一波形编码信号201因此优选地通过qmf分析级250被变换到频域,优选地,qmf域。qmf分析级250一般包含被配置为执行第一波形编码信号201的qmf变换的qmf滤波器组。

基于第一波形编码信号201和高频率重构参数,高频率重构级120在步骤d08中将第一波形编码信号201扩展到高于第一交叉频率fc的频率。具体而言,高频率重构级120产生具有高于第一交叉频率fc的频谱内容的频率扩展信号203。由此,频率扩展信号203是高带信号。

高频率重构级120可根据用于执行高频率重构的任何已知的算法操作。特别地,如在综述性论文brinker等人,anoverviewofthecodingstandardmpeg-4audioamendments1and2:he-aac,sscandhe-aacv2,eurasipjournalonaudio,speech,andmusicprocessing,2009卷,文章id468971中公开的那样,高频率重构级120可被配置为执行sbr。这样,高频率重构级可包含被配置为在数个步骤中产生频率扩展信号203的数个子级。例如,高频率重构级120可包含高频率产生级221、参数高频率成分添加级222和包络调整级223。

简言之,为了产生频率扩展信号203,高频率产生级221在第一子步骤d08a中将第一波形编码信号201扩展到高于第一交叉频率fc的频率范围。通过选择第一波形编码信号201的子带部分,并且根据由高频率重构参数引导的特定规则,将第一波形编码信号201的所选子带部分映照或复制到高于第一交叉频率fc的频率范围的所选子带部分来执行该产生。

高频率重构参数还可包括用于向频率扩展信号203添加缺失谐波的缺失谐波参数。如上面讨论的那样,缺失谐波应当被解释为频谱的任何任意的强声调部分。例如,缺失谐波参数可包含与缺失谐波的频率和振幅有关的参数。基于缺失谐波参数,参数高频率成分添加级222在子步骤d08b中产生正弦曲线成分并且将正弦曲线成分加到频率扩展信号203。

高频率重构参数还可包括描述频率扩展信号203的目标能级的频谱包络参数。基于频谱包络参数,包络调整级223可在子步骤d08c中调整频率扩展信号203的频谱内容,即频率扩展信号203的频谱系数,使得频率扩展信号203的能级与由频谱包络参数描述的目标能级对应。

来自高频率重构级120的频率扩展信号203和来自接收级110的第二波形编码信号然后被输入到交错级130。交错级130一般在与高频率重构级120相同的频域、优选地qmf域中操作。因此,第二波形编码信号202一般通过qmf分析级250被输入到交错级。此外,第二波形编码信号202一般通过延迟级260被延迟,以补偿高频率重构级120执行高频率重构所花费的时间。以这种方式,第二波形编码信号202和频率扩展信号203将被对准,使得交错级130对与相同的时间帧对应的信号进行操作。

然后,为了产生交错信号204,交错级130在步骤d10中交错,即组合第二波形编码信号202与频率扩展信号203。可以使用不同的方法来交错第二波形编码信号202与频率扩展信号203。

根据一个示例性实施例,交错级130通过将频率扩展信号203和第二波形编码信号202相加来交错频率扩展信号203与第二波形编码信号202。第二波形编码信号202的频谱内容在与第二波形编码信号202的频谱内容对应的频率范围的子集中与频率扩展信号203的频谱内容重叠。通过使频率扩展信号203和第二波形编码信号202相加,交错信号204由此对于重叠频率包含频率扩展信号203的频谱内容以及第二波形编码信号202的频谱内容。作为相加的结果,交错信号204的频谱包络水平对于重叠频率增大。优选地,并且,如后面公开的那样,当确定包含于高频率重构参数中的能量包络水平时,在编码器侧应对由于相加导致的频谱包络水平的增大。例如,用于重叠频率的频谱包络水平可在编码器侧减小与由于解码器侧的交错导致的频谱包络水平的增大对应的量。

作为替代方案,可在解码器侧应对由于相加导致的频谱包络水平的增大。例如,可以有能量测量级,其测量第二波形编码信号202的能量、比较测量的能量与由频谱包络参数描述的目标能级、并且调整扩展频率信号203使得交错信号204的频谱包络水平等于目标能级。

根据另一示例性实施例,交错级130通过对于频率扩展信号203和第二波形编码信号202重叠的那些频率,用第二波形编码信号202的频谱内容替代频率扩展信号203的频谱内容,来交错频率扩展信号203与第二波形编码信号202。在频率扩展信号203被第二波形编码信号202替代的示例性实施例中,不必调整频谱包络水平以补偿频率扩展信号203与第二波形编码信号202的交错。

高频率重构级120优选地以等于用于编码第一波形编码信号201的底层芯部编码器的采样率的采样率操作。以这种方式,可以使用与用于编码第一波形编码信号201的重叠窗口变换相同的重叠窗口变换,诸如相同的mdct,来编码第二波形编码信号202。

交错级130可进一步被配置为优选地通过波形解码级240、qmf分析级250和延迟级260从接收级接收第一波形编码信号201,并且,为了产生具有低于以及高于第一交叉频率的频率的频谱内容的组合信号205,组合交错信号204与第一波形编码信号201。

来自交错级130的输出信号即交错信号204或组合信号205可随后通过qmf合成级270变换回时域。

优选地,qmf分析级250和qmf合成级270具有相同数量的子带,意味着输入到qmf分析级250的信号的采样率等于从qmf合成级270输出的信号的采样率。因此,用于波形编码第一和第二波形编码信号的波形编码器(使用mdct)可以与输出信号相同的采样率操作。因此,通过使用相同的mdct变换,可有效地并且在结构上容易地编码第一和第二波形编码信号。这与波形编码器的采样率一般限于输出信号的采样率的一半的现有技术不同,并且,随后的高频率重构模块完成上采样以及高频率重构。这限制波形编码覆盖整个输出频率范围的频率的能力。

图4示出解码器400的示例性实施例。解码器400要在要被重构的输入音频信号中存在瞬态的情况下对高频率给出改善的信号重构。图4的例子与图2的例子之间的主要不同是第二波形编码信号的频谱内容和持续时间的形式。

图4示出解码器400在时间帧的多个随后时间部分中的操作;这里,示出三个随后的时间部分。一个时间帧例如可与2048个时间采样对应。具体而言,在第一时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401a。在第一时间部分期间不接收第二波形编码信号。

在第二时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401b和具有与高于第一交叉频率fc1的频率范围的子集对应的频谱内容的第二波形编码信号402b。在图4的示出例子中,第二波形编码信号402b具有与在第一交叉频率fc1与第二交叉频率fc2之间延伸的频率间隔对应的频谱内容。第二波形编码信号402b由此是限于第一交叉频率fc1与第二交叉频率fc2之间的频率带的带限信号。

在第三时间部分期间,接收级110接收具有直到第一交叉频率fc1的频谱内容的第一波形编码信号401c。对第三时间部分,不接收第二波形编码信号。

对于示出的第一和第三时间部分,不存在第二波形编码信号。对于这些时间部分,解码器将根据诸如常规的sbr解码器的被配置为执行高频率重构的常规的解码器操作。高频率重构级120将分别基于第一波形编码401a和401c产生频率扩展信号403a和403c。但是,由于不存在第二波形编码信号,因此,交错级130不实施交错。

对于示出的第二时间部分,存在第二波形编码信号402b。对于第二时间部分,解码器400将以关于图2描述的相同方式操作。特别地,高频率重构级120基于第一波形编码信号和高频率重构参数执行高频率重构,以产生频率扩展信号403b。频率扩展信号403b然后被输入到交错级130,在那里,它与第二波形编码信号402b交错成交错信号404b。如关于图2的示例性实施例讨论的那样,可通过使用相加或替代方法执行交错。

在以上的例子中,对于第一和第三时间部分没有第二波形编码信号。对于这些时间部分,第二交叉频率等于第一交叉频率,并且不执行交错。对于第二时间帧,第二交叉频率比第一交叉频率大,并且,执行交错。一般地,第二交叉频率可由此随时间改变。特别地,第二交叉频率可在时间帧内改变。当第二交叉频率大于第一交叉频率且小于由解码器代表的最大频率时,将实施交错。第二交叉频率等于该最大频率的情况与纯波形编码对应,并且,不需要高频率重构。

应当注意,关于图2和图4描述的实施例可被组合。图7示出关于频域、优选地qmf域所定义的时间频率矩阵700,其中,通过交错级130执行交错。示出的时间频率矩阵700与要被解码的音频信号的一个帧对应。示出的矩阵700分成从第一交叉频率fc1开始的16个时隙和多个频率子带。并且,示出覆盖低于第八时隙的时间范围的第一时间范围t1、覆盖第八时隙的第二时间范围t2和覆盖高于第八时隙的时隙的时间范围t3。作为sbr数据的一部分的不同的频谱包络可与不同的时间范围t1~t3相关。

在本例子中,频率带710和720中的两个强声调成分在编码器侧的音频信号中被识别。频率带710和720可具有与例如sbr包络带相同的带宽,即,相同的频率分辨率被用于代表频谱包络。频率带710和720中的这些声调成分具有与整个时间帧对应的时间范围,即,声调成分的时间范围包含时间范围t1~t3。在编码器侧,决定在第一时间范围t1中波形编码710和720的声调成分,这由第一时间范围t1中的虚线表示的声调成分710a和720示出。并且,在编码器侧决定,在第二和第三时间范围t2和t3中,要通过如关于图2的参数高频率成分添加级222解释的那样包含正弦曲线而在解码器中在参数上重构第一声调成分710。这由(第二时间范围t2)和第三时间范围t3中的第一声调成分710b的方形图案表示。在第二和第三时间范围t2和t3中,第二声调成分720仍被波形编码。并且,在本实施例中,第一和第二声调成分要通过添加来与高频率重构音频信号交错,因此,编码器已相应调整传送的频谱包络、sbr包络。

另外,瞬态730已在编码器侧在音频信号中被识别。瞬态730具有与第二时间范围t2对应的持续时间,并且,与第一交叉频率fc1与第二交叉频率fc2之间的频率间隔对应。在编码器侧已经决定了波形编码与瞬态的位置对应的音频信号的时间频率部分。在本实施例中,通过替代来完成波形编码瞬态的交错。信令方案被设置以向解码器信令该信息。信令方案包含与第二波形编码信号在哪个/些时间范围中和/或在高于第一交叉频率fc1的哪个/些频率范围中可用有关的信息。信令方案也可与涉及如何执行交错即交错是通过添加还是替代方式的规则相关。信令方案也可与后面解释的限定添加或替代不同的信号的优先级顺序的规则相关。

信令方案包含标为“另外的正弦曲线”的第一矢量740,对于各频率子带指示是否应在参数上添加正弦曲线。在图7中,对于第一矢量740的相应的子带,第二和第三时间范围t2和t3中的第一声调成分710b的添加由“1”表示。包含第一矢量740的信令在现有技术中是已知的。对于什么时候允许开始正弦曲线,在现有技术的解码器中定义了规则。该规则是,如果检测到新的正弦曲线,即,第一矢量740的“另外的正弦曲线”信令从一个帧中的0变为下一帧中的1,那么对于特定的子带,在该帧开始时开始正弦曲线,除非在帧中存在瞬态事件,对于帧中存在瞬态事件的情况,正弦曲线在瞬态处开始。在示出的例子中,在帧中存在瞬态事件730,这就解释了为什么对于频率带710的采用正弦曲线方式的参数重构在瞬态事件730之后才开始。

信令方案还包括标为“波形编码”的第二矢量750。第二矢量750对各频率子带指示波形编码信号是否可用于与音频信号的高频率重构交错。在图7中,对第二矢量750的相应子带,第一和第二声调成分710和720的波形编码信号的可用性由“1”表示。在本例子中,第二矢量750中的波形编码数据的可用性表示也指示要通过添加来执行交错。但是,在其它的实施例中,第二矢量750中的波形编码数据的可用性表示也可指示要通过替代来执行交错。

信令方案还包括标为“波形编码”的第三矢量760。第三矢量760对各时隙指示波形编码信号是否可用于与音频信号的高频率重构交错。在图7中,对于第三矢量760的相应的时隙,瞬态730的波形编码信号的可用性由“1”表示。在本例子中,第三矢量760中的波形编码数据的可用性表示也指示要通过替代执行交错。但是,在其它的实施例中,第三矢量760中的波形编码数据的可用性表示也可指示要通过添加执行交错。

存在如何体现第一、第二和第三矢量740、750、760的许多替代方案。在一些实施例中,矢量740、750、760是使用逻辑0或逻辑1来提供它们的指示的二进制矢量。在其它的实施例中,矢量740、750、760可采取不同的形式。例如,矢量中的诸如“0”的第一值可表示没有波形编码数据可用于特定的频率带或时隙。矢量中的诸如“1”的第二值可表示要对特定的频率带或时隙通过添加执行交错。矢量中的诸如“2”的第三值可表示要对特定的频率带或时隙通过替代执行交错。

以上的示例性信令方案也可与可在冲突的情况下应用的优先级顺序相关。作为例子,代表替代方式的瞬态的交错的第三矢量760可优先于第一和第二矢量740和750。此外,第一矢量740可优先于第二矢量750。应当理解,可定义矢量740、750和760之间的任何优先级顺序。

图8a更详细地示出图1的交错级130。交错级130可包含信令解码部件1301、决策逻辑部件1302和交错部件1303。如上面讨论的那样,交错级130接收第二波形编码信号802和频率扩展信号803。交错级130还可接收控制信号805。信令解码部件1301将控制信号805解码成与参照图7描述的信令方案的第一矢量740、第二矢量750和第三矢量760对应的三个部分。它们被发送到决策逻辑部件1302,该决策逻辑部件1302基于逻辑创建用于qmf帧的时间/频率矩阵870,指示对哪个时间/频率片段要使用第二波形编码信号802和频率扩展信号803中的哪一个。时间/频率矩阵870被发送到交错部件1303并且在交错第二波形编码信号802与频率扩展信号803时被使用。

在图8b中更详细地示出决策逻辑部件1302。决策逻辑部件1302可包含时间/频率矩阵产生部件13021和优先次序排列部件13022。时间/频率产生部件13021产生具有与当前的qmf帧对应的时间/频率片段的时间/频率矩阵870。时间/频率产生部件13021将来自第一矢量740、第二矢量750和第三矢量760的信息包含于时间/频率矩阵中。例如,如图7所示,如果对于某个频率在第二矢量750中存在“1”(或者,更一般地,为与零不同的任何数值),那么在时间/频率矩阵870中,与该频率对应的时间/频率片段被设定为“1”(或者,更一般地,被设定为存在于矢量750中的数值),表示要对这些时间/频率片段执行与第二波形编码信号802的交错。类似地,如果对于某个时隙在第三矢量760中存在“1”(或者,更一般地,为与零不同的任何数值),那么在时间/频率矩阵870中,与该时隙对应的时间/频率片段被设定为“1”(或者,更一般地,被设定为与零不同的任何数值),表示要对这些时间/频率片段执行与第二波形编码信号802的交错。类似地,如果对于某个频率在第一矢量740中存在“1”,那么在时间/频率矩阵870中,与该频率对应的时间/频率片段被设定为“1”,表示输出信号804要基于已例如通过包含正弦曲线信号在参数上重构该频率的频率扩展信号803。

对于一些时间/频率片段,在来自第一矢量740、第二矢量750和第三矢量760的信息之间存在冲突,意味着对于时间/频率矩阵870的相同的时间/频率片段,在矢量740~760中多于一个的矢量表示与零不同的数值,诸如“1”。在这种情况下,为了消除时间/频率矩阵870中的冲突,优先次序排列部件13022需要决定如何排列来自矢量的信息的优先级。更准确地说,优先次序排列部件13022决定输出信号804是基于频率扩展信号803(由此给予第一矢量740优先)、是通过频率方向的第二波形编码信号802的交错(由此给予第二矢量750优先)还是通过时间方向的第二波形编码信号802的交错(由此给予第三矢量760优先)。

出于这种目的,优先次序排列部件13022包含与矢量740~760的优先级顺序有关的预定规则。优先次序排列部件13022还可包含与如何执行交错,即,是通过添加还是通过替代执行交错有关的预定规则。

优选地,这些规则如下:

■时间方向的交错,即由第三矢量760限定的交错被赋予最高优先级。优选地,通过在由第三矢量760限定的那些时间/频率片段中替代频率扩展信号803执行时间方向的交错。第三矢量760的时间分辨率与qmf帧的时隙对应。如果qmf帧与2048个时域采样对应,那么时隙一般可与128个时域采样对应。

■频率的参数重构,即由第一矢量740限定的使用频率扩展信号803被赋予第二高优先级。第一矢量740的频率分辨率是诸如sbr包络带的qmf帧的频率分辨率。与第一矢量740的信令和解释有关的现有技术规则保持有效。

■频率方向的交错,即由第二矢量750限定的交错被赋予最低优先级。通过在由第二矢量750限定的那些时间/频率片段中添加频率扩展信号803执行频率方向的交错。第二矢量750的频率分辨率与诸如sbr包络带的qmf帧的频率分辨率对应。

iii.示例性实施例-编码器

图5示出适用于音频处理系统中的编码器500的示例性实施例。编码器500包括接收级510、波形编码级520、高频率编码级530、交错编码检测级540和传送级550。高频率编码级530可包含高频率重构参数计算级530a和高频率重构参数调整级530b。

以下参照图5和图6的流程图描述编码器500的操作。在步骤e02中,接收级510接收要被编码的音频信号。

接收的音频信号被输入到高频率编码级530。基于接收的音频信号,高频率编码级530,特别是高频率重构参数计算级530a,在步骤e04中计算使得能够实现高于第一交叉频率fc的接收音频信号的高频率重构的高频率重构参数。高频率重构参数计算级530a可使用用于计算高频率重构参数的任何已知技术,诸如sbr编码。高频率编码级530一般在qmf域中操作。因此,在计算高频率重构参数之前,高频率编码级530可执行接收的音频信号的qmf分析。作为结果,关于qmf域限定高频率重构参数。

计算的高频率重构参数可包含与高频率重构有关的数个参数。例如,高频率重构参数可包含与如何将来自低于第一交叉频率fc的频率范围的子带部分的音频信号映照或复制到高于第一交叉频率fc的频率范围的子带部分有关的参数。这种参数有时被称为描述补片(patching)结构的参数。

高频率重构参数还可包含描述高于第一交叉频率的频率范围的子带部分的目标能级的频谱包络参数。

高频率重构参数还可包含指示谐波的缺失谐波参数或者如果通过使用描述补片结构的参数在高于第一交叉频率的频率范围中重构音频信号则将缺失的强声调成分。

交错编码检测级540然后在步骤e06中识别接收音频信号的频谱内容要被波形编码的高于第一交叉频率fc的频率范围的子集。换句话说,交错编码检测级540的作用是识别高于第一交叉频率的频率(对于这些频率,高频率重构无法得到希望的结果)。

交错编码检测级540可采取不同的方法以识别高于第一交叉频率fc的频率范围的相关子集。例如,交错编码检测级540可识别通过高频率重构不能很好地重构的强声调成分。强声调成分的识别可基于接收的音频信号,例如通过根据频率确定音频信号的能量并将具有高能量的频率识别为包含强声调成分。此外,识别可基于如何在解码器重构接收的音频信号的知识。特别地,这种识别可基于作为接收音频信号的声调量度(measure)与高于第一交叉频率的频率带的接收音频信号的重构的声调量度的比的声调配额。高的声调配额表示音频信号将对于与声调配额对应的频率不能很好地重构。

交错编码检测级540还可检测通过高频率重构不能很好地重构的接收音频信号中的瞬态。这种识别可以是接收音频信号的时间频率分析的结果。例如,可从接收音频信号的频谱图检测出现瞬态的时间频率间隔。这种时间频率间隔一般具有比接收音频信号的时间帧短的时间范围。相应的频率范围一般与扩展到第二交叉频率的频率间隔对应。高于第一交叉频率的频率范围的子集可因此通过交错编码检测级540被识别为从第一交叉频率扩展到第二交叉频率的间隔。

交错编码检测级540还可从高频率重构参数计算级530a接收高频率重构参数。基于来自高频率重构参数的缺失谐波参数,交错编码检测级540可识别缺失谐波的频率并且决定在高于第一交叉频率fc的频率范围的所识别子集中包含缺失谐波的频率中的至少一些。如果在不能在参数模型的限度内正确地建模的音频信号中存在强声调成分,那么这种方法可能是有利的。

接收音频信号也被输入到波形编码级520。波形编码级520在步骤e08中执行接收音频信号的波形编码。特别地,波形编码级520通过波形编码直到第一交叉频率fc的频率带的音频信号产生第一波形编码信号。并且,波形编码级520从交错编码检测级540接收所识别子集。波形编码级520然后通过对与高于第一交叉频率的频率范围的所识别子集对应的频谱带波形编码接收音频信号产生第二波形编码信号。第二波形编码信号将由此具有与高于第一交叉频率fc的频率范围的所识别子集对应的频谱内容。

根据示例性实施例,波形编码级520可通过首先对所有频谱带波形编码接收音频信号产生第一和第二波形编码信号,然后对与高于第一交叉频率fc的频率的所识别子集对应的频率去除这样波形编码的信号的频谱内容。

波形编码级例如可通过使用诸如mdct滤波器组的重叠窗口变换滤波器组执行波形编码。这种重叠窗口变换滤波器组使用具有某个时间长度的窗口,使得一个时间帧中的变换信号的值受到前后时间帧中的信号的值的影响。为了减少这种影响,执行一定量的时间过编码可能是有利的,意味着波形编码级520不仅波形编码接收音频信号的当前时间帧,而且波形编码接收音频信号的前后时间帧。类似地,高频率编码级530也可不仅编码接收音频信号的当前时间帧,而且编码接收音频信号的前后时间帧。以这种方式,可在qmf域中改善第二波形编码信号与音频信号的高频率重构之间的交叉衰退。并且,这减少对频谱包络数据边界的调整的需要。

应当注意,第一和第二波形编码信号也可以是单独的信号。但是,优选地,它们形成一个共同信号的第一和第二波形编码信号部分。如果是这样,那么可通过对接收音频信号执行单个波形编码操作,诸如向接收音频信号应用单个mdct变换,来产生它们。

高频率编码级530,特别是高频率重构参数调整级530b,也可接收高于第一交叉频率fc的频率范围的所识别子集。基于接收数据,高频率重构参数调整级530b可在步骤e10中调整高频率重构参数。特别地,高频率重构参数调整级530b可调整与包含于所识别子集中的频谱带对应的高频率重构参数。

例如,高频率重构参数调整级530b可调整描述高于第一交叉频率的频率范围的子带部分的目标能级的频谱包络参数。如果要对解码器中音频信号的高频率重构添加第二波形编码信号,那么这是特别有关系的,原因是,这样,第二波形编码信号的能量将被添加到高频率重构的能量。为了补偿这种添加,高频率重构参数调整级530b可通过对与高于第一交叉频率fc的频率范围的所识别子集对应的频谱带从目标能级减去第二波形编码信号的测量能量来调整能量包络参数。以这种方式,当在解码器中添加第二波形编码信号和高频率重构时,总信号能量被保留。可例如通过交错编码检测级540测量第二波形编码信号的能量。

高频率重构参数调整级530b也可调整缺失谐波参数。更具体而言,如果包含由缺失谐波参数表示的缺失谐波的子带是高于第一交叉频率fc的频率范围的所识别子集的一部分,那么将通过波形编码级520波形编码该子带。因此,高频率重构参数调整级530b可从缺失谐波参数去除这种缺失谐波,原因是这种缺失谐波不需要在解码器侧被参数重构。

传送级550然后接收来自波形编码级520的第一和第二波形编码信号以及来自高频率编码级530的高频率重构参数。传送级550将接收的数据格式化为用于传送到解码器的位流。

交错编码检测级540还可将信息信令到传送级550中以使其包含于位流中。特别地,交错编码检测级540可信令如何用音频信号的高频率重构交错第二波形编码信号(诸如是通过信号的添加还是通过用信号中的一个代替另一个来执行交错),以及应针对什么频率范围和什么时间间隔来交错波形编码信号。例如,可通过使用参照图7讨论的信令方案实施信令。

等同物、扩展、替代和混杂

在研究以上的描述之后,本领域技术人员能够想到本公开的其它实施例。尽管本说明书和附图公开了实施例和例子,但本公开不限于这些特定的例子。在不背离由所附的权利要求限定的本公开的范围的情况下,可以提出大量的修改和变化。在权利要求中出现的任何附图标记不应被理解为限制它们的范围。

另外,通过研究附图、本公开和所附的权利要求,实践本公开的本领域技术人员可以理解和实施公开的实施例的变更例。在权利要求中,词语“包括”不排除其它的要素或步骤,并且,不定冠词“一个”或“一种”不排除多个。在多个不同的从属权利要求中仅仅记载某些措施不表示这些措施的组合不能被充分利用。

以上公开的系统和方法可实为软件、固件、硬件或它们的组合。在硬件实现中,在以上的描述中提到的功能单元之间的任务的划分未必与多个单元的划分对应;相反,一个物理部件可具有多个功能,一个任务可通过协作的几个物理部件实施。某些部件或所有部件可实现为由数字信号处理器或微处理器执行的软件,或者实现为硬件或专用集成电路。这种软件可分布于可包含计算机存储介质(或非暂态介质)或通信介质(或暂态介质)的计算机可读介质上。本领域技术人员公知的是,术语计算机存储介质包括在任何方法或技术中实现的易失性和非易失性、可去除和不可去除介质,这些介质用于存储诸如计算机可读指令、数据结构、程序模块或其它数据的信息。计算机存储介质包括但不限于ram、rom、eeprom、快擦写存储器或其它存储器技术、cd-rom、数字万用盘(dvd)或其它光盘存储器、磁盒、磁带、磁盘存储器或其它磁存储装置或可用于存储希望的信息并且可通过计算机访问的任何其它介质。并且,本领域技术人员公知的是,通信介质一般在诸如载波或其它传输机制的调制数据信号中体现计算机可读指令、数据结构、程序模块或其它数据,并且包含任何信息传输介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1