产生错误隐藏信号的装置、方法和计算机可读介质与流程

文档序号:21354186发布日期:2020-07-04 04:20阅读:126来源:国知局
产生错误隐藏信号的装置、方法和计算机可读介质与流程

本申请是申请人为弗朗霍夫应用科学研究促进协会、申请日为2015年3月4日、申请号为201580014728.2、发明名称为“产生错误隐藏信号的装置、方法和计算机可读介质”的分案申请。

本发明涉及音频编码,尤其涉及基于码本上下文的类lpc处理的音频编码。



背景技术:

为了模拟人类的声道且为了减少冗余量,感知音频编码器常常使用线性预测编码(lpc),其可由lpc参数建模。通过lpc滤波器对输入信号进行滤波而获得的lpc残差,还通过由一个、两个或多个码本(例如:自适应码本、声门脉冲码本、创新性码本、转换码本、由预测和变换部分组成的混合码本)进行表示而被进一步地建模和传输。

在帧丢失的情况下,语音/音频数据的片段(通常10ms或20ms)丢失。为了尽可能地听不出这种丢失,应用各种隐藏技术。这些技术通常包括过去接收的数据的外插。此数据可以是:码本的增益,码本向量,用于建模码本的参数和lpc系数。在现有技术水平已知的所有隐藏技术中,用于信号合成的lpc系数的集合,被重复(基于最后的好集合)或者被外/内插。

itug.718[1]:在隐藏的过程中,外插lpc参数(在isf域中表示)。该外插由两个步骤组成。第一,计算长期目标isf向量。该长期目标isf向量是以下的加权均值(具有固定加权因子beta):

·表示最后三个已知的isf向量的平均的isf向量,以及

·表示长期平均频谱形状的离线训练isf向量。

然后,使用时变因子alpha,,每帧每次以最后正确地接收的isf向量内插此长期目标isf向量,以允许从最后接收的isf向量到长期目标isf向量的交叉衰落。为了产生中间步(每20ms,isf被传输一次,每5ms,内插产生lpc的集合),产生的isf向量随后被转换回lpc域。然后,通过滤波在加法之前以相应的码本增益而放大的自适应和固定码本的总和的结果,使用lpc以合成输出信号。在隐藏的过程中,固定码本包括噪声。在连续的帧丢失的情况下,在不增加固定码本的情况下,反馈自适应码本。可选地,可以反馈和信号,如在arm-wb[5]中所做。

在[2]中,描述使用两个lpc系数的集合的隐藏方案。基于接收的最后好帧得到一个lpc系数的集合,基于接收的第一好帧得到另一个lpc参数的集合,但假设该信号在相反的方向上演变(朝着过去)。然后两个方向上执行预测,一个朝着未来和一个朝着过去。因此,产生丢失的帧的两个表示。最后,在被播出前,加权和平均两个信号。

图8示出根据现有技术的错误隐藏过程。自适应码本800提供自适应码本信息至放大器808,该放大器将码本增益gp应用至来自自适应码本800的信息。放大器808的输出与组合器810的输入相连接。此外,随机噪声产生器804与固定码本802一起,提供码本信息至另一个放大器gc。在806处指示的放大器gc将增益系数(其为固定码本增益)应用至由固定码本802和随机噪声产生器804一起提供的信息。然后,将放大器806的输出附加地输入至组合器810。组合器810对由相应的码本增益放大的两个码本的结果做加法,以获得组合信号,然后将该组合信号输入至lpc合成块814。由如之前的讨论生成的替换表示控制lpc合成块814。

现有技术程序具有一定缺点。

为了处理变化的信号特征或为了将lpc包络朝背景噪声类特性收敛,在隐藏的过程中,通过外/内插一些其他的lpc向量以改变lpc。在隐藏的过程中,不可能精确地控制能量。虽然有可能控制各种码本的码本增益,lpc将隐含地影响整体水平或能量(甚至频率依赖)。

可以想象,在突发帧丢失的过程中,淡出至特定的能量水平(例如,背景噪声水平)。使用现有技术水平的技术,甚至通过控制码本增益,这是不可能的。

在保持合成具有与帧丢失之前相同的频谱特性的音调部分的可能性的同时将信号的噪声部分衰减至背景噪声是不可能的。



技术实现要素:

本发明的一个目的是提出用于产生错误隐藏信号的改进概念。

这个目的由用于产生错误隐藏信号的装置、用于产生错误隐藏信号的方法或计算机可读介质实现。

在本发明的一个方面,用于产生错误隐藏信号的装置包括用于产生第一替换lpc表示和不同的第二替换lpc表示的lpc表示产生器。此外,提供用于使用第一替换lpc表示对第一码本信息进行滤波以获得第一替换信号且使用第二替换lpc表示对第二不同的码本信息进行滤波以获得第二替换信号的lpc合成器。lpc合成器的输出由组合第一替换信号和第二替换信号的替换信号组合器组合,以获得错误隐藏信号。

第一码本优选地为用于提供第一码本信息的自适应码本,第二码本优选地为用于提供第二码本信息的固定码本。换句话说,第一码本表示信号的音调部分,第二或固定码本表示信号的噪声部分并因此可被认为是噪声码本。

使用衰减值、最后的好表示和最后的好lpc表示的均值产生自适应码本的第一码本信息。此外,使用最后的好lpc表示衰减值和噪声估计产生第二或固定码本的lpc表示。依赖于此实现方式,噪声估计可以为固定值、离线训练值或它可以从错误隐藏情况之前的信号自适应地得到。

优选地,执行用于计算替换lpc表示的影响的lpc增益计算,然后为了执行补偿,使用此信息,使得合成信号的功率、或者响度或者通常地,振幅有关的测量与错误隐藏操作之前的相应的合成信号相似。

在另一方面,用于产生错误隐藏信号的装置包括用于产生一个或多个替换lpc表示的lpc表示产生器。此外,提供用于计算来自lpc表示的增益信息的增益计算器,然后附加地提供用于补偿替换lpc表示的增益影响的补偿器,并且此增益补偿使用由增益计算器提供的增益操作而操作。然后,lpc合成器使用替换lpc表示对码本信息进行滤波以获得错误隐藏信号,其中补偿器用于在lpc合成器合成码本信息之前加权该码本信息,或用于加权lpc合成输出信号。因此,降低或消除错误隐藏情况开始时的任何增益、或功率或振幅有关的可感知影响。

此补偿不仅对以上方面概述的各别lpc表示有用,还对仅使用单个lpc替换表示和单个lpc合成器的情况有用。

通过计算最后的好lpc表示和替换lpc表示的脉冲响应,特别是通过在一定时间(3至8ms之间,优选地为5ms)对相应的lpc表示的脉冲响应计算rms值,确定增益值。

在实现方式中,通过将新的rms值(即替换lpc表示的rms值)除以好lpc表示的rms值确定真实的增益值。

优选地,使用背景噪声估计计算单个或多个替换lpc表示,该背景噪声估计优选地是从当前解码信号得到的背景噪声估计,而不是离线训练向量简单预定的噪声估计。

在另一个方面,用于产生信号的装置包括用于产生一个或多个替换lpc表示的lpc表示产生器,和用于使用替换lpc表示对码本信息进行滤波的lpc合成器。附加地,提供用于在接收好的音频帧的过程中估计噪声估计的噪声估计器,此噪声估计依赖于好的音频帧。表示产生器用于在产生替换lpc表示中使用通过噪声估计器估计的噪声估计。

处理过去解码信号的频谱表示以提供噪声频谱表示或目标表示。噪声频谱表示被转换至噪声lpc表示,且该噪声lpc表示优选地为与替换lpc表示相同类型的lpc表示。针对特定的lpc相关的处理过程,isf向量或lsf向量是优选的。

对过去解码信号使用具有最优平滑的最小统计方法得到估计。然后,此频谱噪声估计被转换至时域表示。然后,使用时域表示的第一数量的样本执行莱文森-德宾递归,其中样本的数量与lpc的阶数相等。然后,lpc系数从莱文森-德宾递归的结果得到,且此结果最终被转换至向量。使用用于各个码本的各个lpc表示的方面、使用具有增益补偿的一个或多个lpc表示的方面,以及在产生一个或多个lpc表示中使用噪声估计的方面(其估计不是离线训练向量,而是从过去解码信号得到的噪声估计),分别可用于获得相对于现有技术的改进。

附加地,这些各别的方面还可以彼此组合,使得,例如,第一方面和第二方面可以彼此组合、或者第一方面或第三方面可以彼此组合、或第二方面和第三方面可以彼此组合以提供相对于现有技术的明显改进的性能。更加优选地,所有三个方面彼此结合以获得关于现有技术的改进。因此即使通过单独的图描述这些方面,所有方面可以彼此组合地应用,如可通过参照所附的图和描述看出。

附图说明

随后相对于附图描述本发明的优选实施例,其中:

图1a示出第一方面实施例;

图1b示出自适应码本的使用;

图1c示出在正常模式或隐藏模式的情况中固定码本的使用;

图1d示出用于计算第一lpc替换表示的流程图;

图1e示出用于计算第二lpc替换表示的流程图;

图2示出具有错误隐藏控制器和噪声估计器的解码器的概述;

图3示出合成滤波器的具体表示;

图4示出组合第一方面和第二方面的优选实施例;

图5示出组合第一和第二方面的又一实施例;

图6示出组合第一和第二方面的实施例;

图7a示出用于执行增益补偿的实施例;

图7b示出用于执行增益补偿的流程图;

图8示出现有技术的错误隐藏信号产生器;

图9示出根据具有增益补偿的第二方面的实施例;

图10示出图9的实施例的又一实现方式;

图11示出使用噪声估计器的第三方面的实施例;

图12a示出用于计算噪声估计的优选实现方式;

图12b示出用于计算噪声估计的又一优选实现方式;

图13示出使用噪声估计且应用衰减操作的单个lpc替换表示或用于各个码本的各别的lpc替换表示的计算。

具体实施方式

本发明优选的实施例涉及借助于独立于由外插lpc引起的任何增益改变的码本增益控制输出信号的水平,并涉及针对每个码本单独地控制lpc模型化的频谱形状。针对此目的,针对每个码本应用单独的lpc,且应用补偿方法以补偿隐藏的过程中lpc增益的任意改变。

如在不同方面或结合方面定义的本发明的实施例具有以下优点:在解码器端不正确或根本没有接收一个或多个数据包的情况下,提供语音/音频的高主观质量。

此外,在隐藏的过程中,优选的实施例补偿随后的lpc间的增益差异,此增益差异由随时间改变的lpc系数引起,因此避免不希望的水平改变。

此外,实施例的优点在于,在隐藏的过程中,两个或更多个lpc系数的集合被用于独立地影响有声和无声语音部分,以及音调和噪声类的音频部分的频谱行为。

本发明的所有方面提供改进的主观音频质量。

根据本发明的一个方面,在内插的过程中精确地控制能量。补偿通过改变lpc引起的任何增益。

根据本发明的另一方面,针对码本向量的每个,使用各别的lpc系数集。每个码本向量由其相应的lpc滤波,随后,仅合计各个滤波后的信号以获得合成输出。相反,现有水平的技术首先相加所有激励向量(由不同码本产生),然后将总和馈至单个lpc滤波器。

根据另一方面,不使用噪声估计,例如作为离线训练向量,然而实际上从过去解码帧得到,使得,在一定数量的错误或丢失包/帧之后,获得至真实背景噪声的淡出,而不是任何预定的噪声频谱。特别地,引起在用户端接受的感觉,只是事实是,即使当错误情况发生时,由解码器提供的、一定数量的帧之后的信号与之前的信号有关。然而,在一定数量的丢失或错误帧的情况下由解码器提供的信号是完全与错误情况之前的、由解码器提供的信号无关的信号。

针对lpc的时变增益应用增益补偿允许以下优点:

它补偿通过改变lpc引起的任何增益。

因此,输出信号的水平可以由各种码本的码本增益控制。通过使用内插lpc消除任何由不希望的影响,允许预定的淡出。

针对在隐藏的过程中使用的每个码本,使用单独的lpc系数的集合允许以下优点:

产生分别影响信号的音调和噪声类部分的频谱形状的可能性。

给出播出几乎未改变的有声信号部分(例如,元音期望的)的机会,同时噪声部分可以被迅速收敛至背景噪声。

给出隐藏有声部分并以任意衰减速度(例如,依赖于信号特性的淡出速度)淡出有声部分的机会,且在隐藏期间同时保持背景噪声。通常,现有技术水平的编解码器经常遭受非常干净的有声隐藏声音。

通过不改变频谱特性的情况下淡出音调部分且将噪声类部分衰减至背景频谱包络,提供方法以在隐藏过程中平滑地衰减至背景噪声。

图1a示出用于产生错误隐藏信号111的装置。该装置包括用于产生第一替换表示且附加地用于产生第二替换lpc表示的lpc表示产生器。如在图1a中所示出,第一替换表示被输入至用于对由第一码本102(例如自适应码本102)输出的第一码本信息进行滤波以在块106的输出获得第一替换信号的lpc合成器106。此外,由lpc表示产生器100产生的第二替换表示被输入至用于对由第二码本104(其为,例如,固定码本)提供的第二、不同的码本信息进行滤波以在块108的输出获得第二替换信号的lpc合成器。然后,将两个替换信号输入至用于组合第一替换信号和第二替换信号以获得错误隐藏信号111的替换信号组合器110。两个lpc合成器106和108可以在单个lpc合成器块中实施,或者可以作为分离的lpc合成器滤波器实施。在其他实现方式中,两个lpc合成器的过程可以由实际上被平行实施和操作的两个lpc滤波器实施。然而,lpc合成还可以是lpc合成滤波器和一定的控制,使得lpc合成滤波器针对第一码本信息和第一替换表示提供输出信号,然后继第一操作之后,控制提供第二码本信息和第二替换表示至合成滤波器以以串行的方式获得第二替换信号。针对本领域的技术人员,对于除了单个或多个合成块之外,lpc合成器的其他实现方式是清楚的。

典型地,lpc合成输出信号为时域信号,且替换信号组合器110通过执行同步逐个采样加法以执行合成输出信号组合。然而,替换信号组合器110也可以执行其他组合,例如,加权逐个采样加法、或频域加法或其他信号组合。

此外,第一码本102被指示为包括自适应码本且第二码本104被指示为包括固定码本。然而,第一码本和第二码本可以为任意码本,例如作为第一码本的预测码本或作为第二码本的噪声码本。然而,其他码本可以为声门脉冲码本、创新性码本、转换码本、由预测和变换部分组成的混合码本、对于各别的声音发出者(例如,男士/女士/儿童)的码本或针对不同声音(使用针对动物声音)的码本等。

图1b示出自适应码本的表示。提供具有反馈回路120的自适应码本,且自适应码本接收(作为输入)音调滞后118。在好的接收的帧/包的情况下,音调滞后可以为解码的音调滞后。然而,当检测到指示错误或丢失帧/包的错误情况时,错误隐藏音调滞后118由解码器提供并被输入至自适应码本。自适应码本102可以作为存储由反馈线120提供的反馈输出值的存储器实施,并且依赖于应用的音调滞后118,由自适应码本输出一定数量的采样值。

此外,图1c示出固定码本104。在正常模式的情况下,固定码本104接收码本索引和响应于码本索引,由固定码本提供一定的码本条目114作为码本信息。然而,若确定隐藏模式,不可得到码本索引。然后,激活在固定码本104内提供的噪声产生器112,该噪声产生器提供噪声信号作为码本信息116。依赖于此实现方式,噪声产生器可以提供随机码本索引。然而,优选地,噪声产生器实际上提供噪声信号而不是随机码本索引。噪声产生器112可以作为一定的硬件或软件噪声产生器实施,或可以作为噪声表或具有噪声形状的固定码本中一定的"附加的"条目实施。此外,上述过程的组合是可能的,即,噪声码本条目与一定的后处理一起。

图1d示出在错误的情况下,用于计算第一替换lpc表示的优选的过程。步骤130示出两个或更多个最后的好帧的lpc表示的均值的计算。三个最后的好帧为优选。因此,三个最后的好帧的均值在块130中被计算,并被提供至块136。此外,存储的最后好帧lpc信息在步骤132中被提供并附加地被提供至块136。此外,衰减因子在块134中被确定。然后,依赖于最后的好lpc信息、依赖于最后的好帧的lpc信息的均值并依赖于块134的衰减因子,计算第一替换表示138。

对于现有技术,仅应用一个lpc。针对新提出的方法,由自适应码本或者固定码本产生的每个激励向量,由其自身的lpc系数的集合滤波。各别的isf向量的导出如下:

系数集a(用于滤波自适应码本)由这个公式确定:

isfa-1=alphaa·isf-2+(1-alpha)·isf'(块136)

其中alphaa为可依赖于信号稳定性、信号类等的时变自适应衰减因子。isfa-x为isf系数,其中x表示帧数,与当前帧的端有关:x=-1表示第一丢失的isf,x=-2最后好的,x=-3第二最后好的,等。这导致将用于滤波音调部分的lpc从最后正确地接收的帧朝平均lpc(三个最后好的20ms帧的平均)衰减。丢失越多的帧,在隐藏的过程中使用的isf越接近成为短期平均isf向量(isf')。通常,应注意的是,isf代表isf域或lsf域中的值。因此,还可以在lsf域中而不是在isf域或任何其他类似域中执行相同的计算或稍微不同的计算。

图1e示出用于计算第二替换表示的优选的过程。在块140中,确定噪声估计。然后,在块142中,确定衰减因子。附加地,在块144中,最后的好帧为在被提供之前已经被存储的lpc信息。然后,在块146中,计算第二替换表示。优选地,系数集b(用于滤波固定码本)由这个公式确定:

isfb-1=alphab·isf-2+(1-beta)·isfcng(块146)

其中,isfcng为从背景噪声估计得到的isf系数的集合,alphab为时变衰减速度因子,优选地,为信号依赖的。使用与[3]相似的具有最优平滑的最小统计方法,通过在fft域(功率谱)追迹过去解码信号得到目标频谱形状。通过做逆fft计算自相关然后利用莱文森-德宾递归以使用逆fft的前n个样本计算lpc系数(其中n为lpc的阶)而将此fft估计转换至lpc表示。因此,对自相关值计算莱文森-德宾递归,或者基于其计算递归的时域表示包括平方的傅里叶变换(例如,fft)频谱的逆。

然后此lpc被转换至isf域中以重新获得isfcng。可选地——若不可得到背景频谱形状的这样的追迹——目标频频谱形状还可以基于离线训练向量和短期频谱均值的任意组合得到,如g.718中针对普通目标频谱形状所做。

优选地,衰减因子a和αb依赖于解码频谱信号(即依赖于在错误的发生之前的解码音频信号)确定。衰减因子可以依赖于信号稳定性、信号类等。因此,若确定信号为相当噪声的信号,则以这种方式确定衰减因子:相对于相当音调的信号的情况,衰减因子更快地不时降低。在这种情况中,衰减因子从一个时间帧至下一个时间帧降低减小的数量。这确保在相比于非噪声或音调信号的噪声信号的情况下,从最后好的帧至最后三个好的帧的均值的淡出发生的更快速,其中淡出速度减小。针对信号类,可以执行相似的过程。对于有声信号,可以比对于无声信号,或者对于音乐信号慢地执行淡出,相比于其他信号特性,可以减小一定的衰减速度,且可以应用衰减因子的对应的测定。

如在图1e的上下文中所讨论,针对第二码本信息可以计算不同的衰减因子αb。因此,可以根据不同的衰减速度提供不同的码本条目。因此,至噪声估计例如fcng的淡出可以被设置为不同于,如图1d的块136示出的从最后好的帧isf表示至均值isf表示的衰减速度。

图2示出优选的实现方式的概述。例如,输入线从无线输入端口或线缆端口接收音频信号的包或帧。将输入线202上的数据提供至解码器204,且同时提供至错误隐藏控制器200。错误隐藏控制器确定接收的包或帧是否是错误的或丢失的。若确定,错误隐藏控制器输入控制消息至解码器204。在图2的实现方式中,在控制线ctrl上的消息“1”以信号通知解码器在隐藏模式下操作。然而,若错误隐藏控制器没有发现错误情况,则控制线ctrl携带指示正常解码模式的消息“0”,如图2的表210所示。解码器204附加地与噪声估计器206连接。在正常解码模式的过程中,噪声估计器206通过反馈线208接收解码音频信号,并从解码信号确定噪声估计。然而,当错误隐藏控制器指示从正常解码模式至隐藏模式的改变时,噪声估计器206将噪声估计提供至解码器204,使得解码器204可以如之前和下面附图所讨论的执行错误隐藏。因此,噪声估计器206附加地由来自错误隐藏控制器的控制线ctrl控制,以从正常解码模式中的正常噪声估计模式切换至隐藏模式中的噪声估计准备操作。

图4在解码器的上下文中示出本发明的优选的实施例,例如图2的具有自适应码本且附加地具有固定码本104的解码器204。在由如图2中表210的上下文中所讨论的控制线数据“0”指示的正常解码模式中,当忽略804项时,解码器如图8中所示操作。因此,正确地接收的包包括,用于控制固定码本802的固定码本索引、用于控制放大器806的固定码本增益gc以及为了控制放大器808的自适应码本gp。此外,自适应码本800由传输的音调滞后控制且与开关812连接,使得自适应码本输出被反馈至自适应码本的输入。此外,针对lpc合成滤波器804的系数从传输的数据得到。

然而,若图2的错误隐藏控制器202检测到错误隐藏情况,开始错误隐藏过程,相比于正常过程,其中提供两个合成滤波器106和108。此外,针对自适应码本102的音调滞后由错误隐藏设备产生。附加地,为了正确地控制放大器402和404,自适应码本增益gp和固定码本增益gc也由错误隐藏过程合成,如本领域已知的。

此外,依赖于信号类,控制器409控制开关405以便反馈两种码本输出的组合(继相应的码本增益的应用之后)或者只反馈自适应码本输出。

根据实施例,针对lpc合成滤波器a106的数据和针对lpc合成滤波器b108的数据由图1a的lpc表示产生器100产生,且附加地,由放大器406和408执行增益校正。为此,计算增益补偿因子ga和gb,以便正确地驱动放大器408和406,使得停止由lpc表示产生的任何增益影响。最后,由106和108指示的lpc合成滤波器a和b的输出由组合器110组合,以便获得错误隐藏信号。

随后,讨论一方面从正常模式至隐藏模式和从隐藏模式返回至正常模式的切换。

从干净的通道解码切换至隐藏时,从一个共用的lpc至多个分离的lpc的转变不引起任何间断,因为最后好的lpc的存储器状态被用于初始化分离的lpc的每个ar或mr存储器。当这样做时,保证从最后的好帧至第一丢失帧的平滑转变。

从隐藏切换至干净的通道解码时(恢复阶段),在干净的通道解码的过程中(通常使用ar(自回归)模式),分离的lpc的方法对于正确地更新单个lpc滤波器的内部存储器状态引入挑战。仅使用一个lpc的ar存储器或平均的ar存储器会导致最后丢失帧和第一好帧之间的帧边界处的间断。下面描述一种方法以克服处理这一挑战:

所有激励向量的一小部分(建议5ms)被加在任何隐藏的帧的端部。然后,此总和的激励向量可被馈给至用于恢复的lpc。这在图5中示出。依赖于此实现方式,也可以在lpc增益补偿之后合计激励向量。

明智地,在帧端的负5ms开始,设置lpcar存储器至0,通过使用各别的lpc系数的集合的任一个得到lpc合成,并保存隐藏的帧的最端部的存储器状态。若下一个帧被正确地接收,则此存储器状态可以被用于恢复(含义:用于初始化帧起始的lpc存储器),否则被丢弃。此存储器不得不被附加地引入;必须与隐藏的过程中使用的隐藏的lpcar存储器的任一个分开处理。

用于恢复的另一种方案是使用从usac[4]已知的方法lpc0。

随后,更加具体的讨论图5。通常,自适应码本102可以被叫做如图5中所指示的预测码本或被替换为预测码本。此外,固定码本104可以被替换或实施作为噪声码本104。在正常模式中,为了正确地驱动放大器402和404,在输入数据中传输码本增益gp和gc,或在错误隐藏情况下,可以通过错误隐藏过程合成码本增益gp和gc。此外,使用附加地具有由放大器414指示的相关码本增益gr的第三码本412(可以为其他码本)。在实施例中,在块416中,针对其他码本,由lpc替换表示控制的分离的滤波器实施附加的lpc合成器。此外,以与ga和gb的上下文中所讨论的方法相似的方式执行增益校正gc,如所示出。

此外,示出在418处指示的附加的恢复lpc合成器x,lpc合成器x接收(作为输入)所有激励向量的至少一小部分的总和(例如5ms)。此激励向量被输入至lpc合成滤波器x的lpc合成器x418存储器状态中。

然后,当发生从隐藏模式切换回至正常模式时,通过将lpc合成滤波器x的内部存储器状态复制到此单个正常操作滤波器中,控制单个lpc合成滤波器,且附加地,滤波器的系数通过正确地传输的lpc表示设置。

图3示出具有两个lpc合成滤波器106和108的lpc合成器的又一更加详细的实现方式。例如,每一个滤波器为具有滤波器接头304和306以及滤波器内部存储器304和308的fir滤波器或iir滤波器。滤波器接头302和306由lpc表示产生器(例如图1a的100)正确地传输的相应的lpc表示或产生的相应的替换lpc表示所控制。此外,提出存储器初始化器320。存储器初始化器320接收最后好的lpc表示,且当执行切换至错误隐藏模式时,存储器初始化器320提供单个lpc合成滤波器的存储器状态至滤波器内部存储器304和308。特别地,存储器初始化器接收,替代最后好的lpc表示或除了最后好的lpc表示之外,最后好的存储器状态(即最后好的帧/包的处理中且特别是处理后的,单个lpc滤波器的内部存储器状态)。

附加地,如图5的上下文中已经讨论,存储器初始化器230还可以用于针对从错误隐藏情况至正常无错误操作模式的恢复,执行存储器初始化过程。为此,在从错误或丢失帧至好帧的恢复的情况下,存储器初始化器230或分离的另一个lpc存储器初始化器用于初始化单个lpc滤波器。lpc存储器初始化器用于,将组合的第一码本信息和第二码本信息的至少一部分,或组合的加权第一码本信息和加权第二码本信息的至少一部分,馈入分离的lpc滤波器,例如图5的lpc滤波器418。附加地,lpc存储器初始化器用于保存通过处理馈入的值而获得的存储器状态。然后,当随后的帧或包为好的帧或包时,使用保存的存储器状态(即来自滤波器418的状态)初始化针对正常模式的图8的单个lpc滤波器814。此外,如在图5所示出,针对滤波器的滤波器系数,可以为针对lpc合成滤波器106、或者针对lpc合成滤波器108、或者针对lpc合成滤波器416的系数,或者这些系数的加权的或不加权的组合。

图6示出增益补偿的又一个实现方式。为此,用于产生错误隐藏信号的装置包括增益计算器600和已经在图4(406、408)和图5(406、408、409)的上下文中讨论过的补偿器406和408。特别地,lpc表示计算器100输出第一替换lpc表示和第二替换lpc表示至增益计算器600。然后,增益计算器600针对第一替换lpc表示计算第一增益信息,针对第二lpc替换表示计算第二增益信息,且将数据提供至补偿器406和408,补偿器406和408接收,除了第一和第二码本信息(如图4或图5所示出)之外,最后好的帧/包/块的lpc。然后,补偿器输出补偿的信号。至补偿器的输入可以为图4的实施例中的放大器402和404的输出、码本102和104的输出或合成块106和108的输出。

补偿器406和408部分或者全部地补偿第一增益信息中的第一替换lpc的增益影响并使用第二增益信息补偿第二替换lpc表示的增益影响。

在实施例中,计算器600用于,计算与在错误隐藏开始之前的最后好的lpc表示有关的最后好的功率信息。此外,增益计算器600针对第一替换lpc表示计算第一功率信息并针对第二lpc表示计算第二功率信息,使用最后好的功率信息和第一功率信息计算第一增益值,使用最后好的功率信息和第二功率信息计算第二增益值。然后,使用第一增益值且使用第二增益值,在补偿器406和408中执行补偿。然而,依赖于此信息,最后好的功率信息的计算还可以由补偿器直接执行,如图6实施例中所示出。然而,由于最后好的功率信息的计算基本上与针对第一替换表示的第一增益值和针对第二替换lpc表示的第二增益值的相同的方法执行,优选地,如输入601所示出,在增益计算器600中执行所有增益值的计算。

特别地,增益计算器600用于计算来自最后好的lpc表示或第一和第二lpc替换表示的脉冲响应,然后计算来自脉冲响应的rms(均方根)值,以获得增益补偿中的相应的功率信息,每个激励向量为——在由相应的码本增益进行增益后——再次由增益(ga或gb)放大。这些增益通过计算当前使用的lpc的脉冲响应,然后计算rms以确定:

然后,此结果与最后正确地接收的lpc的rms相比,为了补偿lpc内插的能量增加/损失,其商被用作增益因子:

这一过程可以被看作一种归一化。补偿由lpc内插引起的增益。

随后,更加详细地讨论图7a和7b以示出用于产生错误隐藏信号的装置,或增益计算器600,或如图7a中在700处指示出的计算最后好的功率信息的补偿器406和408。此外,如在702处指示的,针对第一和第二lpc替换表示,增益计算器600计算第一和第二功率信息。然后,如由704指示的,优选地由增益计算器600计算第一和第二增益值。然后,如在706处指示的,使用这些增益值,补偿码本信息、或加权的码本信息、或lpc合成输出。优选地,此补偿由放大器406和408完成。

为此,如在图7b示出的优选的实施例中执行一些步骤。在步骤710中,提供lpc表示(例如第一或第二替换lpc表示或最后好的lpc表示)。在步骤712中,将码本增益应用至由块402和404指示的码本信息/输出。此外,在步骤716中,从对应的lpc表示计算脉冲响应。然后,在步骤718中,针对每个脉冲响应计算rms值,且在块720中使用旧rms值和新rms值计算对应的增益,优选地,此计算通过新rms值除旧rms值完成。最后,为了最后获得如步骤714指示的补偿结果,使用块720的结果以补偿步骤712的结果。

随后,讨论又一方面,即,用于产生错误隐藏信号的装置的实现方式,该装置具有只产生单个替换lpc表示的lpc表示产生器100,如图8示出的情况。对比于图8,然而,图9中实施例示出又一方面,包括增益计算器600和补偿器406和408。因此,补偿由lpc表示产生器产生的替换lpc表示的任意增益影响。特别地,为了最终获得错误隐藏信号,可以由补偿器406和408在如图9中示出的lpc合成器的输入端上执行增益补偿,或可选地,由补偿器900在所示的lpc合成器的输出端执行此增益补偿。因此,补偿器406、408和900用于加权码本信息或lpc合成器106和108提供的lpc合成输出信号。

针对lpc表示产生器、增益计算器、补偿器和lpc合成器的其他过程可以与图1至8的上下文中所讨论的相同的方法执行。

如在图4的上下文中所示出,特别地,在没有乘法器输出402和404的总和被反馈至自适应码本,而只有自适应码本的输出被反馈的情况下(即开关405在所示位置),放大器402和放大器406彼此串行地执行两个加权操作,或者放大器404和放大器408彼此串行地执行两个加权操作。在实施例中,图10中所示出的,此两个加权操作可以在单个操作中执行。为此,增益计算器600提供其输出gp或gc至单个值计算器1002。此外,如本领域所知,为了产生隐藏码本增益,实施码本增益产生器1000。然后,优选地,为了获得单个值,单个值计算器1002计算gp和ga之间的乘积。此外,针对第二分支,为了为图4中较低分支提供单个值,单个值计算器1002计算ga和gb之间的乘积。针对图5的具有放大器414和409的第三分支,可以执行又一过程。

然后,依赖于操纵器被定位于图9中lpc合成器之前还是继图9的lpc合成器之后,提供操纵器1004,其对单个码本的码本信息或两个或更多个码本的码本信息执行例如放大器402和406的操作以便最后获得操纵的信号(例如码本信号或隐藏信号)。图11示出第三方面,其中提供lpc表示产生器100,lpc合成器106、108和附加的、已经在图2的上下文中所讨论的噪声估计器206。lpc合成器106和108接收码本信息和替换lpc表示。使用来自噪声估计器206的噪声估计,由lpc表示产生器产生lpc表示,且该噪声估计器206通过从最后好帧确定噪声估计而操作。因此,噪声估计依赖于最后好的音频帧,且在好的音频帧的接收的过程中(即在图2的控制线上由“0”指示的正常解码模式中)估计噪声估计,然后,在正常解码模式的过程中产生的此噪声估计被应用至隐藏模式,如图2中块206和204的连接处所示。

噪声估计器用于处理过去解码信号的频谱表示以提供噪声频谱表示,并将噪声频谱表示转换至噪声lpc表示,其中噪声lpc表示是与替换lpc表示同类的lpc表示。因此,当替换lpc表示是isf域表示或者是isf向量时,噪声lpc表示附加地为isf向量或isf表示。

此外,噪声估计器206用于将具有最优平滑的最小统计方法应用至过去解码信号以得到噪声估计。针对这一过程,优选地,执行[3]中所示的过程。然而,依赖于例如抑制频谱中的与非音调部分相比的音调部分以滤波掉音频信号中的噪声或背景噪声的其他噪声估计也可以被应用以获取目标频谱形状或噪声频谱估计。

因此,在一个实施例中,频谱噪声估计从过去解码信号得到,然后频谱噪声估计被转换至lpc表示再然后被转换至isf域以获取最后的噪声估计或目标频谱形状。

图12a示出优选的实施例。在步骤1200中,获得过去解码信号,如例如图2中通过反馈回路208所示。在步骤1202中,计算频谱表示(例如快速傅里叶变换(fft)表示)。然后,在步骤1204中,得到目标频谱形状,例如通过具有最优平滑的最小统计方法或任意其他噪声估计器处理。然后如块1206指示的将目标频谱形状转换至lpc表示,最后如块1208所指示的将lpc表示转换至isf因子,从而最后获得isf域中的目标频谱形状,其可以直接被lpc表示产生器使用用于产生替换lpc表示。在这一应用中的等式中,isf域中目标频谱形状被指示为“isfcng”。

在图12b示出的优选的实施例中,例如通过最小统计方法和最优平滑得到目标频谱形状。然后,在步骤1212中,通过对目标频谱形状应用例如逆fft计算时域表示。然后,通过使用莱文森-德宾递归计算lpc系数。然而,块1214的lpc系数计算还可以由除了提到的莱文森-德宾递归之外的任意其他方法执行。然后,在步骤1216中,计算最后的isf因子以获得待被lpc表示产生器100使用的噪声估计isfcng

随后,讨论图13,用于说明在单个lpc替换表示1308的计算的上下文中噪声估计的使用过程(例如,对于图8中所示的过程),或者用于如块1310指示的计算针对各别码本的各别lpc表示(对于图1中示出的实施例)。

在步骤1300中,计算两个或三个最后好帧的均值。在步骤1302中,提供最后好帧的lpc表示。此外,在步骤1304中,提供例如可以由分离的信号分析器控制的衰减因子,信号分析器可以例如包括在图2的错误隐藏控制器200中。然后,在步骤1306中,计算噪声估计且步骤1306中的过程可以由如图12a和12b所示出的过程的任一个执行。

在计算单个lpc替换表示的上下文中,块1300、1304和1306的输出被提供至计算器1308。然后,以这样的方法计算单个替换lpc表示:继一定数量的失去、或丢失、或错误帧/包之后,获得至噪声估计lpc表示的淡出淡入(fadingover)。

然而,如在块1310处所示,针对各别码本(例如针对自适应码本和固定码本),计算各别lpc表示,然后,执行如之前所讨论的,用于一方面计算isfa-1(lpca)并计算isfb-1(lpcb)的过程。

尽管本发明已经在框图的上下文中描述,其中块表示真实的或逻辑的硬件组件,本发明还可以由计算机实施的方法实施。在后者的情况下,块表示相应的方法步骤,这些步骤代表由相应的逻辑的或物理的硬件块执行的功能。

尽管在装置的上下文中已经描述了一些方面,明显地,这些方面还表示相应方法的描述,其中块或设备对应于方法步骤或方法步骤的特征。类似地,方法步骤的上下文中描述的方面还表示相应装置的相应的块、或项、或特征的描述。方法步骤的一些或全部由(或使用)硬件装置执行,例如,微处理器、可编程计算机、或电子电路。在一些实施例中,最重要的方法步骤的一些(一个或多个)可由此装置执行。

依赖于一定的实现方式需要,发明的实施例可以在硬件或软件中实施。此实现方式可以使用数字存储介质执行,例如软盘、dvd、蓝光、cd、rom、prom、eprom、eeprom、或闪存,在其上存储电可读控制信号,与(或能够与)可编程计算机系统配合以便执行各自的方法。因此,数字存储介质可以为计算机可读的。

根据发明的一些实施例包括具有电可读控制信号的数据载体,其能够与可编程计算机系统配合以便执行在此描述的方法中的一个。

通常,本发明的实施例可以由具有程序代码的计算机程序产品实施,当计算机程序产品在计算机上运行时,用于执行方法的一个的程序代码可操作。例如,程序代码可以被存储在机器可读载体上。

其他实施例包括用于执行在此描述的方法中的一个的计算机程序,其存储在机器可读载体上。

换句话说,因此,发明方法的实施例是具有程序代码的计算机程序,当计算机程序在计算机上运行时,用于执行在此描述的方法中的一个。

因此,发明方法的又一个实施例是,包括存储在其上的、用于执行在此描述的方法的一个的计算机程序的数据载体(或非临时存储介质,例如数字存储介质或计算机可读介质)。通常,该数据载体,数字存储介质或记录介质是有形的、和/或非临时的。

因此,本发明方法的又一实施例是,表示用于执行在此描述的方法的一个的计算机程序的数据流或信号序列。例如,该数据流或信号序列被配置为通过数据通信连接例如通过因特网传递。

又一实施例包括处理元件,例如,被配置为或适于执行在此描述的方法的一个的计算机或可编程逻辑设备。

又一实施例包括具有安装在其上的、用于执行在此描述的方法的一个的计算机程序的计算机。

根据本发明的又一个实施例包括用于将用于执行在此描述的方法的一个的计算机程序传递(例如,电传递或光传递)至接收器的装置或系统。例如,接收器可以是计算机、移动设备、存储器设备等。例如,装置或系统包括用于将电脑程序传递至接收器的文件服务器。

在一些实施例中,可编程逻辑设备(例如,现场可编程门阵列)可以被用于执行在此描述的方法的一些或全部功能。在一些实施例中,为了执行在此描述的方法的一个,现场可编程门阵列可以与微处理器配合。通常,优选地,由任意硬件装置执行方法。

根据一些实施例包括用于产生错误隐藏信号的装置,该装置包括:lpc(线性预测编码)表示产生器(100),用于产生替换lpc表示;lpc合成器(106,108),用于使用所述替换lpc表示对码本信息进行滤波;以及噪声估计器(110),用于在接收好的音频帧的过程中估计噪声估计,其中所述噪声估计依赖于所述好的音频帧,以及其中所述lpc表示产生器(100)用于在产生所述替换lpc表示中使用由所述噪声估计器(206)估计的噪声估计。

在一些实施例中,噪声估计器(206)用于处理频谱表示(1200,1202)以提供噪声频谱表示(1204)且将所述噪声频谱表示转换(1206)至噪声lpc表示,所述噪声lpc表示是与所述替换lpc表示同类的lpc表示。

在一些实施例中,替换lpc表示包括替换因子,以及噪声估计器(206)用于提供所述噪声估计作为噪声因子。

在一些实施例中,替换因子是lsf或isf因子,以及噪声因子是lsf或isf因子。

在一些实施例中,噪声估计器(206)用于将具有最优平滑的最小统计方法(1210)应用至过去解码信号(208)以得到所述噪声估计。

在一些实施例中,噪声估计器(206)用于从过去解码信号得到频谱噪声估计(1210),将所述频谱噪声估计转换(214)至lpc表示;以及将所述lpc表示转换(1216)至isf或lsf域以获得所述噪声估计。

在一些实施例中,噪声估计器(206)用于提供频谱噪声估计(1210);将所述频谱噪声估计转换(1212)至时域表示;以及使用时域表示的前n个样本执行(1214)莱文森-德宾递归,其中n对应于表示的lpc阶。

在一些实施例中,时域表示包括平方的傅里叶变换频谱的逆。

在一些实施例中,lpc表示产生器(100)用于使用估计和最后好的lpc表示得到所述替换lpc表示。

在一些实施例中,lpc表示产生器(100)用于使用先前的好的lpc表示或至少两个先前的好的lpc表示的均值得到所述替换lpc表示,其中所述均值或最后的好的lpc表示淡出,使得在一些错误帧或丢失帧之后,所述替换lpc表示对应于所述噪声估计。

在一些实施例中,lpc表示产生器(100)用于产生另一个替换lpc表示。装置还包括自适应码本(104),其中所述lpc合成器(106,108)用于使用所述替换lpc表示对来自所述固定码本的码本信息进行滤波,以及其中所述lpc合成器(106,108)用于使用所述另一个表示对来自所述自适应码本的码本信息进行滤波,其中所述lpc表示产生器(100)用于使用至少两个好的lpc表示的均值计算所述另一个替换lpc表示。

在一些实施例中,lpc表示产生器用于基于以下等式计算所述替换lpc表示:

其中所述lpc表示产生器用于基于以下等式计算所述另一个替换lpc表示:

其中αa和αb是时变衰减因子,其中isf-2是最后好帧的lpc表示,其中isf-3是第二最后好帧的lpc表示,其中isf-4是第三最后好帧的lpc表示,其中是替换lpc表示,其中是另一个替换lpc表示,其中isf代表isf域或lsf域中的值。

在一些实施例中,该装置还包括信号分析器(200),所述信号分析器(200)用于分析在待被隐藏的错误的发生之前接收的信号的信号特征,其中所述信号分析器用于提供分析结果,以及其中所述lpc表示产生器(100)用于使用时变衰减因子,其中依赖于所述分析结果确定所述时变衰减因子。

在一些实施例中,其中所述信号特征是信号稳定性或信号类,以及其中所述时变衰减因子被确定,以使得与较稳定的信号或音调类信号相比,对于较不稳定的信号或噪声类信号,所述衰减因子在较短时间内减小至0。

在一些实施例中,该装置还包括:增益计算器,用于从所述替换lpc表示计算增益信息;以及补偿器,用于使用所述增益信息补偿所述替换lpc表示的增益影响,其中所述补偿器用于加权码本信息或lpc合成输出信号。

根据一些实施例包括用于产生错误隐藏信号的方法,该方法包括:产生(100)替换lpc表示;使用所述替换lpc表示对码本信息进行滤波(106,108);以及在接收好的音频帧的过程中估计(206)噪声估计,其中所述噪声估计依赖于好的音频帧表示,其中由所述估计(206)估计的噪声估计被用于产生(100)所述替换lpc表示。

根据一些实施例包括计算机程序,用于当在计算机或处理器中运行时,执行如上所述的方法。

上述实施例仅是示例性地说明本发明的原理。应该理解的是,本文描述的布置和细节的修改和改变对于本领域其他技术人员是容易的。因此,仅受所附的专利权利要求的范围限制且不受由在此的实施例的描述和解释表示的特定细节的限制。

参考文献

[1]itu-tg.718recommendation,2006

[2]kazuhirokondo,kiyoshinakagawa,,,apacketlossconcealmentmethodusingrecursivelinearprediction“departmentofelectricalengineering,yamagatauniversity,japan.

[3]r.martin,noisepowerspectraldensityestimationbasedonoptimalsmoothingandminimumstatistics,ieeetransactionsonspeechandaudioprocessing,vol.9,no.5,july2001

[4]ralfgeigeret.al.,patentapplicationus20110173011a1,audioencoderanddecoderforencodinganddecodingframesofasampledaudiosignal

[5]3gppts26.190;transcodingfunctions;-3gpptechnicalspecification

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1