分解滤波器组、合成滤波器组、编码器、解码器、混合器及会议系统的制作方法

文档序号:2825303阅读:138来源:国知局
专利名称:分解滤波器组、合成滤波器组、编码器、解码器、混合器及会议系统的制作方法
技术领域
本发明涉及一种分解滤波器组、合成滤波器组、以及包括上述任一滤波器组在内的系统,这些可以在以下领域中实现例如现代音频编码、音频解码、或其他与音频传输相关的应用。此外,本发明还涉及混合器以及会议系统。
背景技术
典型地,现代数字音频处理基于编码方案,与直接传输或存储相应音频数据相比, 编码方案可以实现在比特率、传输带宽以及存储空间方面显著减小。例如,这是通过在发送机端编码音频数据,在接收机端,在向收听者提供解码的音频数据之前对编码的数据进行解码来实现的。可以相对于各种各样的参数来实现这样的数字音频处理系统,这些参数包括针对音频数据的典型潜在标准化流的典型存储空间、比特率、计算复杂度(尤其在实现效率方面)、适于不同应用的可实现质量、以及分别在对音频数据进行编码和对编码的音频数据进行解码期间引起的延迟。换言之,数字音频系统可以应用于从音频数据的超低质量传输到高端传输和存储(例如,针对高质量音乐收听体验)范围内的许多不同应用领域。然而,在许多情况下,必须在如比特率、计算复杂度、质量以及延迟之类的不同参数方面进行折衷。例如,与在可比的质量水平上具有较高延迟的音频系统相比,包括较低延迟的数字音频系统可能需要较高比特率的传输带宽。

发明内容
—种用于对多个时域输入帧进行滤波的分解滤波器组的实施例,其中输入帧包括多个有序的输入采样,所述分解滤波器组包括加窗器,被配置为产生多个加窗帧,其中加窗帧包括多个加窗的采样,其中加窗器被配置为使用采样前移值以重叠的方式来处理所述多个输入帧,其中所述采样前移值小于输入帧的有序输入采样的数目除以2 ;以及时间/频率转换器,被配置为提供包括多个输出值的输出帧,其中输出帧是加窗帧的频谱表示。一种用于对多个输入帧进行滤波的合成滤波器组的实施例,其中每个输入帧包括多个有序的输入值,所述合成滤波器组包括频率/时间转换器,被配置为提供多个输出帧,其中输出帧包括多个有序的输出采样,输出帧是输入帧的时间表示;加窗器,被配置为产生多个加窗帧。加窗帧包括多个加窗的采样。所述加窗器还被配置为提供所述多个加窗的采样,以基于采样前移值以重叠的方式来对其进行处理。所述合成滤波器组的实施例还包括重叠/相加器,被配置为提供包括起始部分和其余部分在内的相加帧,其中相加帧包括多个相加采样,其中通过将来自至少三个加窗帧的至少三个加窗的采样相加来获得相加帧的其余部分中的相加采样,通过将来自至少两个不同的加窗帧的至少两个加窗的采样相加来获得起始部分中的相加采样。为了获得其余部分中的相加采样而相加的加窗的采样的数目比为了获得起始部分中的相加采样而相加的加窗的采样的数目至少多一个采样。 或者,加窗器被配置为根据有序的输出采样的顺序至少忽略最早的输出值,或针对所述多个加窗帧中的每个加窗帧,将相应的加窗的采样设置为预定值或至少设置为预定范围内的值。重叠/相加器(230)被配置为基于来自至少三个不同加窗帧的至少三个加窗的采样来提供相加帧的其余部分中的相加采样,并基于来自至少两个不同加窗帧的至少两个加窗的采样来提供起始部分中的相加采样。一种用于对多个输入帧进行滤波的合成滤波器组的实施例,每个输入帧包括M个有序的输入值yk(0),...,yk (M-I),其中M是正整数,k是指示帧索引的整数,所述合成滤波器组包括反IV型离散余弦变换频率/时间转换器,被配置为提供多个输出帧,输出帧包括基于输入值yk(0),···,yk(M-I)的2M个有序的输出采样,...,^^2M_1);加窗器,被配置为产生多个加窗帧,加窗帧包括基于以下等式的多个加窗的采样、(0),.. .,zk(2M-l)Zk(n) = W (η) · xk (η),η = 0,· · ·,2Μ-1,其中η是指示采样索引的整数,w (η)是与采样索引η相对应的实值窗函数系数; 重叠/相加器,被配置为基于以下等式来提供包括多个中间采样mk(0),...,mk(M-l)的中间帧mk(n) = zk (η)+ (n+M),η = 0,···,Μ_1 ;以及提升器,被配置为基于以下等式来提供包括多个相加采样QUtk(O),. . .,OUtk(M-I)的相加帧outk(n) = mk(η) +1 (η_Μ/2) · Iv1 (Μ_1_η), η = Μ/2, ... , M-I 以及outk(η) = mk (η) +1 (Μ_1_η) · Outlrf (Μ_1_η), η = 0,. . .,Μ/2-1 其中 1 (0),..., 1 (M-I)是实值提升系数。一种编码器的实施例,包括用于对多个时域输入帧进行滤波的分解滤波器组,其中输入帧包括多个有序的输入采样,所述分解滤波器组包括加窗器,被配置为产生多个加窗帧,其中加窗帧包括多个加窗的采样,其中加窗器被配置为使用采样前移值以重叠的方式来处理所述多个输入帧,其中所述采样前移值小于输入帧的有序输入采样的数目除以2 ; 以及时间/频率转换器,被配置为提供包括多个输出值的输出帧,其中输出帧是加窗帧的频谱表示。一种解码器的实施例,包括用于对多个输入帧进行滤波的合成滤波器组,其中每个输入帧包括多个有序的输入值,所述合成滤波器组包括频率/时间转换器,被配置为提供多个输出帧,其中输出帧包括多个有序的输出采样,输出帧是输入帧的时间表示;加窗器,被配置为产生多个加窗帧,加窗帧包括多个加窗的采样,其中所述加窗器被配置为提供所述多个加窗的采样,以基于采样前移值以重叠的方式来对其进行处理;重叠/相加器,被配置为提供包括起始部分和其余部分在内的相加帧,其中相加帧包括多个相加采样,其中通过将来自至少三个加窗帧的至少三个加窗的采样相加来获得相加帧的其余部分中的相加采样,通过将来自至少两个不同的加窗帧的至少两个加窗的采样相加来获得起始部分中的相加采样,其中,为了获得其余部分中的相加采样而相加的加窗的采样的数目比为了获得起始部分中的相加采样而相加的加窗的采样的数目至少多一个采样,
或者其中,所述加窗器被配置为根据有序的输出采样的顺序至少忽略最早的输出值, 或针对所述多个加窗帧中的每个加窗帧,将相应的加窗的采样设置为预定值或至少设置为预定范围内的值;以及,重叠/相加器被配置为基于来自至少三个不同加窗帧的至少三个加窗的采样来提供相加帧的其余部分中的相加采样,并基于来自至少两个不同加窗帧的至少两个加窗的采样来提供起始部分中的相加采样。一种解码器的实施例,包括用于对多个输入帧进行滤波的合成滤波器组,其中每个输入帧包括M个有序的输入值yk(0),...,yk (M-I),其中M是正整数,k是指示帧索引的整数,所述合成滤波器组包括反IV型离散余弦变换频率/时间转换器,被配置为提供多个输出帧,输出帧包括基于输入值yk(0),...,yk (M-I)的2M个有序的输出采样&(0),..., xk(2M-l);加窗器,被配置为产生多个加窗帧,加窗帧包括基于以下等式的多个加窗的采样 zk(0), . . . , zk(2M-l)zk(n) = w (η) · xk (η), η = 0, . . .,2Μ-1,其中η是指示采样索引的整数,w (η)是与采样索引η相对应的实值窗函数系数; 重叠/相加器,被配置为基于以下等式来提供包括多个中间采样mk(0),...,mk(M-l)的中间帧mk(η) = zk(η) +Zk^1 (η+Μ),η = 0,· · ·,Μ_1 ;以及提升器,被配置为基于以下等式来提供包括多个相加采样OUtk(O) outk(M-l)的相加帧outk(n) = mk(η) +1 (η_Μ/2) · Iv1 (Μ_1_η), η = Μ/2, ... , M-I 以及outk(η) = mk (η) +1 (Μ_1_η) · Outlrf (Μ_1_η), η = 0,…,Μ/2-1 其中 1 (0),..., 1 (M-I)是实值提升系数。一种用于对多个输入帧进行混合的混合器的实施例,其中每个输入帧是相应时域帧的频谱表示,所述多个输入帧中的每个输入帧由不同的源来提供,所述混合器包括熵解码器,被配置为对所述多个输入帧进行熵解码;缩放器,被配置为在频域中对多个熵解码后的输入帧进行缩放,并被配置为在频域中获得多个缩放后的帧,其中每个缩放后的帧与熵解码后的帧相对应;相加器,被配置为在频域中将缩放后的帧相加,以在频域中产生相加帧;以及熵编码器,被配置为对所述相加帧进行熵编码以获得混合帧。—种会议系统的实施例,包括用于对多个输入帧进行混合的混合器,其中每个输入帧是相应时域帧的频谱表示,所述多个输入帧中的每个输入帧由不同的源来提供,所述混合器包括熵解码器,被配置为对所述多个输入帧进行熵解码;缩放器,被配置为在频域中对多个熵解码后的输入帧进行缩放,并被配置为在频域中获得多个缩放后的帧,其中每个缩放后的帧与一个熵解码后的输入帧相对应;相加器,被配置为在频域中将缩放后的帧相加,以在频域中产生相加帧;以及熵编码器,被配置为对所述相加帧进行熵编码以获得混合帧。


以下参考附图来描述本发明的实施例。图1示出了分解滤波器组的框图2示出了由分解滤波器组的实施例处理的输入帧的示意表示;图3示出了合成滤波器组的框图;图4示出了在由合成滤波器组处理的框架中输出帧的示意表示;图5示出了分解滤波器组和合成滤波器组的实施例的分解窗函数和合成窗函数的示意表示;图6示出了分解窗函数和合成窗函数与正弦窗函数的比较;图7示出了不同窗函数的另一种比较;图8示出了对于图7所示三个不同窗函数的前回声(pre-echo)性态的比较;图9示意性地示出了人耳的一般时间掩蔽特性;图10示出了正弦窗和低延迟窗的频率响应的比较;图11示出了正弦窗和低重叠窗的频率响应的比较;图12示出了编码器的实施例;
图13示出了解码器的实施例;图14a示出了包括编码器和解码器在内的系统;图14b示出了图14a所示的系统中包括的不同的延迟源;图15示出了包括延迟比较的表;图16示出了包括混合器的实施例在内的会议系统的实施例;图17示出了作为服务器或媒体控制单元的会议系统的另一实施例;图18示出了媒体控制单元的框图;图19示出了作为高效实现方式的合成滤波器组的实施例;图20示出了包括对合成滤波器组或分解滤波器组(AAC ELD编解码器)的实施例的计算效率的评估在内的表;图21示出了包括对AAC LD编解码器的计算效率的评估在内的表;图22示出了包括对AAC LC编解码器的计算复杂度的评估在内的表;图23a和2 示出了包括对三个不同编解码器的RAM和ROM的存储器效率的评估的比较在内的表;以及图M示出了包括针对MUSHRA测试所使用的代码变换器(codex)的列表在内的表。
具体实施例方式图1至M示出了对分解滤波器组、合成滤波器组、编码器、解码器、混合器、会议系统的不同实施例以及本发明的其他实施例的功能特性和特征加以描述的框图和其他图示。 然而,在描述合成滤波器组的实施例之前,将参考图1和2更详细地描述分解滤波器组的实施例以及由分解滤波器组的实施例处理的输入帧的示意表示。图1示出了分解滤波器组100的第一实施例,分解滤波器组100包括加窗器110和时间/频率转换器120。更准确地,加窗器110被配置为接收多个时域输入帧,在输入IlOi 处,每个输入帧包括多个有序的输入采样。加窗器110还适于产生多个加窗帧,所述加窗帧是由加窗器在加窗器110的输出IlOo处提供的。每个加窗帧包括多个加窗的采样,其中, 如将在图2中更详细地说明的,加窗器110还被配置为使用采样前移值(sample advancevalue)以重叠的方式来处理多个加窗帧。时间/频率转换器120能够接收加窗器110输出的加窗帧,并被配置为提供包括多个输出值的输出帧,使得输出帧是加窗帧的频谱表示。为了说明和概述分解滤波器组100的实施例的功能特性和特征,图2将五个输入帧130-(k-3)、130-(k-2)、130-(k-l)、130-k以及130_(k+l)的示意表示示为时间的函数, 如图2底部的箭头140所示。在下文中,如图2中的虚线所示,参考输入帧130-k来更详细地描述分解滤波器组 100的实施例的操作。相对于该输入帧130-k,输入帧130-(k+Ι)是未来的输入帧,而三个输入帧130-(k-l)、130-(k-2)、和130-(k-3)是过去的输入帧。换言之,k是指示帧索引的整数,使得帧索引越大,则相应输入帧位于“未来”越远处。相应地,索引k越小,则输入帧位于“过去”越远处。每个输入帧130包括至少两个等长的子部分150。更准确地,在图2所示的示意表示所基于的分解滤波器组100的实施例的情况下,输入帧130-k和其他输入帧130包括在输入采样方面长度相等的子部分150-2、150-3以及150-4。输入帧130的这些子部分中的每个子部分包括M个输入采样,其中M是正整数。此外,输入帧130还包括第一子部分150-1, 第一子部分150-1可以也包括M个输入帧。在这种情况下,如将在以后的阶段更详细地说明的,第一子部分150-1包括输入帧130的初始部分160,初始部分160可以包括输入采样或其他值。然而,根据分解滤波器组的实施例的具体实现,第一子部分150-1完全不需要包括初始部分160。换言之,与其他子部分150-2、150-3、150-4相比,第一子部分150-1原则上可以包括较少数目的输入采样。随后还将说明针对这种情况的示例。可选地,除了第一子部分150-1以外,其他子部分150-2、150-3、150-4典型地包括相同数目M的输入采样,数目M等于所谓的采样前移值170,采样前移值170指示两个连续输入帧130相对于时间和彼此而移动的输入采样的数目。换言之,如图1和2所示,在分解滤波器组100的实施例的情况下,箭头170所指示的采样前移值M等于子部分150-2、 150-3,150-4的长度,加窗器110以重叠的方式来产生和处理输入帧130。此外,采样前移值M (箭头170)还与子部分150-2至150-4的长度相同。因此,对于大量输入采样而言,在两个输入帧都包括这些输入采样的意义上,输入帧130-k和130-(k+l)是相等的,同时这两个输入帧130相对于其各自的子部分150具有偏移。更准确地,输入帧130-k的第三子部分150-3等于输入帧130-(k+Ι)的第四子部分 150-4。相应地,输入帧130-k的第二子部分150-2与输入帧130- (k+Ι)的第三子部分150-3 相同。再换言之,在图2所示实施例的情况下,与帧索引k和(k+Ι)相对应的两个输入帧 130-k、130-(k+Ι)在两个子部分150方面是相同的,但是对于具有帧索引(k+Ι)的输入帧而
言采样已经移动了。两个前述输入帧130-k和130_(k+l)还共享来自输入帧130_k的第一子部分 150-1的至少一个采样。更准确地,在图2所示的实施例的情况下,输入帧130-k的第一子部分150-1中不是初始部分160的一部分的所有输入采样表现为输入帧130-(k+l)的第二子部分150-2的一部分。然而,根据分解滤波器组的实施例的具体实现,与前一输入帧 130-k的初始部分160相对应的第二子部分150-2中的输入采样可以或可以不基于相应输入帧130的初始部分160中的输入值或输入采样。如果存在初始部分160使得第一子部分150-1中的输入帧的数目等于其他子部分 150-2至150-4中的输入采样的数目,则原则上需要考虑两种不同情况,尽管将要说明这两种“极端”情况之间的其他情况也是可能的。如果初始部分160包括“有意义”(在初始部分160中的输入采样确实表示时域中的音频信号的意义上)的编码的输入采样,则这些输入采样还将是下一输入帧130-(k+l) 的子部分150-2的一部分。然而,这种情况在分解滤波器组的实施例的许多应用中不是最优实现,因为该选项可能导致额外的延迟。然而,在初始部分160不包括“有意义”的输入采样的情况下(在这种情况下还可以将输入采样称作输入值),初始部分160的相应输入值可以包括随机值、预定的、固定的、可适配的或可编程的值,例如可以利用可以与分解滤波器组实施例的加窗器110的输入IlOi耦合的单元或模块以算法计算、确定或其他固定的方式来提供这些值。然而,在这种情况下,典型地需要该模块提供以下输入帧作为输入帧130-(k+l)该输入帧在第二子部分150-2中与前一输入帧的初始部分160相对应的区域中包含“有意义”的输入采样,该有意义的输入采样确实与相应音频信号相对应。此外,典型地与加窗器110的输入IlOi耦合的单元或模块还需要提供与输入帧130-(k+Ι)的第一子部分150-1的框架中的音频信号相对应的有意义的输入采样。换言之,在这种情况下,在收集了足够的输入采样之后,将与帧索引k相对应的输入帧130-k提供给分解滤波器组100的实施例,使得可以使用这些输入采样来填充该输入帧的子部分150-1。然后,利用输入采样或输入值(可以包括随机值或任何其他值,如预定的、固定的、可适配的或可编程的值或这些值的任何其他组合)来填充第一子部分150中的余下部分,即初始部分160。因为与典型采样频率相比,原则上可以以非常高的速度来实现这一点,所以在典型的采样频率(如在几kHz直到几百kHz的范围内的采样频率)所给出的标度上,为输入帧130-k的初始部分160提供这样“无意义”的输入采样并不需要很长一段时间。然而,该单元或模块继续根据音频信号来采集输入采样,以将这些输入采样结合入与帧索引k+Ι相对应的下一输入帧130-(k+l)中。换言之,尽管该模块或单元未完成采集足够的输入采样来为输入帧130-k的第一子部分150-1提供足够的输入采样从而将该输入帧的第一子部分150-1完全填满,然而,一旦有足够的输入采样可用,该单元或模块就将该输入帧提供给分解滤波器组100的实施例,使得可以在没有初始部分160的情况下利用输入采样来填充第一子部分150-1。后续的输入采样将用于填充下一输入帧130_(k+l)的第二子部分150-2的其余输入采样,直到收集到足够的输入采样为止,使得还可以对该下一输入帧的第一子部分150-1 进行填充,直到该帧的初始部分160的起始为止。接着,再一次,将利用随机数或其他“无意义”的输入采样或输入值来填充初始部分160。因此,尽管在图2中指示了在图2所示的实施例的情况下采样前移值170长度等于子部分150-2至150-4的长度,然而在图2中,从输入帧130_k的初始部分160的起始处直到下一输入帧130-(k+l)的初始部分160起始处,示出了表示采样前移值170的误差。因此,与音频信号(与初始部分160相对应)中的事件相对应的输入采样在后两CN 102243875 A
说明书
7/176 页
种情况下将不会出现在相应的输入帧130-k中,而是出现在下一输入帧130_(k+l)中第二子部分150-2的框架中。换言之,分解滤波器组100的许多实施例可以为输出帧提供减小的延迟,这是因为,与初始部分160相对应的输入采样不是相应输入帧130-k的一部分,而只会影响随后的输入帧130-(k+Ι)。换言之,分解滤波器组的实施例可以在许多应用和实现中提供更快地基于输入帧来提供输出帧的优点,这是因为,第一子部分150不需要包括与其他子部分150-2 至150-4相同数目的输入采样。然而,在下一帧130中,在该相应输入帧130的第二子部分 150-2的框架中包括在“缺失部分”中所包括的信息。然而,如之前所述,还可能存在以下情况没有任何输入帧130确实包括初始部分 160。在这种情况下,每个输入帧130的长度不再是采样前移值170或子部分150-2至150-4 的长度的整数倍。更准确地,在这种情况下,每个输入帧130的长度与采样前移值的相应整数倍相差的输入采样数目是为加窗器110提供相应输入帧的模块或单元未提供完整的第一子部分150-1而所缺少的数目。换言之,这样的输入帧130的总长度与采样前移值的相应整数倍相差的差值是第一子部分150-1的长度与其他子部分150-2至150-4的长度之差。然而,在所提到的后两种情况下,该模块或单元(例如可以包括采样器、采样与保持级、采样与保持器、或量化器)可以开始提供达不到预定输入采样数目的相应输入帧 130,以便以较短的延迟(与利用相应输入采样来填充完整的第一子部分150-1的情况相比)将每个输入帧130提供给分解滤波器组100的实施例。如上所述,例如,这种单元或模块(可以耦合到加窗器110的输入IlOi)可以包括采样器和/或量化器,如模拟/数字转换器(A/D转换器)。然而,根据具体实现,这样的模块或单元还可以包括一些存储器或寄存器,以存储与音频信号相对应的输入采样。此外,这样的单元或模块可以基于采样前移值M,以重叠的方式来提供每个输入帧。换言之,输入帧包括比针对每帧或每块所收集的采样数目的两倍更多的输入采样。在许多实施例中,这样的单元或模块适于使得两个连续产生的输入帧基于在时间上偏移了采样前移值的多个采样。在这种情况下,两个连续产生的输入帧中后一输入帧基于至少一个新的输出采样,因为在两个输入帧中的前一输入帧中,最早的输出采样和前述多个采样向后偏移了采样前移值。尽管目前为止针对每个输入帧130包括四个子部分150的情况描述了分解滤波器组100的实施例,其中第一子部分150不需要包括与其他子部分相同数目的输入采样, 然而,子部分的数目不需要如在图2所示的情况下那样等于4。更准确地,输入帧130原则上可以包括大于采样前移值M(箭头170)的两倍大小的任意数目的输入采样,其中初始部分160的输入值(如果存在的话)的数目需要包含在该数目中,因为考虑基于使用帧的系统的实施例的一些实现方式可能是有帮助的,其中每一帧包括与采样前移值相同的采样数目。换言之,在分解滤波器组100的实施例的框架中,可以使用任意数目的子部分,每个子部分的长度与采样前移值M (箭头170)相同,在基于帧的系统中,子部分的数目大于或等于 3。否则,原则上可以使用每输入帧130任何数目的输入采样,只要该数目大于采样前移值的两倍。如图1所示,分解滤波器组100的实施例中的加窗器110被配置为采用如先前所述的重叠的方式,基于采样前移值M(箭头170)来产生基于相应输入帧130的多个加窗帧。更准确地,根据加窗器110的具体实现,将加窗器110配置为根据加权函数来产生加窗帧, 所述加权函数例如可以包括对人耳的听觉特性进行建模的对数依赖关系。然而,还可以实现其他加权函数,如对人耳的心理声学特性进行建模的加权函数。然而,例如,在分解滤波器组的实施例中实现的加窗器函数还可以被实现为将输入帧的每个输入采样与包括实值采样专用窗系数的实值加窗器函数相乘。在图2中示出了这种实现的示例。更准确地,图2示出了一种可能的窗函数或加窗函数180的示意性粗略表示,如图1所示的加窗器110基于相应的输入帧130,使用该函数180来产生加窗帧。根据分解滤波器组100的具体实现,加窗器110还可以以不同的方式将加窗帧提供给时间/频率转换器120。加窗器110被配置为基于每个输入帧130来产生加窗帧,其中每个加窗帧包括多个加窗的采样。更准确地,可以采用不同的方式来配置加窗器110。根据输入帧130的长度以及根据要提供给时间/频率提供器120的加窗帧的长度,对于如何将加窗器110实现为产生加窗帧,可以实现多种可能性。例如,如果输入帧130包括初始部分160,使得在图2所示实施例的情况下,每个输入帧130的第一子部分150-1与其他子部分150-2至150-4包括相同数目的输入值或输入采样,则例如将加窗器110配置为使得加窗帧也包括与输入帧130所包括的输入值的输入采样相同数目的加窗的采样。在这种情况下,如上所述,由于输入帧130的结构,可以利用加窗器110基于前述加窗函数或窗函数来处理除输入帧130的输入值以外输入帧中的所有输入采样。在这种情况下,可以将初始部分160的输入值设置为预定值或预定范围内的至少一个值。例如,在分解滤波器组100的一个实施例中,该预定值可以等于值0(零),而在其他实施例中可能需要不同的值。例如,原则上对于输入帧130的初始部分160可以使用任何值,这表示相应的值对于音频信号无关紧要。例如,该预定值可以是音频信号的输入采样的典型范围以外的值。例如,可以将加窗帧中与输入帧130的初始部分160相对应的部分中的加窗的采样设置为输入音频信号的最大幅度的两倍或更大的值,这表示这些值与要进一步处理的信号不相对应。例如,还可以使用实现专用的绝对值的负值。此外,在分解滤波器组100的实施例中,还可以将加窗帧中与输入帧130的初始部分160相对应的加窗的采样设置为预定范围内的一个或更多个值。原则上,这样的预定范围例如可以是较小值的范围,该范围对于音频体验没有意义,因此无法可听地辨别结果或不显著干扰收听体验。在这种情况下,例如可以将预定范围表示为值的集合,该集合中的值的绝对值小于或等于预定的、可编程的、可适配的或固定的最大阈值。例如,可以将这样的阈值表示为10的幂或2的幂,如IOs或2s,其中s是依赖于具体实现的整数值。然而,原则上,该预定范围还可以包括比一些有意义的值更大的值。更准确地,该预定范围还可以包括绝对值大于或等于可编程的、预定的、或固定的最小阈值的值。原则上同样可以以2的幂或10的幂(如2s或10s)来表示这样的最小阈值,其中s也是依赖于分解滤波器组的实施例的具体实现的整数。在数字实现的情况下,该预定范围例如可以包括在预定范围包括较小值的情况下能够通过设置或不设置最低有效位或多个最低有效位来表示的值。在该预定范围包括更大的值的情况下,如上所述,该预定范围可以包括能够通过设置或不设置最高有效位或多个最高有效位来表示的值。然而,预定值以及预定范围还可以包括其他值,所述其他值例如可以是基于上述值和阈值,通过将其乘以因子而产生的值。根据分解滤波器组100的实施例的具体实现,还可以将加窗器110适配为使得在输出IlOo处提供的加窗帧不包括与输入帧130的初始部分160的输入帧相对应的加窗的采样。在这种情况下,例如,加窗帧的长度与相应输入帧130的长度可能相差初始部分160 的长度。换言之,在这种情况下,可以将加窗器110配置为或适配为忽略按照如先前所述输入帧的顺序在时间上最近的输入采样。换言之,在分解滤波器组100的一些实施例中,可以对加窗器110进行配置,以忽略输入帧130的初始部分160中一个或更多个或甚至所有的输入值或输入采样。在这种情况下,加窗帧的长度等于输入帧130的长度与输入帧130的初始部分160的长度之差。作为另一选项,如上所述,每个输入帧130可以完全不包括初始部分160。在这种情况下,第一子部分150-1在相应子部分150的长度方面或在输入采样的数目方面与其他子部分150-2至150-4不同。在这种情况下,加窗帧可以包括或可以不包括加窗的采样或加窗的值,使得与输入帧130的第一子部分150-1相对应的加窗帧的类似第一子部分包括与输入帧130的子部分150相对应的其他子部分相同数目的加窗的采样或加窗的值。在这种情况下,如上所述,可以将另外的加窗的采样或加窗的值设置为预定值或预定范围内的至少一个值。此外,在分解滤波器组100的实施例中,可以将加窗器110配置为使得输入帧130 和所产生的加窗帧都包括相同数目的值或采样,其中输入帧130和所产生的加窗帧都不包括初始部分160或与初始部分160相对应的采样。在这种情况下,与加窗帧的相应子部分的输入帧130的其他子部分150-2至150-4相比,输入帧130的第一子部分150-1以及加窗帧的相应子部分包括更少的值或采样。原则上应注意,加窗帧不需要与包括初始部分160的输入帧130的长度相对应,或与不包括初始部分160的输入帧130相对应。原则上,加窗器110也可以适配为使得加窗帧包括与输入帧130的初始部分160中的值相对应的一个或多个值或采样。在本文中,还应注意,在分解滤波器组100的一些实施例中,初始部分160表示或至少包括与输入帧130的输入值或输入采样的连通子集相对应的采样索引η的连通子集。 因此,如果可应用,则包括相应初始部分的加窗帧还包括与加窗帧的相应初始部分相对应的加窗的采样的采样索引η的连通子集,其中所述加窗帧的相应初始部分也称为加窗帧的起始部分或开始部分。加窗帧非初始部分或起始部分的余下部分有时也称作其余部分。如先前已经指出的,在分解滤波器组100的实施例中,可以将加窗器110适配为 基于窗函数来产生加窗帧中与输入帧130的初始部分160(如果存在的话)不相对应的加窗的值的加窗的采样,所述窗函数可以例如以基于以相应输入采样为基础的对数计算来产生加窗的采样的方式来结合心理声学模型。然而,在分解滤波器组100的不同实施例中,加窗器110还可以适于使得通过将相应输入采样与在定义集合上定义的窗函数的采样专用加窗后的系数相乘来产生每个加窗的采样。在分解滤波器组100的许多实施例中,相应加窗器110适于使得由窗系数所描述的窗函数在定义集合上关于定义集合的中点不对称。此外,在分解滤波器组100的许多实施例中,在定义集合中相对于中点的第一半部分中,窗函数的窗系数的绝对值大于窗函数的所有窗系数的最大绝对值的10%、20%或30%、50%,其中,在定义集合中相对于中点的第二半部分中,窗函数包括较少的窗系数其绝对值大于窗系数最大绝对值的前述百分比。 在图2中每个输入帧130的情况下,示意性地将这样的窗函数示为窗函数180。将在图5至 11的情况下描述窗函数的更多示例,包括对分解滤波器组和合成滤波器组的一些实施例所提供的频谱和其他特性及机会的简要讨论,其中所述分解滤波器组和合成滤波器组实现如这些图中所示并在段落中描述的窗函数。除了加窗器110以外,分解滤波器组100的实施例还包括时间/频率转换器120, 从加窗器110向所述时间/频率转换器120提供加窗帧。时间/频率转换器120继而适于针对每个加窗帧产生输出帧或多个输出帧,使得输出帧是相应加窗帧的频谱表示。如随后将更详细说明的,时间/频率转换器120适于使得输出帧包括的输出值数目少于输入帧的输入采样数目的一半、或少于加窗帧的加窗的采样的半数的一半。此外,可以将时间/频率转换器120实现为使得所述时间/频率转换器120基于离散余弦变换和/或离散正弦变换,从而输出帧的输出采样的数目小于输入帧的输入采样数目的一半。然而,将简短概述分解滤波器组100的可能实施例的更多实现细节。在分解滤波器组的一些实施例中,将时间/频率转换器120配置为使得时间/频率转换器120输出多个输出采样,所述输出采样的数目等于起始部分150-2、150-3、150-4 的输入采样的数目或与采样前移值170相同,所述起始部分150-2、150-3、150-4不是输入帧130的第一子部分150-1的起始部分。换言之,在分解滤波器组100的许多实施例中,输出采样的数目等于整数M,整数M表示输入帧130前述子部分150长度的采样前移值。在许多实施例中,采样前移值或M的典型值是480或512。然而,应注意,在分解滤波器组的实施例中还可以容易地实现不同的整数MjBM= 360。此外,应注意,在分解滤波器组的一些实施例中,输入帧130的初始部分160,或其他子部分150-2、150-3、150-4中采样数目与输入帧130的第一子部分150-1中采样数目之差等于M/4。换言之,在M = 480的分解滤波器组100的实施例的情况下,初始部分160的长度或前述差值等于120 (M/4)个采样,而在分解滤波器组100的一些实施例中,在M= 512 的情况下,前述差值的初始部分160的长度等于U8(M/4)。然而,还应注意,在这种情况下, 还可以实现不同长度,不表示对分解滤波器组100的实施例的限制。如之前也指出的,因为时间/频率转换器120可以例如基于离散余弦变换或离散正弦变换,所以有时也关于参数N = 2M来讨论和说明分解滤波器组的实施例,其中N = 2M 表示修正离散余弦变换(MDCT)转换器的输入帧的长度。因此,在分解滤波器组100的前述实施例中,参数N等于960 (M = 480)和1024 (M= 512)。如随后将更详细地说明的,分解滤波器组100的实施例可以提供的优点在于在完全不降低音频质量或不以某种方式显著降低音频质量的前提下,使数字音频处理的延迟更低。换言之,分解滤波器组的实施例提供了以下机会例如在(音频)编解码器(编解码器=编码器/解码器或编码/解码)的框架中,实现增强的低延迟编码模式,提供更低的延迟,与许多可用代码变换器相比具有至少可比的频率响应和增强的前回声性态。此外,如将在会议系统的实施例的情况下更详细地说明的,在分解滤波器组的一些实施例以及包括分解滤波器组100的实施例在内的系统实施例中,针对所有类型信号只要单个窗函数就能够实现前述优点。
要强调的是,分解滤波器组100的实施例的输入帧不需要包括如图2所示的四个子部分150-1至150-4。这仅仅表示为了简单起见而选择的一种可能性。相应地,也不需要将加窗器适配为使加窗帧也包括四个相应的子部分,或将时间/频率转换器120适配为使其能够基于包括四个子部分的加窗帧来提供输出帧。这仅仅是在图2的情况下简单选择的,以能够以清楚简要的方式来说明分解滤波器组100的一些实施例。然而,如在与初始部分160及其在输入帧130中的出现有关的不同选项的情况下说明的,还可以将在输入帧130 的长度方面关于输入帧的叙述转移至加窗帧的长度。在下文中,关于为将容错高级音频编解码器低延迟实现(ER AACLD)的分解滤波器组适配为达到有时也称为低延迟(分解滤波器组)的分解滤波器组100的实施例而进行的修改,对根据ER AAC LD的分解滤波器组的实施例的可能实现加以说明。换言之,如以下限定的,为了实现充分减小的延迟或低延迟,在ER AAC LD情况下对标准编码器的一些修改可能是有用的。在这种情况下,分解滤波器组100的实施例中的加窗器110被配置为根据以下方程或表达式来产生加窗的采样Zi,n zijn = w(N-l-n) ‘ x' i>n (1)其中,i是指示加窗帧和/或输入帧的帧索引或块索引的整数,η是指示-N到N-I 范围内的采样索引的整数。换言之,在输出帧130的框架中包括初始序列160的实施例中,通过针对采样索引 η = -N,...,N-I实现上述表达式或方程,将加窗扩展为通过(pass),其中,如将在图5至 11的情况下更详细说明的,w(n)是与窗函数相对应的窗系数。在分解滤波器组100的实施例的情况下,如通过比较窗函数w(n-l-n)的自变量可以看出的,通过反转顺序将合成窗函数w用作分解窗函数。如在图3和4的情况下概述的,通过镜像(例如相对于定义集合的中点)来得到镜像版本,可以基于分解窗函数来构造或产生用于合成滤波器组的实施例的窗函数。换言之,图5示出了低延迟窗函数的图,其中,简单地,分解窗是合成窗的时间反转副本。在这种情况下还应注意,x' i,n表示与块索引i和采样索引η相对应的输入采样或输入值。换言之,与以基于正弦窗的IOM或960个值的窗长度N为基础的前述ER AAC LD 实现(例如以编解码器的形式)相比,通过将加窗扩展至过去,在分解滤波器组100的实施例的加窗器Iio中包含的低延迟窗的窗长度是2N( = 4Μ)。如将在图5至11的情况下更详细说明的,在一些实施例中,对于η = 0,. . .,2N_1 的窗系数w (η)可以按照在附录的表1以及附录的表3中针对N = 960和N= IOM给出的关系。此外,在一些实施例的情况下,窗系数可以分别包括在附录的表2和4中针对N = 960和N= IOM给出的值。对于时间/频率转换器120,在ER AAC LD编解码器的框架中实现的核心MDCT算法(MDCT =修正离散余弦变换)基本不变,但是包括了如所述的更长的窗,使得η现在从-N 行进至N-I而不是从0行进至N-。基于以下方程或表达式来产生输出帧的频谱系数或输出
(2π\ \ΝXuk=-IYjZun-COS -{n + n0)-{k + -) , 0<k<— (2)
η=-NV^ y丄
其中Zi,n是时间/频率转换器120的加窗帧或加窗的输入序列中与如先前所述的采样索引η和块索引i相对应的加窗的采样。此外,k是指示频谱系数索引的整数;N是整数,指示输出帧的输出值数目的两倍,或如先前所述,指示基于在ER AAC LD编解码器中实现的windowsjequence值的一个变换窗的窗长度。整数Iltl是由以下等式给出的偏移值
Γ π——+ 1
0110 Μ 2
η0 =~-——。
0 2根据如在图2的情况下说明的输入帧130的具体长度,可以基于加窗帧来实现时间/频率转换器,所述加窗帧包括与输入帧130的初始部分160相对应的加窗的采样。换言之,在M = 480或N = 960的情况下,上述方程基于包括长度为1920个加窗的采样的加窗帧。在加窗帧不包括与输入帧130的初始部分160相对应的加窗的采样的分解滤波器组 100的实施例的情况下,在M = 480的前述情况下,加窗帧长度为1800个加窗的采样。在这种情况下,可以对以上给出的方程进行适配以便执行相应的方程。在加窗器110的情况下, 如果如先前所述与加窗帧的其他子部分相比,在第一子部分中缺失Μ/4 = Ν/8个加窗的采样,则这可以例如导致采样索引η行进于-N,. . .,7Ν/8-1。相应地,在时间/频率转换器120的情况下,通过相应地修改求和索引以不使用加窗帧的初始部分或起始部分的加窗的采样,可以容易地适配以上给出的方程。当然,还是如先前所述的,在输入帧130的初始部分160的长度不同的情况下,或在加窗帧的第一子部分的长度与其他子部分之间长度有差别的情况下,还可以相应容易地获得其他修改。换言之,根据分解滤波器组100的实施例的具体实现,并不需要执行上述表达式和方程所示的所有计算。分解滤波器组的其他实施例还可以包括以下实现在该实现中,甚至可以进一步减小计算数量,从而原则上得到了更高的计算效率。将参考图19的情况来描述合成滤波器组情况下的示例。具体地,如还将在合成滤波器组实施例的情况下说明的,可以在从前述ER AAC LD 编解码器导出的所谓的容错高级音频编解码器增强型低延迟(ER AAC ELD)的框架中实现分解滤波器组100的实施例。如所述的,将ER AAC LD编解码器的分解滤波器组修改成达到分解滤波器组100的实施例,从而采用低延迟分解滤波器组作为分解滤波器组100的实施例。如将更详细地说明的,ER AAC ELD编解码器包括分解滤波器组100的实施例和/或随后将更详细地说明的合成滤波器组的实施例,ER AAC ELD编解码器提供了将一般低比特率音频编码的使用扩展到要求编码/解码链延迟非常低的应用的能力。例如,示例来自于全双工实时通信领域,其中可以使用不同实施例,如分解滤波器组、合成滤波器组、解码器、 编码器、混合器、以及会议系统的实施例。在更详细地描述本发明的其他实施例之前,应该注意,以相同的参考标记来表示具有相同或相似功能特性的对象、结构以及部件。除非明确指出,否则关于具有类似或等同功能特性和特征的对象、结构以及部件的描述可以互相交换。此外,在以下图中之一所示的一个实施例或结构中,如果不讨论特定对象、结构或部件的特性或特征,则将针对相同或相似的对象、结构或部件使用概括参考标记。例如,在输入帧130的情况下,已经使用了概括参考标记。。在关于图2中输入帧的描述中,如果涉及特定输入帧,则使用该输入帧的特定参考标记,例如130-k,而在涉及所有输入帧或不具体与其他输入帧区分的一个输入帧的情况下,使用概括参考标记130。从而,使用概括参考标记可以实现对本发明实施例的更紧凑且更清楚的描述。此外,这种情况下应该注意,在本发明的框架中,与第二部件耦合的第一部件可以直接连接到第二部件或经由另外的电路或另外的部件连接到第二部件。换言之,在本发明的框架中,彼此接近的两个部件包括两种选择彼此直接连接或经由另外的电路或另外的部件来连接。图3示出了用于对多个输入帧进行滤波的合成滤波器组200的实施例,其中每个输入帧包括多个有序的输入值。合成滤波器组200的实施例包括串联耦合的频率/时间转换器210、加窗器220、以及重叠/相加器230。首先由频率/时间转换器210对提供给合成滤波器组200的实施例的多个输入帧进行处理。频率/时间转换器210能够基于输入帧来产生多个输出帧,使得每个输出帧是相应输入帧的时间表示。换言之,频率/时间转换器210针对每个输入帧执行从频域到时域的变换。然后,耦合到频率/时间转换器210的加窗器220能够处理由频率/时间转换器 210所提供的每个输出帧,从而基于该输出帧来产生加窗帧。在合成滤波器组200的一些实施例中,加窗器220能够通过对每个输出帧的每个输出采样进行处理来产生加窗帧,其中每个加窗帧包括多个加窗的采样。根据合成滤波器组200的实施例的具体实现,加窗器220能够通过基于加权函数对输出采样进行加权来基于输出帧产生加窗帧。如先前在图1的加窗器110的情况下说明的,加权函数例如可以基于结合了人耳听觉能力或特性(如音频信号响度的对数依赖关系)的心理声学模型。此外或可选地,加窗器220还可以通过将输出帧的每个输出采样与窗、加窗函数或窗函数的采样专用值相乘来基于输出帧产生加窗帧。这些值也称作窗系数或加窗系数。 换言之,在合成滤波器组200的至少一些实施例中,加窗器220可以适于通过将其与窗函数相乘来产生加窗帧的加窗的采样,所述窗函数将实值窗系数归于定义集合中的元素集合的每个元素。将在图5至11的情况下更详细地讨论这样的窗函数的示例。此外,应注意,这些窗函数可以关于定义集合的中点而不对称(asymmetric)或非对称(non-symmetric),继而不需要是定义集合自身的元素。此外,如将在图4的情况下更详细说明的,加窗器220产生多个加窗的采样,以便由重叠/相加器230基于采样前移值以重叠的方式对其进行进一步处理。换言之,每个加窗帧包括比耦合至加窗器220的输出的重叠/相加器230所提供的相加采样数目的两倍更多的加窗的采样。因此,在合成滤波器组200的实施例中,针对至少一些相加采样,重叠/ 相加器能够将来自至少三个不同加窗帧的至少三个加窗的采样相加来产生相加帧。然后,耦合到加窗器220的重叠/相加器230能够针对每个新接收的加窗帧来产生或提供相加帧。然而,如先前所提到的,重叠/相加器230以重叠的方式来操作加窗帧, 以产生单个相加帧。如将在图4的内容中更详细解释的,每个相加帧包括起始部分和其余部分,并且还包括多个相加采样将来自至少三个不同加窗帧的至少三个加窗的采样相加, 以获得相加帧其余部分中的相加采样;以及将来自至少两个不同加窗帧的至少两个加窗的采样相加,以获得起始部分中的相加采样。根据实现,为获得其余部分中的相加采样而相加的加窗的采样的数目可以比为获得起始部分中的相加采样而相加的加窗的采样的数目至少多一个采样。可选地或附加地,根据合成滤波器组200的实施例的具体实现,还可以将加窗器 220配置为根据有序的输出采样的顺序来忽略最早的输出值,以针对多个加窗帧中的每个加窗帧,将相应的加窗的采样设置为预定值或至少设置为预定范围内的值。此外,如将在图 4的情况下说明的,在这种情况下,重叠/相加器230能够基于来自至少三个不同加窗帧的至少三个加窗的采样来提供相加帧其余部分中的相加采样,以及基于来自至少两个不同加窗帧的至少两个加窗的采样来提供起始部分中的相加采样。图4示出了与帧索引k、k-1、k-2、k-3以及k+1相对应的相应标记的五个输出帧 240的示意表示。与图2所示的示意表示相类似,根据图4所示的五个输出帧相对于由箭头250所示时间的顺序来布置这五个输出帧。相对于输出帧ΜΟ-k,输出帧MO-(k-l)、 240-(k-2)以及M0-(k-;3)是过去的输出帧MO。相应地,输出帧MO-(k+1)相对于输出帧 240-k是后续或未来的输出帧。如在图2中输入帧130的情况下已经讨论的,在图4所示的实施例的情况下,图4 所示的输出帧240也各包括四个子集260-1、260-2、260-3和沈0_4。根据合成滤波器组200 的实施例的具体实现,如在图2的框架中在输入帧130的初始部分160的情况下已经讨论的,每个输出帧240的第一子部分沈0-1可以包括或可以不包括初始部分270。因此,在图 4所示的实施例中,与其他子部分沈0-2、260-3和沈0-4相比,第一子部分沈0_1可以更短。 然而,其他子部分260-2、260-3和260-4可以分别包括与前述采样前移值M相等数目的输出采样。如在图3的情况下描述的,在图3所示实施例中,为频率/时间转换器210提供多个输入帧,频率/时间转换器210基于这些输入帧产生多个输出帧。在合成滤波器组200 的一些实施例中,每个输入帧的长度与采样前移值M相同,其中M同样是正整数。然而,频率/ 时间转换器210所产生的输出帧确实包括比输入帧的输入值数目的至少两倍更多的采样数目。更准确地,在根据图4所示情况的实施例中,输出帧240包括的输出采样数目甚至比输入值数目的三倍更多,在关于所示情况的实施例中,每个输入值数目也包括M个输入值。 因此,可以将输出帧分成子部分沈0,其中输出帧240的每个子部分260 (可选地,如前所述, 没有第一子部分260-1)包括M个输出采样。此外,在一些实施例中,初始部分270可以包括M/4个采样。换言之,在M = 480或M = 512的情况下,初始部分270 (如果存在)可以包括120或1 个采样或值。再换言之,如在之前的分解滤波器组100的实施例的情况下所解释的,采样前移值M还与输出帧MO的子部分260-2、260-3和260-4的长度相同。根据合成滤波器组200 的实施例的具体实现,输出帧240的第一子部分沈0-1也可以包括M个输出采样。然而,如果输出帧240的初始部分270不存在,则每个输出帧240的第一子部分沈0_1比输出帧240 中其余子部分沈0-2、沈0-3和沈0-4更短。如前面提到的,频率/时间转换器210向加窗器220提供多个输出帧M0,其中每个输出帧包括比采样前移值M的两倍更大数目的输出采样。然后,加窗器220能够基于频率/时间转换器210所提供的当前输出帧240来产生加窗帧。更明确地,如先前提到的,与输出帧240相对应的每个加窗帧是基于加权函数来产生的。在基于图4所述情况的实施例中,加权函数继而基于窗函数观0,在每个输出帧240上方示意性地示出了窗函数观0。在这种情况下,还应注意,窗函数280不为输出帧MO的初始部分270(如果存在)中的输出采样产生任何贡献。然而,因此,根据合成滤波器组200的实施例的具体实现,需要再次考虑不同的情况。根据频率/时间转换器210,可以以非常不同的方式来适配或配置加窗器220。例如,如果一方面输出帧240的初始部分270存在,使得输出帧240的第一子部分 260-1也包括M个输出采样,则可以将加窗器220适配为使其可以或可以不基于包括相同数目的加窗的采样的输出帧来产生加窗帧。换言之,可以实现加窗器220,使得加窗器220产生也包括初始部分270的加窗帧,例如,如先前在图1和2的情况下讨论的,这可以通过以下方式来实现将相应的加窗的采样设置成预定值(例如,0、最大允许信号幅度的两倍等等)或设置成预定范围内的至少一个值。在这种情况下,输出帧MO以及基于输出帧MO的加窗帧都可以包括相同数目的采样或值。然而,加窗帧的初始部分270中的加窗的采样不必须依赖于输出帧MO中的相应输出采样。然而,对于不在初始部分270中的采样,加窗帧的第一子部分260基于频率/ 时间转换器210所提供的输出帧M0。总之,如在图1和图2中的分解滤波器组的实施例的情况下说明的,如果输出帧 240的初始部分270的至少一个输出采样存在,则可以将相应的加窗的采样设置成预定值或设置成预定范围内的值。如果初始部分270包括多于一个的加窗的采样,则同样的方式也适用于初始部分270的这个或这些其他加窗的采样或值。此外,可以将加窗器220适配为使得加窗帧完全不包括初始部分270。在这样的合成滤波器组200的实施例的情况下,可以将加窗器220配置为忽略在输出帧MO的初始部分270中的输出帧MO的输出采样。在任何这些情况下,根据这样的实施例的具体实现,加窗帧的第一子部分沈0_1 可以包括或可以不包括初始部分270。如果加窗帧的初始部分存在,则该部分中的加窗的采样或值完全不需要依赖于相应输出帧的相应输出采样。另一方面,如果输出帧240不包括初始部分270,则还可以将加窗器220配置为基于本身包括或不包括初始部分270的输出帧240来产生加窗帧。如果第一子部分沈0-1的输出采样的数目小于采样前移值M,则在合成滤波器组200的一些实施例中,加窗器220能够将与加窗帧的初始部分270的“缺失输出采样”相对应的加窗的采样设置成预定值或预定范围内的至少一个值。换言之,加窗器220在这种情况下能够利用预定值或预定范围内的至少一个值来填充加窗帧,使得产生的加窗帧所包括的加窗的采样的数目是采样前移值 M、输入帧的大小或相加帧的长度的整数倍。然而,作为可以实现的另一选项,输出帧240和加窗帧都可以完全不包括初始部分270。在这种情况下,可以将加窗器220配置为简单地对输出帧的至少一些输出采样进行加权,以获得加窗帧。此外或可选地,加窗器220可以采用窗函数280等。如先前在图1和2所示的分解滤波器组100的实施例的情况下说明的,输出帧240 的初始部分270与输出帧250中的最早的采样相对应(在这些值与具有最小采样索引的 “最新”采样相对应的意义上)。换言之,考虑输出帧240的所有输出采样,这些采样是指 与输出帧MO的其它输出采样相比,与在回放重叠/相加器230所提供的相应相加采样时所逝去的最小时间量相对应的采样。换言之,在输出帧MO内以及在输出帧的每个子部分 260内,最新输出采样与相应输出帧240或子部分沈0中左边的位置相对应。再换言之,箭头250所指示的时间与输出帧240的序列相对应而不与每个输出帧MO内的输出采样序列相对应。然而,在更详细地描述重叠/相加器220对加窗帧240进行的处理之前,应该注意,在合成滤波器组200的许多实施例中,将频率/时间转换器210和/或加窗器220适配为使得输出帧240和加窗帧的初始部分270完全存在或完全不存在。在第一种情况下,第一子部分沈0-1中输出或加窗的采样的数目相应地等于输出帧中输出采样的数目(等于M)。 然而,还可以实现合成滤波器组200的实施例,其中可以将频率/时间转换器210和加窗器 220中其一或两者配置为使得初始部分存在,而第一子部分沈0-1中的采样数目仍然小于频率/时间转换器210的输出帧中的输出采样的数目。此外,应注意,在许多实施例中,这样处理任何帧的所有采样或值,尽管当然可以使用相应值或采样中的单个或一部分。如图4底部所示,耦合到加窗器220的重叠/相加器230可以提供相加帧四0,相加帧290包括起始部分300和其余部分310。根据合成滤波器组200的实施例的具体实现, 可以实现重叠/相加器230,以便通过将至少两个不同加窗帧的至少两个加窗的采样相加来获得相加帧起始部分中包括的相加采样。更准确地,因为图4所示的实施例基于在每个输出帧240和相应的加窗帧中包括4个子部分260-1至260-4的情况,所以如箭头320所指示的,起始部分300中的相加采样基于分别来自至少3个或4个不同加窗帧的3个或4 个加窗的采样或值。在图4所使用的实施例的情况下是使用3个还是4个加窗的采样的问题取决于实施例在基于相应输出帧240-k的加窗帧的初始部分270方面的具体实现。在下文中,参考图4,可以将如图4所示的输出帧240看作是由加窗器220基于相应输出帧240提供的加窗帧,这是因为在图4所示情况下,通过至少将输出帧240中在初始部分270外的输出采样与从窗函数280导出的值相乘来获得加窗帧。因此,以下关于重叠/相加器230,参考标记240还可以用于加窗帧。在加窗器220被适配为使得将已有初始部分270中的加窗的采样设置成预定值或预定范围内的值的情况下,如果该预定值或预定范围使得将来自加窗帧M0-k(与输出帧240-k相对应)的初始部分270的加窗的采样求和并不明显干扰或改变结果,则可以将初始部分270中的加窗的采样或加窗的值用在其余三个相加采样的相加中,所述其余三个相加采样来自加窗帧MO-(k-l)(与输出帧MO-(k-l)相对应)的第二子部分、加窗帧 M0-(k-2)(与输出帧M0-(k-2)相对应)的第三子部分、以及加窗帧MO-(k-3)(与输出帧 240-(k-3)相对应)的第四子部分。在将加窗器220适配为使得在加窗帧中不存在初始部分270的情况下,则通常通过将来自至少两个加窗帧的至少两个加窗的采样相加来获得起始部分300中相应的相加采样。然而,因为图4所示的实施例基于各包括4个子部分沈0的加窗帧,所以在这种情况下,通过将来自加窗帧M0-(k-l)、M0-(kD和M0-(k-3)的前述3个加窗的采样相加来获得相加帧四0的起始部分中的相加采样。例如,这种情况可以是由以下情况引起的加窗器220被适配为使得加窗器220忽略输出帧的对应输出采样。此外,应注意,如果预定值或预定范围包括可以导致相加采样的干扰的值,则可以将重叠/相加器230配置为使得在将各加窗的采样相加以获得相加采样时,不考虑对应的加窗的采样。在这种情况下,还可以考虑由重叠/相加器将初始部分 270中的加窗的采样忽略,因为对应的加窗的采样将不会用于获得初始部分300中的相加采样。如图4中的箭头330所指示的,对于其余部分310中的相加采样,重叠/相加器230 适于将来自至少3个不同加窗帧MO (与3个不同输出帧240相对应)的至少3个加窗的采样相加。同样,由于图4所示实施例中加窗帧240包括4个子部分沈0的事实,重叠/相加器230通过将来自4个不同加窗帧240的4个加窗的采样相加来产生其余部分310中的相加采样。更准确地,重叠/相加器230通过将相应加窗的采样相加来获得相加帧四0的其余部分310中的相加采样,所述相应加窗的采样来自加窗帧ΜΟ-k的第一子部分沈0-1、 加窗帧MO-(k-l)的第二子部分沈0-2、加窗帧M0-(k-2)的第三子部分沈0-3、以及加窗帧MO-(k-3)的第四子部分沈0-4。由于上述重叠/相加过程,相加帧290包括M = N/2个相加采样。换言之,采样前移值M等于相加帧四0的长度。此外,至少在合成滤波器组200的一些实施例的情况下,如上所述,输入帧的长度也等于采样前移值M。在图4所示的实施例中,分别使用至少3个或4个加窗的采样来获得相加帧的起始部分300和其余部分310中的相加采样,这种情况仅是出于简单起见而选择的。在图4 所示实施例中,每个输出/加窗帧240包括4个起始部分260-1至沈0-4。然而,原则上,可以容易地实现合成滤波器组的实施例,其中输出或加窗帧仅包括比相加帧四0的相加采样的数目的两倍多一个的加窗的采样。换言之,可以将合成滤波器组200的实施例适配为使得每个加窗帧仅包括2M+1个加窗的采样。如在分解滤波器组100的实施例的情况下说明的,也可以通过修改ER AAC LD编解码器,将合成滤波器组200的实施例并入ER AACELD编解码器(编解码器=编码器/解码器)的框架中。因此,合成滤波器组200的实施例可以用于AAC LD编解码器的情况下, 以定义低比特率且低延迟的音频编码/解码系统。例如,合成滤波器组的实施例可以与可选的SBR工具(SBR=频带复制)一起包含在ER AAC ELD编解码器的解码器中。然而,为了实现充分低的延迟,与ER AAC LD编解码器相比,实现一些修改是合理的,以达到合成滤波器组200的实施例的实现。可以对前述编解码器的合成滤波器组进行修改,以适配低(合成)滤波器组,其中在频率/时间转换器210方面,核心IMDCT算法(IMDCT=反修正离散余弦变换)可以基本保持不变。然而,与IMDCT频率/时间转换器相比,可以采用更长的窗函数来实现频率/时间转换器210,使得现在采样索引η行进到2Ν-1,而不是行进到Ν-1。更准确地,可以将频率/时间转换器210实现为使得将频率/时间转换器210配置为根据以下表达式来提供输出值
芏-1
7 2f J7rι Λ·cos + 0)(众 + 全),0<n<2N 其中,如上所述,η是指示采样索引的整数,i是指示窗索引的整数,k是频谱系数索引,N是基于ER AAC LD编解码器实现中的参数windowsjequence的窗长度,使得整数N 是相加帧四0的相加采样数目的两倍。此外,Iitl是由以下等式给出的偏移值
权利要求
1.一种用于对多个输入帧进行混合的混合器,每个所述输入帧是相应时域帧的频谱表示,所述多个输入帧中的每个输入帧由不同的源来提供,所述混合器包括熵解码器,被配置为对所述多个输入帧进行熵解码;缩放器,被配置为在频域中对多个熵解码后的输入帧进行缩放,并被配置为在频域中获得多个缩放后的帧,每个缩放后的帧与熵解码后的输入帧相对应;相加器,被配置为在频域中将缩放后的帧相加,以在频域中产生相加帧;以及熵编码器,被配置为对所述相加帧进行熵编码以获得混合帧。
2.根据权利要求1所述的混合器,还包括解量化器,被配置为对熵解码后的输入帧进行解量化,并将熵解码后的输入帧以解量化的形式提供给缩放器。
3.根据权利要求1所述的混合器,还包括量化器,被配置为对相加帧进行量化,并将相加帧以量化的形式提供给熵编码器。
4.根据权利要求2所述的混合器,其中,所述缩放器被配置为通过将所述多个输入帧的每个输入值乘以1/P来对解量化后的输入帧进行缩放,其中P是指示不同源的数目的整数。
5.根据权利要求4所述的混合器,其中,所述缩放器被配置为通过以节省能量的方式对输入帧的输入值进行缩放,来对熵解码后的输入帧进行缩放。
6.根据权利要求1所述的混合器,其中,所述混合器被配置为基于所述多个输入帧来提供混合帧,所述多个输入帧中的每个输入帧是基于相同的合成窗函数来产生的。
7.根据权利要求1所述的混合器,其中,所述混合器被配置为根据所述多个输入帧来产生混合帧,所述多个输入帧中的每个输入帧是由包括分解滤波器组的编码器产生的,所述分解滤波器组用于对多个时域输入帧进行滤波,所述输入帧包括多个有序的输入采样, 所述分解滤波器组包括加窗器,被配置为产生多个加窗帧,所述加窗帧包括多个加窗的采样,其中,加窗器被配置为使用采样前移值以重叠的方式来处理所述多个输入帧,其中,所述采样前移值小于输入帧的有序输入采样的数目除以2 ;以及时间/频率转换器,被配置为提供包括多个输出值的输出帧,所述输出帧是加窗帧的频谱表示。
8.根据权利要求1所述的混合器,其中,所述混合器被配置为对所述多个输入帧进行处理,基于与小于每声道361cbit/S的比特率相对应的比特率来提供混合帧。
9.根据权利要求1所述的混合器,其中,所述混合器包括在会议系统中。
全文摘要
本发明提供了一种用于对多个时域输入帧进行滤波的分解滤波器组的实施例,其中输入帧包括多个有序的输入采样,所述分解滤波器组包括加窗器,被配置为产生多个加窗帧,其中加窗帧包括多个加窗的采样,其中加窗器被配置为使用采样前移值以重叠的方式来处理所述多个输入帧,其中所述采样前移值小于输入帧的有序输入采样的数目除以2;以及时间/频率转换器,被配置为提供包括多个输出值的输出帧,其中输出帧是加窗帧的频谱表示。
文档编号G10L19/02GK102243875SQ20111021967
公开日2011年11月16日 申请日期2007年8月29日 优先权日2006年10月18日
发明者伯恩哈德·格瑞, 拉尔夫·盖格尔, 格拉尔德·舒勒, 马库斯·施内尔 申请人:弗劳恩霍夫应用研究促进协会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1