用于混迭误差信号来处理音频信号的装置及方法_2

文档序号：9794130阅读：来源：国知局

；
[0035]图6示出了与第二方面相关的根据重建构、时间反转及开窗口产生的混迭项；
[0036]图7示出了帧中的变化的增益因子；
[0037]图8示出了MDCT逆处理之前的增益因子的应用;及 [0038]图9不出了与图8的处理相关的信号。
【具体实施方式】
[0039] 图la示出根据第一方面的用于处理包含一系列频谱值块的音频信号的装置。所述用于处理的装置包含:处理器100,用于使用针对第一块的至少一个修改值102来处理所述一系列频率值块以获得混迭减少的或不含混迭的第一结果信号104。此外，该处理器使用不同于第一修改值的至少一个第二不同修改值（即，第二修改值106)来处理所述一系列块中的第二块(所述第二块从时间上在第一块之后或从时间上在第一块之前且紧邻第一块），以获得交叠范围中的混迭减少的或不含混迭的第二结果信号108。因此，处理器针对相同交叠范围产生两个不含混迭的或至少混迭减少的时域信号。将这种信号108输入至组合器110 中，以便在交叠范围中组合第一和第二结果信号以获得针对交叠范围的处理后的信号112。优选地，该处理器配置用于产生针对交叠区的两个不含混迭的输出信号，然后，优选地在这两个不含混迭的输出信号之间执行平滑转换。所述处理器实现此操作的一个实现方案是提供完全逆变换处理，诸如，针对这两块或所述块的两个不同修改值的MDCT处理。换言之，处理器针对第一块的交叠范围、针对第一及第二块的同一修改值，产生完全頂DCT处理。此外，该处理器针对第一及第二块执行完全頂DCT处理，但现在使用第二修改值。这种完全頂DCT 处理操作均导致交叠范围中的两个不含混迭的或至少混迭减少的时域结果信号，然后由组合器来组合。
[0040] 随后，在图lb的背景下描述第二方面。图lb示出了根据相对第二方面的本发明实施例的用于处理包含一系列频谱值块的音频信号的装置。该装置包含处理器150,用于使用针对一系列频谱值块114中的第一块的至少一个第一修改值102和使用针对所述一系列频谱值块114中的第二块的至少一个不同第二修改值106,来计算受混迭影响的信号154。除受混迭影响的信号154之外，该处理器配置用于估计混迭误差信号158。此外，该装置包含组合器152,用于组合受混迭影响的信号与混迭误差信号，使得通过由组合器152进行组合获得的处理后的音频信号112是混迭减少的或不含混迭的信号。
[0041] 具体地，根据图lb所示出的第二方面，使用针对属于同一交叠范围内的不同块的不同修改值来执行所述处理，这样导致了受混迭影响的信号154。然而，与现有技术(在现有技术中，将这种受混迭影响的信号用于进一步处理，且现有技术容许混迭诱发的误差）相比，本发明中并不进行此处理。实际上，处理器150附加地计算混迭误差信号158,然后通常通过减法或基本加权型的线性组合，来将混迭误差信号与受混迭影响的信号相结合，使得处理后的音频信号优选为是不含混迭的，即使在并未完全准确计算所述组合或特定混迭误差信号的情况下，所述组合仍然使得处理后的音频信号的混迭误差小于受混迭影响的信号 154〇
[0042]在许多应用中，需要的是通过在将频谱系数馈送至頂DCT之前对所述频谱系数应用增益因子，来修改所述频谱系数，使得：
[0043] Yj(k) = gj(k) · Xj(k)
[0044] 其中Xj (k)是第j个帧的MDCT频谱，k为频率索引，gj (k)是依赖于时间和频率的频谱加权函数，且乃(k)是滤波后的MDCT频谱。图8也示出了增益因子的这种应用。
[0045]具体地，图8示出了典型现有技术的MDCT合成系统，其中由乘法器802将时间索引为j-Ι的在先块800的频谱值乘以至少一个增益因子gj-i。此外，将时间索引为j的当前块804 乘以805处所指示的针对当前块的增益因子或由该增益因子修改。具体地，801处所指示的针对时间索引为j-Ι的在先块的增益因子801与针对当前块的增益因子 gj805是彼此不同的。此外，如图8所述，增益因子可以是频率依赖性的。由频率索引k表示这种情况。因此，根据增益因子属于块800还是804,将索引为k的每个频谱值乘以对应第一或第二增益因子 801、805。因此，由于所述两个块的增益因子是时变的和/或频变的的事实，当应用图8的处理时，在处理中产生混迭误差。这种处理包括针对在先块800的頂DCT操作807和针对当前块 804的另一 MDCT操作808。MDCT操作包括频率时间变换和后续迭出（fo ld-out)操作，其中将在图2b的背景下进一步描述后续迭出操作。然后，由块809执行交叠相加处理，以便最后获得在810处所指示的受混迭影响的信号y(η)，其中所述交叠相加处理在实际相加之前，附加地包含合成开窗口器。因此，受混迭影响的信号810通常恰好与图154的154所示的受混迭影响的信号相同。
[0046] 如果两个后续帧中的增益不同，则混迭项不再彼此抵消，如图9中可看出（右边），其中增益因子在频率上是恒定的，但在时间上不恒定。在该示例中，增益为go(k) = l及gi(k) =〇. 7，使得剩余混迭分量为与因子0.3相乘的来自帧0的混迭。
[0047] 应注意，对于这种简单状况（主要选择该状况来进行说明），频域处理是并非必要的，这是由于可以通过应用合适的时间包络来在没有混迭问题的情况下实现类似效应。然而，这种示例有助于解释混迭减少方案的基本构思。文中，剩余混迭分量是经时间反转且经开窗口的输入信号，其中所述输入信号与两个增益因子的差值(在不例中，为〇. 3)相乘。因此，可以通过以下步骤来消除混迭：
[0048] ?通过针对所述两个块具有相等增益的附加頂DCT，来重建构交叠区中的输入信号
[0049] #乘以函数w(n) · w(N+n)
[0050] ?时间反转 [0051 ] ?乘以增益差0.3
[0052] ?与具有不同增益的处理的输出的减法 [0053]图6示出了前三个步骤的输出。
[0054] 在第一方面，计算针对交叠区的两个不含混迭的输出信号，然后在该两个输出信号之间执行平滑转换。图5a示出了实施例的框图。
[0055] 通过用相等增益因子集gn(k)对具有频谱系数XH(kWPXj(k)的两个受影响帧进行MDCT处理，来获得第一信号p lu(n)。两个帧的时域混迭分量彼此消除，这是由于不存在增益差。相应地，根据iaWPXXk)产生第二信号p 2u(n)，但现在使用增益因子gj(k)。现在可以根据在交叠区内执行从Plu(n)向p 2u(n)的平滑转换，获得频谱形状的变化：
[0056] y(jN+n)=f(n) · pi，j(n) + (l-f(n)) · p2,j(n)
[0057] 其中f (η)通常在区间0 < n<N中自1至0地单调递减。对于f (η) = l_w2(n)的情况，可以示出两个方法产生恰好相同的输出（详见附录）。然而，独立于MDCT窗口来选择平滑转换函数(cross fade function)的自由性为这个方法提供了优点，其中图5a示出了此方法。
[0058] 对于纯增益变化，第二过程可以通过产生两个不含混迭的信号并执行平滑转换，来减少混迭分量。这里，通过在两个对应帧中使用相等修补(patching)和相等增益因子，获得两个信号中的每个信号(参见图5b)。对于恒定且固定的修补，无需进行专门区分。恒定修补将针对所有帧仅推断相等映射Pj (k) = P(k)。
[0059] 如果增益因子不仅随时间变化，而且随频率变化，则处理变得更复杂。在这种情况下，不再可能经由时间包络进行替换，产生时间反转的输入信号也无法提供用于减少混迭分量的合适信号。在以下示例中示出这种情况，其中第一帧中的增益再次在频率上是恒定的(g〇(k) = l)，但在第二帧中，gi(k)如图7所示地变化。
[0060] 这种情况导致未消除的混迭分量，然而该未消除的混迭分量的形状不同于图9中所示的形状(右边）。如第一示例中可见，增益差导致未消除的混迭分量。因此，图3a示出了该过程。
[0061 ]通过图3a所示的以下步骤来执行混迭减少：
[0062] ?通过用增益差对原始系数进行加权(307、308)，产生附加频谱系数：
[0063] Uj-i(k) = (gj(k)-gj-i(k)) · Xj-i(k)
[0064] Uj(k) = (gj(k)_gj-i(k)) .Xj(k)
[0065] ?通过用Uj-Kk)和Uj(k)进行附加頂DCT，对交叠区中的输入信号进行重构（303、 304、306)。
[0066] #与函数w(n) · w(N+n)相乘（330)
[0067] ?时间反转(340)
[0068] ?对具有不同增益的处理的输出进行组合，例如，加法或减法
[0069]对于具体示出的MDCT实现方案，增益差项(gKlO-gj-Kk))的顺序确定是否必须将时间反转的输出与常规IMDCT输出相加或相减。对于其他MDCT实现方案，符号可以是不同： [0070] (gj(k)-gH(k)):将时间反转的输出与常规頂DCT输出相加。
[0071] (gj-i (k) -gj (k)):从常规頂DCT输出减去时间反转的输出。
[0072]因此，对于上文所述的实施例和对于图3a所示的情况（其中示出了（gXlO-gn (k)))，组合器341被实现为将两个输入相加的加法器。
[0073]应注意，对于交迭变换的不同实现方案，需要的符号可以不同。例如，对于奇数堆栈MDCT，存在至少四个实施例。此外，对于偶数堆栈MDCT或具有多个交叠的ELT，存在其他实施例。对于奇数堆栈MDCT，校正项的符号是不同的。因此，块341中执行的组合可包括加法或减法。
[0074]图4示出了当前示例的混迭校正项与混迭的頂DCT输出。
[0075]通过映射函数P(k)来描述BWE算法的向上复制级。对于将频谱系数的下半部分复制至上半部分，应如下所示：
[0077] 增益函数在下半部分中可以是恒定的且等于1:
[0078] gj(k) = g^|^t〇<k<N/2
[0079] 如果增益因子可以在频谱上半部分中改变，则可以再次出现未消除的混迭。然而，可以恰好以与在上文所述的第一方法中所描述的相同方式来执行混迭减少，差别仅在于在产生补偿信号时还必须考虑修补。可以通过在将经映射频谱系数馈送至頂DCT时使用所述系数及用增益差适当地对所述系数进行加权，来实现此操作。在这种情况下，下半部分中的所有增益差将为零。
[0080] 更先进的带宽扩展可以应用在帧与帧之间有所不同的修补。可通过针对每个帧定义单独的映射函数Pj(k)来描述这种情况。在这种情况下，混

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6