低复杂度音调自适应音频信号量化的制作方法

文档序号:9383156阅读:535来源:国知局
低复杂度音调自适应音频信号量化的制作方法
【专利说明】低复杂度音调自适应音频信号量化
[0001] 本发明涉及数字音频信号处理。更具体地,本发明涉及音频信号量化。
[0002] 在极低比特率变换编码中,每帧的位的数目通常不足以避免解码的信号中的伪 影。特别是,由于变换线(频点(bin))在某一频率处逐帧被"打开及关闭",即量化为零或 未量化为零,音乐噪声可以出现在固定音乐或噪声频谱中。这样的编码方法不仅给予解码 的信号区与原始信号相比更加具有音调性的特性(因此术语为音乐噪声),而且其相对于 未编码所述频谱区根本没有产生显著的优点,并且反而应用了类似于在xHE_AAC[4]中使 用的TCX或FD编码系统中的噪声填充算法的频点替换技术。事实上,倾向于音乐编码噪声 的区域的显式但非充分编码需要在变换编码器的熵编码阶段中的位,其在声音上较好地耗 费在其它频谱区中,特别是在人类听觉系统灵敏的低频率处。
[0003] 减少音乐噪声在低比特率音频编码中出现的一个方法是,修改将输入频谱线映射 至量化索引的量化器的行为,使得该量化器适于瞬时输入信号特性和量化频谱的位消耗。 更准确地,信号自适应地改变了在量化期间使用的死区。已公开了若干方法[5、6及其中的 参考]。在[5]中,对将要编码的整个频谱执行量化器适应。因此,已适应的量化器对于给 定帧的所有频点行为相同。此外,在最佳死区 2_的量化的情况下,边信息的2个位必须被 传输至解码器,表示比特率及向后兼容惩罚。在[6]中,基于每频率频带对量化器进行调 适,但每频带进行两个量化尝试,并且(根据某一决策)仅将较佳的尝试用于传输。这是复 杂的。
[0004] 本发明的目的在于提供音频信号处理的改进概念。更具体的,本发明的目的在于 提供自适应音频信号量化的改进概念。本发明的目的通过根据权利要求1的音频编码器、 通过根据权利要求15的系统、通过根据权利要16的方法并且通过根据权利要17的计算机 程序来实现。
[0005] 在一个方面中,本发明提供一种音频编码器,用于对音频信号进行编码,以便从中 产生编码信号,该音频编码器包括:
[0006] 帧装置,其被配置成从该音频信号提取帧;
[0007] 量化器,其被配置成将从该音频信号的帧得到的频谱信号的频谱线映射至量化索 弓丨;其中,该量化器具有死区,在该死区中频谱线被映射至量化索引零;以及
[0008] 控制装置,其被配置成修改死区;
[0009] 其中,该控制装置包括音调计算装置,其被配置成计算用于至少一个频谱线或用 于至少一组频谱线的至少一个音调指示值,
[0010] 其中,该控制装置被配置成取决于各个音调指示值来修改用于至少一个频谱线或 至少一组频谱线的该死区。
[0011] 帧装置可以被配置成通过将窗口函数应用至音频信号来从音频信号提取帧。在信 号处理中,窗口函数(也称为切趾函数或渐变函数)为在某些选定的区间以外为零值的数 学函数。通过将窗口函数应用至信号,可以将信号分解为短片段,其通常被称为帧。
[0012] 在数字音频信号处理中,量化是将一大组输入值映射至(可计数的)较小组(如 将值舍位至某些精度的单位)的过程。执行量化的装置或算法函数被称为量化器。
[0013] 根据本发明,针对音频信号的帧计算频谱信号。频谱信号可以包含音频信号的帧 中的每一个的频谱,该音频信号为时域信号,其中每一个频谱为频域中的帧的一个的表示。 频率谱可以经由信号的数学变换来产生,并且结果值通常呈现为振幅对比于频率。
[0014] 死区为在量化期间使用的区域,其中频谱线(频点)或多组频谱线(频带)被映 射至零。死区具有通常在零振幅处的下限,以及可以针对对不同频谱线或多组频谱线而变 化的上限。
[0015] 根据本发明,死区可以通过控制装置进行修改。控制装置包括音调计算装置,其被 配置成计算用于至少一个频谱线或用于至少一组频谱线的至少一个音调指示值。
[0016] 术语"音调"指频谱信号的音调特性。一般而言,在频谱主要包括周期分量的情况 下可以说音调高,其意指帧的频谱包括主峰值。音调特性的相反特性为噪声特性。在后者 情况下,帧的频谱更平坦。
[0017] 此外,控制装置被配置成取决于各个音调指示值来修改用于该至少一个频谱线或 该至少一组频谱线的死区。
[0018] 本发明揭示了具有信号自适应死区的量化方案,该信号自适应死区
[0019] ?不需要任何边信息,允许其在现有介质编解码器中的使用,
[0020] ?在量化之前决定每频点或频带使用哪一个死区,节约复杂度,
[0021] ?可以基于频带频率和/或信号音调来确定每频点或每频带死区。
[0022] 本发明可以应用于现有编码结构中,因为仅改变编码器中的信号量化器;对应的 解码器将仍能够读取从编码信号产生的(未改变的)比特流,并且对输出进行解码。与[6] 及其参考不同,在量化前之前选择用于每组频谱线或用于每个频谱线的死区,所以每组频 谱线或每个频谱线仅一个量化运算是必要的。最后,量化器决策不限于在两个可能的死区 值之间进行选取,而是在值的整个范围进行选取。下文详述决策。以上概术的音调自适应 量化方案可以在LD-USAC编码器的变换编码激励(TCX)路径中实施,该LD-USAC编码器为 xHE-AAC[4]的低延迟变体。
[0023] 根据本发明的优选实施方式,控制装置被配置成用以下方式来修改死区DZ :在频 谱线中的一个处的死区大于在具有较大音调的频谱线中的一个处的死区,或者在多组频谱 线中的一组处的死区大于在具有较大音调的多组频谱线中的一组处的死区。通过这些特 征,非音调频谱区将倾向于被量化为零,其意指可以减少数据的量。
[0024] 根据本发明的优选实施方式,控制装置包括功率频谱计算装置,其被配置成计算 音频信号的帧的功率频谱,其中该功率频谱包括频谱线或多组频谱线的功率值,其中,音调 计算装置被配置成取决于功率频谱来计算至少一个音调指示值。通过基于功率频谱来计算 音调指示值,计算复杂度保持相当低。
[0025] 根据本发明的优选实施方式,用于频谱线中的一个的音调指示值基于用于各个频 谱线的功率值与功率频谱的各个频谱线周围的预定数目的功率值之和的比较,或者其中, 用于多组频谱线中的一组的音调指示值基于用于各个组的频谱线的功率值与功率频谱的 各个组的频谱线周围的预定数目的功率值之和的比较。通过对功率值与其相邻功率值进行 比较,可以容易地识别功率频谱的峰值区域或平坦区域,以使得可以以容易的方式计算音 调指示值。
[0026] 根据本发明的优选实施方式,用于频谱线中的一个的音调指示值基于音频信号的 在先帧的频谱线的音调指示值,或者其中,用于多组频谱线中的一组的音调指示值基于用 于音频信号的在先帧的该组频谱线的音调指示值。通过这些特征,将以平滑的方式随着时 间推移对死区进行修改。
[0027] 根据本发明的优选实施方式,通过以下公式计算该音调指示值:
[0028]
[0029] 兵干,1 73指不谈苜频1目亏的狩疋Ψ贝的系引,k 73指不狩疋频谐线的系引,为第 i帧的第k频谱线的功率值,或者其中,通过以下公式计算该音调指示值:
[0030]
[0031] 其中,i为指示音频信号的特定帧的索引,m为指示频谱线的特定组的索引,Pniil为 第i帧的频谱线的第m组频谱线的功率值。如将从公式中注意到的那样,根据作为当前帧 的第i帧并且根据作为在先帧的第i-Ι帧的功率值来计算音调指示值。可以通过省略对第 i-Ι帧的依赖性来改变公式。此处,第k功率值的7个左侧和7个右侧相邻功率值之和被计 算并且除以各个功率值。使用这个公式,低音调指示值指示高音调。
[0032] 根据本发明的优选实施方式,音频编码器包括起始频率计算装置,其被配置成计 算用于修改该死区的起始频率,其中,仅针对表示高于或等于起始频率的频率的频谱线对 死区进行修改。这意指死区对于低频率是固定的,并且对于较高频率是可变的。这些特征 导致较好的音频质量,因为人类听觉系统在低频率处更为灵敏。
[0033] 根据本发明的优选实施方式,起始频率计算装置被配置成基于音频信号的样本率 和/或基于针对从编码信号产生的比特流预见的最大比特率来计算起始频率。通过这些特 征将可以对音频质量进行优化。
[0034] 根据本发明的优选实施方式,音频编码器包括:修改离散余弦变换计算装置,其被 配置成根据音频信号的帧来计算修改的离散余弦变换;以及修改离散正弦变换计算装置, 其被配置成根据音频信号的帧来计算修改的离散正弦变换,其中,功率频谱计算装置被配 置成基于修改的离散余弦变换和基于修改的离散正弦变换来计算功率频谱。不管怎样,为 了对音频信号进行编码的目的,必须计算修改的离散余弦变换。因此,只是为了音调自适应 量化的目的,必须另外计算修改的离散正弦变换。从而,可以降低复杂度。然而,可以使用 如离散傅里叶变换或奇数离散傅立叶变换的其它变换。
[0035] 根据本发明的优选实施方式,功率频谱计算装置被配置成根据公式Pk, i = (MDCT k, J^(MDSTu)2来计算功率值,其中i为指示音频信号的特定帧的索引,k为指示特定频谱线 的索引,MDCI mS在该第i帧的第k频谱线处的修改的离散余弦变换的值,MDSTkil为在该 第i帧的第k频谱线处的修改的离散正弦变换的值,以及P kil为该第i帧的第k频谱线的 功率值。以上公式允许以容易的方式计算功率值。
[0036] 根据本发明的优选实施方式,音频编码器包括频谱信号计算装置,其被配置成产 生频谱信号,其中,频谱信号计算装置包括振幅设定装置,其被配置成以补偿由于对死区的 修改造成的能量损失的方式来设置频谱信号的频谱线的振幅。通过这些特征,可以以能量 保持的方式进行量化。
[0037] 根据本发明的优选实施方式,振幅设定装置被配置成取决于各个频谱线处的死区 的修改来设置频谱信号的振幅。例如,可出于这个目的对被扩大死区的频谱线进行轻微放 大。
[0038] 根据本发明的优选实施方式,频谱信号计算装置包括标准化装置。通过这个特征, 可以以容易的方式进行后续量化步骤。
[0039] 根据本发明的优选实施方式,将通过修改离散余弦变换
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1