用于编码音频信号的编码器、音频发送系统和用于确定校正值的方法_3

文档序号:9932717阅读:来源:国知局
102的频谱的频点(frequency bin)的能量的量或测量结果146。频谱处理器 还包括归一化器14化,用于归一化已变换预测系数122'化SF),W获得归一化预测系数147。 可例如关于多个LSF中的最大值来相对地归一化已变换预测系数,和/或可绝对地(即,关于 预定值,例如所预期的且可由所使用的计算变量表示的最大值)归一化已变换预测系数。
[0063] 频谱处理器145还包括第一确定器145c,第一确定器145c被配置为确定每个归一 化预测系数的频点能量(bin energy),即,将从归一化器14加获得的每个归一化预测参数 147与计算出的测量146相关,W获得包含每个LSF的频点能量的矢量Wl。频谱处理器145还 包括第二确定器145d,第二确定器145d被配置为发现(确定)每个归一化LSF的频率加权,W 获得包含频率权重的矢量W2。另一信息114包括矢量Wl和W2,即,矢量Wl和W2是表示另一信 息114的特征。
[0064] 处理器142'被配置为基于已变换预测系数122'和IHM的幕(例如,二次幕)来确定 I丽,其中,备选地或附加地,还可W计算更高次幕,其中,I丽及其(多个)幕形成加权因子 142'。
[0065] 组合器150"被配置为基于另一信息114和加权因子142'确定已校正加权因子(已 校正LSF权重152')。
[0066] 备选地,处理器140'、频谱处理器145和/或组合器可被实现为单个处理单元,例如 中央处理单元、(微)控制器、可编程口阵列等。
[0067] 换言之,针对组合器的第一条目和第二条目是I歷和I歷2,即,加权因子142'。针对 于每个LSF矢量元素 i,第=条目是:
[006引
[0069] 其中,Wfft是Wl和W2的组合,且min是Wfft的最小值。
[0070] i = 0..M,其中,在根据音频信号推导出16个预测系数时,M可W是16, W及
[0071]
[0072] 其中,bi址ner包含每个频谱段的能量,即,bi址ner对应于测量146。
[0073] 映射
是对频谱包络中的共振峰的能量的粗略近似。 化eqWTable是包含附加权重的矢量,该附加权重是根据作为语音或非语音的输入信号来选 择的。
[0074] Wfft是对靠近预测系数(如,LSF系数)的频谱能量的近似。简言之,如果预测化SF) 系数包括值X,则运意味着音频信号(帖)的频谱在频率X处或在频率X下方包括能量最大值 (共振峰Kwfft是频率X处的能量的对数表达,即,其对应于该位置处的对数能量。在与之前 描述为利用反射系数作为另一信息的实施例相比较时,备选地或附加地,可使用Wfft(Wl) 和FrequW化ble(W2)的组合来获得另一信息IMDFrequWTable描述了要使用的多个可能表 格之一。基于编码器300的"编码模式"(例如语音、摩擦音(打icative)等),可选择多个表格 中的至少一个。在编码器300的操作期间,可训练(编程或适配)多个表格中的一个或多个。
[0075] 对使用Wfft的发现被用于增强对表示共振峰的已变换预测系数的编码。与经典的 噪声成形(其中,噪声在包括大量(信号)能量的频率处)相比,所描述的方案设及量化频谱 包络曲线。当功率谱在包括已变换预测系数的频率或被布置为与已变换预测系数的频率相 邻的频率处包括大量能量(较大测量)时,可对该已变换预测系数化SF)进行更好地量化, 良P,与包括较低能量测量的其他系数相比,W较高的权重实现较低的误差。
[0076] 图4a示出了包括所确定的线谱频率的16个条目值的矢量线谱频率是由变换 器基于所确定的预测系数获得的。处理器被配置为还获得16个权重,示例性地,在矢量IHM 中表不的反调和平均IHM。将校正值162分组为例如矢量a、矢量b和矢量C。矢量a、b和C中的 每一个包括16个值ai-16、bl-16和C1-16,其中,同样的索引指示相校正值与包括相同^引的 预测系数、其变换表示W及加权因子有关。图4b示出了根据实施例的由组合器150或150'执 行的确定规则。组合器被配置为计算或确定基于形式Z = 崎+些2的多项式函数的结果, 即,将不同的校正值a、b、c与加权因子(示出为X)的不同幕进行组合(相乘)。至表示所获得的 已校正加权因子的矢量。
[0077] 备选地或附加地,组合器还可被配置为添加其他校正值(d、e、f......)W及加权 因子的其他幕或另一信息的其他幕。例如,可通过将包括16个值的矢量马与另一信息114的 S次幕相乘来扩展图4b中描绘的多项式,相应矢量也包括16个值。当图3中所述的处理器 140'被配置为确定I丽的其他幕时,运可W例如是基于I歷 3的矢量。备选地,可W仅计算至 少矢量及可选地,更高阶矢量自、4、...中的一个或多个。简而言之,多项式的阶数随着 每一项而增加,其中,基于加权因子和/或可选地基于另一信息,可形成每种类型,其中,当 包括更高阶的项时,多项式也基于W下形式:至= 四 2。校正值a、b、C W及可选地d、 e.......可包括实数值和/或虚数值,且还可包?零值。
[0078] 图4c描绘了用于示出获得已校正加权因子152或152'的步骤的示例性确定规则。 已校正加权因子被表示在包括16个值的矢量單中,针对图4a中描绘的已变换预测系数中的 每一个存在一个加权因子。根据图4b中示出的确定规则来计算已校正加权因子W1-16中的每 一个。W上描述应当仅示出确定已校正加权因子的原理,且不应被限于上述的确定规则。也 可对上述确定规则进行改变、缩放、更易等。一般而言,通过执行校正值与所确定的加权因 子的组合来获得已校正加权因子。
[0079] 图5a示出了示例性的确定方案,其可由诸如量化器170的量化器实现,W确定已变 换预测系数的量化表示。量化器可合计误差,例如所确定的已变换系数(示出为LSFi)与参 考系数(指示为LSF'i)之间的差或其幕,其中,参考系数可存储在量化器的数据库中。可对 所确定的距离取平方,使得仅获得正值。通过相应的加权因子Wi对距离(误差)中的每一个 进行加权。运使得可向对音频质量具有更大重要性的频率范围或已变换预测系数给予更高 的权重,而向对音频质量具有较小重要性的频率范围给予较低权重。在索引1-16中的一些 或全部上对误差进行合计,W获得总误差值。运可针对系数的多个预定义组合(数据库条 目)来进行,系数可被组合为如图化中所指示的集合如'、Qu"、...如n。量化器可被配置为选 择与预定义系数集合有关的码字,该预定义系数集合关于所确定的已校正加权因子和已变 换预测系数包括最小误差。码字可W例如是表格的索引,使得解码器可基于接收到的索引、 接收到的码字分别恢复预定义集合如'、Qu"、...。
[0080] 为了在训练阶段期间获得校正值,选择根据其来确定参考权重的参考确定规则。 当编码器被配置为关于参考权重来校正所确定的加权因子且参考权重的确定可离线(即, 在校准步骤等期间)进行时,可选择包括高精确度(例如,低LSD)的确定规则,同时忽略所产 生的计算量。优选地,可选择包括高精确度且可能包括高计算复杂度的方法,W获得预定大 小的参考加权因子。例如,可使用根据G.718标准[3]的确定加权因子的方法。
[0081] 还执行编码器将根据其来确定加权因子的确定规则。运可W是包括较低计算复杂 度且同时接受较低确定结果精确度的方法。根据该两个确定规则计算权重,同时使用包括 例如语音和/或音乐的音频素材集。可通过数目为M的训练矢量的形式表示音频素材,其中, M可包括100 W上、1000 W上或5000 W上的值。将所获得的加权因子的该两个集合存储在矩 阵中,每个矩阵包括各自与M个训练矢量中的一个训练矢量有关的矢量。
[0082] 针对M个训练矢量中的每个训练矢量,确定包括基于第一(参考)确定规则确定的 加权因子的矢量与包括基于编码器确定规则确定的加权因子的矢量之间的距离。对距离进 行合计,W获得总距离(误差),其中,可对总误差求平均,W获得平均误差值。
[0083] 在校正值的确定期间,目标可W是降低总误差和/或平均误差。因此,可基于图4b 中示出的确定规则来执行多项式拟合,其中,将矢量3、与、自和/或其他矢量适配到多项式,使 得可降低或最小化总误差和/或平均误差。多项式被拟合到基于确定规则确定的加权因子, 确定规则将在解码器处执行。可对多项式进行拟合,W使得总误差或平均误差低于阔值,例 如,0.01、0.1或0.2,其中,1指示完全失配。备选地或附加地,可对多项式进行拟合,使得可 通过基于误差最小化算法的使用来最小化总误差。值0.01可指示可表达为差(距离)和/或 表达为距离之商的相对误差。备选地,可通过确定校正值W使得所产生的总误差或平均误 差包括与数学最小值接近的值来进行多项式拟合。运可通过例如对所使用的函数求导数W 及基于将所获得的导数设置为OW进行优化来进行。
[0084] 当在编码器侧添加附加信息(如针对114所示出的)时,可实现距离(误差)(例如, 欧氏距离)的进一步减少。还可W在校正参数的计算期间使用该附加信息。可通过将该信息 与用于确定校正值的多项式进行组合来使用该信息。
[0085] 换言之,首先,可从包含5000秒W上的语音和音乐素材(或语音和音乐素材的M个 训练矢量)的数据库提取WM权重和G. 718权重。IHM权重可存储在矩阵I中,且G. 718权重可 存储在矩阵G中。设Ii和Gi是包含整个训练数据库的第i个ISF或LSF系数的所有I歷和G. 718 权重Wi的矢量。可基于W下等式确定运两个矢量之间的平均欧氏距离:
[0086]
[0087]为了最小化运两个矢量之间的距离,可将二次幕多项式拟合为:
[008引
[0089] 可引入矩阵
,且为了进行重写引入矢量Pi= [PO,i PLi P2,i ]T:
[0093] 为了得到具有最低平均欧氏距离的矢量Pi,可将导数^设置为0:O Pj
[0090]
[0091]
[0092]
[0094] ,
[0095]
[0096]
[0097] 为了进一步降低所提议的权重与G. 718权重之间的差(欧氏距离),可将其他信息 的反射系数添加到矩阵Ell。例如因为反射系数携带与在LSF或ISF域中不可直接观察的LPC 模型有关的一些信息,其有助于降低欧氏距离Ell。在实践中,很可能不是所有的反射系数 都会导致欧氏距离的显著减少。发明人发现使用第1反射系数和第14反射系数可W是足够 的。添加反射系数EIi,矩阵将看起来像是:
[009引
当前第3页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1