音频信号编码器的制造方法_3

文档序号:9713661阅读:来源:国知局
的立体声编码器/解码器设备或方法的部分。
[0108] 图2示出了实施方式使用的音频编解码器的一般性操作。一般的音频编码/解码系 统包括编码器和解码器,如图中示意性示出。但是,可以理解一些实施方式能够实施编码器 或解码器之一或编码器或解码器两者。图2示出的是系统102,具有编码器104由其是立体声 编码器151、存储或媒体信道106以及解码器108。可以理解如上所述的一些实施方式能够包 括或实施编码器104或解码器108之一或编码器104和解码器108两者。
[0109] 编码器104压缩输入音频信号110,产生比特流112,其在一些实施方式能够被存储 或通过媒体信道106被传输。此外编码器104能够包括立体声编码器151,作为总编码操作的 部分。可以理解立体声编码器可以是总编码器104的部分或分开的编码模块。编码器104还 能够包括编码多于两个音频信号的多信道编码器。
[0110]比特流112能够在解码器108内被接收。解码器108解压该比特流112并处理输出音 频信号114。解码器108能够包括立体声解码器,作为总解码操作的部分。可以理解立体声解 码器可以是总解码器108的部分或分开的解码模块。解码器108还能够包括解码多于两个音 频信号的多信道解码器。与输入信号110有关的比特流112的比特率和输出音频信号114的 质量是定义编码系统102的性能的主要特征。
[0111] 图3示意性示出了根据一些实施方式的编码器104。图6示意性示出了根据一些实 施方式的编码器104的操作的流程图。在这里提供的示例中,输入音频信号是两信道或立体 声音频信号,其被分析且从单信道参数编码器生成单信道参数表示且从立体声参数编码器 生成立体声编码参数。但是可以理解在一些实施方式中输入能够是被分析的任意数量的信 道且缩混参数编码器生成缩混参数表示且信道扩展参数编码器生成扩展信道参数。
[0112] 这里描述的实施方式的概念因此是确定并应用多信道(立体声)编码方法以产生 有效高质量和低比特率实际生活的多信道(立体声)信号编码。为此关于图3示出了根据一 些实施方式的示例编码器104。此外关于图6更详细示出了编码器104的操作。
[0113]在一些实施方式中编码器104包括帧分段器/变换器201。帧分段器/变换器201被 配置成接收左和右(或更一般地任意多信道音频表示)输入音频信号并生成要被分析并编 码的这些音频信号的频域表示。这些频域表示能够被传递给信道分析器203。
[0114] 在一些实施方式中帧分段器/变换器能够被配置成将音频信号数据分段或分节成 适合频域变换的分段或帧。在一些实施方式中帧分段器/变换器201还能够被配置成根据任 意合适的窗口功能对音频信号数据的这些帧或分段加窗口。例如帧分段器/变换器201能够 被配置成生成20ms的帧,其重叠之前和之后的帧10ms。
[0115] 在一些实施方式中帧分段器/变换器能够被配置成对音频信号数据执行任意合适 的时-频域变换。例如该时-频域变换能够是离散傅里叶变换(DFT)、快速傅里叶变换(FFT)、 修正离散余弦变换(MDCT)。在以下示例中,使用快速傅里叶变换(FFT)。此外时-频域变换器 的输出还能够被处理以生成每个输出信道音频信号数据的分开的频带域表示(子带表示)。 这些频带能够以任意合适方式被安排。例如这些频带能够是线性间隔的,或是感觉上或心 理声学上被分配的。
[0116] 图6中步骤501示出了生成音频帧带频域表示的操作。
[0117] 在一些实施方式中频域表示被传递到信道分析器203。
[0118] 在一些实施方式中,编码器104能够包括信道分析器203或用于分析至少一个音频 信号的装置。信道分析器203能够被配置成接收多信道或立体声输入的子带过滤表示。此外 信道分析器203在一些实施方式中能够被配置成分析频域音频信号并确定关于立体声或多 信道音频信号差的与每个子带相关联的参数。
[0119] 在一些实施方式中生成的单信道(或缩混)信号或单信道(或缩混)参数能够被传 递到单信道参数编码器204。
[0120] 立体声参数(或更一般地多信道参数)能够被输出给立体声参数编码器205。
[0121] 在这里描述的示例中,关于频域参数定义单信道(或缩混)和立体声(或信道扩展 或多信道)参数,但是在一些实施方式中能够生成时域或其他域参数。
[0122] 图6中的步骤503示出了确定立体声(或信道扩展或多信道)参数的操作。
[0123] 关于图4,更详细描述了根据一些实施方式的示例信道分析器203。此外关于图7, 描述了根据一些实施方式的如图4中示出的信道分析器203的操作。
[0124] 在一些实施方式中,信道分析器/单信道编码器203包括移位(shift)确定器301或 用于确定至少两个音频信号之间的移位的装置。移位确定器301被配置成选择子带的移位 由此其在频域最大化信号与移位的信号之间的相关的实部。该移位(或最佳相关索引C0R_ IND [ j ])能够使用例如以下代码来确定。

[0127]其中值MAXSHIFT是最大允许移位(该值能够基于支持的麦克风结构型号或更简单 地麦克风之间的距离),PI是3i,C0R_INIT是初始相关值或用于初始化相关计算的大负值,以 及⑶R_BAND_START[]定义子带的起始点。这里使用的向量svec_re□和svec_im[],即该向 量的实部值和虚部值如下被定义:
[0130] 图7中的步骤553示出了确定该相关值的操作。
[0131] 在一些实施方式中相关值能够被传递给单信道信道编码器204并作为立体声信道 参数给立体声参数编码器205且在一些实施方式中给移位差选择器705。
[0132] 此外,在一些实施方式中该移位值被应用到音频信道中的一个以提供信道之间的 时间校准。这些校准的信道音频信号在一些实施方式中能够被传递到相对能量信号强度确 定器303。
[0133]图7中的步骤552示出了使用确定的移位值校准信道的操作。
[0134]在一些实施方式中,信道分析器/编码器203包括相对能量信号强度确定器303或 用于确定至少两个音频信号之间的相对强度差的装置。相关能量信号强度确定器303被配 置成接收输出的校准的频域表示并确定每个子带的信道对之间的相对信号强度。可以理解 在以下示例中单对信道由合适的立体声信道分析器分析并被处理,但是可以理解在一些实 施方式中该操作能够被扩展到任意数量的信道(换句话说多信道分析器或用于分析多个或 两个或更多个信道的合适装置,以确定定义信道的参数或信道之间的差)。这能够通过例如 合适的多信道配对产生能够如这里所述被分析的信道对来实现。
[0135]在一些实施方式中每个带的相对强度能够使用以下代码被计算。
[0138] 其中L_FFT是FFT的长度和EPSILON是大于零的小值,用于防止零除问题。在这样的 实施方式中相对能量信号强度确定器有效在每个子带生成每个信道(例如在立体声信道配 置中左信道L和右信道R)的大小确定且然后用一个信道值除以另一信道值以生成相对值。 在一些实施方式中,相对能量信号强度确定器303被配置成输出相对能量信号强度给单信 道(或缩混)参数编码器204和立体声(或多信道或信道扩展)参数编码器205且在一些实施 方式中到强度差选择器703。
[0139] 图7中的步骤553示出了确定相对能量信号强度的操作。
[0140] 在一些实施方式中,能够执行任意合适强度间(能量)和时间间(移位或延迟)差估 计。例如对于每个帧能够有两个估计移位(延迟)和强度的窗口。因此例如如果每个帧是 l〇ms则可以有两个窗口,其可以重叠且彼此延迟5ms。换句话说对于每个帧能够有确定的两 个分开的延迟和强度差值,其能够被传递给编码器以用于编码。
[0141] 此外在一些实施方式中,对于每个窗口,能够针对相关子带的每个来估计所述差。 在一些实施方式中能够根据任意合适的方法确定子带的划分。
[0142] 例如在一些实施方式中能够根据选择的带宽确定执行子带划分,其然后确定强度 间(能量)和时间间(移位或延迟)差估计的次数。例如音频信号的生成能够基于输出信号被 认为是宽带(WB)、超宽带(SWB)还是全带(FB)(其中带宽要求从宽带到全带的顺序增加)。在 一些实施方式中,对于可能的带宽选择,能够有子带中的特定划分。因此例如时间或延迟差 估计的FFT域的子带划分能够是:
[0143] 宽带(WB)的ITD子带
[0144] const short scalel024_WB[]=
[0145] {1,5,8,12,20,34,48,56,120,512};
[0146] 超宽带(SWB)的ITD子带
[0147] const short scalel024_SWB[]=
[0148] {1,2,4,6,10,14,17,24,28,60,256,512};
[0149] 全带(FB)的ITD子带
[0150] const short scalel024_FB[]=
[0151] {1,2,3,4,7,11,16,19,40,171,341,448/*~21kHz*/};
[0152] 宽带(WB)的ILD子带
[0153] const short scf_band_WB[] =
[0154] {1,8,20,32,44,60,90,110,170,216,290,394,512};
[0155] 超宽带(SWB)的ILD子带
[0156] const short scf_band_SWB[] =
[0157] {1,4,10,16,22,30,45,65,85,108,145,197,256,322,412,512};
[0158] 全带(FB)的ILD子带
[0159] const short scf_band_FB[] =
[0160] {1,3,7,11,15,20,30,43,57,72,97,131,171 ,215,275,341,391,448/*~ 21kHz*/};
[0161] 换句话说,在一些实施方式中能够有延迟和强度差的不同的子带。
[0162] 如图4中所示,编码器还能够包括单信道参数编码器204(或更一般地缩混参数编 码器或用于编码至少一个缩混参数的装置)。图8中示出了示例单信道(缩混)参数编码器 204的操作。
[0163] 在一些实施方式中该设备包括单信道(或缩混)参数编码器204。在一些实施方式 中单信道(或缩混)参数编码器204包括单信道(缩混)信道生成器/编码器305,被配置成从 相对能量信号强度确定器303接收信道分析器值(例如相对能量信号强度)并从移位确定器 301接收移位强度。此外在一些实施方式中,单信道(缩混)信道生成器/编码器305能够被配 置成还接收输入立体声(多信道)音频信号。在一些实施方式中单信道(缩混)信道生成器/ 编码器305能够被配置成将移位(延迟)和强度差应用到立体声(多信道)音频信号以生成代 表音频信号的"校准"单信道(或缩混)信道。换句话说单信道(缩混)信道生成器/编码器305 能够生成表示校准的立体声(多信道)音频信号的单信道(或缩混)信道信号。例如在确定为 左信道音频信号和右信道音频信号的一些实施方式中,左或右信道音频信号的一者根据确 定的延迟差关于彼此被延迟且然后延迟的信道和其他信道音频信号被平均以生成单信道 信号。但是可以理解在一些实施方式中能够实施任何合适的单信道生成方法。可以理解在 一些实施方式中单信道生成器或用于生成音频信道的合适装置能够由'减少'(或缩混)信 道数生成器替代或辅助,其被配置成生成少于输入音频信道数量的输出音频信道。因此例 如在输入音频信号信道数量大于两个的一些多信道音频信号示例中,'单信道生成器'被配 置成生成多于一个信道音频信号但是少于输入信道数量。
[0164] 图8中的步骤555示出了从多信道信号生成单信道信号(或减少数量的信道)的操 作。
[0165] 在一些实施方式中单(缩混)信道生成器/编码器305然后能够使用任意合适的编 码格式编码生成的单(缩混)信道音频信号(或减少数量的信道)。例如在一些实施方式中能 够使用增强语音服务(EVS)单(或多个单)信道编码格式来编码单(缩混)信道音频信号,该 形式可以包含自适应多速率-宽带(AMR-WB)编解码器的比特流互操作版本。
[0166] 图8中的步骤557示出了编码单信道(或减少数量的信道)的操作。
[0167]已编码单(缩混)信道信号然后能够被输出。在一些实施方式中已编码单(缩混)信 道信号被输出给复用器以与立体声参数编码器205的输出结合以形成单个流或输出。在一 些实施方式中已编码单(缩混)信道信号分开地从立体声参数编码器205输出。
[0168] 图6中的步骤504示出了确定单(缩混)信道信号和编码单(缩混)信道信号的操作。
[0169] 在一些实施方式中编码器104包括立体声(或扩展或多信道)参数编码器205或用 于编码扩展参数的装置。在以下示例中多信道参数编码器是立体声参数编码器205或用于 编码多信道参数的合适装置。立体声参数编码器205能够被配置成接收信道分析器203确定 的多信道参数,例如立体声(差)参数。在一些实施方式立体声参数编码器205则能够被配置 成对该参数执行量化并此外编码该参数由此它们能被输出(被存储在设备上或传递给另外 的设备)。
[0170] 图6中的步骤505示出了量化并编码量化的立体声参数的操作。
[0171] 关于图5更详细示出了示例立体声/多信道参数编码器205。此外关于图9示出了根 据一些实
当前第3页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1