音频编码方法和装置、音频解码方法和装置及采用该方法和装置的多媒体装置的制造方法_2

文档序号:8399351阅读:来源:国知局
出为指示不同的特性功能,该不意味着 每个单元由一个单独的硬件组件或软件组件组成。每个单元被示出用于便于解释,多个单 元可形成一个单元,一个单元可被划分为多个单元。
[0045] 目前,多个编解码器技术正被用于对音频信号进行编码/解码。每个编解码器技 术具有适合特定音频信号的特性并针对该特定音频信号被最优化。使用修正离散余弦变 换(MDCT)的编解码器的一些示例是MPEG的高级音频编码系列、G. 722. 1、G. 929. 1、G. 718、 G. 711. 1、G. 722超宽带(SWB)、G. 729. 1/G718SWB和G. 722SWB,该些编解码器基于感知编码 方案,其中,在感知编码方案中,通过屯、理声学模型与应用了MDCT的滤波器组的组合来执 行编码处理。由于时域信号可通过使用叠加(overlap-and-add)方案被有效地重构的优 点,因此MDCT正被广泛用于音频编解码器。
[0046] 同样,使用MDCT的各种编解码器正被使用,但每个编解码器可具有不同的结构W 获得预期效果。例如,MPEG的ACC系列通过MDCT(滤波器组)和屯、理声学模型的组合执行 编码,ACC增强型低延迟(ACC-ELD)通过使用具有低延迟的MDCT执行编码。另外,G. 722. 1 通过将MDCT应用于整个频带来对系数进行量化,G. 718宽带(WB)将量化误差编码为分层 的WB编解码器和超宽带(SWB)编解码器中基于MDCT的增强层。另外,增强型可变速率编 解码器巧VRC)-WB、G. 729. 1、G. 718、G. 711. 1、G. 718/G. 729. 1SWB等将频带被划分的信号编 码为分层的WB编解码器和SWB编解码器中的基于MDCT的增强型层。
[0047] 图1是示出根据示例性实施例的音频编码设备100的框图。
[0048] 图1的音频编码设备100可包括前置滤波单元110、分析加窗单元120、变换单元 130、分辨率增强单元140和编码单元150。可通过额外的路径160将编码所需的各种参数 (诸如,信号的长度、窗类型和比特分配信息)发送到编码设备100中的单元110至单元150 中的每个单元。示例性实施例中示出;可通过额外的路径160发送单元110至单元150中 的每个单元的操作所需的附加信息,但该是为了便于解释,因此在没有单独的额外的路径 160的情况下,可根据每个示出的单元的操作顺序,依次将附加信息连同信号发送到每个单 元(即,前置滤波单元110、分析加窗单元120、变换单元130、分辨率增强单元140和编码单 元150)。另外,各个组件可被集成为至少一个模块,并可被实现为至少一个处理器(未示 出)。该里,音频可表示音乐、语音或音乐和语音的混合信号。
[0049] 参照图1,前置滤波单元110可从W帖为单位输入的音频信号检测周期分量,去除 检测到的周期分量,并通过将去除的周期分量表示为单独的参数来产生修正音频信号。该 里,帖可指示一般帖、作为帖的下级帖的子帖或子帖的下级帖。根据示例性实施例,周期分 量可包括谐波分量(诸如,音高)。例如,当周期分量是音高时,前置滤波单元110可使用各 种已知的音高检测算法来检测音高,并考虑检测到的音高的位置和幅度设计滤波器系数, 并将滤波器系数应用于输入的音频信号。前置滤波处理可应用于所有帖,或者可应用于首 先检测到周期分量的帖。包括与检测到的音高的位置和幅度相关的滤波器系数的单独的参 数可包括在比特流中,W便被发送。
[0050] 分析加窗单元120可针对从前置滤波单元110提供的修正音频信号执行分析加 窗。根据示例性实施例,应用的窗类型可具有小于50%的重叠区间。另外,当具有相同长度 的两种窗类型重叠或者具有不同长度的两种窗类型重叠时,除窗系数为0的区间之外,重 叠区间的长度可被设置为相同,W便满足完美重构条件,稍后将参照图4至图7描述完美重 构条件。
[0化1] 变换单元130可通过对在分析加窗单元120中执行了窗处理的时域音频信号进行 变换来产生频域的变换系数。DCT、修正离散余弦变换(MDCT)或快速傅里叶变换(FFT)可 用于变换处理,但一个或更多个示例性实施例不限于此。
[0052] 分辨率增强单元140可针对在变换单元130中产生的频域的变换系数W子频带为 单位来调整时频分辨率。例如,在音调分量、稳态分量和瞬态分量共存的帖中,相对长的块 大小可应用于音调分量或稳态分量,相对短的块大小可应用于瞬态分量。作为结果,在音 调分量或稳态分量中,频率分辨率会增加而时间分辨率减小,在瞬态分量中,频率分辨率会 减小而时间分辨率会增加,因此可获得适合于信号特性的分辨率。关于应用的块大小的信 息可包括在比特流中。另外,分辨率增强单元140可子频带为单位朝着低频频带或高 频频带合并频率槽化in)。秩为2"的沃尔什矩阵可用于合并每个子频带中存在的频率槽。 可从秩为2"的哈达玛矩阵得到沃尔什矩阵。根据示例性实施例,分辨率增强单元140可贯 穿整个帖通过W每个子频带为单位朝着低频频带合并频率槽,来增强低频频带的频率分辨 率。另一已知的矩阵可用于合并每个子频带中存在的频率槽。关于在合并频率槽中使用的 矩阵的信息可包括在比特流中。
[0化3] 编码单元150可针对在分辨率增强单元140中调整了分辨率的变换系数执行包括 量化的编码处理。编码单元150中的编码结果和解码所需的编码参数可形成比特流,可将 比特流存储在预定存储介质中,或可通过信道发送比特流。
[0化4] 根据示例性实施例,可使用前置滤波单元110和分辨率增强单元140两者,可根据 实施了编码设备或解码设备的装置的用途来使用前置滤波单元110和分辨率增强单元140 中的至少一个。为此,当需要用户的选择时,单独的开关单元可被提供。当选择性地被使用 时,可将与是否执行前置滤波处理或分辨率增强处理相关的标志添加到比特流的头,从而 可在解码设备中执行相应处理。
[0化5] 另外,根据另一示例性实施例,与现有AAC编解码器中的窗类型相同的窗类型应 用于分析加窗单元120,前置滤波单元110和分辨率增强单元140额外地被包括,并全部地 或选择性地被操作W增强恢复的声音质量。
[0化6] 另外,根据另一示例性实施例,单个窗类型(例如,短窗或长窗)可应用于分析加 窗单元120,前置滤波单元110和分辨率增强单元140可额外地被包括,并可全部地或选择 性地被操作W增强恢复的声音质量。
[0057] 图2是示出根据示例性实施例的音频解码设备200的框图。
[0化引图2中示出的音频解码设备200可包括解码单元210、分辨率恢复单元220、逆变 换单元230、合成加窗单元240和后置滤波单元250。解码所需的各种参数(诸如,信号的 长度、窗类型和比特分配信息)可通过额外的路径260被发送到解码设备200的单元210 至单元250中的每个单元。示例性实施例中示出;可通过额外的路径260发送单元210至 单元250中的每个单元的操作所需的附加信息,但该是为了便于解释,因此,在没有单独的 额外的路径260的情况下,可根据每个示出的单元的操作顺序,依次将附加信息连同信号 发送到每个单元(即,解码单元210、分辨率恢复单元220、逆变换单元230、合成加窗单元 240和后置滤波单元250)。另外,各个组件可被集成为至少一个模块,并可被实现为至少一 个处理器(未示出)。该里,音频可表示音乐、语音或音乐和语音的混合信号。
[0化9] 参照图2,解码设备210可接收比特流并执行反量化,W获得频域的变换系数。
[0060] 分辨率恢复单元220可通过针对从解码单元210提供的频域的变换系数W子频带 为单位使频率槽分解,来恢复分辨率。为此,可使用在编码设备100的分辨率增强单元140 中用于合并频率槽的矩阵的逆矩阵。
[0061] 逆变换单元230可通过对已由分辨率恢复单元220恢复了分辨率的频域的变换系 数进行逆变换来产生时域信号。为此,可执行与编码设备100的变换单元130中使用的变 换处理相应的逆变换处理。例如,当MDCT应用于编码设备100的变换单元130时,逆变换 单元230可通过将IMDCT应用于变换系数来将频域的变换系数变换为时域信号。
[0062] 合成加窗单元240可针对从逆变换单元230提供的时
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1