使用加权线性预测变换对音频信号进行编码和解码的设备和方法

文档序号:2824851阅读:213来源:国知局
专利名称:使用加权线性预测变换对音频信号进行编码和解码的设备和方法
技术领域
本发明涉及一种对音频信号进行编码和/或解码的技术。
背景技术
音频信号编码是指通过提取关于人类语音产生模型的参数来对原始音频进行压缩的技术。在音频信号编码中,输入音频信号以特定采样率被采样,并被划分为时域块或帧。音频编码设备提取特定参数以分析输入音频信号,并量化参数来以二进制数(例如,一组比特或二进制数据包)进行表示。量化的比特流经由有线或无线信道被发送到接收器或解码设备,或被存储在各种记录介质中。解码设备处理包括在比特流中的音频帧,通过对音频帧进行去量化来产生参数,并通过使用该参数来恢复音频信号。当前,正在对以最优比特率编码包括多个帧的超帧的方法进行研究。如果感知性非敏感音频信号以低比特率被编码,感知性敏感音频信号以高比特率被编码,则可在最小化声音质量的劣化的同时对音频信号进行有效编码。

发明内容
技术问题本发明的目的在于在最小化声音质量的劣化的同时对音频信号进行有效编码。本发明的目的还在于在无声声音时间段(unvoiced sound period)提高声音质
fio技术方案根据本发明的一方面,提供了一种音频信号编码器,包括模式选择单元,选择音频帧的编码模式;比特率确定单元,根据选择的编码模式来确定音频帧的目标比特率;力口权线性预测变换编码单元,根据确定的目标比特率对音频帧执行加权线性预测变换编码。根据本发明的另一方面,提供了一种音频信号解码器,包括比特率确定单元,确定编码的音频帧的比特率;加权线性预测变换解码单元,根据确定的比特率对音频帧执行加权线性预测变换解码。根据本发明的另一方面,提供了一种对音频信号进行编码的方法,所述方法包括 选择音频帧的编码模式;根据选择的编码模式来确定音频帧的比特率;以及,根据确定的比特率对音频帧执行加权线性预测变换编码。技术效果根据本发明的实施例,可在最小化声音质量的劣化的同时减小编码的音频信号的大小。根据本发明的实施例,可在编码的音频信号的无声声音时间段提高声音质量。


图1是根据本发明的音频信号编码设备的框图。图2是根据本发明实施例的通过使用多个线性预测对音频信号进行编码的编码器的框图。图3是根据本发明实施例的音频信号解码器的框图。图4是根据本发明实施例的通过使用多个线性预测对音频信号进行解码的加权线性预测变换解码单元的框图。图5是根据本发明实施例的通过执行时域噪声整形(TNS)对音频信号进行编码的编码器的框图。图6是根据本发明实施例的对TNS的音频信号进行解码的解码器的框图。图7是根据本发明实施例的通过使用码本对音频信号进行编码的编码器的框图。图8是根据本发明实施例的通过使用码本对音频信号进行解码的解码器的框图。图9是根据本发明实施例的用于确定音频信号的编码模式的模式选择单元的框图。图10是根据本发明实施例的通过执行加权线性预测变换对音频信号进行编码的方法的流程图。图11是根据本发明实施例的通过使用多个线性预测对音频信号进行编码的方法的流程图。图12是根据本发明实施例的通过执行TNS对音频信号进行编码的方法的流程图。图13是根据本发明实施例的通过使用码本对音频信号进行编码的方法的流程图。
具体实施例方式以下,将参照附图通过解释本发明的实施例来详细说明本发明。图1是根据本发明的音频信号编码设备的框图。参照图1,音频信号编码设备包括模式选择单元170、比特率确定单元171、一般线性预测变换编码单元181、无声线性预测变换编码单元182和静默(silence)线性预测变换编码单元183。预处理单元110可从输入音频信号去除非期望的频率分量,并可执行用于调节频率特性的预滤波,以对音频信号进行编码。例如,预处理单元110可使用根据自适应多速率宽带(AMR-WB)标准的预加重滤波。这里,输入音频信号被采样为适于编码的预定采样频率。例如,窄带音频编码器可具有8000Hz的采样频率,宽带音频编码器可具有16000Hz的采样频率。音频信号编码设备可以以包括多个帧的超帧为单位对音频信号进行编码。例如, 超帧可包括四个帧。也就是说,通过对四个帧进行编码来对每个超帧进行编码。例如,如果超帧具有1024个采样的大小,则四个超帧中的每个具有256个采样的大小。在这种情况下, 超帧可通过执行重叠和添加(OLA)处理而被调节为具有较大大小并与另一超帧重叠。帧比特率确定单元120可确定音频帧的比特率。帧比特率确定单元120可通过将目标比特率与先前帧的比特率进行比较来确定当前超帧的比特率。线性预测分析/量化单元130通过使用滤波的输入音频帧来提取线性预测系数。这里,线性预测分析/量化单元130将线性预测系数变换为适于量化的系数(例如,导谱频率(ISF)系数或线谱频率(LSF)系数),并通过使用各种量化方法(例如,矢量量化)对系数进行量化。提取的线性预测系数和量化的线性预测系数被发送到感知加权滤波器单元 140。感知加权滤波器单元140通过使用感知加权滤波器对预处理的信号进行滤波。感知加权滤波器单元140将量化噪声减小到掩蔽范围内,以使用人体的听觉结构的掩蔽效应。由感知加权滤波器单元140滤波的信号可被发送到开环音高(pitch)检测单元160。开环音高检测单元160通过使用由感知加权滤波器单元140滤波并发送的信号来检测开环音高。语音激活检测单元150接收由预处理单元110滤波的音频信号,并检测滤波的音频信号的语音激活。例如,输入音频信号的特性可包括频域中的倾斜(tilt)信息和每个咆哮(bark)带中的能量信息。模式选择单元170根据音频信号的特性通过应用开环方法或闭环方法来确定音频信号的编码模式。模式选择单元170可在选择最优编码模式之前对音频信号的当前帧进行分类。也就是说,模式选择单元170可通过使用检测无声声音的结果将当前音频帧划分为低能量噪声、噪声、无声噪声和残差信号。在这种情况下,模式选择单元170可基于分类的结果来选择当前音频帧的编码模式。编码模式可包括一般线性预测变换编码模式、无声线性预测变换编码模式、静默线性预测变换编码模式和可变比特率(VBR)有声线性预测变换编码模式 (算法码激励线性预测(ACELP)编码模式),用于对包括在超帧(所述超帧包括多个音频帧)中的音频信号进行编码。比特率确定单元171根据由模式选择单元170选择的编码模式来确定音频帧的目标比特率。模式选择单元170可确定包括在音频帧中的音频信号对应于静默,并可选择静默线性预测变换编码模式作为音频帧的编码模式。在这种情况下,比特率确定单元171可确定音频帧的目标比特率非常低。否则,模式选择单元170可确定包括在音频帧中的音频信号对应于有声声音。在这种情况下,比特率确定单元171可确定音频帧的目标比特率高。线性预测变换编码单元180可根据由模式选择单元170选择的编码模式,通过激活一般线性预测变换编码单元181、无声线性预测变换编码单元182和静默线性预测变换编码单元183中的一个来对音频帧进行编码。如果模式选择单元170选择码激励线性预测(CELP)编码模式作为音频帧的编码模式,则CELP编码单元190根据CELP编码模式对音频帧进行编码。根据本发明的实施例, CELP编码单元190可参照音频帧的目标比特率,根据不同比特率对每个音频帧进行编码。虽然在上述描述中根据由模式选择单元170选择的编码模式来确定音频帧的目标比特率,但是还可根据由比特率确定单元171确定的目标比特率来确定音频帧的编码模式。如果比特率确定单元171基于音频信号的特性来确定音频帧的目标比特率,则模式选择单元170可在由比特率确定单元171确定的目标比特率内选择用于实现最佳声音质量的编码模式。模式选择单元170可根据多个编码模式对音频帧进行编码。模式选择单元170可比较编码的音频帧,并可选择用于实现最佳声音质量的编码模式。模式选择单元170可测量编码的音频帧的特性,并可通过将测量的特性与特定参考值进行比较来确定编码模式。 音频帧的特性可以是音频帧的信噪比(SNR)。模式选择单元170可将测量的SNR与特定参考值进行比较,并可选择具有高于参考值的SNR的编码模式。根据本发明的另一实施例,模式选择单元170可选择具有最高SNR的编码模式。图2是根据本发明实施例的通过使用多个线性预测对音频信号进行编码的编码器的框图。音频信号编码器包括第一线性预测单元210、第一残差信号产生单元220、第二线性预测单元230、第二残差信号产生单元240和加权线性预测变换编码单元250。第一线性预测单元210通过对音频帧执行线性预测来产生第一线性预测数据和第一线性预测系数。第一线性预测系数量化单元211可对第一线性预测系数进行量化。音频信号解码器可通过使用第一线性预测系数来恢复第一线性预测数据。第一残差信号产生单元220通过从音频帧去除第一线性预测数据来产生第一残差信号。第一残差信号产生单元220可通过分析多个音频帧或单个音频帧中的音频信号并预测音频信号的值的改变来产生第一线性预测数据。如果第一线性预测数据的值非常相似于音频信号的值,则通过从音频帧去除第一线性预测数据而获得的第一残差信号的值的范围小。因此,如果取代于音频信号而对第一残差信号进行编码,则可通过仅使用少量的比特来对音频帧进行编码。第二线性预测单元230通过对第一残差信号执行线性预测来产生第二线性预测数据和第二线性预测系数。第二线性预测系数量化单元231可对第二线性预测系数进行量化。音频信号解码器可通过使用第二线性预测系数来产生第一线性预测数据。第二残差信号产生单元240通过从第一残差信号去除第二线性预测数据来产生第二残差信号。通常,第二残差信号的值的范围小于第一残差信号的值的范围。因此,如果第二残差信号被编码,则可通过使用更少数量的比特来对音频帧进行编码。加权线性预测变换编码单元250可通过对第二残差信号执行加权线性预测变换编码来产生诸如码本索引、码本增益和噪声等级的参数。参数量化单元260可对由加权线性预测变换编码单元250产生的参数以及编码的第二残差信号进行量化。音频信号解码器可基于量化的第二残差信号、量化的参数、量化的第一线性预测系数和量化的第二线性预测系数对编码音频帧进行解码。图3是根据本发明实施例的音频信号解码器300的框图。音频信号解码器300包括解码模式确定单元310、比特率确定单元320和加权线性预测变换解码单元330。解码模式确定单元310确定音频帧的解码模式。由于包括在不同音频帧中的音频信号具有不同特性,故音频帧可已经根据不同编码模式被编码。解码模式确定单元310可确定与每个音频帧的编码模式相应的解码模式。比特率确定单元320确定音频帧的比特率。由于包括在不同音频帧中的音频信号具有不同特性,故音频帧可已经根据不同比特率被编码。比特率确定单元320可确定每个音频帧的比特率。比特率确定单元320可参照确定的解码模式确定比特率。加权线性预测变换解码单元330根据确定的比特率和确定的解码模式对音频帧执行加权预测变换解码。以下将参照图4、图6和图8详细描述加权线性预测变换解码单元 330的各种示例。
8
图4是根据本发明实施例的通过使用多个线性预测对音频信号进行解码的加权线性预测变换解码单元的框图。加权线性预测变换解码单元包括参数解码单元410、残差信号恢复单元420、第二线性预测系数去量化单元430、第二线性预测合成单元440、第一线性预测系数去量化单元450和第一线性预测合成单元460。参数解码单元410对量化的参数(诸如,码本索引、码本增益和噪声等级)进行解码。参数可包括在编码音频帧中作为音频信号的一部分。残差信号恢复单元420参照解码的码本索引和解码的码本增益恢复第二残差信号。码本可包括遵循高斯分布的多个分量。 残差信号恢复单元420可通过使用码本索引来选择码本的多个分量中的一个,并可基于选择的分量和码本增益来恢复第二残差信号。第二线性预测系数去量化单元430恢复量化的第二线性预测系数。第二线性预测合成单元440可通过使用第二线性预测系数来恢复第二线性预测数据。第二线性预测合成单元440可通过将恢复的第二线性预测数据与第二残差信号组合来恢复第一残差信号。第一线性预测系数去量化单元450恢复量化的第一线性预测系数。第一线性预测合成单元460可通过使用第一线性预测系数来恢复第一线性预测数据。第一线性预测合成单元460可通过将恢复的第一线性预测数据与第二残差信号进行组合来对音频信号进行解码。图5是根据本发明实施例的通过执行时域噪声整形(TNS)对音频信号进行编码的编码器的框图。音频信号编码器包括线性预测单元510、线性预测系数量化单元511、残差信号产生单元520和加权线性预测变换编码单元530。加权线性预测变换编码单元530可包括频域变换单元540、TNS单元550、频域处理单元560和量化单元570。线性预测单元510通过对音频帧执行线性预测来产生线性预测数据和线性预测系数。线性预测系数量化单元511可对线性预测系数进行量化。音频信号解码器可通过使用线性预测系数来恢复线性预测数据。残差信号产生单元520通过从音频帧去除线性预测数据来产生残差信号。加权线性预测变换编码单元530可通过对残差信号进行编码,根据低比特率对高质量音频信号进行编码。频域变换单元540将时域的残差信号变换到频域。频域变换单元540可通过执行快速傅里叶变换(FFT)或改进离散余弦变换(MDCT)将残差信号变换到频域。TNS单元550对变换到频域的残差信号执行TNS。TNS是一种这样的方法用于智能地减小当连续模拟音乐数据被量化为数字数据时产生的差错,从而减小噪声并实现与原始接近的声音。如果在时域中突然产生信号,则编码音频信号由于例如预回声而具有噪声。 TNS可被执行以减小由预回声引起的噪声。频域处理单元560可在频域执行各种类型的处理以提高音频信号的质量并促进编码。量化单元570对TNS的残差信号进行量化。在图5中,可通过执行TNS来减小编码音频信号的噪声。因此,可根据低比特率对高质量音频信号进行编码。图6是根据本发明实施例的对TNS的音频信号进行解码的解码器的框图。音频信号解码器包括去量化单元610、频域处理单元620、逆TNS单元630、时域变换单元640、线性预测系数去量化单元650和加权线性预测变换解码单元660。去量化单元610通过对包括在帧中的量化的残差信号去量化来恢复残差信号。由去量化单元610恢复的残差信号可以是频域的残差信号。频域处理单元620可在频域中执行各种类型的处理以提高音频信号的质量并促进编码。逆TNS单元630对去量化的残差信号执行逆TNS。执行逆TNS以去除由于量化导致的噪声。当量化被执行时,如果在时域中突然产生的信号由于预回声而具有噪声,则逆 TNS单元630可去除噪声。时域变换单元640将逆TNS的残差信号变换到时域。线性预测系数去量化单元650对包括在音频帧中的量化的线性预测系数去量化。 加权线性预测变换解码单元660基于去量化的线性预测系数来产生线性预测数据,并通过将线性预测数据与时域的残差信号进行组合来对编码的音频信号执行线性预测解码。图7是根据本发明实施例的通过使用码本对音频信号进行编码的编码器的框图。 音频信号编码器包括线性预测单元710、线性预测系数量化单元711、残差信号产生单元 720和加权线性预测变换编码单元730。线性预测单元710、线性预测系数量化单元711和残差信号产生单元720的操作与图5中示出的线性预测单元510、线性预测系数量化单元 511和残差信号产生单元520类似,因此在此将不提供它们的详细描述。加权线性预测变换编码单元730可包括频域变换单元740、检测单元750和编码单元 760。频域变换单元740将时域的残差信号变换到频域。频域变换单元740可通过执行 FFT或MDCT将残差信号变换到频域。检测单元750从包括在码本中的多个分量中搜索与变换到频域的残差信号相应的分量。与残差信号相应的分量可以是包括在码本中的分量中与残差信号相似的分量。码本的分量可遵循高斯分布。编码单元760对与残差信号相应的分量的码本索引进行编码。音频信号编码器可取代残差信号而对与残差信号相似的码本索引进行编码。码本的分量与残差信号相似,并且码本索引相比于残差信号具有非常小的大小。因此,可根据低比特率对高质量音频信号进行编码。音频信号解码器可对码本索引进行解码并可参照解码的码本索引来提取与残差信号相似的码本的分量。虽然通过执行一次线性预测并通过使用图7中的码本来对音频信号进行编码,但是根据本发明的另一实施例,可通过多次执行线性预测并通过使用码本来对音频信号进行编码。与图2相似,线性预测单元710可通过对残差信号执行线性预测来产生第二线性预测数据。残差信号产生单元720通过从残差信号去除第二线性预测数据来产生第二残差信号。检测单元750可从码本的分量中检测与第二残差信号相应的分量,并且编码单元 760可对与第二残差信号相应的分量的码本索引进行编码。图8是根据本发明实施例的通过使用码本对音频信号进行解码的解码器的框图。音频信号解码器包括去量化单元810、码本存储单元820、提取单元830、时域变换单元840、 线性预测系数去量化单元850和加权线性预测变换解码单元860。去量化单元810对包括在音频帧中的量化的码本索引去量化。码本存储单元820存储包括多个分量的码本。码本的分量可遵循高斯分布。提取单元830参照码本索引从码本提取多个分量中的一个。码本索引可指示码本的分量中与残差信号相似的分量。提取单元830可参照去量化的码本索引来提取与残差信号相似的码本的分量。时域变换单元840将码本的提取的分量变换到时域。线性预测系数去量化单元850对包括在音频帧中的量化的线性预测系数去量化。 加权线性预测变换解码单元860基于去量化的线性预测系数来产生线性预测数据,并通过将线性预测数据与时域的码本的分量进行组合来对编码的音频信号执行加权线性预测变换解码。图9是根据本发明实施例的用于确定音频信号的编码模式的模式选择单元的框图。模式选择单元包括VAD单元910、无声声音识别单元920、无声声音编码单元930和有声声音编码单元940。VAD单元910检测包括在音频帧中的音频信号的语音激活。如果音频信号的语音激活小于特定阈值,则VAD单元910可确定音频信号对应于静默。无声声音识别单元920识别音频信号对应于无声声音还是有声声音。无声声音是声带不振动的声音,有声声音时声带振动的声音。如果无声声音识别单元920识别出包括在音频帧中的音频信号对应于无声声音, 则无声声音编码单元930可对音频信号进行编码。无声声音编码单元930可包括VBR线性预测变换编码单元951、无声线性预测变换编码单元952、无声CELP编码单元953。如果音频信号对应于无声声音,则VBR线性预测变换编码单元951、无声线性预测变换编码单元952和无声CELP编码单元953分别根据线性预测变换编码模式、无声线性预测变换编码单元和无声CELP编码模式对音频信号进行编码。第一编码模式选择单元954可基于根据每个模式编码的音频帧的特性来选择编码模式。音频帧的特性可以是音频帧的SNR。也就是说,第一编码模式选择单元954可基于根据每个模式编码的音频帧的SNR来选择编码模式。第一编码模式选择单元954可选择具有编码的音频帧的高SNR的编码模式作为输入音频帧的编码模式。虽然在图9中的第一编码模式选择单元954从三个模式中选择编码模式,但是根据本发明的另一实施例,第一编码模式选择单元954可从两个模式(诸如,VBR线性预测变换编码模式和无声线性预测变换编码模式)选择编码模式。根据本发明的另一实施例,第一编码模式选择单元954可通过改变每个模式的偏移(offset)来,基于编码音频帧的SNR选择编码模式。也就是说,第一编码模式选择单元 954可通过改变VBR线性预测变换编码单元951的偏移和无声线性预测变换编码单元952 的偏移来对音频帧进行编码,并可比较编码音频帧的SNR。即使VBR线性预测变换编码单元 951的偏移大于无声线性预测变换编码单元952的偏移,如果根据VBR线性预测变换编码模式编码的音频帧的SNR高于根据无声线性预测变换编码模式编码的音频帧的SNR,则VBR线性预测变换编码模式可被选择作为编码模式。可通过如下操作选择最优编码模式通过改变每个模式的偏移并选择具有高SNR 的编码模式来对音频帧进行编码。如果无声声音识别单元920识别出包括在音频帧中的音频信号对应于有声声音, 则有声声音编码单元940可对音频信号进行编码。有声声音编码单元940可包括VBR线性预测变换编码单元961和VBRCELP编码单元 962。 VBR线性预测变换编码单元961和VBR CELP编码单元962分别根据VBR线性预测变换编码模式和VBR CELP编码模式对音频帧进行编码。第二编码模式选择单元963可基于根据每个模式编码的音频帧的特性来选择编码模式。音频帧的特性可以是音频帧的SNR。也就是说,第二编码模式选择单元963可选择具有编码的音频帧的高SNR的编码模式作为输入音频帧的编码模式。虽然在图9中VAD单元910包括在模式选择单元中,但是根据本发明的另一实施例,VAD单元910可从模式选择单元分离。图10是根据本发明实施例的通过执行加权线性预测变换对音频信号进行编码的方法的流程图。在操作S1010,选择音频帧的编码模式。可从无声加权线性预测变换编码模式和无声CELP编码模式中选择编码模式。可基于根据每个模式编码的音频帧的SNR来选择编码模式。也就是说,如果根据无声加权线性预测变换编码模式编码的音频帧的SNR高于根据无声CELP编码模式编码的音频帧的SNR,则可选择无声加权线性预测变换编码模式作为编码模式。在操作S1020,根据在操作S1010中选择的编码模式来确定音频帧的目标比特率。 在操作S1010中可选择无声加权线性预测变换编码模式作为编码模式,这意味着包括在音频帧中的音频信号对应于无声声音。如果音频信号对应于无声声音,则可确定非常低的目标比特率。在操作S1010中可选择有声CELP编码模式作为编码模式,这意味着音频信号对应于有声声音。如果音频信号对应于有声声音,则可确定高目标比特率。在操作S1030,根据确定的目标比特率和选择的编码模式对音频帧执行加权线性预测变换编码。可通过多次执行线性预测、通过执行TNS或通过使用码本来对音频帧进行编码。现将参照图11到图13详细描述对音频帧进行编码的方法。图11是根据本发明实施例的通过多次执行线性预测对音频信号进行编码的方法的流程图。在操作S1110,通过对音频帧执行线性预测来产生第一线性预测数据和第一线性预测系数。音频信号解码器可基于第一线性预测系数来恢复第一线性预测数据。在操作S1120,通过从音频帧去除第一线性预测数据来产生第一残差信号。如果包括在音频帧中的音频信号被准确预测,则第一线性预测数据相似于音频信号。因此,第一残差信号的大小小于音频信号的大小。在操作S1130,通过对第一残差信号执行线性预测来产生第二线性预测数据和第二线性预测系数。音频信号解码器可基于第二线性预测系数来恢复第二线性预测数据。在操作S1140,通过从第一残差信号去除第二线性预测数据来产生第二残差信号。。第二残差信号的大小小于第一残差信号和音频信号的大小。因此,即使根据非常低的比特率对音频信号进行编码,也可始终保持音频信号的质量。图12是根据本发明实施例的通过执行TNS对音频信号进行编码的方法的流程图。在操作S1210,通过对音频帧执行线性预测来产生线性预测数据和线性预测系数。 音频信号解码器可基于线性预测系数来恢复线性预测数据。在操作S1220,通过从音频帧去除线性预测数据来产生残差信号。在操作S1030,对残差信号执行加权线性预测变换编码。现将详细描述操作 S1030。在操作S1230,将残差信号变换到频域。可通过执行FFT或MDCT将残差信号变换到频域。在操作S1240,对变换到频域的残差信号执行TNS。如果音频信号包括在时域突然产生的信号,则编码的音频信号由于例如预回声而具有噪声。可执行TNS以减小由预回声引起的噪声。在操作S1250,对TNS的残差信号进行量化。残差信号的值的范围可小于音频信号的值的范围。因此,如果取代于音频信号而对残差信号进行量化,则可通过使用少量比特对音频信号进行量化。图13是根据本发明实施例的通过使用码本对音频信号进行编码的方法的流程图。操作S1310和S1320相似于图12中示出的操作S1210和S1220,从而在此将不提供它们的详细描述。在操作S1030,对残差信号执行加权线性预测变换编码。现将详细描述操作 S1030。在操作S1330,将残差信号变换到频域。可通过执行FFT或MDCT将残差信号变换到频域。在操作S1340,从码本的分量中检测与变换到频域的残差信号相应的分量。与残差信号相应的分量可以是码本的分量中与残差信号相应的分量。码本的分量可遵循高斯分布。在操作S1350,对与残差信号相应的码本的分量的索引进行编码。因此,可根据低比特率对高质量音频信号进行编码。虽然已经参照示例性实施例具体示出和描述了本发明,但是本领域的普通技术人员将理解,在不脱离本发明的精神和范围的情况下,可作出形式和细节上的各种改变。根据本发明的上述实施例的对音频信号进行编码和解码的方法可记录在包括用于执行由计算机实现的各种操作的程序指令的计算机可读介质中。计算机可读介质可包括单独或协作的程序指令、数据文件和数据结构。程序指令和介质可被特别设计和构造用于本发明的目的,或者它们可以是计算机软件领域的技术人员公知和可用的类型。计算机可读介质的示例包括磁介质(例如,硬盘、软盘和磁带)、光介质(例如,CD-ROM或DVD)、磁光介质(例如,光读盘)和特别构造用于存储和执行程序指令的硬件装置(例如,R0M、RAM或闪存等)。介质还可以是包括发送指定程序指令、数据结构等的信号的载波的传输介质(诸
13如,光纤或金属线、波导等)。程序指令的示例包括机器代码(诸如,由编译器产生)和文件 (包括可由计算机使用解释器执行的高级语言的代码)两者。上述硬件元件可配置为用于实现本发明的操作的一个或多个软件模块。 虽然已经示出和描述了本发明的一些实施例,但是本发明不限于所述实施例。相反,将由本领域的技术人员理解,在不脱离由权利要求及其等同物限定范围的本发明的原理和精神的情况下,可对这些实施例作出改变。
权利要求
1.一种音频信号编码器,包括模式选择单元,选择音频帧的编码模式;比特率确定单元,根据选择的编码模式来确定音频帧的目标比特率;以及加权线性预测变换编码单元,根据确定的目标比特率对音频帧执行加权线性预测变换编码。
2.如权利要求1所述的音频信号编码器,其中,模式选择单元基于编码之后音频帧的信噪比(SNR),从无声加权线性预测变换编码模式和无声码激励线性预测(CELP)编码模式中选择编码模式。
3.如权利要求1所述的音频信号编码器,其中,模式选择单元基于通过改变每个模式的偏移而编码的音频帧的信噪比(SNR),从无声加权线性预测变换编码模式和无声码激励线性预测(CELP)编码模式中选择编码模式。
4.如权利要求1所述的音频信号编码器,还包括码激励线性预测(CELP)编码单元, 根据选择的编码模式对音频帧执行CELP编码。
5.如权利要求4所述的音频信号编码器,其中,CELP编码单元参照确定的比特率对音频帧进行编码。
6.如权利要求1所述的音频信号编码器,还包括第一线性预测单元,通过对音频帧执行线性预测来产生第一线性预测数据; 第一残差信号产生单元,通过从音频帧去除第一线性预测数据来产生第一残差信号; 第二线性预测单元,通过对第一残差信号执行线性预测来产生第二线性预测数据; 第二残差信号产生单元,通过从第一残差信号去除第二线性预测数据来产生第二残差信号,其中,加权线性预测变换编码单元对第二残差信号进行变换。
7.如权利要求1所述的音频信号编码器,还包括线性预测单元,通过对音频帧执行线性预测来产生线性预测数据; 残差信号产生单元,从音频帧产生残差信号, 其中,加权线性预测变换编码单元包括 频域变换单元,将残差信号变换到频域;时域噪声整形(TNS)单元,对变换到频域的残差信号执行TNS;以及量化单元,对TNS的残差信号进行量化。
8.如权利要求1所述的音频信号编码器,还包括线性预测单元,通过对音频帧执行线性预测来产生线性预测数据; 残差信号产生单元,从音频帧产生残差信号, 其中,加权线性预测变换编码单元包括 频域变换单元,将残差信号变换到频域;检测单元,从包括在码本中的多个分量中检测与变换到频域的残差信号相应的分量;以及编码单元,对相应的分量的索引进行编码。
9.一种音频信号解码器,包括比特率确定单元,确定编码的音频帧的比特率;加权线性预测变换解码单元,根据确定的比特率对音频帧执行加权线性预测变换解码。
10.如权利要求9所述的音频信号解码器,还包括解码模式确定单元,确定音频帧的解码模式,其中,比特率确定单元参照确定的解码模式来确定比特率。
11.如权利要求9所述的音频信号解码器,其中,加权线性预测变换解码单元包括残差信号恢复单元,参照包括在音频帧中的码本索引从包括遵循高斯分布的多个分量的码本恢复第二残差信号;第二线性预测合成单元,基于包括在音频帧中的第二线性预测系数来恢复第二线性预测数据,并通过将第二残差信号与第二线性预测数据进行组合来恢复第一残差信号;以及第一线性预测合成单元,基于包括在音频帧中的第一线性预测系数来恢复第一线性预测数据,并通过将第一残差信号与第一线性预测数据进行组合来对音频帧执行线性预测解码。
12.如权利要求9所述的音频信号解码器,其中,加权线性预测变换解码单元包括 去量化单元,对包括在音频帧中的量化的残差信号去量化;逆时域噪声整形(TNS)单元,对去量化的残差信号执行逆TNS ; 时域变换单元,将逆TNS的残差信号变换到时域;以及线性预测解码单元,基于包括在音频帧中的线性预测系数来产生线性预测数据,并通过将线性预测数据与变换到时域的残差信号组合对音频帧执行线性预测解码。
13.如权利要求9所述的音频信号解码器,其中,加权线性预测变换解码单元包括提取单元,参照包括在音频帧中的码本索引从包括遵循高斯分布的多个分量的码本提取分量;时域变换单元,将提取的分量变换到时域;以及线性预测解码单元,基于包括在音频帧中的线性预测系数来产生线性预测数据,并通过将线性预测数据与变换到时域的码本的分量进行组合来对音频帧执行线性预测解码。
14.一种对音频信号进行编码的方法,所述方法包括 选择音频帧的编码模式;根据选择的编码模式来确定音频帧的比特率;以及根据确定的比特率对音频帧执行加权线性预测变换编码。
15.如权利要求14所述的方法,其中,选择编码模式的步骤包括基于编码之后音频帧的信噪比(SNR),从无声加权线性预测变换编码模式和无声码激励线性预测(CELP)编码模式中选择编码模式。
16.如权利要求14所述的方法,其中,选择编码模式的步骤包括基于通过改变每个模式的偏移而编码的音频帧的信噪比(SNR),从无声加权线性预测变换编码模式和无声码激励线性预测(CELP)编码模式中选择编码模式。
17.如权利要求14所述的方法,还包括通过对音频帧执行线性预测来产生第一线性预测数据; 通过从音频帧去除第一线性预测数据来产生第一残差信号; 通过对第一残差信号执行线性预测来产生第二线性预测数据;通过从第一残差信号去除第二线性预测数据来产生第二残差信号, 其中,执行加权线性预测变换编码的步骤包括对第二残差信号进行变换。
18.如权利要求14所述的方法,还包括 通过对音频帧执行线性预测来产生线性预测数据; 从音频帧产生残差信号,其中,执行加权线性预测变换编码的步骤包括 将残差信号变换到频域;对变换到频域的残差信号执行时域噪声整形(TNS);以及对TNS的残差信号进行量化。
19.如权利要求14所述的方法,还包括 通过对音频帧执行线性预测来产生线性预测数据; 从音频帧产生残差信号,其中,执行加权线性预测变换编码的步骤包括 将残差信号变换到频域;从包括在码本中的多个分量中检测与变换到频域的残差信号相应的分量;以及对相应的分量的索引进行编码。
20.一种记录有用于执行权利要求14到权利要求19的任意一项的方法的计算机程序的计算机可读记录介质。
全文摘要
公开了一种使用可变比特率(VBR)对音频信号进行编码/解码的设备。根据音频信号的特性确定目标比特率,并根据确定的目标比特率执行加权线性预测变换编码。
文档编号G10L19/00GK102483922SQ201080038872
公开日2012年5月30日 申请日期2010年6月28日 优先权日2009年6月29日
发明者吴殷美, 成昊相, 金美英, 金重会 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1