音频编解码的量化方法、反变换方法及音频编解码装置的制作方法

文档序号:2837294阅读:221来源:国知局
专利名称:音频编解码的量化方法、反变换方法及音频编解码装置的制作方法
技术领域
本发明涉及音频编码技术,尤其涉及音频编码的量化方法、音频解码的 反变换方法及音频编码装置、解码装置。
背景技术
目前,音频编码装置通常由四个主要部分组成,包括滤波器组、心理 声学模型、量化模块以及编码模块。参见图1,图l示出了现有技术中的一 种音频编码装置的结构示意图。
其中,滤波器组用于进行时变换域映射,将输入的音频信号由时域映射 为变换域,并将所映射的变换域信号输出给比特分配量化模块。其中,变换 域或者说频域泛指各种为了信号处理的方便采用的变换方法得到的信号表 示结果,这些变换方法包括傅立叶变换(FFT),修正离散余弦变换(MDCT) 和小波变换(wavelet)等。
心理声学模型用于对输入信号进行分析,根据人耳的听觉模型确定输入 信号中哪些分量可以不进行编码,哪些分量可以用比较低的精度进行编码 等,并生成控制信号输出给比特分配量化模块。
量化模块用于根据来自心理声学模型的控制信号中的掩噪比及感知熵
等信息,对所接收的来自滤波器组的变换域信号进行量化,将量化后的音频 样本信号输出给编码模块。
编码模块用于对量化模块输出的音频样本信号进行熵编码,并连同一些 解码所需的边信息生成符合规范的码流。
此外,音频解码装置通常由三个主要部分组成,包括解码模块、反量 化模块和滤波器组。参见图2,图2示出了现有技术中音频解码装置的结构
示意图。
其中,解码模块,用于对所接收的码流进行解码,将解码后的音频样本 信号输出给反量化模块,并将相应的解码边信息(如声道数,采样率和码表 索引等信息)提供给反量化模块,或者以及滤波器组。
反量化模块,用于根据解码边信息对来自解码模块的音频样本信号进行 反量化等操作,将反量化后的变换域信号输出。
滤波器组,用于接收来自反量化模块的变换域信号,将所接收的变换域 信号反映射为时域信号输出。
其中,量化模块在对变换域信号进行量化之前,通常先对变换域信号利 用统一的压扩函数进行变换,之后再对变换后的系数进行量化。相应地,反 量化模块在对音频样本信号进行反量化之后,还需对反变换后的变换域信号 利用统一的压扩函数进行反变换。具体实现时,可如图l和图2所示,量化 模块中可包括压扩函数变换子模块和量化子模块,反量化模块中可包括反量 化子模块和压扩函数反变换子模块。其中,统一的压扩函数通常采用
/(x) = x%。此外,当压扩函数采用/(;c)-x时,相当于进行线性量化,其中, x为变换域信号中的每个系数。
但由于人耳对不同频段噪声的敏感程度不一样,且采用不同压扩函数进 行变换处理后,信号的性能和量化过程引入的量化误差是不一样的,且量化 后进行编码需要的比特数也是不一样的。因此,对整帧输入信号进行统一的 压扩函数变换,无法充分利用信号本身及人耳的特点,无法有效提高音频编 码的整体效率。

发明内容
有鉴于此,本发明实施例中提供一种音频编码的量化方法和一种音频编 码装置,以便提高音频编码的整体效率。
相应地,本发明实施例中还提供一种音频解码的反变换方法和一种音频 解码装置。
本发明实施例中提供的音频编码的量化方法,包括将变换域信号划分 为一个或一个以上的子带;对所划分的各个子带分别选择一个压扩函数进行 变换,得到各个子带的变换系数;对所得到的各个子带的变换系数进行量化。
其中,所述将变换域信号划分为一个或一个以上的子带为根据预先设定 的划分信息,将变换域信号划分为 一个或一个以上的子带;
或者为根据系统测量的信号信息,以及所述信号信息与子带划分的关系, 将变换域信号划分为一个或一个以上的子带。
其中,所述对所划分的各个子带分别选择一个压扩函数进行变换为根据 预先设定的子带与压扩函数的映射关系信息,为各个子带分别选择对应的压扩 函数进行变换;
或者为根据系统测量的信号信息,以及所述信号信息与压扩函数的对 应关系,为各个子带分别选择对应的压扩函数进行变换。
本发明实施例中提供的音频解码的反变换方法,包括对反量化得到的 变换域信号的每个子带,按照编码时对应的压扩函数分别进行反变换。
本发明实施例中提供的音频编码装置,包括滤波器组、心理声学模型、 量化模块和编码模块,其中,所述量化模块,用于将来自滤波器组的变换域 信号划分为一个或一个以上的子带,对所划分的各个子带分别选择一个压扩 函数进行变换,得到各个子带的变换系数,对所得到的各个子带的变换系数 进行量化,将量化后得到的音频样本信号输出给编码模块。
其中,量化模块包括子带划分子模块、压扩函数选择子模块、压扩函数 变换子模块和量化子模块,其中,
所述子带划分子模块,用于将来自滤波器组的变换域信号划分为一个或一 个以上的子带,将所划分子带输出给所述压扩函数选择子模块;
所述压扩函数选择子模块,用于为子带划分子模块所划分的各个子带分别
变换子模块;
所述压扩函数变换子模块,用于利用各个子带对应的压扩函数,对相应子
带进行变换,得到各个子带的变换系数,将所述各个子带的变换系数输出给量
化子模块;
所述量化子模块,用于对来自所述压扩函数变换子模块的所述各个子带 的变换系数进行量化,将量化后得到的音频样本信号输出给编码模块。
所述子带划分子模块进一步接收来自所述心理声学模型的信号信息,根 据所述信号信息与子带划分的关系,执行所述将来自滤波器组的变换域信号 划分为一个或一个以上的子带的操作。
所述压扩函数选择子模块进一步接收来自所述心理声学模型的信号信
息,根据所述信号信息与压扩函数的对应关系,执行所述为子带划分子模块 所划分的各个子带分别选择一 个压扩函数的操作。
本发明实施例中提供的音频解码装置,包括解码模块、反量化模块和
滤波器组,其中,所述反量化模块,用于对来自解码模块的音频样本信号进 行反量化后,将反量化得到的变换域信号的每个子带,按照编码时对应的压 扩函数分别进行反变换,将反变换后的变换域信号输出给滤波器组。
其中,所述反量化模块包括
反量化子模块,用于对来自解码模块的音频样本信号进行反量化,将反量 化得到的变换域信号输出给压扩函数反变换模块;
所述压扩函数反变换模块,用于对所述变换域信号的每个子带,按照编 码时对应的压扩函数分别进行反变换,将反变换后的变换域信号输出给滤波器组。
从上述方案可以看出,本发明实施例中将变换域信号划分为一个或一个 以上的子带,对所划分的各个子带分别选择一个压扩函数进行变换,从而可 以充分利用信号及人耳的特点,对每帧信号中的不同部分,分别采用适宜的 压扩函数进行变换,优化编码方式,提高音频编码的整体效率。


图l为现有技术中音频编码装置的结构示意图2为现有技术中音频解码装置的结构示意图3为本发明实施例中音频编码的量化方法的流程图4为本发明实施例中音频编码装置的结构示意图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和 附图,对本发明进一步详细说明。
参见图3,图3为本发明实施例中音频编码的量化方法的流程图。如图 3所示,该流程包括如下步骤
步骤301,将变换域信号划分为一个或一个以上的子带。
在音频编码过程中,将输入信号由时域映射为变换域后,可在本步骤中 将变换域信号划分为一个或一个以上的子带。其中,划分子带的方法可有多 种。如可以按照预先设定的划分信息,对变换域信号进行划分,也可以根据 系统测量的信号信息,以及所述信号信息与子带划分的关系,对变换域信号 进行划分。
例如利用人耳对低中频段比较敏感,而对高频段不太敏感的特性,可 对变换域信号按频段划分,如可划分为高频段部分和低频段部分两个子带, 或者划分为高频段部分、中频段部分和低频段部分三个子带等。此外,还可 以有其它的划分方法,具体采用何种依据进行划分,可根据实际需要而定, 本发明中不做限制。
其中,可根据音频信号的统计规律,预先设定划分子带时的边界或个数 等划分信息,之后可按照预先设定的划分信息对变换域信号进行划分。此时, 可在解码端预先约定子带的划分信息,则编码后无需将子带划分的信息放入 码流中传输,或未在解码端约定子带的划分信息,则需要将子带划分的信息 作为边信息放入码流中 一 并传输。
或者,也可以预先设定信号信息(如信号的变换域掩蔽阈值或者变换域 信号内每个频率段的取值等)与子带划分的关系,之后根据系统测量的当前
帧的信号信息,按照预先设定的信号信息与子带划分的关系,动态的对变换 域信号进行子带的划分。其中,在动态划分的情况下,需要将子带划分的信 息作为边信息放入码流中 一 并传输。
步骤302,对所划分的各个子带分别选取一个压扩函数进行变换,得到
各个子带的变换系数。
具体的压扩函数的选取策略可以有多种,如可以根据编码系统的特性, 或者结合信号的特点等多方面的因素进行判断。具体采用何种依据进行选 取,可根据实际需要而定,本发明中不做限制。
其中,可根据信号的统计规律,预先设定子带与压扩函数的映射关系信 息,即什么特性的子带与什么压扩函数相对应,或者是第几个子带与第几个
压扩函数相对应等,如预先设定系统划分2个子带,并设定第一个子带对应 压扩函数l,第2个子带对应压扩函数2。然后根据预先设定的子带与压扩 函数的映射关系信息,为各个子带分别选择对应的压扩函数进行变换。此时, 可在解码端预先约定压扩函数的选用信息,则编码时无需将压扩函数选用的 信息放入码流中传输,或未在解码端约定压扩函数的选用信息,则需要将压 扩函数选用的信息作为边信息放入码流中 一并传输。
或者也可以预先设定信号信息(如信号的变换域掩蔽阈值或者变换域信 号内每个频率段的取值等)与压扩函数的对应关系,即建立信号信息与压扩 函数及子带特性的对应关系等,之后根据系统测量的当前帧的信号信息,按 照预先设定的信号信息与压扩函数的对应关系,动态的为各个子带,选取适 宜的压扩函数进行变换。其中,对于动态选取压扩函数的情况,需要将压扩 函数选用的信息作为边信息放入码流中 一并传输。
换完后,再对另一个子带进行变换;或者也可以是并行进行,即同时对各个 子带进行变换。具体采用哪种方式,可根据实际需要选择。 步骤303,对所得到的各个子带的变换系数进行量化。 本步骤中,对所得到的各个子带的变换系数进行量化的过程可以是串行
进行,即对一个子带量化完后,再对另一个子带进行量化;或者也可以是并 行进行,即同时对各个子带进行量化。具体釆用哪种方式,可根据实际需要 选择。
之后,对量化后得到的音频样本信号进行熵编码等编码过程,并连同一 些解码所需的边信息生成符合规范的码流。同样,熵编码等编码过程也可以 是串行进行,或并行进行。
相应地,对釆用上述量化方法进行量化后编码生成的码流,在解码端可 包括如下过程对所接收的码流进行解码,对解码后的音频样本信号进行反 量化,对反量化得到的变换域信号的每个子带,按照编码时对应的压扩函数 分别进行反变换,将反变换后的变换域信号反映射为时域信号输出。
其中,若在解码端事先约定了子带划分的信息,则对反量化得到的变换 域信号进行反变换时,可按照事先约定的子带划分的信号,获取各子带的划 分信息,否则可根据从码流中解码出的边信息获取各子带的划分信息。
同样,若在解码端事先约定了压扩函数的选取信息,则对反量化得到的 变换域信号进行反变换时,可按照事先约定的压扩函数的选取信号,获取各 子带对应的压扩函数信息,否则可根据从码流中解码出的边信息获取各子带 对应的压扩函数信息。
以上对本发明实施例中音频编码的量化方法和音频解码的反变换方法 进行了详细描述,下面将对本发明实施例中的音频编码装置和音频解码装置 进4亍详细描述。
参见图4,图4为本发明实施例中音频编码装置的结构示意图。如图4 所示,该装置包括滤波器组、心理声学模型、量化模块和编码模块。
其中,滤波器组用于进行时变换域映射,将输入的音频信号由时域映射 为变换域,并将所映射的变换域信号输出给比特分配量化模块。
心理声学模型,用于对输入信号进行分析,根据人耳的听觉模型确定输 入信号中哪些分量可以不进行编码,哪些分量可以用比较低的精度进行编码 等,并生成控制信号输出给比特分配量化模块。
量化模块用于将来自滤波器组的变换域信号划分为一个或一个以上的 子带,对所划分的各个子带分别选择一个压扩函数进行变换,得到各个子带 的变换系数,对所得到的各个子带的变换系数进行量化,将量化后得到的音 频样本信号输出给编码模块。其中,对所得到的各个子带的变换系数进行量 化时,可根据来自心理声学模型的控制信号中的掩噪比及感知熵等信息进 行。
编码模块用于对量化模块输出的音频样本信号进行熵编码,并连同 一些 解码所需的边信息生成符合规范的码流。
具体实现时,量化模块可有多种实现形式,本实施例中仅列举其中 一种,
对量化模块的具体实现进行详细描述。如图4所示,该量化模块可包括子 带划分子模块、压扩函数选择子模块、压扩函数变换子模块和量化子模块。
其中,子带划分子模块用于将来自滤波器组的变换域信号划分为一个或 一个以上的子带,将所划分子带输出给所述压扩函数选择子模块。
压扩函数选择子模块用于为子带划分子模块所划分的各个子带分别选 择一个压扩函数,将各个子带及其对应的压扩函数信息提供给所述压扩函数 变换子模块。
压扩函数变换子模块用于利用各个子带对应的压扩函数,对相应子带进 行变换,得到各个子带的变换系数,将所述各个子带的变换系数输出给量化 子模块。其中,压扩函数变换子模块对各个子带进行变换时,可串行进行, 也可并行进行。串行进行指对一个子带变换完后,再对另一个子带进行变换, 并行进行指同时对各个子带进行变换。具体采用哪种方式,可根据实际需要 选择。
量化子模块用于对来自所述压扩函数变换子模块的所述各个子带的变 换系数进行量化,将量化后得到的音频样本信号输出给编码模块。其中,量 化子模块对各个子带进行量化时,可串行进行,也可并行进行。串行进行指 对一个子带量化完后,再对另一个子带进行量化,并行进行指同时对各个子 带进行量化。具体采用哪种方式,可根据实际需要选择。
其中,子带划分子模块在对音频信号进行子带划分时,可有多种划分方 法。如可以按照预先设定的划分信息,对变换域信号进行划分,如预先设定 按照设定的边界将子带划分为2个或多个等。
或者,也可以根据系统测量的信号信息,以及所述信号信息与子带划分 的关系,对变换域信号进行划分。其中,系统测量的信号信息可以从心理声 学模型获取,也可以从其它模块中获取,若从心理声学模块中获取,则如图
4中的虚线部分所示,子带划分子模块进一步用于接收来自所述心理声学 模型的信号信息,根据所述信号信息与子带划分的关系,执行所述将来自滤 波器组的变换域信号划分为 一个或一个以上的子带的操作。
压扩函数选择子模块在为各子带选取压扩函数时,可有多种选取方法。 如可根据预先设定的子带与压扩函数的映射关系信息,为各个子带分别选择 对应的压扩函数进行变换,如预先设定系统划分2个子带,并设定第一个子 带对应压扩函数l,第2个子带对应压扩函数2,则可为第一个子带选取压 扩函数l,为第2个子带选取压扩函数2;或者预先设定子带特性与压扩函 数的对应关系,则根据各子带自身的特性,选取对应的压扩函数。
或者,也可以根据系统测量的信号信息,以及所述信号信息与压扩函数 的对应关系,为各个子带分别选择对应的压扩函数进行变换。其中,系统测 量的信号信息可以从心理声学模型获取,也可以从其它模块中获取,若从心 理声学模块中获取,则如图4中的虚线部分所示,压扩函数选择子模块进一 步用于接收来自所述心理声学模型的信号信息,根据所述信号信息与压扩 函数的对应关系,执行所述为子带划分子模块所划分的各个子带分别选择一 个压扩函数的操作。
其中,压扩函数选择子模块和压扩函数变换子模块可集成在一起。
相应地,本发明实施例中的音频解码装置的组成及连接关系可与图2所示 装置的描述一致。包括解码模块、反量化模块和滤波器组。不同之处在于, 本实施例中的反量化模块,用于对来自解码模块的音频样本信号进行反量化后, 将反量化得到的变换域信号的每个子带,按照编码时对应的压扩函数分别进行
反变换,将反变换后的变换域信号输出给滤波器组。
具体实现时,反量化模块的内部组成及连接关系也可以与图2所示装置的 描述一致。包括反量化子模块和压扩函数反变换模块。其中,反量化子模块仍 然为,用于对来自解码模块的音频样本信号进行反量化,将反量化得到的变换 域信号输出给压扩函数反变换模块。
不同之处在于,压扩函数反变换模块,用于对所述变换域信号的每个子带, 按照编码时对应的压扩函数分别进行反变换,将反变换后的变换域信号输出给 滤波器组。
其中,若在解码端事先约定了子带划分的信息,则压扩函数反变换模块 可按照事先约定的子带划分的信号,获取各子带的划分信息,否则可根据从 码流中解码出的边信息获取各子带的划分信息。
同样,若在解码端事先约定了压扩函数的选取信息,则压扩函数反变换模 块可按照事先约定的压扩函数的选取信号,获取各子带对应的压扩函数信息, 否则可根据从码流中解码出的边信息获取各子带对应的压扩函数信息。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了 进一步详细说明,所应理解的是,以上所述仅为本发明的较佳实施例而已, 并非用于限定本发明的保护范围,凡在本发明的精神和原则之内,所作的任 何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
权利要求
1、一种音频编码的量化方法,其特征在于,该方法包括将变换域信号划分为一个或一个以上的子带;对所划分的各个子带分别选择一个压扩函数进行变换,得到各个子带的变换系数;对所得到的各个子带的变换系数进行量化。
2、 如权利要求l所述的方法,其特征在于,所述将变换域信号划分为一个 或一个以上的子带为根据预先设定的划分信息,将变换域信号划分为一个或 一个以上的子带;或者为根据系统测量的信号信息,以及所述信号信息与子带划分的关系, 将变换域信号划分为一个或一个以上的子带。
3、 如权利要求l所述的方法,其特征在于,所述对所划分的各个子带分别 选择一个压扩函数进行变换为根据预先设定的子带与压扩函数的映射关系信或者为根据系统测量的信号信息,以及所述信号信息与压扩函数的对应 关系,为各个子带分别选择对应的压扩函数进行变换。
4、 一种音频解码的反变换方法,其特征在于,该方法包括对反量化得到 的变换域信号的每个子带,按照编码时对应的压扩函数分别进行反变换。
5、 一种音频编码装置,包括滤波器组、心理声学模型、量化模块和编码 模块,其特征在于,所述量化模块,用于将来自滤波器组的变换域信号划分为 一个或一个以上的子带,对所划分的各个子带分别选择一个压扩函数进行变换, 得到各个子带的变换系数,对所得到的各个子带的变换系数进行量化,将量化 后得到的音频样本信号输出给编码模块。
6、 如权利要求5所述的装置,其特征在于,所述量化模块包括子带划分 子模块、压扩函数选择子模块、压扩函数变换子模块和量化子模块,其中,所述子带划分子模块,用于将来自滤波器组的变换域信号划分为一个或一 个以上的子带,将所划分子带输出给所述压扩函数选择子模块;所述压扩函数选择子模块,用于为子带划分子模块所划分的各个子带分别 选择一个压扩函数,将各个子带及其对应的压扩函数信息提供给所述压扩函数变换子模块;所述压扩函数变换子模块,用于利用各个子带对应的压扩函数,对相应子 带进行变换,得到各个子带的变换系数,将所述各个子带的变换系数输出给量 化子模块;所述量化子模块,用于对来自所述压扩函数变换子模块的所述各个子带的 变换系数进行量化,将量化后得到的音频样本信号输出给编码模块。
7、 如权利要求6所述的装置,其特征在于,所述子带划分子模块进一步接 收来自所述心理声学模型的信号信息,根据所述信号信息与子带划分的关系, 执行所述将来自滤波器组的变换域信号划分为一个或一个以上的子带的操作。
8、 如权利要求6或7所述的装置,其特征在于,所述压扩函数选择子模块 进一步接收来自所述心理声学模型的信号信息,根据所述信号信息与压扩函数 的对应关系,执行所述为子带划分子模块所划分的各个子带分别选择一个压扩 函数的操作。
9、 一种音频解码装置,包括解码模块、反量化模块和滤波器组,其特征 在于,所述反量化模块,用于对来自解码模块的音频样本信号进行反量化后, 将反量化得到的变换域信号的每个子带,按照编码时对应的压扩函数分别进行 反变换,将反变换后的变换域信号输出给滤波器组。
10、 如权利要求9所述的装置,其特征在于,所述反量化模块包括 反量化子模块,用于对来自解码模块的音频样本信号进行反量化,将反量化得到的变换域信号输出给压扩函数反变换模块;所述压扩函数反变换模块,用于对所述变换域信号的每个子带,按照编码 时对应的压扩函数分別进行反变换,将反变换后的变换域信号输出给滤波器组。
全文摘要
本发明公开了一种音频编码的量化方法,包括将变换域信号划分为一个或一个以上的子带;对所划分的各个子带分别选择一个压扩函数进行变换,得到各个子带的变换系数;对所得到的各个子带的变换系数进行量化。此外,本发明还公开了一种音频解码的反变换方法,包括对反量化得到的变换域信号的每个子带,按照编码时对应的压扩函数分别进行反变换。最后,本发明还公开了一种音频编码装置及音频解码装置。通过充分利用信号及人耳的特点,对每帧信号中的不同部分,分别采用适宜的压扩函数进行变换,优化编码方式,提高音频编码的整体效率。
文档编号G10L19/02GK101105940SQ200710118030
公开日2008年1月16日 申请日期2007年6月27日 优先权日2007年6月27日
发明者王箫程 申请人:北京中星微电子有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1