音频编解码器的制作方法

文档序号:7514566阅读:254来源:国知局
专利名称:音频编解码器的制作方法
技术领域
本发明涉及通信技术领域,具体涉及一种编解码器,用于多媒体通信和消费类电 子设备。
背景技术
在多媒体通信领域,包括语音在内的音频、尤其是宽带音频已逐渐成为主要通信 业务之一。但是音频信号频带较宽、编码数据量较大,这给音频信号的实时传输和有 效存储带来很大的困难。虽然MP3、 AAC、 EAAC和EAAC+等音频编码器已经能够较好地 对音频信号进行压縮编码、满足了一定应用的要求,但还无法完全胜任移动多媒体通 信业务的低速率高质量要求,所以有必要研究效率更高和质量更好的音频编解码器。 与本发明相关的现有技术有下两种,下面分别给以简单介绍
现有技术一
EAAC和EAAC+音频编码器。这两种音频编码器是在AAC音频编码器基础上发展起 来的,其主要特点是采用频带复制技术。 一般地说,任何信号是由若干个基频及合它 们的各次谐波所组成,这为用低频信号复制和重构高频信号提供了可能。频带复制是 目前效果比较好的一种高频重建技术,它把低频子带的波形选择性地复制到高频段子 带中去,再利用提取的能量和谐波调整参数对复制的高频段进行整形,从而达到高频 重建的目的,并以此为基础重建时域信号。频带复制是建立在现有的核心音频编解码 器之上的高频重构方法,它通过核心编解码器得到音频的低频成分并以此复制程高频 成分,再添加一些补偿的音调信号,然后进行高频频谱调整完成高频重构。
现有技术一存在如此下缺点音频信号具有频带宽、信号内容丰富、动态范围大、 频谱谐波丰富等特点,而且在不同的频段都会出现共振峰;在通常情况下,音频信号 频谱的低频部分与高频部分可能没有相似的共振峰特性、也没有类似的频谱细节和谐 波效应。所以频带复制技术在许多情况下虽然能够大体上重构高频信号分量,但高频 的细节信息难以较好的重构,从而影响了重构音频信号的质量,因此,£八八(]和£八八0+ 音频编码器的音频压縮比和音频编码质量仍有待提高。现有技术二
Vorbis是一种通用的音频编解码器。这种音频编解码器算法的基本思想是在 编码端,对时域音频信号进行变换到频域信号,然后用心理声学模型所确定的感知滤 波器对频域信号进行滤波处理,得到频域残差信号;编码器传送的是感知滤波器参数 和频域残差信号的编码。在解码端,解码器利用收到的感知滤波器参数和频域残差信 号的编码,通过解码恢复感知滤波器参数和频域残差信号;然后感知滤波器参数和频 域残差信号重构频域信号,再将频域信号变换到时域重构时域音频信号。
现有技术二存在的缺点是Vorbis音频编码器分析得到的频域残差信号是经过
感知滤波处理的白化信号,所以从整个频域上看,频域残差的高频段信号与低频段信
号通常具有很强的相似性和相关性。但Vorbis音频编码器并没有考虑这些特性,而
是直接对频域残差信号进行编码,所以未能达到最佳的编码效率。

发明内容
本发明目的在于克服上述已有技术的不足,提供一种压縮比高的音频编解码器, 以提高对信道利用率、减少带宽需求、提高音频传输质量。
为实现上述目的,本发明的编码器包括时频分析单元、感知模型单元、感知参
数编码单元、感知参数解码单元、频域感知滤波单元及合路单元,感知参数编码单元 输出的感知参数编码分为两路传输, 一路通过感知参数解码单元进入频域感知滤波单 元,另一路直接进入合路单元,其特征在于频域感知滤波单元的输出端连接有残差分 析与编码单元,该残差分析与编码单元输出低频残差信号编码和高频残差参数编码, 同时进入合路单元,与感知参数编码合并,输出编码比特流。
所述的残差分析与编码单元,包括
残差信号高低频段分割单元,用于将频域残差信号划分为低频残差信号和高频残
差信号两部分;低频残差信号编码单元,用于对低频残差信号直接进行压縮编码,得 到低频残差信号编码;低频残差信号解码单元,用于完成对低频残差信号编码数据在 编码端的本地解码,得到解码重构的低频残差信号;高频残差信号分析单元,用于根 据高频残差信号与本地解码得到的低频残差信号的相关性或相似性,分析和估算用于 在解码端复制和重构高频残差信号的高频残差参数;高频残差参数编码器单元,用于 对高频残差参数进行编码,得到高频残差参数编码;该残差信号高低频段分割单元输 出的低频残差信号和高频残差信号分别传输到低频残差信号编码单元和高频残差信 号分析单元,分别输出低频残差信号编码和高频残差参数。
为实现上述目的,本发明的解码器包括分路单元、感知参数解码单元、频域感知逆滤波器单元和时频合成单元,分路单元输出的感知参数编码通过感知参数解码单 元输出感知参数,并进入频域感知逆滤波器单元以确定滤波器特性,其特征在于分路 单元输出的低频残差信号编码和高频残差参数编码同时通过残差解码与合成单元,输 出重构频域残差信号进入频域感知逆滤波器单元进行逆滤波,输出重构频域信号,再 通过时频合成单元输出重构时域信号。
所述的残差解码与合成单元,包括低频残差信号解码器单元,用于对接收到的 低频残差信号编码进行解码,得到重构的低频残差信号,同时输出到高频残差信号重 构单元和残差信号高低频段重组单元;高频残差参数解码器单元,用于对接收到的高 频残差参数编码进行解码,得到重构的高频残差参数,输出到高频残差信号重构单元; 高频残差信号重构单元,用于利用重构的低频残差信号,并根据解码得到的高频残差 参数进行高频残差的复制和重构,得到重构高频残差信号,输出到残差信号高低频段 重组单元;残差信号高低频段重组单元,用于将解码器将解码得到的低频残差信号和 重构的高频残差进行组合,得到重构频域残差信号。
本发明由于在编码器中采用了残差分析与编码单元,它将频域残差分解为高频 残差信号和低频残差信号,并采用对低频残差进行直接编码、对高频残差进行参数编 码的形式;同时由于在解码器中采用了残差解码与合成单元,它利用解码得到的低频 残差信号和高频残差参数复制和重构高频残差信号,继而重构频域残差信号;因此, 本发明消除了频域残差信号中的多余度、有效地压缩了音频信号中的多余度、进一步 提高了音频编码的编码效率,以此为基础的音频编解码器能够对包括语音信号在内的 音频信号进行高效高质量的压縮和编码。


图1是本发明的音频编码器结构示意图; 图2是本发明的残差分析及编码器单元组成示意图3是本发明的音频解码器结构示意图4是本发明的解码器及残差合成单元组成示意图。
具体实施例方式
参见图l,本发明的音频编码器包括时频分析单元101、感知模型单元102、感
知参数编码器单元103、感知参数解码器单元104、频域感知滤波器单元105、残差分 析与编码单元106、合路单元107,其中
时频分析单元IOI,接收输入到编码器的原始音频信号,它包括语音信号、音频 信号或任何人耳可以听到的各种声音信号的混合声音;音频信号的频率范围主要在0Hz到20kHz之间,音频信号的采样频率为96kHz、 48kHz、 44. lkHz、 32kHz、 22. 05kHz、 16kHz、 11.025kHz和8kH。时域音频信号的编码通常是以音频帧为单位的,常用音频 帧的大小按照实际应用一般在50毫秒之内。
时频分析单元IOI,对输入的时频信号进行时频分析并将其变换成频域信号,时 域分析采用但不限于修正离散余弦变换、修正重叠变换和快速傅里叶变换方法进行变 换。
感知模型单元102,根据输入的时域信号帧以及时域分析得到的频域信号计算出 的反映人耳听觉特性的频域感知参数或感知曲线,如掩蔽门限、信号掩蔽比等。
感知参数编码器单元103,对感知模型参数进行压缩编码并输出感知参数编码数 据,感知模型参数的压縮编码方法采用各种有失真的编码方法,如线性或非线性标量 量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码、 算术编码。
感知参数解码器单元104,完成对感知参数编码在编码器端的解码并得到解码后 的感知参数。
频域感知滤波器单元105,根据本地解码得到的感知参数,对来自时频分析单元 IOI的频域信号进行频域滤波,得到在感知意义上白化了的频域残差信号。如果用 表示频域感知滤波器的传输函数,用M(/)表示由感知参数表征的感知曲线,
则/^(/)可以表示为// (/) = ~^~,其中/表示频率,单位为Hz。
残差分析与编码单元106,对频域残差信号进行分析,并对分析结果进行编码, 分别得到低频残差信号编码数据和高频残差参数编码数据。该残差分析与编码单元 106如图2所示,其具体结构包括残差信号高低频段分割单元201、低频残差信号编 码器单元202、低频残差信号解码单元203、高频残差信号分析单元204和高频残差参 数编码单元205。该残差信号高低频段分割单元201,根据音频编码器压縮比和编码速 率的要求,将频域残差信号划分为低频残差信号和高频残差信号两部分;该低频残差 信号编码器单元202对低频残差信号直接进行压縮编码,得到低频残差信号编码数据; 低频残差信号的编码,釆用各种有失真的编码方法,如线性或非线性标量量化编码、 矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码、算术编码; 该低频残差信号解码器单元203,完成低频残差信号编码数据在编码端的本地解码, 得到解码的低频残差信号;该高频残差信号分析单元204,根据高频残差信号与本地 解码的低频残差信号的相关性,分析和估算用于在解码端重构高频残差信号的高频残差参数,以有效地压縮高频残差信号的数据量并能够在解码器端高质量地重构高频残 差信号;该高频残差参数编码器单元205,对高频残差参数进行编码,得到高频残差 参数编码数据;高频残差参数的编码采用各种有失真的编码方法,如线性或非线性标 量量化编码、矢量量化编码,或者同时采用各种无失真的编码方法,如Huffman编码、 算术编码等。残差信号高低频段分割单元201接收频域残差信号,并将输出的低频残 差信号和高频残差信号分别传输到低频残差信号编码单元202和高频残差信号分析单 元204;低频残差信号编码单元202输出的低频残差信号编码,分别输出到合路单元107 和低频残差信号解码器单元203;高频残差信号分析单元204根据接收到的高频残差信 号和重构低频残差信号分析计算并输出高频残差参数;高频残差参数编码单元205对 接收到的高频残差参数进行编码,并输出高频残差参数到合路单元107。
合路单元107,将感知参数编码数据、低频残差信号编码数据和高频残差参数编 码数据进行合路,形成一个完整的编码比特流,并输出到传输信道或存储媒介。
整个编码器的连接关系为时域分析单元101接收时域信号并对其进行时域分析, 得到频域信号并分为两路, 一路进入频域感知滤波器单元105, 一路进入感知模型单 元102;感知模型单元102利用接收的时域信号和频域信号进行计算得到感知参数, 并送到感知参数编码单元103;感知参数编码单元103输出的感知参数编码分为两路 传输, 一路通过感知参数解码单元103进入频域滤波单元105,另一路直接进入合路 单元107;频域感知滤波单元105的输出端与残差分析与编码单元106连接;残差分析 与编码单元106输出低频残差信号编码和高频残差参数编码,同时进入合路单元107, 并与感知参数编码合并,输出编码比特流。
参见图3,本发明的音频解码装置包括分路单元301、残差解码与合成单元302、 感知参数解码器单元303、频域感知逆滤波器单元304和时频合成单元305。其中
分路单元301,接收来自音频编码器的编码比特流,并将其分解成感知参数编码、 低频残差信号编码和高频残差参数编码三路编码数据。
残差解码与合成单元302如图4所示,它包括低频残差信号解码单元401、高频 残差参数解码单元402、高频残差信号重构单元403和残差信号高低频段重组单元404。 该低频残差信号解码单元401,用于对接收到的低频残差信号编码进行解码,得到的 重构低频残差信号,再将它同时输出到高频残差信号重构单元403和残差信号高低频 段重组单元404;该高频残差参数解码器单元402,用于对接收到的高频残差参数编码 进行解码,得到重构的高频残差参数,输出到高频残差信号重构单元403;该高频残 差信号重构单元403,用于利用重构的低频残差信号,并根据解码得到的高频残差参数进行高频残差的复制和重构,得到重构高频残差信号,输出到残差信号高低频段重
组单元404;该残差信号高低频段重组单元404,用于将得到的低频残差信号和重构的
高频残差进行组合,得到重构频域残差信号。
感知参数解码器单元303,对感知参数编码数据的解码,得到解码后的感知参数。 频域感知逆滤波器单元304,利用由感知参数所确定的频域感知逆滤波器对重构
频域残差信号进行频域逆滤波处理,得到重构频域信号。如果用表示频域感知
逆滤波器,则压(/)可以表示为历(/) = ~^~ =似(/),其中/表示频率,单位为Hz。
时频合成单元305,对重构频域信号进行时频反变换,得到重构的时域信号输出。 与时频分析相对应,时域合成可以采用反向修正离散余弦变换、反向修正重叠反变换、 反向快速傅里叶变换方法进行变换。
整个解码器的传输关系为分路单元301接收编码比特流并将其分解成低频残差 信号编码、高频残差参数编码和感知参数编码三路编码,分别输出到残差解码与合成 单元302和感知参数解码器单元303;残差解码与合成单元302根据低频残差信号编码 和高频残差参数编码重构频域残差信号,输出到频域感知逆滤波器单元304;感知参 数解码器单元303对感知参数编码进行解码,得到解码感知参数,输出到频域感知逆 滤波器单元304;频域感知逆滤波器单元304利用解码感知参数确定的频域感知滤波器 对重构频域残差信号进行逆滤波处理,得到重构频域信号,输出到时频合成单元305; 时频合成单元305对重构频域信号进行方变换,得到重构时域信号输出。
本发明上述实施例提供的音频编码器和解码器,能够对包括语音信号在内的音频 信号进行高效高质量的压缩编码和传输。
以上实施例只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域 的一般技术人员,依据本发明的思想,在具体实施方式
及应用范围上均会有改变之处, 综上所述,本说明书内容不应理解为对本发明的限制。本领域普通技术人员可以理解 上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完 成,该程序可以存储于计算机可读存储介质中,存储介质可以包括ROM、 RAM、 Flash、 磁盘或光盘,但这些均在本发明的保护范围之内。
权利要求
1. 一种音频编码器,包括时频分析单元(101)、感知模型单元(102)、感知参数编码单元(103)、感知参数解码单元(104)、频域感知滤波单元(105)及合路单元(107),感知参数编码单元(103)输出的感知参数编码分为两路传输,一路通过感知参数解码单元(104)进入频域感知滤波单元(105),另一路直接进入合路单元(107),其特征在于,频域感知滤波单元(105)的输出端连接有残差分析与编码单元(106),该残差分析与编码单元(106)输出低频残差信号编码和高频残差参数编码,同时进入合路单元(107),并与感知参数编码合并,输出编码比特流。
2. 根据权利要求1所述的音频编码器,其特征在于,残差分析与编码单元(106), 包括残差信号高低频段分割单元(201),用于将频域残差信号划分为低频残差信号 和高频残差信号两部分;低频残差信号编码单元(202),用于对低频残差信号直接进行压缩编码,得到 低频残差信号编码;低频残差信号解码单元(203),用于完成低频残差信号编码在编码端的本地解 码,得到解码重构的低频残差信号;高频残差信号分析单元(204),用于根据高频残差信号与本地解码的低频残差 信号的相关性和相似性,分析和估算用于在解码端重构高频残差信号的高频残差参 数;高频残差参数编码单元(205),用于对高频残差参数进行编码,得到高频残差 参数编码;所述的残差信号高低频段分割单元(201)输出的低频残差信号和高频残差信号 分别传输到低频残差信号编码单元(202)和高频残差信号分析单元(204),分别 输出低频残差信号编码和高频残差参数。
3. 根据权利要求2所述的音频编码器,其特征在于,低频残差信号编码单元 (202)输出的低频残差信号编码分为两路输出, 一路进入合路单元(107), —路通过低频残差信号解码单元(203)输出重构低频残差信号,进入高频残差信号分析 单元(204)。
4. 根据权利要求2或3所述的音频编码器,其特征在于,高频残差信号分析单 元204对所输入的重构低频残差信号和高频残差信号进行相关性和相似性比较,输 出高频残差参数,通过高频残差参数编码单元(205)进行编码,得到高频残差参数编 码。
5. —种音频解码器,包括分路单元(301)、感知参数解码单元(303)、频 域感知逆滤波器单元(304)和时频合成单元(305),分路单元(301)输出的感知 参数编码通过感知参数解码单元(303)输出重构的感知参数,进入频域感知逆滤波 器单元(304)以确定其滤波器特性,其特征在于,分路单元(301)输出的低频残 差信号编码和高频残差参数编码同时通过残差解码与合成单元(302),得到输出的 重构频域残差信号进入频域感知逆滤波器单元(304)进行逆滤波,得到输出的重构 频域信号,再通过时频合成单元(305),输出重构时域信号。
6. 根据权利要求5所述的音频解码器,其特征在于,残差解码与合成单元(302), 包括低频残差信号解码器单元(401),用于对接收到的低频残差信号编码进行解码, 得到的重构低频残差信号同时输出到高频残差信号重构单元(403)和残差信号高低 频段重组单元(404);高频残差参数解码器单元(402),用于对接收到的高频残差参数编码进行解码, 得到重构的高频残差参数,输出到高频残差信号重构单元(403);高频残差信号重构单元(403),用于利用重构的低频残差信号,并根据解码得到 的高频残差参数进行高频残差的复制和重构,得到重构高频残差信号,输出到残差 信号高低频段重组单元(404);残差信号高低频段重组单元(404),用于将解码器解码得到的低频残差信号和重 构的高频残差进行组合,得到重构频域残差信号。
全文摘要
本发明公开了一种音频编码器和音频解码器。该编码器主要由时频分析单元、感知模型单元、感知参数编码和解码单元、频域感知滤波单元、残差分析与编码单元及合路单元电连接组成;该解码器主要由分路单元、感知参数编解码单元、残差解码与合成单元、频域感知逆滤波器单元和时频合成单元电连接组成。所述的音频编解码器在频域对音频信号进行压缩编码,其中残差分析与编码单元利用高频残差信号与低频残差信号之间的相关性,对高频残差信号进行参数编码;所述的残差解码与合成单元利用高频残差参数对高频残差进行复制和重构。本发明消除了频域残差信号中的多余度,提高了音频编码的压缩比、信道利用率和音频传输质量,用于多媒体通信和消费类电子设备。
文档编号H03M7/30GK101436406SQ200810232759
公开日2009年5月20日 申请日期2008年12月22日 优先权日2008年12月22日
发明者宋少鹏, 张圣钦, 凯 彭, 倩 李, 李双阳, 巍 柳, 郝晓锋, 马鸿飞 申请人:西安电子科技大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1