多声道音频编码方法、编码器、解码方法和解码器的制作方法

文档序号:7719619阅读:213来源:国知局
专利名称:多声道音频编码方法、编码器、解码方法和解码器的制作方法
技术领域
本发明涉及音频处理技术领域,特别涉及了一种多声道音频编码方法、编码器、解
码方法和解码器。
背景技术
音频(Audio)信号的频率范围从20Hz到20000Hz,音频信号的处理过程,既要考虑 其作为信号的特点,尽量保证其不失真,又要考虑人类声学机能对于音频信号的感觉特点, 使得对音频信号的处理能够在保证人类听觉感受的前提下尽可能地降低处理的运算量和 复杂度。 现有技术中比较成功的多声道音频编解码系统大都采用基于心理声学模型的 感觉音频编解码。例如,本领域公知的技术有Dolby AC-3和MPEG AAC(Advanced Audio Coding,先进音频编码)五声道环绕声系统。 在Dolby AC-3和MPEG AAC五声道环绕声系统中,普遍采用了联合编码的声道压
縮方法,其中包括强度耦合和Mid/Side (M/S,中/边)立体声编码。对于低频段,使用M/S
方法对原始信号的和与差进行编码,用两个新的对称声道代替原始的左、右声道,可以大大
的提高编码效率。在高频段(至少2kHz以上),利用听觉系统主要靠信号包络定位的特点,
采用强度耦合编码,只传输耦合声道以及耦合系数,从而降低码率。 在实现本发明的过程中,发明人发现上述现有技术至少具有以下缺点 现有技术的出发点都是消除声道之间的冗余度,但分析表明它们仅消除了部分冗
余信息。目前的环绕声消除冗余的方法主要集中在PC(Pair-Channels,对称声道对)上,而
对于NPC(Not-Pair-Channels,非对称声道对),有一定的消除作用,但是消除的力度不够强。

发明内容
为了提高编解码性能,在解码端自适应地改变输出的重放声道,本发明实施例提 供了一种多声道音频编码方法、编码器、解码方法和解码器。所述技术方案如下
—方面,一种多声道音频编码方法,所述多声道音频至少包括主声道信号和环绕 声道信号,其中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道信 号包括左环绕声道信号和右环绕声道信号,所述方法包括 根据所述主声道信号对所述环绕声道信号进行线性预测,得到预测参数,将所述 预测参数加入编码码流; 或,根据所述主声道信号和传输函数对所述环绕声道信号进行预测,得到预测参 数,将所述预测参数加入编码码流; 判别所述环绕声道信号与所述中央声道信号之间是否具有相关性,
或判别所述环绕声道信号与所述左、右主声道信号之间是否具有相关性,
如果是,则对所述预测参数、所述主声道信号和相关性判别信息进行编码。
82/16页 根据所述主声道信号对所述环绕声道信号进行线性预测,得到预测参数,将所述 预测参数加入编码码流,具体包括 A:将所述主声道信号中的至少一个声道信号作为当前主声道信号,根据延迟参数 和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将縮放后的当前主声道信号分成 左声道信号和右声道信号,将所有所述左声道信号累加、所有所述右声道信号累加,得到预 测的左、右环绕声道信号; B:将所述预测的左环绕声道信号与输入的环绕声道信号做差,所述预测的右环绕 声道信号与输入的右环绕声道信号做差,得到预测残差; C:判断所述预测残差是否小于预设的阈值,如果否,执行步骤D;如果是,执行步 骤E ; D :调整所述延迟参数和所述縮放参数,应用调整后的延迟参数和縮放参数执行步 骤A; E:将所述预测残差小于所述阈值时的延迟参数、縮放参数和所述预测残差作为预 测参数,将所述预测参数加入编码码流。 根据延迟参数和縮放参数,对至少一个主声道信号进行多次延迟、縮放,将縮放后
的主声道信号按照声道的左、右累加,得到预测的左、右环绕声道信号,具体包括 将中央声道信号、左主声道信号和右主声道信号之一作为所述当前主声道信号,
根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的当
前主声道信号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有
所述左声道信号累加,所有所述右声道累加,得到所述预测的左、右环绕声道信号;或, 将左、右主声道信号作为所述当前主声道信号,根据延迟参数和縮放参数,对所述
当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为左声道信号,将每
个縮放后的右主声道信号作为右声道信号,将所有所述左声道信号累加,所有所述右声道
信号累加,得到所述预测的左、右环绕声道信号;或, 将左、右主声道信号和中央声道信号作为所述当前主声道信号,根据延迟参数和
縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为
左声道信号,将每个縮放后的右主声道信号作为右声道信号,将每个縮放后的中央声道信
号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有所述左声道
信号累加,所有所述右声道信号累加,得到所述预测的左、右环绕声道信号。 根据所述主声道信号和传输函数对所述环绕声道信号进行预测,得到预测参数,
将所述预测参数加入编码码流,具体包括 H:将主声道信号中的至少一个声道信号作为当前主声道信号,根据传输函数,对 所述当前主声道信号进行滤波处理,得到预测的左、右环绕声道信号; I :将所述预测的左环绕声道信号与输入的环绕声道信号做差,所述预测的右环绕 声道信号与输入的右环绕声道信号做差,得到预测残差; J :判断所述预测残差是否小于预设的阈值,如果否,执行步骤K ;如果是,执行步 骤L; K :调整所述传输函数,应用调整后的相关函数执行步骤H ; L:将所述预测残差小于所述阈值的传输函数和所述预测残差作为预测参数,将所述预测参数加入编码码流。 判别所述环绕声道信号与所述中央声道信号之间是否具有相关性,或判别所述环 绕声道信号与所述左、右主声道信号之间是否具有相关性,如果是,则对所述预测参数、所 述主声道信号和相关性判别信息进行编码进一步包括 如果否,则利用预先经过方位感处理的环绕声道信号和所述多声道信号进行编 码。 另一方面,一种多声道音频编码器,所述多声道音频至少包括中央声道信号、主声 道信号和环绕声道信号,其中,所述主声道信号包括左、右主声道信号,所述环绕声道信号 包括左环绕声道信号和右环绕声道信号,所述编码器包括 第一预测模块,用于根据所述主声道信号对所述环绕声道信号进行线性预测,得
到预测参数,将所述预测参数加入编码码流;
或, 第二预测模块,用于根据所述主声道信号和传输函数对所述环绕声道信号进行预 测,得到预测参数,将所述预测参数加入编码码流; 相关性判别模块,用于判别所述环绕声道信号与所述中央声道信号之间是否有相 关性, 或判别所述环绕声道信号与所述左、右主声道信号之间是否有相关性; 相关编码模块,用于如果判别所述环绕声道信号与所述中央声道信号之间具有相
关性,或判别所述环绕声道信号与所述左、右主声道信号之间具有相关性,则对所述预测参
数、所述主声道信号和相关性判别信息进行编码。 所述第一预测模块包括 信号处理单元,用于将所述主声道信号中的至少一个声道信号作为当前主声道信 号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将縮放后的当 前主声道信号分成左声道信号和右声道信号,将所有所述左声道信号累加、所有所述右声 道信号累加,得到预测的左、右环绕声道信号; 第一预测残差单元,用于将所述预测的左环绕声道信号与输入的环绕声道信号做 差,所述预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差;
第一判断循环单元,用于判断所述预测残差是否小于预设的阈值,如果否,触发第 一参数调整单元;如果是,触发第一确定单元; 第一参数调整单元,用于调整所述延迟参数和所述縮放参数,应用调整后的延迟 参数和縮放参数触发所述信号处理子单元; 第一确定单元,用于将所述预测残差小于所述阈值时的延迟参数、縮放参数和所 述预测残差作为预测参数,将所述预测参数加入编码码流。
所述信号处理单元包括 第一信号处理子单元,用于将中央声道信号、左主声道信号和右主声道信号之一 作为所述当前主声道信号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延 迟、縮放,将每个縮放后的当前主声道信号分成两个频谱相同的声道信号,分别作为左声道 信号和右声道信号,将所有所述左声道信号累加,所有所述右声道累加,得到所述预测的 左、右环绕声道信号;
10
第二信号处理子单元,用于将左、右主声道信号作为所述当前主声道信号,根据延
迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道
信号作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,将所有所述左声道
信号累加,所有所述右声道信号累加,得到所述预测的左、右环绕声道信号; 第三信号处理子单元,用于将左、右主声道信号和中央声道信号作为所述当前主
声道信号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个
縮放后的左主声道信号作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,
将每个縮放后的中央声道信号分成两个频谱相同的声道信号,分别作为左声道信号和右声
道信号,将所有所述左声道信号累加,所有所述右声道信号累加,得到所述预测的左、右环
绕声道信号。 所述第二预测模块包括 滤波单元,用于将主声道信号中的至少一个声道信号作为当前主声道信号,根据
传输函数,对所述当前主声道信号进行滤波处理,得到预测的左、右环绕声道信号; 第二预测残差单元,用于将所述预测的左环绕声道信号与输入的环绕声道信号做
差,所述预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差; 第二判断循环单元,用于判断所述预测残差是否小于预设的阈值,如果否,触发第
二参数调整单元;如果是,触发第二确定单元; 第二参数调整单元,用于调整所述传输函数,应用调整后的相关函数触发所述滤 波单元; 第二确定单元,用于将所述预测残差小于所述阈值的传输函数和所述预测残差作 为预测参数,将所述预测参数加入编码码流。
所述编码器进一步包括 不相关编码模块,用于如果判别所述环绕声道信号与所述中央声道信号之间不具 有相关性,或判别所述环绕声道信号与所述左、右主声道信号之间不具有相关性,则利用预 先经过方位感处理的环绕声道信号和所述多声道信号进行编码。 再一方面, 一种多声道音频解码方法,所述多声道音频至少包括主声道信号和环 绕声道信号,其中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道 信号包括左环绕声道信号和右环绕声道信号,所述方法包括 判断所述编码码流中是否包含相关性判别信息,如果是,提取所述相关性判别信 息;如果否,对所述编码码流进行感觉音频解码; 根据所提取的该相关性判别信息,对编码码流进行解码,形成重放音频信号。
所述形成重放音频信号之前包括对重放声道数要求进行判别。 根据所提取的该相关性判别信息,对编码码流进行解码,形成重放音频信号,具体 包括 判断所述提取的相关性判别信息是否指示环绕声道信号与中央声道信号之间具 有相关性,或所述环绕声道信号与左、右主声道信号之间具有相关性, 如果是,从所述编码码流中提取预测参数,利用所述预测参数对所述编码码流进 行解码,形成重放音频信号; 如果否,直接对所述编码码流进行解码,形成所述重放音频信号。
11
从所述编码码流中提取预测参数,利用所述预测参数对所述编码码流进行解码, 形成重放音频信号,具体包括 对所述编码码流进行感觉音频解码,解码出中央声道信号、左、右主声道信号;
利用所述预测参数和所述主声道信号中任意一个声道信号表示左、右环绕声道信 号,形成重放音频信号。 从编码码流中提取预测参数,利用预测参数对所述编码码流进行解码,形成重放 音频信号之后包括 如果重放声道数要求为双声道重放,将所述中央声道信号、所述左、右主声道信 号、环绕声道信号混合为双声道重放信号进行重放; 如果重放声道数要求为多声道重放,将所述中央声道信号、所述左、右主声道信
号、所述环绕声道信号作为多声道重放信号进行重放。 直接对所述编码码流进行解码,形成重放音频信号,具体包括 对所述编码码流进行感觉音频解码,解码出中央声道信号、左、右主声道信号,形 成重放音频信号。 直接对所述编码码流进行解码,形成重放音频信号之后包括 当重放声道数要求为双声道重放,将中央声道信号直接或以衰减形式混合入左、 右主声道信号,形成双声道重放信号进行重放; 当重放声道数要求为多声道重放,对左、右主声道信号进行逆传输函数滤波处理, 去除左、右主声道信号中的方位感信息,形成环绕声道信号; 将所述中央声道信号、所述左、右主声道信号、所述环绕声道信号作为多声道重放 信号进行重放。 再一方面,一种多声道音频解码器,所述多声道音频至少包括主声道信号和环绕 声道信号,其中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道信 号包括左环绕声道信号和右环绕声道信号,所述解码器包括 判断模块,用于判断所述编码码流中是否包含相关性判别信息,如果是,触发信息 提取模块;如果否,触发不相关编码单元; 信息提取模块,用于如果编码码流中包含所述相关性判别信息,提取所述相关性 判别信息; 解码模块,用于根据所提取的该相关性判别信息,对所述编码码流进行解码,形成
重放音频信号。 所述解码器包括重放声道数判别模块,用于对重放声道数要求进行判别。
所述解码模块具体包括 相关性判别单元,用于判断提取的相关性判别信息是否指示有关多声道音频中的 环绕声道信号与中央声道信号之间具有相关性,或所述环绕声道信号与左、右主声道信号 之间具有相关性; 相关解码单元,用于当判断提取的相关性判别信息指示有关多声道音频中的环绕 声道信号与中央声道信号之间具有相关性,或所述环绕声道信号与左、右主声道信号之间 具有相关性,从编码码流中提取预测参数,利用所述预测参数对所述编码码流进行解码,形 成重放音频信号;
不相关解码单元,用于当判断提取的相关性判别信息指示有关多声道音频中的环 绕声道信号与中央声道信号之间不具有相关性,或所述环绕声道信号与左、右主声道信号 之间不具有相关性,直接对所述编码码流进行解码,形成重放音频信号。
所述相关解码单元具体包括 第一感觉音频解码子单元,用于对所述编码码流进行感觉音频解码,解码出中央 声道信号、左、右主声道信号; 预测解码子单元,用于利用所述预测参数和所述主声道信号中任意一个声道信号
表示左、右环绕声道信号,形成重放音频信号。 所述相关解码单元进一步包括 第一双声道重放子单元,用于如果重放声道数要求为双声道重放,将所述中央声
道信号、所述左、右主声道信号、环绕声道信号混合为双声道重放信号进行重放; 第一多声道重放子单元,用于如果重放声道数要求为多声道重放,将所述中央声
道信号、所述左、右主声道信号、环绕声道信号作为多声道重放信号进行重放。 所述不相关编码单元具体包括 第二感觉音频解码子单元,用于对所述编码码流进行感觉音频解码,解码出中央 声道信号、左、右主声道信号,形成重放音频信号。
所述不相关解码单元进一步包括 第二双声道重放子单元,用于当重放声道数要求为双声道重放,将中央声道信号
直接或以衰减形式混合入左、右主声道信号,形成双声道重放信号进行重放; 第二多声道重放子单元,用于当重放声道数要求为多声道重放,对左、右主声道信
号进行逆传输函数滤波处理,去除左右主声道信号中的方位感信息,形成环绕声道信号; 将所述中央声道信号、所述左、右主声道信号、所述环绕声道信号作为多声道重放
信号进行重放。 本发明实施例提供的技术方案的有益效果是 通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行预测,并利用 相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,并在解码端根据 相关性判别信息和预测参数进行解码,根据重放声道数要求来自适应地改变输出的重放声 道,进一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅提高了编解码 的效率,而且提高了编解码器的性能。


为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现
有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本 发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可 以根据这些附图获得其他的附图。
图1是现有技术提供的一种多声道音频编码方法的流程图; 图2是本发明实施例1提供的一种多声道音频解码方法的流程图; 图3是本发明实施例2提供的另一种多声道音频编码方法的流程图; 图4是本发明实施例2提供的一种多声道音频编码方法中线性预测的示意13
图5是本发明实施例2提供的- 图6是本发明实施例2提供的- 图7是本发明实施例3提供的- 图8是本发明实施例4提供的- 图9是本发明实施例4提供的- 图10是本发明实施例5提供的
种多声道音频编码方法中相关性判别的示意图; 种多声道音频编码方法中滤波处理的流程图; 种多声道音频编码器的结构示意图; 种多声道音频解码方法的流程图; 种多声道音频解码方法的流程图; -种多声道音频解码器的结构示意图。
具体实施例方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方 式作进一步地详细描述。 在现有技术中,参见图l,多声道音频编码为以下工作流程输入时间信号一方面 经过增益控制后进入滤波器组进行分析滤波,另一方面进入听觉模型模块。在听觉模型模 块中,选用适当的心理声学模型,以得到SMR等必要的参数。这些得到的参数可作为控制信 息用来控制增益控制、滤波器组以及下述的各个编码模块。经过滤波变换后的信号还需要 进行TNS处理。接下来进行强度耦合、预测与M/S,即主要的有损压縮编码部分。有损压縮 编码需要使用到听觉模型中所得到的必要参数信息。然后,由码率失真与控制过程模块对 比例系数(比例因子)和量化器模块进行控制。量化器的输出既可以影响码率失真与控制 过程模块,同时又提供了前述的预测模块所需的前帧量化频谱。量化后的信号进行无损编 码,即无噪声编码,或Huffman编码,形成最终的压縮数据流。可以通过码率失真与控制过 程模块迭代地控制比例系数计算、量化与无噪声编码的过程,以达到压縮的需要。上述各个 步骤均将各自的编码参数信息传输到码流格式器中,并按照码流格式的要求与压縮数据流 装帧成编码音频流。 为了便于表述,在本发明实施例中将中央声道信号记作C,左、右主声道信号分别 记作L、R,左、右环绕声道信号分别记作Ls、Rs。中央声道信号、左、右主声道信号都可以称 作主声道。作为环绕声道信号的Ls和Rs,通常是由中央声道C或者左右主声道L、 R声道 的延时、混响或者部分频率搬移衰落造成的。这也就是说,在某些应用中,环绕声道是可以 由主声道生成的。
实施例l 为了提高编解码性能,在解码端自适应地改变输出的重放声道,本发明实施例提 供了一种多声道音频编、解码的方法,多声道音频至少包括主声道信号和环绕声道信号,其 中,主声道信号包括左、右主声道信号和中央声道信号,环绕声道信号包括左环绕声道信号 和右环绕声道信号,参见图2所示,该方法具体包括 步骤201 :根据主声道信号对环绕声道信号进行线性预测,得到预测参数,将预测 参数加入编码码流;或,根据主声道信号和传输函数对环绕声道信号进行预测,得到预测参 数,将预测参数加入编码码流; 步骤202 :判别环绕声道信号与中央声道信号之间是否具有相关性, 或判别环绕声道信号与左、右主声道信号之间是否具有相关性, 如果是,则对预测参数、主声道信号和相关性判别信息进行编码。 本发明实施例通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行预测,并利用相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,并 在解码端根据相关性判别信息和预测参数进行解码,根据重放声道数要求来自适应地改变 输出的重放声道,进一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅 提高了编解码的效率,而且提高了编解码器的性能。
实施例2 参见图3所示,为了提高编解码性能,在解码端自适应地改变输出的重放声道,本 发明实施例提供了一种多声道音频编码的方法,包括 步骤301 :根据延迟参数,对左主声道信号L、右主声道信号R进行多次延迟处理;
其中,初始的延迟参数可以根据实际情况确定。
步骤302 :根据縮放参数,对延迟后的信号进行縮放;
其中,初始的縮放参数可以根据实际情况确定。 其中,由于中央声道信号为低频信号,而左、右主声道信号为中、高频信号,为了使
处理后频谱与原信号相近且保持完整,则需将信号进行一定程度的縮放。 步骤303:将所有縮放后的左主声道信号累加,得到Ls',所有縮放后的右主声道
信号累加,得到Rs'; 其中,Ls'、Rs'分别用来表示预测的左、右环绕声道信号。 步骤304 :将Ls'与输入的Ls、 Rs'与输入的Rs分别做差,得到预测残差eLs、 eKs ;
其中,e^用来表示Ls'与Ls之间的预测残差,e^用来表示Rs'与Rs之间的预测残差。 步骤305 :判断所得的预测残差&和eKs是否小于预设的阈值,如果否,执行步骤 306 ;如果是,执行步骤307 ; 其中,预设的阈值可以根据实际情况来选取,本发明实施例不做具体限定。 步骤306 :调整延迟参数和縮放参数,并应用调整后的延迟参数和縮放参数执行
步骤302 ; 其中,这里的预测参数指的是延迟参数、縮放参数等预测时应用的参数。 步骤307 :确定使预测残差&和eKs小于预设的阈值的预测参数,将该预测参数加
入编码码流中。 需要说明的是,在步骤301 步骤307中,本发明实施例是以左、右主声道信号为 例进行说明的,在实际操作中,可以同时处理左、右主声道信号进行预测,可以单独处理中 央声道信号进行预测,也可以是左、右主声道信号和中央声道信号一同进行预测。在对中央 声道信号进行处理时,其步骤、原理与步骤301 步骤307相似,两者区别在于,在进行步骤 305中"做差"之前,应将延迟、縮放后的中央声道信号平分成两个相同的信号,将这两个平 分后的信号作为左右信号,并进行上述步骤304中所述的处理。 在实际操作时,即将主声道信号中的至少一个声道信号作为当前主声道信号,根 据延迟参数和縮放参数,对当前主声道信号进行多次延迟、縮放,将縮放后的当前主声道信 号分成左声道信号和右声道信号,将所有左声道信号累加、所有右声道信号累加,得到预测 的左、右环绕声道信号,具体可以为 将中央声道信号、左主声道信号和右主声道信号之一作为当前主声道信号,根据 延迟参数和縮放参数,对当前主声道信号进行多次延迟、縮放,将每个縮放后的当前主声道
15信号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有左声道信 号累加,所有右声道累加,得到预测的左、右环绕声道信号; 或者,将左、右主声道信号作为当前主声道信号,根据延迟参数和縮放参数,对当 前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为左声道信号,将每个 縮放后的右主声道信号作为右声道信号,将所有左声道信号累加,所有右声道信号累加,得 到预测的左、右环绕声道信号; 或者,将左、右主声道信号和中央声道信号作为当前主声道信号,根据延迟参数和 縮放参数,对当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为左声 道信号,将每个縮放后的右主声道信号作为右声道信号,将每个縮放后的中央声道信号分 成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有左声道信号累加, 所有右声道信号累加,得到预测的左、右环绕声道信号。 需要说明的是,步骤301 步骤307的信号处理过程可以视作一个自适应滤波或 调整的过程,具体过程参见图4所示,用左主声道信号预测左环绕声道信号时,求预测残差 的过程如下,其中,z是延迟参数,z—工表示延迟的时间,L(n)表示需要处理的主声道信号, L(n-l)...L(n-N)分别表示经过不同程度延迟后的该主声道信号,Ls (n)表示输入的环绕 声道信号,Ls' (n)表示预测的左环绕声道信号,^(n)表示预测残差,L(n)经过多次以z 为延迟参数的延迟,将延迟后的L(n-l)..丄(n-N)累加,得到Ls' (n),该Ls' (n)与输入的 Ls(n),做差,得到预测残差^(n)。判断该预测残差^(n)与预设的阈值的大小关系,再根 据该大小关系调整步骤301 步骤302中的延迟参数和縮放参数,最终得到用左、右主声道 信号L、R预测出Ls'、Rs'信号时的预测参数,在后续的编码步骤中即可以只传输并编码预 测参数,而不用传输、编码输入的左右环绕声道信号,在解码端,用预测参数加上中央声道 信号或左右主声道信号表示(这里的表示为近似表示)左环绕声道信号Ls、Rs。本领域技 术人员可以获知,由于信号有短时的平稳性,即步骤301 步骤302中的延迟参数、縮放参 数可以在相当长一段时间内保持不变,从而在码流格式中只用为其预留较小的空间,达到 节约空间的目的。 其中,步骤301 步骤307也可以看作是编码的预处理过程,有关相关性的判别结 果不仅要体现在选用的编码器上,也作为辅助信息加入到编码码流中,从而传送到解码器, 以便选择适用的解码器。 步骤308 :判别输入信号之间是否有相关性,当输入的多声道中的环绕声道信号
与中央声道信号之间有相关性,或环绕声道信号与左、右主声道信号之间有相关性时,执行
步骤309,当输入的多声道中的环绕声道信号与中央声道信号之间没有相关性,或环绕声道
信号与左、右主声道信号之间没有相关性时,执行步骤310 ; 上述判别输入信号之间是否有相关性,具体包括 环绕声道信号与中央声道信号之间是否有相关性;和/或, 环绕声道信号与左、右主声道信号之间是否有相关性; 其中,相关性的判别的标准为判别输入的多声道信号之间的相关性是否大于一 个预设的阈值,如果大于该阈值,则称多声道信号之间的相关性较大。 参见图5,以环绕声道与主声道的相关性判断为例,可以有以下步骤对L声道和 Ls声道(或者R声道和Rs声道、C与Ls/Rs声道)之间的相关性进行自适应判别,选取一段时间,将每个时间或频率样点上的残差e(n)相加,得到残差和eSUffl,当一段时间内的残差 和e,超过预设的阈值,可以判断环绕声道与主声道基本不相关。自适应判别可以通过逐 差的方式来进行,也可以通过其他的求相关性的方式进行,本实施例不做具体限定,在此仅 以逐差的方式为例进行说明。 其中,本领域技术人员可以获知,相关性的计算方法有多种,本发明实施例不做具 体限定。 需要说明的是,步骤308和编码的预处理过程(即步骤301-307)的顺序可以互 换,也可以同时进行,其先后顺序本发明不做具体限定。 步骤309 :根据预测参数、中央声道信号和左、右主声道信号,进行音频编码;
根据预测参数、中央声道信号和左、右主声道信号,进行音频编码,具体包括
对所得的各个预测参数进行编码; 对预测的左、右环绕声道信号、中央声道信号和左、右主声道信号进行以心理声学 模型为基础的感觉音频编码; 其中,生成的编码码流中包含感觉音频编码的结果、步骤308得到的相关性判别 信息和预测过程中的各个参数和预测残差,便于解码时对码流的分析。 其中,本领域技术人员可以获知,该步骤所涉及的具体编码过程为现有技术,不再 赘述。 步骤310 :根据预先经过方位感处理的环绕声道信号和左、右主声道信号,进行音 频编码; 具体地,将预先经过方位感处理的环绕声道信号按照声道的左右混入左、右主声 道信号,形成混合后的左、右主声道信号;对中央声道信号和混合后的左、右主声道信号进 行以心理声学模型为基础的感觉音频编码。 其中,方位感处理时处理的信号为输入的环绕声道信号。
其中,方位感处理包括加入对方向角、仰角和距离的感觉。 其中,心理声学模型是感觉音频编码的一种,本发明实施例仅以心理声学模型为
例进行说明,本发明所述感觉音频编码的基础可以但不仅限于心理声学模型。 其中,编码码流包含感觉音频编码的结果和步骤308得到的相关性判别信息,便
于解码时对码流的分析。 其中,本领域技术人员可以获知,该步骤所涉及的具体编码过程为现有技术,不再 赘述。 其中,本发明实施例中的"有相关性"或"相关性较大"指的是相关性超过一个预 设的阈值(此预设的阈值与步骤305和步骤308中所说的各个阈值都没有关联)。
由于本发明实施例基于AAC多声道编解码结构或其他高质量感觉音频编码结构, 因此首先它可以保证对称声道对(PC)之间的压縮度不会被降低,从而在这方面的码率不 会有大的改变。 对于非对称声道对(NPC)的码率压縮,由于采用了预测和方位感处理的方法,可 以把环绕声道中的音频数据在主声道中体现,彻底不传输环绕声道的音频数据,转而传输 预测参数,预测参数包括预测之后的残差。预测残差相对于原有音频数据来说所占用的码 率是微不足道的,因此这样处理的结果是使得原有的NPC问题不复存在;由于环绕声道已经不复存在,码率压縮的重点重新集中在PC之间。实际上,由于使用了预测的方法,等于将 原来的主声道与环绕声道之间的相关度用预测过程来代替,从而由预测过程把NPC之间的 冗余度消除。 在C声道与Ls声道的相关性很大的情况下,可以直接采用上述线性预测的方法,
通过C声道来预测Ls声道,这时,使用线性预测得到的预测声道的频谱比用HRTF参数预
测的声道更接近于原始的环绕声道Ls。由于主声道与环绕声道相关度很大,因此线性预测
模型有可能更简单,而且可以避免编码阶段线性预测可能带来的高频段比特分配不足的问
题,因为这里的预测结果是不需要传递的,只需要传递几个预测的参数和残差,这就避免了
对预测结果进行编码,从而保证了心理声学模型能够正确适用于音频编码过程。 另外,上述步骤301 307是一个编码的预处理过程,该过程可以由以下步骤
601-605代替 参见图6,利用传输函数和左右主声道信号和/或中央声道预测左、右环绕声道信 号,确定预测参数,具体包括 步骤601 :将主声道信号分别通过传输函数的滤波处理,得到预测的左、右环绕声 道信号; 在预测时,可应用下式
Ls , = L X HLL+R X HKL+C X HCL
Rs , = L X HLK+R X H跟+C X HCK其中,Hxy代表从原X声道到预测后的Y声道的HRTF(Head Related Transfer Function,头相关传输函数),即是代表从原L声道到预测后的L声道的头相关传输函 数,即是代表从原R声道到预测后的L声道的头相关函数,其它以此类推,不再赘述。
在更一般的情况下,上式中的HxY有可能为常数。例如,更常见的情况是,Ha和HK^ 可以是常数或O。 其中,式中的"X "是指变换域中的乘法,相应地,在时域中则是巻积。 本领域技术人员从上式可以获知,环绕声道信号的预测可以通过对左主声道信号
和/或右主声道信号和/或中央声道信号进行传输函数滤波处理得到。 其中,在本实施例中以头相关传输函数作为预测的传输函数为例进行说明,预测
时所用的传输函数可以有多种,本发明实施例不做具体限定。 步骤602 :将预测的左环绕声道信号与输入的环绕声道信号做差,预测的右环绕 声道信号与输入的右环绕声道信号做差,得到预测残差; 步骤603 :判断所得的预测残差是否小于预设的阈值,如果否,执行步骤604 ;如果 是,执行步骤605 ; 步骤604 :调整传输函数,并应用调整后的传输函数执行步骤601 ;
其中,这里的传输函数指的是预测时应用的参数。 步骤605 :确定使预测残差小于预设的阈值的传输函数,将预测参数加入编码码 流中。 本发明实施例通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行 预测,并利用相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,进 一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅提高了编解码的效
18率,而且提高了编解码器的性能。
实施例3 参见图7,为了提高编解码性能,在解码端自适应地改变输出的重放声道,本发明 实施例提供了一种多声道音频编码器,其中,多声道音频至少包括主声道信号和环绕声道 信号,其中,主声道信号包括左、右主声道信号和中央声道信号,环绕声道信号包括左环绕 声道信号和右环绕声道信号,该多声道音频编码器具体包括 第一预测模块70,第二预测模块71、相关性判别模块72、相关编码模块73和不相 关编码模块74。 第一预测模块70,用于根据主声道信号对环绕声道信号进行线性预测,得到预测
参数,将预测参数加入编码码流; 第一预测模块70具体包括 信号处理单元701,用于将主声道信号中的至少一个声道信号作为当前主声道信 号,根据延迟参数和縮放参数,对当前主声道信号进行多次延迟、縮放,将縮放后的当前主 声道信号分成左声道信号和右声道信号,将所有左声道信号累加、所有右声道信号累加,得 到预测的左、右环绕声道信号;
上述信号处理单元701具体包括 第一信号处理子单元701a,用于将中央声道信号、左主声道信号和右主声道信号 之一作为当前主声道信号,根据延迟参数和縮放参数,对当前主声道信号进行多次延迟、 縮放,将每个縮放后的当前主声道信号分成两个频谱相同的声道信号,分别作为左声道信 号和右声道信号,将所有左声道信号累加,所有右声道累加,得到预测的左、右环绕声道信 号; 第二信号处理子单元701b,用于将左、右主声道信号作为当前主声道信号,根据延 迟参数和縮放参数,对当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号 作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,将所有左声道信号累加, 所有右声道信号累加,得到预测的左、右环绕声道信号; 第三信号处理子单元701c,用于将左、右主声道信号和中央声道信号作为当前主
声道信号,根据延迟参数和縮放参数,对当前主声道信号进行多次延迟、縮放,将每个縮放
后的左主声道信号作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,将每
个縮放后的中央声道信号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信
号,将所有左声道信号累加,所有右声道信号累加,得到预测的左、右环绕声道信号。 第一预测残差单元702,用于将预测的左环绕声道信号与输入的环绕声道信号做
差,预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差; 第一判断循环单元703,用于判断预测残差是否小于预设的阈值,如果否,触发第
一参数调整单元704 ;如果是,触发第一确定单元705 ; 第一参数调整单元704,用于调整延迟参数和縮放参数,应用调整后的延迟参数和 縮放参数触发信号处理单元701 ; 第一确定单元705,用于将预测残差小于阈值时的延迟参数和縮放参数作为预测 参数,将预测参数加入编码码流; 第二预测模块71,用于根据主声道信号和传输函数对环绕声道信号进行预测,得到预测参数,将预测参数加入编码码流;
第二预测模块71具体包括 滤波单元711 ,用于将主声道信号中的至少一个声道信号作为当前主声道信号,根
据传输函数,对当前主声道信号进行滤波处理,得到预测的左、右环绕声道信号; 第二预测残差单元712,用于将所述预测的左环绕声道信号与输入的环绕声道信
号做差,所述预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差; 第二判断循环单元713,用于判断预测残差是否小于预设的阈值,如果否,触发第
二参数调整单元714 ;如果是,触发第二确定单元715 ; 第二参数调整单元714,用于调整传输函数,应用调整后的相关函数触发滤波单元
711 ; 第二确定单元715,用于将预测残差小于阈值的传输函数作为预测参数,将预测参 数加入编码码流。 相关编码模块73,用于如果判别环绕声道信号与中央声道信号之间具有相关性,
或判别左主声道信号与右主声道信号之间具有相关性,
对预测参数、主声道信号和相关性判别信息进行编码。 多声道音频编码器进一步包括相关性判别模块72和不相关编码模块74 ;
相关性判别模块72,用于判别环绕声道信号与中央声道信号之间是否有相关性, 或左、右主声道信号之间是否有相关性。 不相关编码模块74,用于当判别环绕声道信号与中央声道信号之间不具有相关性 时,或判别左主声道信号与右主声道信号之间不具有相关性时,利用预先经过方位感处理 的环绕声道信号和所述多声道信号进行编码。 把本发明实施例的编码效率与传统编码结构的编码效率进行比较。以一个五声道 的音频信号为例,使用传统编码器结构,如果每声道码率为64kbps,那么五声道的总码率为 320kbps对于新结构,同样的五声道音频信号,由于对环绕声道进行了预测,因此只需要传 输三个主声道,同样每声道码率为64kbps,三个声道的总码率为192kbps,当然,还要考虑 预测模型信息在编码码流中所占的比特数,这里假设采用了方向、延时时间、幅度控制三个 参数作为模型信息的传递参数,则只需要很少的几个比特就够用了。因此总体来说,采用新 结构在最好情况下将使得码率降低到原来的60 70%,从而带来编码效率的提高。
本发明实施例通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行 预测,并利用相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,进 一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅提高了编解码的效 率,而且提高了编解码器的性能。
实施例4 参见图8所示,为了提高编解码性能,在解码端自适应地改变输出的重放声道,本 发明实施例提供了一种多声道音频解码的方法,其中,多声道音频至少包括主声道信号和 环绕声道信号,其中,主声道信号包括左、右主声道信号和中央声道信号,环绕声道信号包 括左环绕声道信号和右环绕声道信号,该方法包括 801 :判断编码码流中是否包含相关性判别信息,如果是,提取相关性判别信息; 如果否,对编码码流进行感觉音频解码;
20
802:根据所提取的该相关性判别信息,对编码码流进行解码,形成重放音频信号。
具体地,如果提取的判别信息指示环绕声道信号与中央声道信号之间具有相关 性,或环绕主声道信号和左、右主声道信号之间具有相关性,从编码码流中提取预测参数, 利用预测参数对编码码流进行解码,形成重放音频信号; 如果编码码流中没有所述判别信息或所述判别信息指示环绕声道信号与中央声 道信号不具有相关性或环绕主声道信号和左、右主声道信号之间不具有相关性,直接对编 码码流进行解码,形成重放音频信号。
该解码方法具体包括 步骤901 :判断编码码流中是否包含相关性判别信息,如果是,执行步骤902,如果 否,执行步骤906。 具体地,判断编码码流中是否存在有关多声道音频中的环绕声道信号与中央声道
信号之间的相关性判别信息,或环绕主声道信号和左、右主声道信号之间的相关性判别信
息,若是,提取该相关性判别信息,若没有,直接进行解码,形成重放音频信号; 其中,如果所述判别信息指示环绕声道信号与中央声道信号之间具有相关性,或
环绕主声道信号和左、右主声道信号之间具有相关性,即该编码码流是使用本发明实施例
提供的编码方法进行编码;如果编码码流中没有所述判别信息,或所述判别信息指示环绕
声道信号与中央声道信号之间不具有相关性,或环绕主声道信号和左、右主声道信号之间
不具有相关性,说明编码码流不是使用本发明实施例提供的编码方法进行编码的。
步骤902 :提取该相关性判别信息; 步骤903 :判断提取的相关性判别信息指示有关多声道音频中的环绕声道信号与 中央声道信号之间是否具有相关性,环绕主声道信号和左、右主声道信号之间是否具有相 关性,如果是,执行步骤904,如果否,执行步骤906 ; 步骤904 :从编码码流中提取预测参数,利用预测参数对编码码流进行解码,形成 重放音频信号; 具体地,对编码码流进行以心理声学模型为基础的感觉音频解码,从而解码出中 央声道信号和左、右主声道信号; 利用所提取的预测参数,通过中央声道信号或左、右主声道信号形成对环绕声道 信号的预测,从而能够仅使用中央声道信号或左、右主声道信号与提取的预测参数表示出 环绕声道信号。
步骤905 :对重放声道数要求进行判别,根据判别结果和重放音频信号进行重放;
具体地,若重放声道数要求为双声道,将中央声道信号、左、右主声道信号、环绕声 道信号混合为双声道重放信号进行重放; 若重放声道数要求为多声道,将中央声道信号、左、右主声道信号、环绕声道信号 作为多声道重放信号进行重放。 其中,重放声道数可以是双声道,也可以是多声道,本发明实施例不做具体限定。
步骤906 :直接对编码码流进行解码,形成重放音频信号; 具体地,对编码码流进行以心理学模型为基础的感觉音频解码,从而解码出中央 声道信号和左右主声道信号。
步骤907 :对重放声道数要求进行判别,根据判别结果和重放音频信号进行重放;
具体地,若重放声道数要求为双声道,将中央声道信号信号直接或以衰减形式混 合入左右主声道信号,从而形成双声道重放信号进行重放。 若重放声道数要求为多声道重放,对左右主声道信号进行逆传输函数滤波处理,
去除左右主声道信号中的方位感信息,形成环绕声道信号;将中央声道信号、左、右主声道
信号、环绕声道信号作为多声道重放信号进行重放。 优选地,逆传输函数滤波时使用的是逆头相关传输函数。 需要说明的是,本发明实施例中的步骤905和步骤907都是对重放声道数要求进 行判别,该判别过程只需在重放前进行即可,其执行的具体顺序本发明不做具体限定。
本发明实施例通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行 预测,并利用相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,并 在解码端根据相关性判别信息和预测参数进行解码,根据重放声道数要求来自适应地改变 输出的重放声道,进一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅 提高了编解码的效率,而且提高了编解码器的性能。
实施例5 参见图10所示,为了提高编解码性能,在解码端自适应地改变输出的重放声道, 本发明实施例提供了一种多声道音频解码器,该多声道音频至少包括中央声道信号、左、右 主声道信号、环绕声道信号,该解码器具体包括信息提取模块101、解码模块102和重放声 道数判别模块103、判断模块104。 其中,信息提取模块101,用于当编码码流中有相关性判别信息时,提取该相关性 判别信息; 其中,解码模块102,用于根据所提取的该相关性判别信息,对编码码流进行解码,
形成重放音频信号。 解码模块102具体包括 相关性判别单元1021,用于判断提取的相关性判别信息指示有关多声道音频中的 环绕声道信号与中央声道信号之间是否具有相关性,或环绕声道信号与左、右主声道信号 之间是否具有相关性; 相关解码单元1022,用于当判断提取的相关性判别信息指示有关多声道音频中的 环绕声道信号与中央声道信号之间具有相关性,或环绕主声道信号和左、右主声道信号之 间是否具有相关性,从编码码流中提取预测参数,利用预测参数对编码码流进行解码,形成 重放音频信号; 相关解码1022单元具体包括 感觉音频解码子单元1022a,用于对所述编码码流进行感觉音频解码,解码出中央 声道信号、左、右主声道信号; 预测解码子单元1022b,用于利用所述预测参数,和所述中央声道号,或所述左主 声道信号,或右主声道信号表示环绕声道信号,形成重放音频信号。
相关解码单元1022进一步包括 第一双声道重放子单元1022c,用于如果重放声道数要求为双声道重放,将所述中 央声道信号、所述左、右主声道信号、环绕声道信号混合为双声道重放信号进行重放;
第一多声道重放子单元1022d,用于如果重放声道数要求为多声道重放,将所述中央声道信号、所述左、右主声道信号、环绕声道信号作为多声道重放信号进行重放。 不相关解码单元1023,用于当判断提取的相关性判别信息指示有关多声道音频中
的环绕声道信号与中央声道信号之间不具有相关性,或环绕声道信号与左、右主声道信号
之间不具有相关性,直接对编码码流进行解码,形成重放音频信号。 不相关解码单元1023具体包括 第二感觉音频解码子单元1023a,用于对所述编码码流进行感觉音频解码,解码出
中央声道信号、左、右主声道信号,形成重放音频信号。 不相关解码单元1023进一步包括 第二双声道重放子单元1023b,用于当重放声道数要求为双声道重放,将中央声道 信号信号直接或以衰减形式混合入左右主声道信号,形成双声道重放信号进行重放;
第二多声道重放子单元1023c,用于当重放声道数要求为多声道重放,对左、右主 声道信号进行逆传输函数滤波处理,去除左右主声道信号中的方位感信息,形成环绕声道 信号; 将中央声道信号、左右主声道信号、环绕声道信号作为多声道重放信号进行重放。
其中,重放声道数判别模块103,用于对重放声道数要求进行判别。
其中,判断模块104,用于判断编码码流中是否包含相关性判别信息,如果是,触发 信息提取模块IOI,如果否,触发不相关解码单元1023。 本发明实施例提供的解码器,与方法实施例属于同一构思,其具体实现过程详见 方法实施例,在此不再赘述。 本发明实施例通过在编码端进行声道间的相关性判别,用主声道对环绕声道进行 预测,并利用相关性判别信息和预测参数同主声道一起在编解码时表示环绕声道信号,并 在解码端根据相关性判别信息和预测参数进行解码,根据重放声道数要求来自适应地改变 输出的重放声道,进一步压縮声道间存在的冗余度,节约了编解码时所需的码流空间,不仅 提高了编解码的效率,而且提高了编解码器的性能。 本发明实施例提供的上述技术方案的全部或部分可以通过程序指令相关的硬件 来完成,所述程序可以存储在可读取的存储介质中,该存储介质包括ROM、RAM、磁碟或者光 盘等各种可以存储程序代码的介质。 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和 原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
2权利要求
一种多声道音频编码方法,所述多声道音频至少包括主声道信号和环绕声道信号,其中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道信号包括左环绕声道信号和右环绕声道信号,其特征在于,所述方法包括根据所述主声道信号对所述环绕声道信号进行线性预测,得到预测参数,将所述预测参数加入编码码流;或,根据所述主声道信号和传输函数对所述环绕声道信号进行预测,得到预测参数,将所述预测参数加入编码码流;判别所述环绕声道信号与所述中央声道信号之间是否具有相关性,或判别所述环绕声道信号与所述左、右主声道信号之间是否具有相关性,如果是,则对所述预测参数、所述主声道信号和相关性判别信息进行编码。
2. 如权利要求1所述的多声道音频编码方法,其特征在于,根据所述主声道信号对所 述环绕声道信号进行线性预测,得到预测参数,将所述预测参数加入编码码流,具体包括A:将所述主声道信号中的至少一个声道信号作为当前主声道信号,根据延迟参数和縮 放参数,对所述当前主声道信号进行多次延迟、縮放,将縮放后的当前主声道信号分成左声 道信号和右声道信号,将所有所述左声道信号累加、所有所述右声道信号累加,得到预测的 左、右环绕声道信号;B:将所述预测的左环绕声道信号与输入的环绕声道信号做差,所述预测的右环绕声道 信号与输入的右环绕声道信号做差,得到预测残差;C :判断所述预测残差是否小于预设的阈值,如果否,执行步骤D ;如果是,执行步骤E ; D :调整所述延迟参数和所述縮放参数,应用调整后的延迟参数和縮放参数执行步骤A ;E:将所述预测残差小于所述阈值时的延迟参数、縮放参数和所述预测残差作为预测参 数,将所述预测参数加入编码码流。
3. 如权利要求2所述的多声道音频编码方法,其特征在于,根据延迟参数和縮放参数,对至少一个主声道信号进行多次延迟、縮放,将縮放后的主声道信号按照声道的左、右累加,得到预测的左、右环绕声道信号,具体包括将中央声道信号、左主声道信号和右主声道信号之一作为所述当前主声道信号,根据 延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的当前主 声道信号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有所述 左声道信号累加,所有所述右声道累加,得到所述预测的左、右环绕声道信号;或,将左、右主声道信号作为所述当前主声道信号,根据延迟参数和縮放参数,对所述当前 主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为左声道信号,将每个縮 放后的右主声道信号作为右声道信号,将所有所述左声道信号累加,所有所述右声道信号 累加,得到所述预测的左、右环绕声道信号;或,将左、右主声道信号和中央声道信号作为所述当前主声道信号,根据延迟参数和縮放 参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号作为左声 道信号,将每个縮放后的右主声道信号作为右声道信号,将每个縮放后的中央声道信号分 成两个频谱相同的声道信号,分别作为左声道信号和右声道信号,将所有所述左声道信号 累加,所有所述右声道信号累加,得到所述预测的左、右环绕声道信号。
4. 如权利要求1所述的多声道音频编码方法,其特征在于,根据所述主声道信号和传 输函数对所述环绕声道信号进行预测,得到预测参数,将所述预测参数加入编码码流,具体 包括H:将主声道信号中的至少一个声道信号作为当前主声道信号,根据传输函数,对所述 当前主声道信号进行滤波处理,得到预测的左、右环绕声道信号;I :将所述预测的左环绕声道信号与输入的环绕声道信号做差,所述预测的右环绕声道 信号与输入的右环绕声道信号做差,得到预测残差;J :判断所述预测残差是否小于预设的阈值,如果否,执行步骤K ;如果是,执行步骤L ;K :调整所述传输函数,应用调整后的相关函数执行步骤H ;L :将所述预测残差小于所述阈值的传输函数和所述预测残差作为预测参数,将所述预 测参数加入编码码流。
5. 如权利要求1所述的多声道音频编码方法,其特征在于,判别所述环绕声道信号与 所述中央声道信号之间是否具有相关性,或判别所述环绕声道信号与所述左、右主声道信 号之间是否具有相关性,如果是,则对所述预测参数、所述主声道信号和相关性判别信息进 行编码进一步包括如果否,则利用预先经过方位感处理的环绕声道信号和所述多声道信号进行编码。
6. —种多声道音频编码器,所述多声道音频至少包括中央声道信号、主声道信号和环 绕声道信号,其中,所述主声道信号包括左、右主声道信号,所述环绕声道信号包括左环绕 声道信号和右环绕声道信号,其特征在于,所述编码器包括第一预测模块,用于根据所述主声道信号对所述环绕声道信号进行线性预测,得到预 测参数,将所述预测参数加入编码码流; 或,第二预测模块,用于根据所述主声道信号和传输函数对所述环绕声道信号进行预测, 得到预测参数,将所述预测参数加入编码码流;相关性判别模块,用于判别所述环绕声道信号与所述中央声道信号之间是否有相关性,或判别所述环绕声道信号与所述左、右主声道信号之间是否有相关性; 相关编码模块,用于如果判别所述环绕声道信号与所述中央声道信号之间具有相关性,或判别所述环绕声道信号与所述左、右主声道信号之间具有相关性,则对所述预测参数、所述主声道信号和相关性判别信息进行编码。
7. 如权利要求6所述多声道音频编码器,其特征在于,所述第一预测模块包括 信号处理单元,用于将所述主声道信号中的至少一个声道信号作为当前主声道信号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将縮放后的当前主 声道信号分成左声道信号和右声道信号,将所有所述左声道信号累加、所有所述右声道信 号累加,得到预测的左、右环绕声道信号;第一预测残差单元,用于将所述预测的左环绕声道信号与输入的环绕声道信号做差, 所述预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差;第一判断循环单元,用于判断所述预测残差是否小于预设的阈值,如果否,触发第一参 数调整单元;如果是,触发第一确定单元;第一参数调整单元,用于调整所述延迟参数和所述縮放参数,应用调整后的延迟参数 和縮放参数触发所述信号处理子单元;第一确定单元,用于将所述预测残差小于所述阈值时的延迟参数、縮放参数和所述预 测残差作为预测参数,将所述预测参数加入编码码流。
8. 如权利要求8所述多声道音频编码器,其特征在于,所述信号处理单元包括 第一信号处理子单元,用于将中央声道信号、左主声道信号和右主声道信号之一作为所述当前主声道信号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮 放,将每个縮放后的当前主声道信号分成两个频谱相同的声道信号,分别作为左声道信号 和右声道信号,将所有所述左声道信号累加,所有所述右声道累加,得到所述预测的左、右 环绕声道信号;第二信号处理子单元,用于将左、右主声道信号作为所述当前主声道信号,根据延迟参 数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放后的左主声道信号 作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,将所有所述左声道信号 累加,所有所述右声道信号累加,得到所述预测的左、右环绕声道信号;第三信号处理子单元,用于将左、右主声道信号和中央声道信号作为所述当前主声道 信号,根据延迟参数和縮放参数,对所述当前主声道信号进行多次延迟、縮放,将每个縮放 后的左主声道信号作为左声道信号,将每个縮放后的右主声道信号作为右声道信号,将每 个縮放后的中央声道信号分成两个频谱相同的声道信号,分别作为左声道信号和右声道信 号,将所有所述左声道信号累加,所有所述右声道信号累加,得到所述预测的左、右环绕声 道信号。
9. 如权利要求7所述多声道音频编码器,其特征在于,所述第二预测模块包括 滤波单元,用于将主声道信号中的至少一个声道信号作为当前主声道信号,根据传输函数,对所述当前主声道信号进行滤波处理,得到预测的左、右环绕声道信号;第二预测残差单元,用于将所述预测的左环绕声道信号与输入的环绕声道信号做差,所述预测的右环绕声道信号与输入的右环绕声道信号做差,得到预测残差;第二判断循环单元,用于判断所述预测残差是否小于预设的阈值,如果否,触发第二参数调整单元;如果是,触发第二确定单元;第二参数调整单元,用于调整所述传输函数,应用调整后的相关函数触发所述滤波单元;第二确定单元,用于将所述预测残差小于所述阈值的传输函数和所述预测残差作为预 测参数,将所述预测参数加入编码码流。
10. 如权利要求7所述多声道音频编码器,其特征在于,所述编码器进一步包括 不相关编码模块,用于如果判别所述环绕声道信号与所述中央声道信号之间不具有相关性,或判别所述环绕声道信号与所述左、右主声道信号之间不具有相关性,则利用预先经 过方位感处理的环绕声道信号和所述多声道信号进行编码。
11. 一种多声道音频解码方法,所述多声道音频至少包括主声道信号和环绕声道信号, 其中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道信号包括左环 绕声道信号和右环绕声道信号,其特征在于,所述方法包括判断所述编码码流中是否包含相关性判别信息,如果是,提取所述相关性判别信息;如果否,对所述编码码流进行感觉音频解码;根据所提取的该相关性判别信息,对编码码流进行解码,形成重放音频信号。
12. 如权利要求11所述的多声道音频解码方法,其特征在于,所述形成重放音频信号 之前包括对重放声道数要求进行判别。
13. 如权利要求11所述的多声道音频解码方法,其特征在于,根据所提取的该相关性 判别信息,对编码码流进行解码,形成重放音频信号,具体包括判断所述提取的相关性判别信息是否指示环绕声道信号与中央声道信号之间具有相 关性,或所述环绕声道信号与左、右主声道信号之间具有相关性,如果是,从所述编码码流中提取预测参数,利用所述预测参数对所述编码码流进行解 码,形成重放音频信号;如果否,直接对所述编码码流进行解码,形成所述重放音频信号。
14. 如权利要求13所述的多声道音频解码方法,其特征在于,从所述编码码流中提取 预测参数,利用所述预测参数对所述编码码流进行解码,形成重放音频信号,具体包括对所述编码码流进行感觉音频解码,解码出中央声道信号、左、右主声道信号; 利用所述预测参数和所述主声道信号中任意一个声道信号表示左、右环绕声道信号, 形成重放音频信号。
15. 如权利要求13所述的多声道音频解码方法,其特征在于,从编码码流中提取预测 参数,利用预测参数对所述编码码流进行解码,形成重放音频信号之后包括如果重放声道数要求为双声道重放,将所述中央声道信号、所述左、右主声道信号、环 绕声道信号混合为双声道重放信号进行重放;如果重放声道数要求为多声道重放,将所述中央声道信号、所述左、右主声道信号、所 述环绕声道信号作为多声道重放信号进行重放。
16. 如权利要求13所述的多声道音频解码方法,其特征在于,直接对所述编码码流进 行解码,形成重放音频信号,具体包括对所述编码码流进行感觉音频解码,解码出中央声道信号、左、右主声道信号,形成重 放音频信号。
17. 如权利要求13所述的多声道音频解码方法,其特征在于,直接对所述编码码流进 行解码,形成重放音频信号之后包括当重放声道数要求为双声道重放,将中央声道信号直接或以衰减形式混合入左、右主 声道信号,形成双声道重放信号进行重放;当重放声道数要求为多声道重放,对左、右主声道信号进行逆传输函数滤波处理,去除 左、右主声道信号中的方位感信息,形成环绕声道信号;将所述中央声道信号、所述左、右主声道信号、所述环绕声道信号作为多声道重放信号 进行重放。
18. —种多声道音频解码器,所述多声道音频至少包括主声道信号和环绕声道信号,其 中,所述主声道信号包括左、右主声道信号和中央声道信号,所述环绕声道信号包括左环绕 声道信号和右环绕声道信号,其特征在于,所述解码器包括判断模块,用于判断所述编码码流中是否包含相关性判别信息,如果是,触发信息提取 模块;如果否,触发不相关编码单元;信息提取模块,用于如果编码码流中包含所述相关性判别信息,提取所述相关性判别 信息;解码模块,用于根据所提取的该相关性判别信息,对所述编码码流进行解码,形成重放 音频信号。
19. 如权利要求18所述的多声道音频解码器,其特征在于,所述解码器包括重放声道 数判别模块,用于对重放声道数要求进行判别。
20. 如权利要求18所述的多声道音频解码器,其特征在于,所述解码模块具体包括 相关性判别单元,用于判断提取的相关性判别信息是否指示有关多声道音频中的环绕声道信号与中央声道信号之间具有相关性,或所述环绕声道信号与左、右主声道信号之间 具有相关性;相关解码单元,用于当判断提取的相关性判别信息指示有关多声道音频中的环绕声道 信号与中央声道信号之间具有相关性,或所述环绕声道信号与左、右主声道信号之间具有 相关性,从编码码流中提取预测参数,利用所述预测参数对所述编码码流进行解码,形成重 放音频信号;不相关解码单元,用于当判断提取的相关性判别信息指示有关多声道音频中的环绕声 道信号与中央声道信号之间不具有相关性,或所述环绕声道信号与左、右主声道信号之间 不具有相关性,直接对所述编码码流进行解码,形成重放音频信号。
21. 如权利要求20所述的多声道音频解码器,其特征在于,所述相关解码单元具体包括第一感觉音频解码子单元,用于对所述编码码流进行感觉音频解码,解码出中央声道 信号、左、右主声道信号;预测解码子单元,用于利用所述预测参数和所述主声道信号中任意一个声道信号表示 左、右环绕声道信号,形成重放音频信号。
22. 如权利要求20所述的多声道音频解码器,其特征在于,所述相关解码单元进一步 包括第一双声道重放子单元,用于如果重放声道数要求为双声道重放,将所述中央声道信 号、所述左、右主声道信号、环绕声道信号混合为双声道重放信号进行重放;第一多声道重放子单元,用于如果重放声道数要求为多声道重放,将所述中央声道信 号、所述左、右主声道信号、环绕声道信号作为多声道重放信号进行重放。
23. 如权利要求20所述的多声道音频解码器,其特征在于,所述不相关编码单元具体 包括第二感觉音频解码子单元,用于对所述编码码流进行感觉音频解码,解码出中央声道 信号、左、右主声道信号,形成重放音频信号。
24. 如权利要求20所述的多声道音频解码器,其特征在于,所述不相关解码单元进一 步包括第二双声道重放子单元,用于当重放声道数要求为双声道重放,将中央声道信号直接 或以衰减形式混合入左、右主声道信号,形成双声道重放信号进行重放;第二多声道重放子单元,用于当重放声道数要求为多声道重放,对左、右主声道信号进 行逆传输函数滤波处理,去除左右主声道信号中的方位感信息,形成环绕声道信号;将所述中央声道信号、所述左、右主声道信号、所述环绕声道信号作为多声道重放信号进行重放。
全文摘要
本发明公开了一种多声道音频编码方法、编码器、解码方法和解码器,属于音频处理技术领域。该编码方法包括根据主声道信号对环绕声道信号进行线性预测,得到预测参数,将预测参数加入编码码流;或,根据主声道信号和传输函数对环绕声道信号进行预测,得到预测参数,将预测参数加入编码码流;判别环绕声道信号与中央声道信号之间是否具有相关性,或判别环绕声道信号与左、右主声道信号之间是否具有相关性,如果是,则对预测参数、主声道信号和相关性判别信息进行编码。还公开了一种多声道音频编码器、解码方法和解码器。本发明提高了编解码性能,能在解码端自适应地改变输出的重放声道。
文档编号H04S3/00GK101695150SQ20091023571
公开日2010年4月14日 申请日期2009年10月12日 优先权日2009年10月12日
发明者刘光明, 窦维蓓 申请人:清华大学;
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1