解码音频信号的方法和装置的制作方法

文档序号:2830060阅读:188来源:国知局
专利名称:解码音频信号的方法和装置的制作方法
技术领域
本发明涉及音频信号处理,且更为具体地说,涉及用于处理音频 信号的方法和装置,其能够产生伪环绕信号。
背景技术
近来,已经开发了用于编码数字音频信号的各种各样的技术和方 法,并且也制造了其相关的产品。此外,已经开发了许多方法,其中 具有多信道的音频信号被使用心理声学模型编码。
该心理声学模型是一种使用人类的声音识别方式的原理有效地降 低在除去在编码处理的过程中不必要的信号时的数据量的方法。例如, 人类的耳朵在喧闹的声音之后无法立即识别安静的声音,并且也仅仅
听得见频率在20-20,000Hz之间的声音。
虽然已经开发了以上所述现有的技术和方法,没有已知的用于处 理音频信号以从包括空间信息的音频比特流中产生伪环绕信号的方法。

发明内容
本发明提供了用于解码音频信号的方法和装置及其数据结构,其 能够在音频系统中提供伪环绕效果。
按照本发明的方面,提供了一种用于解码音频信号的方法,该方
法包括接收滤波信息,将空间信息应用于滤波信息以产生环绕转换 信息,和输出该环绕转换信息。
按照本发明的另一方面,提供了一种用于解码音频信号的装置, 该装置包括接收滤波信息的滤波信息接收部分,将空间信息应用于 滤波信息以产生环绕转换信息的信息转换部分,和输出环绕转换信息 的环绕转换信息输出部分。
按照本发明的再一方面,提供了一种音频信号的数据结构,该数 据结构包括滤波信息和空间信息。在这里,该滤波信息被利用应用的 空间信息转换为环绕转换信息。


该伴随的附图被包括以提供对本发明进一步的理解,其举例说明 本发明的实施例,并且与该说明书一起起解释本发明原理的作用。
在附图中
图1举例说明按照本发明一个实施例的信号处理系统;
图2举例说明按照本发明一个实施例的伪环绕产生部分的简略方
框图3举例说明按照本发明一个实施例的信息转换部分的简略方框
图4举例说明按照本发明一个实施例用于描述伪环绕呈现过程和 空间信息转换过程的简略方框图5举例说明按照本发明另一个实施例用于描述伪环绕呈现过程 和空间信息转换过程的简略方框图6和图7举例说明按照本发明一个实施例用于描述信道映射过 程的简略方框图7举例说明按照本发明一个实施例用于描述信道映射过程的简 略方框图8举例说明按照本发明一个实施例用于经由以信道描述滤波系 数的示意图;禾L1
图9至图ll举例说明按照本发明实施例用于描述用于产生环绕转换信息的过程的简略方框图。
具体实施例方式
现在将详细地进行介绍本发明的实施例,其例子被在伴随的附图
中举例说明。
首先,本发明是通过术语描述的,该术语通常已经在其相关的技 术中使用。但是,在本发明中定义了一些术语以清楚地描述本发明。 因此,本发明必须基于在以下的描述中定义的术语来理解。
在本发明中"空间信息"表示通过上混频下混频的信号产生多信 道需要的信息。虽然将假设空间信息是空间参数来描述本发明,容易 理解,该空间信息不受空间参数的限制。这里,该空间参数包括信道
电平差(CLD)、信道间相干性(ICC)和信道预测系数(CPC)等。该信道电 平差(CLD)表示在两个信道之间的能量差。该信道间相干性(ICC)表示 在两个信道之间的互相关性。该信道预测系数(CPC)表示从两个信道预 测三个信道的预测系数。
在木发明中"核心编解码器"表示用于编码音频信号的编解码器。 该核心编解码器不编码空间信息。本发明将假设下混频音频信号是由 核心编解码器编码的音频信号来描述。此外,该核心编解码器可以包 括活动图像专家组(MPEG)层-II、 MPEG音频层-III(MP3)、 AC-3、 Ogg Vorbis、 DTS、 Window媒体音频(WMA)、高级音频编码(AAC)或者高 效的AAC(HE-AAC)。但是,可以不必提供该核心编解码器。在这种情 况下,使用未压縮的PCM信号。该编解码器可以是现有的编解码器和 在将来开发的未来的编解码器。
"信道划分部分"表示可以将特定数目的输入信道划分为另一个特 定数目的输出信道的划分部分,其中输出信道数目不同于输入信道的 数目。该信道划分部分包括二至三(TTT)盒,其将两个输入信道转换为
三个输出信道。此外,该信道划分部分包括一至二(OTT)盒,其将一个
输入信道转换为两个输出信道。本发明的信道划分部分不限于TTT和 OTT盒,而是容易理解,可以在其输入信道数目和输出信道数目是任 意的系统中使用该信道划分部分。
图1举例说明按照本发明一个实施例的信号处理系统。如图1所 示,该信号处理系统包括编码设备100和解码设备150。虽然本发明将 基于音频信号描述,容易理解,本发明的信号处理系统可以处理除音 频信号之外的所有信号。
该编码设备100包括下混频部分110、核心编码部分120和多路复 用部分130。该下混频部分IIO包括信道下混频部分111和空间信息估 算部分112。
当输入下混频部分110的N个多信道音频信号X,、 X2、…、XN 时,取决于某个下混频方法或者任意的下混频方法产生音频信号。在 这里,从下混频部分IIO输出到核心编码部分120的音频信号的数目 小于输入多信道音频信号的数目"N"。该空间信息估算部分112从输 入多信道音频信号提取空间信息,然后将提取的空间信息传送给多路 复用部分130。在这里,下混频信道的数目可以是一个或者两个,或者 可以是按照下混频命令的特定的数目。可以设置下混频信道的数目。 此外,任意的下混频信号被可选地用作下混频音频信号。
该核心编码部分120编码下混频音频信号,其经由下混频信道发 送。将该编码的下混频音频信号输入给多路复用部分130。
该多路复用部分130多路复用编码的下混频音频信号和空间信息 以产生比特流,然后将产生的比特流传送给解码设备150。在这里,该 比特流可以包括核心编解码器比特流和空间信息比特流。
该解码设备150包括多路分解部分160、核心解码部分170和伪环 绕解码部分180。该伪环绕解码部分180可以包括伪环绕产生部分200 和信息转换部分300。此外,该伪环绕解码部分180可以进一步包括用 于接收滤波信息的滤波信息接收部分(未示出),和用于输出环境转 换信息的环境转换信息输出部分(未示出)。此外,该解码设备150 可以进一步包括空间信息解码部分190。该多路分解部分160接收该比 特流,并且将接收的比特流多路分解为核心编解码器比特流和空间信 息比特流。该多路分解部分160从接收的比特流中提取下混频信号和 空间信息。
该核心解码部分170从多路分解部分160接收核心编解码器比特 賴[以解码接收的比特流,然后将解码结果作为解码的下混频信号输出 给伪环绕解码部分180。例如,当编码设备IOO下混频多信道信号为单 信道信号或者立体声信道信号的时候,该解码的下混频信号可以是单 信道信号或者立体声信道信号。虽然本发明的实施例是基于用作下混 频信道的单信道或者立体声信道描述的,容易理解,本发明不受限于 下混频信道的数目。
该空间信息解码部分l卯从多路分解部分160接收空间信息比特 流,解码该空间信息比特流,并且作为空间信息输出该解码的结果。
该伪环绕解码部分180起使用空间信息从下混频信号产生伪环绕 信号的作用。以下是对于伪环绕产生部分200和信息转换部分300的 描述,其被包括在伪环绕解码部分180中。
该信息转换部分300接收空间信息和滤波信息。此外,该信息转 换部分300使用空间信息和滤波信息产生环绕转换信息。在这里,该 产生的环绕转换信息具有适于产生伪环绕信号的模式。该环绕转换信 息在伪环绕产生部分200是特定的滤波器的情形下表示滤波系数。虽 然本发明是基于用作环绕转换信息的滤波系数描述的,容易理解,该
环绕转换信息不受该滤波系数限制。此外,虽然该滤波信息被假设为
是头部相关的传递函数(HRTF),容易理解,该滤波信息不限于HRTF。
在本发明中,以上描述的滤波系数表示特定的滤波器的系数。例 如,该滤波系数可以如下定义。原型HRTF滤波系数表示特定的HRTF 滤波器的原始滤波系数,并且可以被表示为GL—L等等。转换的HRTF 滤波系数表示从原型HRTF滤波系数转换的滤波系数,并且可以被表 示为GL—L'等等。空间化的HRTF滤波系数是通过空间化原型HRTF 滤波系数以产生伪环绕信号获得的滤波系数,并且可以被表示为FL一Ll 等等。主呈现系数表示为执行呈现所必需的滤波系数。并且可以被表 示为HL—L等等。内插的主呈现系数表示通过内插和/或模糊化主呈现 系数获得的滤波系数,并且可以被表示为HL一L'等等。按照本发明,容 易理解,滤波系数不限于以上所述的滤波系数。
该伪环绕产生部分200从核心解码部分170接收解码的下混频信 号,和从信息转换部分300接收环绕转换信息,并且使用解码的下混 频信号和环绕转换信息产生伪环绕信号。例如,伪环绕信号用来在立 体声音频系统中提供虚拟多信道(或者环绕)声音。按照本发明,容易理 解,伪环绕信号将在除立体声音频系统之外的任何的设备中起以上所 述的作用。该伪环绕产生部分200可以按照设置模式执行各种各样类 型的呈现。
假设编码设备100传送单声道或者立体声下混频信号而不是多信 道音频信号,并且该下混频信号被与多信道音频信号的空间信息一起 发送。在这种情况下,虽然该设备150的输出信道是立体声信道而不 是多信道,包括伪环绕解码部分180的该解码设备150可以提供用户 具有虚拟立体声收听感受的效果。
以下是按照本发明一个实施例对于音频信号结构140的描述,如 图1所示。当基于有效载荷发送音频信号的时候,其可以经由每个信
道或者单个信道接收。1帧的音频有效载荷由编码的音频数据字段和辅 助的数据字段组成。在这里,该辅助的数据字段可以包括编码的空间 信息。例如,如果音频有效载荷的数据速率是48 128kbps,空间信息 的数据速率可以是5 32kbps。这样一个例子将不限制本发明的范围。
图2举例说明按照本发明一个实施例的伪环绕产生部分200的简
略方框图。
在本发明中描述的域包括其中解码下混频信号的下混频域,其中 处理空间信息以产生环绕转换信息的空间信息域,其中使用空间信息 呈现下混频信号的呈现域,和其中输出时域的伪环绕信号的输出域。 在这里,该输出域音频信号可以是由人类听到的。该输出域指的是时 域。该伪环绕产生部分200包括呈现部分220和输出域转换部分230。 此外,该伪环绕产生部分200可以进一步包括呈现域转换部分210,其 当下混频域不同于呈现域的时候,将下混频域转换为呈现域。
以下是分别地由被包括在呈现域转换部分210中的三个域转换部 分执行的三个域转换方法的描述。首先,虽然以下的实施例假设呈现 域被设置为子频带域来描述,容易理解,该呈现域可以被设置为任何 的域。按照第一域转换方法,在下混频域是时域的情况下,时域被转 换为呈现域。按照第二域转换方法,在下混频域是离散频域的情况下, 离散频域被转换为呈现域。按照第三域转换方法,在下混频域是离散 频域的情况下,离散频域被转换为时域,且之后转换的时域被转换为 呈现域。
该呈现部分220使用环绕转换信息执行用于下混频信号的伪环绕 呈现以产生伪环绕信号。在这里,以立体声输出信道从伪环绕解码部 分180输出的该伪环绕信号变为具有虚拟环绕声音的伪环绕立体声输 出。此外,因为从呈现部分220输出的伪环绕信号是在呈现域中的信 号,当呈现域不是时域的时候需要域转换。虽然本发明在伪环绕解码 部分180的输出信道是立体声信道的情况下描述,容易理解,可以应 用本发明,而与输出信道的数目无关。
例如,可以通过HRTF滤波方法实现伪环绕呈现方法,其中输入 信号经历一组HRTF滤波器。在这里,空间信息可以是可以在混频滤 波器组域中使用的值,混频滤波器组域是在MPEG环绕下定义的。该 伪环绕呈现方法可以按照下混频域和空间信息域的类型如以下的实施 例那样实现。为此,使得下混频域和空间信息域是与呈现域重合的。
按照伪环绕呈现方法的实施例,存在 一 种其中在子频带域(Q M F) 中执行下混频信号的伪环绕呈现的方法。该子频带域包括简单子频带 域和混合域。例如,当下混频信号是PCM信号并且下混频域不是子频 带域的时候,呈现域转换部分210将下混频域转换为子频带域。另一 方面,当下混频域是子频带域的时候,下混频域不需要被转换。有时 候,为了使下混频信号与空间信息同步,需要将下混频信号或者空间 信息延迟。在这里,当空间信息域是子频带域的时候,空间信息域不 需要被转换。此外,为了在时域中产生伪环绕信号,该输出域转换部 分230将呈现域转换为时域。
按照伪环绕呈现方法的另一实施例,存在一种其中在离散频域中 执行下混频信号的伪环绕呈现的方法。在这里,该离散频域表示除子 频带域之外的频域。即,该频域可以包括离散频域和子频带域的至少 一个。例如,当下混频域不是离散频域的时候,该呈现域转换部分210 将下混频域转换为离散频域。在这里,当空间信息域是子频带域的时 候,空间信息域需要被转换为离散频域。该方法用来以在离散频域中 的操作代替在时域中滤波,使得操作速度可以相对迅速地执行。此外, 为了在时域中产生伪环绕信号,该输出域转换部分230可以将呈现域 转换为时域。
按照伪环绕呈现方法的再一个实施例,存在一种其中在时域中执
行下混频信号的伪环绕呈现的方法。例如,当下混频域不是时域的时 候,该呈现时域转换部分210将下混频域转换为时域。在这里,当空 间信息域是子频带域的时候,空间信息域也被转换为时域。在这种情
况下,因为该呈现域是时域,该输出域转换部分230不需要将呈现域
转换为时域。
图3举例说明按照本发明实施例的信息转换部分300的简略方框 图。如图3所示,该信息转换部分300包括信道映射部分310、系数产 生部分320和积分部分330。此外,该信息转换部分300可以进一步包 括用于另外处理滤波系数的附加处理部分(未示出)和/或呈现域转换 部分340。
该信息转换部分300接收滤波信息和空间信息,将该空间信息应 用于滤波信息以产生环绕转换信息,然后输出该环绕转换信息。在这 里,该滤波信息的域和空间信息域可以互相是相同的,以便将该空间 信息应用于该滤波信息。当该接收的滤波信息的域与空间信息域是不 相同的时候,该滤波信息的域可以被转换,使得两个域可以是互相相 同的。今后,将假设空间信息域是子频带域来描述本发明,但是,应 该理解,本发明不限于该假设。
例如,当域转换被应用于该接收的滤波信息的时候,因为滤波信 息的域与空间信息域是不相同的,该滤波信息出现在每个子频带中。 在这里,当该滤波信息出现在各个子频带中的时候,应用其而不进行 修改,这导致大量的操作。因此,需要在子频带域中减少滤波信息的 量。 一个减少方法的实施例是参数化法。为了描述方便起见,在参数 化法之前的滤波信息以下被简称为在子频带中的原型滤波信息,并且 在参数化法之后的滤波信息以下被简称为参数滤波信息。此外最后的 参数滤波信息是通过转换滤波信息的域获得的,且然后在转换的域中 参数化该滤波信息。最后的参数滤波信息被称为修改的滤波信息,其 可以包括参数滤波信息。
该信道映射部分310执行信道映射,使得该输入的空间信息可以 被映射给多信道信号的至少一个信道信号,然后产生作为信道映射信 息的信道映射输出值。
该系数产生部分320产生信道系数信息。该信道系数信息可以包 括信道的系数信息或者信道间的系数信息。在这里,信道的系数信息 表示大小信息和能量信息等等的至少一个,并且该信道间的系数信息 表示信道间的相关信息,其是使用滤波系数和信道映射输出值计算的。 该系数产生部分320可以包括信道的多个系数产生部分。该系数产生 部分320使用滤波信息和信道映射输出值产生信道系数信息。在这里, 该信道可以包括多信道、下混频信道和输出信道的至少一个。今后, 该信道将描述为多信道,并且信道的系数信息将也描述为大小信息。 虽然信道和系数信息将基于上述的实施例描述,容易理解,存在许多 可允许的实施例的修改。此外,该系数产生部分320可以按照信道编 号或者其它的特征产生信道系数信息。
该接收信道的系数信息的积分部分330积分或加和信道的系数信 息以产生积分的系数信息。此外,该积分部分330使用积分系数信息 的积分系数产生滤波系数。该积分部分330可以通过进一步积分附加 信息与该信道的系数来产生该积分系数。该积分部分330可以按照信 道系数信息的特征积分至少一个信道的系数。例如,该积分部分330 可以按照信道系数信息的特征,以下混频信道,输出信道,与输出信 道相结合的一个信道,和列出的信道的组合执行积分。此外,该积分 部分330可以通过另外处理该积分的系数产生附加的处理系数信息。 即,该积分部分330可以通过附加的处理产生滤波系数。例如,该积 分部分330可以通过另外处理该积分系数,诸如,通过应用特定函数 于积分系数,或者通过合并多个积分系数来产生滤波系数。在这里, 该积分系数信息是输出信道幅度信息、输出信道能量信息和输出信道 相关信息中的至少一个。
当空间信息域不同于呈现域的时候,该呈现域转换部分340可以
使空间信息域与呈现域重合。该呈现域转换部分340可以将用于伪环
绕呈现的滤波系数的域转换为呈现域。
由于该积分部分330起减小伪环绕呈现的工作量的作用,其可以 被省略。此外,在立体声下混频信号的情况下,在产生信道的系数信 息的过程中,产生应用于左和右下混频信号的系数组。在这里,滤波 系数组可以包括从各个信道发送给它们自己信道的滤波系数,和从各 个信道发送给它们的相对信道的滤波系数。
图4举例说明按照本发明一个实施例用于描述伪环绕呈现过程和 空间信息转换过程的简略方框图。然后,该实施例举例说明解码的立 体声下混频信号被接收到伪环绕产生部分410的情形。
信息转换部分400可以产生在伪环绕产生部分410中传送给其自 己的信道的系数,和在伪环绕产生部分410中传送给相对信道的系数。 该信息转换部分400产生系数HLJL和系数HL—R,并且将该产生的系 数HL—L和HL一R输出给第一呈现部分413。在这里,该系数HL一L被 传送给伪环绕产生部分410的左输出端,并且该系数HL—R被传送给 伪环绕产生部分410的右输出端。此外,该信息转换部分400产生系 数HR—R和HR—L,并且将产生的系数HR一R和HR一L输出给第二呈现 部分4M。在这里,该系数HR—R被传送给伪环绕产生部分410的右输 出端,并且该系数HR_L被传送给伪环绕产生部分410的左输出端。
该伪环绕产生部分410包括第一呈现部分413、第二呈现部分414 以及加法器415和416。此外,该伪环绕产生部分410可以进一步包括 域转换部分411和412,其将下混频域与呈现域重合,当两个域互相不 同时,例如,当下混频域不是子频带域时,并且呈现域是子频带域。 在这里,该伪环绕产生部分410可以进一步包括反域转换部分417和
418,其将呈现域,例如子频带域转换为时域。因此,用户经由具有立 体声信道等的耳机听到具有虚拟多信道声音的音频。
第一和第二呈现部分413和414接收立体声下混频信号和一组滤
波系数。该滤波系数组被分别地应用于左和右下混频信号,并且从积
分部分403输出。
例如,第一和第二呈现部分413和414使用四个滤波系数HL一L、 HL—R、 HR一L和HR一R执行呈现以从下混频信号产生伪环绕信号。
更具体地说,第一呈现部分413可以使用滤波系数HL一L和HL—R 执行呈现,其中滤波系数HL一L被传送给其自己的信道,并且该滤波系 数HL一R被传送给与其自己的信道相对的信道。第一呈现部分413可 以包括子呈现部分(未示出)1-1和1-2。在这里,该子呈现部分1-1 使用滤波系数HL一L执行呈现,该滤波系数HL—L被传送给伪环绕产生 部分410的左输出端,并且该子呈现部分1-2使用滤波系数HL一R执行 呈现,该滤波系数HL一R被传送给伪环绕产生部分410的右输出端。 此外,第二呈现部分414使用滤波系数组HR一R和HR—L执行呈现, 其中滤波系数HR一R被传送给其自己的信道,并且该滤波系数HR一L 被传送给与其自己的信道相对的信道。第二呈现部分414可以包括子 呈现部分(未示出)2-1和2-2。在这里,该子呈现部分2-1使用滤波 系数HR—R执行呈现,该滤波系数HR一R被传送给伪环绕产生部分410 的右输出端,并且该子呈现部分2-2使用滤波系数HR—L执行呈现,该 滤波系数HR—L被传送给伪环绕产生部分410的左输出端。HL—R和 HR—R在加法器416中相加,并且HL一L和HR—L在加法器415中相加。 在这里,必要时,HL—R禾B HR—L变为零,这指的是交叉项的系数是零。 在这里,当HL—R和HR—L是零的时候,另外的两个传送不互相影响。
另一方面,在单声下混频信号的情况下,可以通过具有类似于图4 的结构的实施例执行呈现。更具体地说,原始单声输入被称为第一信
道信号,并且通过去相关第一信道信号获得的信号被称为第二信道信 号。在这种情况下,第一和第二呈现部分413和414可以接收第一和 第二信道信号,并且对它们执行呈现。
参考图4,其定义输入的立体声下混频信号是由"x"表示的,通 过将空间信息映射给信道获得的信道映射系数是由"D"表示的,外部 输入的原型HRTF滤波系数是由"G"表示的,临时的多信道信号是由 "p"表示的,并且已经经历呈现的输出信号是由"y"表示的。该标 记"x" 、 "D" 、 "G" 、 "p"和"y"可以通过如下公式1的矩阵形 式表示。公式1是基于用作原型滤波系数的原型HRTF滤波系数表示 的。但是,当作为修改的滤波系数的修改的HRTF滤波系数用于以下 的公式的时候,在以下的公式中G必须以G'代替。
<formula>formula see original document page 17</formula>在这里,当每个系数是频域的值的时候,临时的多信道信号"p"
可以被通过信道映射系数"D"与立体声下混频信号"x"的乘积表示, 如以下的公式2所示。 <formula>formula see original document page 18</formula>
然后,当使用原型HRTF滤波系数"G"呈现临时的多信道"p" 的时候,可以通过公式3表示该输出信号"y"。 y = G p
然后,如果插入p-D.x,可以通过公式4表示"y"。 》=GDx
在这里,如果定义H^GD,该输出信号"y"和立体声下混频信号 "x"具有如下的公式5的关系。
:公式5]
<formula>formula see original document page 18</formula>
因此,该滤波系数的乘积允许获得"H"。然后,可以通过将立体 声下混频信号"x"和"H"相乘获得该输出信号"y"。
可以通过以下的公式6获得稍后将描述的系数F(FL—Ll FL—L2、..,)。
<formula>formula see original document page 19</formula>图5举例说明按照本发明另一个实施例用于描述伪环绕呈现过程 和空间信息转换过程的简略方框图。然后,该实施例举例说明解码的 单声下混频信号被接收到伪环绕产生部分510的情形。如该图所示, 信息转换部分500包括信道映射部分501、系数产生部分502和积分部 分503。由于该信息转换部分500的上述的元件执行与图4的信息转换 部分400相同的功能,在下面将省略其详细说明。在这里,该信息转 换部分500可以产生最后的滤波系数,其域与其中执行伪环绕呈现的 呈现域重合。当解码的下混频信号是单声下混频信号的时候,该滤波 系数组可以包括滤波系数组HM—L和HM—R。该滤波系数HM—L用于 执行单声下混频信号的呈现,以将呈现结果输出给伪环绕产生部分510 的左信道。该滤波系数HM—R用于执行单声下混频信号的呈现,以将 呈现结果输出给伪环绕产生部分510的右信道。
该伪环绕产生部分510包括第三呈现部分512。此外,该伪环绕产 生部分510可以进一步包括域转换部分511和反向域转换部分513和 514。该伪环绕产生部分510的元件不同于图4的伪环绕产生部分410 的元件,这是由于解码的下混频信号在图5中是单声下混频信号,该 伪环绕产生部分510包括执行伪环绕呈现的一个第三呈现部分512和
一个域转换部分511。该第三呈现部分512从积分部分503接收滤波系 数组HM—L和HM—R,并且可以使用接收的滤波系数执行单声下混频 信号的伪环绕呈现,以及产生伪环绕信号。
同时,在下混频信号是单声信号的情形下,可以按照以下的二种 方法通过执行单声下混频信号的伪环绕呈现获得立体声下混频的输出。
按照第一方法,第三呈现部分512 (例如,HRTF滤波器)不使用 用于伪环绕声音的滤波系数,而是使用当处理立体声下混频的时候使 用的值。在这里,当处理立体声下混频的时候使用的值可以是系数(左 前=1、右前=0、...等等),这里该系数"左前"是用于左输出,并且该 系数"右前"是用于右输出。
其次,在使用空间信息从下混频信号产生多信道信号的解码过程 的中间,获得具有所需的信道数目的立体声下混频的输出。
参考图5,其定义输入单声下混频信号是由"x"表示的,信道映 射系数是由"D"表示的,外部输入的原型HRTF滤波系数是由"G" 表示的,临时的多信道信号是由"p"表示的,并且已经经历呈现的输 出信号是由"y"表示的,该标记"x" 、 "D" 、 "G" 、 "p"和"y"
可以由如下公式7的矩阵形式表示。—公式7]
<formula>formula see original document page 21</formula>在公式7中的矩阵之间的关系已经在图4的解释中描述。因此, 以下的描述将省略其描述。在这里,图4举例说明接收立体声下混频 信号的情形,并且图5举例说明接收单声下混频信号的情形。
图6和图7举例说明按照本发明一个实施例用于描述信道映射过 程的简略方框图。该信道映射过程指的是一过程,其中信道映射输出 值的至少一个是通过将接收的空间信息映射为多信道的至少一个信道 而产生的,以与伪环绕产生部分兼容。该信道映射过程是在信道映射 部分401和501中执行的。在这里,空间信息,例如,能量可以被映 射给多个信道的至少二个。在这里,可以不必划分Lfe信道和中心信道 C。在这种情况下,由于上述的过程不需要信道划分部分604或者705, 其可以简化计算。
例如,当接收单声下混频信号的时候,可以使用系数CLD1至 CLD5、 ICC1至ICC5等产生信道映射输出值。该信道映射输出值可以 是Dl、 Dr、 De、 DwF、 D^、 D&等。由于该信道映射输出值是通过使 用空间信息获得的,可以按照不同的公式获得各种各样类型的信道映 射输出值。在这里,可以按照由解码设备150接收的空间信息的树形 结构,和在解码设备150中使用的空间信息的范围改变信道映射输出 值的产生。
图6和图7举例说明按照本发明一个实施例用于描述信道映射结 构的简略方框图。在这里,信道映射结构可以包括表示OTT盒的至少 一个信道划分部分。图6的信道结构具有5151结构。
参考图6,可以使用OTT盒601、 602、 603、 604、 605和空间信 息,例如CLD。、 CLD" CLD2、 CLD3、 CLD4、 ICC。、 ICC,、 ICC2、 ICC3 等从下混频信号"m"产生多信道信号L、 R、 C、 LFE、 Ls、 Rs。例如, 当该树形结构具有如图6所示的5151结构的时候,可以仅使用CLD 获得该信道映射输出值,如公式8所示。
公式8]
<formula>formula see original document page 22</formula>
参考图7,可以使用OTT盒701、 702、 703、 704、 705和空间信 息,例如CLDq、 CLD,、 CLD2、 CLD3、 CLD4、 ICC。、 ICQ、 ICC3、 ICC4 等等从下混频信号"m"产生多信道信号L、 Ls、 R、 Rs、 C、 LFE。
例如,当该树形结构具有如图7所示的5152结构的时候,可以仅 使用CLD获得该信道映射输出值,如公式9所示。<formula>formula see original document page 23</formula> 该信道映射输出值可以按照频带范围、参数频带和/或传送的时隙 改变。在这里,如果在邻近频带之间或者在形成边界的时隙之间的信 道映射输出值的差值扩大,当执行伪环绕呈现的时候,可能出现失真。 为了防止上述的失真,可能在频率和时域中需要信道映射输出值的模 糊化。更具体地说,防止失真的方法如下。首先,该方法可以采用频 率模糊化和时间模糊化,或者此外采用任何适于伪环绕呈现的其他技 术。此外,可以通过将每个信道映射输出值乘以特定的增益来防止该 失真。
图8举例说明按照本发明一个实施例用于描述信道的滤波系数的 示意图。例如,该滤波系数可以是HRTF系数。
为了执行伪环绕呈现,通过具有滤波系数GL—L的滤波器滤波来 自左信道信源"L" 810的信号,然后,该滤波结果I^GL—L被作为左 输出传送。此外,来自左信道信源"L"810的信号由具有滤波系数GL—R 的滤波器滤波,然后,该滤波结果I^GL—R被作为右输出传送。例如, 左和右输出可以分别地到达用户的左耳和右耳。如此,所有左和右输 出是通过信道获得的。然后,该获得的左输出被加和以产生最后的左
输出(例如,Lo),并且该获得的右输出被加和以产生最后的右输出(例 如,RO)。因此,已经经历伪环绕呈现的最后的左和右输出可以由以下 的公式10表示。
<formula>formula see original document page 24</formula>
按照本发明的实施例,用于获得L(810)、 C(800)、 R(820)、 Ls(830) 和Rs(840)的方法如下。首先,可以通过用于使用下混频信号和空间信 息产生多信道信号的解码方法获得L(810)、 C,、 R(820)、 Ls(830) 和Rs(840)。例如,可以通过MPEG环绕解码方法产生该多信道信号。 其次,可以通过仅与空间信息相关的公式获得L(810)、 C(800)、 R(820)、 Ls(830)和Rs(840)。
图9至图11举例说明按照本发明实施例用于描述产生环绕转换信 息的过程的简略方框图。
图9举例说明按照本发明一个实施例用于描述产生环绕转换信息 的过程的简略方框图。如图9所示,除信道映射部分之外,信息转换 部分可以包括系数产生部分卯O和积分部分910。在这里,该系数产生 部分900包括子系数产生部分(coef—1产生部分900—1、 coef—2产生部 分卯0一2、 ...、 coef—N产生部分900—N)的至少一个。在这里,该信息 转换部分可以进一步包括内插部分920和域转换部分930以便另外处 理滤波系数。
该系数产生部分900使用空间信息和滤波信息产生系数。以下是
在特定的子系数产生部分,例如,coef—1产生部分900_1 (其被称为第 一子系数产生部分)中系数产生的描述。
例如,当输入单声下混频信号的时候,第一子系数产生部分900—1 使用从空间信息产生的值D—L产生用于多信道的左信道的系数FL一L 和FL—R。该产生的系数FL—L和FL—R可以由以下的公式11表示。
FL—L=DJL *GL一L (用于从输入的单声下混频信号产生左输出的系
数)
FL—R=D—L*GL—R (用于从输入的单声信道信号产生右输出的系
数)
在这里,该D—L是在信道映射过程中从空间信息产生的信道映射 输出值。用于获得D—L的过程可以按照编码设备传送和解码设备接收 的树形结构信息改变。类似地,在coef—2产生部分900—2被称为第二 子系数产生部分,并且coef一3产生部分900—3被称为第三子系数产生 部分的情况下,第二子系数产生部分900—2可以产生系数FR—L和 FR—R,并且第三子系数产生部分900_3可以产生FC_L和FC—R等等。
例如,当输入立体声下混频信号的时候,第一子系数产生部分 900—1使用从空间信息产生的值D一L1和D一L2产生用于多信道的左信 道的系数FL—Ll、 FL—L2、 FL—Rl禾Q FL—R2。该产生的系数FL—Ll、 FL—L2、 FL—Rl禾P FL—R2可以由以下的公式12表示。
FL—L1=D—L1*GL—L(用于从输入立体声下混频信号的左下混频信 号产生左输出的系数)
FL—L2=D—L24GLJL(用于从输入立体声下混频信号的右下混频信
号产生右输出的系数)
FL一R^D一LPGL一R(用于从输入立体声下混频信号的左下混频信 号产生右输出的系数)
FL—R2=D—L2*GL—R(用于从输入立体声下混频信号的右下混频信 号产生右输出的系数)
在这里,类似于输入该单声下混频信号的情形,当输入立体声下 混频信号的时候,可以通过系数产生部分900—1至900一N的至少一个 产生多个系数。
该积分部分910通过积分系数产生滤波系数,该积分系数是按照 信道产生的。该积分部分910用于输入的单声和立体声下混频信号情 况的积分可以由以下的公式13表示。
在输入单声下混频信号的情况下 HM—L = FL—L + FR一一L + FC一L + FLS—L + FRS—L + FLFE一L
HM一R = FL—R + FR—R + 1 C一R + R + FRS—R + FLFE一R
在输入立体声下混频信号的情况下
HL—L = ! ;l_L1 + fr—Ll + fc_l1 + fls_Jil + FRS_l1 +
f:lfe—Li
HR—L a FL—L2 + FR—L2 + FC一L2 + FLS一L2 + FRS一]1'2 + FIFE—J.,2
HL R = FL Rl + 1TR Rl + FC Rl + fls Rl + FRS Rl +
_ ~—
FLFE—Rl
HR_R = FL—R2 + FR一R2 + FC一R2 + FLS—R2 'l' FRS一R2 + FXFE—R2
在这里,HM—L和HM_R表示在输入单声下混频信号的情况下用 于伪环绕呈现的滤波系数。另一方面,HL一L、 HR一L、 HL—R和HR一R
表示在输入立体声下混频信号的情况下用于伪环绕呈现的滤波系数。
该内插部分920可以内插该滤波系数。此外,可以作为后处理执 行滤波系数的模糊化。该时间模糊化可以在时间模糊化部分(未示出) 中执行。当传送和产生的空间信息在时间轴具有宽的间隔的时候,该 内插部分920内插该滤波系数,以获得在传送和产生的空间信息之间 不存在的空间信息。例如,当空间信息存在于第n个参数时隙和第n+K 个参数时隙(K〉1)的时候,线性内插的实施例可以由以下的公式14表 示。在公式14的实施例中,可以使用产生的滤波系数,例如HL—L、 HR一L、 HL—R和HR—R获得在没有传送的参数时隙中的空间信息。应 该理解,该内插部分920可以通过多种方法内插滤波系数。
<formula>formula see original document page 28</formula>
通过公式14的线性内插,可以使用在第n和第n+K参数时隙中 的空间信息获得在没有在第n和第n+K参数时隙之间传送的参数时隙 中的空间信息。即,可以在两个参数时隙中按照公式15在由空间信息 的连接值形成的直线上获得空间信息的未知值。
当在1J 、}域中在邻近模块之间的系数值被迅速地改变的时候可以产 生不连续的点。然后,可以通过时间模糊化部分执行时间模糊化以防 止由不连续的点所引起的失真。可以与内插操作并行执行该时间模糊 化操作。此外,可以按照它们的操作顺序不同地处理该时间模糊化和 内插操作。
在单声下混频信道的情况下,该滤波系数的时间模糊化可以由以 下的公式16表示。
丽—L(n)' = HM—L(n) * b + HM一I, (n-l)' * (1-b) HM一R(n)' = HM—R(n) * b + HM—R(n-l)' * (l-b)
公式16描述经由1极IIR滤波器的模糊化,其中该模糊化结果可 以如下获得。艮卩,在当前的模块(n)中该滤波系数HM一L(n)和HM—R(n) 分别地乘以"b"。然后,在先前的模块(n-l)中该滤波系数HM一L(n-l)' 和HM一R(n-l)'分别地乘以(l-b)。该相乘的结果被相加,如公式16所示。 在这里,"b"是恒定的(0<1)<1)。 "b"的值越小,该模糊化效应增加 越多。相反地,"b"的值越大,该模糊化效应增加越少。类似于以上
所述的方法,可以执行剩余的滤波系数的模糊化。
使用公式16用于时间模糊化,内插和模糊化可以由公式17表示。
HM一L(n+j)' = (HM—:L(n)*a + HM—!■ (n+k) *( ) * b + HM一L(n+j-1)' * (l-b)
HM一R(n+j)' = <HM—R(n)*a + HM一R(n+k)*(1-a)) * b + HM一R(n+j-1)' * (1-b)
另一方面,当内插部分920和/或时间模糊化部分分别地执行内插 和时间模糊化的时候,可以获得其能量值不同于原始滤波系数的滤波 系数。在那种情况下,可以进一步需要能量标准化处理以防止上述的 问题。当呈现域不与空间信息域重合的时候,该域转换部分930将空 间信息域转换为呈现域。但是,如果该呈现域与空间信息域重合,不 需耍上述的域转换。在这里,当空间信息域是子频带域并且呈现域是 频域的时候,上述的域转换可以涉及其中系数被扩展或者降低到符合 频率范围和用于每个子频带的时间范围的处理。
图10举例说明按照本发明另一个实施例用于描述产生环绕转换信 息过程的简略方框图。如图10所示,除信道映射部分之外,信息转换 部分可以包括系数产生部分1000和积分部分1020。在这里,该系数产 生部分1000包括子系数产生部分(coefJ产生部分IOOO一I、 coef—2产生 部分1000—2、...和coef—N产生部分1000—N)的至少一个。此外,该信息 转换部分可以进一步包括内插部分1010和域转换部分1030以便另外处 理滤波系数。在这里,该内插部分1010包括子内插部分1010—1、 1010—2、... 和1010—N的至少一个。与图9的实施例不同,在图10的实施例中,该 内插部分1010内插该系数产生部分1000按照信道产生的相应的系数。 例如,在单声下混频信道的情况下,该系数产生部分1000产生系数FL一L
和FL—R,且在立体声下混频信道情况下,产生系数FL—Ll、 FL—L2、 FL—Rl禾口 FL—R2。
图11举例说明按照本发明再一个实施例的用于描述产生环绕转换 信息的过程的简略方框图。与图9和IO的实施例不同,在图ll的实施 例中,内插部分1100内插各个信道映射输出值,然后系数产生部分1110
使用内插结果产生信道的系数。
在图9至图11的实施例中,描述了由于信道映射输出值是在频域 中(例如,参数频带单元具有单个值),而在频域中执行处理,诸如 滤波系数产生。此外,当在子频带域中执行伪环绕呈现的时候,该域 转换部分930或者1030不执行域转换,而是分路子频带域的滤波器系 数,或者可以执行转换以调整频率分解,然后输出该转换结果。
如上所述,本发明可以甚至在其中解码装置无法产生多信道信号 的环境中,在解码装置中提供具有伪环绕声音的音频信号,该解码装 置接收包括下混频信号和多信道信号的空间信息的声音比特流。
此外,本发明提供一种用于产生环绕转换信息的方法和装置,以 及用于该方法和装置的数据结构和媒体,其可以用于转换下混频信号 为伪环绕信号。
此外,本发明提供一种用于应用空间信息于滤波信息以产生环绕 转换信息的方法,和一种用于预处理滤波信息的方法。
对于那些本领域技术人员来说显而易见,不脱离本发明的精神或 者范围,可以在本发明中进行各种各样的改进和变化。因此,本发明 意欲覆盖其归入所附的权利要求和其等效范围之内所提供的本发明的 改进和变化。
权利要求
1.一种用于解码音频信号的方法,该方法包括接收滤波信息;将空间信息应用于滤波信息以产生环绕转换信息;和输出该环绕转换信息。
2. 根据权利要求1的方法,进一步包括使用环绕转换信息将对应 于空间信息的下混频信号转换为伪环绕信号。
3. 根据权利要求1的方法,其中,该滤波信息包括修改的滤波信息。
4. 根据权利要求3的方法,其中,该滤波信息的接收包括 转换滤波信息的域;和从在转换的域中的滤波信息获得修改的滤波信息。
5. 根据权利要求l的方法,其中,该应用空间信息的步骤包括通过按照信道映射空间信息来产生信道映射信息; 使用信道映射信息和滤波信息产生信道系数信息;和 使用信道系数信息产生环绕转换信息。
6. 根据权利要求5的方法,其中该环绕转换信息是积分系数信息和附加处理系数信息的至少一 个,该积分系数信息是通过积分信道系数信息获得的,且该附加处理 系数信息是通过附加处理积分系数信息获得的;和该积分系数信息是输出信道幅度信息、输出信道能量信息和输出 信道相关信息的至少一个。
7. —种用于解码音频信号的装置,该装置包括.- 接收滤波信息的滤波信息接收部分 ,将空间信息应用于滤波信息以产生环绕转换信息的信息转换部 分;和输出环绕转换信息的环绕转换信息输出部分。
8. 根据权利要求7的装置,进一步包括使用环绕转换信息将对应 于空间信息的下混频信号转换为伪环绕信号的伪环绕产生部分。
9. 根据权利要求7的装置,其中,该滤波信息包括修改的滤波信肩、。
10. 根据权利要求9的装置,其中,该信息转换部分转换滤波信 息的域,并且从在转换的域中的滤波信息计算修改的滤波信息。
11. 根据权利要求7的装置,其中,该信息转换部分包括通过按照信道映射空间信息来产生信道映射信息的信道映射部分;使用信道映射信息和滤波信息产生信道系数信息的系数产生部 分;禾口使用信道系数信息产生环绕转换信息的积分部分。
12. 根据权利要求11的装置,其中该环绕转换信息是积分系数信息和附加处理系数信息的至少一 个,该积分系数信息是通过积分信道系数信息获得的,且该附加处理 系数信息是通过附加处理该积分系数信息获得的;且该积分系数信息是输出信道幅度信息、输出信道能量信息和输出信道相关信息的至少一一个。
13. —种音频信号的数据结构,其包括滤波信息和空间信息,其 中该滤波信息被利用应用的空间信息转换为环绕转换信息。
14. 根据权利要求13的数据结构,其中,该对应于空间信息的下 混频信号被利用使用的环绕转换信息转换为伪环绕信号。
15. 根据权利要求13的数据结构,其中,该滤波信息包括修改的滤波信息。
16. 根据权利要求13的数据结构,其中,该滤波信息的域被转换 以产生修改的滤波信息。
全文摘要
提供了一种用于处理音频信号的方法和装置。用于解码音频信号的方法包括接收滤波信息,将空间信息应用于滤波信息以产生环绕转换信息,和输出该环绕转换信息。用于解码音频信号的装置包括接收滤波信息的滤波信息接收部分;将空间信息应用用于滤波信息以产生环绕转换信息的信息转换部分;和输出环绕转换信息的环绕转换信息输出部分。
文档编号G10L19/00GK101185119SQ200680018245
公开日2008年5月21日 申请日期2006年5月26日 优先权日2005年5月26日
发明者吴贤午, 房熙锡, 林宰显, 郑亮源, 金东秀 申请人:Lg电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1