低位率空间编码方法和系统的制作方法

文档序号:7585624阅读:263来源:国知局
专利名称:低位率空间编码方法和系统的制作方法
技术领域
本发明一般涉及人类听觉用多维声域的记录、传送和重现。更具体地,本发明涉及一种感知编码系统,它的编码器和解码器以及它的方法的改进,其中编码信号由一个组合音频信号和一个方向向量所携带。本发明特别适用于要求非常低位率的系统。
美国专利5,583,962,5,632,005和5,633,981描述两个用于音频信号的减低位率感知编码系统,此处标为“类型Ⅰ”和“类型Ⅱ”。所述5,583,962,5,632,005和5,633,981专利中的每一个都在此处全部引为参考。根据两个系统的基础原理,一个编码器响应于输入的音频信号流而生成频率副带信号,这些副带信号一般对应于人类耳朵的重要频带。
在所述专利中描述的类型Ⅰ系统的编码器中,当有足够数量的可用位数时,每个音频流都是单独地编码。当位数不够时,一部分或全部副带中的信号分量组合为一个组合信号和多个比例系数,每个输入的音频流有一个比例系数,每个比例系数基于每个音频流中副带信号分量中的某些量度。类型Ⅰ解码器从组合信号和比例系数中重新构造原始信号的表现。类型Ⅰ系统因而相对于在其中独立地将每个音频流编码的专用离散系统而言能提供位数的节省或编码增益。类型Ⅰ系统采用于AC-3编码中,它组成Dolby数字感知编码系统的基础,其中5.1音频声道(左、中、右、左环绕、右环绕和有限带宽亚低音声道)编码为一个减低位率数据流。
在所述专利中描述的类型Ⅱ的编码器中,当有足够数量的可用位数时,每个音频流都是单独地编码。当位数不够时,一部分或全部副带中的信号分量组合为一个组合信号和一个或多个方向向量,这些方向向量标示由音频流表现的声域的一个或多个主要方向。类型Ⅱ解码器从组合信号和一个或多个方向向量中重新构造由原始信号表现的声域的表现。类型Ⅱ系统因而相对于在其中独立地将每个音频流编码的专用离散系统而言以及相对于在其中组合信号与每个音频流的比例系数相关连的类型Ⅰ系统能够提供位的节省或编码增益。
在所述专利中描述的类型Ⅰ和类型Ⅱ系统在若干方面是适应性的。它们的适应性的一个方面在于一个或多个频率副带可在某些时间内用一个“离散”模式操作以使频率副带中音频流的所有副带分量能够单独地编码和解码,而位数不够时能使例如具体频率副带中音频流的副带分量根据类型Ⅰ方案或类型Ⅱ方案编码。
还知道能在一个或多个频率副带内适应性地从类型Ⅰ至类型Ⅱ往返地改变操作模式。这类布置是1997年7月16日MarkFranklin Davis提交的名为“在低位率下将多音频声道编码和解码的方法和设备”的美国专利申请号S.N.08/895,496的主题。因为类型Ⅱ方案比类型Ⅰ方案要求较少位数,通过采用类型Ⅱ编码和解码可以克服短时间内位数不够的困难。
本发明涉及类型Ⅱ编码,它的编码器和解码器,以及可以有利地采用这类解码器的环境。具体地,本发明旨在提出所述5,583,962,5,632,005和5,633,981专利中没有公开过的类型Ⅱ编码器,解码器以及解码器环境的新的方面。虽然此处公开的具体实施例涉及一个简化的类型Ⅱ版本,其中编码器和解码器优选地是专用类型Ⅱ设备及采用单方向向量,作为本发明主题的类型Ⅱ编码改进的一定方面可以应用于类型Ⅱ系统的更复杂的形式中,包括所述'962,'005和'981专利中描述的适应性布置,及应用于适应性类型Ⅰ/类型Ⅱ系统中,例如在所述共同未决Davis申请中所描述的。在类型Ⅱ编码器的简化的单方向向量版本中,根据通过方向向量进行编码的空间特性来看,可以称为“空间编码器”。在这整个文件中,所述'962,'005和'981专利的类型Ⅱ编码的单向量版本称为“空间编码”。
本发明人认为,即使声音来自各个方向而且它们在重要频带中的频率各不相同,但在足够短的时间间隔内例如几个毫秒的数量级内,人类耳朵只能听见来自重要频带内单方向的声音。因此,对于其中方向向量能够在足够短的时间间隔内改变的系统,埋嵌于空间编码器内的类型Ⅱ系统的基本、单方向向量形式适合于表现声域,即使它无法连续地和同时地重现所有声道的多样性。此效应概念性地阐述于

图1中;收听者101感收来自扬声器102和104之间的位置111处的副带内的声音,即使副带内的声音实际上来自所有扬声器102至110时亦是如此。
此“单方向”效应与众所周知的“相加局部化”效应具有某些表面相似性。按照后一效应,如Blauert(Jens Blauert所著的“空间听觉人类声音局部化的心理物理学”,The MIT Press,Cambridge,Massachusetts,revised edition,1997)所描述的,两个或多个在一定时间内发出一定幅值的彼此相干信号的声音源产生单个幻觉信号的感受。具体地参阅Blauert论文的204、271和272页。按照Blauert,当一对最初相干的信号愈来愈不相干时,收听者愈来愈能检测不同的声音。具体地参阅Blauert论文的240和242页。然而,根据本发明者的单方向效应,当多个信号之间频率差别缩小至一个重要频带内以及当时间间隔足够短时,收听者感受它们作为来自不同方向的信号的能力也就消失。
本发明者知道在时间间隔的短暂性与附加位率要求(由于更高采样率)之间存在折衷,当时间间隔缩短时可能要求附加位率(见以下18与19页的讨论)。因此,对于其中采样率低于单方向效应的最优值的极低位率系统,在某些信号条件下可能损失一些多方向多信号收听者的感受和声音定位的准确度。然而所得重现结果很可能提供一个悦耳和可接受的多方向收听效果。本发明特别适用于其中位率受到严格限制的传输或记录系统,例如通过因特网的音频信号。
本发明的一个方面基于以下了解当空间编码用于一个其中一个或多个收听者预测性地位于预定收听区内的声音重现布置中时,此处所感受的空间编码缺点主要是“信号躲闪”效应,事实上是优点。本发明特别适用于以下收听环境其中一个或者可能两个收听者预测性地位于可能称为“空间编码有利位置”中,这将在下面结合图2、3和4加以解释。在例如空间编码有利位置这样一个收听区内产生一个非人为声域的空间编码能力是一个预料不到的结果。在空间编码有利位置处一个或多个收听者在心理声学上感受不到信号躲闪效应。可以获得一个稳定而正常的声域。
图2显示一个位于可预测收听区内的收听者202,在五个扬声器-左(206)、中心(208)、右(210)、左环绕(212)和右环绕(214)中的理想的基本上圆形的空间编码有利位置204,一个典型“环绕声”回放布置。
在个人计算机(“多媒体”)声响系统中,通常只采用两个扬声器,即其位置邻近于或靠近于计算机监视器的左和右扬声器(可选地,可以在例如地板上远程地放置一个亚低音扬声器,在本讨论中将忽略该亚低音扬声器)。这两个扬声器建立一个相对小的最佳收听区。图3显示一个位于可预测收听区内的收听者302和一个理想的空间编码有利位置304,在计算机监视器306之前有两个扬声器-左(308)和右(310)各在其两侧。更完备的计算机音响系统可能以图2布置的方式采用两个以上的扬声器(计算机监视器位于中心扬声器的位置上,在左和右扬声器之间)。
某些电视机可以建立类似的小最佳收听区,其中一对扬声器位于屏幕的各一侧。图4显示一个位于可预测收听区内的收听者402和一个理想的空间编码有利位置404,在电视机406之前有两个邻近于其显象管412的内装扬声器-左(408)和右(410)。更完备的计算机音响系统可能以图2布置的方式采用两个以上的扬声器。例如,电视机可能具有组合入其柜中的左、中心和右扬声器,或者这些扬声器可能与环绕扬声器一样位于电视机柜的外部。
Dolby AC-3系统和许多其他系统并不全部利用计算机或电视音响系统之前的收听者的可预测位置,从而浪费这类环境中的位数。虽然空间编码对例如图1、2和3中所示环境特别有用,但空间编码也用于较大环境中,应该理解,当扬声器之间的空间增加时,可预测收听区的规模也增加。当只在简短的位数短缺时间间隔内使用时,空间编码也可用于较大环境,即使收听者位于可预测收听区之外时也可以。
在采用空间编码器的简化环绕音响系统中(即只采用单方向向量的类型Ⅱ系统),只需发送足够信息以便满足可预测收听区或空间编码有利位置内的收听者。不必如AC-3系统中那样,为重新建立例如所有五个声道使之成为五个输入声道的正确复制内容而尝试提供所有所需信息。其结果是能够显著地减少位数。空间编码器并不将任何瞬间内在可预测收听区内听不到的任何内容编码,因此它非常有效。此简化系统甚至可能用于例如两个位于可预测收听区内的彼此靠近的收听者。
此简化处理的“信号躲闪”副作用是,如果收听者移出可预测收听区之外并且将耳朵放在任何具体扬声器上,当程序内容改变时,声音会时现时隐-即信号躲闪效应(来自具体扬声器的信号可能“躲闪”或由来自其他声道的信号所调制)。该效应正是单簧管手所早就知道的;当每次长号手吹奏时他们对听众的平静吹奏就消失,而当平静下来时该吹奏又奇迹般地出现。虽然这一副作用在大的商业性剧院中或房间内坐满收听者的家庭影院内(而不是如图3中所示相对小的空间编码有利位置内)是不能容忍的,该效应对于可预测收听区内的一个或两个收听者来说是善意的和听不出的。然而,如上所述,空间编码也可用于大的商业性剧院和收听者坐满房间的家庭影院中,但只是在简短时间间隔内及例如极端缺少位数的情况下。
空间编码的信号躲闪副作用在可预测收听区内听不到这一事实允许将编码器的位数要求限制在为在该区域内生成一个悦耳收听印象所绝对需要的位数。当不试图提供“带增益的直线”结果时,可以在空间编码有利位置中感受到一个好的可享受的将人工效果局部化至最小的效应。
为增强双扬声器计算机或电视机声音重现布置的环绕声效应,采用一个具有声音交叉(或交叉馈送)消除器的“空间化器”来使解码的空间编码器信号“空间化”是有利的。当通过常规手段在两个扬声器上表现时,立体声内容一般产生的声音局限于扬声器本身和它们之间的空间。这是由于来自每个扬声器的声音信号对位于计算机监视器之前的收听者的远端耳朵的交叉馈送效果所造成的。通过将环绕声道信号施加于声音交叉消除器及将处理的信号与主要左和右信号相加,有可能产生一种感受,好像环绕声信息来自位于收听者身后或一侧的虚拟扬声器,事实上只采用了两个向前放置的扬声器(左和右的声道信号来自实际的正常扬声器位置)。
声音交叉消除器的起源一般归功于贝尔电话实验室的B.S.Atal和Manfred Schroeder(见例如美国专利3,236,949,它在此处整个地引为参考)。如最初由Schroeder和Atal所描述的,可以通过引进来自对面的扬声器的合适的消除信号而减轻声音交叉效应。由于消除信号本身也具有声音交叉效果,它也必须用来自原始发送的扬声器的合适信号加以消除,等等。
图5A是用于显示一个具有本发明的声音交叉消除网络的空间化器的一个类型的功能框图。接收五个音频输入信号,左、右、中心、环绕左和环绕右,如同Dolby数字AC-3系统。这些输入分别施加于可选的DC阻塞滤波器502、504、506、508和510。左侧、中心和右侧输入线中的可选的延迟器512、514和516具有与交叉消除网络520中存在的任何时间延迟相当的时间延迟。除非网络556包括例如幅值压缩器/限幅器,通常在网络520中没有时间延迟和可以忽略延迟器512、514和516。在此例中,消除网络520的输入量是左环绕和右环绕输入量。与图5C的实施例一起描述消除网络520的简化实施例。再参照图5A,第一线性附加相加器522接收延迟的左声道音频流。第二线性附加相加器524接收延迟的右声道音频流。延迟的中心声道音频流施加于相加器522和相加器524。来自网络520的处理的左环绕声道音频流也施加于相加器522。来自网络520的处理的右环绕声道音频流也施加于相加器524。只有左和右环绕声道音频流由消除网络处理。左和右前声道分别加至消除网络处理过的左和右环绕声道。中心声道同相地加至左和右输出量而无任何附加处理。
当存在四个输入信号(左、中心和右声道,单个环绕声道)时,例如由Dolby Surround或Dolby Surround Pro Logic解码器提供的信号时,图5A的布置也可使用。在此情况下,单个环绕声道应该解偶为两个伪立体声信号,然后将它们施加于消除器的输入端。简单的伪立体声转换可以应用移相技术,就是使一个信号的相位与另一个信号的相位不同。技术中知道许多其他伪立体声转换技术。
图5B显示图5A中空间化器的附加选代项。在图5B中,左和右前声道由块526中的部分地反相混合来稍为加宽。用反相混合来加宽表面立体声“舞台”是众所周知的技术。作为另一个选项,可以消除中心声道以便使每个耳朵两次听到的中心信号(一次来自近的扬声器而又一次来自远的扬声器)所造成的细微变化减至最小。可以将中心声道声音交叉信号施加于环绕声道交叉消除网络而消除它们,而并不要求单独地实施消除器。因此,中心声道信号分别通过线性附加相加器526和528混合入左环绕和右环绕输入中,送至交叉消除网络520。
图5C是用于显示图5A或图5B的布置中可用的简单声音交叉消除器的基本元件的功能框图。可以采用其他更为复杂的消除器。对于相对于收听者+/-15度角向前放置的扬声器而言,每个延迟器530和532通常约为140微秒,该15度角是图1的计算机监视器环境和图2的电视机环境的典型角度。滤波器534和536中的每一个是简单的与频率无关的衰减系数K,它通常约为0.9。每个交叉馈送分支538和540的输入量在交叉声道负反馈布置中(每个分支在相应的相加器处相减)取自附加相加器(分别是542和544)的输出端,以便如上所述地生成对每个先前消除器信号的消除器。这是可以数字地实现的非常简单的声音交叉消除器两次相加,两次相乘及用于延迟的一对6个样本环形缓存。如果使用,最好使用软件数字地实施声音交叉消除器,并且在具有图3中所示监视器306的个人计算机上或图4中所示电视机406中的微处理器上实时运行该软件。
根据本发明,编码器产生一个表现待重现的声域的组合音频信息信号和一个方向向量或“操纵控制信号”。组合音频信息信号具有其自己的频谱,该频谱拆分为若干副带,它们最好相当于人类耳朵的重要频带。操纵控制信号具有一个与每个副带中声域的主要方向相关的分量。
虽然本发明可以使用模拟或数字技术或甚至这些技术的混合来实施,但本发明可以更方便地使用数字技术来实施,及此处公开的优选实施例是数字实施。
在本发明的一个实施例中,一个编码器接收多条音频流,其中每一条用于表现一个输入声道以及这些输入声道中的每一个的局部化特性。解码器接收一个编码信号以及每个输出声道的声音传感器的位置或虚拟位置,并且为每个输出声道提供一条信号流以便尽可能准确地重现由输入声道信号表现的声域。因为本发明的空间编码方案基于以下约定任何瞬间只听见来自单方向的声音,任何瞬间内解码器不必施加一个信号至多于两个声音传感器。编码信息包括每个副带的所有输入声道的聚集表现。该聚集表现包括一个用于表现净总声域音平的组合音频信息信号及一个包括该声域的局部化信息的操纵控制信号。此处将此局部化信息称为净方向向量。
在解码器中也有以下情况只有一个方向得到位数,因此每个时间间隔内在每个重要频带内只有一个或两个表现声道得到位数(当声域方向成为与表现声道方向一致时,一个表现声道是合适的;否则需要两个表现声道用于将声域方向定位)。
本发明的一个方面是用于将多条表现声域的音频流编码为一个编码信号和用于将编码信号解码的低位率空间编码系统,该系统包括一个编码器和一个解码器。该编码器包括一个副带信号发生器,用于响应于多条音频流而生成多个副带信号,每个副带信号表现一条相应的音频流的相应频率副带,一个信号组合器,用于生成一个表现相应频率副带中副带信号的组合的组合信号,一个声域方向检测器,用于为组合信号生成一个用于标示相应副带内声域的主要方向的操纵控制信号,一个编码器和位分配器,用于通过向组合信号和操纵控制信号分配位数而生成编码信息,及一个格式化器,用于将编码信息组装成一个编码信号。
该解码器包括一个去格式化器,用于自编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于组合信号和操纵控制信号而获取副带信号,一个信息输入,用于描述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,其中存在三条或更多输出声道,及一个信号发生器,用于响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
本发明的另一个方面是用于将多条表现声域的音频流编码为一个编码信号,用于将编码信号解码和用于重现声域的听觉相似感受的低位率空间编码系统,该系统包括一个编码器和一个解码器。该编码器包括
一个副带信号发生器,用于响应于多条音频流而生成多个副带信号,每个副带信号表现一条相应的音频流的相应频率副带,一个信号组合器,用于生成一个表现每个频率副带中副带信号的组合的组合信号,一个声域方向检测器,用于为组合信号生成一个用于标示每个副带内声域的主要方向的操纵控制信号,一个编码器和位分配器,用于通过向组合信号和操纵控制信号分配位而生成编码信息,及一个格式化器,用于将编码信息组装成一个编码信号。
该解码器包括一个去格式化器,用于自编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于组合信号和操纵控制信号而获取副带信号,一个信息输入,用于描述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,及一个信号发生器,用于响应于副带信号和重现信息而在一条或更多输出声道中生成一条音频流。
该系统还包括多个声音传感器,连至解码器的输出声道并且布置为对于空间编码有利位置收听区内的一个或多个收听者生成声域的听觉相似感受。
本发明的又一个方面是用于低位率空间编码系统中的解码器,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码,每个副带信号表现一条相应的音频流的相应频率副带,该解码器生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号。该解码器包括一个去格式化器,用于自编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于组合信号和操纵控制信号而获取副带信号,一个信息输入,用于描述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,其中存在三条或更多输出声道,及一个信号发生器,用于响应于副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
本发明还有一个方面是用于低位率空间编码系统中的解码器和重现系统,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码和重现,每个副带信号表现一条相应的音频流的相应频率副带,该解码器和重现系统生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号。该解码器和重现系统包括一个去格式化器,用于自编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于组合信号和操纵控制信号而获取副带信号,一个信息输入,用于描述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,及一个信号发生器,用于响应于副带信号和重现信息而在一条或更多输出声道中生成一条音频流,及多个声音传感器,连至解码器的输出声道并且布置为对于空间编码有利位置收听区内的一个或多个收听者生成声域的听觉相似感受。
本发明的不同特征及其优选实施例在以下“实现本发明的最好模式”及其附图中更详细地说明。
图1是一个概念图,用于阐述一个人收听由多条表现声道产生的声域,但他感受到声音犹如来自一个点。
图2是一个收听者位于五个扬声器“环绕声”重现布置中的理想空间编码有利位置上的平面示意图。
图3是一个收听者位于具有两侧扬声器的计算机监视器之前的理想空间编码有利位置上的平面示意图。
图4是一个收听者位于具有邻近于其显象管的扬声器的电视机之前的理想空间编码有利位置上的平面示意图。
图5A是一个采用声音交叉消除器的空间化器的功能框图。
图5B是一个采用声音交叉消除器的修改的空间化器的功能框图。
图5C是一个根据现有技术的简单四端口声音交叉消除器的的功能框图。
图6是用于显示空间编码和解码的概念框图。
图7是用于阐述副带编码器的基本结构的功能框图。
图8是用于阐述副带解码器的基本结构的功能框图。
图9是本发明涉及副带编码的基本结构的功能框图。
图10是本发明涉及副带解码的基本结构的功能框图。
图11是具有五个表现声道的三维内的重现系统的假设性图形表现。
图12A是与一个可预测回放环境一起运行的空间解码器的原理功能框图。
图12B是与另一个可预测回放环境一起运行的空间解码器的原理功能框图。
图6是类型Ⅱ编码系统的一个实施例的概念阐述。一个包括过程604和606的编码器从来自副带编码器(见图7)的多条输入声道602接收表现一个声域的副带信号,同时从路径603接收关于如何将声域映射至这些输入声道中的每一条的信息。过程604将信号组合成一个沿路径608通过的组合信息信号。过程606建立一个用于表现沿路径610通过的声域的表面方向的操纵控制信号。包括过程612的解码器从路径613接收关于输出声道数量及关于表现系统中输出声道声音传感器的实际或虚拟空间配置的信息,从路径608和610接收一个组合声道信号,以及沿输出声道614生成输出信号以供表现声域之用。
在空间编码器的实际应用中,送至编码器的信息是表现输入声道的信号流的组合。编码器与所需重现声域有关;因此,它必须接收关于如何尝试将这些输入声道与该声域相连系的信息。例如,在通常标准化扬声器位置的具有左、中心、右、左环绕和右环绕重现的五声道源的情况下,可从五个准备施加于这些扬声器位置的五声道信号中获取净方向向量。
一个接收关于回放或表现环境的信息的空间编码解码器能够使用净方向向量以便产生一组信号,用于所准备的五声道回放或表现或者用于其他使用不同数量声道和/或扬声器位置的回放或表现环境。例如,可以为两个扬声器计算机监视器环境将组合音频信息信号和净方向向量解码。如上所述,解码可能包括一个“空间化器”以使所得的表现能提供一个声域的心理声学效应而不限于两个扬声器和它们之间的空间。
本发明不限于任何用于生成多条输入声道的具体方案,也不限于任何用于扑获或重新建立声域的具体方案。本发明在编码器处接收任何组的多条声道信息作为输入,这些输入声道具有定义输入声道的产生者准备如何产生一个声域所需信息,例如它们准备具有的相对于收听者的方向。编码器将这些信息和这些声音声道翻译成一个组合音频信息信号和一个净方向向量操纵控制信号,以使解码器能够提供一组表现声道作为输出,它们产生与表现设备和环境的回放能力相当的可能最好的声域。由解码器产生的声道数量由表现系统的特性所决定,因此不必要等于输入声道的数量。
本发明应用于由任何许多已知技术所实施的副带编码器。一个优选实施例使用一个转换,更具体的是根据时域混叠消除(TDAC)技术的时域至频域的转换。见Princen和Bradley的“基于时域混叠消除的分析/综合滤波器组设计”(IEEE Trans.onAcoust.,Speech,Signal Proc.,vol.ASSP-34,1986,pp.1153-1161)。一个利用TDAC转换的转换编码器/解码器系统的例子提供于美国专利5,109,417中,它在此处整个引为参考。
如图7中所示,典型单声道副带编码包括由滤波器组710将一条输入信号流810拆分为各副带,由编码器730将这些副带信息转换为量化代码字,以及由格式化器740将这些量化代码字组合为适合于传输或存储的形式。如果滤波器组由数字滤波器或离散转换所实施,则在滤波器组滤波之前由采样器700将输入信号采样和数字化。如果滤波器组由模拟滤波器实施,则可以由采样器720将副带信号采样和数字化以便由编码器730进行数字编码。在一方面,本发明涉及用于多个信息声道的编码器730。例如,图6中每个输入602组成施加于编码器730的副带信息。
如图8中所示,典型单声道数字副带解码包括由去格式化器810将格式化代码字分拆,由解码器820将副带信息恢复,以及由逆滤波器组840将副带信息合并为一个单声道信号。如果逆滤波器组由模拟滤波器实施及信号是数字地编码的,则在逆滤波器组滤波之前由转换器830将副带信息转换为模拟形式。如果逆滤波器组由数字滤波器或离散转换所实施,则由转换器850将数字信号转换为模拟形式。在另一方面,本发明涉及用于多信息声道的解码器820。
副带操纵将来自一条或多条声道的副带频谱分量组合为一个组合信号。副带的组合表现被传输或记录以替代由组合声道副带所表现的个别声道副带频谱分量。有两个相应的方法用于形成组合声道。可以使用任何一个方法来得到相同结果。一个方案是首先对每条声道应用带内屏蔽准则以便通过消除屏蔽的信号分量的编码来减少每条声道所需位数,以及然后合并那些位数减少声道以建立一个组合信号。将在下面更详细地描述的另一个方案是首先合并原始声道信号以便建立组合信号,以及然后对该组合信号应用带内屏蔽准则以便通过消除屏蔽信号分量的编码来减少位数。可认为这两个情况下所得组合信号是相同或基本相同的。在任何一种情况下,空间编码器采用两种类型的屏蔽-所得组合信号中的交叉声道屏蔽和带内屏蔽。因此,本发明准备用于覆盖两个用于形成组合信号的使用方法中的任何一个。
操纵控制信号(或净方向向量)表现从各条声道来的频谱分量的表面主要方向。
根据本发明用于数字编码技术的原理,用于表现频谱分量的数字值可量化为代码字,其中来自位存储区的可变数量的位数可以适应性地分配给至少某些代码字。位数分配基于以下判断由于现有信号内容,某些副带内的量化误差是否会比其他副带内的量化误差更为严重地降低表面质量。更具体地,对于其量化误差比其他副带内的量化误差较少受到心理声学屏蔽的副带内的频谱分量,将赋予更多位数。
根据本发明对于解码的原理,逆操纵使用操纵控制信号来从组合通道中恢复操纵的声道的表现。因为根据本发明的空间编码使用单方向向量及考虑到任何瞬间收听者只从一个方向内听见声音的基本原理,只需生成一条或两条声道以供具体表现系统的表现之用。解码器的声道数量由表现系统的特性所决定,因此它不必等于输入声道的数量。
再者,根据本发明关于数字解码技术的原理,完成一个基本上类似于编码期间所使用的适应性位分配过程以便建立赋予每个量化的代码字的位数。此信息用于重新构造副带频谱分量。
图9是空间编码编码器(即简化的单向量类型Ⅱ编码器)的原理功能框图。编码器可以使用不同模拟和数字编码技术实施。可以使用数字技术更方便地实施本发明及此处公开的实施例是数字地实施的。
数字实施可以采用适应性位分配技术。以下优选实施例的描述说明适应性位分配和副带操纵概念两者,然而应该理解,可以使用空间编码的数字实施而位分配方案可以不是适应性的。
参照图9,输入路径901上多条输入声道1至N中的每一条的副带信号分量由一个表面方向和组合信号发生器902处理以便建立一个表面方向操纵控制信号和一个组合信号。该过程还接收源信息,用于标示源声域如何映射至每条输入声道(用于描述每条声道的信号准备用的空间方向的信息)。源和重现信息可以是不同的,即永久或可编程。编码器可以包括涉及源和/或回放环境的永久指令或者可以通过如图9中所示输入路径自编码器外部提供这类指令。自副带输入信号和源信息中获取表现源声域的组合音频信息信号。自副带输入信号和源信息中获取包括声域的局部化信息在内的具有单方向向量形式的操纵控制信号。
自块902输出的组合信号也施加于粗音平量化器904,它用于量化单个组合声道的副带频谱信息。适应性位分配器908响应于自粗音平量化器904接收的粗量化信息和自位存储区910接收的位置的可用位数而分配若干位数给不同副带。量化器912响应于组合信号、粗音平量化器的输出和适应性位分配器的输出而适应性地量化组合信号频谱信息为量化代码字。虽然下面描述一个合适的算法,但编码器用于适应性地分配位数的算法对于本发明并不重要。量化器912还量化操纵控制信号。量化器912分别沿路径914-918提供操纵信息、量化代码字和粗量化信息作为输出。
图10是一个空间编码解码器的原理功能框图。适应性位分配计算器1002响应于自编码器输出端918接收的粗量化信息和自位存储区1004接收的可用分配位数而在量化期间确定分配给每个代码字的位数;去量化器1006将自编码器输出端914接收的操纵控制信号去量化及响应于自编码器输出端916接收的量化代码字、自编码器输出端918接收的粗量化信息和自适应性位分配计算器1002接收的位分配信息而恢复频谱分量信息,以及在路径1008上在其输出端处提供单方向向量信息,在线路1010上提供组合声道副带成分,以及在路径1012上提供组合声道频谱分量。这些输出都施加于一个逆表面方向和组合信号发生器1014,后者也接收用于描述所希望输出声道数量和连至输出声道的传感器(例如扬声器)的位置或虚拟位置的信息。重现信息可以是永久的或可编程的。解码器可以包括关于回放环境的永久指令或者可以如图10中所示地通过一条输入路径自解码器外部提供这类指令。发生器1014响应于在路径1008-1012上接收的操纵和组合频谱信息而重新构造副带,以及在接收到一组副带信号和方向向量的每个时间间隔内为一条或两条副带频谱信息的声道提供一组完全的副带组,其中每条声道表现为标以Ch 1,…,Ch N的路径1016的一部分。在该时间间隔内只为每个副带启动一条或两条声道就已足够用于自每个副带内的单个方向中重现声音。换言之,相对于任何具体副带而言,在每个时间间隔内只有一条或两条声道在工作。
以下说明中更详细地描述本发明的优选实施例中关于编码和解码的部分。在整个讨论中提出本发明的选代实施例和结构。
再参照图9,它阐述一个类型Ⅱ副带编码器,可以看出,表面方向和组合信号发生器902沿路径901接收副带信息的多条声道。如果副带块是由离散转换例如离散傅里叶转换(DFT)获取的,则每个副带将要包含一个或多个离散转换系数。一个20kHz带宽信号的具体副带布置利用512点转换和48kHz的输入信号采样率。这些副带一般相当于耳朵的重要频带。可以在不背离本发明范围的情况下利用其他副带组合、采样率和转换长度。
如上所述,认为在足够短的时间间隔内单方向效应起作用。在48kHz采样率和512点转换的情况下,每个转换块具有大约为10毫秒的时间间隔(在TDAC转换的情况下,考虑到TDAC过程中固有的块至块平均值,这只是一个近似值)。因此,大约每隔10毫秒生成一组连续的组合副带信号。每个组合块可以具有与它相关连的单方向向量,或者选代地,可以在通常大于或小于块周期的规律基础上生成方向向量。另一个选代例子是只当主要方向内的偏移大于一个阈值(例如大于30度)时,才在一个块周期内生成一个或多个附加方向向量。本发明人发现基于TDAC转换的系统的块长度约为10毫秒以及在每个块周期内单方向向量提供一个愉快的音乐重现效果。
表面方向和组合信号发生器过程将来自多条声道的频谱分量加以合并而形成一个组合单声道副带,从而减少必须量化和传输的频谱分量的数量。一个用于表达关于一个时间间隔内的声域表面方向(单方向)的信息的操纵控制信号与编码组合声道频谱分量一起传输,以便允许进行接收的去量化器将一条或两条声道的频谱分量恢复,这些声道对于单方向重现是足够的。应该知道,一般而言,从组合声道和单方向控制信号中恢复的频谱分量并不等同于接收机从离散声道或从组合声道和每条声道的比例系数中解码所得频谱分量(如在类型Ⅰ系统中)。
通过将组合声道副带和辅助单方向向量编码而不是将离散声道的副带或组合声道副带和声道比例系数编码(如类型Ⅰ系统中那样),所节省的位数用于适应性位分配过程中以便例如分配给其他副带以及用于量化器中以便将操纵控制信号量化。
将一条或多条声道中副带的频谱分量合并。根据所述专利5,583,962、5,632,005和5,633,981,一个优选方法将组合副带的每个频谱分量设置为等于操纵的声道内相应频谱分量的平均值,以及选代的方法可能在操纵的声道内形成频谱分量值的其他线性组合或加权和。
操纵控制信号用于表现组合声道内副带分量的主(主要)空间方向。根据作为本发明主题的类型Ⅱ系统的简化版本,在每个时间间隔内,一个基本方法构造单个向量,用于只表现组合信号中每个副带的主或主要空间方向。
可以参照图11更好地理解此基本方法的概念,图11阐述一个包括五个表现声道的假设性重现系统。这些表现声道中对应于一条输入声道的每一条表现声道表现一个位于单位球表面上的扬声器。准备收听的人位于球的中心。声道中之一标以RF。对声道RF的收听者的表面方向由单位向量 表现。
根据此基本编码方法,操纵控制信号向量 表现组合信号副带j的声域主(主要)方向。虽然笛卡尔坐标系统是用于表示方向的优选表示,但其他表示例如极坐标也可使用而不背离本发明的实质。每条声道的方向向量由音平来加权。操纵控制信号可以表现为V→j=Σi=1sLIi,j·DI→i=LI→j·DI----(3)]]>其中 =声道i的方向单位向量,LIij=声道i内副带j的计算音平,S=输入声道的总数量, =副带j的操纵控制信号向量, =所有输入声道的方向单位向量,及 =所有输入声道中副带j的计算音平。
在所述5,583,962、5,632,005和5,633,981专利中阐述了本发明可用的类型Ⅱ编码器的进一步细节。
在图10中所示空间编码解码器中,逆表面方向和组合信号发生器1014响应于操纵控制信号、粗量化音平和分别自路径1008至1012接收的频谱分量值来重新构造组合声道的单方向表现。
如上所述,类型Ⅱ编码发明采用操纵控制信号的方向向量形式。为逼近编码信号的方向,该重新构造过程必须考虑装于解码位置的扬声器的数量和位置。每个表现声道i的方向向量 作为重现信息而提供输入至逆表面方向和组合信号发生器1014。重新构造过程优选地为一条或两条表现声道生成频谱分量,它们对于获取具有由操纵控制信号表现的组合信号副带的空间定向的声域是足够的。
通过应用等式1于表现系统,操纵控制信号可以表现如下V→j=Σi=1sLOi,j·DO→i=LO→j·DO→---(4)]]>其中 =表现声道i的方向单位向量,LOi,j=声道i内副带j的计算音平,S=表现声道的总数量, =副带j的操纵控制信号向量, =所有表现声道的方向单位向量,及 =所有表现声道中副带j的计算音平。
对于计算音平LO所加一个附加约束是由表现系统产生的声域响度应该等于原始声域响度。更具体地,对每个 向量施加一个约束以使表现系统所产生的每个副带的声域的响度或总音平等于原始声域中副带音平。
在所述专利5,583,962、5,632,005和5,633,981中阐述了本发明可用的类型Ⅱ解码器的进一步细节。
图12A是与可预测回放环境一起操作的空间解码器的原理功能框图。操纵信息、量化代码字和粗量化信息分别沿输入路径1202、1204和1206施加于空间解码器1208。输入信号可以由不同传输或存储技术中的任何一项传送给空间解码器,包括例如有线或无线传输,磁媒体和光媒体。如上所述,根据类型Ⅱ系统的单向量版本将输入信号编码。解码器1208提供四或五个输出信号,它们可用于采用声音交叉消除器的可选空间化器1210。空间化器1210的具体实施并不重要;其合适的布置结合图5A、5B和5C加以描述。如果采用了一个空间化器,则空间化器1210的输出施加于左和右扬声器1212和1214(通过合适的放大和连接装置,未示出),否则解码器1208的输出通过合适的放大和连接装置(未示出)施加于扬声器。例如图3或图4那样定位的这些扬声器产生一个椭圆形空间编码有利位置1216(理想地示出),其中坐着一个收听者1217。如果使用空间化器,则空间化器1210在需要时可能形成解码器1208的一个整体部分。
图12B是与另一个可预测回放环境一起操作的空间解码器的原理功能框图。如图12A布置中的操纵信息、量化代码字和粗量化信息分别沿输入路径1202、1204和1206施加于空间解码器1208。图12B布置的不同处在于回放环境是一个标准五扬声器环绕声布置。在此情况下,不需要任何空间化器。来自空间解码器1208的输出施加于五个扬声器-左(1218)、中心(1220)、右(1222)、左环绕(1224)和右环绕(1226),它们产生一个圆形空间编码有利位置1228(理想地示出),其中坐着一个收听者1230。
应该理解,熟悉技术的人了解本发明的其他变动和修改及其不同方面,以及本发明不限制于所描述的这些具体实施例。因此可以设想,本发明覆盖此处所公开的和所权利要求的基本基础原理的实质和范围内所包括的任何和全部修改、变动或其等效内容。
权利要求
1.一种低位率空间编码系统,用于将多条表现声域的音频流编码为一个编码信号和用于将所述编码信号解码,所述系统包括一个编码器和一个解码器,所述编码器包括用于响应于所述多条音频流而生成多个副带信号的装置,每个副带信号表现一个相应的所述音频流的相应频率副带,用于生成一个表现相应频率副带中副带信号的组合的组合信号的装置,用于为所述组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号的装置,用于通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息的装置,及用于将所述编码信息组装成一个编码信号的装置,及所述解码器包括用于自所述编码信号中获取组合信号和操纵控制信号的装置,用于响应于所述组合信号和所述操纵控制信号而获取副带信号的装置,用于提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息的装置,其中存在三条或更多输出声道,及用于响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流的装置。
2.一种低位率空间编码系统,用于将多条表现声域的音频流编码为一个编码信号,用于将所述编码信号解码和用于重现所述声域的听觉相似感受,所述系统包括一个编码器和一个解码器,所述编码器包括用于响应于所述多条音频流而生成多个副带信号的装置,每个副带信号表现一条相应的所述音频流的相应频率副带,用于生成一个表现每个频率副带中副带信号的组合的组合信号的装置,用于为所述组合信号生成一个用于标示每个副带内所述声域的主要方向的操纵控制信号的装置,用于通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息的装置,及用于将所述编码信息组装成一个编码信号的装置,所述解码器包括用于自所述编码信号中获取组合信号和操纵控制信号的装置,用于响应于所述组合信号和所述操纵控制信号而获取副带信号的装置,用于提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息的装置,及用于响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流的装置,以及还包括多个声音传感器,连至所述解码器的输出声道并且布置为对空间编码有利位置收听区内的一个或多个收听者生成声域的听觉相似感受。
3.根据权利要求2的低位率空间编码系统,其中存在三条或更多声道,及所述用于响应于所述副带信号和重现信息而在更多输出声道中的一条声道内生成一条音频流的装置在任何瞬间在不多于两条输出声道中生成一条音频流。
4.根据权利要求1或权利要求2的低位率空间编码系统,还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,该空间化器提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
5.根据权利要求1或权利要求2的低位率空间编码系统,其中所述操纵控制信号包括每个副带的一个方向向量。
6.根据权利要求1或权利要求2的低位率空间编码系统,其中所述相应频率副带具有一个相当于人类听觉系统的相应重要频带的带宽。
7.根据权利要求1或权利要求2的低位率空间编码系统,其中根据心理声学原理分配所述位数。
8.根据权利要求2的低位率空间编码系统,其中所述解码器还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受提供一个广大舞台或环绕声声域的感受。
9.一种用于低位率空间编码系统中的解码器,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码器生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号,所述解码器包括用于自所述编码信号中获取组合信号和操纵控制信号的装置,用于响应于所述组合信号和所述操纵控制信号而获取副带信号的装置,用于提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息的装置,其中存在三条或更多输出声道,及用于响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流的装置。
10.一种用于低位率空间编码系统中的解码器和重现系统,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码和重现,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码器和重现系统生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号。所述解码器和重现系统包括用于自所述编码信号中获取组合信号和操纵控制信号的装置,用于响应于所述组合信号和所述操纵控制信号而获取副带信号的装置,用于提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息的装置,及用于响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流的装置,及多个声音传感器,连至所述解码器的输出声道并且布置为对空间编码有利位置收听区内的一个或多个收听者生成所述声域的听觉相似感受。
11.权利要求10的组合,其中存在三条或更多输出声道,及所述用于响应于所述副带信号和重现信息而在更多输出声道中的一条中生成一条音频流的装置在任何瞬间在不多于两条输出声道内生成一条音频流。
12.根据权利要求9或权利要求10的组合还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,该空间化器提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
13.根据权利要求9或权利要求10的组合,其中所述操纵控制信号包括每个副带的一个方向向量。
14.根据权利要求9或权利要求10的组合,其中所述相应频率副带具有一个相当于人类听觉系统的相应重要频带的带宽。
15.根据权利要求9或权利要求10的组合,其中根据心理声学原理分配所述位数。
16.根据权利要求10的组合,其中所述解码器还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受能提供一个广大舞台或环绕声声域的感受。
17.一种低位率空间编码系统,用于将多条表现声域的音频流编码为一个编码信号和用于将所述编码信号解码,所述系统包括一个编码器和一个解码器,所述编码器包括一个副带信号发生器,用于响应于所述多条音频流而生成多个副带信号,每个副带信号表现一条相应的所述音频流的相应频率副带,一个信号组合器,用于生成一个表现相应频率副带中副带信号的组合的组合信号,一个声域方向检测器,用于为所述组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,一个编码器和位分配器,用于通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息,及一个格式化器,用于将所述编码信息组装成一个编码信号,及所述解码器包括一个去格式化器,用于自所述编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于所述组合信号和所述操纵控制信号而获取副带信号,一个信息输入,用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,其中存在三条或更多输出声道,及一个信号发生器,用于响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
18.一种低位率空间编码系统,用于将多条表现声域的音频流编码为一个编码信号,用于将所述编码信号解码和用于重现所述声域的听觉相似感受,所述系统包括一个编码器和一个解码器,所述编码器包括一个副带信号发生器,用于响应于所述多条音频流而生成多个副带信号,每个副带信号表现一条相应的所述音频流的相应频率副带,一个信号组合器,用于生成一个表现每个频率副带中副带信号的组合的组合信号,一个声域方向检测器,用于为所述组合信号生成一个用于标示每个副带内所述声域的主要方向的操纵控制信号,一个编码器和位分配器,用于通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息,及一个格式化器,用于将所述编码信息组装成一个编码信号,所述解码器包括一个去格式化器,用于自所述编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于所述组合信号和所述操纵控制信号而获取副带信号,一个信息输入,用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,及一个信号发生器,用于响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流。及还包括多个声音传感器,连至所述解码器的输出声道并且布置为对空间编码有利位置收听区内的一个或多个收听者生成所述声域的听觉相似感受。
19.根据权利要求18的低位率空间编码系统,其中存在三条或更多输出声道及所述信号发生器在任何瞬间在不多于两条输出声道内生成一条音频流。
20.根据权利要求17或权利要求18的低位率空间编码系统还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,该空间化器提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
21.根据权利要求17或权利要求18的低位率空间编码系统,其中所述操纵控制信号包括每个副带的一个方向向量。
22.根据权利要求17或权利要求18的低位率空间编码系统,其中所述相应频率副带具有相当于人类听觉系统的相应重要频带的带宽。
23.根据权利要求17或权利要求18的低位率空间编码系统,其中根据心理声学原理分配所述位数。
24.根据权利要求18的低位率空间编码系统,其中所述解码器还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受提供一个广大舞台或环绕声声域的感受。
25.一种用于低位率空间编码系统中的解码器,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码器生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号,所述解码器包括一个去格式化器,用于自所述编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于所述组合信号和所述操纵控制信号而获取副带信号,一个信息输入,用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,其中存在三条或更多输出声道,及一个信号发生器,用于响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
26.一种用于低位率空间编码系统中的解码器和重现系统,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码和重现,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码器和重现系统生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于表现相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号,所述解码器和重现系统包括一个去格式化器,用于自所述编码信号中获取组合信号和操纵控制信号,一个逆副带发生器,用于响应于所述组合信号和所述操纵控制信号而获取副带信号,一个信息输入,用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置,及一个信号发生器,用于响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流,及多个声音传感器,连至所述解码器的输出声道并且布置为对空间编码有利位置收听区内的一个或多个收听者生成所述声域的听觉相似感受。
27.权利要求26的组合,其中存在三条或更多输出声道,及所述发生器在任何瞬间在不多于两条输出声道内生成一条音频流。
28.权利要求25或权利要求26的组合还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,该空间化器提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
29.权利要求25或权利要求26的组合,其中所述操纵控制信号包括每个副带的一个方向向量。
30.权利要求25或权利要求26的组合,其中所述相应频率副带具有一个相当于人类听觉系统的重要频带的带宽。
31.权利要求25或权利要求26的组合,其中根据心理声学原理分配所述位数。
32.权利要求26的组合,其中所述解码器还包括一个空间化器,该空间化器包括一个用于在所述输出声道中处理音频流的声音交叉消除器,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受提供一个广大舞台或环绕声声域的感受。
33.一种低位率空间编码方法,用于将多条表现声域的音频流编码为一个编码信号和用于将所述编码信号解码,所述方法包括编码和解码,所述编码包括响应于所述多条音频流而生成多个副带信号,每个副带信号表现一条相应的所述音频流的相应频率副带,生成一个表现相应频率副带中副带信号的组合的组合信号,为所述组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息,及将所述编码信息组装成一个编码信号,及所述解码包括自所述编码信号中获取组合信号和操纵控制信号,响应于所述组合信号和所述操纵控制信号而获取副带信号,提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息,其中存在三条或更多输出声道,及响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
34.一种低位率空间编码方法,用于将多条表现声域的音频流编码为一个编码信号、用于将所述编码信号解码和用于重现所述声域的听觉相似感受,所述方法包括编码和解码,所述编码包括响应于所述多条音频流而生成多个副带信号,每个副带信号表现一条相应的所述音频流的相应频率副带,生成一个表现每个频率副带中副带信号的组合的组合信号,为所述组合信号生成一个用于标示每个副带内所述声域的主要方向的操纵控制信号,通过向所述组合信号和所述操纵控制信号分配位数而生成编码信息,及将所述编码信息组装成一个编码信号,所述解码包括自所述编码信号中获取组合信号和操纵控制信号,响应于所述组合信号和所述操纵控制信号而获取副带信号,提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息,及响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流,及还包括将所述输出声道连至多个声音传感器,所述多个声音传感器布置为对空间编码有利位置收听区内的一个或多个收听者生成所述声域的听觉相似感受。
35.根据权利要求34的低位率空间编码方法,其中存在三条或更多输出声道,及所述响应于所述副带信号和重现信息而在更多输出声道中的一条输出声道生成一条音频流的步骤在任何瞬间在不多于两条输出声道内生成一条音频流。
36.根据权利要求33或权利要求34的低位率空间编码方法还包括使用一个包括声音交叉消除器的空间化器在所述输出声道内处理音频流的步骤,所述处理步骤提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
37.根据权利要求33或权利要求34的低位率空间编码方法,其中所述操纵控制信号包括每个副带的一个方向向量。
38.根据权利要求33或权利要求34的低位率空间编码方法,其中所述相应频率副带具有一个相当于人类听觉系统的相应重要频带的带宽。
39.根据权利要求33或权利要求34的低位率空间编码方法,其中根据心理声学原理分配所述位数。
40.根据权利要求34的低位率空间编码方法,其中所述解码器还包括使用包括声音交叉消除器的空间化器在所述输出声道内处理音频流的步骤,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受提供一个广大舞台或环绕声声域的感受。
41.一种低位率空间编码解码方法,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码方法生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于标示相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号,所述解码方法包括自所述编码信号中获取组合信号和操纵控制信号,响应于所述组合信号和所述操纵控制信号而获取副带信号,提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息,其中存在三条或更多输出声道,及响应于所述副带信号和重现信息而在任何瞬间在不多于两条输出声道中生成一条音频流。
42.一种低位率空间编码解码和重现方法,通过响应于多条表现声域的音频流而生成多个副带信号而用于将从多条音频流中获取的一个编码信号解码和重现,每个副带信号表现一条相应的所述音频流的相应频率副带,所述解码和重现方法生成一个表现相应频率副带中副带信号的组合的组合信号,为组合信号生成一个用于表现相应副带内所述声域的主要方向的操纵控制信号,通过向组合信号和操纵控制信号分配位数而生成编码信息,及将编码信息组装成一个编码信号,所述解码和重现方法包括自所述编码信号中获取组合信号和操纵控制信号,响应于所述组合信号和所述操纵控制信号而获取副带信号,提供用于描述所述解码器的输出声道数量和连至相应输出声道的声音传感器的位置或虚拟位置的重现信息,及响应于所述副带信号和重现信息而在一条或更多输出声道中生成一条音频流,及将多个声音传感器连至所述解码器的输出声道,所述多个声音传感器布置为对空间编码有利位置收听区内的一个或多个收听者生成声域的听觉相似感受。
43.权利要求42的方法,其中存在三条或更多输出声道,及所述响应于所述副带信号和重现信息而在更多输出声道内一条中生成一条音频流的步骤在任何瞬间在不多于两条输出声道内生成一条音频流。
44.权利要求41或权利要求42的方法还包括使用一个空间化器处理所述输出声道内的音频流的步骤,该空间化器包括一个声音交叉消除器,所述处理步骤提供减少数量的具有音频流的输出声道,这些音频流的特性是当连至声音传感器时,它所提供的声域听觉印象类似于原始数量的输出声道连至较多声音传感器时所得声域听觉印象。
45.权利要求41或权利要求42的方法,其中所述操纵控制信号包括每个副带的一个方向向量。
46.权利要求41或权利要求42的方法,其中所述相应频率副带具有一个相当于人类听觉系统的相应重要频带的带宽。
47.权利要求41或权利要求42的方法,其中根据心理声学原理分配所述位数。
48.权利要求42的方法还包括使用一个包括声音交叉消除器的空间化器处理所述输出声道内的音频流的步骤,从而使空间编码有利位置收听区内生成的所述声域的听觉相似感受提供一个广大舞台或环绕声声域的感受。
全文摘要
一种包括编码器和解码器的空间音频编码系统在极低位率下工作并且通过因特网用于音频信息。一个或多个收听者例如个人计算机用户或电视观众最好位于可预测收听区内。编码器产生一个用于表现待重现的声域的组合音频信息信号和一个方向向量或“操纵控制信号”。该组合音频信息信号的频谱拆分为若干副带,优选地相当于人类耳朵的重要频带。操纵控制信号具有与每个副带的声域主要方向相关的一个分量。因为该系统基于在任何瞬间只听到来自单方向的声音这一认识,因此任何瞬间内编码器不必将一个信号施加于多于两个声音传感器。
文档编号H04S3/00GK1295778SQ99804610
公开日2001年5月16日 申请日期1999年4月5日 优先权日1998年4月7日
发明者雷·M·杜比 申请人:雷·M·杜比
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1