语音对其余音频(vra)交互中心声道下混音的制作方法

文档序号:7602039阅读:283来源:国知局
专利名称:语音对其余音频(vra)交互中心声道下混音的制作方法
交叉引用的有关申请本申请请求1999年6月15日提交的标题为“语音对其余音频(VRA)交互中心声道下混音”的美国临时专利申请系列号60/139242的权利。
本发明领域本发明的实施例总的涉及一个用于处理音频信号的方法和设备,更具体地涉及用于处理音频信号以改善大范围最终用户的收听效果的一种方法和设备。
本发明背景具有“高档”或昂贵设备包括多声道放大器和多扬声器系统的最终用户当前具有有限能力来独立于其它其余声道上的音频信号调节多声道音频系统的中心声道上的音量。由于许多电影在中心声道上具有大多数对话而其它音响效果位于其它声道上,该有限的调节能力允许最终用户提升大多数对话声道的幅度,以便在大声音响效果片段期间对话更容易理解。现在,这种有限调节具有严重缺点。首先,这种调节能力只对具有DVD播放机和多声道扬声器系统例如六扬声器家庭影院系统的最终用户有用,这样的系统允许所有扬声器独立地调节。这种调节在优选音频信号(例如,语音或对话)和其余音频信号(所有其它声道)期间也需要连续调整。最后的缺点是,如果其余音频电平增加太大或对话电平减少太多,在电影节目一个音频段期间可接受的语音对其余音频(VRA)调节可能对于另一个音频段不好。
事实是大多数最终用户许多年也不具有并且也不想具有允许该调节能力的家庭影院,即杜比数字解码器、六声道可变增益放大器和多扬声器系统。另外,最终用户不具有保证在节目开始时所选择的VRA比率在整个节目期间保持相同的能力。
图3表示了普通家庭影院系统预定立体定位设置。尽管没有对于5.1立体声道的文字规则,但是有工业标准。如同在此所使用,术语“立体声道”表示输出设备的物理位置(例如,扬声器)和来自输出设备的声音如何发送给最终用户。这些标准之一是将大多数对话定位在中心声道226上。同样地,需要立体定位的其他音响效果将安置在任何其他四个左、右、左环绕、右环绕扬声器上,标记为L221、R222,Ls223、Rs224。另外,为避免损坏中距离扬声器,低频效果(LFE)被安置在指向亚低音扬声器225的0.1声道上。
数字音频压缩允许厂家为最终用户提供更大的音频动态范围,这通过模拟传输是不可能实现的。更大动态范围在某些非常大声的音响效果出现时引起大多数对话与声音相比太低。下列例子提供了解释。假设模拟传输(或录音)有能力传输高达95dB的动态范围而对话典型地以80dB被记录。当其余音频达到上限而有人正说话时,其余音频的大声段可以妨碍对话。可是,当数字音频压缩允许动态范围达到105dB时,这种情况恶化。很清楚,对话将保持在针对其他声音的某个电平(80dB)上,现在只有大声其余音频可以更真实地按照其幅度再现。用户抱怨在DVD上对话被录音得太低是非常普遍的。实际上,与具有有限动态范围的模拟录音相比对话IS在适当电平并且更适合和真实。
即使对于现在具有适当校对的家庭影院系统的消费者,在现在生产的许多DVD电影中对话经常被大声其余音频部分掩盖。一小部分消费者通过增加中心声道音量或减少所有其他声道音量能够稍微改善清晰度。可是,这种固定调节只对于某些音频通道可接受,它破坏了适当校准的电平。扬声器电平一般被校准以在观看位置产生一定的声压级(SPL)这种适当校准保证观看尽可能真实。不幸的是,这意味着大声音被非常大声地再现。在后半夜观看期间,这可能是不希望的。可是,扬声器电平的任何调节将破坏该校准。
本发明概述一种解码音频信号的方法包括接收具有多个声道上限定的数字音频信号,其中多个声道之一是中心声道而所述其他多个声道至少之一是其余音频声道;比较中心声道与其他多个声道的至少一个以确定中心声道与其他多个声道的比率;当该比率不满足预定数值时自动调节中心声道和其他多个声道的至少一个。
附图简要说明

图1表示了按照本发明的总方案,在录音或广播节目中将有关语音信息与一般背景音频分开。
图2表示按照本发明的示范性实施例,接收和重新播放被编码节目信号。
图3表示普通家庭影院系统预定立体定位设置。
图4表示一个按照本发明的系统,其中最终用户具有选项以选择自动语音对其余音频(VRA)电平特性或校准后音频特性。
图5表示按照本发明如何实现下混音的原理图的实施例。
图6表示按照本发明如何实现下混音的原理图的替换实施例。
图7图示了具有标准化下混音系数的现有技术杜比数字编码器和解码器。
图8表示了按照本发明每个编码5.1声道上最终用户可调节电平。
图9表示了按照本发明实施例的图8所示的接口盒。
图10表示了将音乐安置在左和右声道而语音安置在中心声道并且在下混音之前调节中心声道的处理。
图11表示了按照本发明原理的图10中所示的系统的替代实施例。
详细说明本发明描述一种方法和设备,用于针对多声道音频节目的其余声道的优选语音对其余音频容量而调节多声道节目的中心声道电平。
另外,本发明描述了一种方法和设备,用于以一种方式在音频介质上重新录音旧主音量和录音新主音量,该方式允许最终用户调节优选的语音对其余音频。如同在此所使用的,术语“主音量”是指在音频录音过程中在最开始步骤产生的音频介质。另外,术语“最终用户”是指广播或声音录音的消费者或听众或在收听通过录音或广播发送的音频介质上音频信号的人。另外,术语“优选音频”是指音频信号的语音成分、语音信息或主要语音成分,而术语“其余音频”是指音频信号的背景、音乐或非语音成分。
在此描述的本发明不限于任何特定音频COREC(压缩/解压缩)标准,并且可以与任何音频CODEC一起使用,例如数字影院音响(DTS)、杜比数字、索尼动态数字音响(SDDS)、脉冲编码调制(PCM)等。
优选的音频对其余音频比率的价值本发明始于这种认识,即优选音频信号相对任何其余音频比率的优先收听范围相当大,当然地大于以往预计的范围。这一重大发现是针对对优选音频信号电平与所有其余音频信号电平比率选择的小群体抽样测试的结果。
对于听力损伤者和正常听众所希望范围的特定调节在了解正常人和听力受损者如何感觉不同类型音频节目中对话和其余音频之间比率方面已经进行了非常有针对性的研究。已经发现,在语音和其余音频之间所希望调节范围上人们有很大不同。
已经对包括小学生、中学生、中年人和老年人的随机抽样群体进行了两个实验。总共测试了71人。测试包括要求用户对足球比赛(其中其余音频是人群噪声)和流行歌曲(其中其余音频是音乐)调节语音电平和其余音频电平。通过对每个选择将对话音或语音量线性数值除以其余音频音量线性数值形成称为VRA(语音对其余音频)比的标称。
作为给测试的结果清楚了几个事实。第一,对于体育和音乐媒介没有两个人选择相同的语音和其余音频比。这是非常重要的,因为人们已经依赖厂家提供呈现给每个人的VRA(其不能由用户调节)。假设这些测试结果,这明显不会想到。第二,尽管VRA一般高于听力受损者(以改善清晰度),具有正常听力的人们也选择与厂家现在提供所不同的比率。
很重要的是提出了这样的事实,即任何提供VRA调节的设备必须提供至少与这些测试所得出一样多的调节能力,以便满足重要群体。由于语音和家庭影院媒体提供各种节目,我们应当考虑比率范围应当从至少任何媒体(音乐或体育)最低比率扩展到音乐或体育的最高比率。这是0.1到20.17,或46dB的分贝范围。也应当注意,这仅仅是抽样人群和调节能力应当理论上无限大,因为当观看体育广播时非常可能一个人可以选择无人群噪声而另一个人选择没有解说。注意,这类研究和大范围改变VRA的特定希望在文章和现有技术中还没有报告或讨论过。
在该测试中,较年长者被选择和要求进行固定背景噪声和解说员语音之间的调节(该测试后来在学生群体中进行),其中只有后者可以改变而前者被设置为6.00。年长者的结果如下表1个人设置17.50
24.5034.0047.5053.0067.0076.5087.7595.5010 7.0011 5.00为进一步说明所有年纪人们具有不同听力需要和选择的事实,一组21位大学生被选择收听语音和背景的混音并且通过对语音电平进行一次调节选择语音对背景比率。在足球比赛人群噪声情况下,背景噪声被固定设置为六(6.00)并且学生被允许一场一场地调节解说员语音音量,该语音已经被单独录音并且是纯语音或基本上纯语音。换句话说,学生被选择进行与年长人群相同的测试。学生们都是十七八或二十出头。结果如下表2学生 语音设置1 4.752 3.753 4.254 4.505 5.206 5.757 4.258 6.709 3.2510 6.0011 5.0012 5.2513 3.00
144.25153.25163.00176.00182.00194.00205.50216.00年长者群体的年龄(见表1)范围在36到39,而个体在40或50岁群体占多数。如同该测试所表示的,平均设置趋向适当增高表明某些大范围的听力下降。该范围从3.00到7.75之间变化,分布范围为4.75,这证实了所发现的人们选择的语音对背景或火热优选信号对其余音频的收听比率变量范围。两组音量设置的总范围服从2.0到7.75的范围。这些电平代表用于进行实验的音量调节装置的时间数值。它们提供了信号对噪声数值范围的指示(当与“噪声”电平6.0相比),这可能是不同用户的希望。
为获得对这些如何有关不同用户所选择的相对大声音范围有更好了解,考虑从2.0到7.75的非线性音量控制范围代表增加20dB或十(10)倍。因此,即使对于小抽样人群和单一类型的音频节目,发现不同听众针对“其余音频”选择相当明显不同的“优选信号”电平。这种选择跨越年龄组,表明它与个人选择和基本听力一致,这是以前从没有预计到的。
如同测试结果表示的,没有年龄引起的听力损害的学生(见表2)选择的的范围从低设置2.00到高设置6.70而明显不同,范围为4.70或几乎从1到10的总发我的一半。该测试说明了大多数录音和广播音频信号的“一应具全”概念给单个听众非常少的能力来调节混音以适合他们自己的选择或收听需要。而且,学生具有与年长者一样的大范围证明了在选择和听力需要方面的个人差别。该测试的结果是收听选择大范围不同。
进一步测试已经在更大抽样群体上确认了该结果。此外,该结果根据音频类型而改变。例如,当音频信号源是音乐时,语音对其余音频的比率从几乎零到大约10范围改变,而当音频信号源是体育节目时,同样比率在几乎零到大约20范围改变。另外,标准偏差增加几乎三倍,而平均值比音乐增加了两倍多。
上述测试的最后结果是,如果选择优选音频对其余音频比率并且永远固定,最有可能产生低于重要人群部分所希望的音频节目。另外,如上所述,优化比率可以是短期和长期时变函数。因此,希望完全控制优选音频对其余音频比率以满足“正常”或没有听力损害听众的收听需要。另外,为最终用户提供对该比率的最终控制允许最终用户优化他们的收听感受。
最终用户独立调节优选音频信号和其余音频信号是本发明一方面的明显表现。为详细说明本发明,考虑优选音频信号是有关语音信息的应用场合。
产生优选音频信号和其余音频信号图1表示了在录音或广播节目中将有关语音信息与一般背景音响分开的总方案。首先需要由节目导演进行确认,以便定义有关语音。演员、一组演员或播音员必须被识别为有关说话者。
一旦有关说话者被识别,他们的语音通过语音麦克风1拾音。语音麦克风1需要近距离麦克风(在播音员情况下)或用于音响录音的高方向性瞄准麦克风。除了高方向性,这些麦克风1需要语音频带限制,最好为200-5000Hz。方向性和带通滤波的组合使耦合到录音上有关语音信息的背景噪声最低。在某些节目类型中,防止声音耦合的需要可以通过脱机记录有关对话语音和将对话配音在节目视频部分适当位置来避免。背景麦克风2应当是均匀宽带以提供完整的背景信息音频质量,例如音乐。
摄象机3将用于提供节目的视频部分。音频信号(语音和有关语音)将在编码器4与视频信号一起编码。总之,通过简单地利用不同载波频率调制,音频信号通常与视频信号分开。由于大多数广播现在是立体声,解码有关语音信息与背景的一种方式是将有关语音信息复用到单独立体声声道,该方式与左前或右前声道被增加到两声道立体声以产生四声盘记录的方式相同。尽管这将产生另外广播带宽的需要,对于录音介质,这不引起问题,只要视盘或磁带播放机中的音频电路设计得解码有关语音信息。
一旦信号被编码,无论认为哪种方式适合,被编码信号通过天线13由广播系统发送而广播,或被录音系统6记录在磁带或盘上。在记录声像信息的情况下,背景和语音信息可以简单地安置在分开的记录磁道上。
接收和解码优选音频信号和其余音频。
图2表示了接收和重新播放被编码节目信号的示范性实施例。接收机系统7在广播信息情况下根据被编码音频/视频信号解码主载波频率。在录音介质14的情况下,VCR的磁头或CD播放机8的光头将产生被编码音频/视频信号。
在任何情况下,这些信号应当被发送给解码系统9。解码器9使用标准解码技术例如包络检波与频分或时分解调的组合,将信号分成视频、语音音频和背景音频。背景音频信号被送给单独可变增益放大器10,该放大器可以由收听者调节到他们的选择。语音信号被送给可变增益放大器11,该放大器可以由收听者调节到他们特定要求,如上所述。
两个被调节信号通过统一增益相加放大器12相加以产生最后音频输出。替代地,两个被调节信号由统一增益相加放大器12相加并且由可变增益放大器15进一步调节以产生最后音频输出。以此方式,在播放音频节目时收听者可以调节有关语音对背景电平以优化音频节目达到他们唯一的收听要求。每次相同的收听者播放相同音频时,由于收听者听力改变而比率设置可能需要改变。设置保持无限可调节以适应这种灵活性。
中心声道的自动VRA调节特性中心声道电平的某些增加或其余扬声器电平的减少为具有多声道音响系统例如具有调节能力的5.1声道音响系统的最终用户提供了语音清晰度的改善。注意,不是所有消费者具有这种系统,而本发明允许所有消费者具有该能力。
图4表示了一个系统,其中最终用户具有选项以选择自动VRA电平特性或被校准音频特性。该系统包括一个被校准解码器231、开关235和237、一个处理器232和多个放大器234、238和236。如图4所示,该系统通过移动开关235到位置B校准,该位置被认为是正常工作位置,在此使用5.1解码器输出声道通过功率放大器236直接到达5.1扬声器输入。解码器然后被校准以便扬声器电平对于家庭影院系统适合。如上所述,这些扬声器电平可能不适合夜晚观看。
替代地,开关235可以被移动到位置A,该位置允许最终用户选择所希望VRA比率并且通过针对其他音频声道调节中心声道相对电平而自动保持。
在不干扰用户所选择VRA的音频节目段期间,扬声器以原来校准格式再现音频声音。只有当其余音频变得太大声或语音变成太轻声时在放弃自动电平特性。在这些时刻,语音电平可以被提高,其余音频可能被降低,或两者组合。这通过“检查实际VRA”处理器232完成。检查实际VRA处理器232包括所有必要硬件和软件以及其组合以执行上述功能。如果最终用户通过开关235选择自动VRA保持特性被使用,则5.1声道电平在检查实际VRA模块232中被比较。如果平均中心电平对于其他声道有足够的比率(其他声道可以全部相反校准以符合观看位置的室内声音和预定SPL),则正常被校准电平通过快速开关237由放大器再现。
如果该比率被预定为不满意,则快开关237将中心声道释放到其自动电平调节并且所有其他扬声器到自己的自动电平调节。
按照本发明1)这些自动VRA-HOLD特性被直接应用于现有5.1音频声道;2)现在在家庭影院中可调节的中心电平可以针对其余声道被调节到特定比率并且在出现瞬间被保持;3)当用户所选择VRA不被影响时被校准电平被再现,并且当其仍然适合临时改变校准引起的瞬间改变时被自动对准,由此以更真实方式再现音频;4)允许最终用户选择自动(或手工)VRA或被校准系统,由此消除在中心声道调节之后对重新校准的需要。
也应当注意,尽管该电平被认为自动调节,该特性也可以希望提供简单人工增益调节,如图4所示。
对非中心声道扬声器方案的下混音的中心声道调节如上所述,许多最终用户不具有家庭影院系统。可是,DVD播放机正变得更普及并且在不远的将来将广播数字电视。这些数字音频格式将要求最终用户具有5.1声道解码器以便收听任何广播音频,可是,他们可能没有奢侈到购买具有5.1音频声道的完全可调节和校准家庭影院系统。
本发明的下个方面利用一个事实,即厂家将推出5.1声道音响给可能没有完全再现能力的最终用户,同时允许他们调节语音以保持音频VRA比率电平。另外,本发明的这方面通过允许最终用户选择保持或维护该比率而不用具有多扬声器可调节系统的特性而增强。
图5表示了按照本发明的实施例如何实现下混音的原理图。如图所示,下混音通过接口单元241从DVD播放机输出端口接收5.1声道(在此情况下杜比数字)比特流来实现。该信号然后被发送给用户音频解码器,按照用户所选择VRA对中心声道243进行用户调节。输出信号然后送给立体声、四声道或不提供中心声道扬声器的任何其它扬声器装置244。
图6表示了按照本发明如何实现下混音的原理图的替代实施例。对于非家庭影院音频系统的下混音为所有用户提供了受益于可选择VRA的方法。被调节对话以一种方式被分配给非中心声道扬声器,该方式使音频节目的预定立体位置保留得尽可能完好。可是,对话电平将简单地更高。如图所示,一个N声道D/A转换器252将来自用户音频解码器并用于用户调节中心声道下混音243的数字信号转换为模拟信号。该模拟信号然后送给一个N扬声器音频播放设备253。
由非常详细的方法将5.1音频声道(杜比数字)下混音成为4声道(杜比专家逻辑电路)、成为2声道(立体声)或1声道(单声道)。以适当比率组合的5.1声道被选择对于消费者具有的任何再现设备产生优化立体定位。现有下混音方法的问题是它们对最终用户是透明的并且不可控制。这可能出现清晰度问题,假设动态范围被利用在更新的5.1声道音频混音方式。
作为例子,考虑已经用5.1声道产生的电影具有其余音频盖过了对话的一段,使对话很难理解。如果消费者具有6扬声器和6声道可调节增益放大器,语音清晰度可以被改善并且保持,如上所述。可是,只具有立体声再现的消费者将接收一个与图7所示图一样的5.1声道下混音版本(摘自“杜比数字广播实施指导”)。实际上,中心声道电平被衰减了DD比特流中指定的数量(或者-3,-4.5或-6dB)。这进一步减少了其他声道上包含大声其余音频的片段的清晰度。
本发明的这方面通过在它们被混音到用户再现设备之前在每个立体声道上安置可调节增益而回避了下混音问题。
图8表示了每个被解码5.1声道上的最终用户可调节电平。通常,低频效果(LFE)声道的下混音不进行,以防止电子元件饱和和减少清晰度。可是,对于在下混音出现之前的最终用户调节变化,有可能在下混音中包括最终用户指定比率的LFE。
让最终用户调节每个声道电平(电平调节器263a-g)允许最终用户具有任何数量的再现扬声器以利用以前只有具有5.1再现声道的听众才可使用的语音电平调节。
如上所述,该设备可以外部用于任何解码器271,不论是单独解码器、DVD的内部、或电视机内部,也不论在家庭影院系统中再现声道的数量。最终用户必须简单命令解码器271分配一个(5.1)输出和“接口盒”将执行以前由解码器执行的调节和下混音。
图9表示了该接口盒282。它可以从任何解码器提取输入,5.1被解码音频声道,对每个声道施加独立增益,按照消费者具有的再现扬声器数量下混音。
另外,本发明的这方面可以通过在任何下混音执行之前在每个5.1声道上安置独立用户可调节声道增益而结合到任何解码器中。当前的方法是在必要时下混音并且然后进行增益。这不能改善对话清晰度,因为对于任何下混音条件,该中心被混合到包含其余音频的其它声道中。
也应当注意,前面讨论的自动VRA-HOLD装置非常可应用于该实施例。通过调节每个放大器增益一旦VRA被选择,VRA-HOLD特性将在下混音之前保持该比率。由于选择该比率同时收听任何被下混音的再现设备,下混音电路的比例将通过消费者应用的另外中心电平调节而被补偿。所以,作为下混音处理自身的结果,不需要另外补偿。
也应当注意,在用户调节放大和下混音之前的带通滤波将消除比语音频率更低和比语音频率更高的声音(200Hz到4000Hz例如),和可能改善某些通道的清晰度。也经常可能为改善清晰度而被消除的中心声道上内容也存在在左和右声道,因为它们预计再现反之在语音带宽之外的音乐和效果。这保证不出现其余音频声音保真度失真而同时也改善了语音清晰度。
本发明的这方面1)允许具有任何数量扬声器的消费者利用当前只对具有5.1再现扬声器的消费者可使用的VRA比率调节;2)允许这些消费者针对其他声道上的其余音频设置中心声道上所希望电平,并且使该比率在整个VRA-HOLD特性瞬间保持相同;3)可以应用于任何5.1声道解码器输出而不修改比特流或增加所需要传输带宽,即对于硬件独立。
对于VRA再现的三声道录音为提供在此所公开构思的例子,必须在媒体某些应用中选择一定的媒体。可是,特定例子不排除其他形式的媒体或来自本发明范围的稍微修改录音技术。另外,尽管本发明重点讨论了三声道音频转换为两声道音频,设想以VRA调节目的的特定下混音方式的多声道录音也在不脱离本发明范围。
为最终用户提供VRA调节装置的目的是为改善清晰度而单独控制语音或对话电平和其余音频的电平。所讨论的本发明上述方面利用一个事实,即许多多声道产品在中心声道上安置大多数对话,在这种多声道节目中许多用户不能获得提升中心声道电平所需要的调节。因此,如上所述,厂家不需任何区别地为最终用户提供有限的VRA调节能力。如下所讨论的,讨论了一种生产方法,该方法利用前面讨论的元件保证更有效的VRA调节。另外,利用上述相同实际硬件的装置,许多旧音频录音可以重新利用新生产技术进行处理,这样为用户提供了利用上述硬件调节当前5.1声道再现以调节VRA的装置。
用于描述上生产方法特点的第一个例子上典型的流行音乐。主录音一般包括各种音频声道,可以包括鼓、吉他、贝斯和嗓音。这些声道当然在单一记录介质上被同步,所以他们的播放将构成完整的歌曲。当当前CD(或DVD音频)盘被生产时,最终用户不可能具有对语音的任何控制来保持音频比率。可是,如果厂家打算将音乐混音安置在所希望隔开的左和右声道而同时将语音安置在中心声道上,分开的“节目”将独立于播放由最终用户调节。(该生产通过利用包括多声道节目的DVD音频标准实现)。许多,如果DVD以该方式生产(音乐在左和右而语音在中心),它可以由上述从5.1声道到2声道的下混音设备播放,而在下混音之前在中心声道上调节。该特定实施例在图9表示。
图10表示了在左和右声道上安置音乐而在中心声道安置语音并且在下混音之前在中心声道上调节的过程。该过程开始于包括语音和其余音频的主音频节目90的产生。来自主音频节目90的信号在左和右声道上被混音并且均等调节,如模块91瞬时。产生一个三声道音频介质92,以便左和右音频节目驻留在音频介质的左和右位置,而同时语音驻留在音频介质的中心声道上。该介质产生得语音电平在针对总的节目其余音频电平的标准再现电平上。这保证在播放中最终用户通过以相同电平设置语音和其余音频电平能够体验标准混音。
阴平播放设备93分配所有的音频5.1声道给电平调节/下混音硬件94,该硬件在前面本发明中描述过。该下混音可以被设置得从5.1声道音频节目产生立体声节目。由于大多数音乐再现不需要环绕或低频效果,为VRA再现的下混音是被调节语音电平与左和右音乐节目的简单组合。该产生多声道方法依赖于一个事实,即并非大多数最终用户将下混音到适合节目类型的更少数量声道。音乐是极好的例子,因为立体声图象一般满足纯音频表演。该方法简单利用了更高容量DVD介质可使用的外部空间,以便安置适合于下混音的对话声道。该实施例不需要对中心声道电平调节的上述系统元件进行任何改变,但是利用了VRA能力的系统元件。
图11保护色了按照本发明的图10中描述的实施例的替代实施例。可以希望厂家生产(并且最终用户体验)立体定位的语音。为保持语音和保持其余音频永远与最终用户相互隔离并且具有立体定位能力,四音频声道必须传输给最终用户(对于全空间再现)。这些音频声道包括左音频、右音频、左语音和右语音。如图10瞬时,主声道使所有音乐和空间定位录音完整。产生一个多声道录音介质,例如5.1音频DVD,以便左音频(没有语音)在单一声道上(例如L),右音频在R上,左语音在左环绕声道而右语音在右环绕声道。对纯语音使用环绕声道完全是随意的,并且离散声道可以用于任何上述信号而不失一般性。在生产和整个标准化过程中,为介质类型确定每个音频成分的位置;在此假设左和右语音在左和右环绕上,而左和右音频在右声道的左前。图11表示了所需要的下混音和与图10的区别。音频增益被施加到左和右音频信号上而语音增益被施加到左和右两个语音信号。这允许所需要VRA调节能力。左节目然后通过将左语音和左音频组合而产生,而右节目通过将右音频和右语音组合产生,如图所示。作为上述过程的结果,将获得纯立体声节目同时最终用户仍然能够调节VRA比率。
本发明的实施例公开一个方法,用于通过利用安装语音的多声道进行录音而保证下混音技术与中心声道调节系统元件兼容。建议将语音安置在中心声道上,以便下混音为立体声播放。这不排除使用用于对话或用于其余音频的其它声道。需要类似调节和下混音技术以重新产生具有所希望立体位置的总节目,而不论原来所录音的声道如何。可是,如果该系统元件没有设计得禁止预定格式,下混音将不与该产生兼容并且最终结果将不可预测。通过保证利用中心声道作为专用对话声道进行生产,最终用户可以利用类似系统元件调节任何下混音情况的VRA。可以仍然产生任何多声道音频格式的多声道语音段的VRA调节(需要在几个声道上再现),只要语音与其余音频分开产生的DVD上。这需要多声道产生语音和其余音频两者并且受所使用音频格式声道数量的限制。
权利要求
1.一种解码一个音频信号的方法包括接收一个具有其上定义的多个声道的数字音频信号,其中所述多个声道之一是中心声道而所述多个声道的其它至少之一是其余音频声道;比较所述中心声道与所述至少所述多个声道的其它至少之一,以确定所述中心声道对所述其它所述多个声道的比率;和当所述比率不满足预定数值时,自动调节所述中心声道和所述至少所述多个其它声道之一。
2.按照权利要求1的方法,进一步包括当该比率数值超过所述预定数值时调节所述中心声道和所述至少所述多个其它声道之一的步骤。
3.按照权利要求1的方法,进一步包括当该比率数值低于所述预定数值时调节所述中心声道和所述至少所述多个其它声道之一的步骤。
4.按照权利要求1的方法,其中所述中心声道主要是语音声道。
5.按照权利要求1的方法,其中所述中心声道是语音声道。
6.按照权利要求1的方法,其中所述至少所述其它多个声道之一包括一个非语音声道。
7.一种音频系统用于为最终用户优化音频节目播放,包括一个接收机接收被编码音频信号,所述被编码音频信号包括优选的音频信号和其余音频信号;一个解码器耦合到所述接收机,并且解码所述编码音频信号以重新产生优选音频信号和其余音频信号;一个第一用户可调节放大器耦合到所述解码器并且调节所述优选音频信号;一个第二用户可调节放大器耦合到所述解码器并且调节所述优选其余音频信号;一个处理器连接到所述解码器,比较所述优选音频信号对所述其余音频信号的比率,并且输出一个数值;和一个控制器,用于当所述比率没有满足预定数值时自动调节所述优选音频信号对所述其余音频信号的所述比率。
8.按照权利要求7的系统,其中当该比率超过所述预定数值时优选音频信号被调节。
9.按照权利要求7的系统,其中当该比率低于所述预定数值时优选音频信号被调节。
10.按照权利要求7的系统,其中当该比率超过所述预定数值时其余音频信号被调节。
11.按照权利要求7的系统,其中当该比率低于所述预定数值时其余音频信号被调节。
12.按照权利要求1的系统,其中所述优选音频信号主要包括语音信号。
13.按照权利要求1的系统,其中所述优选音频信号包括语音信号。
14.按照权利要求1的系统,其中所述其余音频信号包括非语音声道。
全文摘要
一种解码音频信号的方法包括接收具有多个声道(221-226或CENTER,ALL OTHER SPEAKERS)定义的数字音频信号,其中多个声道之一是执行声道(C或CENTER)而多个声道的其他声道至少一个是其余音频声道;比较中心声道(C或CENTER)与多个其他声道(221-24或ALLOTHER SPEAKERS)至少一个;和当该无线电台的预定数值没有满足时,自动调节(232,233)中心声道和多个其他声道至少一个。
文档编号H04S7/00GK1369189SQ00811414
公开日2002年9月11日 申请日期2000年6月13日 优先权日1999年6月15日
发明者M·A·沃德雷, W·R·桑德斯 申请人:听觉增强有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1