对多声道音频信号进行编码/解码的系统、介质和方法

文档序号:2833202阅读:158来源:国知局
专利名称:对多声道音频信号进行编码/解码的系统、介质和方法
技术领域
本发明的实施例涉及音频信号的编码和/或解码,更具体地讲,涉及对多声道音频信号进行编码/解码的系统和方法。
背景技术
一般音频编码的示例包括波形多声道音频编码和参数多声道音频编码。在波形多声道音频编码中,可接收5音频声道信号,并输出5音频声道信号。波形多声道音频编码的示例包括MPEG-2MC音频编码、AAC MC音频编码以及BSAC/AVS MC音频编码。MPEG-2MC音 频编码是以两种类型的模式被执行的,一种是对原始信号进行操作的模式,另一种是对下混频(downmix)的信号和其他独立的信号进行操作的模式,AAC MC音频编码是使用PCE和默认设置对原始信号被执行的,BSAC/AVS MC是使用channel_configuration_idx对原始信号执行的比特分片算术音频编码(bit sliced arithmetic audio coding)。参数多声道音频编码的示例包括将I个或2个输入的声道信号编码为5个或6个声道信号的MPEG环绕编码。此外,MPEG环绕编码基于量化矩阵扩展(QMF,Quant MatrixExtension)、逆一输入至两输出的解码工具(R-0TT,a reverse one-input to two-outputdecoding tool)、逆两输入至三输出的角军石马工具(a reverse two-input to three-outputdecoding tool, R-TTT)以及关于扩展的信号的R-OTT树。这里,作为示例,一输入至两输出工具可以是获得一个输入并产生两个输出的工具。图I示出这样的MPEG环绕解码器。在解码器的接收器端有各种扬声器配置,例如,
1、2、3(前)/0(后),3/1,3/2以及5/2。因此,输入的编码的音频流可被解码为全部可用的音频声道信号,其中,可根据在解码器的接收器端使用的扬声器配置选择性地挑选所述全部可用的音频声道信号用于输出。类似地,图2示出用于将输入的音频声道信号编码为音频比特流的相应的编码器以及用于对编码的音频声道信号进行解码的解码器。在MPEG环绕的情况下,编码器对M个输入的音频声道信号进行编码,并输出N个音频声道信号作为音频比特流,其中,M大于N。然后,解码器可对N个编码的音频声道信号进行解码,并输出L个解码的音频声道信号,其中,L大于或等于N,M大于或等于L。然而,在这样的传统解码器中,通过将M个输入的音频声道信号解码(例如,当M=N = L时)或通过将下混频的M个输入音频声道信号上混频为N个音频声道信号并随后对N个音频声道信号进行解码来直接产生L个音频声道信号。然而,难以在接收器基于实际已知类型的扬声器配置,将输入的音频声道信号解码为合适数量的声道的音频信号
发明内容
技术问题本发明的实施例提供一种对多声道音频信号进行编码/解码的系统、介质和方法,通过该多声道音频信号解码系统、介质和方法,基于可选的解码级别根据在解码器的接收器端的扬声器配置的类型,将输入的音频声道信号选择性地解码为复数数量的声道的音频信号。
将在接下来的描述中部分阐述本发明另外的方面和/或优点,还有一部分通过描述将是清楚的,或者可以经过本发明的实施而得知。技术方案为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码系统,所述多声道音频信号解码系统包括解码级别产生单元,产生解码级别信息以控制将具有预定数量N的编码的音频声道信号和空间信息的比特流解码为数量L (其中,L ^ N)的音频声道信号的解码级别,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;音频解码器,基于解码级别信息通过不同级别的解码对比特流进行选择性地解码,并产生数量L的音频声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码方法,所述多声道音频信号解码方法包括包括基于解码级别信息对比特流进行选择性地解码,以控制将具有预定数量N的编码的音频声道信号和空间信息的比特流解码为数量L的音频声道信号的解码级别,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码系统,所述多声道音频信号解码系统包括第一 OTT解码器,将以包括相应的编码的单个音频声道信号的相应的比特流形式的单个音频声道信号和空间信息解码为两个音频声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;TTT解码器,将所述两个音频声道信号解码为三个音频声道信号作为第一、第二和第三声道信号;第二 OTT解码器,将第一声道信号解码为第一复数个声道信号;第三OTT解码器,将第二声道信号解码为第二复数个声道信号;第四OTT解码器,将第三声道信号解码为第三复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码方法,所述多声道音频信号解码方法包括第一 OTT解码,将以包括相应的编码的单个音频声道信号的相应的比特流形式的单个音频声道信号和空间信息解码为两个音频声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;τττ解码,将在第一 OTT解码中获得的两个音频声道信号解码为三个音频声道信号作为第一、第二和第三声道信号;第二 OTT解码,将第一声道信号解码为第一复数个声道信号;第三OTT解码,将第二声道信号解码为第二复数个声道信号;第四OTT解码,将第三声道信号解码为第三复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码系统,所述多声道音频信号解码系统包括=TTT解码器,将以包括相应的编码的两个音频声道信号的相应的比特流形式的两个音频声道信号和空间信息解码为三个音频声道信号作为第一、第二和第三声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第一 OTT解码器,将第一声道信号解码为第一复数个声道信号;第二 OTT解码器,将第二声道信号解码为第二复数个声道信号;第三OTT解码器,将第三声道信号解码为第三复数个声道信号;第四OTT解码器,将由第一OTT解码器解码的第一复数个声道信号之一解码为第四复数个声道信号;第五OTT解码器,将由第二OTT解码器输出的第二复数个声道信号中的一个声道信号解码为第五复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码方法,所述多声道音频信号解码方法包括=TTT解码,将以包括相应的编码的两个音频声道信号的相应的比特流形式的两个音频声道信号和空间信息解码为三个音频声道信号作为第一、第二和第三声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第一 OTT解码,将第一声道信号解码为第一复数个声道信号;第二OTT解码,将第二声道信号解码为第二复数个声道信号;第三OTT解码,将第三声道信号解码为第三复数个声道信号;第四OTT解码,将在第一 OTT解码输出的第一复数个声道信号之一解码为第四复数个声道信号;第五OTT解码,将在第二OTT解码中输出的第二复数个声道 信号中的一个声道信号解码为第五复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码系统,所述多声道音频信号解码系统包括=TTT解码器,将以包括相应的编码的两个音频声道信号的相应的比特流形式的两个音频声道信号和空间信息解码为三个音频声道信号作为第一、第二和第三声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第一 OTT解码器,将第一声道信号解码为第一复数个声道信号;第二 OTT解码器,将第二声道信号解码为第二复数个声道信号;第三OTT解码器,将第三声道信号解码为第三复数个声道信号;第四OTT解码器,将第三OTT解码器的第三复数个声道信号中的一个声道信号解码为第四复数个声道信号;第五OTT解码器,将第四OTT解码器的第四复数个声道信号中的一个声道信号解码为第五复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码方法,所述多声道音频信号解码方法包括=TTT解码,将以包括相应的编码的两个音频声道信号的相应的比特流形式的两个音频声道信号和空间信息解码为三个音频声道信号作为第一、第二和第三声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第一 OTT解码,将第一声道信号解码为第一复数个声道信号;第二OTT解码,将第二声道信号解码为第二复数个声道信号;第三OTT解码,将第三声道信号解码为第三复数个声道信号;第四OTT解码,将在第三OTT解码中输出的第三复数个声道信号中的一个声道信号解码为第四复数个声道信号;第五OTT解码器,将在第四OTT解码中输出的第四复数个声道信号中的一个声道信号解码为第五复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码系统,所述多声道音频信号解码系统包括第一 OTT解码器,对包括作为第一和第二音频声道信号的两个编码的音频声道信号和空间信息的比特流进行解码,以便将第一音频声道信号解码为第一复数个音频声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第二 OTT解码器,将第二音频声道信号解码为第二复数个声道信号作为第一和第二声道信号;第三OTT解码器,将由第一 OTT解码器输出的第一复数个音频声道信号中的一个音频声道信号解码为第三复数个声道信号;第四OTT解码器,将第一声道信号解码为第四复数个声道信号;第五OTT解码器,将第二声道信号解码为第五复数个声道信号;第六OTT解码器,将第一OTT解码器输出的第一复数个音频声道信号中的另一音频声道信号解码为第六复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号解码方法,所述多声道音频信号解码方法包括第一 OTT解码,将包括作为第一音频声道信号和第二音频声道信号的两个编码的音频声道信号和空间信息的比特流进行解码,以便将第一音频声道信号解码为第一复数个音频声道信号,其中,所述空间信息包括相应的声道之间的幅值差和/或相似性的信息;第二 OTT解码,将第二音频声道信号解码为第二复数个声道信号作为第一和第二声道信号;第三OTT解码,将在第一 OTT解码中获得的第一复数个音频声道信号中的一个音频声道信号解码为第三复数个声道信号;第四OTT解码,将第一声道信号解码为第四复数个声道信号;第五OTT解码,将第二声道信号解码为第五复数个声道信号;第六OTT解码,将在第一OTT解码中获得的第一复数个音频声道信号中的另一音频声道信号解码为第六复数个声道信号。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音 频信号编码系统,所述多声道音频信号编码系统包括第一 OTT编码器,从左前音频声道(LF)信号和左环绕音频声道(LS)信号产生第一 OTT音频声道(L’)信号和第一 OTT参数,其中,第一 OTT参数包括关于相应的LF和LS声道之间的幅值差和/或相似性的信息;第二OTT编码器,从右前音频声道(RF)信号和右环绕音频声道(RS)信号产生第二 OTT音频声道(R’ )信号和第二 OTT参数,其中,第二 OTT参数包括相应的RF和RS声道之间的幅值差和/或相似性的信息;第三OTT编码器,从中音频声道(C)信号和低音音频声道(LFE)信号产生第三OTT音频声道C’信号和第三OTT参数,其中,第三OTT参数包括相应的C和LFE声道之间的幅值差和/或相似性的信息;TTT编码器,从分别由第一 OTT编码器、第二 OTT编码器和第三OTT编码器输出的L’、R’和C’声道信号产生复数个TTT音频声道信号和TTT参数,其中,所述TTT参数包括相应的L’、R’和C’声道之间的幅值差和/或相似性的信息;第四OTT编码器,从由TTT编码器输出的复数个TTT音频声道信号产生第四OTT音频声道信号和第四OTT参数,其中,第四OTT参数包括相应的复数个TTT声道之间的幅值差和/或相似性的信息;比特流产生单元,压缩由第一至第四OTT编码器产生的OTT参数、由TTT编码器产生的TTT参数以及由第四OTT编码器产生的第四OTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码系统,所述多声道音频信号编码系统包括第一 OTT编码器,从前左音频声道(FL)信号和前左中音频声道(FLC)信号产生第一 OTT音频声道(FL’ )信号和第一 OTT参数,其中,第一 OTT参数包括相应的FL和FLC声道之间的幅值差和/或相似性的信息;第二OTT编码器,从前右音频声道(FR)信号和前右中音频声道(FRC)信号产生第二 OTT音频声道FR’信号和第二 OTT参数,其中,第二 OTT参数包括关于相应的FR和FRC声道之间的幅值差和/或相似性的信息;第三OTT编码器,从由第一 OTT编码器产生的音频声道(FL’)信号和后左音频声道(BL)信号产生第三OTT音频声道(L’)信号和第三OTT参数,其中,第三OTT参数包括相应的FL’和BL声道之间的幅值差和/或相似性的信息;第四OTT编码器,从由第二 OTT编码器产生的音频声道(FR’ )信号和后右音频声道(BR)信号产生第四OTT音频声道(R’)信号和第四OTT参数,其中,第四OTT参数包括相应的FR’和BR声道之间的幅值差和/或相似性的信息;第五OTT编码器,从中音频声道(C)信号和低音音频声道LFE信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数包括相应的C和LFE声道之间的幅值差和/或相似性的信息;TTT编码器,从分别由第三OTT编码器、第四OTT编码器和第五OTT编码器输出的L’、R’和C’声道信号产生复数个TTT音频声道信号和TTT参数,其中,TTT参数包括相应的L’、R’和C’声道之间的幅值差和/或相似性的信息;比特流产生单元,压缩由第一至第五OTT编码器以及TTT编码器产生的参数以及由TTT编码器产生的复数个TTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码系统,所述多声道音频信号编码系统包括第一 OTT编码器,从前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(FC’)信号和第一 OTT参数,其中,第一 OTT参数包括相应的FLC和FRC声道之间的幅值差和/或相似性的信息;第二 OTT编码器,从由第一 OTT编码器输出的音频声道(FC’ )信号和中音频声道(C)信号产生第二 OTT音频声道(C’’ )信号和第二 OTT参数,其中,第二 OTT参数包括相应的FC’和 C声道之间的幅值差和/或相似性的信息;第三OTT编码器,从前左音频声道(FL)信号和后左音频声道(BL)信号产生第三OTT音频声道(L’)信号和第三OTT参数,其中,第三OTT参数可包括相应的FL和BL声道之间的幅值差和/或相似性的信息;第四OTT编码器,从音频声道(FR)信号和后右音频声道(BR)信号产生第四OTT音频声道(R’ )信号和第四OTT参数,其中,第四OTT参数包括相应的FR和BR声道之间的幅值差和/或相似性的信息;第五OTT编码器,从由第二 OTT编码器输出的音频声道(C’’)信号和低音音频声道(LFE)信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数包括相应的C’’和LFE声道之间的幅值差和/或相似性的信息;ΤΤΤ编码器,从分别由第三OTT编码器、第四OTT编码器和第五OTT编码器输出的L’、R’和C’声道信号产生复数个TTT音频声道信号和TTT参数,其中,TTT参数包括L’、R’和C’声道之间的幅值差和/或相似性的信息;匕匕特流产生单元,压缩由第一至第五OTT编码器以及TTT编码器产生的参数以及由TTT编码器产生的复数个TTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码系统,所述多声道音频信号编码系统包括第一 OTT编码器,从前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(C’ )信号和第一 OTT参数,其中,第一 OTT参数包括相应的FLC和FRC声道之间的幅值差和/或相似性的信息;第二 OTT编码器,从前左音频声道(FL)信号和后左音频声道(BL)信号产生第二 OTT音频声道(L’ )信号和第二 OTT参数,其中,第二 OTT参数包括相应的FL和BL声道之间的幅值差和/或相似性的信息;第三OTT编码器,从前右音频声道(FR)信号和后右音频声道(BR)信号产生第三OTT音频声道(R’)信号和第三OTT参数,其中,第三OTT参数包括相应的FR和BR声道之间的幅值差和/或相似性的信息;第四OTT编码器,从中音频声道(C)信号和低音音频声道(LFE)信号产生第四OTT音频声道(C’’)信号和第四OTT参数,其中,第四OTT参数包括相应的C和LFE声道之间的幅值差和/或相似性的信息;第五OTT编码器,从由第二 OTT编码器输出的音频声道(L’ )信号和由第一 OTT编码器输出的音频声道(C’ )信号产生第五OTT音频声道信号和第五OTT参数,其中,第五OTT参数包括相应的L’和C’声道之间的幅值差和/或相似性的信息;第六OTT编码器,从由第三OTT编码器输出的音频声道(R’ )信号和由第四OTT编码器输出的音频声道(C’’ )信号产生第六OTT音频声道信号和第六OTT参数,其中,第六OTT参数包括相应的R’和C’ ’声道之间的幅值差和/或相似性的信息;比特流产生单元,压缩由第一至第六OTT编码器产生的参数、由第五OTT编码器产生的第五OTT音频声道信号以及由第六OTT编码器产生的第六OTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码方法,所述多声道音频信号编码方法包括第一 OTT编码,从左前音频声道(LF)信号和左环绕音频声道(LS)信号产生第一 OTT音频声道(L’)信号和第一 OTT参数,其中,第一 OTT参数包括关于相应的LF和LS声道之间的幅值差和/或相似性的信息;第二 OTT编码,从右前音频声道(RF)信号和右环绕音频声道(RS)信号产生第二 OTT音频声道(R’)信号和第二 OTT参数,其中,第二 OTT参数包括相应的RF和RS声道之间的幅值差和/或相似性的信息;第三OTT编码,从中音频声道(C)信号和低音音频声道(LFE)信号产生第三OTT音频声道(C’ )信号和第三OTT参数,其中,第三OTT参数包括相应的C和LFE声道之 间的幅值差和/或相似性的信息;TTT编码,从分别在第一 OTT编码、第二 OTT编码和第三OTT编码中产生的L’、R’和C’声道信号产生TTT参数和复数个TTT音频声道信号,其中,TTT参数包括相应的L’、R’和C’声道之间的幅值差和/或相似性的信息;第四OTT编码,从在TTT编码中产生的复数个TTT音频声道信号产生第四OTT音频声道信号和第四OTT参数;压缩在第一至第四OTT编码以及TTT编码中产生的参数和在第四OTT编码中产生的第四OTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码方法,所述多声道音频信号编码方法包括第一 OTT编码,从前左音频声道(FL)信号和前左中音频声道(FLC)信号产生第一 OTT音频声道(FL’ )信号和第一 OTT参数,其中,第一 OTT参数包括相应的FL和FLC声道之间的幅值差和/或相似性的信息;第二 OTT编码,从前右音频声道(FR)信号和前右中音频声道(FRC)信号产生第二 OTT音频声道(FR’)信号和第二 OTT参数,其中,第二 OTT参数包括关于相应的FR和FRC声道之间的幅值差和/或相似性的信息;第三OTT编码,从在第一 OTT编码中产生的音频声道(FL’)信号和后左音频声道(BL)信号产生第三OTT音频声道(L’ )信号和第三OTT参数,其中,第三OTT参数包括相应的FL’和BL声道之间的幅值差和/或相似性的信息;第四OTT编码,从在第二OTT编码中产生的音频声道(FR’ )信号和后右音频声道(BR)信号产生第四OTT音频声道(R’)信号和第四OTT参数,其中,第四OTT参数包括相应的FR’和BR声道之间的幅值差和/或相似性的信息;第五OTT编码,从中音频声道(C)信号和低音音频声道(LFE)信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数包括相应的C和LFE声道之间的幅值差和/或相似性的信息;ΤΤΤ编码,从分别在第三OTT编码、第四OTT编码和第五OTT编码中产生的L’、R’和C’声道信号产生复数个TTT立体声音频声道信号和TTT参数,其中,TTT参数包括相应的L’、R’和C’声道之间的幅值差和/或相似性的信息;压缩在第一至第五OTT编码中产生的参数以及在TTT编码中产生的复数个立体声音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码方法,所述多声道音频信号编码方法包括第一 OTT编码,从前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(FC’)信号和第一 OTT参数,其中,第一 OTT参数包括相应的FLC和FRC声道之间的幅值差和/或相似性的信息;第二 OTT编码,从在第一 OTT编码中产生的音频声道(FC’ )信号和中音频声道(C)信号产生第二 OTT音频声道(C’’)信号和第二 OTT参数,其中,第二 OTT参数包括相应的FC’和C声道之间的幅值差和/或相似性的信息;第三OTT编码,从前左音频声道(FL)信号和后左音频声道(BL)信号产生第三OTT音频声道(L’)信号和第三OTT参数,其中,第三OTT参数可包括相应的FL和BL声道之间的幅值差和/或相似性的信息;第四OTT编码,从前右音频声道(FR)信号和后右音频声道(BR)信号产生第四OTT音频声道(R’)信号和第四OTT参数,其中,第四OTT参数包括相应的FR和BR声道之间的幅值差和/ 或相似性的信息;第五OTT编码,从在第二 OTT编码中产生的音频声道(C’’)信号和低音音频声道(LFE)信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数包括相应的C’ ’和LFE声道之间的幅值差和/或相似性的信息;TTT编码器,从分别在第三OTT编码、第四OTT编码和第五OTT编码中产生的L’、R’和C’声道信号产生复数个TTT (立体声)音频声道信号和TTT参数,其中,TTT参数包括相应L’、R’和C’声道之间的幅值差和/或相似性的信息;压缩在第一至第五OTT编码中产生的参数以及在TTT编码中产生的音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括一种多声道音频信号编码方法,所述多声道音频信号编码方法包括第一 OTT编码,从前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(C’ )信号和第一 OTT参数,其中,第一 OTT参数包括相应的FLC和FRC声道之间的幅值差和/或相似性的信息;第二 OTT编码,从前左音频声道(FL)信号和后左音频声道(BL)信号产生第二 OTT音频声道(L’ )信号和第二 OTT参数,其中,第二 OTT参数包括相应的FL和BL声道之间的幅值差和/或相似性的信息;第三OTT编码,从前右音频声道(FR)信号和后右音频声道(BR)信号产生第三OTT音频声道R’信号和第三OTT参数,其中,第三OTT参数包括相应的FR和BR声道之间的幅值差和/或相似性的信息;第四OTT编码,从中音频声道(C)信号和低音音频声道(LFE)信号产生第四OTT音频声道(C’’)信号和第四OTT参数,其中,第四OTT参数包括相应的C和LFE声道之间的幅值差和/或相似性的信息;第五OTT编码,从在第二 OTT编码中产生的音频声道(L’)信号和在第一 OTT编码中产生的音频声道(C’)信号产生第五OTT音频声道信号和第五OTT参数,其中,第五OTT参数包括相应的L’和C’声道之间的幅值差和/或相似性的信息;第六OTT编码,从在第三OTT编码中产生的音频声道(R’)信号和在第四OTT编码中产生的音频声道(C’ ’ )信号产生第六OTT音频声道信号和第六OTT参数,其中,第六OTT参数包括相应的R’和C’ ’声道之间的幅值差和/或相似性的信息;压缩在第一至第六OTT编码中产生的参数、在第五OTT编码中产生的第五OTT音频声道信号以及在第六OTT编码中产生的第六OTT音频声道信号,以产生比特流。为了实现至少上面的和/或其他方面和优点,本发明的实施例包括至少一种包含用于控制实现本发明的实施例的至少一个处理部件的计算机可读代码的介质。有益效果在根据本发明的对多声道音频信号进行编码/解码的设备和方法中,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道的音频声道信号。可仅通过对输入的比特流进行部分地解码而非全部解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器设置解码级别,并根据解码级别输出音频声道信号。因此,可降低解码的复杂性。


通过下面结合附图对实施例进行的描述,本发明的这些和/或其他方面和优点将会变得清楚并更易于理解,其中图I示出传统的MPEG环绕解码器;图2示出用于对输入的音频声道信号进行编码的传统的编码器、作为结果的编码的音频声道信号比特流以及用于对编码的音频声道信号进行解码的传统的解码器;图3示出根据本发明实施例的多声道音频信号解码系统; 图4示出根据本发明实施例的多声道音频信号解码方法;图5示出根据本发明实施例的通过参照各种解码级别对如图4所述的下混频的信号进行解码的解码器;图6示出根据本发明实施例的多声道音频信号解码系统;图7示出根据本发明的另一实施例的多声道音频信号解码方法;图8示出根据本发明实施例的多声道音频信号解码系统;图9示出根据本发明的另一实施例的多声道音频信号解码方法;图10示出根据本发明的另一实施例的多声道音频信号解码系统;图11示出根据本发明的另一实施例的多声道音频信号解码方法;图12示出根据本发明的另一实施例的多声道音频信号解码系统;图13示出根据本发明实施例的多声道音频信号解码方法;图14示出根据本发明实施例的多声道音频信号编码系统;图15示出根据本发明实施例的多声道音频信号编码方法;图16示出根据本发明的另一实施例的多声道音频信号编码系统;图17示出根据本发明实施例的多声道音频信号编码方法;图18示出根据本发明的另一实施例的多声道音频信号编码系统;图19示出根据本发明的另一实施例的多声道音频信号编码方法;图20示出根据本发明的另一实施例的多声道音频信号编码系统;图21示出根据本发明的另一实施例的多声道音频信号编码方法。
具体实施例方式以下,将参照附图更充分地描述本发明的示例性实施例,示例性实施例在附图中示出,其中,相同的标号始终表示相同的部件。以下通过参照附图描述实施例以解释本发明。以下,根据本发明的不同实施例,即使单个输入比特流也可基于接收器扬声器配置的类型被选择性地解码为合适数量的声道的音频声道信号。相应地,可仅通过对输入的比特流进行部分解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置用于设置解码的等级的解码级别,并根据解码级别输出音频声道信号,从而降低解码复杂性。
图3示出根据本发明实施例的多声道音频信号解码系统,作为示例,该多声道音频信号解码系统可包括音频解码器300和解码级别产生单元350。解码级别产生单元350可产生有助于将具有预定数量N的音频声道信号和空间信息的比特流解码为预定数量L(L^N)的音频声道信号的解码级别信息。这里,空间信息可包括在声道的相应编码期间关于声道之间的幅值差和相似性的信息。因此,音频解码器300可根据这样的解码级别信息选择性地对比特流进行解码,并输出L个音频声道信号。图4示出根据本发明实施例的多声道音频信号解码方法。在操作400,可产生在将例如包括N个音频声道信号和空间信息的比特流选择性地解码为L个音频声道信号时使用的解码级别信息。比特流可以是包括有空间信息的下混频的信号,例如,单声道信号,通过基于空间信息更改下混频的信号来最终上混频为另外的信号。这里,如上面提到的,比特流可包括下混频的信号和附加素材(material),作为示例,附加素材可被不同地称为特别参 数或空间提示(cue),其中,附加素材包括关于每个混频的信号如何彼此区分或如何与下混频的单声道信号区分开来的信息。通过仅发送下混频的信号和附加素材的技术,可减少基本数据量,例如,与每个单独的左示例声道和右示例声道所需的数据相比,对于下混频的单声道信号,差不多发送全部数据的一半。因此,进一步来说,图5进一步示出通过参照各种解码级别对下混频的信号进行解码的解码器。标号dlO、dll和dl2表示这样的解码级别,其中,dlO表示核心解码级别。图5示出在dll级别的2至3解码工具(TTT),以及在dl2级别的I至2解码工具(OTT)。作为示例,如果dl2级别用于对下混频的信号解码,则针对左声道、右声道和中声道的扬声器,仅左(L’)、右(R’ )和中(C’ )被解码并输出。下面参照图6进一步讨论该操作。回到图4,在操作450,可基于解码级别对比特流解码以输出与适当的解码级别相应的期望数量的解码的音频声道信号。图6示出根据本发明实施例的多声道音频信号解码系统,作为示例,该多声道音频信号解码系统可包括第一 OTT解码器600、TTT解码器610、第二 OTT解码器620、第三OTT解码器630以及第四OTT解码器640。多声道音频信号解码系统还可包括例如解码级别产生单元650。第一OTT解码器600对包括一个音频声道信号(例如,下混频信号)以及上述空间信息的比特流进行解码,从而单个音频声道信号被上混频并被输出为两个音频声道信号。这里,空间信息可包括在声道的相应编码期间声道之间的幅值差以及关于相同声道之间的相似性的信息。如果在解码期间使用dll级别,则由第一 OTT解码器600输出的两个音频声道可被当作立体声音频声道,例如,选择性地输出左扬声器和右扬声器。TTT解码器610将两个音频声道信号解码为三个音频声道信号。这里,由TTT解码器610输出的三个音频声道信号的三个声道可被当作例如左音频声道L’、右音频声道R’以及中音频声道C’。当由TTT解码器610输出的三个音频声道信号被称为第一、第二和第三声道信号时,第二 OTT解码器620可将第一声道信号解码为两个声道信号。这两个声道信号的两个声道可被当作例如左前音频声道LF和左环绕音频声道LS。类似地,第三OTT解码器630可将第二声道信号解码为两个声道信号。这两个声道信号的两个声道可被当作例如右前音频声道RF和右环绕音频声道RS。同样,第四OTT解码器640可将第三声道信号解码为两个声道信号。这两个声道信号的两个声道可以是例如中音频声道C和低音音频声道LFE。在一个实施例中,解码级别产生单元650可产生在将比特流选择性地解码为预定数量的音频声道信号时使用的解码级别信息。作为示例,解码级别信息可包括第一解码级别dlO、第二解码级别dll、第三解码级别dl2以及第四解码级别dl3。第一解码级别dlO可用在包括一个音频声道信号的比特流的解码中,以控制将该比特流解码为一个音频声道信号进行输出的选择级别。第二解码级别dll可用在包括在第一解码级别dlO输出的单个音频声道信号的比特流的解码中,以控制将该比特流解码为两个音频声道信号的选择级别。第三解码级别dl2可用在包括在第二解码级别dll输出的两个音频声道信号的比特流的解码中,以控制将该比特流解码为三个音频声道信号(例如,L’、R’和C’声道)的选择级别。第四解码级别dl3可用在包括在第三解码级别dl2输出的三个音频声道信号的比特流的解码中,以控制将该比特流解码为例如5. I音频声道LF、LS、RF、RS、C和LFE的选择级别。
·
图7示出根据本发明实施例的多声道音频信号解码方法。在操作700,对包括单个音频声道信号和空间信息的比特流进行解码,以输出两个音频声道信号,其中,空间信息包括例如声道之间的幅值差和/或关于声道之间的相似性的信息。所述两个声道可被当作例如立体声音频声道。在操作720,可将例如来自操作700的两个音频声道信号解码为三个音频声道信号,其中,例如由TTT解码器610输出的所述三个音频声道的三个声道被当作左音频声道1/、右音频声道1 ’以及中音频声道C’。当例如在操作720获得的三个音频声道信号被称为第一、第二和第三声道信号时,在操作740,第一、第二和第三声道信号的每个被解码为两个声道信号,从而输出5. I声道信号。这里,第一声道解码为的两个声道信号的两个声道可被当作左前音频声道LF和左环绕音频声道LS,第二声道信号解码为的两个声道信号的两个声道可被当作右前音频声道RF和右环绕音频声道RS,第三声道信号解码为的两个声道信号的两个声道可被当作中音频声道C和低音音频声道LFE。因此,为了实现将比特流解码为预定数量的音频声道信号,可能需要解码级别信息。解码级别信息可包括第一解码级别,可用在将包括一个音频声道信号的比特流解码为一个音频声道信号的选择性的解码中;第二解码级别,可用在将包括在第一解码级别输出的单个音频声道信号的比特流解码为两个音频声道信号的选择性的解码中;第三解码级另|J,可用在将包括在第二解码级别输出的两个音频声道信号的比特流解码为三个声道L’、R’和C’的三个音频声道信号的选择性的解码中;第四解码级别,可用在将包括在第三解码级别输出的三个音频声道信号的比特流解码为例如5. I音频声道LF、LS、RF、RS、C和LFE的信号的选择性的解码中。图8示出根据本发明实施例的多声道音频信号解码系统,作为示例,该多声道音频信号解码系统可包括=TTT解码器800、第一 OTT解码器810、第二 OTT解码器820、第三OTT解码器830、第四OTT解码器840以及第五OTT解码器850。多声道音频信号解码系统还可包括例如解码级别产生单元860。TTT解码器800对包括两个音频声道信号和空间信息的比特流进行解码,以将两个音频声道信号输出为例如三个音频声道信号。这里,空间信息可包括在声道的相应的编码期间关于声道之间的幅值差和相似性的信息。由TTT解码器800输出的三个音频声道信号的三个声道可被当作例如左音频声道L’、右音频声道R’以及中音频声道C’。在由TTT解码器800输出的三个音频声道信号被称为第一、第二和第三声道信号时,第一 OTT解码器810将第一声道信号解码为两个声道信号,其中,这两个声道信号的两个声道被当作前左音频声道FL’和后左音频声道BL。第二 OTT解码器820可将第二声道信号解码为两个另外的声道信号,其中,这两个声道信号的两个声道可被当作前右音频声道FR’和后右音频声道BR。第三OTT解码器830可将第三声道信号解码为两个另外的声道信号,其中,这两个声道信号的两个声道被当作中音频声道C和低音音频声道LFE。第四OTT解码器840可进一步将第一 OTT解码器810的输出信号中的一个(即, 前左音频声道FL’的信号)解码为两个另外的声道信号,其中,由第四OTT解码器840输出的这两个声道信号的两个声道被当作前左音频声道FL和前左中音频声道FLC。第五OTT解码器850可进一步将第二 OTT解码器820的输出信号中的一个(即,前右音频声道FR’的信号)解码为两个另外的声道信号,其中,由第五OTT解码器850输出的这两个声道信号的两个声道被当作前右音频声道FR和前右中音频声道FRC。解码级别产生单元860可产生在将比特流选择性地解码为预定数量的音频声道信号时使用的解码级别信息。这里,作为示例,解码级别信息可包括第一解码级别dlO、第二解码级别dll、第三解码级别dl2以及第四解码级别dl3。第一解码级别dlO可在将包括两个音频声道信号的比特流选择性地解码为两个音频声道信号时使用。第二解码级别dll可在将包括在第一解码级别dlO输出的两个音频声道信号的比特流选择性地解码为例如三个音频声道L’、R’和C’的信号时使用。第三解码级别dl2可在将包括在第二解码级别dl I输出的三个音频声道信号的比特流选择性地解码为例如5. I音频声道FL’、BL、FR’、BR、C和LFE的信号时使用。第四解码级别dl3可在例如将FL’声道信号选择性地解码为两个音频声道FL和FLC的信号以及将FR’声道信号选择性地解码为两个音频声道FR和FRC的信号时使用,从而输出总共7. I声道信号。图9示出根据本发明实施例的多声道音频信号解码方法。在操作900,对包括两个音频声道信号和空间信息的比特流进行解码,以输出三个音频声道信号,其中,空间信息可包括在声道的相应的编码期间关于声道之间的幅值差和相似性的信息。所述三个音频声道信号的三个声道可被当作例如左音频声道L’、右音频声道R’和中音频声道C’。当在操作900获得的三个音频声道信号被称为第一、第二和第三声道信号时,在操作920,可将第一、第二和第三声道信号中的每个进一步解码为两个另外的声道信号,以输出5. I声道信号。第一声道解码为的两个声道信号的两个声道可被当作前左音频声道FL’和后左音频声道BL,第二声道信号解码为的两个声道信号的两个声道可被当作前右音频声道FR’和后右音频声道BR,第三声道信号解码为的两个声道信号的两个声道可被当作中音频声道C和低音音频声道LFE。在操作940,5. I声道的两个声道的信号的每个被进一步解码,以输出7. I声道的信号。在操作940中的两个声道信号被解码为的信号的声道可被当作例如前左音频声道FL、前左中音频声道FLC、前右音频声道FR以及前右中音频声道FRC。为了实现上述将比特流解码为预定数量的音频声道信号,可使用例如由解码器生成的解码级别信息,以便可基于适当的解码级别对音频声道信号进行解码并输出。在本实施例中,解码级别信息可包括第一解码级别dio,可在将包括两个音频声道信号的比特流选择性地解码为两个音频声道信号时使用;第二解码级别dll,可在将包括在第一解码级别dio输出的两个音频声道信号的比特流选择性地解码为例如三个音频声道L’、R’和C’的信号时使用;第三解码级别dl2,可在将包括三个音频声道信号的比特流选择性地解码为5. I音频声道LF、LS、RF、RS、C和LFE的信号时使用;第四解码级别dl3,可在将FL’声道信号选择性地解码为两个音频声道FL和FLC的信号以及将FR’声道信号选择性地解码为两个声道信号FR和FRC的信号以输出总共7. I声道信号时使用。图10示出根据本发明实施例的多声道音频信号解码系统,作为示例,该多声道音 频信号解码系统可包括=TTT解码器1000、第一 OTT解码器1010、第二 OTT解码器1020、第三OTT解码器1030、第四OTT解码器1040以及第五OTT解码器1050。多声道音频信号解码系统还可包括例如解码级别产生单元1060。TTT解码器1000可对包括两个音频声道信号和空间信息的比特流进行解码,以从两个音频声道信号输出三个音频声道信号。这里,空间信息可包括在声道的相应的编码期间关于声道之间的幅值差和相似性的信息。由TTT解码器1000输出的三个音频声道信号的三个声道可被当作例如左音频声道L’、右音频声道R’以及中音频声道C’。在由TTT解码器1000输出的三个音频声道信号被称为第一、第二和第三声道信号时,第一 OTT解码器1010可将第一声道信号解码为两个声道信号。这两个声道信号的两个声道可被当作例如前左音频声道FL和后左音频声道BL。第二 OTT解码器1020可将第二声道信号解码为两个声道信号,其中,这两个声道信号的两个声道可被当作例如前右音频声道FR和后右音频声道BR。类似地,第三OTT解码器1030可将第三声道信号解码为两个声道信号,其中,这两个声道信号的两个声道被当作例如中音频声道C’ ’和低音音频声道LFE。第四OTT解码器1040可进一步将第三OTT解码器1030的输出信号中的一个(例如,中音频声道C’’的信号)解码为两个声道信号,其中,由第四OTT解码器1040输出的这两个声道信号的两个声道被当作例如前中音频声道FC’和中音频声道C。第五OTT解码器1050可进一步将第四OTT解码器1040的输出信号中的一个(例如,FC’声道信号)解码为两个声道信号,其中,由第五OTT解码器1050输出的这两个声道信号的两个声道被当作例如前左中音频声道FLC和前右中音频声道FRC。在一个实施例中,解码级别产生单元1060可产生可在将比特流选择性地解码为预定数量的音频声道信号期间使用的解码级别信息。作为示例,解码级别信息可包括第一解码级别dlO、第二解码级别dll、第三解码级别dl2以及第四解码级别dl3。这里,第一解码级别dlO可在将包括两个音频声道信号的比特流解码为两个音频声道信号的选择性解码期间使用,第二解码级别dll可在将包括在第一解码级别dlO输出的两个音频声道信号的比特流选择性地解码为三个音频声道L’、R’和C’的信号期间使用,第三解码级别dl2可在将包括在第二解码级别dl I输出的三个音频声道信号的比特流选择性地解码为5. I音频声道FL、BL、FR、BR、C’ ’和LFE的信号期间使用,第四解码级别dl3可在将FC’声道信号选择性地解码为两个声道FLC和FRC信号期间使用,从而输出总共7. I
声道信号。图11示出根据本发明实施例的多声道音频信号解码方法。在操作1100,对包括两个音频声道信号和空间信息的比特流进行解码,以从两个音频声道信号输出三个音频声道信号,其中,空间信息包括声道之间的幅值差和关于声道之间的相似性的信息。所述三个音频声道信号的三个声道可被当作例如左音频声道L’、右音频声道R’和中音频声道C’。当在操作1100获得的三个音频声道信号被称为第一、第二和第三声道信号时,在操作1120,可将第一、第二和第三声道信号中的每个解码为两个声道信号,以输出5. I声道信号。更具体地说,第一声道解码为的两个声道信号的两个声道可被当作前左音频声道FL和后左音频声道BL,第二声道信号解码为的两个声道信号的两个声道可被当作前右音频声道FR和后右音频声道BR,第三声道信号解码为的两个声道信号的两个声道可被当作中音频声道C’ ’和低音音频声道LFE。 在操作1140,在操作1120输出的5. I声道的两个声道的信号可被进一步解码为两个声道信号,其中,这两个声道信号的声道被当作例如前中音频声道FC’和中音频声道C。在操作1160,在操作1140输出的两个声道信号中的一个例如可被解码为两个声道信号,从而输出7. I声道信号,其中,这两个声道信号的声道被当作例如前左中音频声道FLC和前右中音频声道FRC。因此,根据本实施例,为了实现上述将比特流选择性解码为预定数量的音频声道信号,可使用由解码器生成的解码级别信息,以便基于解码级别输出音频声道信号。解码级别信息可包括第一解码级别dlO,可在将包括两个音频声道信号的比特流选择性地解码为两个音频声道信号期间使用;第二解码级别dl I,可在将包括在第一解码级别dlO输出的两个音频声道信号的比特流选择性地解码为三个音频声道L’、R’和C’的信号期间使用;第三解码级别dl2,可在将包括三个音频声道信号的比特流选择性地解码为5. I音频声道FL、BL、FR、BR、C’ ’和LFE的信号期间使用;第四解码级别dl3,可在将FC’声道信号选择性地解码为两个音频声道FLC和FRC的信号期间使用,从而输出总共7. I声道信号。图12示出根据本发明实施例的多声道音频信号解码系统,作为示例,该多声道音频信号解码系统可包括 第一 OTT解码器1200、第二 OTT解码器1210、第三OTT解码器1220、第四OTT解码器1230、第五OTT解码器1240以及第六OTT解码器1250。在实施例中,多声道音频信号解码系统还可包括例如解码级别产生单元1260。响应于包括两个音频声道信号(例如,第一和第二音频声道信号)和空间信息的比特流,第一 OTT解码器1200可将第一音频声道信号解码为两个音频声道信号。这里,空间信息可包括在声道的相应的编码期间关于声道之间的幅值差以及声道之间的相似性的信息。由第一 OTT解码器1200输出的两个音频信号的声道可被当作例如左音频声道L’和中音频声道C’。第二 OTT解码器1210可对比特流进行解码,以输出两个音频声道信号作为第二音频声道信号。由第二 OTT解码器1210输出的两个音频声道信号的声道可被作为右音频声道R’和中音频声道C’’。第三OTT解码器1220可将由第一 OTT解码器1200输出的两个声道信号中的一个(例如,L’声道信号)解码为另外两个声道信号。由第三OTT解码器1220输出的两个音频声道信号的两个声道可被作为例如前左音频声道FL和后左音频声道BL。由第二 OTT解码器1210输出的两个音频声道信号被称为第一和第二声道信号时,第四OTT解码器1230可将第一声道信号解码为两个声道信号,其中,这两个声道信号的两个声道可被当作前右音频声道FR和后右音频声道BR。第五OTT解码器1240可将第二声道信号解码为两个声道信号,其中,这两个声道信号的两个声道被当作中音频声道C和低音音频声道LFE。第六OTT解码器1250可将第一 OTT解码器1200的两个输出信号中的另一输出信号(例如,C’声道信号)解码为两个声道信号,其中,由第六OTT解码器1250输出的这两个声道信号的两个声道是前左中音频声道FLC和前右中音频声道FRC。在实施例中,解码级别产生单元1260可产生可在将比特流选择性地解码为预定数量的音频声道信号时使用的解码级别信息。作为示例,解码级别信息可包括第一解码级 别dlO、第二解码级别dll、第三解码级别dl2以及第四解码级别dl3。这里,第一解码级别dlO可在将包括两个音频声道信号的比特流选择性地解码为两个音频声道信号期间使用。第二解码级别dll可在将包括在第一解码级别dlO输出的两个音频声道信号的比特流选择性地解码为例如四个音频声道L’、C’、R’和C’’的信号期间使用。第三解码级别dl2可在例如将L’音频声道信号选择性地解码为两个音频声道FL和BL的信号期间、将要被解码的R’音频声道信号被选择性地解码为两个音频声道FR和BR的信号期间以及将要被解码的C’ ’音频声道信号被选择性地解码为两个声道信号C和LFE的信号期间使用。第四解码级别dl3可在将C’声道信号选择性地解码为两个声道FLC和FRC信号期间使用。图13示出根据本发明实施例的多声道音频信号解码方法。在操作1300,对包括两个音频声道信号(例如,第一音频声道信号和第二音频声道信号)和空间信息的比特流进行解码,以将第一音频声道信号输出为两个音频声道信号(例如,L’和C’音频声道信号),其中,空间信息可包括在声道的相应编码期间声道之间的幅值差和声道之间的相似性的信息。这里,L’和C’分别表示左音频声道和中音频声道。此外,在操作1300,可对比特流解码,以便将第二音频声道信号输出为两个音频声道信号例如R’和C’ ’音频声道信号,其中,R’和C’’分别表示右音频声道和中音频声道。在操作1320,在操作1300获得的L’信号可被解码为前左音频声道FL和后左音频声道BL的信号。在操作1340,第一音频信号被解码为前右音频声道(FR)信号和后右音频声道(BR)信号。在操作1360,第二声道(C’’)可被解码为中音频声道(C)信号和低音音频声道(LFE)信号。此外,在操作1380,在操作1300获得的C’声道信号可被解码为前左中音频声道(FLC)信号和前右中音频声道(FRC)信号。在该实施例中,为了实现将比特流选择性地解码为预定数量的音频声道信号,可使用由解码器生成的解码级别信息,以便基于解码级别输出音频声道信号。解码级别信息可包括第一解码级别dlO,可在将包括两个音频声道信号的比特流选择性地解码为两个音频声道信号期间使用;第二解码级别dll,可在将在第一解码级别dlO输出的两个音频声道信号选择性地解码为四个音频声道L’、R’、C’、和C’,的信号期间使用;第三解码级别dl2,可在将L’音频声道信号选择性地解码为FL和BL音频声道信号期间、将R’音频声道信号选择性地解码为FR和BR音频声道信号期间以及将C’ ’音频声道信号选择性地解码为C和LFE音频声道信号期间使用;第四解码级别dl3,可在将C’声道信号选择性地解码为FLC和FRC音频声道信号期间使用。在上面的实施例中,可使用时域瞬时整形(TP, temporal shaping)和瞬时包迹整形(TES, temporal envelope shaping)以获得中间输出。此外,每个解码级别可大于三树深(tree depth)。例如,以五个声道编码的MPEG环绕数据可被解码为被建立树结构的7个扬声器播放。根据上面所述,现在将进一步描述根据本发明实施例的对这样的多声道音频信号进行编码的系统、介质和方法。图14示出根据本发明实施例的多声道音频信号编码系统,该多声道音频信号编码系统可包括例如第一 OTT编码器1400、第二 OTT编码器1410、第三 OTT编码器1420、TTT编码器1430、第四OTT编码器1440以及比特流产生单元1450。第一 OTT编码器1400可使用左前音频声道(LF)信号和左环绕音频声道(LS)信号产生第一 OTT音频声道(L’)信号和第一 OTT参数(也可能被称为空间信息或空间提不),其中,第一 OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第二 OTT编码器1410可使用右前音频声道(RF)信号和右环绕音频声道(RS)信号产生第二 OTT音频声道(R’ )信号和第二 OTT参数,其中,第二 OTT参数可包括相应的声道之间的幅值差和关于相应的声道之间的相似性的信息。第三OTT编码器1420可使用中音频声道(C)信号和低音音频声道(LFE)信号产生第三OTT音频声道(C’ )信号和第三OTT参数,其中,第三OTT参数可包括声道的幅值之间的幅值差和关于相应的声道之间的相似性的信息。此外,TTT编码器1430可使用分别由第一 OTT编码器1400、第二 OTT编码器1410和第三OTT编码器1420输出的L’、R’和C,声道信号产生TTT音频声道信号和TTT参数,其中,所述TTT参数可包括相应的声道之间的幅值差和关于相应的声道之间的相似性的信息。第四OTT编码器1440可使用由TTT编码器1430输出的TTT音频声道信号产生第四OTT音频声道信号和第四OTT参数,其中,第四OTT参数可包括相应的声道之间的幅值差和关于相应的声道之间的相似性的信息。然后,比特流产生单元1450可压缩由第一至第四OTT编码器1400、1410、1420和1440产生的OTT参数、由TTT编码器1430产生的TTT参数以及由第四OTT编码器1440产生的音频信号,以产生以后可基于这样的编码的音频信号和压缩的参数信息被解码的比特流。图15示出根据本发明实施例的多声道音频信号编码方法。在操作1500,可从左前音频声道(LF)信号和左环绕音频声道(LS)信号产生第一 OTT参数和第一 OTT音频声道(L’ )信号。在操作1510,可从右前音频声道(RF)信号和右环绕音频声道(RS)信号产生第二OTT参数和第二 OTT音频声道(R’ )信号。在操作1520,可从中音频声道(C)信号和低音音频声道(LFE)信号产生第三OTT参数和第三OTT音频声道(C’ )信号。在操作1530,还可从分别在操作1500、1510和1520产生的L’、R’和C’声道信号产生TTT参数和TTT (立体声)音频声道信号。在操作1540,可从在操作1530产生的立体声音频声道信号产生第四OTT参数和第四OTT音频声道(下混频的单声道)信号。在操作1550,压缩在操作1500、1510、1520、1530和1540产生的参数以及在操作1540产生的单声道的下混频音频声道信号,以产生比特流。图16示出根据本发明实施例的多声道音频信号编码系统,该多声道音频信号编码系统可包括例如第一 OTT编码器1600、第二 OTT编码器1610、第三OTT编码器1620、第四OTT编码器1630、第五OTT编码器1640、TTT编码器1650、以及比特流产生单元1660。第一 OTT编码器1600可使用前左音频声道(FL)信号和前左中音频声道(FLC)信号产生第一 OTT音频声道(FL’ )信号和第一 OTT参数,其中,第一 OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第二 OTT编码器1610可使用前右音频声道(FR)信号和前右中音频声道(FRC)信号产生第二 OTT音频声道(FR’ )信号和第二 OTT参数,其·中,第二 OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第三OTT编码器1620可使用由第一 OTT编码器1600产生的FL’音频声道信号和后左音频声道(BL)信号进一步产生第三OTT音频声道(L’ )信号和第三OTT参数,其中,第三OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第四OTT编码器1630可使用由第二 OTT编码器1610产生的FR’音频声道信号和后右音频声道(BR)信号产生第四OTT音频声道(R’)信号和第四OTT参数,其中,第四OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第五OTT编码器1640可使用中音频声道(C)信号和低音音频声道(LFE)信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。TTT编码器1650可使用分别由第三OTT编码器1620、第四OTT编码器1630和第五OTT编码器1640输出的L’、R’和C’声道信号产生TTT音频声道信号和TTT参数,其中,所述TTT参数可包括相应的声道之间的声道的幅值之差和相似性的信息。 然后,比特流产生单元1660可压缩由第一至第五OTT编码器1600至1640以及TTT编码器1650产生的参数以及由TTT编码器1650产生的TTT音频声道信号,以产生比特流。图17示出根据本发明实施例的多声道音频信号编码方法。在操作1700,可从FL音频声道信号和FLC音频声道信号产生第一 OTT音频声道(FL’)信号和第一 OTT参数。在操作1710,可从FR音频声道信号和FRC音频声道信号产生第二 OTT音频声道(FR’ )信号和第二 OTT参数。在操作1720,可使用在操作1700产生的FL’音频声道信号和BL音频声道信号产生第三OTT音频声道(L’ )信号和第三OTT参数。此外,在操作1730,可从在操作1710产生的FR’音频声道信号和BR音频声道信号产生第四OTT音频声道(R’)信号和第四OTT参数。在操作1740,可从C音频声道信号和LFE音频声道信号产生第五OTT音频声道(C’ )信号和第五OTT参数。在操作1750,可从分别在操作1720、1730和1740产生的L’、R’和C’声道信号产生TTT (立体声)音频声道信号和TTT参数。然后在操作1760,可压缩在操作1700、1710、1720、1730、1740和1750产生的参数以及在操作1750产生的立体声音频声道信号,以产生相应的比特流。
图18示出根据本发明实施例的多声道音频信号编码系统,该多声道音频信号编码系统可包括例如第一 OTT编码器1800、第二 OTT编码器1810、第三OTT编码器1820、第四OTT编码器1830、第五OTT编码器1840、TTT编码器1850、以及比特流产生单元1860。第一 OTT编码器1800可使用前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(FC’)信号和第一 OTT参数,其中,第一 OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第二 OTT编码器1810可使用由第一 OTT编码器1800输出的FC’音频声道信号和中音频声道(C)信号产生第二 OTT音频声道(C’’ )信号和第二 OTT参数,其中,第二 OTT参数可包括相应的声道之间的幅值差和关于相应的声道之间的相似性的信息。第三OTT编码器1820可使用前左音频声道(FL)信号和后左音频声道(BL)信号产生第三OTT音频声道(L’ )信号和第三OTT参数,其中,第三OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第四OTT编码器1830可使用FR音频声道信号和后右音频声道(BR)信号产生第四OTT音频声道(R’)信号和第四OTT参数,其中,第四OTT参数 可包括关于相应的声道之间的幅值差和相似性的信息。第五OTT编码器1840可使用由第二 OTT编码器1810输出的C’ ’音频声道信号和低音音频声道(LFE)信号产生第五OTT音频声道(C’ )信号和第五OTT参数,其中,第五OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。TTT编码器1850可使用分别由第三OTT编码器1820、第四OTT编码器1830和第五OTT编码器1840输出的L’、R’和C’声道信号产生TTT音频声道信号和TTT参数,其中,所述TTT参数可包括关于相应的声道之间的幅值差和相似性的信息。然后,比特流产生单元1860可压缩由第一至第五OTT编码器1800至1840以及TTT编码器1850产生的参数以及由TTT编码器1850产生的TTT音频声道信号,以产生比特流。图19示出根据本发明实施例的多声道音频信号编码方法。在操作1900,可从FLC音频声道信号和FRC音频声道信号产生第一 OTT音频声道(FC’)信号和第一 OTT参数。在操作1910,可从在操作1900产生的FC’音频声道信号和C音频声道信号产生第二 OTT音频声道(C’ ’)信号和第二 OTT参数。在操作1920,可从FL音频声道信号和BL音频声道信号产生第三OTT音频声道(L’ )信号和第三OTT参数。在操作1930,可从FR音频声道信号和BR音频声道信号产生第四OTT音频声道(R’)信号和第四OTT参数。在操作1940,可从在操作1910产生的C’ ’音频声道信号和LFE音频声道信号产生第五OTT音频声道(C’ )信号和第五OTT参数。在操作1950,可从分别在操作1920、1930和1940产生的L’、R’和C’声道信号产生TTT (立体声)音频声道信号和TTT参数,在操作1960,可压缩在操作1900至1950产生的参数和在操作1950产生的立体声音频声道信号,以产生比特流。图20示出根据本发明的实施例的多声道音频信号编码系统,该多声道音频信号编码系统可包括例如第一 OTT编码器2000、第二 OTT编码器2010、第三OTT编码器2020、第四OTT编码器2030、第五OTT编码器2040、第六OTT编码器2050、以及比特流产生单元2060。第一 OTT编码器2000可使用前左中音频声道(FLC)信号和前右中音频声道(FRC)信号产生第一 OTT音频声道(C’ )信号和第一 OTT参数,其中,第一 OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第二 OTT编码器2010可使用前左音频声道(FL)信号和后左音频声道(BL)信号产生第二 OTT音频声道(L’)信号和第二 OTT参数,其中,第
二OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第三OTT编码器2020可使用前右音频声道(FR)信号和后右音频声道(BR)信号产生第三OTT音频声道(R’ )信号和第三OTT参数,其中,第三OTT参数可包括关于相应的声道之间的幅值差和相似性的信肩、O第四OTT编码器2030可使用中音频声道(C)信号和低音音频声道(LFE)信号产生第四OTT音频声道(C’’)信号和第四OTT参数,其中,第四OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第五OTT编码器2040可使用由第二 OTT编码器2010输出的L’音频声道信号和由第一 OTT编码器2000输出的C’音频声道信号产生第五OTT音频声道信号和第五OTT参数,其中,第五OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。第六OTT编码器2050可使用由第三OTT编码器2020输出的R’音频声道信号和由第四OTT编码器2030输出的C’’音频声道信号产生第六OTT音频声道信号和第六 OTT参数,其中,第六OTT参数可包括关于相应的声道之间的幅值差和相似性的信息。然后,比特流产生单元2060可压缩由第一至第六OTT编码器2000至2050产生的参数、由第五OTT编码器2040产生的第五OTT音频声道信号以及由第六OTT编码器2050产生的第六OTT音频声道信号,以产生比特流。图21示出根据本发明的实施例的多声道音频信号编码方法。在操作2100,可从FLC音频声道信号和FRC音频声道信号产生第一 OTT音频声道(C’)信号和第一 OTT参数。在操作2110,可从FL音频声道信号和BL音频声道信号产生第二 OTT音频声道(L’ )信号和第二 OTT参数。在操作2120,可从FR音频声道信号和BR音频声道信号产生第三OTT音频声道(R’ )信号和第三OTT参数。在操作2130,可从C音频声道信号和LFE音频声道信号产生第四OTT音频声道(C’ ’ )信号和第四OTT参数。在操作2140,可从在操作2110产生的L’音频声道信号和在操作2100产生的C’音频声道信号产生第五OTT音频声道信号和第五OTT参数。在操作2150,可从在操作2120产生的R’音频声道信号和在操作2130产生的C’ ’音频声道信号产生第六OTT (立体声)音频声道信号和第六OTT参数。在操作2160,可压缩在操作2100至2140产生的参数、在操作2140产生的第五OTT音频声道信号以及在操作2150产生的立体声音频声道信号,以产生比特流。除了上面所述的实施例,本发明的实施例还可通过介质(例如,计算机可读介质)上的计算机可读代码/指令被实施,以控制至少一个处理部件来实施上述任何实施例。所述介质可对应于允许计算机可读代码的的存储和/或传输的任何介质。计算机可读代码可以各种方式在介质上被记录/传输,介质的示例包括例如磁存储介质(例如,ROM、软盘、硬盘等)、光记录介质(例如,CD-ROM或DVD)以及诸如通过互联网的载波的存储/传输介质。这里,介质还可以是根据本发明实施例的诸如作为结果的信号或比特流的信号。介质还可以是分布式网络,从而计算机可读代码以分布式方式存储/传输和执行。此外,仅作为示例,所述处理部件可包括处理器或计算机处理器,处理部件可以分布和/或包括在单个装置中。除了上面所述,尽管从系统的角度解释了实施例,但是相应的实施例可同样在设备中被实施。
尽管已经显示和描述了本发明的几个实施例,但是本领域的技术人员应该理解,在本发明的原理和精神的情况下,可以对这些实施例进行改变,本发明的范围由权利要求及其等同物限定。
权利要求
1.一种多声道音频信号解码系统,包括 TTT解码器,使用TTT空间信息将两个音频声道信号解码为第一、第二和第三声道信号; 第一 OTT解码器,使用第一 OTT空间信息将第一声道信号解码为第一复数个声道信号; 第二 OTT解码器,使用第二 OTT空间信息将第二声道信号解码为第二复数个声道信号; 第三OTT解码器,使用第三OTT空间信息将第三声道信号解码为第三复数个声道信号; 第四OTT解码器,使用第四OTT空间信息将由第一 OTT解码器输出的第一复数个声道信号中的一个声道信号解码为第四复数个声道信号; 第五OTT解码器,使用第五OTT空间信息将由第二 OTT解码器输出的第二复数个声道信号中的一个声道信号解码为第五复数个声道信号, 其中,第四OTT解码器和第五OTT解码器被配置为执行选择性解码,以产生7. I声道输出或5. I声道输出。
2.如权利要求I所述的系统,其中,使用树结构来分别布置所有的解码器。
全文摘要
一种对多声道音频信号进行编码/解码的系统、介质和方法,所述系统包括解码级别产生单元,产生用于将包括一定数量的音频声道信号和空间信息的比特流解码为一定数量的音频声道信号的解码级别信息,其中,所述空间信息包括关于相应的声道之间的幅值差和/或相似性的信息;音频解码器,根据解码级别信息对比特流进行解码。因此,即使单个输入流也可基于使用的扬声器配置的类型被选择性地解码为合适数量的声道。可通过对输入的比特流进行部分地解码来实现可伸缩声道解码。在可伸缩声道解码中,解码器可设置解码级别,并根据解码级别输出音频声道信号,从而可降低解码复杂性。
文档编号G10L19/00GK102779516SQ20121019174
公开日2012年11月14日 申请日期2006年11月21日 优先权日2005年11月21日
发明者吴殷美, 苗磊, 金重会 申请人:三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1