音频编码器和音频解码器的制作方法

文档序号:2827940阅读:274来源:国知局
专利名称:音频编码器和音频解码器的制作方法
技术领域
本发明涉及对多声道信号进行编码的音频编码器。尤其涉及生成可用便宜的解码器来再现编码了的多声道信号的编码信号的音频编码器。
另外,本发明涉及对用这种音频编码器编码后的编码信号进行解码的音频解码器。尤其涉及以双声道再现多声道信号的音频解码器。
背景技术
现有技术中,目前正在进行如下的音频编码器的研究开发,该音频编码器生成可用便宜的再现装置、尤其是双声道的再现装置来再现多声道信号的编码信号。例如,在MPEG2音频标准(ISO13818-3)中公开了这样的技术(参考非专利文献1),该技术区分把多声道信号下混合(down mix)为双声道的信号、和用于将该下混合后的信号恢复为多声道信号的信号,并分别作为第一编码信号、第二编码信号来进行编码,在便宜的解码器中,可以仅对上述第一编码信号进行解码。
非专利文献1MPEG2音频标准(ISO13818-3)。
但是,在MPEG2音频标准中,存在有不易分离上述第一编码信号和上述第二编码信号的问题。
图1表示MPEG2音频标准中的编码信号(比特流)的结构。图1中,帧头信息900表示每1152个取样进行了编码的一帧编码信息的起始位置。第一编码信号901是对将多声道信号下混合为双声道的立体声信号进行了编码的编码信号。第二编码信号902是对用于将下混合信号恢复为多声道信号的信号进行编码而得到的编码信号。
这里,仅要对一编码信号901进行解码的、例如仅以双声道再现为前提设计的便携电话等解码器,在取得第一编码信号901来进行解码后,想要跳过第二编码信号902,但是因下面的理由不能容易取得第二编码信号902的量,因此,不能容易跳过第二编码信号902。这是因为虽然各帧的帧大小可以通过分析各帧的帧头信息900来容易取得,但是第一编码信号901的编码量如图所示例,每个帧可变,所以第二编码信号902的编码量必然也可变。因此,第二编码信号902的编码量只能通过从该帧的帧大小来减去该帧的第一编码信号901的编码量来得知。所以,在对第一编码信号901进行解码时,必须逐一算出第一编码信号901的编码量,这样,存在有必须花费很大的运算资源的问题。
另外,在现有技术中,还有如下问题。
MPEG2音频标准中,由于在每个取样时刻通过预定的矩阵运算来进行下混合,所以解码后的下混合信号丢失了原来的多声道信号的空间信息。因此,在再现原来的空间信息后,在想要再现双声道下混合后的信号的情况下,即,想要再现实施了虚拟环绕(surrond)处理的双声道信号的情况下,一旦使用第一编码信号901和第二编码信号902来对多声道信号进行解码后,就需要根据头部传送函数来滤波处理空间信息,这样存在有必须耗费很大的运算资源的问题。

发明内容
本发明是鉴于这种现有技术的问题而作出的,其目的是提供一种生成可简单得知编码信号的编码量的编码信号的音频编码器,该编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号。
此外,本发明的第二目的是提供一种生成编码信息的音频编码器,该编码信息通过仅再现下混合信号就可再现原来的多声道空间信息。
另外,其目的是提供一种用很少的运算量来对用这种音频编码器编码后的编码信号进行解码的音频解码器。
为解决上述问题,本发明的音频编码器一种音频编码器,其特征在于,包括下混合单元,将超过两个声道的多声道信号下混合为双声道的立体声信号;第一编码单元,对所述下混合后的立体声信号进行编码,并生成第一编码信号;第二编码单元,对用于将所述下混合后的立体声信号恢复为多声道信号的信息进行编码,并生成第二编码信号;编码量计算单元,算出所述第二编码信号的编码量;复用单元,对所述第一编码信号、所述第二编码信号和算出的表示所述编码量的信号进行复用。
另外,所述复用单元也可包括第一复用部,对由所述编码量计算单元算出的编码量和所述第二编码信号进行复用;第二复用部,对所述第一编码信号和复用了所述编码量的所述第二编码信号进行复用。
进一步,所述第一复用部也可将由所述编码量计算单元算出的所述编码量配置在所述第二编码信号的开头来进行复用。
另外,所述第一复用部也可以将由所述编码量计算单元算出的所述编码量紧接着识别所述第二编码信号的开始的记号而配置的方式进行复用。
进一步,所述第一复用部也可以可变长度来描述由所述编码量计算单元算出的所述编码量,并复用在所述第二编码信号上。
另外,所述下混合单元也可对所述多声道信号进行使用头部传递函数的运算,并进行下混合处理。
另外,所述下混合单元也可在频率轴上对所述多声道信号进行使用头部传递函数的运算。
进一步,所述第二编码信号也可包含无效数据;所述编码量计算单元算出包含所述无效数据的所述第二编码信号的编码量。
为了解决上述问题,本发明的音频解码器,其特征在于,包括取得单元,取得编码信号,该编码信号包含对从超过两个声道的多声道信号下混合后的双声道的立体声信号进行编码而得到的第一编码信号、对用于根据所述立体声信号生成多声道信号的信息进行编码而得到的第二编码信号、以及表示所述第二编码信号的编码量的信号;解码单元,对所取得的所述编码信号进行解码而输出立体声信号。
另外,所述解码单元也可包括第一编码信号读出部,从所取得的所述编码信号中读出所述第一编码信号;编码量读出部,从所述编码信号中读出表示所述第二编码信号的编码量的信号;第一解码部,对由所述第一编码信号读出部读出的所述第一编码信号进行解码,并输出所述立体声信号;所述第一编码信号读出部根据由所述编码量读出部读出的所述编码量,跳过第二编码信号。
另外,所述第一编码信号也可以是对通过使用头部传递函数的运算预先赋予了虚拟环绕效果的立体声信号进行编码而成的信号;所述第一解码部输出赋予了虚拟环绕效果的立体声信号。
另外,所述解码单元也可进一步具有第二编码信号读出部,从所述编码信号中读出所述第二编码信号;第二解码部,根据所读出的所述第一编码信号和所述第二编码信号,对多声道信号进行解码;滤波部,对所述解码后的多声道信号实施基于头部传递函数的滤波处理,并输出赋予了虚拟环绕效果的立体声信号;选择部,选择从所述第一解码部输出的所述立体声信号和从所述滤波部输出的赋予了所述虚拟环绕效果的所述立体声信号中的某个。
进一步,所述第一解码部也可生成所述立体声信号的频率轴信号;所述滤波部在对从所述立体声信号的频率轴信号恢复的多声道信号的频率轴信号,进行基于头部传递函数的处理并生成了双声道的频率轴信号后,将所述频率轴信号转换为时间轴信号。
另外,所述音频解码器也可进一步具有功率供给部,至少供给用于驱动所述第二解码部的功率;所述选择部在来自所述功率供给部的功率供给量低于预定值的情况下,选择来自所述第一解码部的立体声信号。
进一步,通过所述编码量读出部读出的表示所述第二编码信号的编码量的信号也可以是表示包含无效数据的所述第二编码信号的编码量的信号。
发明效果根据本发明,可以生成编码信息,该编码信息使音频解码器简单得知第二编码信号的编码量,所述第二编码信号是对为将下混合信号恢复为多声道信号所需的信息进行编码而得到的。因此,在仅再现下混合信号的再现装置中,可以容易仅对下混合信号进行解码来进行再现。
根据本发明,可以从所述第二编码信号的起始位置紧之后得到表示所述第二编码信号的编码量的信号。
根据本发明,由于表示所述第二编码信号的编码量的信号可以根据其值的大小用可变编码长度来进行复用,所以可以节约用于表示编码量的信号复用的比特数。
进一步,根据本发明,由于可以在频率轴上进行下混合处理,所以在所述第二编码单元对频率轴上的信号进行编码处理的情况下,可以高效实施所述下混合处理和所述第二编码处理。
根据本发明,所述第一编码单元处理1/2以下的频带的信号,所以可以使压缩率提高。另外,在仅再现由第一编码单元进行了编码的编码信号的情况下,由于处理1/2以下频带的信号,所以解码的运算量较少。另外,由于近年来广泛进行研究开发的频带扩大技术(ISO/IEC14496-3)是扩大1/2频带以下的频带信号的技术,所以与该技术的兼容性特别好。
另外,根据本发明,下混合信号成为头部传递函数的滤波处理后的信号,在仅再现第一编码信号的情况下,反映了原来多声道的空间信息。
进一步,根据本发明,下混合信号成为头部传递函数的滤波处理后的信号,在仅再现第一编码信号的情况下,反映了原来多声道的空间信息。且由于在频率轴上实施头部传递函数的处理,所以在与近年来主流的音频压缩方式,例如AAC方式(ISO/IEC13818-7)和AAC-SBR方式(ISO/IEC14496-3)组合时,可以用很少的运算量来执行处理。这是因为这些方式是对频率轴上的信号进行压缩编码的方式。
另外,根据本发明,在想要仅对下混合信号进行解码的情况下,为了用简单的处理进行多声道化,可以去除信息。
进一步,根据本发明,可以选择下混合信号的再现音和对多声道信号实施了基于头部传递函数的滤波处理后的再现音。
另外,根据本发明,在频率轴上进行基于头部传递函数的滤波处理,而生成了双声道的频率轴信号后,可以将该频率轴信号转换为时间轴信号,所以在与近年来主流的音频压缩方式,例如AAC方式(ISO/IEC13818-7)和AAC-SBR方式(ISO/IEC14496-3)组合时,可以用很少的运算量来执行处理。这是因为这些方式是对频率轴上的信号进行压缩编码的方式。
进一步,根据本发明,在用于驱动音频解码器的功率降低的情况下,例如电池寿命耗尽的情况下,由于自动进入到下混合信号的解码模式,所以电池寿命延长。另外,听音者可以根据音质的变化来检测出电池寿命耗尽。


图1表示MPEG2音频标准中的编码信号(比特流)的结构;图2是表示本实施方式1中的音频编码器结构的框图;图3(a)是表示下混合的变换矩阵的图;图3(b)是表示生成用于将下混合信号恢复为原来的多声道信号的信号的矩阵的图;图3(c)是表示用于将下混合信号恢复为原来的多声道信号的矩阵的图;图4(a)是表示根据头部传递函数来计算出图3(b)所示的矩阵的情况下的矩阵的一例的图;图4(b)是图4(a)的逆矩阵,是用于将下混合信号恢复为原来的多声道信号的矩阵的一例的图;图5是表示用于将图2的编码量计算部103算出的编码量描述为编码信号的描述方法的一例的图;图6是通过图5所示的描述方法将编码量描述为编码信号时的流程图;图7是表示在本实施方式1、2中生成的编码信号的数据结构的图;图8是表示本实施方式2中的音频编码器结构的图;图9是表示本实施方式3中的音频编码器结构的图;图10是表示用音频解码器读取通过图5所示的编码量描述方法来描述的表示编码量的信号时的步骤的流程图;图11是表示本实施方式4中的音频解码器结构的图;图12是表示本实施方式4中的音频解码器的另一个结构的图;图13(a)是表示内置了本发明的音频解码器的移动电视的外观的一例的图;图13(b)是内置了本发明的音频解码器的便携电话的外观的一例的图。
图中100,500-下混合部
101,501-第一编码部102,502-第二编码部103,503-编码量计算部104,504-第一复用部105,505-第二复用部600,700,800-第一编码信号取出部601,701,801-第二编码信号取出部602,702,802-第一解码部603,703,803-编码量取出部604,704,804-实体信号取出部705,805-第二解码部706,806-滤波部707,807-选择部900-帧头信息901-第一编码信号902-第二编码信号具体实施方式
(实施方式1)下面,参考附图来说明本发明的实施方式1中的音频编码器。图2是表示本实施方式1中的音频编码器结构的图。图2所示的实施方式1的音频编码器是对每个帧在第二编码信号的开头部描述了表示该第二编码信号的编码量的信号的音频解码器,所述每个帧分别由可变长的第一编码信号和第二编码信号构成,该音频解码器包括下混合部100、第一编码部101、第二编码部102、编码量计算部103、第一复用部104和第二复用部105。第一编码信号是通过对将多声道信号下混合而得到的双声道的立体声信号进行编码而得到的。第二编码信号是通过对用于从第一编码信号恢复原来的多声道信号的信息进行编码而得到的。下混合部100将M声道(M是满足M>2的自然数)的多声道信号下混合为立体声信号。另外,下面,将下混合多声道信号而得到的立体声信号称作“下混合信号”。第一编码部101对下混合信号进行编码而生成第一编码信号。第二编码部102对用于将下混合信号恢复为多声道信号的信息进行编码。编码量计算部103算出通过第二编码部102编码后的信号的编码量。第一复用部104对通过编码量计算部103算出的编码量和由第二编码部102生成的信号进行复用,并生成第二编码信号。第二复用部105对第一编码信号和第二编码信号进行复用。
下面说明这样构成的音频编码器的动作。首先,下混合部100在本实施方式中输入四声道(前左ch、前右ch、后左ch、后右ch)的多声道信号,并下混合为立体声信号。该方法一般是例如执行图3(a)所示的矩阵运算,使用将(前左ch+后左ch)新作为左ch、将(前右ch+后右ch)新作为右ch的变换矩阵的方法。另外,也可如MPEG2音频标准所定义的那样,使用滤波器组(filter bank)将输入的各声道的信号转换为频率轴信号,并根据按各个频带定义的变换矩阵来进行下混合。另外,也可使用FFT(Fast FourierTransform(快速傅里叶变换))等正交变换方式将输入的各声道的信号转换为频率系数,并根据按每个频率系数定义的变换矩阵来进行下混合。这时,各频率系数也可如傅立叶系数那样,是复数。
接着,第一编码部101对在频率轴上或时间轴上下混合后的下混合信号进行编码,来生成第一编码信号。这里,第一编码部101进行的编码也可以是例如由MPEG标准等所规定的编码方式。
接着,第二编码部102对用于将下混合信号恢复为多声道信号的信息进行编码。例如,对通过辅助矩阵运算生成的信号进行编码,所述辅助矩阵运算用于使对用于下混合的变换矩阵运算的逆变换矩阵运算成立。图3(b)表示最简单的例子。即,对通过图3(b)的网格状部分的矩阵运算算出的左’ch、右’ch的信号进行编码。这是因为若对这种信号进行编码,并与对下混合信号进行编码后的信号一起进行传送或存储,则通过图3(c)所示的逆矩阵运算,可以恢复为原来的四声道(前左ch、前右ch、后左ch、后右ch)的多声道信号。图4(a)是表示由根据头部传递函数HRTF来计算图3(b)所示的矩阵的系数构成的矩阵的一例的图。图4(b)是图4(a)的逆矩阵,是表示用于将下混合信号恢复为原来的多声道信号的矩阵的一例的图。图4(a)和(b)的a、b、c、d、e、f、g、h、i、j、k、l、m、n、o、p是根据头部传递函数HRTF算出的系数。通过使用基于这种头部传递函数的矩阵,原来的多声道的空间信息可反映于由左ch和右ch表示的双声道立体声信号中。虽然也可对输入的时间轴信号执行这种处理,但是也可使用滤波器组等将输入的时间轴信号转换为频率轴信号,并按各个频带根据预定的变换矩阵来进行处理。另外,也可使用FFT等正交转换方式将输入的时间轴信号转换为频率系数,并按每个频率系数根据预定的变换矩阵来进行处理。这时,各频率系数如傅立叶系数那样,也可以是复数。
接着,编码量计算部103计算出由第二编码部102编码后的信号的编码量。其中,编码量计算部103在应描述由第二编码部102编码的信号的区域包含由第二编码部102编码的信号之外的无效数据如NULL等的情况下,算出包含该无效数据的编码量。即,权利要求和这里所指的编码量在应描述由第二编码部102编码的信号的区域包含无效数据的情况下,是指包含该无效数据的编码量。
接着,第一复用部104对由编码量计算部103算出的编码量和由第二编码部102生成的信号进行复用,生成第二编码信号。图5是表示用于将由图2的编码量计算部103算出的编码量描述为编码信号的描述方法的一例的图。图6是通过图5所示的描述方法将编码量描述为编码信号时的流程图。这里,由编码量计算部103算出的编码量例如如图5所示,用A比特或(A+B)比特的可变长的比特字段来表现。具体地,若用A比特来表示所算出的编码量,则仅用size_of_ext来描述,在编码量超过了A比特的情况下,用size_of_ext和size_of_esc两个字段来表示。例如,在A为4,B为8,编码量和(sum)为14字节的情况下,由于可用二进制1110的4比特来表示14(S401),所以在size_of_ext的4比特的字段上写上表示sum=14的二进制数1110(S402)。由于表示该条件的if句中,size_of_ext的值14比(1<<4)-1即从将1左移4比特后的值16减去1得到的15小,所以不存在size_of_esc的8比特字段。即,这时,对用4比特的比特字段来表示编码量的信号进行复用。
另外,在例如A是4、B是8、编码量和为100字节的情况下(S401),在size_of_ext的4比特的字段上写上二进制数1111(S403)。由于在表示该条件的if句中,size_of_ext的值与(1<<4)-1即15相等,所以在size_of_esc的8比特的字段上写入sum-size_of_ext+1=100-(15-1)的值(S404)。即,这时,对用12比特的比特字段来表示编码量的信号进行复用。
最后,由第二复用部105对第一编码信号901和第二编码信号902进行复用。通过对每个音频帧依次进行该处理,而如图7所示那样,对第一编码信号901和第二编码信号902交替进行复用,且生成在第二编码信号902的开头部对表示编码量的信号进行了复用的编码信号。
如上所述,根据本实施方式,具有将M声道(M>2)的多声道信号下混合为立体声信号的下混合部;对下混合信号进行编码来生成第一编码信号的第一编码部101;对用于将下混合信号恢复为多声道信号的信息进行编码的第二编码部102;计算由第二编码部102编码后的信号的编码量的编码量计算部103;对由编码量计算部103算出的编码量和由第二编码部102生成的信号进行复用而生成第二编码信号的第一复用部104;对第一编码信号和第二编码信号进行复用的第二复用部105。第一复用部104通过对表示编码量的信号进行复用,使得在第二编码信号的开头配置表示编码量的信号,故对于想要仅对第一编码信号进行解码而仅再现下混合信号的解码器而言,由于在第二编码信号中包含了表示第二编码信号的编码量的信息,所以可以容易从整体的编码信号中去除第二编码信号。
当然,这里,最好对表示编码量的信号进行复用,使得在识别第二编码信号的开始的记号紧之后配置表示编码量的信号。这是因为对于想要仅对第一编码信号进行解码来再现下混合信号的解码器而言,若在第二编码信号的开头配置表示第二编码信号的编码量的信息,则可以容易从所有的编码信号中去除第二编码信号。另外,也可在MPEG2的编码信号的Fill Element(填充要素)中描述该第二编码信号的编码量。这时,所谓识别第二编码信号的开始的记号是指表示Fill Element的开始的记号。
另外,通过将所算出的编码量复用为与表示该编码量的比特量对应的可变长的比特字段,可以削减用于对表示该编码量的信号进行复用的比特数。
另外,在本实施方式中,为了简化说明,将多声道信号的声道数设为4,但是当然也可不是4,也可以是一般广泛普及的5.1声道。
另外,最好将表示所算出的编码量的信号描述在第二编码信号的开头,但是本发明并不限于此。例如,也可描述在帧头信息中。另外,也可在帧头信息中描述表示第一编码信号的编码量的信号。这是因为由于在帧头信息中描述了帧整体的编码量,所以可以简单算出第二编码信号的编码量。
(实施方式2)下面,参考附图来说明本发明的第二实施方式中的音频编码器。图8是表示本发明的实施方式2中的音频编码器结构的图。图8的音频编码器是将输入的时间轴上的四声道信号转换为频率轴上的信号后进行下混合的音频编码器,包括下混合部500、第一编码部501、第二编码部502、编码量计算部503、第一复用部504和第二复用部505。其中,第二编码部502、编码量计算部503、第一复用部504和第二复用部505也与实施方式1所示的相同。与实施方式1所示的不同点是,(1)下混合部500输入在第二编码部502的处理过程中生成的各输入声道的频率轴信号,并下混合该各输入声道的频率轴信号的一部分、或频带的频率轴信号;(2)第一编码部501输入通过下混合部500下混合后的信号并对该信号进行编码。
下面说明这样构成的音频编码器的动作。首先,第二编码部502将所输入的4声道信号转换为由与时间轴上的信号的取样数相同数目的取样数构成的频率轴信号。其可以使用滤波器组,也可使用FFT等的正交变换方式来转换为频率系数。这时,各频率系数也可如傅立叶系数那样是复数。对下混合部500送出该各声道的频率轴信号,并在下混合部500中通过预定的方法来进行下混合处理。这里,也可通过实施方式1所描述的矩阵运算来实施对各声道对应的频率轴信号之间实施的下混合处理。另一方面,在第二编码部502中,对用于将下混合信号恢复为多声道信号的信息进行编码。该方法也可与实施方式1所示的方法相同。
这里,在本实施方式中,下混合部500也可仅对所接收的各声道的频率轴信号的一部分频带实施下混合处理。例如,对去除所有频带的高频侧的一部分的信号进行下混合。由此,对于想要仅对第一编码信号进行解码来再现下混合信号的解码器而言,由于编码信号的频带窄,所以可以使解码时的运算量很少。另外,若下混合整体频带的1/2以下的频带的信号,则因下面所述的理由,可以进一步享受便利性。即,这是因为第一编码部501虽然可以为例如用MPEG标准等规定的编码方式,但是尤其这里,若是频带为整体频带的1/2以下的频带,则由于与按近年的MPEG4标准研究的频带扩大技术(ISO/IEC14496-3)为前提的频带一致,所以与该技术的接口更容易。
之后,编码量计算部503的处理、第一复用部504的处理、第二复用部505的处理也可与实施方式1所描述的处理相同。
另外,下混合部500中,也可边对分解为频率成分的信号实施基于头部传递函数的滤波处理,边进行下混合。对于分解为频率成分的信号的基于头部传递函数的滤波处理也可以是如在特开平11-032400号公报中所描述的方法。由此,在仅再现由第一编码部501编码后的编码信号的情况下,可以反映原来的多声道的空间信息。当然其不仅适用于本实施方式2中的处理过程,也可在之前的实施方式1的处理过程中实施。
如上所述,根据本实施方式,具有将M声道(M>2)的多声道信号下混合为立体声信号的下混合部500、对下混合信号进行编码来生成第一编码信号的第一编码部501、对用于将下混合信号恢复为多声道信号的信息进行编码的第二编码部502、计算通过第二编码部502编码后的信号的编码量的编码量计算部503、对由编码量计算部503算出的编码量的信号和由第二编码部502生成的信号进行复用来生成第二编码信号的第一复用部504、和对第一编码信号和第二编码信号进行复用的第二复用部505。下混合部500通过将多声道信号分别转换为频率轴信号,并将该频率轴信号的一部分或全部的频带信号下混合为立体声信号,可在频率轴上进行下混合处理,所以在第二编码部502对频率轴上的信号进行编码处理的情况下,可以高效实施下混合处理和第二编码的处理。另外,若将一部分或全部频带的信号下混合为立体声信号,则可以用较少的运算量来进行下混合处理,同时,由于第一编码部501可以处理窄频带的信号,所以可以提高压缩率。另外,在仅再现由第一编码部501编码的编码信号的情况下,由于处理窄带的信号,所以解码的运算量较少。另外,若在原先频带的1/2频带上处理下混合处理,则由于第一编码部501处理1/2以下的频带的信号,所以压缩率可以进一步提高,同时,在仅再现由第一编码部501编码后的编码信号的情况下,由于处理1/2以下的频带的信号,所以解码的运算量较少。另外,由于近年来广泛进行研究开发的频带扩大技术(ISO/IEC14496-3)是扩大1/2频带以下的频带的信号的技术,所以与该技术的接口特别容易。
另外,在上述下混合处理时,若还实施头部传递函数的滤波处理,则在仅再现由第一编码部501编码的编码信号的情况下,反映原先多声道的空间信息。
当然,上述头部传递函数的滤波处理可以不在频率轴上进行,也可在时间轴上进行。
另外,在本实施方式中,为了简化说明,将多声道信号的声道数设为4,但是当然也可以不是4,而是一般广泛普及的5.1声道。
(实施方式3)下面,参考附图来说明本发明的实施方式3中的音频解码器。本音频解码器是对实施方式1或实施方式2中编码后的编码信号进行解码的音频解码器。即,是对将第1编码信号和第2编码信号进行了多路服用的编码信号进行解码的音频解码器,所述第1编码信号是对下混合M声道(M>2)的多声道信号后的立体声信号进行了编码的信号,所述第2编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号。这里,第二编码信号中,对表示该第二编码信号的编码量的值进行了复用。
图9是表示本实施方式3中的音频解码器的结构图。图9中,音频解码器具有第一编码信号取出部600、第二编码信号取出部601、第一解码部602、编码量取出部603和实体信号取出部604。第一编码信号取出部600取出第一编码信号。第二编码信号取出部601取出第二编码信号。第一解码部602根据第一编码信号,对下混合信号进行解码。编码量取出部603取出第二编码信号中包含的表示该第二编码信号的编码量的信号。实体信号取出部604根据通过编码量取出部603取出的表示编码量的信号,从编码信号中取出第二编码信号。
下面说明如上构成的音频解码器的动作。首先,第一编码信号取出部600从对第一编码信号和第二编码信号进行了复用的编码编码信号中取出第一编码信号,所述的第一编码信号是对将四声道的多声道信号下混合后的立体声信号进行了编码的信号,所述第二编码信号是对用于将下混合信号恢复为多声道信号用的信息进行了编码的信号。这里,由于第一编码信号是由实施方式1或实施方式2的第一编码部生成的编码信号,所以在该第一编码信号取出部600中,可以根据第一编码信号的编码格式来取出第一编码信号。例如,若第一编码部是基于MPEG标准AAC方式的编码部,则在该第一编码信号取出部600中,可以根据AAC编码格式来取出第一编码信号。
接着,在第一解码部602中根据第一编码信号,对下混合信号进行解码。这里的解码方法也可根据第一编码信号的编码规则来进行解码。
图10是表示通过音频解码器来读取按照图5所示的编码量描述方法描述的表示编码量的信号的情况下的步骤的流程图。接着,在第二编码信号取出部601中内置的编码量取出部603中,取出第二编码信号中包含的表示该第二编码信号的编码量的信号(S501)。这里,该编码量和由图5所示的A比特或(A+B)比特来表现。例如,图5所示的size_of_ext是4比特,size_of_esc为8比特,size_of_ext的值在二进制中为1010。这时,size_of_ext的值为10,由于不等于(1<<4)-1=15(S502),所以不存在size_of_esc的8比特,编码量和为10字节(S505)。另外,例如,在size_of_ext为4比特,size_of_esc为8比特,size_of_ext的值在二进制中为1111的情况下,由于size_of_ext的值为(1<<4)-1=15(S502),所以size_of_esc的8比特存在。编码量取出部603进一步取出8比特的size_of_esc(S503)。这里,在size_of_esc的值在二进制中为00001000的情况下,编码量和为sum=size_of_ext+size_of_esc-1=15+8-1,为22字节(S504)。
最后,在实体信号取出部604中,根据由编码量取出部603取出的表示编码量的信号,从编码信号中取出第二编码信号。例如,若编码量为20字节,则之后的20字节的信号被认为是对用于将下混合信号恢复为多声道信号的信息进行了编码的第二编码信号的编码量,由于对于仅再现下混合信号的解码器不需要该第二编码信号,所以可以使编码信号跳过该大小。
这里,与在该第二编码信号上复用的该编码量对应的值,不需要一定与对用于将下混合信号恢复为多声道信号的信息进行了编码的信号的编码量恰好一致,可以与其相同也可以是比其大的值。例如,在对将下混合信号恢复为多声道信号的信息进行了编码的信号的真正的编码量为18字节的情况下,在例如追加了2字节附加信息的情况下(其也可以是实质上没有含义的信息),在该第二编码信号上复用的相当于该编码量的值应为20。即,与第二编码信号包含作为添加的信息或没有含义的信息的2字节的情况相同。这是由于实体信号取出部不需要知道一切编码信号的内容。
如上,本实施方式的音频解码器具有对于将第一编码信号和第二编码信号进行了复用的编码信号取出第一编码信号的第一编码信号取出部600和取出第二编码信号的第二编码信号取出部601,所述第一编码信号是对将M声道(M>2)的多声道信号下混合后的立体声信号进行了编码的信号,所述第二编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号;根据第一编码信号,来对下混合信号进行解码的第一解码部602。第二编码信号取出部601进一步具有取出第二编码信号中含有的表示编码量的信号的编码量取出部603;根据由编码量取出部603取出的表示编码量的信号,从编码信号中取出第二编码信号的实体信号取出部604。由此,在为要仅对下混合信号进行解码的音频解码器的情况下,可以通过简单的处理来取出或跳过用于多声道化的信息。
当然,这里表示编码量的信息最好配置在第二编码信号的开头。这是因为对于想要仅对第一编码信号进行解码而仅再现下混合信号的解码器而言,若表示第二编码信号的编码量的信息配置在第二编码信号的开头,则可以容易地从所有的编码信号中去除第二编码信号。
另外,这里,第一编码信号如前所述的实施方式2那样,若预先通过基于头部传递函数的滤波处理将本来的多声道信号下混合为双声道信号,则对于想要仅对第一编码信号进行解码来仅再现下混合信号的解码器而言,通过仅对第一编码信号进行解码,可以再现反映了原先的多声道空间信息的音频。
另外,在本实施方式中,为了简化说明,将多声道信号的声道数设为4,但是当然也可不是4,而是一般广泛普及的5.1声道。
(实施方式4)下面,参考附图来说明本发明的实施方式4中的音频解码器。
本音频解码器是对实施方式1或实施方式2中编码后的编码信号进行解码的音频解码器。即,是对将第一编码信号和第二编码信号进行了复用的编码信号进行解码的音频解码器,所述第一编码信号是对下混合M声道(M>2)的多声道信号的立体声信号进行了编码的信号,所述第二编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号。这里,在第二编码信号上复用了表示该第二编码信号的编码量的值。
图11是表示本实施方式4中的音频解码器的结构的图。如图11所示,实施方式4的音频解码器具有第一编码信号取出部700、第二编码信号取出部701、第一解码部702、编码量取出部703、实体信号取出部704、第二解码部705、滤波部706和选择部707。其中,与实施方式3不同的是,具有根据第一编码信号和第二编码信号来对多声道信号进行解码的第二解码部705;对解码后的多声道信号,实施基于头部传递函数的滤波处理的滤波部706;选择由第一解码部702生成的信号或通过滤波部706生成的信号的选择部707。除此之外的第一编码信号取出部700、第二编码信号取出部701、第一解码部702、编码量取出部703和实体信号取出部704与实施方式3所述的相同。
下面说明如上构成的音频解码器的动作。首先,第一编码信号取出部700从对第一编码信号和第二编码信号进行了复用的编码信号中取出第一编码信号,所述第一编码信号是对下混合四声道的多声道信号的立体声信号进行了编码的信号,所述第二编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号。其动作与实施方式3相同。
接着,在第一解码部702中,根据第一编码信号对下混合信号进行解码。其动作也与实施方式3相同。
接着,在第二编码信号取出部701中内置的编码量取出部703中,取出第二编码信号中包含的表示该第二编码信号的编码量的信号。其动作与实施方式3相同。
接着,根据通过编码量取出部703取出的表示编码量的信号,实体信号取出部704从编码信号中取出第二编码信号。该动作与实施方式3相同。
接着,在第二解码部705中,根据第一编码信号和第二编码信号,对多声道信号进行解码。
这里,由于第一编码信号和第二编码信号是在实施方式1或实施方式2的音频解码器中生成的编码信号,所以在该第二解码部705中,只要根据该编码格式来对第一编码信号和第二编码信号进行解码来生成多声道信号就可以。
接着,在滤波部706中,对解码后的多声道信号实施基于头部传递函数的滤波处理。
最后,在选择部707中,选择由第一解码部生成的信号或由滤波部生成的信号。
如上,本实施方式中,具有对将第一编码信号和第二编码信号进行了复用的编码信号取出第一编码信号的第一编码信号取出部700、取出第二编码信号的第二编码信号取出部701,所述第一编码信号是对将M声道(M>2)的多声道信号下混合后的立体声信号进行了编码的信号,所述第二编码信号是对用于将下混合信号恢复为多声道信号的信息进行了编码的信号;根据第一编码信号,对下混合信号进行解码的第一解码部702;取出第二编码信号中含有的表示编码量的信号的编码量取出部703;根据由编码量取出部703取出的表示编码量的信号,从编码信号中取出第二编码信号的实体信号取出部704;根据第一编码信号和第二编码信号,对多声道信号进行解码的第二解码部705;对解码后的多声道信号实施基于头部传递函数的滤波处理的滤波部706;选择由第一解码部生成的信号或由滤波部706生成的信号的选择部707。由此,使用者可以选择下混合信号的再现音和对多声道信号实施了基于头部传递函数的滤波处理的再现音。
在上述的处理中,为了在第二解码部705中生成各多声道信号的频率轴信号,也可在对该各多声道信号的频率轴信号在频率轴上进行基于头部传递函数的滤波处理而生成双声道的频率轴信号后,将该频率轴信号转换为时间轴信号。例如,可以是在日本专利文献特开平11-032400号公报中所述的方法。由此,例如在组合AAC方式(ISO/IEC13818-7)和AAC-SBR方式(ISO/IEC14496-3)时,可以大幅度减少运算量。这是因为由于这些方式是对频率轴上的信号进行压缩编码的方式,所以虽然内置了将频率轴信号转换为时间轴信号的处理,但是通过在频率轴上进行下混合,仅在双声道上进行将频率轴信号转换为时间轴信号的处理就可以。
另外,在本实施方式中,为了简化说明,将多声道信号的声道数设为4,但是当然也可不是4,而是一般广泛普及的5.1声道。
另外,在本实施方式中,第二解码部输入第一编码信号和第二编码信号,并使用这些信号来对多声道信号进行解码,但是也可使用在第一解码部中解码的信号,来对多声道信号进行解码。图12是表示本实施方式4中的音频解码器的其他结构的图。这时为图12所示的结构。
另外,在用于驱动该音频解码器的功率降低的情况下,例如,在电池寿命耗尽的情况下,检测出该情况,自动将上述选择部控制为用第一解码部生成的信号进行输出,则在电池组耗尽时,由于自动进入到下混合信号的解码模式,因此电池寿命延长。另外,收听者可以通过音质的变化来检测出电池寿命耗尽。
图13是表示具有本发明的音频解码器的移动音频设备的外观的一例的图。(a)是表示内置了本发明的音频解码器的移动电视的一例的图。(b)是内置了本发明的音频解码器的便携电话的一例的图。在如该图所示的便携型的设备中,若每单位时间的运算量大,则为进行运算处理的并行等,电路规模变大。并且,在移动音频设备中,目前双声道再现还是主流。因此,在如该图所示的移动音频设备中,对通过本发明的音频编码器编码后的编码信号进行解码,并通过再现来跳过编码信号的不需要的部分,并使用头部传递函数可以在低负载下再现滤波后的虚拟环绕音频。
产业上的可用性本发明的音频编码器是对多声道信号进行编码的音频编码器,但是由于生成可用便宜的解码器再现已编码的多声道信号的编码信号,所以尤其可以应用于需要设备的小型化的便携设备。
本发明的音频解码器由于适用于通过双声道的再现部例如用耳机来再现对多声道信号进行了编码的编码信号,所以尤其可以应用于需要设备的小型化的便携设备,例如移动电视、MD、SD和便携电话等中。
权利要求
1.一种音频编码器,其特征在于,包括下混合单元,将超过两个声道的多声道信号下混合为双声道的立体声信号;第一编码单元,对所述下混合后的立体声信号进行编码,并生成第一编码信号;第二编码单元,对用于将所述下混合后的立体声信号恢复为多声道信号的信息进行编码,并生成第二编码信号;编码量计算单元,算出所述第二编码信号的编码量;复用单元,对所述第一编码信号、所述第二编码信号和算出的表示所述编码量的信号进行复用。
2.根据权利要求1所述的音频编码器,其特征在于,所述复用单元包括第一复用部,对由所述编码量计算单元算出的编码量和所述第二编码信号进行复用;第二复用部,对所述第一编码信号和复用了所述编码量的所述第二编码信号进行复用。
3.根据权利要求2所述的音频编码器,其特征在于,所述第一复用部将由所述编码量计算单元算出的所述编码量配置在所述第二编码信号的开头来进行复用。
4.根据权利要求2所述的音频编码器,其特征在于,所述第一复用部以将由所述编码量计算单元算出的所述编码量紧接着识别所述第二编码信号的开始的记号而配置的方式进行复用。
5.根据权利要求2所述的音频编码器,其特征在于,所述第一复用部以可变长度来描述由所述编码量计算单元算出的所述编码量,并复用在所述第二编码信号上。
6.根据权利要求1所述的音频编码器,其特征在于,所述下混合单元对所述多声道信号进行使用头部传递函数的运算,并进行下混合处理。
7.根据权利要求6所述的音频编码器,其特征在于所述下混合单元在频率轴上对所述多声道信号进行使用头部传递函数的运算。
8.根据权利要求1所述的音频编码器,其特征在于所述第二编码信号包含无效数据;所述编码量计算单元算出包含所述无效数据的所述第二编码信号的编码量。
9.一种音频解码器,对编码信号进行解码,其特征在于,包括取得单元,取得编码信号,该编码信号包含对从超过两个声道的多声道信号下混合后的双声道的立体声信号进行编码而得到的第一编码信号、对用于根据所述立体声信号生成多声道信号的信息进行编码而得到的第二编码信号、以及表示所述第二编码信号的编码量的信号;解码单元,对所取得的所述编码信号进行解码而输出立体声信号。
10.根据权利要求9所述的音频解码器,其特征在于,所述解码单元包括第一编码信号读出部,从所取得的所述编码信号中读出所述第一编码信号;编码量读出部,从所述编码信号中读出表示所述第二编码信号的编码量的信号;第一解码部,对由所述第一编码信号读出部读出的所述第一编码信号进行解码,并输出所述立体声信号;所述第一编码信号读出部根据由所述编码量读出部读出的所述编码量,跳过第二编码信号。
11.根据权利要求10所述的音频解码器,其特征在于,所述第一编码信号是对通过使用头部传递函数的运算预先赋予了虚拟环绕效果的立体声信号进行编码而成的信号;所述第一解码部输出赋予了虚拟环绕效果的立体声信号。
12.根据权利要求9所述的音频解码器,其特征在于,从所取得的所述编码信号读出的表示所述第二编码信号的编码量的信号是表示包含无效数据的所述第二编码信号的编码量的信号。
13.根据权利要求9所述的音频解码器,其特征在于,所述解码单元进一步具有第一编码信号读出部,从所取得的所述编码信号中读出所述第一编码信号;第一解码部,对由所述第一编码信号读出部读出的所述第一编码信号进行解码,并输出所述立体声信号;第二编码信号读出部,从所述编码信号中读出所述第二编码信号;第二解码部,根据所读出的所述第一编码信号和所述第二编码信号,对多声道信号进行解码;滤波部,对所述解码后的多声道信号实施基于头部传递函数的滤波处理,并输出赋予了虚拟环绕效果的立体声信号;选择部,选择从所述第一解码部输出的所述立体声信号和从所述滤波部输出的赋予了所述虚拟环绕效果的所述立体声信号中的某个。
14.根据权利要求13所述的音频解码器,其特征在于,所述第一解码部生成所述立体声信号的频率轴信号;所述滤波部在对从所述立体声信号的频率轴信号恢复的多声道信号的频率轴信号,进行基于头部传递函数的处理并生成了双声道的频率轴信号后,将所述频率轴信号转换为时间轴信号。
15.根据权利要求14所述的音频解码器,其特征在于,所述音频解码器进一步具有功率供给部,至少供给用于驱动所述第二解码部的功率;所述选择部在来自所述功率供给部的功率供给量低于预定值的情况下,选择来自所述第一解码部的立体声信号。
16.一种音频编码方法,其特征在于,将超过两个声道的多声道信号下混合为双声道的立体声信号;对下混合后的所述立体声信号进行编码,而生成第一编码信号;对用于将下混合后的所述立体声信号恢复为多声道信号的信息进行编码,并生成第二编码信号;算出所述第二编码信号的编码量;对所述第一编码信号、所述第二编码信号和算出的表示编码量的信号进行复用。
17.一种音频解码方法,对编码信号进行解码,其特征在于取得编码信号,该编码信号包含对从超过两个声道的多声道信号下混合后的双声道的立体声信号进行编码而得到的第一编码信号、对用于根据所述立体声信号生成多声道信号的信息进行编码而得到的第二编码信号、以及表示所述第二编码信号的编码量的信号;对所取得的所述编码信号进行解码而输出立体声信号。
18.一种程序,用于音频编码器,其特征在于,使计算机起到以下各单元的功能下混合单元,将超过两个声道的多声道信号下混合为双声道的立体声信号;第一编码单元,对所述下混合后的立体声信号进行编码,并生成第一编码信号;第二编码单元,对用于将所述下混合后的立体声信号恢复为多声道信号的信息进行编码,并生成第二编码信号;编码量计算单元,算出所述第二编码信号的编码量;复用单元,对所述第一编码信号、所述第二编码信号和算出的表示所述编码量的信号进行复用。
19.一种程序,用于对编码信号进行解码的音频解码器,其特征在于,使计算机起到以下各单元的功能取得单元,取得编码信号,该编码信号包含对从超过两个声道的多声道信号下混合后的双声道的立体声信号进行编码而得到的第一编码信号、对用于根据所述立体声信号生成多声道信号的信息进行编码而得到的第二编码信号、以及表示所述第二编码信号的编码量的信号;解码单元,对所取得的所述编码信号进行解码而输出立体声信号。
全文摘要
一种以多声道信号为基础来生成立体声信号的音频编码器,该音频编码器的下混合部(100)将超过两个声道的多声道信号下混合为双声道的立体声信号。第一编码部(101)对下混合后的立体声信号进行编码,生成第一编码信号。第二编码部(102)对用于将下混合后的立体声信号恢复为多声道信号的信息进行编码,生成第二编码信号。编码量计算部(103)算出第二编码信号的编码量。第一复用部(104)对第一编码信号或第二编码信号中的某个和所算出的编码量进行复用。由此,由于解码器可根据上述编码量来简单抽出多声道信号的编码信号,所以便宜地构成仅再现下混合信号的解码器。
文档编号G10L19/008GK1906664SQ20058000178
公开日2007年1月31日 申请日期2005年2月9日 优先权日2004年2月25日
发明者宫阪修二, 高木良明, 阿部一任 申请人:松下电器产业株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1