对具有多声道的多对象音频信号进行编码和解码的设备和方法

文档序号:2831774阅读:163来源:国知局

专利名称::对具有多声道的多对象音频信号进行编码和解码的设备和方法
技术领域
:本发明涉及对具有多声道的多对象音频信号进行编码和解码,更为具体地讲,涉及一种对具有多声道的多对象音频信号进行编码和解码的设备和方法。.在此,具有多声道的多对象音频信号指的是包括音频对象信号的多对象音频信号,其中,每个对象音频信号由诸如单声道、立体声声道和5.1声道的各种声道组成。本工作受到MIC/IITA[2007-S-004-01,"无玻璃单用户3D广播技术的开发(Developmentofglasslesssingleuser3Dbroadcastingtechnologies),,]的ITR&D项目的支持。
背景技术
:根据相关的音频编码和解码技术,无法根据用户的需要对由多种声道组成的多个音频对象进行混音。因此,无法以多种形式欣赏音频内容。即,相关的音频编码和解码技术仅允许用户被动地欣赏音频内容。作为相关4支术,空间音频编码(SAC)4支术4吏用空间-提示(spatialcue)信息将多声道音频信号编码为缩混(downmixed)的单声道信号或缩混立体声声道信号,并且即使在低比特率下也发送高质量多声道信号。SAC技术通过子带(sub-band)分析音频信号,并基于与每个子带相应的空间提示信息从缩混的单声道信号或缩混的立体声声道信号恢复原多声道音频信号。空间提示信息包括用于在解码操作中恢复原始信号的信息,并决定在SAC解码设备中再现的音频信号的音频品质。运动图像专家组(MPEG)已开展MPEG环绕(MPS)的SAC技术标准化,并将声道等级差(CLD)用作空间提示。由于SAC技术允许用户仅对多声道音频声道的一个音频对象进行编码和解码,所以用户使用SAC技术无法对具有多声道的多对象音频信号进行编码和解码。即,才艮据SAC技术无法对单声道、立体声声道和5.1声道组成的音频信号的多种对象进行编码和解码。作为另一相关技术,双耳提示编码(BCC)技术能够使用户仅对具有单声道的多对象音频信号进行编码和解码。因此,用户使用BCC技术,除具有单声道的多对象音频信号之外,无法对具有多声道的多对象音频信号进行编码或解码。如上所述,相关技术仅允许用户对具有单声道的多对象音频信号或具有多声道的单对象音频信号进行编码和解码。即,根据相关技术无法对具有多声道的多对象音频信号进行编码和解码。因此,无法根据用户的需要以各种形式对多种声道组成的多个音频对象进行混音,并且无法以多种形式欣赏音频内容。即,相关4支术4叉允许用户被动地欣赏音频内容。因此,存在对具有多声道的多对象音频信号进行编码和解码的设备和方法的需要,以使用户根据用户的需求通过控制多对象音频信号来以多种形式欣赏一个音频内容。发明公开技术问题本发明实施例的目的在于提供对具有多声道的多对象音频信号进行编码和解码的设备和方法。通过以下的描述可理解本发明的其它目的和优点,参照本发明的实施例本发明的目的和优点会变得清楚。此外,对本发明
技术领域
的技术人员明显的是,可通过权利要求及其结合的手段来实现本发明的目的和优点。技术方案根据本发明的一方面,提供了多声道编码单元,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多对象编码单元,对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,多声道编码单元不考虑编码器解码器(CODEC)方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码装置。根据本发明的另一方面,提供了一种音频编码设备,所述音频编码设备包括多声道编码单元,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多声道编码单元,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;第一多对象编码单元,对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号具有来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,并产生包括产生的空间提示的第二渲染信息;第二多对象编码单元,对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号包括来自第一多对象编码装置的缩混的信号,产生用于包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第三渲染信息,其中,第二多对象编码单元不被CODEC方案限制而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码单元和第一多对象编码单元。根据本发明的另一方面,提供了一种用于产生渲染信息以对编码的音频信号进行解码的的代码变换设备,所述代码变换设备包括第一矩阵单元,基于包括编码的音频信号的位置和等级信息以及输出布局信息的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵单元,基于包括用于包括多个声道的音频信号的空间提示的第一渲染信息,产生用于所述包括多个声道的音频信号的声道恢复信息,所述包括多个声道的音频信号被包括在编码的音频信号中;子带转换单元,将具有用于包括多个对象的音频信号的空间提示的第二渲染信息转换为符合CODEC方案的渲染信息,所述包括多个对象的音频信号被包括编码的音频信号中,其中,第二渲染信息包括不被CODEC方案限制的空间提示,该CODEC方案限制第一渲染信息;渲染单元,基于第一矩阵单元产生的渲染信息、第二矩阵单元产生的渲染信息和来自子带转换单元的转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一方面,提供了一种代码变换设备,所述代码变换设备包括预设ASI提取单元,从第四渲染信息提取预设ASI;第一矩阵单元,基于直接将具有编码的音频信号的位置和等级信息以及输出布局信息表示为预设ASI的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵单元,基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息,所述包括多个对象的音频信号被包括在编码的音频信号中;子带转换单元,将第三渲染信息转换为符合CODEC方案的渲染信息;渲染单元,基于提取的预设ASI、产生渲染信息的步骤所产生的渲染信息、产生声道恢复信息的步骤所产生的渲染信息、转换的渲染信息和第二渲染信息中的一个,产生用于编码的音频信号的修改的渲染孑言息。根据本发明另一实施例,提供了一种用于产生渲染信息以对编码的音频信号进行解码的代码变换设备,所述代码变换设备包括第一矩阵单元,基于具有编码的音频信号的位置和等级信息和输出布局信息的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵单元,基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;子带转换单元,将第三渲染信息转换为符合CODEC方案的渲染信息;渲染单元,基于来自第一矩阵单元的产生的渲染信息、来自第二矩阵单元的产生的声道恢复信息、来自子带转换单元的转换的渲染信息和第二渲染信息,产生用于编码的音频信号的修改的渲染信息,其中,第一渲染信息包括包含在编码的音频信号中的用于包括多个声道的音频信号的空间提示,第二渲染信息包括用于包括多个对象的音频信号的空间提示,所述包括多个对象的音频信号包括与第一渲染信息相应的音频信号,第三渲染信息包括不考虑限制第一渲染信息和第二渲染信息的CODEC方案而产生的作为用于包括多个对象的音频信号的空间提示的空间提示,所述包括多个对象的音频信号包括与第二渲染信息相应的音频信号。根据本发明的另一方面,提供了一种代码变换设备,所述代码变换设备包括预设ASI提取单元,从第五渲染信息提取预设ASI;第一矩阵单元,基于直接将具有编码的音频信号的位置和等级信息以及输出布局信息表示为预设ASI的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵单元,基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息,所述包括多个对象的音频信号被包括在编码的音频信号中;子带转换单元,将第三渲染信息转换为符合CODEC方案的渲染信息;渲染单元,基于提取的预设ASI和来自第一矩阵单元的的渲染信息中的一个、来自第二矩阵单元的渲染信息、来自子带转换单元的转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一方面,提供了一种音频解码设备,所述音频解码设备20包括解析单元,从用于包括多个声道的多对象音频信号的渲染信息,分离包括多个对象的音频信号的渲染信息和所述包括多个对象的音频信号的场景信息,所述多对象信号渲染信息包括用于包括多个对象的音频信号;信号处理单元,基于多对象信号的渲染信息,通过对用于所述包括多个声道的多对象音频信号的缩混信号中的用于包括多个声道的音频信号的音频对象信号执行高抑制,输出修改的缩混信号;混音单元,基于所述场景信息通过对修改的缩混信号进行混音来恢复音频信号。根据本发明的另一方面,提供了一种音频解码设备,所述音频解码设备包括解析装置,从用于包括多个声道的多对象信号的渲染信息中,分离如下信息,多声道信号的渲染信息,该多声道信息的渲染信息包括用于包括多个声道的音频信号的空间提示;多对象信号的渲染信息,该多对象信号的渲染信息包括用于包括多个对象的音频信号的空间提示;包括多个对象的音频信号的场景信息;信号处理装置,基于所述多对象信号的渲染信息,通过对用于包括多个声道的多对象音频信号的缩混信号中的至少一个音频对象信号执行高抑制,产生修改的缩混信号和高抑制音频对象信号;声道解码装置,通过对所述修改的缩混信号进行混音来恢复多声道音频信号;混音装置,基于所述场景信息,对信号处理装置产生的修改的缩混信息和音频对象信号进行混音。根据本发明的另一方面,提供了一种音频编码方法,所述音频编码方法包括对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,在所述对包括多个声道的音频信号进行缩混的步骤中,不考虑编码器解码器CODEC方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制对包括多个声道的音频信号进行缩混。根据本发明的另一方面,提供了一种音频编码方法,所述音频编码方法包括对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号具有对包括多个声道的音频信号进行缩混的步骤的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,并产生包括产生的空间提示的第二渲染信息;对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号包括来自第一多对象编码装置的缩混的信号,产生用于包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第三渲染信息,其中,在对所述包括多个对象的音频信号进行缩混的步骤中,不考虑CODEC方案限制而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码单元和第一多对象编码单元。根据本发明的另一方面,提供了一种用于产生渲染信息以对通过音频编码步骤编码的音频信号进行解码的的代码变换方法,所述代码变换方法包括基于包括编码的音频信号的位置和等级信息以及输出布局信息的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;基于包括用于包括多个声道的音频信号的空间提示的第一渲染信息,产生用于所述包括多个声道的音频信号的声道恢复信息,所述包括多个声道的音频信号被包括在编码的音频信号中;将具有用于包括多个对象的音频信号的空间提示的第二渲染信息转换为符合CODEC方案的渲染信息,所述包括多个对象的音频信号被包括在编码的音频信号中,其中,第二渲染信息包括不被CODEC方案限制的空间提示,该CODEC方案限制第一渲染信息;基于所述产生渲染信息的步骤所产生的渲染信息、所述产生声道恢复信息的步骤所产生的渲染信息、所述转换第二渲染信息的步骤所转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一方面,提供了一种用于产生渲染信息以对通过音频编码方法编码的音频信号进行解码的的代码变换方法,所述代码变换方法包括从第四渲染信息提取预定预设ASI;基于将编码的音频信号的位置和等级信息以及输出的布局信息直接表示为提取的预设ASI的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;基于包第一渲染信息,产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于提取的预设ASI和所述产生渲染信息的步骤所产生的渲染信息中的一个、所述产生声道恢复信息的步骤所产生的渲染信息和转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一方面,提供了一种用于产生渲染信息以对通过音频编码方法编码的音频信号进行解码的的代码变换方法,所述代码变换方法包括基于具有编码的音频信号的位置和等级信息以及输出布局信息的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于所述产生渲染信息的步骤所产生的渲染信息、所述产生声道恢复信息的步骤所产生的渲染信息、所述转换第三渲染信息的步骤所转换的渲染信息以及第二渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一方面,提供了一种用于产生渲染信息以对通过音频编码方法编码的音频信号进行解码的的代码变换方法,所述代码变换方法包括从第五渲染信息提取预设ASI;基于直接将具有编码的音频信号的位置和等级信息以及输出布局信息表示为预设ASI的对象控制信息,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于提取的预设ASI和所述产生渲染信息的步骤所产生的渲染信息中的一个、所述产生声道恢复信息所产生的渲染信息和转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。根据本发明的另一实施例,提供了一种音频解码方法,所述音频解码方法包括从用于包括多个声道的多对象音频信号的渲染信息,分离所述包括多个对象的音频信号的渲染信息和所述包括多个对象的音频信号的场景信息;基于多对象信号的渲染信息,通过对用于所述包括多个声道的多对象音频信号的缩混信号中的用于包括多个声道的音频信号的音频对象信号执行高抑制,输出修改的缩混信号;基于所述场景信息通过对修改的缩混信号进行混音来恢复音频信号。根据本发明的另一实施例,提供了一种音频解码方法,所述音频解码方法包括从用于包括多个声道的多对象信号的渲染信息中,分离如下信息多声道信号的渲染信息,该多声道信号的渲染信息包括用于包括多个声道的音频信号的空间提示,多对象信号的渲染信息,该多对象信号的渲染信息包括用于包括多个对象的音频信号的空间提示,包括多个对象的音频信号的场景信息;基于所述多对象信号的瑄染信息,通过对用于包括多个声道的多对象音频信号的缩混信号中的至少一个音频对象信号执行高抑制,产生修改的缩混信号和高抑制音频对象信号;通过对所述修改的缩混信号进行混音来恢复多声道音频信号;基于所述场景信息,对信号处理装置产生的修改的缩混信息和音频对象信号进行混音。根据本发明的另一方面,提供了一种音频编码设备,所述音频编码设备包括输入单元,接收多声道音频信号和多对象音频信号;编码单元,将接收的音频信号编码为缩混信号和渲染信息,其中,所述渲染信息包括多声道编码辅助信息和多对象编码辅助信息。根据本发明的另一方面,提供了一种音频解码方法,所述音频解码方法包括接收包括缩混信号的音频编码信号和辅助信息信号;从所述辅助信息信号提取多对象辅助信息和多声道辅助信息;基于所述多对象辅助信息将所述缩混信号转换为多声道缩混信号;使用所述多声道缩混信号和所述多声道辅助信息,对多声道音频信号进行解码;对解码的音频信号进行混音。有益效果根据本发明,用户可以以多种方式对具有多声道的多对象音频信号进行编码和解码。因此,可根据用户需求主动地欣赏音频内容。图1是示出根据本发明实施例的音频编码设备和音频解码设备的示图。图2是示出从比特流格式化器(105)产生的代表性比特流的示图。图3是示出图2的代码变换器的示图。图4是示出用于将与附加子带相应的空间提示参数转换为被SAC方案限制的子带的处理的示图。图5是示出根据本发明另一实施例的SAOC编码器和比特流格式化器的示图。图6是示出根据本发明另一实施例的适合于图5中示出的SAOC编码器501和比特流格式化器505的代码变换器的示图。图7是示出根据本发明另一实施例的音频解码设备的示图。图8是示出图7的混音器的示图。图9是用于描述根据本发明实施例的通过应用CPP将音频信号映射到目标位置的方法的示图。图10是示出根据本发明另一实施例的比特流格式化器105输出的代表性比特流的结构的示图。图10的代表性比特流包括预设ASI信息。图11是示出根据本发明另一实施例的代码变换器的示图。图12是示出图3的代码变换器的示图,其示出处理包括不被ASC方案限制的子带信息或附加信息的代表性比特流的过程。具体实施例方式通过参照附图对实施例进行的以下描述,本发明的优点、特点和各方面将变得清楚,其在此阐述。图1是根据本发明实施例的示出音频编码设备和音频解码设备的示图。如图1所示,根据本发明的音频编码设备包括空间音频对象编码(SAOC)编码器101、空间音频编码(SAC)编码器103、比特流;f各式化器105和预设音频场景信息(预设ASI)单元113。SAOC编码器101是采用SAC技术的基于空间提示的编码器。SAOC编码器101将单声道或立体声声道组成的多个音频对象缩混为单声道或立体声声道组成的一个信号。编码的音频对象在音频解码设备中不是被独立地恢复。编码的音频对象基于每个音频对象的渲染信息被恢复为期望的音频场景。因此,音频解码设备需要用于渲染期望音频场景的音频对象的结构。渲染是通过决定音频信号的输出位置和音频信号的等级(level)来产生音频信号的处理。SAOC技术是基于参数对多对象进行编码的技术。SAOC技术被设计为使用具有M个声道的音频信号发送N个音频对象,其中,M和N是整数并且M小于N(M<N)。对象参数与缩混的信号一起被发送以重建或操作原始对象信号。对象参数可以是关于对象之间的等级差、对象的绝对能量和对象之间的相关性的信息。根据SAOC技术,N个音频对象可基于发送的M(<N)个声道信号和具有空间提示信息和辅助(supplementary)信息的SAOC比特流被重建、修改和渲染。M个声道信号可以是单声道信号或立体声声道信号。N个音频对象可以是单声道信号或立体声声道信号。此外,N个音频对象可以是MPEG环绕(MPS)多声道对象。SAOC编码器对输入的对象信号进行16缩混之外,还提取对象参数。SAOC解码器从缩混的信号重构对象信号并将对象信号渲染为适合于预定数量的再现声道。可由用户输入包括每个对象的声相(panning)位置的重构等级和渲染信息。输出的声音场景可具有多种声道(例如,立体声声道或5.1声道),并与输入的对象的信号数量和缩混声道的数量独立。SAOC编码器101对直4^输入或SAC编码器103输出的音频对象进行缩混,并输出代表性缩混信号。同时,SAOC编码器101对输出具有对输入音频对象的空间提示信息和辅助信息的SAOC比特流。在此,SAOC解码器101可使用"非均匀布局SAOC(heterogeneouslayoutSAOC)"方案和"费勒(Faller)"方案分析输入的音频对象信号。贯穿说明书,以频域的子带(sub-band)为单位对空间提示信息进行分析和提取。在本实施例中,按如下定义了可用的空间提示。CLD[声道(音频信号)等级差]:输入音频信号之间的等级差ICC[声道间相关性]:输入的音频信号之间的相关性CTD[声道(音频信号)时间差]:输入的音频信号之间的时间差CPC[声道预测系数]:输入的音频信号的缩混率即,CLD表示关于音频信号的功率增益的信息;ICC是关于音频信号之间的相关性的信息;CTD是关于音频信号之间的时间差的信息;CPC表示关于当音频信号被缩混时的缩混增益的信息。空间提示的主要作用是保持(sustain)空间图像,即,声音场景。因此,可通过空间提示组成声音场景。从音频信号再现环境的角度,包括最多信息的空间提示是CLD。即,可仅使用CLD产生基本输出信号。因此,以下将基于CLD描述本发明的实施例。但是,本发明不限于CLD。对本领域技术人员清楚的是,本发明可包括与各种空间提示相关的各种实施例。附加信息包括用于恢复和控制输入到SAOC编码器101的音频对象的空间信息。所述附加信息定义用于每个输入的音频对象的标识信息。此外,附加信息定义每个输入的音频对象的声道信息(例如,单声道、立体声声道或多声道)。例如,附加信息可包括用于去除对象的头信息、音频对象信息、呈现(present)信息和控制信息。同时,SAOC编码器101可基于多个子带产生空间提示参数,所述多个子带的数量多于SAC方案限定的子带(即,附加子带)的数量。SAOC编码器101基于以下的式13计算具有主功率的子带的指数(index)Pw—index(b)。将在以下更全面地进行对其描述。子带的指数Pw—index(b)可被包括在SAOC比特流。.贯穿说明书,SAC方案、SAC编码和解码方案或SACCODEC方案是这种条件,即,SAC编码器103必须符合该条件以产生用于输入的多声道音频信号的空间提示信息。SAC方案的代表示例是用于产生空间提示的子带的数量。SAC编码器103通过将多声道音频信号缩混为单声道音频信号或立体声声道音频信号来产生音频对象。同时,SAC编码器103输出包括用于输入的多声道音频信号的空间提示信息和附加信息的SAC比特流。例如,SAC编码器103可以是双耳提示编码(BCC)编码器或MPEG环绕(MPS)编码器。从SAC编码器103输出的音频对象信号输入到SAOC编码器101。与直接输入到SAOC编码器101的音频对象不同,从SAC编码器103输入到SAOC编码器101的音频对象可以是背景场景(backgroundscene)对象。作为多声道音频信号的背景场景对象,被SAC编码器103缩混的一个音频对象可以是根据先前预定音频场景或用于产生音频内容的目的反映的具有多个音频对象的音乐记录(MR)版本的信号。预设ASI单元113基于从外部装置输入的控制信号(即,对象控制信息)形成预设ASI,并产生包括预设ASI的预设ASI比特流。将参照图10和图11更全面的描述预设ASI。比特流格式化器115通过组合从SAOC编码器101输出的SAOC比特流、从SAC编码器103输出的SAC比特流和从预设ASI单元113输出的预设ASI比特流来产生代表性比特流。图2是示出从比特流格式化器105产生的代表性比特流的示图。参照图2,比特流格式化器105基于SAOC编码器101产生的SAOC比特流和SAC编码器103产生的SAC比特流产生代表性比特流。在本发明中,代表性比特流可具有如下三种结构。在代表性比特流的第一种结构201中,SAOC比特流和SAC比特流串行连接。在代表性比特流的第二种结构203中,SAC比特流被包括在SAOC比特流的辅助数据(ancillarydata)区域。代表性比特流的第三种结构205包括多个数据区域,并且每个数据区域包括SAOC比特流和SAC比特流的相应的数据。例如,在第三种结构205中,头区域包括SAOC比特流头和SAC比特流头。此外,第三种结构205包括关于基于预定CLD分组的SAOC比特流和SAC比特流的信息。同时,SAOC比特流头包括在如下表1中定义的音频对象标识符信息、子带信息和附加空间提示标识信息。在此,可控制音频对象表示没有被SAC方案限定的子带信息和通过附加信息分析的音频对象。表1<table>tableseeoriginaldocumentpage19</column></row><table>虽然公开了根据本实施例的用于代表性比特流的三种可用结构,但是本发明不限于此。明显的是,SAOC比特流和SAC比特流可以以各种形式被结合。代表性比特流可包括预设ASI单元113产生的预设ASI比特流。图IO是示出根据本发明另一实施例的从比特流格式化器105输出的代表性比特流的结构的示图。图10的代表性比特流包括预设ASI。如图IO所示,代表性比特流包括预设ASI区域。预设ASI区域包括多个预设ASI,每个预设ASI包括默认预设ASI。预设ASI包括具有关于每个音频对象的位置和等级的信息和输出布局信息的对象控制信息。即,预设ASI表示用于构成适合于扬声器的布局信息的扬声器布局信息和音频场景的每个音频对象的位置和等级。默认预设ASI是用于基本输出的场景信息。代码变换器107使用对象控制信息渲染音频对象。同时,对象控制信息可被设置为预定阈值,例如,默认预设ASI。对象控制信息包括代表性比特流的附加信息和头信息。对象控制信息可被表示为两种类型。第一种,可直接表示每个音频对象的位置和等级信息以及输出布局信息。第二种,每个音频对象的位置和等级信息以及输出布局信息可被表示为将在以下描述的第一矩阵I。该矩阵可净皮用作将在稍后描述的第一矩阵单元3113的第一矩阵。在直接表示包括在预设ASI中的对象控制信息的情况中,预设ASI可包括再现系统的布局信息(例如,单声道、立体声声道或多声道)、音频对象ID、音频对象布局信息(例如,单声道或立体声声道)、音频对象位置(例如,方位表示为0度至360度、高度表示为-50度至90度)和音频对象等级信息表示为-50db至50db。在以第一矩阵I的形式表示包括在预设ASI的对象控制信息的情况下,反映了预设ASI的图6的矩阵P被发送到渲染单元1103。第一矩阵I包括将被映射到声道的功率增益信息,该声道将每个音频对象或相位信息输出为因子向量(factorvector)。预i殳ASI可定义与目标再现情景(scenario)相应的各种音频场景。例如,多声道再现系统(例如,立体声、5.1声道或7.1声道)需要的预设ASI可被定义为与内容制作者的强度(intension)和再现服务的对象相应。再次参照图1,从SAC编码器103输出的SAC比特流包括多声道音频信号的空间提示信息,并依赖SAC编码和解码方案。例如,如果SAC解码器111作为MPEG环绕(MPS)解码器包括28个子带,则SAC编码器103应该以28个子带为单位产生空间提示。例如,SAC编码器103以帧为单位将作为输入音频信号的第一声道信号声道1和第二声道信号声道2变换为频域,并通过分析变换的频域信号以固定的子带为单位产生空间提示。例如,通过式1产生作为一个空间提示的CLD。在式1中,S表示子带的数量,b是子带指数,k是频率系数和A(b)是第b子带的频域的边界。可通过交换式1的分子和分母来定义式1。通常,根据MPEG环绕(MPS)方案通过以固定数量的子带(例如20个或28个)分析一个音频信号帧来产生空间提示。然而,SAOC编码器101可以与SAC方案独立。SAOC编码器101不考虑SAC方案而分析的音频对象的空间提示可包括比根据SAC方案分析的音频对象的空间^提示更多的信息,例如,更多的子带信息或附加地包括不被SAC方案限制的附加信息。在信号处理器109中有效地使用没有被SAC方案限制的子带信息或附加信息。当信号处理器109从代表性缩混信号中去除预定音频对象时,例如,当信号处理器109从SAOC编码器101输出的代表性缩混信号中去除除对象N之外的SAC编码器105输出的所有音频对象信号时,或当仅去除对象N时,通过与SAC方案独立的子带信息或辅助信息根据SAC方案改善了音频对象分解能力。最终,通过与SAC方案独立的子带信息或附加信息,还可改善去除预定音频对象的能力。如果音频对象去除能力被改善,则可以精确和干净除地从代表新缩混信号中去除音频对象,即,高抑制。即,SAOC编码器101可产生用于更多子带的空间提示,即,用于更高分辨率的子带的空间提示和与SAC方案独立的辅助空间提示。SAOC编码器101不限于固定数量的子带。因此,由于与SAOC编码器101独立地产生用于空间提示的音频对象还包括更多辅助信息,因此可实现高抑制。信号处理器109输出通过这种步骤修改的代表性缩混信号,即,基于式2从来自SAOC编码器101的代表性缩混信号中去除除从SAC编码器105输出的对象N之外的所有音频对象信号,或基于式3从代表性缩混音频信号中仅去除对象N。如上所述,SAOC编码器101产生不被SAC方案限制的用于信号处理器109的高抑制的子带信息或辅助信息。例如,SAOC编码器101可通过以大于SAC方案限制的27的子带数量为单位产生空间提示。在这种情况中,由SAOC编码器101产生并被包括在代表性流中的空间提示的子带参数被变换以被仅具有28个子带参数的SAC解码器111处理。这种变换被将在以下描述的代码变换器107执行。即,根据本发明的用于高抑制的SAOC编码器101和用于声道信号恢复的SAC编码器103通过分析由用于每个对象的多声道构成的多声道音频信号来产生空间提示。同时,根据本实施例的音频解码设备包括代码变换器107、信号处理器109和SAC解码器111。贯穿说明书,音频解码设备被描述为包括代码变换器和信号处理器以及解码器。但是,本领域的技术人员明显的是,代码变换器和信号处理器不是必须被物理地包括在具有解码器的装置中。SAC解码器111是基于空间提示的多声道音频解码器。SAC解码器111通过基于从代码变换器107输出的修改的代表性比特流按对象将从信号处理器109输出的修改的代表性缩混信号解码为音频信号来恢复由多声道构成的多对象音频信号。例如,SAC解码器111可以是MPEG环绕(MPS)解码器和BCC解码信号处理器109基于SAOC编码器101输出的代表性缩混信号和解析器301、601、707和1101输出的SAOC比特流信息去除包括在代表性缩混信号中的音频对象的预定部分,并输出修改的代表性缩混信号。例如,信号处理器109输出按照式2通过从SAOC编码器输出的代表性缩混信号中去除除SAC编码器105输出的音频对象信号的对象N之外的音频对象信号来修改的代表性缩混信号。在式2中,U(f)表示从SAOC编码器101输出的代表性缩混信号变换为频域的单声道信号。U"f'ed(f)是修改的代表性缩混信号,该代表性缩混信号是从频域的代表性缩混信号中去除除作为SAC编码器105输出的音频对象信号的对象N之外的对象后剩余的信号。A(b)表示第b子带的频域的边界。d是用于控制等级大小的预定常量,并且是包括在从外部装置输入到信号处理器109的控制信号中的值。Pb°—'"是包括在SAOC编码器101输出的代表性缩混信号中的第i对象的第b子带的功率。包括在SAOC编码器101输出的代表性缩混信号中的第N对象与SAC编码器103输出的音频对象相应。如果U(f)是立体声声道信号,则代表性缩混信号在被划分为左声道和右声道之后被处理。通过式2从信号处理器109输出的修改的代表性縮混信号A(b+l)S"A(b+1)-1Um。dlfied(f)与SAC编码器105输出的对象N和应。即,信号处理器109输出的修改的代表新缩混信号可被视为SAC编码器105按照式2输出的缩混信号。因此,SAC解码器111从修改的代表新缩混信号恢复M个多声道信号。在这种情况中,代码变换器107通过仅处理SAC编码器103输出的SAC比特流产生修改的代表性比特流,所述SAC比特流是从比特流格式化器105输出的代表性比特流中除SAOC编码器101输出的SAOC比特流之外的剩余音频对象信息。因此,修改的代表性比特流不包括功率增益信息和校正信息,功率增益信息和校正信息是直接输入到SAOC编码器101的音频对象信号。在此,信号的总体级可被代码变换器107的渲染单元303控制或被式2的常量d控制。信号处理器109通过基于式3从SAOC编码器101输出的代表性缩混信号中仅去除作为SAC编码器105输出的音频对象信号的对象N来输出修改的代表性缩混信号。P口w,QiW;;=IW1l,N-l丄2,N-1—1M,lPb..丄M.2iM,N_bl,oj—i…W,oj一SAOC(多声道m=2,单声道m=l)》'Object#ibi-1x3Umodltied(f)=U(f)x,pObject#i,i=lA(b+l)S"A(b+1)-1式3在式3中,基于式3的信号处理器109输出的修改的代表新缩混信号Um。d'fied(f)是SAOC编码器101输出的代表性缩混信号中除对象N之外的信号。对象N是SAC编码器105输出的音频对象信号。在这种情况中,代码变换器107通过仅处理比特流格式化器105输出的代表性比特流中除SAC编码器105输出的SAC比特流之外的剩余的音频对象信息来产生修改的代表性比特流。因此,功率增益信息和校正信息不包括在修改的代表性比特流中。在此,功率增益信息和校正信息与对象N(从SAC编码器105输出的音频对象信号)相应。T3b73b73ww:.w□23在此,信号的总体等级可被代码变换器107的渲染单元303控制或被式3的常量d控制。明显的是,信号处理器109可不仅处理频域信号,还可以处理时域信号。信号处理器109可使用离散傅里叶变换(DFT)或正交镜式滤波器组(QMF),以子带为单位划分代表性缩混信号。代码变换器107对从SAOC编码器101传输至SAC解码器111的音频对象执行渲染,并基于作为从外部装置输入的控制信号的对象控制信息和再现系统信息传输比特流格式化器105产生的代表性比特流。代码变换器107基于比特流格式化器105输出的代表性比特流产生渲染信息,以将从SAC解码器111传输的音频对象变换为惰性构成的多对象音频信号。代码变换器107基于包括在代表性比特流中的音频对象信息对从SAC解码器111传输的与目标音频场景相应的音频对象进行渲染。在渲染处理中,代码变换器107预测与目标音频场景相应的空间信息,并通过变换预测空间信息来产生修改的代表性比特流的附加信息。此外,代码变换器107将比特流格式化器105输出的代表性比特流变换为可被SAC解码器111处理的比特流。代码变换器107从比特流格式化器105输出的代表性比特流中排除与信号处理器109去除的对象相应的信息。图3是示出图2的代码变换器107的示图。如图3所示,代码变换器107包括解析器301、渲染单元303、子带转换器305、第二矩阵单元311和第一矩阵单元313。解析器301通过解析比特流格式化器105输出的代表性比特流从该代表性比特流中分离SAOC编码器101产生的SAOC比特流和SAC编码器103产生的SAC比特流。解析器301还从分离的SAOC比特流提取关于输入到SAOC编码器101的音频对象的数量的信息。第二矩阵单元311基于从解析器301分离的SAC比特流产生第二矩阵II。第二矩阵是用于SAC编码器103的作为多声道音频信号输入信号的矩阵,该输入信号是多声道音频信号。第二矩阵与作为SAC编码器的输入信号的多声道音频信号的功率增益值有关。式4示出第二矩阵I1。24<formula>formulaseeoriginaldocumentpage25</formula>Y:M(k)式4矩阵n基本地,根据SAC技术一个音频信号帧被分析为M子带单元。在此,U^(k)表示对象N(SAC编码器105输出的音频对象信号),对象N是SAC编码器103输出的缩混的信号。k是频率系数。b是子带指数。W二是SAC编码器103的M个输入音频信号的空间提示信息,是包括在SAC比特流中的多声道信号。其用于恢复第i音频信号的频率信息,其中,i是大于l小于M的整数(1-^M)。因此,W^i可表示为频率系数的大小或相位。因此,式4的Y^c(k)表示SAC解码器111输出的多声道音频信号。L4c(k)和W:i是向量。U^(k)的转置矩阵维数成为W^i的维数。例如,可按式5定义。在此,由于对象N是单声道信号或立体声声道信号,因此m可以是1或2。如上所述,对象N是SAC编码器103输出的缩混信号,并且还是SAC编码器105输出的音频对象信号。W二xUsV(k)《(k)式如上所述,W:i是包括在SAC比特流中的空间提示信息。如果W二表示在每个声道的子带中的功率增益,则可由CLD预测W、'。如果wl;被用于校正频率系数之间的相位差,则可由ctd或icc预测w;;,。以下,W:;被示例性地用作校正频率系数之间的相位的系数。为了通过^f吏用SAC编码器103输出的缩混信号(即,SAC编码器105输出的音频对象信号,对象N)的矩阵计算产生从SAC解码器111输出的多声道音频信号Y^(k),式4的第二矩阵II表示每个声道的功率增益值,并具有作为SAC编码器105输出的音频对象的对象N的缩混信号的逆维数。渲染单元303组合第二矩阵单元311产生的式4的第二矩阵II与第一矩阵单元313的输出。为了将来自SAC解码器111的音频对象映射到包括多声道的多对象音频信号,第一矩阵单元313基于外部装置输入的控制信号产生第一矩阵I。形成式6的第一矩阵I的基本向量P〗表示用于将第j音频对象映射到解码器的第i输出声道的功率信息或相位信息,其中,j是大于1小于(N-l)的整数(l$j$N-l),j是大于1小于M的整数(l-^M)。可从外部装置输入基本向量p纟,或从使用初始值设置的控制信息(例如,从对象控制信息和再现、1系统信息)获得基本向量p,i。渲染单元303基于式6计算第一矩阵单元313产生的式6的第一矩阵I。SAOC编码器101的N个输入音频对象中,第N音频对象是从SAC编码器103输出的缩混信号,剩余信号被直接输入到SAOC编码器101。在这种情况中,除SAC编码器103输出的缩混信号之外的每个音频对象可根据第一矩阵I被映射到SAC解码器的M个输出声道。在此,缩混信号是作为SAC编码器105输出的音频对象信号的对象N。渲染单元303基于式6计算SAC解码器111的输出声道的功率增益向量W:i。P口w》pP,2'1P.2,2'2,N-1pbpM.2P,M'N-1WwchWcliSAOC二w'矩阵TW,式6'l,oj一ivl,oj一ij(多声道m=2,单声道m=l)在式6中,w^,是表示除SAC编码器103输出的音频对象之外的第j(l^^N-l)音频对象的向量,例如,式1的直接输入到SAOC编码器101的对象音频的子带信号。即,这是作为子带变换器305输出的SAOC比特流的可根据SAC方案从SAOC比特流获得的空间提示信息。如果第j音频对象立体声,则相应的空间提示wl,具有2xl维度。式6的运算符〇等于式7和式8。PPwWoj—N_boj—2式7<formula>formulaseeoriginaldocumentpage27</formula>杜a/7F口asy,田丁i亏祸r到sal;用平々与奋丄丄丄日3貫观^r豕疋皁尸逸4吕,r或立体声声道信号,因此m可以是l或2。在SAOC编码器101的音频信号中除SAC编码器105输出的音频输出之外,输入音频对象的数量是N-1。如果SAC解码器111输出M个输出声道,则式6的第一矩阵的维度是Mx(N-1),并且&构成为2xl矩阵。然后,渲染单元303基于包括输出声道的功率增益向量W二的矩阵作为通过式4计算的第二矩阵II和通过式6计算的矩阵计算目标空间提示信息,并产生包括目标空间提示信息的修改的代表性比特流。在此,目标空间提示是与期望从SAC解码器111输出的输出多声道音频信号相关的空间提示。即,渲染单元303才艮据式9计算期望的空间提示信息Wl^d。因此,在对传输到SAC解码器111的音频对象进行渲染之后,每个声道的功率比率可被表示为<formula>formulaseeoriginaldocumentpage27</formula>在式9中,Pw是作为SAC编码器103输出的音频对象信号的对象N的功率相对于直接输入到SAOC编码器101的(N-l)个音频对象的功率之和的比率。其可由式10表示。<formula>formulaseeoriginaldocumentpage27</formula>被传输并输出到SAC解码器111的信号的功率比率可被表示为作为空间提示参数的CLD。相邻声道信号之间的空间提示可被表示为根据空间提示信息W:。dif,ed的各种组合。即,渲染单元103根据空间提示信息Wld,产生空间提示参数。例如,如果从SAC解码器111传输的音频信号是立体声声道信号,则可基于式11产生第一声道信号Chi与第二声道信号Ch2之间的CLD参数。式11<formula>formulaseeoriginaldocumentpage28</formula>同时,如果传输到SAC解码器111的音频信号是单声道信号,则可通过式12计算CLD参数。<formula>formulaseeoriginaldocumentpage28</formula>:式12渲染单元303根据霍夫曼(Huffman)编码基于从W二麵提取的空间提示参数(例如,式11和式12的CLD参数)产生修改的代表性比特流。根据解码器的特性不同地分析和提取包括在渲染单元303产生的修改的代表性比特流中的空间提示。例如,BCC解码器可使用式11提取用于一个声道的(N-l)CLD参数。此外,MPEG环绕解码器可基于MPEG每个声道的比较顺序提取CLD参数。即,解析器301从比特流格式化器105输出的代表性比特流中分离SAOC编码器101产生的SAOC比特流和SAC编码器103产生的SAC比特流。第二矩阵单元311基于分离的SAC比特流使用式4产生第二矩阵II。第一矩阵单元313产生与控制信号相应的第一矩阵I。渲染单元303基于第一矩阵和分离的SAOC比特流-使用式6计算包括SAC解码器111的功率增益向量,的矩阵,其中,所述分离的SAOC比特流是被子带转换器305转换的SAOC比特流,即,根据SAC方案的SAOC比特流。渲染单元303使用式9基于通过式6计算的矩阵和通过式4计算的第二矩阵来计算空间提示信息w二,。渲染单元303基于从W二,提取的空间提示信息(例如,式11和式12的CLD参数)产生修改的代表性比特流。修改的代表性比特流是根据解码器的特性适当地转换的比特流。修改的代表性比特流可被恢复为包括多声道的多对象音频信号。如上所述,SAOC编码器101可不考虑与SAC编码器103和SAC解码器lll相关的SAC方案而产生用于更多个子带的空间提示。即,SAOC编码器101产生用于更高分辨率的子带的空间提示和辅助空间提示。例如,SAOC编码器101可产生用于多于28个子带的子带的空间提示,其中,28是被SAC编码器103和SAC解码器111的MPEG环绕方案限定的子带的数量。当SAOC编码器101产生作为辅助子带单位(其数量大于SAC方案限定的子带的数量)的空间提示参数时,代码变换器107将与附加子带相应的空间提示参数变换为与SAC方案限定的子带相应。这些变换被子带转换器305执行。图4是示出将与附加子带相应的空间提示参数转换为SAC方案限定的子带的处理的示图,其中该处理被子带转换器305执行。如果SAC方案限定的子带中的第b子带具有与SAOC编码器101的L个附加子带的相应关系,则子带转换器305将用于L个附加子带的空间提示参数转换为一个空间提示信息,并将其映射到第b子带。作为将用于L个附加子带的空间提示参数转换为一个空间提示参数的示例,子带转换器305将用于L个附加子带的CLD参数转换为一个CLD参数,SAOC编码器101从SAOC比特流中提取该用于L个附加子带的CLD参数。在种情况中,子带转换器305从L个附加子带中选择具有最主要功率的CLD参数。SAOC编码器101使用式13计算具有最主要功率的子带的指数Pw一indx(d),并将计算的指数包括在SAOC比特流中。CLD_dist(b)Pw—indx(b)=argminCLD—dist(b+d)CLD—dist(b+L-l)CLD—dist(b)CLD—dist(b+d)CLD—dist(b+L-l)=CLDSAC(b)CLD匿(b)CLDSA0C(b+d)CLDSA。c(b+L-l)式3在式13中,CLD(b)是用于第bSAC子带段的CLD信息,该CLD信息是SAOC编码器101根据SAC方案为了计算子带指数Pw—indx(b)而产生的子带信息。CLD^。c(b+d)是SAOC附属子带(即,与第bSAC子带段相应的L个附加子带)中与第d附属子带相关的CLD值,其中,0^iSL-l。用于L个SAOC子带的附属子带识别与一个SAC子带段相应的多个SAOC子带,即,高分辨率的子带。如果SAC子带的分析单位与SAOC子带的分析单位相同,则CLDSA0C(b)=CLDSAC(b)。CLD—dist(b+d)表示CLDSAC(b)与CLDSAOC(b+d)之差。因此,29子带指数Pw一indx(b)是具有在L个附加子带中与CLD^(b)的最小差的CLD值的指数。子带转换器305根据式14基于对从解析器301输出的SAOC比特流的SAOC编码器101产生的子带指数Pw—indx(b)将L个附加子带中与CLD:SA。C(b)具有最小差的CLD值CLD^。c(Pw—indx(b))映射到SAOC比特流的第b子带。即,用于SAOC比特流的第b子带的CLD参数CLD,c(b)根据式14被替换为L个附加子带中与CLDSA。C(b)具有最小差的CLD值。CLDSA。c(b)=CLDSA。c(Pw—indx(b))式14同时,如果[CLDSA0C(b)…CLDSA0C(b+L)]T与CLDSA0C(Pwindx(b))的算数平均值之差大于10db,则式14的CLD:,。(b)被替换为通过式15平滑的值。通过式15来排除CLDsA。c(b)与[CLDsA。c(b)…CLDSA。c(b+L)]T的最大偏差。CLDSAOC(b):2a+lf;CLD匿(Pw—indx(b)+j)0《a《172式15为了排除CLDsA。c(b)与[CLDsA。c(b)…CLDsA。c(b+L)f的最大偏差,根据式15在用于L个附加子带的CLD[CLDSA。c(b-L/2)…CLDSA。r(b+L/2)]T中排出具有大于士30db的CLD。由于是很小的信号,所以可忽略具有大于土30db的CLI)的子带声道信号。[…,-10,5,-32,…]t,CLD匿(b)4(-10+5-32)例如,如果[CLDSA0C(b),…,CLDs織(b十L)]'是L/2=l并且CLDSA。c(Pwindx(b》=5,则然而,如果排除了大于±30db的值,则SA。c(b),(-10+5)同时,子带转换器305使用式16计算子带的指数P,—mdx(b)来替换SAOC编码器101基于式13产生的子带的指数PwJndx(b),并根据式14和式15交换SAOC比特流的第b子带的CLD参数CLDsA。c(b)与CLDSA。c(Pwindx(b))。<formula>formulaseeoriginaldocumentpage30</formula>式16虽然示例性地描述了CLD,但是根据本实施例可相同地应用另一空间提示参数ICC。例如,SAOC比特流的第b子带的ICC参数lcc'sA。c(b)根据式17至式20一皮替才奐为ICCSA0C(Pw—indx(b))Pw—indx(b)=argminICC—dist(b)ICC—dist(b+d)ICC—dist(b+L-l)ICC—dist(b)ICC—dist(b+d)ICC—dist(b+L-l)icc匿(b)ICCSAC(b)ICC匿(b+d)ICCSA。c(b+L-l)ICCSA0C(bHCCSAOC(Pw—indx(b))ICCSA0C(b)=丄JICCSA0C(Pw—indx(b)+j)0"SL/2式17式18Pw_indx(b)=argminOdb-ICC匿(b)ICC匿(b+d)ICCSA。c(b+L-l)式19式20如上所述,子带转换器305将解析器301输出的SAOC比特流转换为根据SAC方案的SAOC比特流。在此,SAOC比特流包括以辅助子带为单位产生的空间提示参数,该辅助子带的单位是比基于SAC方案限制的子带的数量多的单位。渲染单元303根据式6基于第一矩阵I和来自子带转换器305的转换的SAOC比特流(即,根据SAC方案的SAOC比特流)计算包括SAC解码器111的输出声道的功率增益向量W二。此前,描述过辅助子带单位是大于被SAC方案限制的子带的数量的单位,以及SAOC编码器101以所述辅助子带为单位产生空间提示参数并包括SAOC比特流中的产生的空间提示参数。然而,尽管未使用的空间提示信息被附加包括在SAOC比特流中,可相同地应用本发明的技术方面。例如,SAOC编码器101产生作为相位信息的空间提示信息(例如,耳间相位差(IPD)和整体相位差(OPD)),并将产生的空间提示信息包括在31SAOC比特流中以用于信号处理器109的高抑制。辅助信息可改善音频对象的分解能力。因此,信号处理器109可从代表性缩混信号精确和干净地去除音频对象。在此,IPD表示两个输入音频信号在子带处的相位差,OPD表示代表性缩混信号与输入音频信号之间的子带相位差。同时,子带转换器305去除附加信息以产生根据SAC方案的去除SAOC比特流。图12是示出图3中的代码变换器的示图。即,图12是示出在代码变换器107中处理具有不被SAC方案限制的子带信息和附加信息的代表性比特流的过程的示图。为了简单,图12中没有示出第一矩阵单元313和第二矩阵单元311。如图12所示,输入到解析器301的代表性比特流包括SAOC编码器101产生的SAOC比特流。SAOC比特流编码器101产生的SAOC比特流是包括不被SAC方案限制的空间提示信息的附加空间提示信息(例如,子带指数Pw—indx(b)、ITD等)。解析器301从代表性比特流中将SAC编码器103产生的SAC比特流输出到第二矩阵单元311。此外,解析器301将SA()C编码器101产生的SAOC比特流输出到子带转换器305。子带转换器305将来自SAOC编码器的产生的SAOC比特流转换为基于SAC方案的SAOC比特流,并将该SAOC比特流输出到渲染单元303。因此,由于从渲染单元303输出的修改的代表性比特流是基于SAC方案的比特流,所以SAC解码器111可处理修改的代表性比特流。图5是示出#4居本发明另一实施例的SAOC编码器和比特流格式化器的示图。图1示出的SAOC编码器101和比特流格式化器105可被替换为图1的SAOC编码器501和比特流格式化器505。在这种情况中,SAOC编码器501产生两个SAOC比特流。一个是不被SAC方案限制的SAOC比特流,另一个是被SAC方案限制的称作基于SAC方案的SAOCA比特流的SAOC比特流。不被SAC方案限制的SAOC比特流包括与图1的SAOC编码器输出的SAOC比特流相同的不被SAC方案限制的空间提示信息(例如,子带指数Pw—indx(b)、ITD等)。SAOC编码器501包括第一编码器507和第二编码器509。第一编码器507对输入到SAOC编码器501的N个音频对象中的[N-C]个音频对象进行缩32混。第一编码器507还产生包括用于[N-C]个音频对象的空间提示信息和辅助信息的SAOC比特流信息的基于SAC方案的SAOC比特流。第二编码器509通过对第一编码器507输出的缩混信号和输入到SAOC编码器501的N个音频对象中其余的C个音频对象进行缩混产生代表性缩混信号。第二编码器509还产生不被SAC方案限制的SAOC比特流作为用于剩余C个音频对象和第一编码器507输出的缩混信号的包括空间提示信息和辅助信息的SAOC比特流的。比特流格式化器505通过对SAOC编码器101输出的两个比特流、SAC编码器103输出的两个SAC比特流和预设ASI单元113输出的预设ASI比特流进行组合来产生代表性比特流。比特流格式化器505输出的代表性比特流可以是图2和图10示出的比特流中的一个。图6是示出根据本发明另一实施例的代码变换器的示图,其中,该代码变换器适合于图5中示出的SAOC编码器501和比特流格式化器505。图6的代码变换器基本上执行与图3的代码变换器相同的操作。然而,解析器601从比特流格式化器105输出的代表性比特流中分离SAOC编码器501产生的两个SAOC比特流。一个是不被SAC方案限制的SAOC比特流,另一个是SAC方案限制的称作基于SAC方案的SAOC比特流的SAOC比特流。基于SAC方案的SAOC比特流被直接用于渲染单元603。同时,不被SAC方案限制的SAOC比特流被用在信号处理器109中,并被子带转换器605转换为基于SAC方案的SAOC流。如上所述,不被SAC方案限制的SAOC比特流是SAOC编码器501产生的信息,并包括不被SAC方案限制的子带信息或附加信息。所述附加信息改善分解音频对象的能力。因此,信号处理器109可从代表性缩混信号精确和清楚地去除音频对象。即,由于用于不被SAC方案限制的子带信息或附加信息的音频对象还包括更多辅助信息,因此可通过信号处理器109获得高抑制性。同时,为了使例如具有28个子带参数的SAC解码器能够根据SAC方案处理SAOC比特流,不被SAC方案限制的SAOC比特流被子带转换器605转换。例如,附加信息被子带转换器去除以产生基于SAC方案的SAOC流。图11是示出根据本发明另一实施例的代码变换器的示图。图11的代码变换器使用预设ASI信息,而不使用直接输入到第一矩阵单元的对象控制信33息和再现系统信息。图11的代码变换器包括渲染单元1103、子带变换器1105、第二矩阵单元111和第一矩阵单元1113。图11的代码变换器的这些构成元件执行与图3和图中的渲染单元303和603、子带变换器305和605、第二矩阵单元311和611以及第一矩阵单元313和613相同的操作。但是,输入到解析器1101的代表性比特流附加地包括图10中示出的预设ASI比特流。解析器1101通过对比特流格式化器105和505输出的代表性进行解析来从代表性比特流分离SAOC编码器101产生的SAOC比特流和SAC编码器103产生的SAC比特流。解析器1101还从代表性比特流对预设ASI比特流进行解析,并将该预设ASI比特流发送到预设ASI提取器1117。预设ASI提取器1117从提取自解析器1101的预设ASI比特流提取默认预设ASI信息。即,预设ASI提取器1117提取用于基本输出的场景信息。响应于从外部装置输入的预设ASI选择请求,预设ASI提取器1117可提取由从解析器1101提取的预设ASI比特流选择和请求的预设ASI信息。如果从预设ASI提取器1117提取的预设ASI信息是基于预设ASI选择请求而选择的预设ASI信息,则矩阵确定器1119确定选择的预设ASI信息是否是第一矩阵I的形式。如果选择的预设ASI信息不是第一矩阵I的形式,即,如果选择的预设ASI信息直接表示关于每个音频对象的位置和等级的信息以及关于输出布局的信息,则矩阵确定器1119将选择的预设ASI信息发送到第一矩阵单元1113,并且第一矩阵单元1113使用从矩阵确定器1119发送的预设ASI信息产生第一矩阵I。如果选择的预设ASI信息是第一矩阵[的形式,则矩阵确定器1119绕过第一矩阵单元1113之后将选择的预设ASI信息发送到渲染单元1103,并且渲染单元1103使用从矩阵确定器1119发送的预设ASI信息。如上所述,渲染单元11034艮据式9基于通过式6计算的矩阵和通过式4计算的第二矩阵n计算空间提示信息w二,。渲染单元1103基于从wld,提取的空间提示参数(例如,式11和式12的CLD参数)产生修改的代表性比特流。图7是示出根据本发明的另一实施例的音频解码设备的示图。如图所示,根据本发明另一实施例的音频解码设备包括解析器701、信号处理器709、SAC解码器711和混音器701。在根据图7的音频解码设备中,当信号处理器109从SAOC编码器101和501输出的代表性缩混信号去除音—'_A"L、trrA口.q"八^iLZ——L^V,kir—L_A//一士,'r£_/'一/ii,■、、"P,豕ti3,'/f匕貫奋/u丄ir凡4丁x-j貫"w—'j承日'、j尸鄉、疋ii^、iocaiizauon入图7的音频解码设备与图3的音频解码设备不同,包括代替代码变换器107的解析器707并附加地包括混音器701。解析器707通过对代表性比特流进行解析,从比特流格式化器105和505输出的代表性比特流分离SAOC编码器101和501产生的SAOC比特流以及SAC编码器103产生的SAC比特流。如果SAC编码器103是MPS编码器,则SAC比特流是MPS比特流。解析器707从分离的SAOC比特流(输入到SAOC编码器101和501的音频对象)提取作为场景信息的可控制对象的位置信息,并将提取的信息传输到混音器701。信号处理器709基于SAOC编码器101输出的代表性缩混信号和解析器701输出的SAOC比特流信息部分地去除包括在代表性缩混信号中的音频对象,并输出修改的代表性缩混信号。例如,已描述到,信号处理器109使用式2通过从SAOC编码器101和501输出的代表性缩混信号去除除作为SAC编码器105输出的音频对象信号的对象N之外的音频对象,来输出修改的代表性缩混信号。也描述到,信号处理器109通过从SAOC编码器101和501输出的代表性缩混信号中仅去除作为SAC编码器105输出的音频对象信号的对象N来输出修改的代表性缩混信号。在图7中,信号处理器709通过从音频信号对象中去除除作为可控制对象信号的对象1之外的所有音频对象来输出修改的代表性缩混信号。或者,信号处理器709从音频信号对象中仅去除对象1来输出修改的代表性缩混信号。在去除除对象1之外的所有对象的情况中,不是必须附加地提取对象1的分量。在仅去除对象1的情况中,信号处理器709基于式21从代表性缩混信号中提取对象l的分量。在式21中,Object針(n)是包括在代表性缩混信号中的对象1的分量,Downmixsignals(n)是4戈表性缩混^言号,ModifiedDownmixsignals(n)是f务改的4戈表性缩混信号,n表示时域样本指数。信号处理器709通过直接控制参数来从代表性缩混信号提取对象1的分量。例如,信号处理器709可基于通过式22计算的增益参数来从代表性缩混信号提取对象1的分量。Object#l(n)=Downmixsignals(n)-ModifiedDownmixsignals(n)式21<formula>formulaseeoriginaldocumentpage35</formula>在式22中,G。bieeW1是包括在代表性缩混信号中的对象1的增益,GM。difiedD_signals是修改的代表性缩混信号的增益。SAOC解码器711执行与图1的SAC解码器111相同的操作。例如,SAC解码器711是MPS解码器。SAC解码器711使用解析器701输出的SAC比特流将信号处理器709输出的修改的代表性缩混信号解码为多声道信号。混音器701对信号处理器709输出的作为图7的对象1的可控制对象信号SAC解码器711输出的多声道信号进行混音,并输出混音信号。混音器701基于作为解析器707输出的信号的可控制对象信号的位置信息(即,场景信息)确定可控制对象的输出声道。图8是示出图7的混音器的示图。如图8所示,混音器701通过SAC解码器711输出的M个声道信号的增益gl至gM乘以作为可控制对象信号的对象1并将相乘结果与M个声道信号相加来对可控制对象信号和多声道信号进行混音。例如,如果期望将对象1放置在第一声道信号,则gl=l并且所有剩余系数是O。作为另一示例,如果期望将对象1放置在第一声道信号1与第二声道信号2之间,则gl二g2^/V5并且所有剩余系数是0。如果期望将可控制对象信号放置在预定信号之间,则根据声相规则(panninglaw)控制每个增益。当信号处理器709通过去除除第一对象1之外的所有对象来输出代表性缩混信号时,SAC解码器711可不处理修改的代表性缩混信号。代替不处理,混音器701通过将作为信号处理器709输出的可控制对象信号的第一对象1与gl至gM相乘来对信号进行混音。例如,如果期望将第一对象l放置到第一声道信号,则gl=l并且全部剩余系数是O。作为另一示例,如果期望将第一对象1放置在第一声道信号与第二声道信号之间,则ghg2二l/V^并且所有剩余系数是0。如果期望将可控制对象信号放置在预定信号之间,则根据声相规则控制每个增益值。如果第一对象1是立体声声道对象信号,则gl和g2被设置为1并且剩余系数设置为0,从而将第一对象产生为立体声声道信声相表示将可控制对象信号放置在输出声道信号之间的处理。采用声相规则的映射方法通常被用于映射输出声道信号之间的输入音频信号。声相规则可包括正弦声相规则、正切声相规则、恒定功率声相规则(CPP规则)。任何方法可通过声相规则获得相同的对象。36以下,将描述才艮才居本发明实施例的用于才艮据CPP头见则一f音频信号映射到目标位置的方法。但是,明显的是本发明可被应用到各种声相规则。即,本发明不限于CPPMJ寸。根据本发明的实施例,多对象或多声道音频对象根据用于给定声相角度的CPP被进行声相输出(pan)。图9是描述4艮据本发明实施例的通过应用CPP将音频信号映射到目标位置的方法的示图。如图9所示,输出信号。^L和。utg^分别是0度和90度。因此,孔径(aperture)大约是90度。如果第一输入音频信号g"位于第一输出信号。u,g^与第二输出信号。^之间的位置e,则a、(3被定义为a=cos(e)、(3=sin(e)。根据CPP规则,通过将输入音频信号的位置映射到输出音频信号的轴并使用正弦和余弦函数来计算a、(3值,并通过计算控制的功率增益来渲染音频信号。基于(x、P值计算和控制的功率增益被表示为式23。<formula>formulaseeoriginaldocumentpage37</formula>在式23中,a=cos(e),(3=sin(e)。式24更详细地描述了式23。<formula>formulaseeoriginaldocumentpage37</formula>a和b值可根据声相规则而改变。通过将输入音频信号的功率增益映射到输出音频信号的适合于孔径的虚拟位置来计算a和b值。以下,以设备的角度来描述根据本发明的编码处理、代码变换处理和解码处理。包括在设备中的每个组元可等效于处理块。在这种情况中,对本领域技术人员明显的是,可以以方法的角度来理解本发明。例如,包括图1或图5的SAOC编码器101或501、SAC编码器103、比特流格式化器105或505和预设ASI单元113的音频编码设备执行音频编码方法,该音频编码方法包括对包括多个声道的音频信号进行缩混;产生用于包括多个声道的音频信号的空间提示,并产生具有产生的空间提示的第一渲染信息;对包括具有缩混的信号的多个对象的音频信号进行縮混,产生用于包括多个对象的音频信号的空间提示,并产生具有产生的空间提示的第二渲染信息。在对包括多个声道的音频信号进行缩混的步骤中,用于包括多个对象的音频信号的空间提示不被CODEC方案限制,该OCDEC方案限制对包括多个声道的音频信号进行缩混。所述音频编码设备执行音频编码方法,该音频编码方法包括对包括多个声道的音频信号进行缩混,产生用于包括多个声道的音频信号的空间提示并产生包括产生的空间提示的第一渲染信息;对包括多个对象的音频信号进行缩混,该音频信号包括通过对包括多个声道的音频信号进行缩混得到的缩混的信号,产生用于包括多个对象的音频信号的空间提示和产生包括产生的空间提示的第二渲染信息;对包括多个对象的音频信号进行缩混,该音频信号包括通过对包括多个对象的音频信号进行缩混得到的缩混的信号,产生用于包括多个对象的音频信号的空间提示并产生包括产生的空间提示的第三渲染信息。在对包括多个对象的音频信号进行缩混的步骤中,不考虑CODEC方案而产生用于包括多个对象的音频信号的空间提示,该CODEC方案限制对包括多个声道的音频信号进行缩混和对包括多个对象的音频信号进行缩混。此外,包括图3、6和11的解析器301、601和1101、渲染单元303、603和1103、子带转换器305、605和1105、第二矩阵单元311、611和1111、第一矩阵单元313、613和1113、预设ASI提取器1117以及矩阵确定器1119的代码变换器可执行代码变换方法,该代码变换方法包括产生渲染信息,该渲染信息包括用于基于对象控制信息和输出布局信息将编码的音频信号映射到音频解码设备的输出声道的信息,所述对象控制信息包括包括编码的音频信号的位置和等级信号以及输出布局信息;基于包括用于音频信号的空间提示的第一渲染信息,产生用于包括在编码的音频信号中的包括多个声道的音频信号的声道恢复信息;将第二渲染信息转换为符合CODEC方案的渲染信息,该第二渲染信息具有用于包括在编码的音频信号中的包括多个对象的音频对象的的音频信号的空间提示;其中,第二渲染信息包括不被限制第一渲染信息的CODEC方案限制的空间提示;基于第一矩阵装置产生的渲染信息、第二矩阵装置产生的渲染信息和来自子带转换器装置的转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。381'戈石马变4奂器护"于3马变纟炎方法,该1戈^马变纟吳方法包〗舌^人渲染信息拔」耳又预定的预设ASI;基于作为提取的预设ASI的直接表示编码的音频信号的位置和等级信息的对象控制信息以及输出布局信息,产生包括这种信息的渲染信息,该信息用于将编码的音频信号映射到音频解码设备的输出声道;基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于提取的预设ASI和产生渲染信息步骤所产生的渲染信息、产生声道恢复信息步骤所产生的渲染信息和转换的渲染信息中的一个,产生用于编码的音频信号的修改的渲染信息。此外,代码变换器可执行代码变换方法,该代码变换方法包括基于具有编码的音频信号的位置和等级信息的对象控制信息以及输出布局信息,产生包括这种信息的渲染信息,该信息用于将编码的音频信号映射到音频解码设备的输出声道;基于第一渲染信息,产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于产生渲染信息步骤所产生的渲染信息、产生声道恢复信息步骤所产生的渲染信息、转换第三渲染信息的步骤所转换的渲染信息以及第二渲染信息,产生用于编码的音频信号的修改的渲染信息。代码变换器可执行代码变换方法,该代码变换方法包括从渲染信息提取预定的预设ASI;基于作为提取的预设ASI的直接表示编码的音频信号的位置和等级信息的对象控制信息以及输出布局信息,产生包括这种信息的渲染信息,该信息用于将编码的音频信号映射到音频解码设备的输出声道;基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;将第三渲染信息转换为符合CODEC方案的渲染信息;基于提取的预设ASI和产生渲染信息步骤所产生的渲染信息、产生声道恢复信息步骤所产生的渲染信息和转换的渲染信息中的一个,产生用于编码的音频信号的修改的渲染信息。包括图1和图7的解析器707、信号处理器709、SAC解码器711以及混音器701的解码设备可执行音频解码方法,该音频解码方法包括从用于包括多个声道的多对象音频信号的渲染信息,分离包括用于包括多个对象的音频信号的空间提示的多对象信号的渲染信息和所述包括多个对象的音频信号的场景信息;基于多对象信号的渲染信息,通过在用于包括多个声道的多对象音频信号的缩混的信号中对用于包括多个声道的音频信号执行高抑制来输出修改的缩混信号;基于场景信息通过对修改的缩混信号进行混音来恢复A/二口解码设备还可执行音频解码方法,该音频解码方法包括从用于包括多个声道的多对象音频信号的渲染信息,分离多声道信号的渲染信息(该多声道信号包括用于包括多个声道的音频信号的空间提示)、多对象信号的渲染信息(该多对象信号包括用于包括多个对象的音频信号的空间提示)和包括多个对象的音频信号的场景信息;基于多对象信号的渲染信息,通过对用于包括多个声道的多对象音频信号的缩混的信号中的至少一个音频对象信号执行高抑制来产生修改的缩混信号和高抑制音频对象信号;通过对修改的缩混信号进行混音来恢复多声道音频信号;基于场景信息对修改的缩混信号和由信号处理装置产生的音频对象信号进行混音。根据本发明实施例的如上所述的方法可被实现为程序并存储在计算机可读记录介质。计算机可读记录介质是可存储其后可被计算机系统的数据的任何数据存储装置。计算机可读记录介质包括只读存储器(ROM)、随机存储存储器(RAM)、CD-ROM、软盘、硬盘和光盘。虽然参照特定实施例描述了本发明,对于本领域技术人员清楚的是,在不脱离权利要求限定的本发明的精神和范围的情况下,可进行各种变化和修改。产业上的可利用性根据本发明,用于能够以多种方式对具有多声道的多对象音频信号进行编码和解码。因此,可根据用户的需求主动地欣赏音频内容。40权利要求1、一种音频编码设备,所述音频编码设备包括多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多对象编码装置,对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,多声道编码装置不考虑编码器解码器CODEC方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码装置。2、如权利要求1所述的音频编码设备,其中,多对象编码装置产生用于附加附属子带的空间提示作为用于所述包括多个对象的音频信号的空间提示,该附加附属子带与被CODEC方案限制的子带中的一个相应。3、如权利要求2所述的音频编码设备,其中,多对象编码装置包括与空间提示相应的附属子带的指数信息,该空间提示与用于附加附属子带中被CODEC方案限制的子带中的一个的空间提示最相似。4、如权利要求1所述的音频编码设备,其中,多对象音频编码装置产生用于所述包括多个对象的音频信号的空间提示作为除CODEC方案限制的空间提示之外的空间提示。5、一种音频编码设备、所述音频编码设备包括多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;第一多对象编码装置,对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号具有来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,并产生包括产生的空间提示的第二渲染信息;第二多对象编码装置,对包括多个对象的音频信号进行缩混,所述包括多个对象的音频信号包括来自第一多对象编码装置的缩混的信号,产生用于包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第三渲染信息,其中,第二多对象编码装置不被CODEC方案限制而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码装置和第一多对象编码装置。6、如权利要求5所述的音频编码设备,其中,第二多对象编码装置产生用于附加附属子带的空间提示作为用于所述包括多个对象的音频信号的空间提示,该附加附属子带与被CODEC方案限制的子带中的至少一个子带相应。7、如权利要求6所述的音频编码设备,其中,第二多对象编码装置包括与空间提示相应的附属子带的指数信息,该空间提示与用于附加附属子带中被CODEC方案限制的子带中的一个的空间提示最相似。8、如权利要求5所述的音频编码设备,其中,第二多对象编码装置产生用于所述包括多个对象的音频信号的空间提示作为被CODEC方案限制的空间提示之外的空间提示。9、一种用于产生渲染信息以对编码的音频信号进行解码的的代码变换设备,所述代码变换设备包括第一矩阵装置,基于包括编码的音频信号的位置和等级信息以及输出布局信息的对象控制信号,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵装置,基于包括用于包括多个声道的音频信号的空间提示的第一渲染信息,产生用于所述包括多个声道的音频信号的声道恢复信息,所述包括多个声道的音频信号被包括在编码的音频信号中;子带转换装置,将具有用于包括多个对象的音频信号的空间提示的第二渲染信息转换为符合CODEC方案的渲染信息,所述包括多个对象的音频信号被包括在编码的音频信号中,其中,第二渲染信息包括不被限制第一渲染信息的CODEC方案限制的空间提示;渲染装置,基于第一矩阵装置产生的渲染信息、第二矩阵装置产生的渲染信息和来自子带转换装置的转换的渲染信息,产生用于编码的音频信号的修改的渲染信息。10、如权利要求9所述的代码变换设备,其中,第二渲染信息包括用于附加附属子带的空间提示作为用于音频对象信号的空间提示,该附加附属子带与被CODEC方案限制的子带中的至少一个子带相应。11、如权利要求IO所述的代码变换设备,其中,第二渲染信息还包括与空间提示相应的附属子带的指数信息,该空间提示与用于附加附属子带中被CODEC方案限制的子带中的一个的空间提示最相似;子带转换装置基于指数信息将用于被CODEC方案限制的子带中的至少一个子带的空间提示替换为用于附属子带的空间提示。12、如权利要求IO所述的代码变换设备,其中,子带变换装置将用于被CODEC方案限制的子带中的至少一个子带的空间提示替换为具有在附加附属子带中最小的绝对值的空间提示。13、如权利要求9所述的代码变换设备,其中,第二渲染信息包括用于音频对象信号的空间提示作为除被CODEC方案限制的空间提示之外的空间提示。14、如权利要求13所述的代码变换设备,其中,子带转换装置去除除被CODEC方案限制的空间提示之外的空间提示。15、如权利要求9所述的代码变换设备,还包括信号处理装置,通过对包括在编码的音频信号中的多个音频对象信号中的至少一个执行高抑制来输出修改的缩混信号。16、一种用于产生渲染信息以对编码的音频信号进行解码的代码变换设备,所述代码变换设备包括第一矩阵装置,基于具有编码的音频信号的位置和等级信息和输出布局信息的对象控制信号,产生包括用于将编码的音频信号映射到音频解码设备的输出声道的信息的渲染信息;第二矩阵装置,基于第一渲染信息产生用于包括多个声道的音频信号的声道恢复信息;子带转换装置,将第三渲染信息转换为符合限制第一渲染信息和第二渲染信息的CODEC方案的渲染信息;渲染装置,基于来自第一矩阵装置的产生的渲染信息、来自第二矩阵装置的产生的声道恢复信息、来自子带转换装置的转换的渲染信息和第二渲染信息,产生用于编码的音频信号的修改的渲染信息,其中,第一渲染信息包括包含在编码的音频信号中的用于包括多个声道的音频信号的空间提示,第二渲染信息包括用于包括多个对象的音频信号的空间提示,所述包括多个对象的音频信号包括与第一渲染信息相应的音频信号,第三渲染信息包括不考虑限制第一渲染信息和第二渲染信息的CODHC方案而产生的作为用于包括多个对象的音频信号的空间提示的空间提示,所述包括多个对象的音频信号包括与第二渲染信息相应的音频信号。17、如权利要求16所述的代码变换设备,其中,第三渲染设备包括用于附加附属子带的作为用于音频对象信号的空间提示的空间提示,该附加附属子带与被CODEC方案限制的子带中的至少一个子带相应。18、如权利要求17所述的代码变换设备,其中,第三渲染信息还包括与空间提示相应的附属子带的指数信息,该空间提示与用于附加附属子带中被CODEC方案限制的子带中的一个的空间提示最相似;子带转换装置基于指数信息将被CODEC方案限制的至少一个子带替换为用于与指数相应的附属子带的空间提示。19、如权利要求17所述的代码变换设备,其中,子带变换装置将用于被CODEC方案限制的至少一个子带的空间提示替换为具有在附加附属子带中最小的绝对值的空间提示。20、如权利要求16所述的代码变换设备,其中,第三渲染信息包括用于音频对象信号的空间提示作为除被CODEC方案限制的空间提示之外的空间提示。21、如权利要求21所述的代码变化设备,其中,子带转换装置去除除被CODEC方案限制的空间提示之外的空间提示。22、如权利要求16所述的代码变换设备,还包括信号处理装置,基于第三渲染信息,通过对包括在从第二多对象编码装置输出的编码的音频信号中的多个音频对象信号中的至少一个执行高抑制,输出修改的缩混信号。23、一种音频解码设备,所述音频解码设备包括解析装置,从用于包括多个声道的多对象音频信号的渲染信息,分离包括多个对象信号的音频信号的渲染信息和所述包括多个对象的音频信号的场景信息;信号处理装置,基于所述多对象信号的渲染信息,通过对用于所述包括多个声道的多对象音频信号的缩混信号中的用于包括多个声道的音频信号的音频对象信号执行高抑制,输出修改的缩混信号;混音装置,基于所述场景信息通过对修改的缩混信号进行混音来恢复音频信号。24、一种音频解码设备,所述音频解码设备包括解析装置,从用于包括多个声道的多对象信号的渲染信息中,分离如下信息多声道信号的渲染信息,该多声道信号的渲染信息包括用于包括多个声道的音频信号的空间提示;多对象信号的渲染信息,该多对象信号的渲染信息包括用于包括多个对象的音频信号的空间提示;包括多个对象的音频信号的场景信息;信号处理装置,基于所述多对象信号的渲染信息,通过对用于包括多个声道的多对象音频信号的缩混信号中的至少一个音频对象信号执行高抑制,产生修改的缩混信号和高抑制音频对象信号;声道解码装置,通过对所述修改的缩混信号进行混音来恢复多声道音频信号;混音装置,基于所述场景信息,对信号处理装置产生的修改的缩混信息和音频对象信号进行混音。25、一种音频编码设备,所述音频编码设备包括输入单元,接收多声道音频信号和多对象音频信号;编码单元,将接收的音频信号编码为缩混信号和渲染信息,其中,渲染信息包括多声道编码辅助信息和多对象编码辅助信息。26、如权利要求25所述的音频编码设备,其中,所述多声道编码辅助信息包括空间音频编码SAC空间提示信息,并且所述多对象编码辅助信息包括空间音频对象编码SAOC空间提示信息。27、如权利要求26所述的音频编码设备,还包括比特流格式化器,对所述多声道编码辅助信息和所述多对象编码辅助信息进行组合。28、如权利要求25所述的音频编码设备,其中,编码单元包括多声道编码器和多对象编码器。29、如权利要求28所述的音频编码设备,其中,多声道编码器执行SAC编码操作,并且多对象编码器包括第一多对象编码器,执行基于SAC方案的SAOC编码操作;第二多对象编码器,不考虑SAC方案而^L行SAOC编码操作。30、如权利要求29所述的音频编码设备,还包括比特流格式化器,对从多声道编码器输出的SAC辅助信息、从第一多对象编码器输出的第一SAOC辅助信息和从第二多对象编码器输出的SAOC辅助信息进行组合。31、一种音频解码方法,所述音频解码方法包括接收包括缩混信号的音频编码信号和辅助信息信号;从所述辅助信息信号提取多对象辅助信息和多声道辅助信息;基于所述多对象辅助信息将所述缩混信号转换为多声道缩混信号;使用所述多声道缩混信号和所述多声道辅助信息,对多声道音频信号进行解码;对解码的音频信号进行混音。32、如权利要求31所述的音频解码方法,其中,所述将缩混信号转换为多声道缩混信号的步骤中,附加地分离要控制的目标音频对象信号,使用剩余音频对象信号产生所述多声道缩混信号,并且所述附加地;陂分离的音频对象信号在执行预定控制操作之后被用于所述对解码的音频信号进行混音的步骤。33、如权利要求31所述的音频解码方法,其中,所述音频编码信号包括预设音频场景信息ASI,并且在执行所述对多声道音频信号进行解码之前基于预设ASI修改所述多声道辅助信息。全文摘要提供了一种对具有多声道的多对象音频信号进行编码和解码的方法和设备。所述设备包括多声道编码装置,对包括多个声道的音频信号进行缩混,产生用于所述包括多个声道的音频信号的空间提示,并产生包括产生的空间提示的第一渲染信息;多对象编码装置,对包括多个对象的音频信号进行缩混,其中,所述包括多个对象的音频信号包括来自多声道编码装置的缩混的信号,产生用于所述包括多个对象的音频信号的空间提示,产生包括产生的空间提示的第二渲染信息,其中,多声道编码装置不考虑编码器解码器(CODEC)方案而产生用于所述包括多个对象的音频信号的空间提示,该CODEC方案限制多声道编码单元。文档编号G10L19/00GK101689368SQ200880018050公开日2010年3月31日申请日期2008年3月31日优先权日2007年3月30日发明者姜京玉,张大永,徐廷一,李泰辰,洪镇佑,白承权,金镇雄申请人:韩国电子通信研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1