用以基于下混信号表示型态针对上混信号表示型态的供应来提供一个或多个经调整参数...的制作方法

文档序号:2824772阅读:213来源:国知局
专利名称:用以基于下混信号表示型态针对上混信号表示型态的供应来提供一个或多个经调整参数 ...的制作方法
技术领域
根据本发明的实施例涉及一种用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态的供应来提供一个或多个经调整参数的装置。根据本发明的另一实施例涉及一音频信号译码器。根据本发明的另一实施例涉及一音频信号转码器。根据本发明的更进一步实施例涉及一用以提供一个或多个经调整参数的方法。根据本发明的更进一步实施例涉及一种基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供多个上混音频信道作为一上混信号表示型态的方法。根据本发明的又一实施例涉及一种基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供一下混信号表示型态及一信道相关参数信息作为一上混信号表示型态的方法。根据本发明的更进一步实施例涉及一音频信号编码器、一种用以提供一编码音频信号表示型态的方法及一音频位串流。根据本发明的更进一步实施例涉及相对应的计算机程序。根据本发明的更进一步实施例涉及针对避免失真的音频信号处理的方法、装置及计算机程序。
背景技术
在已知音频处理、音频传输与音频储存技术中,愈益期望处理多通道内容以便提高听觉印象。多信道音频内容的使用为使用者带来显著的改进。举例而言,获得一 3维听觉印象,其在娱乐应用中提高使用者的满意度。然而,多信道音频内容在例如电话会议应用的专业环境中也是有用的,因为扬声器可懂度可通过使用一多信道音频播放来提高。然而,还期望在音频质量与位率要求间有一良好折衷,以避免由多通道应用导致的一过度资源加载。最近,已提出了针对包含多个音频对象的音频场景的位率有效传输及/或储存的参数技术,例如,双耳线索编码(类型I)(参见,例如参考文献[BCC])、联合源编码(参见, 例如参考文献[JSC])、及MPEG空间音频对象编码(SAOC)(参见,例如参考文献[SA0C1]、 [SA0C2])。这些技术旨在感知地重建期望的输出音频场景而非用一波形匹配。图8示出这一系统的一系统概观(这里MPEG SA0C)。在图8中示出的MPEG SAOC 系统800包括一 SAOC编码器810及一 SAOC译码器820。SAOC编码器810接收多个对象信号X1至xn,它们可被表示为例如时域信号或时间-频率-域信号(例如,为一傅立叶类型转换的一组转换系数的形式,或为QMF子频带信号的形式)。SAOC编码器810典型地也接收下混系数Cl1至dn,它们与对象信号X1至^相关联。诸组下混系数可分别用于下混信号的每一信道。SAOC编码器810典型地被配置成通过根据相关联的下混系数Cl1至dn组合对象信号X1至来获得下混信号的一信道。典型地,下混信道比对象信号X1至I少。为了在 SAOC译码器820端(至少近似)容许分离(或分开处理)对象信号,SAOC编码器810提供一个或多个下混信号(表示为下混通道)812及一辅助(side)信息814。辅助信息814说明对象信号X1至%的特性以便容许一译码器端特定对象处理。SAOC译码器820被配置成接收该一个或多个下混信号812及辅助信息814。再者,SAOC译码器820典型地被配置成接收说明一期望的渲染设置的一使用者互动信息及/ 或一使用者控制信息822。举例而言,使用者互动信息/使用者控制信息822可说明一扬声器设置及提供对象信号&至%的对象的期望空间布局。SAOC译码器820被配置成提供例如多个译码上混信道信号义至5^1。上混信道信号可例如与一多扬声器渲染安排的个别扬声器相关联。SAOC译码器820可例如包含一对象分离器820a,该对象分离器820a被配置成基于一个或多个下混信号812及辅助信息814来至少近似重建对象信号X1至%,借此获得重建对象信号820b。然而,重建对象信号820b可能略偏离原始对象信号1工至&,举例而言,因为辅助信息814由于比特流限制不太够进行完美重建。SAOC译码器820可进一步包含一混合器820c,该混合器820c可被配置成接收重建对象信号820b及使用者互动信息/使用者控制信息822并基于它们来提供上混信道信号
至知。混合器820可被配置成使用使用者互动信息/使用者控制信息822来判定个别重建对象信号820b对上混信道信号义至的贡献。使用者互动信息/使用者控制信息822 可例如包含渲染参数(也被表示为渲染系数),这些渲染参数判定个别重建对象信号822对上混信道信号义至的贡献。然而,应该注意的是,在许多实施例中,在单一步骤中执行用第8图中对象分离器 820a指示的对象分离与用第8图中混合器820c指示的混合。为实现此目的,可计算说明一个或多个下混信号812到上混信道信号义至 Μ上的一直接映像之总参数。这些参数可基于辅助信息及使用者互动信息/使用者控制信息820来计算。现在参考图9a、图9b及图9c,将说明不同的用以基于一下混信号表示型态及对象相关辅助信息来获得一上混信号表示型态之装置。图9a示出一包含一 SAOC译码器920之 MPEG SAOC系统900的一方块示意图。SAOC译码器920包含作为分离功能区块的一对象译码器922及一混合器/渲染器926。对象译码器922依赖于下混信号表示型态(例如,为在时域或时间-频率-域中表示的一个或多个下混信号的形式)及对象相关辅助信息(例如,为对象元数据的形式)提供多个重建对象信号924。混合器/渲染器拟4接收与N个对象相关联的重建对象信号拟4并基于它们提供一个或多个上混信道信号928。在SAOC译码器920中,对象信号拟4的采集与混合/渲染分开执行,这允许将对象译码功能与混合/渲染功能分离但带来一相当高的计算复杂度。现在参考图%,将简要讨论另一 MPEG SAOC系统930,该MPEG SAOC系统930包含一 SAOC译码器950。SAOC译码器950依赖于一下混信号表示型态(例如,为一个或多个下混信号的形式)及一对象相关辅助信息(例如,为对象元数据的形式)提供多个上混信道信号958。SAOC译码器950包含一组合的对象译码器与混合器/渲染器,该组合的对象译码器与混合器/渲染器被配置成在一联合混合处理中获得上混信道信号958而无需将对象译码与混合/渲染分开,其中该联合上混过程的参数是取决于对象相关辅助信息与渲染信息。联合上混过程也取决于被视为对象相关辅助信息的一部分之下混信息。综上所述,可在一个一步骤过程或一个两步骤过程中执行提供上混信道信号928、 958。现在参考图9c,将说明一 MEPG SAOC系统960。SAOC系统960包含一 SAOC至MPEG 环绕转码器而非一 SAOC译码器。SAOC至MPEG环绕转码器包含一辅助信息转码器982,该辅助信息转码器982被配置成接收对象相关辅助信息(例如,为对象元数据的形式)及可取舍地关于一个或多个下混信号的信息及渲染信息。辅助信息转码器也被配置成基于一接收数据来提供一 MPEG环绕辅助信息(例如,为一 MPEG环绕位串流的形式)。因此,辅助信息转码器982被配置成在计入渲染信息及可取舍地有关一个或多个下混信号内容的信息之情况下将自对象编码器出来的一对象相关(参数)辅助信息转换成一信道相关(参数)辅助信息。可取舍地,SAOC至MPEG环绕转码器980可被配置成操控例如下混信号表示型态所描述的一个或多个下混信号以获得一经操控的下混信号表示型态988。然而,下混信号操控器986可被省略使得SAOC至MPEG环绕转码器980之输出下混信号表示型态988与SAOC 至MPEG环绕转码器之输入下混信号表示型态相同。举例而言,如果通道相关MPEG环绕辅助信息984基于SAOC至MPEG环绕转码器980之输入下混信号表示型态可能不能提供一期望的听觉印象(这在一些渲染群集(rendering constellation)中可能如此),则可使用下混信号操控器986。因此,SAOC至MPEG环绕转码器980提供下混信号表示型态988及MPEG环绕位串流984使得多个上混信道信号可使用一接收MPEG环绕位串流984与下混信号表示型态988 的MPEG环绕译码器来产生,该多个上混信道信号根据输入至SAOC至MPEG环绕转码器980 的渲染信息来表示音频对象。综上所述,可使用译码SAOC编码音频信号的不同构想。在一些情况中,一 SAOC译码器被使用,该SAOC译码器依赖于下混信号表示型态及对象相关参数辅助信息来提供上混信道信号(例如,上混信道信号928、958)。在第9a与9b图中可见此构想的范例。可选择地,SAOC编码音频信息可被转码以获得一下混信号表示型态(例如,一下混信号表示型态988)及一信道相关辅助信息(例如,信道相关MPEG环绕位串流984,),它们可被一 MPEG 环绕译码器使用以提供期望的上混信道信号。在MPEG SAOC系统800中(此一系统概观在第8图中给出),一般处理是以一频率选择方式来完成且在每一频带内可被如下说明作为SAOC编码器处理的一部分,N个输入音频对象信号X1至%被下混。对于一单声道下混,用Cl1至dN来表示下混系数。此外,SAOC编码器810采集说明输入音频对象的特性的辅助信息814。对于MPEGSA0C,彼此间对象功率的关系是此一辅助信息的最基本形式。(数)下混信号812及辅助信息814被传输及/或储存。为此目的,下混音频信号可使用习知的感知音频编码器来压缩,诸如MPEG-I层II或III (也称为“.mp3” ) ,MPEG高阶音频编码(AAC)、或任一其它音频编码器。 在接收端,SAOC译码器820感知地尝试使用经传输的辅助信息814(当然还有一个或多个下混信号812)来恢复原始对象信号(「对象分离」)。这些近似对象信号(也表示为重建对象信号820b)接着使用一渲染矩阵被混合成一用M个音频输出信道表示(例如可用上混信道信号夕1至表示)的目标场景。对于一单声道输出,用巧至!·,指定渲染矩阵系数。
实际上,很少执行对象信号的分离,因为分离步骤(用对象分离器820a指示) 与混合步骤(用混合器820c指示)被组合成一单一转码步骤,这通常极大地降低计算复杂度。 已发现这一方案在传输位率(仅需传输几个下混通道外加一些辅助信息来代替N 个离散对象音频信号或一离散系统)与计算复杂度(处理复杂度主要有关于输出信道数目而非音频对象数目)方面都极其有效。对接收端上的使用者的进一步好处包括自由选择对他/她的选择(单声道、立体声、环绕、虚拟化耳机播放等等)的一渲染设置与使用者互动性特征渲染矩阵,及因而,输出场景可由使用者随意愿、个人偏好或其它准则来互动地设置及改变。举例而言,可以将一群组的通话器一起置于一空间区域来与其它剩余通话器最大的区别开。此互动性透过提供一译码器使用者接口来实现对于每一传输声音对象,其相对层级及(对于非单声道渲染)渲染的空间位置可被调整。这可随使用者改变相关联图形使用者接口(⑶I)滑动块的位置而实时发生(例如, 对象层级=+5dB,对象位置=-30deg)。然而,已发现的是,针对上混信号表示型态(例如,上混信道信号义至 Μ )的供应之译码器端参数选择在一些情况中带来可闻降级。鉴于此情况,本发明的目标是建立一种在提供一上混信号表示型态(例如,为上混信道信号至 Μ的形式)时容许减小或甚至避免可闻失真的构想。

发明内容
发明概要此问题由一种根据权利要求1项所述之用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态之一供应来提供一个或多个经调整的参数之装置、 一种根据权利要求M项所述之音频信号译码器、一种根据权利要求25项所述之音频信号转码器、一种根据权利要求26、27、观项所述之方法、一种根据权利要求四项所述之音频信号编码器、一种根据权利要求31项所述之方法、一种根据权利要求32项所述之音频位串流及一种根据权利要求;34项所述之计算机程序来解决。根据本发明的一实施例产生一种用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态之一供应来提供一个或多个经调整的参数之装置。该装置包含一参数调整器(例如,一渲染系数调整器),该参数调整器被配置成接收一个或多个输入参数(例如,一渲染系数或一期望渲染矩阵之一说明)并基于该一个或多个输入参数提供一个或多个经调整的参数。该参数调整器被配置成依赖于该一个或多个输入参数及该对象相关参数信息(例如,依赖于一个或多个下混系数、及/或一个或多个物件层级差值、及/ 或一个或多个对象间相关性值)来提供该一个或多个经调整参数,使得由使用非最佳参数引起的上混信号表示型态之一失真至少针对偏离最佳参数超过一预定偏差之输入参数而减小。
根据本发明的此实施例是根据此想法由不适当选择输入参数引起的音频信号失真可通过针对上混信号表示型态之供应提供经调整参数来减小,及通过计入对象相关参数信息能以良好准确度来执行经调整参数的供应。已发现的是,使用对象相关参数信息容许获得可能由使用输入参数而引起之可闻失真的一估计测度,这相应地容许提供适于将可闻失真保持在一预定范围内或较输入参数适于减小可闻失真之经调整参数。对象相关信息说明例如音频对象特性及/或给出有关编码器端对象处理的信息。因此,通过提供一个或多个经调整参数,由使用不适当参数(例如,不适当渲染系数)导致之不期望及往往恼人的音频信号失真可被减小或甚至避免,其中在参数调整时计入对象相关参数信息有助于通过考虑可闻失真的一相对可靠估计来确保有效减小及/或限制音频信号失真。在一优选实施例中,该装置被配置成接收期望渲染参数作为输入参数,这些期望渲染参数描述上混信号表示型态说明的一个或多个信道中多个音频对象信号的一期望强度缩放。在此情况中,参数调整器被配置成依赖于该一个或多个期望渲染参数提供一个或多个实际渲染参数。已发现的是,选择不适当渲染参数带来使用此类不适当选择的渲染参数而获得之一上混信号表示型态的一显著(及往往可闻)降级。再者,已发现的是,渲染参数可依赖于对象相关参数信息被有效调整,因为对象相关参数信息考虑到对由渲染参数 (可由输入参数来定义)的一指定选择而引入之失真的一估计。在一优选实施例中,参数调整器被配置成依赖于对象相关参数信息及一说明音频对象信号对下混信号表示型态的一贡献之下混信息来获得一个或多个渲染参数限制值,使得一失真度量处在渲染参数值遵从渲染参数限制值所定义的限制之一预定范围内。在此情况中,参数调整器被配置成依赖于期望渲染参数及该一个或多个渲染参数限制值来获得实际渲染参数,使得实际渲染参数遵从渲染参数限制值所定义的限制。计算渲染参数限制值组成一计算上简单且可靠的机制以根据一失真度量确保可闻失真在一可容许的范围内。在一优选实施例中,参数调整器被配置成获得该一个或多个渲染参数限制值使得在使用一遵从该一个或多个渲染参数限制值的渲染参数而渲染之多个对象信号的一渲染迭加中一对象信号的一相对贡献与一下混信号中对象信号的一相对贡献的差异不超过一预定差。已发现的是,若对象信号之一渲染迭加中一对象信号的贡献类似于一下混信号中对象信号的一贡献,则失真典型地足够小,而这些相对贡献的一强烈差异典型地带来可闻失真。这是由于此事实一对象信号(相对)层级较之下混信号表示型态中对象信号(相对)层级的一强烈改变往往带来人工因素,因为往往不可能以理想方式分离不同音频对象的对象信号。因此,已发现调整渲染参数带来良好结果,借此透过选择渲染参数,对象信号的相对贡献仅被适度改变。在另一实施例中,参数调整器被配置成获得该一个或多个渲染参数限制值使得一失真测度处在一预定范围内,该失真测度说明一由下混信号表示型态说明的下混信号与使用该一个或多个遵从该一个或多个渲染参数限制值之渲染参数而渲染的渲染信号间的相干性。已发现的是,对构成参数调整器的输入参数之期望渲染参数的选择应该使得在下混信号表示型态说明之下混信号与渲染信号间维持一足够「类似性」,因为若非如此上混过程中获得可闻失真的风险十分高。在又一优选实施例中,参数调整器被配置成计算一期望渲染参数(可构成参数调整器的输入参数)之平方与一最佳渲染参数(可例如被定义为一最小化一失真度量的渲染参数)之平方间的一线性组合以获得实际渲染参数(可被装置输出为经调整参数)。在此情况中,参数调整器被配置成依赖于一预定阈值参数T及失真度量来决定期望渲染参数与最佳渲染参数对线性组合的一贡献,其中失真度量说明一使用该一个或多个期望渲染参数而非最佳渲染参数以基于下混信号表示型态来获得上混信号表示型态而引起之失真。此构想容许将失真减小至一可接受的测度,同时仍维持期望渲染参数的一足够影响。根据此构想,计入限制可闻失真的一期望程度可找到最佳渲染参数与期望渲染参数间的一合理良好折衷。在一优选实施例中,参数调整器被配置成依赖于对感知降级的一计算测度来提供一个或多个经调整参数,使得由使用非最佳参数引起且用感知降级之计算测度表示之上混信号表示型态的一感知评估失真受限制。以此方式,可实现参数可根据听觉印象来调整,从而避免一不可接受之欠佳听觉印象,同时在依一使用者的期望来调整参数上仍提供足够的灵活性。在一优选实施例中,参数调整器被配置成接收一说明一个或多个原始对象信号的性质之对象性质信息,该一个或多个原始对象信号构成下混信号表示型态说明之一下混信号的基础。在此情况中,参数调整器被配置成考虑对象性质信息来提供经调整参数使得上混信号表示型态相对被包括于上混信号表示型态中之对象信号的性质方面的一失真至少针对偏离最佳参数超过一预定偏差之输入参数而减小。根据本发明的此实施例是根据此发现该一个或多个原始对象信号的性质可被用来评估是否输入参数合适或应该被调整,因为期望提供上混信号使得上混信号的特性有关于该一个或多个原始对象信号的特性,因为若非如此在许多情况下感知印象会明显降级。在一优选实施例中,参数调整器被配置成接收并考虑一对象信号音调信息作为一对象性质信息以便提供该一个或多个经调整参数。已发现的是,对象信号的音调是一对感知印象有明显影响的量,及应该避免选择明显改变音调印象的参数以便拥有一良好听觉印象。在一优选实施例中,参数调整器被配置成依赖于接收的对象信号音调信息及一接收的对象功率信息来估计一理想渲染上混信号的音调。在此情况中,参数调整器被配置成提供该一个或多个经调整参数,以当相比于估计音调与使用输入参数而获得之一上混信号的音调间的差时减小估计音调与使用该一个或多个经调整参数而获得之一上混信号的音调间的差,或使估计音调与使用该一个或多个经调整参数而获得之一上混信号的音调间的差保持在一预定范围内。使用此构想,能以高计算效率获得听觉印象降级的一测度,该测度允许适当调整渲染参数。在一优选实施例中,参数调整器被配置成执行输入参数的一时间与频率变化调整。因此,可仅在此类调整实际上带来听觉印象的改进或避免听觉印象的一明显降级之时间间隔或频率区域执行输入参数的调整来获得经调整参数。还在另一优选实施例中,参数调整器被配置成亦考虑提供该一个或多个经调整参数之下混信号表示型态。计入下混信号表示型态,可获得听觉印象可能的失真的一更加精确估计。在一优选实施例中,参数调整器被配置成获得一总失真测度,其为说明多个人工因素类型之失真测度的一组合。在此情况中,参数调整器被配置成获得总失真测度使得总失真测度是由使用一个或多个输入渲染参数而非最佳渲染参数以基于下混信号表示型态来获得上混信号表示型态而引起之失真的一测度。通过组合说明多个人工因素类型的多个失真测度,建立一调整听觉印象的良好控制机制。根据本发明的另一实施例产生一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供多个上混音频信道作为一上混信号表示型态之音频信号译码器。该音频信号译码器包含一上混器,该上混器被配置成基于该下混信号表示型态并依赖于对象相关参数信息及一实际渲染信息来获得上混音频信道,该实际渲染信息说明由对象相关参数信息说明之音频对象之多个对象信号至上混音频信道的一分配。该音频信号译码器亦包含一种用以提供如上讨论一个或多个经调整参数之装置。用以提供一个或多个经调整参数的装置被配置成接收期望渲染信息作为该一个或多个输入参数并提供该一个或多个经调整参数作为实际渲染信息。用以提供一个或多个经调整参数的装置亦被配置成提供该一个或多个经调整参数使得由使用偏离最佳渲染参数之实际渲染参数而引起之上混音频信道的失真至少针对偏离最佳渲染参数超过一预定偏差之期望渲染参数被减小。在一音频信号译码器中使用用以提供该一个或多个经调整参数之装置容许避免产生由用不当选择期望渲染信息执行音频译码而引起之强烈可闻失真。根据本发明的一实施例产生一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息提供一信道相关参数信息作为一上混信号表示型态之音频信号转码器。该音频信号转码器包含一辅助信息转码器,该辅助信息转码器被配置成基于下混信号表示型态并依赖于对象相关参数信息及一实际渲染信息来获得信道相关参数信息,该实际渲染信息说明由对象相关参数信息说明之音频对象之多个对象信号至上混音频信道的一分配。该音频信号译码器亦包含一种用以提供如上讨论一个或多个经调整参数之装置。 用以提供一个或多个经调整参数的装置被配置成接收期望渲染信息作为该一个或多个输入参数并提供该一个或多个经调整参数作为实际渲染信息。再者,用以提供该一个或多个经调整参数的装置被配置成提供该一个或多个经调整参数使得由使用偏离最佳渲染参数之实际渲染参数引起、由信道相关参数信息(结合下混信号信息)表示之上混音频信道的失真至少针对偏离最佳渲染参数超过一预定偏差之期望渲染参数减小。已发现的是,提供经调整参数的构想也十分适于结合一音频信号转码器使用。根据本发明的进一步实施例产生一种用以提供一个或多个经调整参数的方法,一种译码一音频信号之方法及一种转码一音频信号之方法。这些方法是以与如上所讨论装置相同的关键想法为基础。根据本发明的另一实施例产生一种用以基于多个对象信号来提供一下混信号表示型态及一对象相关参数信息之音频信号编码器。该音频编码器包含一下混器,该下混器被配置成依赖于与对象信号相关联的下混系数来提供一个或多个下混信号,使得该一个或多个下混信号包含多个对象信号的一迭加。该音频编码器也包含一辅助信息提供器,该辅助信息提供器被配置成提供一说明对象信号的层级差与相关性特性之对象间关系辅助信息与一说明个别对象信号的一个或多个个别性质之个别对象辅助信息。已发现的是,一音频信号编码器提供一对象间关系辅助信息与一个别对象辅助信息容许有效减小或甚至避免一多信道音频信号译码器端的可闻失真。对象间关系辅助信息被用于在译码器端分离对象信号,个别对象辅助信息可被用于决定是否对象信号的个别特性在译码器端被维持,这指示失真在可接受容许度内。在一优选实施例中,辅助信息提供器被配置成提供个别对象辅助信息使得个别对象辅助信息说明个别对象的音调。已发现的是,个别对象的音调是一心里声学上重要的量, 其容许失真的一译码器端限制。根据本发明的一实施例产生一种用以编码一音频信号之方法。根据本发明的另一实施例产生一种以一编码形式表示多个(音频)对象信号之音频位串流。该音频位串流包含一表示一个或多个下混信号之下混信号表示型态,其中至少一下混信号包含多个(音频)对象信号的一迭加。该音频位串流也包含一说明对象信号的层级差与相关性特性之对象间关系辅助信息与一说明个别对象信号的一个或多个个别性质之个别对象辅助信息。如上所述,这一音频位串流使多信道音频信号的一重建成为可能, 其中可识别并减小或甚至消除由不当设置渲染参数引起的可闻失真。根据本发明之进一步的实施例产生一种用以实施上面所讨论方法的计算机程序。


参考附图随后将说明根据本发明的实施例,其中图1示出一用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态之供应来提供一个或多个经调整参数之装置的一方块示意图;图2根据本发明一实施例示出了一 MPEG SAOC系统的一方块示意图;图3根据本发明另一实施例示出了一 MPEG SAOC系统的一方块示意图;图4示出了对象信号对一下混信号及对一混合信号的一贡献的一示意表示型态;图fe根据本发明一实施例示出了一基于单声道下混的SAOC至MPEG环绕转码器的一方块示意图;图5b根据本发明一实施例示出了一基于立体声下混的SAOC至MPEG环绕转码器的一方块示意图;图6根据本发明一实施例示出了一音频信号编码器的一方块示意图;图7根据本发明一实施例示出了一音频位串流的一示意表示型态;图8示出了一参考MPEG SAOC系统的一方块示意图;图9a示出了一使用一分离的译码器及混合器的参考SAOC系统的一方块示意图;图9b示出了一使用一整合的译码器及混合器之参考SAOC系统的一方块示意图; 以及图9c示出了一使用一 SAOC至MPEG转码器的参考SAOC系统的一方块示意图。
具体实施例方式1.根据图1用以提供一个或多个经调整参数的装置下面将参考图1说明一用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态的供应来提供一个或多个经调整参数的装置100。图1示出了这一装置100的一方块示意图,该装置100被配置成接收一个或多个输入参数110。输入参数 110可例如是期望渲染参数。装置100也被配置成基于输入参数110提供一个或多个经调整参数120。经调整参数可例如是经调整渲染参数。装置100进一步被配置成接收一对象相关参数信息130。该对象相关参数信息130可例如是描述多个对象的一对象层级差信息及/或一对象间相关信息。装置100包含一参数调整器140,该参数调整器140被配置成接收该一个或多个输入参数110并基于该一个或多个输入参数110来提供该一个或多个经调整参数120。参数调整器140被配置成依赖于该一个或多个输入参数110及对象相关参数信息130来提供该一个或多个经调整参数120,使得至少针对偏离最佳参数超过一预定偏差的输入参数110,减小在一用以基于一下混信号表示型态及对象相关参数信息130提供一上混信号表示型态的装置中由使用非最佳参数(例如,该一个或多个输入参数110)而引起的一上混信号表示型态的失真。因此,装置100接收该一个或多个输入参数110并基于它们提供该一个或多个经调整参数120。在提供该一个或多个经调整参数120时,若该一个或多个输入参数110被用以基于一下混信号表示型态及对象相关参数信息130来控制一上混信号表示型态的一供应,则装置100明确地或隐性地判定是否不改变使用该一个或多个输入参数110将导致无法接受的高失真。因此,经调整参数120典型地比该一个或多个输入参数110较适于调整这一提供上混信号表示型态的装置,至少在该一个或多个输入参数110以一不利方式被选择时。因此,装置100典型地改善一上混信号表示型态的感知印象,该上混信号表示型态由一上混信号表示型态提供器依赖于该一个或多个经调整参数120来提供。使用对象相关参数信息来调整该一个或多个输入参数以获得该一个或多个经调整参数已被发现带来良好结果,因为若该一个或多个经调整参数120对应于对象相关参数信息130则上混信号表示型态的质量通常良好,而违反与对象相关参数信息130的期望关系的参数典型地造成可闻失真。对象相关参数信息可例如包含下混参数,这些下混参数说明对象信号(来自多个音频对象)对该一个或多个下混信号的一贡献。对象相关参数信息也能可选择地或额外地包含说明对象信号的特性的对象层级差及/或对象间相关参数。已发现的是,说明对象信号的一编码器端处理的参数与说明音频对象自身特性的参数都可被视作有用信息供参数调整器120使用。然而,其它对象相关参数信息130可被装置100可选择或额外地使用。然而,应该注意的是,参数调整器140可使用额外信息以便提供基于该一个或多个输入参数110来提供该一个或多个经调整参数120。举例而言,参数调整器140能可取舍地评估下混系数、一个或多个下混信号或任一额外信息以甚至改进该一个或多个经调整参数120的供应。2.根据图2的系统下面将详细说明图2的MPEG SAOC系统200。为了提供对MPEG SAOC系统200的一良好理解,将给出对期望系统规格及设计考虑的一概述。随后,将给出系统的一结构概述。此外,将讨论多个SAOC失真度量,及将说明针对一失真限制的这些SAOC失真的应用。此外,将讨论系统200的进一步延伸。2. 1系统设计考虑如上讨论,针对包含多个音频对象的音频场景的位率有效传输/储存的参数技术典型地在传输位率与计算复杂度方面是有效的。对此系统使用者在接收端上的进一步好处包括自由选择对他/她的选择(单声道、立体声、环绕、虚拟化耳机播放、等等)的一渲染设置与使用者互动性特征渲染矩阵,及因而,输出场景可随意愿、个人偏好或其它准则来互动地设置及改变。举例而言,可以将一群组的通话器一起置于一空间区域来与其它剩余通话器最大的区别开。此互动性透过提供一译码器使用者接口来实现对于每一传输声音对象,其相对层级及(对于非单声道渲染)渲染的空间位置可被调整。这可随使用者改变相关联图形使用者接口(⑶I)滑动块的位置而实时发生(例如, 对象层级=+5dB,对象位置=-30deg)。然而,已发现的是,由于使用下混分离/混合式参数方法,渲染音频输出的主观质量取决于渲染参数设置。已发现的是,相对对象层级上的改变对最后音频质量的影响多于空间渲染位置上的改变(「再平移」)。也已发现的是,相对参数的极端设置(例如,+20dB)甚至可导致无法接受的输出质量。虽然这只是违反一些构成此方案基础的感知假定的结果,但对于商业产品而言仍无法接受依使用者接口上的设置而产生不良的声音及人工因素。因此,根据本发明的实施例类似例如系统200处理此避免无法接受降级问题,而不管使用者接口的设置(该使用者接口设置可被视作「输入参数」)。下面将讨论有关避免SAOC失真方法的一些细节。本文所呈现的SAOC失真限制的方法是以下列构想为基础突出的SAOC失真因不当选择渲染系数(可被视作输入参数)而出现。此选择通常由使用者以一互动方式来作出(例如,经由交互式应用程序的一实时图形使用者接口 (GUI))。因此,引入一额外的处理步骤,该步骤修改使用者提供的渲染系数(例如,根据某些计算限制它们)并将这些经修改系数用于SAOC渲染引擎。举例而言,使用者提供的渲染系数可被视作输入参数,及SAOC渲染引擎的经修改系数可被视作经修改参数。为控制产生的SAOC音频输出的过度降级,期望开发感知降级的一计算测度(也被指定为失真测度DM)。已发现的是,此失真测度应该满足某准则该失真测度应易于从SAOC译码引擎的内部参数中计算出。举例而言,期望无需额外滤波器组计算来获得失真测度。该失真测度值应该与主观感知声音质量(感知降级)相关,也即符合心里声学的基本原理。为此目的,可优选地以一频率选择方式来完成失真测度的计算,因为其通常自感知音频编码及处理知晓。已发现的是,众多SAOC失真测度可被定义及计算。然而,已发现的是,SAOC失真测度应该优选地考虑某些基本因素以便对一渲染SAOC质量做出一正确评估及因而往往(但不一定)具有某些共性它们考虑下混系数。这些下混系数判定该一个或多个下混信号中每一音频对象的相对混合部分。作为一背景信息,应该指出的是,已发现出现的SAOC失真取决于下混系数与渲染系数间的关系如果渲染系数定义的相对对象贡献实质上不同于下混中的相对对象贡献,则SAOC译码引擎(使用经调整参数)必须对下混信号执行相当大的调整来将其转换为渲染输出。已发现这导致SAOC失真。它们考虑渲染系数。这些渲染系数判定每一音频对象对该一个或多个渲染输出信号中的每一者的相对输出强度。作为一背景信息,应该指出的是,已发现出现SAOC失真也取决于彼此间对象功率的关系。如果在某一时间点的一对象具有比其它对象高得多的功率 (及如果此对象的下混系数不是很小的话),则此对象支配下混并被很好地在渲染输出信号中重现。相比之下,弱对象在下混时仅被很弱地表示及因而在没有显著失真的情况下无法被提至高输出层级。它们考虑每一对象相对于另一对象的(相对)对象功率/层级。此信息被描述为例如一 SAOC对象层级差(OLD)。作为一背景信息,应该指出的是,已发现出现SAOC失真进一步取决于个别对象信号的性质。例如,将渲染输出中具有音调性质的一对象提升到较大层级(而其它对象可能更多为具有类似噪声性质的)将导致相当大的感知失真。除此之外,可考虑其它有关原始对象信号性质的信息。这些信息接着可被SAOC编码器作为SAOC辅助信息的一部分来传输。举例而言,有关每一对象项的音调或噪度的信息可作为SAOC辅助信息的一部分被传输且被用于达到限制失真的目的。2. 2系统概述根据上述考虑,现在将给出对MPEG SAOC系统200的一概述以很好地理解本发明。 应该指出的是,根据图2的SAOC系统200是根据图8的MPEG SAOC系统800的一延伸形态,因此上述讨论也适用。再者,应该指出的是,MPEG SAOC系统200可根据图9a、图9b及图9c中示出的实施备选900、930、960来修改,其中对象编码器对应于SAOC编码器,其中使用者互动信息/使用者控制信息822对应于渲染控制信息/渲染系数。此外,MPEG SAOC系统100的SAOC译码器可用分离式对象译码器与混合器/渲染器安排920来替换、用整合式对象译码器与混合器/渲染器安排930或SAOC至MPEG环绕转码器980来替换。现在参考图2,可见的是,MPEG SAOC系统200包含一 SAOC编码器210,该SAOC编码器210被配置成接收与自1至N编号的多个对象相关联之多个对象信号\至&。该SAOC 编码器210也被配置成接收(或者获得)下混系数Cl1至dN。举例而言,SAOC编码器210可针对其提供的下混信号212的每一信道获得一组下混系数Cl1至dN。SAOC编码器210可例如被配置成获得对象信号X1至&的一加权组合以获得一下混信号,其中各该对象信号X1至 %用与其相关联的下混系数Cl1至dN来加权。SAOC编码器210还被配置成获得说明不同对象信号间的一关系的对象间关系信息。举例而言,对象间关系信息可包含例如为OLD参数形式的对象层级差信息与例如为IOC参数形式的对象间相关信息。因此,SAOC编码器200 接着被配置成提供一个或多个下混信号212,该一个或多个下混信号212中的每一个包含一个或多个对象信号的一加权组合,该一个或多个对象信号根据一组与各自下混信号(或多信道下混信号212的一信道)相关联的下混参数来加权。SAOC编码器210还被配置成提供辅助信息214,其中辅助信息214包含对象间关系信息(例如,为对象层级差参数与对象间相关参数的形式)。辅助信息214还包含一下混参数信息,例如,为下混增益参数与下混通道层级差参数的形式。辅助信息214可进一步包含一可表示个别对象性质的可取舍对象性质辅助信息。下面将讨论有关可取舍对象性质辅助信息的细节。MPEG SAOC系统200也包含一 SAOC译码器220,该SAOC译码器220可包含SAOC 译码器820的功能。因此,SAOC译码器220接收一个或多个下混信号212及辅助信息214 以及经修改(或「经调整」,或「实际的」)渲染系数222并基于它们提供一个或多个上混信道信号P產、。MPEG SAOC系统200也包含一用以依赖于一个或多个输入参数,即说明一渲染控制信息或渲染系数242的输入参数来提供一个或多个经修改(或「经调整」,或「实际的」) 参数,即经修改渲染系数222的装置M0。装置240被配置成还接收至少辅助信息214的一部分。举例而言,装置240被配置成接收说明对象功率(例如,对象信号X1至%的功率) 的参数2Ha。举例而言,参数21 可包含对象层级差参数(也表示为OLD)。装置240也优选地接收说明下混系数的辅助信息214的参数214b。举例而言,参数214b说明下混系数 Cl1至dN。可取舍地,装置240可进一步接收组成一个别对象性质辅助信息的额外参数2Hc。
装置240大体上被配置成基于输入渲染系数242 (可例如自一使用者接口接收,或可例如依赖于使用者输入来计算或作为预设信息被提供)来提供经修改渲染系数222,使得由SAOC译码器220使用非最佳渲染参数而引起的上混信号表示型态的一失真被减小。换言之,经修改渲染系数222是输入渲染系数M2的一修改版本,其中依赖于参数214a、214b 来作出改变使得上混信道信号^ (形成上混信号表示型态)中所有可闻失真被减小或被限制。用以提供该一个或多个经调整参数242的装置240可例如包含一渲染系数调整器 250,该渲染系数调整器250接收输入渲染系数242并基于它们提供经修改渲染系数222。 为此目的,渲染系数调整器250可接收一说明由使用输入渲染系数242而引起的失真的失真测度252。失真测度252可例如由失真计算器260依赖于参数214a、214b及输入渲染系数242来提供。然而,渲染系数调整器250与失真计算器沈0的功能也可被整合于一单一功能单元中,使得在没有显式计算一失真测度252的情况下提供经修改的渲染系数222。当然,可应用减小或限制失真测度的隐式机制。关于MPEG SAOC系统200的功能,应该指出的是,以上混信道信号至^n形式输出的上混信号表示型态以良好感知质量被产生,因为通过修改或调整渲染系数避免了可闻失真,这些可闻失真系由参考系统800中不当选择使用者互动信息/使用者控制信息822而引起。修改或调整由装置240执行使得感知印象的严重降级被避免,或使得较之输入渲染系数242被SAOC译码器220直接使用(没有修改或调整)的一情况时感知印象的降级至少被减小。下面将简要概述本发明构想的功能。在指定一失真测度(DM)的情况下,可通过计算指定信号的失真测度值并修改SAOC译码算法(限制实际使用的渲染系数21 使得失真测度值不超过某一阈值值来避免音频输出中的过度失真。根据此构想的一系统200在图2 中被示出并在上面已被较详细地阐述。关于系统200,可做下列论述期望渲染系数M2由使用者或另一接口输入。在被应用于SAOC译码引擎220之前,渲染系数242被一渲染系数调整器250修改, 该渲染系数调整器250使用一失真计算器260提供的一个或多个经计算失真测度252。失真计算器260评估出自辅助信息214(例如,相关对象功率/OLD、下混系数及可取舍地对象信号性质信息)的信息(例如,参数2Ha、214b)。此外,它是基于期望渲染系数输入242。在一优选实施例中,装置240被配置成根据一失真测度来修改渲染系数。优选地, 使用例如频率选择权重以一频率选择方式调整渲染系数。渲染系数的修改可以此帧(例如,一目前帧)为基础、或渲染系数不仅可在逐帧基础上随时间被调整,而且还随时间被处理/控制(例如,随时间被平滑化),其中如针对一动态范围压缩器/限制器可能可应用不同的起音/衰减时间常数。在一些实施例中,失真测度可以是频率选择的。在一些实施例中,失真测度可考虑下列一个或多个特性每一物件的功率/能量/层级下混系数渲染系数;及/或额外对象性质辅助信息,如果适用的话在一些实施例中,失真测度可以每对象为基础来计算并组合达成一总失真。在一些实施例中,一额外对象性质辅助信息2Hc能可取舍地被评估。额外对象性质辅助信息2Hc可在一增强型SAOC编码器中读取,例如,SAOC编码器210。额外对象性质辅助信息可被例如植入一增强型SAOC位串流中,该增强型SAOC位串流将参考图7被说明。 再者,额外对象性质辅助信息可被一增强型SAOC译码器用于失真限制。在一特殊情况中,噪度/音调可被用作额外对象性质辅助信息所说明的对象性质。在此情况中,噪度/音调比之其它对象参数(例如,OLD)能以粗略得多的频率分辨率来传输以保存于辅助信息上。在一极端情况中,噪度/音调对象性质辅助信息能以每对象仅一信息来传输(例如,如宽带特性)。2. 3SA0C 失真度量下面将说明多个不同失真测度,该多个不同失真测度可例如使用失真计算器沈0 而获得。在下面2. 4节将讨论应用这些失真测度来限制渲染系数的细节。换言之,此节概述数个失真测度。这些失真测度可个别使用或例如通过将个别失真度量值加权相加而可被组合形成一复合、更复杂失真度量。应该注意的是,这里词语「失真测度」与「失真度量」表示类似的量且在大部分情况中不需要区分。下面将说明多个失真度量,该多个失真度量可被失真计算器260评估且可被渲染系数调整器250使用,以便基于输入渲染系数242获得经修改渲染系数222。2. 3.1 失真测度 #1下面将说明一第一失真测度(也表示为失真测度#1)。为了构想简单易懂,将考虑一 N-1-1SA0C系统(例如,一单声道下混信号(212)及一单一上混信道(信号))。N个输入音频对象被下混成一单声道信号并被渲染成一单声道输出。如图8中指定,用Cl1.. dN表示下混系数及用IV. 1^表示渲染系数。在下面公式中,为了简单明了,已省略了时间指数。同样地,已去掉了频率指数,要注意的是,方程式有关于子频带信号。在下面的一些方程式中,小写字母表示系数或信号,及大写字母表示可从方程式的脉络中看出的相对应的功率。此外,应该注意的是,信号有时用相对应时间-频率-域而非时域系数表示。假定,对象#m (听觉对象指数m)是受关注的一对象,例如最主要对象,其相对层级被增加且因而限制总声音质量。那么理想的期望输出信号(上混信道信号)由
权利要求
1.一种用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态("^至·^^)的一供应来提供一个或多个经调整参数(rm’,rlim,m)的装置,所述装置包含一参数调整器,其被配置成接收一个或多个输入参数并基于所述一个或多个输入参数提供一个或多个经调整参数,其中,所述参数调整器被配置成依赖于所述一个或多个输入参数及所述对象相关参数信息来提供所述一个或多个经调整参数,使得由使用非最佳参数而引起的所述上混信号表示型态的一失真至少针对偏离最佳参数超过一预定偏差的输入参数被减小。
2.根据权利要求1所述的装置,其中,所述装置被配置成接收期望渲染参数来作为所述输入参数(A),所述期望渲染参数说明所述上混信号表示型态(^至夕^^)所说明的一个或多个音频信道中多个音频对象信号(X1至&)的一期望强度缩放;以及其中,所述参数调整器被配置成依赖于所述一个或多个期望渲染参数(A)来提供一个或多个实际渲染参数(rm’,rlim,m)。
3.根据权利要求2所述的装置,其中,所述参数调整器被配置成依赖于所述对象相关参数信息及一说明所述音频对象信号0^至&)对所述下混信号表示型态的一贡献的下混信息(Cli)来获得一个或多个渲染参数限制值( ),使得一失真度量(cKOii)、dm2(m)、 dm5(m)、dm6(m)、DM1, DM2, DM3, DM4, DM5, DM6)在渲染参数值遵从所述渲染参数限制值所定义的限制的一预定范围内,以及其中,所述参数调整器被配置成依赖于所述期望渲染参数(A)及所述一个或多个渲染参数限制值来获得所述实际渲染参数(rm’,rlim,m),使得所述实际渲染参数遵从所述渲染参数限制值所定义的所述限制。
4.根据权利要求2至3中任一项所述的装置,其中,所述参数调整器被配置成获得所述一个或多个渲染参数限制值(r2m ),使得使用一个或多个遵从所述一个或多个渲染参数限制值的渲染参数(rm’,rlim,m)而渲染的多个对象信号的一渲染迭加中的一对象信号(\至%) 的一相对贡献与一下混信号中所述对象信号的一相对贡献的差异不超过一预定差。
5.根据权利要求4所述的装置,其中,所述参数调整器被配置成决定所述一个或多个渲染参数值rm,使得对于一对象指数m指定的一个或多个音频对象满足方程式
6.根据权利要求2或3所述的装置,其中,所述参数调整器被配置成获得所述一个或多个渲染参数限制值(€),使得一失真测度(DM3)在一预定范围内,所述失真测度(DM3)说明由所述下混信号表示型态所说明的一下混信号与使用一个或多个遵从所述一个或多个渲染参数限制值丨的渲染参数OJ而渲染的一渲染信号间的相干性。
7.根据权利要求6所述的装置,其中,所述参数调整器被配置成获得所述一个或多个渲染参数限制值为C,使得所述失真测度
8.根据权利要求2所述的装置,其中,所述参数调整器被配置成计算一期望渲染参数 (rffl)的平方与一最佳渲染参数(ropt’ J的平方间的一线性组合,以获得所述实际渲染参数(riim,m),其中,所述参数调整器被配置成依赖于一预定阈值参数τ及一失真度量((Η、(1πι2、(1ΠΙ3、 dm4、dm5、dm6)来判定所述期望渲染参数(rm)与所述最佳渲染参数(r。pt,m)对所述线性组合的一贡献,其中,所述失真度量说明一由使用所述一个或多个期望渲染参数(rm)而非所述最佳渲染参数(r。pt,m)以基于所述下混信号表示型态来获得所述上混信号表示型态而引起的失真。
9.根据权利要求8所述的装置,其中,所述参数调整器被配置成评估所述方程式
10.根据权利要求8或9所述的装置,其中,所述参数调整器被配置成获得所述失真度量,使得所述失真度量取决于根据所述期望渲染参数而渲染的多个对象信号的一渲染迭加中一指定对象信号的一相对贡献与一包含所述指定对象信号的下混信号中所述指定对象信号的一相对贡献间的一关系。
11.根据权利要求8、9或10所述的装置,其中,所述参数调整器被配置成获得所述失真度量(Clm1),使得所述失真度量取决于根据所述期望渲染参数(rm)而渲染的多个对象信号的一渲染迭加中一指定对象信号(^至^)的一相对贡献与一包含所述指定对象信号(X1 至%)的下混信号中所述指定对象信号0^至&)的一相对贡献间的比。
12.根据权利要求8至11中任一项所述的装置,其中,所述参数调整器被配置成根据以下来计算所述失真度量dmx (m)
13.根据权利要求8、9或10所述的装置,其中,所述参数调整器被配置成获得所述失真度量(dm2),使得所述失真度量取决于根据所述期望渲染参数(rm)而渲染的多个对象信号的一渲染迭加中一指定对象信号(^至^)的一相对贡献与一包含所述指定对象信号(X1 至%)的下混信号中所述指定对象信号(\至&)的一相对贡献间的差。
14.根据权利要求8至13中任一项所述的装置,其中,所述参数调整器被配置成计算所述失真度量(dm2),使得所述失真度量取决于一遮蔽对信号比(msr),以致于若所述遮蔽对信号比增加,则所述失真度量(dm2)减小,表明一失真较小。
15.根据权利要求8至10中任一项或第11项或第12项所述的装置,其中所述参数调整器被配置成计算所述失真度量,根据
16.根据权利要求1至15中任一项所述的装置,其中,所述参数调整器被配置成依赖于感知降级的一计算测度来提供所述一个或多个经调整参数,使得由使用非最佳参数而引起且用感知降级的所述计算测度表示的所述上混信号表示型态的一感知评估失真被限制。
17.根据权利要求1至16中任一项所述的装置,其中,所述参数调整器被配置成接收一个别对象性质信息,所述个别对象性质信息说明一个或多个构成所述下混信号表示型态说明的一下混信号的基础的原始对象信号的所述个别性质;以及其中,所述参数调整器被配置成考虑所述个别对象性质信息,并提供所述经调整参数使得相对于一理想渲染上混信号表示型态,所述上混信号表示型态的一失真至少针对偏离最佳参数超过一预定偏差的输入参数被减小。
18.根据权利要求17所述的装置,其中,所述参数调整器被配置成接收并考虑一对象信号音调信息作为一个别对象性质信息,以便提供所述一个或多个经调整参数。
19.根据权利要求18所述的装置,其中,所述参数调整器被配置成依赖于所述接收对象信号音调信息与所述接收对象功率信息(0LP,P)来估计一理想渲染上混信号的一音调 (N);以及其中,所述参数调整器被配置成提供所述一个或多个经调整参数,以在比较于所述估计音调与使用所述一个或多个输入参数而获得的一上混信号的一音调间的差时减小所述估计音调与使用所述一个或多个经调整参数而获得的一上混信号的所述音调间的差,或使所述估计音调与使用所述一个或多个经调整参数而获得的一上混信号的一音调间的差保持在一预定范围内。
20.根据权利要求1至19中任一项所述的装置,其中,所述参数调整器被配置成执行所述输入参数的一时间及频率变化调整。
21.根据权利要求1至20中任一项所述的装置,其中,所述参数调整器被配置成在提供所述一个或多个经调整参数方面也考虑所述下混信号表示型态。
22.根据权利要求1至21中任一项所述的装置,其中,所述参数调整器被配置成获得一总失真测度,所述总失真测度是说明多个人工因素类型的失真测度的一加权组合;其中,所述参数调整器被配置成获得所述总失真测度,使得所述总失真测度是由使用一个或多个所述输入渲染参数而非最佳渲染参数来基于所述下混信号表示型态来获得所述上混信号表示型态而引起的失真的一测度。
23.根据权利要求22所述的装置,其中,所述参数调整器被配置成组合下列所述失真测度当中的至少两失真测度,以便获得所述总失真测度 一说明一音频对象的音色的一寄生改变的测度; 一说明与一音频对象相关联的一对象信号的一寄生调变的测度; 一说明一寄生乐音的存在的测度; 一说明一寄生调变噪声的存在的测度。
24.一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供多个上混音频信道作为一上混信号表示型态的音频信号译码器,所述音频信号译码器包括一上混器,其被配置成基于所述下混信号表示型态并依赖于所述对象相关参数信息及一实际渲染信息来获得所述上混音频信道(^ 1至·^^ ),所述实际渲染信息说明由所述对象相关参数信息说明的音频对象的多个对象信号至所述上混音频信道的一分配;以及一根据权利要求1至23所述的用以提供一个或多个经调整参数的装置,其中,所述用以提供一个或多个经调整参数的装置被配置成接收所述期望渲染信息作为所述一个或多个输入参数,并将所述一个或多个经调整参数提供为实际渲染信息;以及其中,所述用以提供所述一个或多个经调整参数的装置被配置成提供所述一个或多个经调整参数,使得由使用偏离最佳渲染参数(r。pt,m)的所述实际渲染参数(rm’,rliffl,ffl)而引起的所述上混音频信道(^丨至^^)的失真至少针对偏离所述最佳渲染参数(r。pt,m)超过一预定偏差的期望渲染参数(^)被减小。
25.一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供一信道相关参数信息作为一上混信号表示型态的音频信号转码器,所述音频信号转码器包括一辅助信息转码器,其被配置成基于所述下混信号表示型态并依赖于所述对象相关参数信息及一实际渲染信息来获得所述信道相关参数信息,所述实际渲染信息说明由所述对象相关参数信息说明的音频对象的多个对象信号至所述信道相关参数信息说明的上混音频信道的一分配;以及一根据权利要求1至23中任一项所述的用以提供一个或多个经调整参数的装置,其中所述用以提供一个或多个经调整参数的装置被配置成接收所述期望渲染信息作为所述一个或多个输入参数,并提供所述一个或多个经调整参数作为所述实际渲染信息;以及其中,所述用以提供所述一个或多个经调整参数的装置被配置成提供所述一个或多个经调整参数,使得由使用偏离最佳渲染参数的实际渲染参数而引起的所述上混音频信道的失真至少针对偏离所述最佳渲染参数超过一预定偏差的期望渲染参数被减小。
26.一种用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态一供应来提供一个或多个经调整参数的方法,所述方法包含接收一个或多个输入参数并基于所述一个或多个输入参数来提供一个或多个经调整参数,其中,所述一个或多个经调整参数是依赖于所述一个或多个输入参数及所述对象相关参数信息而被提供,使得由使用非最佳参数而引起的所述上混信号表示型态的一失真至少针对偏离最佳参数超过一预定偏差的输入参数被减小。
27.一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供多个上混音频信道作为一上混信号表示型态的方法,所述方法包括根据权利要求26所述,提供一个或多个经调整参数,其中,所述期望渲染信息被接收为所述一个或多个输入参数及其中所述一个或多个经调整参数被提供为一实际渲染信息, 及其中所述一个或多个经调整参数被提供,使得由使用偏离最佳渲染参数的所述实际渲染参数而引起的所述上混音频信道的失真至少针对偏离所述最佳渲染参数超过一预定偏差的期望渲染参数被减小;以及基于所述下混信号表示型态并依赖于所述对象相关参数信息及所述实际渲染信息来获得所述上混音频信道,所述实际渲染信息说明由所述对象相关参数信息说明的音频对象的多个对象信号至所述上混音频信道的一分配。
28.一种用以基于一下混信号表示型态、一对象相关参数信息及一期望渲染信息来提供一信道相关参数信息作为一上混信号表示型态的方法,所述方法包括根据权利要求26所述,提供一个或多个经调整参数,其中,所述期望渲染信息被接收为所述一个或多个输入参数,及其中所述一个或多个经调整参数被提供为一实际渲染信息,及其中所述一个或多个经调整参数被提供,使得由使用偏离最佳渲染参数的所述实际渲染参数而引起的所述上混音频信道的失真至少针对偏离所述最佳渲染参数超过一预定偏差的期望渲染参数被减小;以及基于所述下混信号表示型态并依赖于所述对象相关参数信息及所述实际渲染信息来获得说明所述上混音频信道的所述信道相关参数信息,所述实际渲染信息说明由所述对象相关参数信息说明的音频对象的多个对象信号至上混音频信道的一分配,所述上混音频信道由所述信道相关参数信息说明。
29.一种用以基于多个对象信号U1至%)来提供一下混信号表示型态及一对象相关参数信息的音频信号编码器,所述音频编码器包括一下混器,其被配置成依赖于与所述对象信号(\至&)相关联的下混系数W1至屯) 来提供一个或多个下混信号,使得所述一个或多个下混信号包括多个对象信号的一迭加;一辅助信息提供器,其被配置成提供一说明对象信号(X1至&)的层级差与相关性特性的对象间关系辅助信息(OLD、I0C)与一说明所述个别对象信号U1至%)的一个或多个个别性质的个别对象辅助信息。
30.根据权利要求四所述的装置,其中,所述辅助信息提供器被配置成提供所述个别对象辅助信息,使得所述个别对象辅助信息说明所述个别对象信号U1至&)的音调。
31.一种用以基于多个对象信号来提供一下混信号表示型态及一对象相关参数信息的方法,所述方法包括依赖于与所述对象信号相关联的下混系数来提供一个或多个下混信号,使得所述一个或多个下混信号包含多个对象信号的一迭加;以及提供一说明对象信号的层级差及相关性特性的对象间关系辅助信息;以及提供一说明所述个别对象信号的一个或多个个别性质的个别对象辅助信息。
32.—种以一编码形式来表示多个对象信号U1至%)的音频位串流,所述音频位串流包括一下混信号表示型态,其表示一个或多个下混信号,其中,所述下混信号当中的至少一下混信号包含多个对象信号的一迭加;以及一对象间关系辅助信息,其说明对象信号的层级差与相关性特性;以及一个别对象辅助信息,其说明所述个别对象信号的一个或多个个别性质。
33.根据权利要求32所述的音频位串流,其中,所述个别对象辅助信息说明所述个别对象信号的音调。
34.一种用以执行根据权禾腰求洸、27、冽或31所述的方法当中的一个方法的计算机程序。
全文摘要
一种用以基于一下混信号表示型态及一对象相关参数信息针对一上混信号表示型态的一供应来提供一个或多个经调整参数的装置包括一参数调整器。该参数调整器被配置成接收一个或多个输入参数并基于该一个或多个输入参数提供一个或多个经调整参数。该参数调整器被配置成依赖于该一个或多个输入参数及该对象相关参数信息来提供该一个或多个经调整参数,使得由使用非最佳参数而引起的该上混信号表示型态的一失真至少针对偏离最佳参数超过一预定偏差的输入参数被减小。
文档编号G10L19/00GK102576532SQ201080019185
公开日2012年7月11日 申请日期2010年4月28日 优先权日2009年4月28日
发明者于尔根·赫莱, 列昂尼德·特伦蒂夫, 安德烈亚斯·赫尔策, 托尔斯藤·卡斯特纳, 法尔科·里德鲁施, 海科·普尔纳根, 科尔内利娅·法尔克, 约纳斯·恩格德加德 申请人:埃尔朗根-纽伦堡弗里德希-亚历山大大学, 弗兰霍菲尔运输应用研究公司, 杜比Ab国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1