双耳音频处理的制作方法_2

文档序号：9204584阅读：来源：国知局

的表示和/或处理，而可以针对反射音频传播路径优化混响路径的表示和/或处理。
[0029]方法还可以通过允许从编码器侧控制不同部分的渲染的同步而提供经改进的音频质量。这允许紧密地控制早期部分与混响部分之间的相对定时以提供对应于原始头部相关双耳传递函数的总体效果。实际上，其允许根据关于整个头部相关双耳传递函数信息的信息来控制不同部分的同步。具体而言，反射和扩散混响相对于直接路径的定时取决于例如声源的位置和倾听位置，以及特定房间特性。该信息反映在所测量的头部相关双耳传递函数中，但是典型地不可用于双耳渲染器。然而，方法允许渲染器对原始所测量的头部相关双耳传递函数准确地仿真，即便这是由两个不同部分表示。
[0030]头部相关双耳传递函数可以特别地是房间相关传递函数，诸如BRIR或BRTF。
[0031]同步器可以特别地被布置为使第一和第二音频分量以根据同步指示所确定的时间对齐偏移而时间对齐。
[0032]同步器可以以任何适合的方式使第一音频分量和第二音频分量同步。因此，可以在组合之前使用任何方法来调节第一音频分量相对于第二音频分量的定时，其中响应于同步指示确定定时调节。例如，可以将延迟应用到音频分量之一，和/或可以例如将延迟应用到从其生成第一和/或第二音频分量的信号。
[0033]早期部分可以对应于在给定时间点之前头部相关双耳传递函数的脉冲响应的时间间隔，并且混响部分可以对应于在给定时间点之后头部相关双耳传递函数的脉冲响应的时间间隔(其中两个时间点可以是但不必是相同的时间点)。用于混响部分的脉冲响应时间间隔的至少一些比用于早期部分的脉冲响应时间间隔更晚。在大多数实施例和场景中，混响部分的开始比早期部分的开始更晚。在一些实施例中，用于混响部分的脉冲响应时间间隔是在(脉冲响应的)给定时间之后的时间间隔，并且用于早期部分的脉冲响应时间间隔是在给定时间之前的时间间隔。
[0034]在一些场景中，早期部分可以对应于或包括与从头部相关双耳传递函数的(虚拟)声源位置到(标称(nominal))倾听位置的直接路径相对应的头部相关双耳传递函数的部分。在一些实施例或场景中，早期部分可以包括对应于从头部相关双耳传递函数的(虚拟)声源位置到(标称)倾听位置的一个或多个早期反射的头部相关双耳传递函数的部分。
[0035]在一些场景中，混响部分可以对应于或包括与由头部相关双耳传递函数表示的音频环境中的扩散混响相对应的头部相关双耳传递函数的部分。在一些实施例或场景中，混响部分可以包括对应于从头部相关双耳传递函数的(虚拟)声源位置到(标称)倾听位置的一个或多个早期反射的头部相关双耳传递函数的部分。因此，早期反射可以分布在早期部分和混响部分之上。
[0036]在许多实施例和场景中，早期部分可以对应于与从头部相关双耳传递函数的(虚拟)声源位置到(标称)倾听位置的直接路径相对应的头部相关双耳传递函数的部分，并且混响部分可以对应于与早期反射和扩散混响相对应的头部相关双耳传递函数的部分。
[0037]通过包括至少部分地描述头部相关双耳传递函数的早期部分的数据，早期部分数据可以指示头部相关双耳传递函数的早期部分。特别地，其可以包括至少描述(直接地或间接地)早期时间间隔内的头部相关双耳传递函数的数据。例如，可以至少部分地通过早期部分数据的数据来描述早期时间间隔内的头部相关双耳传递函数的脉冲响应。
[0038]通过包括至少部分地描述头部相关双耳传递函数的混响部分的数据，混响部分数据可以指示头部相关双耳传递函数的混响部分。特别地，其可以包括至少描述(直接地或间接地)混响时间间隔内的头部相关双耳传递函数的数据。例如，可以至少部分地通过早期部分数据的数据来描述混响时间间隔内的头部相关双耳传递函数的脉冲响应。混响时间间隔在早期时间间隔之后结束，并且在许多实施例中，也在早期时间间隔结束之后开始。
[0039]第一音频分量可以生成为对应于经头部相关双耳传递函数的早期部分滤波的音频信号，因为该函数由早期部分数据描述。
[0040]第二音频分量可以对应于与混响部分相对应的时间间隔中的混响信号分量，根据由混响数据(至少部分地)描述的过程从音频信号生成混响信号分量。
[0041]双耳处理可以对应于与早期部分中的头部相关双耳传递函数相对应的滤波器对音频信号的滤波，因为所述函数由早期部分数据确定。
[0042]双耳处理可以生成用于双耳立体声信号当中的一个信号的第一音频分量(即其可以生成用于一个耳朵的信号的音频分量)。
[0043]混响过程可以是合成混响器过程，其根据从混响数据所确定的过程从音频信号生成混响部分中的混响信号。
[0044]混响过程可以对应于经头部相关双耳传递函数的混响部分滤波的音频信号，因为所述函数由混响部分数据描述。
[0045]根据本发明的可选特征，同步器被布置为引入第二音频分量相对于第一音频分量的延迟，所述延迟取决于同步指示。
[0046]这可以允许低复杂性和高效的操作。
[0047]根据本发明的可选特征，早期部分数据指示头部相关双耳传递函数的无回声部分。
[0048]这可以导致特别有利的操作，以及典型地高度高效的表示和处理。
[0049]根据本发明的可选特征，早期部分数据包括频率域滤波器参数，并且早期部分处理是频率域处理。
[0050]这可以导致特别有利的操作，以及典型地高度高效的表示和处理。具体而言，频率域滤波可以允许以低复杂性和资源使用对直接路径音频传播的非常准确的仿真。而且，这可以在不要求混响也由频率域滤波表示的情况下实现，所述频率域滤波将要求高度复杂性。
[0051]根据本发明的可选特征，混响部分数据包括用于混响模型的参数，并且混响器被布置为使用由混响部分数据所指示的参数实现混响模型。
[0052]这可以导致特别有利的操作，以及典型地高度高效的表示和处理。具体而言，混响建模可以允许以低复杂性和资源使用对反射音频分布的非常准确的仿真。而且，这可以在不要求直接音频路径也由相同模型表示的情况下实现。
[0053]根据本发明的可选特征，混响器包括合成混响器，并且混响部分数据包括用于合成混响器的参数。
[0054]这可以导致特别有利的操作，以及典型地高度高效的表示和处理。具体而言，合成混响器可以允许以低复杂性和资源使用对反射音频分布的非常准确的仿真，同时仍然允许直接音频路径的准确表示。
[0055]根据本发明的可选特征，混响器包括混响滤波器，并且混响数据包括用于混响滤波器的参数。
[0056]这可以导致特别有利的操作，以及典型地高度高效的表示和处理。
[0057]根据本发明的可选特征，头部相关双耳传递函数还包括早期部分与混响部分之间的早期反射部分；并且所述数据还包括:早期反射部分数据，其指示头部相关双耳传递函数的早期反射部分；和第二同步指示，其指示早期反射部分与早期部分和混响部分中的至少一个之间的时间偏移；并且所述装置还包括:用于通过向音频信号应用反射处理而生成第三音频分量的早期反射部分处理器，所述反射处理至少部分地由早期反射部分数据确定；并且组合器被布置为响应于至少第一音频分量、第二音频分量和第三音频分量的组合而生成双耳信号的第一耳朵信号；并且所述同步器被布置为响应于第二同步指示而使第三音频分量与第一音频分量和第二音频分量中的至少一个同步。
[0058]这可以导致经改进的音频质量和/或更高效的表示和/或处理。
[0059]根据本发明的可选特征，混响器被布置为响应于应用到第一音频分量的混响过程而生成第二音频分量。
[0060]在一些实施例和场景中，这可以提供特别有利的实现方式。
[0061]根据本发明的可选特征，针对双耳处理的处理延迟补偿同步指示。
[0062]在一些实施例和场景中，这可以提供特别有利的操作。
[0063]根据本发明的可选特征，针对混响处理的处理延迟补偿同步指示。
[0064]在一些实施例和场景中，这可以提供特别有利的操作。
[0065]根据本发明的方面，提供了一种用于生成位流的装置，所述装置包括:
处理器，其用于接收包括早期部分和混响部分的头部相关双耳传递函数；早期部分电路，其用于生成指示头部相关双耳传递函数的早期部分的早期部分数据；混响电路，其用于生成指示头部相关双耳传递函数的混响部分的混响数据；同步电路，其用于生成包括指示早期部分数据与混响数据之间的时间偏移的同步指示的同步数据；以及输出电路，其用于生成包括早期部分数据、混响数据和同步数据的位流。
[0066]根据本发明的方面，提供了一种处理音频信号的方法，所述方法包括:接收输入数据，所述输入数据包括至少描述包括早期部分和混响部分的头部相关双耳传递函数的数据，所述数据包括:指示头部相关双耳传递函数的早期部分的早期部分数据，指示头部相关双耳传递函数的混响部分的混响数据，指示早期部分与混响部分之间的时间偏移的同步指示；通过向音频信号应用双耳处理而生成第一音频分量，双耳处理至少部分地由早期部分数据确定；通过向音频信号应用混响处理而生成第二音频分量，混响处理至少部分地由混响数据确定；响应于第一音频分量和第二音频分量的组合而生成至少双耳信号的第一耳朵信号；以及响应于同步指示而使第一音频分量和第二音频分量同步。
[0067]根据本发明的方面，提供了一种生成位流的方法，所述方法包括:接收包括早期部分和混响部分的头部相关双耳传递函数；生成指示头部相关双耳传递函数的早期部分的早期部分数据；生成指示头部相关双耳传递函数的混响部分的混响数据；生成包括指示早期部分数据与混响数据之间的时间偏移的同步指示的同步数据；以及生成包括早期部分数据、混响数据和同步数据的位流。
[0068]根据本发明的方面，提供了一种包括表示头部相关双耳传递函数的数据的位流，所述头部相关双耳传递函数包括早期部分和混响部分，所述数据包括:指示头部相关双耳传递函数的早期部分的早期部分数据；指示头部相关双耳传递函数的混响部分的混响数据；同步数据，其包括指示早期部分数据与混响数据之间的时间偏移的同步指示。
[0069]本发明的这些和其它方面、特征和优点将从下文所描述的(多个)实施例显而易见并且将参考下文所描述的(多个)实施例进行阐述。
【附图说明】
[0070]将参考附图仅以示例的方式描述本发明的实施例，其中:
图1图示了 MPEG Surround系统的元件的示例；
图2例示了 MPEG SAOC中可能的音频对象的操纵；
图3图示了使得用户能够控制SAOC位流中所包含的各个对象的交互式接口；
图4图示了 3DAA的音频编码的原理的示例；
图5图示了双耳处理的示例；
图6图示了双耳房间脉冲响应的示例；
图7图示了双耳房间脉冲响应的示例；
图8图示了根据本发明的一些实施例的双耳渲染器的示例；
图9图示了经修改的Jot混响器的示例；
图10图示了根据本发明的一些实施例的双耳渲染器的示例；
图11图示了根据本发明的一些实施例的头部相关双耳传递函数数据的发射器的示例；以及
图12图示了 MPEG Surround系统的元件的示例；
图13图示了 MPEG SAOC音频渲染系统的元件的示例；以及图1

完整全部详细技术资料下载

当前第2页1 2 3 4 5 6