用于定向相关编码方案的声音分量旋转的制作方法

文档序号:35282842发布日期:2023-09-01 03:04阅读:133来源:国知局

本公开涉及用于定向相关编码方案的声音分量旋转的系统、方法及媒体。


背景技术:

1、基于场景的音频的编码技术可依赖于定向相关的下混范例。例如,包含w、x、y及z分量(例如,用于三维声音定位)的基于场景的音频信号可经下混,使得仅所述分量的分量子集经波形编码,且剩余分量由接收器装置的解码器进行参数编码及重新建构。此可导致音频声音质量下降。

2、符号及命名

3、贯穿本公开,包含在权利要求书中,术语“扬声器”、“扩音器”及“音频再现换能器”同义使用以指示任何发声换能器(或换能器组)。一组典型耳机包含两个扬声器。扬声器可经实施为包含多个换能器(例如,低音扬声器及高音扬声器),所述换能器可由单个公共扬声器馈电或多个扬声器馈电驱动。在一些实例中,扬声器馈电可在耦合到不同换能器的不同电路系统分支中经历不同处理。

4、贯穿本公开,包含在权利要求书中,“对”信号或数据执行操作(例如,对信号或数据进行滤波、缩放、变换或应用增益)的表述在广义上用于指示直接对信号或数据执行操作,或对信号或数据的经处理版本(例如,被执行操作前已经历初步滤波或预处理的信号版本)执行操作。

5、贯穿本公开,包含在权利要求书中,术语“系统”在广义上用于指示装置、系统或子系统。例如,实施解码器的子系统可被称为解码器系统,且包含此类子系统的系统(例如,响应于多个输入而产生x个输出信号的系统,其中子系统产生m个输入且从外部源接收其它x-m个输入)也可被称为解码器系统。

6、贯穿本公开,包含在权利要求书中,术语“处理器”在广义上用于指示可编程或以其它方式可配置(例如,用软件或固件)以对数据(例如,音频或视频或其它图像数据)执行操作的系统或装置。处理器的实例包含现场可编程门阵列(或其它可配置集成电路或芯片组)、经编程及/或以其它方式配置成对音频或其它声音数据执行流水线处理的数字信号处理器、可编程通用处理器或计算机,及可编程微处理器芯片或芯片组。


技术实现思路

1、本公开的至少一些方面可经由方法实施。一些方法可涉及由编码器确定输入音频信号的帧中的主要声音分量的空间方向。一些方法可涉及由所述编码器基于所述所确定空间方向及要用于编码所述输入音频信号的编码方案的方向偏好来确定旋转参数。一些方法可涉及基于所述旋转参数旋转所述输入音频信号的所述帧的声音分量,使得在旋转之后,所述主要声音分量具有与所述编码方案的所述方向偏好对准的空间方向。一些方法可涉及结合所述旋转参数的指示或所述主要声音分量的所述空间方向的指示,使用所述编码方案编码所述输入音频信号的所述帧的所述经旋转声音分量。

2、在一些实例中,旋转所述声音分量包括:基于所述主要声音分量的所述空间方向及所述编码方案的所述方向偏好,确定所述声音分量的第一旋转量及任选地为第二旋转量;及将所述声音分量围绕第一轴旋转所述第一旋转量且任选地围绕第二轴旋转所述任选第二旋转量,使得所述声音分量在旋转之后与对应于所述编码方案的所述方向偏好的第三轴对准。在一些实例中,所述第一旋转量是方位角旋转量且所述任选第二旋转量是仰角旋转量。在一些实例中,所述第一轴或所述第二轴垂直于与所述主要声音分量相关联的向量。在一些实例中,所述第一轴或所述第二轴垂直于所述第三轴。

3、在一些实例中,一些方法可涉及至少部分基于对所述主要声音分量的所述空间方向的强度的确定来确定是否确定所述旋转参数,其中确定所述旋转参数响应于确定所述主要声音分量的所述空间方向的所述强度超过预定阈值。

4、在一些实例中,一些方法可涉及:对于第二帧,确定所述输入音频信号的所述第二帧中的主要声音分量的空间方向;确定所述第二帧中的所述主要声音分量的所述空间方向的强度低于预定阈值;及响应于确定所述第二帧中的所述主要声音分量的所述空间方向的所述强度低于预定阈值,确定不确定所述第二帧的旋转参数。在一些实例中,所述第二帧的所述旋转参数经设置为前一帧的所述旋转参数。在一些实例中,所述第二帧的所述声音分量不旋转。

5、在一些实例中,确定所述旋转参数包括进行以下中的至少一者:用前一帧的所确定空间方向平滑所述帧的所述所确定空间方向,或用所述前一帧的所确定旋转参数平滑所述帧的所述所确定旋转参数。在一些实例中,所述平滑包括利用自回归滤波器。

6、在一些实例中,所述编码方案的所述方向偏好至少部分取决于所述输入音频信号将被编码的位率。

7、在一些实例中,所述主要声音分量的所述空间方向是使用到达方向(doa)分析来确定。

8、在一些实例中,所述主要声音分量的所述空间方向是使用主分量分析(pca)来确定。

9、在一些实例中,一些方法涉及量化所述旋转参数或所述主要声音分量的所述空间方向的所述指示中的至少一者,其中所述声音分量是使用所述经量化旋转参数或所述主要声音分量的所述空间方向的所述经量化指示来旋转。在一些实例中,量化所述旋转参数或所述主要声音分量的所述空间方向的所述指示包括编码对应于均匀分布在球体的部分上的一组点中的一点的数值。在一些实例中,一些方法涉及在量化所述旋转参数之前或在量化所述主要声音分量的所述空间方向的所述指示之前,相对于与所述输入音频信号的前一帧相关联的旋转参数来平滑所述旋转参数。

10、在一些实例中,一些方法涉及相对于用于确定所述输入音频信号的前一帧的主要声音分量的空间方向的协方差矩阵,平滑用于确定所述帧的所述主要声音分量的所述空间方向的协方差矩阵。

11、在一些实例中,确定所述旋转参数包括确定服从至少部分基于应用于所述输入音频信号的前一帧的旋转而确定的限制的一或多个旋转角度。在一些实例中,所述限制指示基于应用于所述输入音频信号的所述前一帧的所述旋转从所述主要声音分量的定向的最大旋转。

12、在一些实例中,旋转所述声音分量包括从与所述输入音频信号的前一帧相关联的先前旋转参数插值到所述输入音频信号的所述帧的样本的所述所确定旋转参数。在一些实例中,所述插值包括线性插值。在一些实例中,所述插值包括相对于所述帧的结束部分处的样本,对所述帧的开始部分处的样本应用较快旋转。

13、在一些实例中,所述经旋转声音分量及所述旋转参数的所述指示可由解码器使用以在再现所述声音分量之前反转所述声音分量的所述旋转。

14、一些方法可涉及由解码器接收表示音频信号的帧的经旋转音频分量及用于产生所述经旋转音频分量的旋转参数的参数化的信息,其中所述经旋转音频分量由编码器从原始定向旋转,且其中所述经旋转音频分量已旋转到与由所述编码器及所述解码器使用的编码方案的空间偏好对准的经旋转定向。一些方法可涉及至少部分基于所述编码方案解码所述经接收信息。一些方法可涉及至少部分基于所述旋转参数的所述参数化来反转所述音频分量的旋转以恢复所述原始定向。一些方法可涉及再现至少部分服从所述经恢复原始定向的所述音频分量。

15、在一些实例中,反转所述音频分量的所述旋转包括将所述音频分量围绕第一轴旋转第一旋转量且任选地围绕第二轴旋转第二旋转量,且其中所述第一旋转量及所述任选第二旋转量是在所述旋转参数的所述参数化中指示。在一些实例中,所述第一旋转量是方位角旋转量且所述任选第二旋转量是仰角旋转量。在一些实例中,所述第一轴或所述第二轴垂直于与所述音频分量的主要声音分量相关联的向量。在一些实例中,所述第一轴或所述第二轴垂直于与所述编码方案的所述空间偏好相关联的第三轴。

16、在一些实例中,反转所述音频分量的所述旋转包括围绕垂直于由所述旋转之前的所述音频分量的主要声音分量及对应于所述编码方案的所述空间偏好的轴形成的平面的轴旋转所述音频分量,且其中指示垂直于所述平面的所述轴的信息包含于所述旋转参数的所述参数化中。

17、一些方法可涉及由编码器确定输入音频信号的帧中的主要声音分量的空间方向。一些方法可涉及由所述编码器基于所述所确定空间方向及要用于编码所述输入音频信号的编码方案的方向偏好来确定旋转参数。一些方法可涉及修改所述编码方案的所述方向偏好以产生经适配编码方案,其中所述经修改方向偏好是基于所述旋转参数或所述主要声音分量的所述所确定空间方向中的至少一者来确定,使得所述主要声音分量的所述空间方向与所述经适配编码方案的所述经修改方向偏好对准。一些方法可涉及结合所述经修改方向偏好的指示,使用所述经适配编码方案编码所述输入音频信号的所述帧的声音分量。

18、一些方法可涉及由解码器接收表示音频信号的帧的音频分量及由用于编码所述音频分量的编码器对编码方案的适配的指示的信息,其中所述编码方案由所述编码器适配,使得所述音频分量的主要声音分量的空间方向与所述编码方案的空间偏好对准。一些方法可涉及基于所述编码方案的所述适配的所述指示来适配所述解码器。一些方法可涉及使用所述经适配解码器解码所述音频信号的所述帧的所述音频分量。

19、本文中所描述的部分或全部操作、功能及/或方法可由一或多个装置根据存储在一或多个非暂时性媒体上的指令(例如软件)执行。此类非暂时性媒体可包含例如本文中所描述的存储器装置,包含但不限于随机存取存储器(ram)装置、只读存储器(rom)装置等。因此,本公开中所描述的标的物的一些创新方面可经由其上存储有软件的一或多个非暂时性媒体来实施。

20、本公开的至少一些方面可经由设备实施。例如,一或多个装置可能够至少部分执行本文中所公开的方法。在一些实施方案中,设备是或包含具有接口系统及控制系统的音频处理系统。控制系统可包含一或多个通用单或多芯片处理器、数字信号处理器(dsp)、专用集成电路(asic)、现场可编程门阵列(fpga)或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其组合。

21、本公开提供各种技术优势。例如,通过旋转声音分量以与编码方案的方向偏好对准,可在以位率高效的方式编码音频信号时保持高声音质量。此可允许基于场景的音频中声源定位的准确性,即使当音频信号以相对较低位率编码时,以及当声音分量没有定位成与编码方案的方向偏好对准时。

22、本说明书中所描述的标的物的一或多个实施方案的细节在附图及以下具体实施方式中阐述。将从具体实施方式、附图及权利要求书明白其它特征、方面及优势。注意,下图的相对尺寸可未按比例绘制。

当前第1页1 2 
网友询问留言 留言:0条
  • 还没有人留言评论。精彩留言会获得点赞!