生成虚拟环绕声的方法和装置的制造方法_2

文档序号:9619239阅读:来源:国知局
道混音器模块输出的混音后信号转换成待播出的 音频。
[0045] 本发明的有益效果为:
[0046] 本发明基于ambisonic理论将音频对象转成高阶的B-格式信号,优选2阶或3阶 的B-格式信号,可扩展性(Scalability)好,不管对象个数如何增加,运算复杂度都基本 保持稳定,因为核心区只和3d,3rd order ambisonic维数(16)相关,由此,理论上所需要 的虚拟扬声器阵列中的虚拟扬声器个数最小值最大为16个,运算复杂度都基本保持稳定, 既保持了较好的可扩展性,又不因该扩展过度增加运算成本。
[0047] 如果暂时不考虑用BRIR模型距离,只需要保存16个BRIR即可,因此可以保持较 低的内存消耗。
【附图说明】
[0048] 图1是本发明的方法一个实施例的原理框图;
[0049] 图2是本发明的装置的一个实施例的结构示意图。
【具体实施方式】
[0050] 本发明提供了一种生成虚拟环绕声的方法,包括对音频对象的如下处理步骤:
[0051] (1)通过头部跟踪装置获取用户头部旋转角度;
[0052] (2)根据所述旋转角度,将音频对象编码到高阶(优选为2阶或3阶)B-格式信 号;
[0053] (3)将所述B-格式信号转换成虚拟扬声器阵列信号;以一个一阶B-格式信号[Wi Xi 1 ZJT为例,转换成虚拟扬声器阵列信号[h L2…LN]T的过程就是进行下列运算:
[0055] 其中,N为虚拟扬声器拓扑结构中包括的虚拟扬声器的数目。上式中所用的G矩 阵为ambi sonic解码矩阵,可以通过求伪逆矩阵来得出。
[0056] (4)对音频对象的所述虚拟扬声器阵列信号基于双耳房间脉冲响应(BRIR)进行 双耳转码(通常是3维,即包含高度信息),得到音频对象的双耳输出虚拟环绕声信号。具 体是:从虚拟扬声器信号转到耳机信号对应的二路立体声BRIR矩阵,将该二路立体声矩阵 和虚拟扬声器阵列信号进行矩阵乘法,得到虚拟环绕声。BRIR矩阵为
,则虚 拟环绕声为
[0057] 所述音频信号可以为一个或多个。
[0058] 所述双耳房间脉冲响应优选为离线生成,可以采用真实测量或由专门的软件生 成,因此不必像现有技术下采用在线生成方式时需要存储大量的BRIR,减少了内存消耗。
[0059] 将音频对象编码到B-格式信号时,水平方向阶数优选大于或等于垂直方向阶数, 例如,水平方向编码优选为3阶B-格式信号时,垂直方向编码优选为2阶或1阶B-格式信 号,分别用H3V2、H3V1表示。由于人对高度感知低于平面角度的分辨率,因此采用以上适当 在某个特定方向上降低阶数的方法,减少了运算量,但又不明显降低用户对声音的感知效 果。
[0060] 当电量变低至一定程度时或接收到进入低功耗模式的指令时,可以将音频对象编 码到B-格式信号的阶数调低,以减小耗电量,当电量得到回复或进入正常模式后,则回复 原有的阶数。
[0061] 具体调低阶数的方式优选为:
[0062] 在已知内容在垂直方向上没有大量角度变化时,调低垂直方向的阶数,在已知内 容在垂直方向上有大量角度变化时,根据对听觉效果的综合影响,调低垂直方向和/或水 平方向的阶数,
[0063] 在电量变低过程中对阶数的调低采用一步式或多步式,当采用一步式时,只设置 一个电量阈值,当低于电量低于该电量阈值时进行一次性的调低,当采用多步式时,划分多 个低电量区间,当电量位于某一低电量区间时,将阶数调低到该区间对应的调低程度,低电 量区间涵盖的电量值越低,对应的阶数越低,
[0064] 所述低功耗模式的档位为一档或多档,当采用多档低功耗模式时,在高档位的低 功耗模式下,所调低的B-格式信号的阶数低于在低档位下相应B-格式信号的阶数。
[0065] 例如,对于所述垂直方向阶数,优选动态自动可调,调整方式可以为以下任意一种 或两种并存:
[0066] (1)根据生成虚拟环绕声的装置的供电电量变化或所接收的进入低功耗模式的指 令,动态调整垂直方向阶数,当供电电量变低至一定程度时或接收到进入低功耗模式的指 令时,将音频对象编码到B-格式信号的垂直方向阶数调低;例如可以动态从垂直高阶(如 3阶)变为2阶,甚至一阶,即由H3V3到H3V2或H3V1。
[0067] (2)根据音频对象在垂直方向上的角度变化动态调整垂直方向阶数,当所述音频 对象在垂直方向上的角度变化量超过一定值或者角度变化频次加快到一定程度时,则通常 应将音频对象编码到B-格式信号的垂直方向阶数保持在相对较高的阶数,以使垂直方向 的空间分辨率更加精准,在此情况下,可以调低水平分量的阶数(如果适应的话),以便降 低电耗的情况下尽可能获得较好的综合听觉效果。
[0068] 所述生成虚拟环绕声的方法还优选包括将环境声转换成环境声的双耳输出虚拟 环绕声信号,再将所述音频对象(此时的音频对象主要是指环境声之外的声音内容)和所 述环境声各自的双耳输出虚拟环绕声信号对应混音并双耳输出。图1所示为该方法的一个 实施例的原理框图。其中,所述将环境声(即图1中的声场信号)转换成环境声的双耳输 出虚拟环绕声信号优选包括如下步骤:
[0069] 获取环境声的1阶B-格式信号;
[0070] 根据所述旋转角度,将环境声的所述B-格式信号旋转得到旋转后的B-格式信 号;具体来说,是根据所述旋转角度生成旋转矩阵,再根据所述旋转矩阵,对环境声的所述 B-格式信号(即待调整信号)进行旋转。所谓旋转,即将旋转矩阵与待调整信号矩阵相乘, 旋转不改变音频信号矩阵分量的大小,只改变分量的方向。旋转矩阵的阶数与音频信号矩 阵相适应。例如,当待调整信号矩阵为[W2 Χ2 Υ2]τ时,旋转矩阵为
:当待 调整信号矩阵为[W2 Χ2 Υ2 Ζ2]τ时,旋转矩阵为
[0071] 将环境声的所述旋转后的Β-格式信号转换成虚拟扬声器阵列信号;
[0072] 对环境声的所述虚拟扬声器阵列信号基于头相关变换函数(HRTF)进行双耳转码 (通常是2维,即不包含高度信息),得到环境声的双耳输出虚拟环绕声信号。
[0073] 所述生成虚拟环绕声的方法在实施运算时优选基于以下假定:虚拟扬声器阵列具 有左右对称性,用户在房间的中轴线上,用户对应的所述双耳房间脉冲响应和头相关变换 函数也具有左右对称性。基于该假设,可以利用高阶B-格式对称性优化方法,显著减少运 算量,提高运算效率。
[0074] 下面描述了如何将音频对象编码到ambisonic域。
[0075] 将音频对象编码到一阶ambisonic信号:
[0080] Sl是第i个音频对象,i = 1. . k,k是音频对象的个数。Θ 1是平面上的角度(方 位角),巾1是垂直方向上的角度。W声道信号表示全方向声波,X声道信号、Y声道信号和Z 声道信号分别表不沿空间三个互相垂直取向X、Y、Z的声波。
[0081] 一阶B-格式信号表不为
[0082] 同理,将音频对象编码到2阶或3阶B-格式信号优选依照下表定义进行:
[0083]
[0084] 上表中的三角函数对于方位角Θ是偶函数的,则相应B-格式信号的相应分量是 左右对称的,如果上表中的三角函数对于方位角Θ是奇函数,则相应B-格式信号的相应分 量是左右相反的。以一阶B-格式信号为例,从物理意义和坐标来看,w,x,z不分左右,所以 如果听着的位置左右对称,并且假定相应的HRTF系数也近似左右对称,那么w,X,z对应的 双耳输出的分量对于输出的左右通道是相同的。而y对于左右正好反向。所以y对应的双 耳输出的分量对于左右通道是相反的。对于具有对称性的分量,可以采用快速算法,即运算 过程中的对称性优化,可进一步降低运算量。
[0085] 本发明还提供了一种生成虚拟环绕声的装置,包括:
[0086] 头部跟踪装置,用于检测用户头部旋转角度,通常设置在立体声耳机上或单独固 定在用户的头部;
[0087] 音频对象输入模块,用于输入原始的音频对象声道信号;
[0088] 音频对象B格式编码模块,其设有声道信号输入端和角度输入端,分别连接所述 音频对象输入模块的输出端和所述头部跟踪装置的输出端,用于根据所述旋转角度将音频 对象编码到B-格式信号;
[0089] 音频对象虚拟扬声器阵列
当前第2页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1