音频信号处理装置的制造方法

文档序号：9355743阅读：546来源：国知局

音频信号处理装置的制造方法
【技术领域】
[0001]本发明涉及音频信号处理领域。
【背景技术】
[0002]正如2008年Pekonen，J.在赫尔辛基理工大学音频信号处理研讨会上的《空间声音的麦克风技术》中所描述的，音频信号可以分为两种不同类别。第一类包括如传统麦克风录制的立体声音频信号。第二类包括如采用仿真头录制的双耳音频信号。
[0003]立体声音频信号是为在听者前采用两个扬声器进行立体声呈现所设计，以实现在与所述扬声器的位置不同的位置上感知声源位置的目标。这些声源也称为幻象声源。还可以使用耳机进行立体声音频信号呈现。声源在空间位置的布置通过改变强度和/或适当延迟提供给左右扬声器和/或耳机的源信号来实现，其中，所述强度的改变和/或源信号的适当延迟称为幅度、强度平移或延迟平移。通过合理配置两个麦克风，如A-B或X-Y，立体声录制也可以营造声源在不同位置的感觉。
[0004]当通过耳机收听时，立体声音频信号不能在所述两个扬声器之间的线段外营造声源的效果，导致声源在头部内的定位。所述幻象声源的位置是限制的，且听觉体验并不是浸入式的。
[0005]然而，正如2011年Blauert, J.和Braasch, J.在IEEE DSP的《双耳信号处理》中所描述的，由于发生在真实的声音场景中，双耳音频录制可以在听者的两个耳膜上捕获声压。在向听者展示双耳音频信号时，会在所述听者的两个耳膜上产生所述信号的副本，就如同在录制位置体验到双耳音频信号一样。从所述两路音频信号中捕获到如双耳时间差和/或双耳电平差等双耳线索，营造出一种浸入式听觉体验，其中，声源可以放置在所述听者的四周。
[0006]对于向所述听者呈现双耳音频信号，期望保证每个声道单独展示并且没有任何串扰。串扰指的是将在所述听者右耳膜边录制的部分信号展示给了左耳的非期望情况，反之亦然。当采用传统耳机展示双耳音频信号时，防止串扰可以自然地得以实现。使用传统立体声扬声器呈现要求进行合适处理来主动消除非期望的串扰，这种处理避免了所述左扬声器产生的信号到达右耳膜，反之亦然。串扰消除可以通过使用逆滤波技术实现。这种加强型扬声器也称为一对串扰消除扬声器。没有串扰的双耳音频信号可以提供完全浸入式听觉体验，其中，声源的位置没有限制但大体上跨越围绕所述听者的整个三维空间。
[0007]对于获得营造完全浸入式听觉体验的双耳音频信号，在所述听者的耳膜边捕获信号是可取的。尽管所述听者可以佩戴专门设计的麦克风，大多数双耳音频信号是通过采用仿真头获得的。仿真头是一种模拟真实人头的声学特性和在所述耳膜的位置上嵌入两个麦克风的人工头。
[0008]对于立体声音频信号，现有方法增加了所述声音场景的宽度。正如2011年Floros，A.和Tatlas, N.A.在IEEE-DSP《用于浸入式立体声音频应用的空间增强》中所描述的，这类方法众所周知且在称为立体声增强或声音外化的技术中广为应用。主要的策略是引进合成双耳线索，并把合成双耳线索加入到立体声音频信号中，从而支持在所述扬声器或耳机之间的线段外的声源的定位。
[0009]因此，正如2006年Liitola，T.在赫尔辛基大学的博士论文《耳机声音外化》中所描述的，虚拟声场的宽度可以增加至超出典型扬声器跨度±30°，且使用耳机可以实现更加自然的浸入式体验。所产生信号的呈现一般需要采用串扰防止手段，如使用耳机或一对串扰消除扬声器。
[0010]立体声增强方法的应用只适合不含双耳线索的立体声音频信号。对于双耳录制，引进额外的合成双耳线索以增强立体声像，导致双耳线索与所述双耳信号中已包含的自然线索冲突。这类冲突的线索使得人类听觉系统无法实现所述声源的定位，以及三维声音场景的任何感知都被破坏了。
[0011]在现有的方法中，所述听者手工完成了是否应该将立体声增强应用到加强所述感知的决策。所述听者必须决定是否开启立体声增强。
[0012]在以立体声增强方法为特征的典型听觉场景中，如智能手机、MP3播放器或PC声卡，立体声增强通常被默认应用。为通过使用现有技术获得最佳的听觉体验，所述听者将必须在所述设备的设置中关闭立体声增强。这就需要所述听者意识到自己正在听双耳音频信号，自己的设备正在使用立体声增强方法，以及应该为双耳音频信号去激活立体声增强。因此，听者在听双耳音频信号时通常体验到较差的三维听觉体验。

【发明内容】

[0013]本发明的目的是在无需听者进行任何人工干预的情况下，对于如立体声音频信号和双耳音频信号等任何一种音频信号，提供营造浸入式听觉体验的改进方案。
[0014]该目的是通过独立权利要求的特征来实现的。结合独立权利要求、说明书和附图会使具体实现方式更易于理解。
[0015]根据第一方面，本发明涉及一种用于处理音频信号的音频信号处理装置，所述音频信号处理装置包括:转换器，用于将立体声音频信号转换为双耳音频信号；确定器，用于根据指示信号确定所述音频信号是立体声音频信号还是双耳音频信号，该指示信号指示所述音频信号是立体声音频信号还是双耳音频信号，所述确定器还用于:如果所述音频信号是立体声音频信号，则向所述转换器提供所述音频信号。
[0016]因此，所述音频信号处理装置使得在无需听者进行任何人工干预的情况下，对于任何一种音频信号都能够提供浸入式听觉体验。
[0017]因此，所述立体声音频信号通过使用例如基于合成双耳线索的立体声增强技术来进行处理，以增大所述声音场景的宽度和营造浸入式的体验。然而，呈现了未被修改的双耳音频信号，以重现原来录制的三维场景。
[0018]所述音频信号可以是立体声音频信号或双耳音频信号。立体声音频信号例如可以通过采用传统的立体声麦克风来进行录制。双耳音频信号例如可以通过采用仿真头上的麦克风来进行录制。
[0019]所述音频信号还可以作为双声道音频信号或参数音频信号提供。双声道音频信号可以包括第一声道音频信号，如左声道，和第二声道音频信号，如右声道。参数音频信号可以包括下混音频信号和参数边信息。下混音频信号可以通过将双声道音频信号混合到单个声道或单声道音频声道中获得。所述参数边信息可以对应所述下混音频信号且可以包括定位线索或空间线索。
[0020]因此，所述音频信号可以由四种不同组合中的其中一种提供。所述音频信号可以是双声道立体声音频信号、双声道双耳音频信号、参数立体声音频信号或参数双耳音频信号。
[0021]所述转换器可以用于将立体声音频信号转换为双耳音频信号。为实现此目的，可以应用立体声增强技术和/或声音外化技术，其可以将合成双耳线索加入到所述立体声音频信号中。
[0022]所述确定器可以用于根据指示信号确定所述音频信号是立体声音频信号还是双耳音频信号。所述确定器还可以用于:如果所述音频信号是立体声音频信号，则向所述转换器提供所述音频信号。为实现此目的，所述确定器例如可以将所述指示信号提供的值如0.6与预先定义的阈值如0.4进行比较，如果所述值小于所述预先定义的阈值，则确定所述音频信号是立体声音频信号；如果所述值大于所述预先定义的阈值，则确定所述音频信号是双耳音频信号，反之亦然。可选地，所述确定器例如可以基于所述指示信号提供的标志确定所述音频信号是立体声音频信号还是双耳音频信号。
[0023]所述转换器和所述确定器可以在处理器上实现。
[0024]所述指示信号可以指示所述音频信号是立体声音频信号还是双耳音频信号。所述指示信号可以向所述确定器提供一个值，如某个数值，或一个用于指示所述音频信号是立体声音频信号还是双耳音频信号的标志。
[0025]根据第一方面，在第一种实现方式中，所述音频信号处理装置包括用于输出所述双耳音频信号的输出终端，其中，所述确定器用于:如果所述音频信号是双耳音频信号，则直接向所述输出终端提供所述音频信号。
[0026]因此，不向所述转换器提供所述双耳音频信号，且不向所述双耳信号加入合成双耳线索。这样，所述双耳音频信号的原始双耳声音场景得以保留，并实现浸入式听觉体验。
[0027]所述输出终端可以用于立体声音频信号和/或双耳音频信号。所述输出终端还可以用于双声道音频信号和/或参数音频信号。因此，所述输出终端可以用于双声道立体声音频信号、双声道双耳音频信号、参数立体声音频信号、参数双耳音频信号或其组合。
[0028]根据第一方面或根据第一方面的第一种实现方式，在第二种实现方式中，所述音频信号处理装置还包括用于分析所述音频信号以生成所述指示信号的分析器。
[0029]因此，无需外部提供所述指示信号，所述装置就可以应用到任何传统的音频信号中。
[0030]所述分析器可以用于分析所述音频信号以生成指示所述音频信号是立体声音频信号还是双耳音频信号的指示信号。所述分析器还可以用于从所述音频信号中提取定位线索，该定位线索指示音频源的位置；并分析所述定位线索以生成所述指示信号。
[0031]所述分析器可以在处理器上实现。
[0032]根据第一方面的第二种实现方式，在第三种实现方式下，所述分析器用于从所述音频信号中提取定位线索，该定位线索指示音频源的位置；并分析所述定位线索以生成所述指示信号。
[0033]因此，可以分析所述音频信号浸入感的深刻标准，以生成可靠且具有代表性的指不信号。
[0034]所述定位线索或空间线索可以包括所述音频信号中一个或若干个音频源空间位置分布的信息。所述定位线索或空间线索例如可以包括双耳时间差(ITD)、双耳相位差(IPD)、双耳电平差(ILD)、外耳上的方向选择性频率滤波、头部、肩膀和身体上的方向选择性反射，和/或环境线索。双耳电平差、双耳相干性差、双耳相位差和双耳时间差分别表示为所述录制的音频信号中的声道间电平差、声道间声道差、声道间相位差和声道间时间差。所述术语“定位线索”和所述术语“空间线索”可以替换使用。
[0035]所述音频源可以由麦克风录制的声波源来表征。所述声波源例如可以是乐器或说话的人。
[0036]所述音频源的位置可以表示为相对于所述音频录制位置的中心轴的一个角度，例如25°。所述中心轴例如可以表示为0°。左边方向和右边方向例如可以表示为+90°和-90°。因此，在所述音频录制位置如空间音频录制位置内，所述音频源的位置可以通过相对于所述中心轴的角度来表示。
[0037]所述定位线索的提取可以包括音频信号处理技术的进一步

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：彼得·格罗舍;大卫·维雷特;
技术所有人：华为技术有限公司;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。