一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备的制作方法

文档序号：7686613阅读：142来源：国知局

专利名称：一种针对耳机音响系统的人脑音频变换函数(hrtf)的生成方法和设备的制作方法
技术领域：
本发明涉及一种能够将双声道音频声源扩展为针对耳机音响系统的 HRTF生成的方法和设备，尤其涉及能够增强手持终端音效的方法和设备。
根据本发明实例，三维环绕音效技术提供了一种双声道音频再建系统，只需提供一个人脑音频变换函数(HRTF)，就能够改变这些重建虚拟声源的听觉位置。针对耳机音响系统的HRTF生成技术的工作原理基于以下两项发现(1) HRTF可以用一个线性滤波器系统进行描述；(2)该线性系统由三个参数决定声源方位，声源高度和音频采样率。本发明针对双声道耳机声音空间化的HRTF生成技术通过使用三维双声道耳机音频系统模型来获得更高精确度的技术。
原则上讲，本发明方法和设备所提供冊TF生成引擎可用于多种不同类型的电子设备，如手机，PDA, MP3/MP4播放器等。
背景技术：
本发明致力于寻求通过线性系统设计生成HRTF的有效方法，意在解决计算复杂性和服TF设计及实施中的不够精确的相关问题。
传统方法将服TF作为由一对参数(声源方位，声源高度)决定的线性滤波系统进行模拟。通过使用KEMAR仿真人脑测量。这种测量在全封闭环境中进行，其中，扩音器播放测试信号，从不同方向靠近头部。测量结果为一
组FIR滤波器系数，可用来处理双声道音频信号来生成三维空间音频。此模型不能准确描述HRTF系统，由于以下两个原因(1)该模型不考虑音频采样率；(2)该模型测量一些特殊的方向，但并没有指出如何获得一个针对上述参数对(声源方位，声源高度)任意值的服TF滤波器的参数值。
更具体地说，空间环响要求一个延迟时间，这个参数由缓冲的采样数进行模拟。对于一个固定延迟时间，缓冲器大小应该根据采样率改变。在由经测量确定滤波器系数的过程中，不可能取对任意参数组(声源方位，声源高度，采样率)的值进行测量。显然该参数组的所有可能值都可以在现实世界中出现。因此，需要从已测定的滤波器系数来确定所有可能的滤波器系数。
若一种服TF生成方法或设备是实用的，它应该具备(l)简单因为该方法要用于消费电子设备上，如手机、PDA等；(2)准确因为该方法必须要逼真地重建真实的人脑听觉系统。本发明实例可以达到上述两个目标。

发明内容
本发明的第一目标是提供一种针对双声道耳机能模拟人脑听觉系统的 HRTF建立方法和设备。
本发明的第二目标是提供一种适用于任何消费电子设备，如手机、PDA 等，并且能针对双声道耳机有效重建空间环响音效的服TF建立方法和设备。
本发明的第三目标是在不需要大量系统资源的条件下，包括CPU和存储器，能够针对双声道耳机提供一种准确的空间环绕音效环境的HRTF建立方法和设备。根据本发明实例原则，通过提供HRTF建立引擎，以其最宽的涵盖形式，基于已发现的人脑听觉系统的事实，来确定HRTF滤波器系数，以实现上述目标。
本发明实例对来自给定方向的平面波使用线性滤波器。为了更好地测量滤波属性，进行了大量试验以获得精确数据。线性滤波器的脉冲响应通过不同的声音方向和声音采样率来决定。
本发明针对双声道耳机的服TF生成技术能高度准确地模拟三维环绕环境是因为，本方法在建立人脑听觉系统主观感知的模型时，考虑到了以下三个因素(1) HRTF能通过一个线性滤波器系统进行描述；(2)该线性系统由参数组决定声源方位，声源高度和音频采样率；(3)针对该参数组任何取值的HRTF滤波器能通过插值与抽取技术从现有的HRTF滤波器获得。
由于本发明应用PCM音频信号，故可对任何音频和语音编解码标准进行后处理，以提供三维环绕音效。

图l HRTF所描述的人脑听觉系统模糊椎体示意图；图2本发明服TF滤波器生成的流程图。
具体实施例方式
如图2所示，本发明是通过HRTF建立引擎实现的，适用于任何消费电子设备。HRTF引擎200由对参数组(声源方位，声源高度，采样率)特定取值点测量所得m^TF滤波器数据库210，指定音频采样率插值器220，指定声源方位插值器230，以及指定声源高度插值器240组成。音频采样率插值器220在服TF滤波器数据库210中选择与指定参数组(声源方位，声源高度，采样率)取值最接近的四组HRTF滤波器，并使用插值和抽取技术生成与指定采样率相同的四组ffi^TF滤波器；声源方位插值器230使用220的输出使用插值技术生成与指定声源方位相同的两组HRTF滤波器；最后，声源高度插值器240使用230的输出使用插值技术生成与指定声源高度相同的一组服TF滤波器。不同于传统的服TF生成技术，本发明可对参数组(声源方位，声源高度，采样率)的任意取值生成其所对应的HRTF滤波器，且所生成的冊TF滤波器能更好地反映了人脑听觉系统的主观感受。
为了了解本发明HRTF生成技术，有必要先了解一些基于服TF的三维耳机环绕音效的一些基本原理，即如何对双声道信号的两个输入音频流实施处理。当多个声源在传播相关的或部分相关的信号时，有差异的、有时甚至是互相干扰的声源就会混叠，尤其是当听者听到的不同声源信号仅有微小振幅差异和微小时间差异时。这种情况下，不同的声源会合成为一个单音，这个单音的位置与源声源的实际位置会有很大不同。当传入的声源差异较大时，虚拟的声源镜像会混入其中的一个真实声源中，心理声学试验显示，当受到简单正弦波的刺激，听觉系统会使用两个声源参数来估算声源的方向。艮P: 耳间强度和时间差异(IID和ITD)共同作用来达到该目的。然而，IID和 ITD只能部分地解释区别不同空间方向的能力。实际上，如果声源沿环形横向运动，如图3所示，IID和ITD就不会改变。由头中部环形组成的椎体被称为"模糊锥体"。模糊椎体内横向及纵向的区别可用头相关传递函数(HRTF) 来描述。HRTF实际是自给定方向平面波的线性滤波器。该滤波器的幅度和相位响应是很复杂的，并由声源的方向和高度决定。由简化的服TF模型来描述相关的不同方向的声源是可能的。即使这些
声源被简化了，当它们动态地改变时，它们可以提供很强的定位效果。在现实生活中，听者在听到一个声源时从来不会是静态的。甚至是很小的头部动作也可以对区别可能的模糊声源提供很大的帮助，例如位于听者不能确定声
源在其正前方或正后方。因此，几个虚拟声源参数，如ITD， IID及HRTFs 足以提供一个很强的方向效果，只要这些声源与听者的头部动作有关。服TF 是针对双声道耳机建立三维环响音效的重要模型。
传统的服TF建立技术只为(声源方位，声源高度，音频采样率)参数组一些特殊的值提供HRTF滤波器系数。在现实生活中，声音可以来自任意方向，以任意速度和任意采样率。因此，传统的HRTF建立技术不能提供一个精确的模型来建立声音环响音效。
好的HRTF建立技术应该准确有效地反映人体听觉系统的"模糊椎体"。本发明HRTF生成技术通过下列步骤来实现设计目标(1)通过一些特定参数组值(声源方位，声源高度和音频采样率)获得一组HRTF滤波器；(2) 针对步骤1中未指定的所有参数组值插补HRTF滤波器系数。
业内人士应该可以看出，发明HRTF生成技术的首要目的是有效建立一个线性滤波系统，基于位置参数组(声源方位，声源高度)决定的当前声音位置。由于整个方法的设计都基于人体听觉系统的主观感觉以及人体听觉系统的精确建模，故本发明HRTF生成技术能够针对双声道耳机系统生动再建真实的三维环绕音效场景。
由于本发明的服TF生成实例不需要专门的硬件支持，只通过软件即可实现其功能，但不排除专门的硬件实现方式，因此该技术可容易地应用于任何类型的消费电子产品上，如手机，PDA等。此外，本发明可用于任何音频和语音编解码系统，如AAC， AAC+， MP3， WMA， RA， AMR等。
前面已经十分详细地描述了本发明所提请的技术，使业内人士能够了解和使用本发明，但是，还要提请注意的是，在不偏离本发明实质的前提下，还可以对所提请的技术发明进行变更和改进，并且本发明不受以上说明或附图的限制，而是按照所附权利要求来予以限定。
权利要求
1. 针对双声道耳机音响系统的人脑音频变换函数HRTF生成方法包括以下步骤a. 根据位置参数组(声源方位，声源高度)和声音采样率测量并收集一系列HRTF滤波器系数；b. 针对步骤a中不存在的位置参数组(声源方位，声源高度)的任意值，使用线性插值技术，从步骤a中指定的现有滤波器获得该位置参数组滤波器系数；c. 针对步骤a中不存在的音频采样率参数的任意值，使用插值和抽取技术，从步骤a中指定的现有滤波器获得该采样率参数的滤波器系数。
2. 如权利要求1所述的方法，其中步骤b执行线性插值，分为两个步骤(1)对一个参数应用线性插值；(2)然后对步骤(1)的输出对另一个参数应用线性插值。
3. 如权利要求1所述的方法，其中步骤c执行插值和抽取技术，分为两个步骤(1)针对(声源方位，声源高度)参数组值最相近的四组己有滤波器系数的现有声音采样率参数值应用插值或抽取技术，获得有相同的采样率的上述四种滤波器；(2)然后对步骤(1)的输出应用线性插值，获得(声源方位，声源高度，音频采样率)参数组指定值的滤波系数。
4. 针对双声道耳机音响系统的人脑音频变换函数HRTF生成装置包括以下单元a.根据(声源方位，声源高度)位置参数组和声音采样率，测量并收集一系列HRTF滤波器系数；b. 针对单元a中不存在的位置参数组(声源方位，声源高度)的任意值，使用线性插值技术，从步骤a中指定的现有滤波器获得该位置参数组滤波器系数；c. 针对单元a中不存在的音频采样率参数的任意值，使用插值和抽取技术，从单元a中指定的现有滤波器获得该采样率参数的滤波器系数。
5. 如权利要求4所述设备，单元b执行线性插值，分两个单元(1)对一个参数应用线性插值；(2)然后对单元(1)的输出对另一个参数应用线性插值。
6. 如权利要求4所述设备，其中单元c执行插值和抽取技术，分为两个单元(1)针对(声源方位，声源高度)参数组值最相近的四组已有滤波器系数的现有声音采样率参数值应用插值或抽取技术，获得有相同的采样率的上述四种滤波器；(2)然后对单元(1)的输出应用线性插值，获得(声源方位，声源高度，音频采样率)参数组指定值的滤波系数。
全文摘要
一种针对耳机音响系统的人脑音频变换函数(HRTF)的生成方法和设备，能够使双声道的音频信号扩展为多声道三维环绕的音频信号。本发明HRTF生成技术依据人体听觉的主观感知原理建立了一个新模型。虚拟声音位置主要通过“模糊椎体”进行反映，“模糊椎体”由头中部环形组成，可以用HRTF(Head-Related Transfer Function，人脑音频变换函数)进行描述。本发明实例通过对参数组(声源方位，声源高度和音频采样率)在不连续域测量一组滤波器系数，并使用线性插值技术从现有滤波器获得任意参数组的滤波器系数。本发明所设计的针对双声道耳机音频系统的HRTF生成技术既便于实施又能高效重建双声道音响的三维环绕效果。
文档编号H04R5/033GK101483797SQ20081005568
公开日2009年7月15日申请日期2008年1月7日优先权日2008年1月7日
发明者佳严, 洪浩洋, 高成伟申请人:昊迪移通(北京)技术有限公司;高成伟

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：高成伟;洪浩洋;严佳
技术所有人：昊迪移通（北京）技术有限公司;高成伟
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。