用于音频创建和传递的系统和方法与流程

文档序号:13742490阅读:154来源:国知局
用于音频创建和传递的系统和方法与流程

所描述的技术通常涉及传送音频信号,更具体地涉及从与用户的耳朵间隔开的一个或多个换能器向用户的耳朵传递音频的系统和方法。

背景

人类听觉系统能够通过分析到达双耳入口的声音信号中的听觉线索来确定声源的位置。听觉线索(例如,耳间时间差(itd)和/或耳间强度差(ild))可由于收听者的头部、躯干和耳廓滤波声音信号而导致。这种滤波行为可以根据用户的头部相关传输函数(hrtf)来描述。将hrtf应用于3d音频信号为用户提供了在穿戴在用户的耳朵内的、穿戴在用户的耳朵上的和/或穿戴在用户的耳朵附近的头戴耳机上再现空间音频所需要的空间线索。

概述

提供本概述以便以简化的形式介绍以下在详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键因素或必要特征,也不旨在用于限定所要求保护的主题的范围。在一些实施例中,例如,被配置为穿戴在用户的头部上的音频设备(例如,耳机)包括由音频设备承载的换能器,该换能器被配置成当音频设备被穿戴在用户的头部上时,被部署在接近用户的头部并与用户的耳朵间隔开的位置处。音频设备可进一步包括电子设备,该电子设备被通信地耦合到换能器并被配置为将头部相关传输函数(hrtf)和换能器位置补偿滤波器两者应用于音频信号,以当声音从换能器向用户的耳朵传送时,在用户的耳朵入口处提供具有经增强的频率响应的声音。

附图简述

图1a是根据所公开的技术的一个实施例配置的被显示为穿戴在用户的头部上的设备的后侧立体图。

图1b是图1a的用户的头部的坐标系的示意性侧视图。

图1c-1e是图1a的设备的前底面、后底面和后底面的透视图。

图1f是图1a的设备的一部分的放大视图。

图2是根据所公开的技术的一实施例配置的系统的示意性视图。

图3是示出了根据所公开的技术的一实施例配置的用于产生音频信号的过程的流程图。

图4是示出根据所公开的技术的一实施例配置的用于滤波音频信号的过程的流程图。

图5是示出根据所公开的技术的一实施例配置的音频信号频率响应和滤波器频率响应的图。

图6是示出根据所公开的技术的一实施例配置的滤波器的频率响应的图。

图7是示出了根据所公开的技术的一实施例配置的用于确定用户的头部相关传输函数(hrtf)的过程的流程图。

图8是示出了根据所公开的技术的一实施例配置的用于选择用户的hrtf的过程的流程图。

详细描述

本公开描述了向用户的耳朵传送和/或传递音频信息的各种设备、系统和方法。将用户的头部相关传输函数(以下称为hrtf)应用到其的音频信号可在通过位于用户的耳道入口上和/或直接邻近用户的耳道入口的头戴耳机和/或耳机进行回放时提供逼真的空间收听体验。经由不直接邻近用户的耳道入口的换能器(例如定位在距用户的耳道入口约4cm至10cm之间处的换能器)来回放音频信号可导致音频质量和真实性的显著降低。由用户的耳朵的物理结构导致的反射可能会在音频信号中产生失真。发明人已经认识到,向将用户的hrtf应用到其的音频信号应用换能器位置补偿滤波器可减轻由相对于用户的耳道入口而言偏离中心位置的换能器所引入的频谱着色。

在一些实施例中,将音频信息传递到用户的耳朵的方法包括接收音频信号(例如,空间音频信号、单声道音频信号、多声道音频信号)。该方法进一步包括通过将滤波器应用于音频信号并且从被配置为穿戴在用户的头部上的头戴耳机所承载的换能器向用户的耳朵传送经滤波的音频信号来生成经滤波的音频信号。换能器被配置为当头戴耳机被穿戴在用户的头部上时被定位在与用户的耳朵的耳道入口纵向间隔开一定距离(例如,在约2cm至约12cm之间、约4cm至约10cm之间、约6cm至8cm之间和/或大约是用户的头部的相同侧上的用户的耳朵和用户的眼睛之间的距离的二分之一)的位置处。应用滤波器包括在一频率范围内(例如,约1千赫兹(khz)至约10khz之间)改变音频信号的一部分。经滤波的音频信号被配置为提供具有基本上与从位于耳道入口处的换能器发射的声音的频谱相似的频谱的声音。在一些方面,该方法包括检测换能器和用户的耳道入口之间的取向和/或距离(例如在约4cm至约10cm之间)。在一些方面,换能器由头戴耳机的头带承载,并且被配置成沿着头带的底面上的凹槽移动,使得换能器在相对于用户的耳道入口而言的至少第一位置和第二位置之间是可移动的。在这些方面,该方法还包含进一步包括当换能器沿着凹槽从第一位置向第二位置移动时修改滤波器。在一些方面,该方法包括通过将用户的hrtf应用于音频信号来生成经修改的音频信号。在一些方面,该方法还包括:检测用户的一个或多个人体测量(例如,头部宽度或头部深度),将用户的一个或多个人体测量特征与hrtf数据库中的一个或多个hrtf相匹配,以及基于与用户的一个或多个人体测量相匹配的一个或多个hrtf来调整滤波器。在一些方面,该方法进一步包括使用人体测量数据来构造和/或调整应用于经修改的音频信号的滤波器。

在一些实施例中,设备(例如,空间音频回放设备、头戴耳机、增强现实或虚拟现实设备)包括被配置为被穿戴在用户的头部上的头戴耳机和由该头戴耳机承载的换能器。换能器被配置成当头戴耳机被穿戴在用户的头部上时与用户的耳朵间隔开一距离。存储器被配置成存储可执行指令;以及处理器被配置成执行存储在该存储器上的指令。该指令包括用于提供具有基本上与从位于用户的耳朵入口处的换能器发射的声音的频谱相似的频谱的音频信号的指令。在一些方面,该距离等于用户的头部的相同侧上的用户的耳朵和眼睛之间的距离的大约二分之一。在一些方面,该距离在1khz处的声音波长的约二分之一至四分之一之间。在一些方面,该距离在约4cm至约10cm之间。在一些方面,换能器被配置为沿着头戴耳机的圆周相对于用户的耳朵从第一位置向第二位置移动。在一些方面,传感器被配置为提供指示换能器沿着头戴耳机向处理器移动的信号。在一些方面,头戴耳机包括与第二头带部分相对的第一头带部分。在一些方面,第一头带部分和第二头带部分可在第一配置和至少第二配置之间调节。在这些方面,用于提供音频信号的指令包括用于将头部相关传输函数(hrtf)应用于音频信号的指令,并且指令进一步包括用于当第一头带部分和第二头带部分从第一配置被调整至第二配置时修改hrtf的指令。

在一些实施例中,系统(例如,增强现实系统)包括被配置为被穿戴在用户的头部上的增强现实设备(例如,头戴耳机)和由该增强现实设备承载的换能器。换能器被配置为当增强现实设备被穿戴在用户的头部上时被部署在邻近用户的头部并与用户的耳朵间隔开的位置处。该系统可进一步包括电子设备(例如,包括存储器和处理器的系统电子设备),该电子设备被通信地耦合到换能器并被配置为将头部相关传输函数(hrtf)和换能器位置补偿滤波器两者应用于音频信号以提供从换能器向用户的耳朵传送的声音,该声音在用户的耳朵入口处具有基本上与位于用户的耳朵入口处的换能器传送的声音的频率响应相似的频率响应。在一些方面,换能器被定位在增强现实设备上并与用户的耳朵入口之间的距离在约4cm至约10cm之间。在一些方面,该系统进一步包括被配置为产生指示用户的人体测量特征的第一电信号的第一传感器,以及被配置为产生指示换能器与用户的耳朵入口之间的距离的第二电信号的第二传感器。在这些方面,电子设备被进一步配置为基于第一电信号来调整hrtf,并且基于第二电信号来调整换能器位置补偿滤波器。

下面更详细地描述所公开技术的这些和其他方面。在下面的描述和图1a-8中给出了某些细节,以提供对所公开技术的各种实施例的全面理解。描述通常与空间音频创建、传递和相关方法和系统相关联的公知结构和系统的其它细节未在下面的公开中被阐述以避免不必要地模糊对各种实施例的描述。

在各附图中,相同附图标记标识相同,或至少大致相似的元素。为了便于讨论任何特定元素,任何附图标记的最高有效位或数字指的是首先引入该元素的图。例如,首先参考图1a引入并讨论元素110。图中所示的许多细节、尺寸、角度和其它特征仅仅是本公开的特定实施例的解说。因此,在不背离本发明的精神或范围的情况下,其他实施例可具有其他细节、尺寸、角度和特征。此外,本领域的那些普通技术人员将理解,可在没有下面描述的几个细节的情况下实践本发明的其他实施例。

合适的设备

图1a是根据所公开的技术的一个实施例配置的被视为穿戴在用户的头部102上的设备110的后侧立体图。设备110(例如,头戴耳机、个人收听设备、增强现实设备和/或虚拟现实设备)包括被配置为穿戴在用户头部上的头带112和由该头带112承载并定位在与耳朵105(即,用户的左耳)的入口间隔开的位置处的第一换能器120a。不同于传统的头戴耳机和耳机,换能器120a被配置为由头带112承载在不直接邻近耳朵105的入口的位置处。在一些实施例中,换能器120a与耳朵105的入口间隔开超过2cm。在一些实施例中,换能器120a和耳朵105的入口之间的距离在约2cm至12cm之间(例如,约4cm至约10cm之间、约5cm至9cm或约7cm之间)。在一些实施例中,换能器120a和耳朵105的入口之间的距离在约20至80毫米之间。

如下面进一步详细讨论的,设备110和换能器120a可被配置为接收音频信号、将hrtf应用于信号、并且进一步对信号应用换能器位置补偿滤波器以将空间音频传递到耳朵105的入口,该空间音频与未经滤波的空间声音(例如,没有将换能器位置补偿滤波器应用于其的空间声音)相比具有经增强的感知质量(例如,相对未修改的频率响应),从而提供更逼真的空间音频体验。

图1b是图1a的用户的头部102的坐标系的示意性侧视图,示出了相对于xyz坐标系而言用户的耳朵105、眼睛102a(即,用户的左眼)和鼻子102b具有方位角和仰角θ。图1b的x轴对应于范围尺寸,而z轴对应于仰角尺寸。由x和y轴定义的平面对应于与耳朵105的入口共面的方位角平面。

图1c-1e是设备110的前底面、后底面和后底面的透视图。将图1a和图1c-1e一起参考,头带112包括第一头带部分113a和第二头带部分113b。可调整的内部头带部分115允许调节头带112的大小以容纳各种大小和/或形状的头部。显示器116被配置为向用户输出视觉信息(例如,文本、图像和/或视频)。鼻梁117被配置为搁置在用户的鼻子102b上,并且护目镜118被配置成保护设备110的各部分,并且还可被配置为用于减少穿过其的光的量。换能器120b被定位在设备110的相对侧上来作为换能器120。换能器120a和120b被配置成沿头带112的圆周经由形成在设备110的下底面中的相应凹槽124进行移动。在一些实施例中,凹槽124中的一个或多个传感器(未示出)被配置为产生指示换能器120a和120b沿凹槽124的移动的信号。然而,在其它实施例中,换能器120a和120b相对于设备110而言具有固定的位置。在一些实施例中,例如,凹槽124被配置成为设备110中的电子设备和/或其他产热组件提供通风。

图1f是图1a中示出的设备110和耳朵105的一部分的放大视图。在图1f中示出了常见于人耳耳廓的解剖结构和特征以供读者参考。耳朵105包括三角窝105a、耳甲艇105b、螺旋核105c、耳屏105d、耳道105e、耳垂105f、对耳屏105g、对螺旋105i、螺旋105j、舟状窝105k、对螺旋的下肢105l和耳甲腔105m(即,耳道内腔和/或通向耳朵105的听觉道105的前庭或开口)。为清楚起见,未示出额外的解剖学结构。如图1f所示,换能器120a被定位在距耳甲腔105m的距离d处的头带112上,在x方向上间隔开范围r(图1b),而在z方向上处于相对于耳甲腔105m而言成角度b(例如,35-45度)的高度h上(图1b)。在一些实施例中,距离d可在约2cm至约12cm之间或约4cm至10cm的范围之间。此外,换能器120a在图1f中被示为位于耳甲腔105m上方的z方向上的高度h处。然而,在其他实施例中,换能器120a可被定位在相对于耳朵105而言的任何合适的位置处。在一些实施例中,例如,换能器120a可由位于耳甲腔105m下方的头戴耳机承载。

合适的系统

图2以及下面的讨论提供了其中可以实现该技术的合适的计算环境的简要的一般描述。虽然未作要求,但各技术方面将在诸如例程等由通用计算机执行的计算机可执行指令的一般上下文中描述。该技术的各方面可被嵌入在专门编程、配置、或构建的以执行在此详细解释的一个或多个计算机可执行指令的专门目的计算机或数据处理器中。该技术的各方面也可在分布式计算环境中实现,其中任务或模块由通过通信网络(例如,无线通信网络、有线通信网络、蜂窝通信网络、因特网、短距离无线电网络(例如,经由蓝牙))连接的远程处理设备执行。在分布式计算环境中,程序模块可位于本地和远程的存储器存储设备两者中。

该技术的各方面下的计算机实现的指令、数据结构、屏幕显示、和其它数据可被存储或分布在计算机可读存储介质上,包括磁性或光可读计算机盘片、如半导体存储器、纳米技术存储器、有机或光存储器、或其它便携和/或非瞬态数据存储介质上的微代码。在一些实施例中,在一段时间内技术的各方面可被分布在因特网或其他网络(例如,蓝牙网络)的传播介质(例如,电磁波(s)、声波)中的传播信号上,或可被提供在任何模拟或数字网络(分组切换、线路切换或其他方案)。

图2是根据所公开的技术的一实施例配置的系统201的示意图。在所例示的实施例中,系统201包括耦合到音频设备210的系统电子设备203(例如,图1a和1c-1e的设备110、音频头戴耳机、虚拟现实耳机、或增强现实耳机)。在一些实施例中,系统电子设备203可包括部分地或全部地结合到设备210中的一个或多个组件。然而,在其他实施例中,系统电子设备203可包括远离设备210的组件。系统电子设备203可驻留在例如移动设备(例如,移动电话、平板、个人数字助理)和/或计算机(例如,台式计算机、膝上型计算机)上以通信地耦合到设备210。

系统电子设备203包括若干组件,包括:存储器203a(例如,一个或多个计算机可读存储模块、组件、设备),一个或多个处理器203b、通信组件203c(例如,有线通信链路和/或无线通信链路(例如,蓝牙、wi-fi、红外线和/或另一无线电传输网络))和被配置为存储用于生成空间音频的数据(例如,等式、滤波器、hrtf数据库)的数据库203d。在一些实施例中,系统电子设备203可包括图2中未示出的附加组件。存储器203a可被配置为存储信息(例如,用户信息或简档、环境数据、从一个或多个传感器收集的数据、媒体文件)和/或可由一个或多个处理器203b执行的可执行指令。如下面参考图3-5进一步详细解释的,存储器203a可包括例如用于增强将从音频输出220(例如,图1a的换能器120a)输出的音频信号的指令。通信组件203c还可被配置为从一个或多个音频源107、移动设备108、一个或多个计算机109、和/或另一外置设备接收数据(例如,包含用于回放的空间音频信息的数据)。

设备210被耦合到系统电子设备203并包括视觉输出(例如,图1d和1e的显示器116),音频输出220(例如,图1a和1c-1e的换能器120a和120b、和/或一个或多个音频换能器(例如,电声扬声器、压电换能器、静电换能器)),一个或多个音频输入221(例如,一个或多个麦克风),一个或多个传感器222(例如,一个或多个加速度计、温度计、湿度计、血压传感器、高度计、陀螺仪、磁力计、接近传感器、气压计、霍尔效应传感器),和通信组件223(例如,有线通信链路和/或无线通信链路(例如,蓝牙、wifi、红外线和/或另一无线电传输网络))。电源225(例如,一个或多个电池和/或电容器)可向系统201的各组件和/或系统电子设备203提供电力。电源225可以是可重复充电的,例如经由电力电缆、感应充电和/或其他合适的重复充电方法。

图3是示出了根据所公开的技术的一实施例配置的用于产生音频信号的过程300的流程图。在一些实施例中,过程300可包括例如被存储在系统201(图2)的存储器203a上的可由一个或多个处理器203b(图2)执行的指令。在一些实施例中,过程300的各部分由一个或多个硬件组件(例如,被容纳在设备110中和/或由设备110承载的数字信号处理器)执行。在一些实施例中,过程300的各部分由外置于系统201的设备执行。

该过程300起始于框310。在框320处,过程300经由有线或无线通信链路(例如,图2的通信组件203c和/或223)从外置音频源(例如,媒体播放器、移动设备、计算机、一个或多个远程服务器)接收一个或多个音频信号(例如,空间音频信号)。在一些实施例中,过程300在框325解码音频信号(例如,使用存储在存储器203a和/或硬件解码器上的解码指令)。例如,过程300可将音频信号从压缩格式(例如,mp3、mp4、flac)转换为未压缩格式。在一些实施例中,音频信号包括多声道音频信号和/或包括记录声场的球面分解的格式(例如,b格式和/或立体混响)。在这些实施例中,过程300可经由一个或多个换能器(例如,图1c-1e的换能器120a和120b)来调节或以其它方式准备用于回放的音频信号。然而,在其他实施例中,过程300跳过框325并前进到框330。

在框330,过程300将第一滤波器应用于所接收的音频信号以生成结合用户的身体的物理结构的滤波效果的经修改的音频信号。第一滤波器可包括例如hrtf、对应的hrir(头部相关脉冲响应)、和/或另一适当的解剖学传输函数。在一些实施例中,第一滤波器包括用户的hrtf,其可例如被存储在存储器203a和/或数据库203d(图2)中。在一些实施例中,第一滤波器包括被存储在hrtf数据库(例如,图2的数据库203d)中并基于用户的人体测量(例如,头部形状、头部宽度、头部长度)而选择的复合hrtf。在一些实施例中,如下面参考图7和8所描述的,通过用户的人体测量的度量来计算、建模或以其他方式确定第一滤波器。例如,第一滤波器可包括基于从位于头戴耳机(例如,图1a的设备110和/或图2的设备210)上的传感器(例如,图2的一个或多个传感器222)接收的用户的头部大小的度量来计算的hrtf。也可例如使用用户的头部和/或耳廓的光学度量(例如,图像、激光度量)来确定第一滤波器。在一些实施例中,第一滤波器包括使用

在共同转让的美国专利申请12/903,610号(现为美国专利8,767,968号)中公开的技术和/或方法中的一种或多种获得的hrtf。

在框340,过程300将诸如换能器位置补偿滤波器的第二滤波器应用于在框330生成的经修改的音频信号。如下面参考图4和5更详细地描述的,第二滤波器可包括被配置为被应用于来自框330的经修改的音频信号的滤波器,使得从被定位在用户的耳朵的附近并与其入口间隔开的换能器(例如,图1a的换能器120a)输出时所产生的经滤波的音频信号在用户的耳朵(例如,图1a或图1f中的耳朵105)的入口处具有未失真的频谱。在一些实施例中,如下面参考图4所描述的,换能器位置补偿滤波器可基于例如换能器特征和/或用户的人体测量来生成或计算。在一些实施例中,换能器位置补偿滤波器可以是预先确定的(例如,被存储在图2的存储器203a和/或数据库203d中)。

在框350,经滤波的音频信号被输出到一个或多个换能器(例如,图1c-1e的换能器120a和/或120b和/或图2的音频输出220)。在一些实施例中,换能器与用户的耳道入口间隔开。然而,在其他实施例中,换能器被定位成直接邻近用户的耳朵入口(例如,在一对头戴耳机或耳机之中和/或之上)。在框360,过程300结束。

图4是示出了根据所公开的技术的一实施例配置的用于生成换能器位置补偿的过程400的流程图。过程400被配置为生成或以其他方式输出换能器位置补偿滤波器,该换能器位置补偿滤波器被配置为增强从与用户的耳朵入口间隔开的换能器(例如,图1的换能器120a)传送的音频信号(例如,图3的框330处生成的空间音频信号)。在一些实施例中,过程400包括过程300的部分和/或子例程(例如,图3的框340)。在一些实施例中,过程400可包括例如被存储在可由一个或多个处理器203b(图2)执行的系统201(图2)的存储器203a上的指令。在一些实施例中,过程400的各部分可由一个或多个硬件组件(例如,被容纳在设备110中和/或由设备110承载的数字信号处理器)执行。在一些实施例中,过程400的部分可由外置于系统201的设备执行。

该过程400起始于框410。在框420,过程400可选地确定由头戴耳机(例如,图1a的设备110)承载的换能器(例如,图1a的换能器120a)和用户的对应耳朵入口之间的距离、取向和/或方向(例如,图1f的距离d)。在一些实施例中,使用一个或多个传感器(例如,图2的传感器222)来确定距离和/或方向。在一些实施例中,过程400被配置为在换能器相对于用户的耳朵而言在头戴耳机上移动(例如,沿着图1c和1e的凹槽124)的情况下,确定经更新的距离和/或方向度量。在一些实施例中,过程400可接收对应于来自由用户执行的度量的距离和/或方向的用户输入。然而,在其他实施例中,距离和/或方向可以是预先确定的,并且过程400可跳过框410并前进到框430。

在框430,过程400可以可选地接收来自头戴耳机(例如,图2的传感器222)上的传感器和/或邻近于用户的其它传感器的人体测量数据(例如,诸如头部形状、头部大小、耳朵位置、耳朵形状和/或耳朵大小之类的一个或多个用户人体测量的度量)和/或其他度量数据。在一些实施例中,度量数据可包括由位于和/或邻近用户的耳朵的话筒(例如,图2的音频输入221)获取的音频度量。过程400可被配置为例如基于所获取的音频度量来计算逆滤波器,其可被应用于音频信号以减轻从靠近用户的耳朵的换能器(例如,图1a和1f的换能器120a)传送的音频信号中的频率失真。然而,在其他实施例中,过程400可跳过框420和430并直接前进到框440。

在框440,过程400生成将被应用到音频信号的换能器位置补偿滤波器,使得音频信号产生与经滤波的音频信号从位于用户的耳朵附近(例如距用户的耳朵约4cm至约100cm之间)的换能器发送到用户的耳朵时的框330的音频信号相比在用户的耳朵处具有经增强的频率响应的声音。在一些实施例中,如下面参考图5和6所讨论的,换能器位置补偿滤波器可包括被配置为修改从换能器发射的音频信号的特定频率范围的滤波器。如本领域的那些普通技术人员将理解的,与用户的耳朵间隔开但接近于用户的耳朵的换能器可产生被用户的身体的物理结构扭曲、滤波或以其他方式影响的信号。例如,从被定位在偏离用户的耳朵入口中心的换能器发射的声音可能因耳廓反射而失真。过程400可应用换能器位置补偿滤波器,该滤波器至少部分地减轻由耳廓反射引起的失真,以在由换能器发射的声音进入用户的耳朵时提供经增强的或更平滑的频率响应。在一些实施例中,在框440生成的换能器位置补偿滤波器包括基于在框420和430处执行的度量和/或计算而计算的逆滤波器。在一些实施例中,换能器位置补偿包括增强了将hrtf应用在其上的并且从与用户耳朵间隔开的换能器向用户的耳朵发射的声音的质量和/或真实性的任何合适的滤波器。在框450,过程400结束。

示例

图5是示出在用户的耳朵入口处接收或度量的未校正的音频路径540的频率响应的图表500(例如,将hrtf应用到其而没有上文参考图3的框330讨论的换能器位置补偿滤波器的空间音频信号),换能器位置补偿滤波器550和音频路径560所产生的频率响应。图表500包括第一频率范围551(例如,在约20hz至约5khz之间)、第二频率范围552(例如,在约4khz至约8khz之间或在约5khz至约7khz之间)、以及第三频率范围553(例如,在约7khz至约20khz之间)。第二频率范围以大约f1频率(例如,在约5khz或7khz之间的频率)为中心。音频信号路径540具有由例如来自用户的耳朵的耳廓的一个或多个声音反射引起的在频率f1处的槽口544。滤波器550具有以大约频率f1为中心的峰值554。将滤波器550应用于音频信号路径540,导致经滤波的音频路径560在用户的耳朵入口处与初始频率响应540相比具有经增强的(例如,更平滑和/或更低失真的)频率响应。

fig.图6是根据本公开的实施例配置的换能器位置补偿滤波器650的另一示例的频率响应的图表600。滤波器650可被应用于从第一频率f1(例如,在约800hz至约2khz或约1khz之间)延伸到第二频率f2(大约8khz至约12khz或约10khz之间)的频率范围652处的音频信号。将滤波器650应用于将从被定位在与用户的耳朵入口间隔开的位置处的换能器(例如图1a的换能器120a)传送的音频信号,可导致从换能器向用户的耳朵传送的声音与传送自相同换能器的未经滤波的音频信号相比具有经增强的频率响应。

hrtf确定

如上文参考图3所讨论的,在一些实施例中,基于用户的人体测量或物理特征从hrtf库中确定用于该用户的hrtf。这些物理特征可基于来自传感器的输入来确定。图7是确定用于特定用户的hrtf的过程700的流程图。在一些实施例中,过程700至少部分地存储在存储器203a上并由图2的一个或多个处理器203b执行。例如,所产生的hrtf可被用于图3的过程300的步骤330。注意到,hrtf可在任何时刻被确定。作为一个示例,仅针对一用户确定一次hrtf,并将其存储以供重复使用。当然,修改hrtf(例如,选择新的hrtf)是可能的。

在框702,过程700指示用户采取某一位置或姿态。例如,过程700指示用户向左看。在框704,过程700收集在该位置处的用户的数据。在框706,过程700确定数据是否是有效的。例如,如果过程200期望用于右耳的数据,则过程200确定数据是否与右耳预期的数据相匹配。如果不是,则可重复框702的步骤,使得再次指示用户采取正确的姿态。如果数据是有效的(框706为是),则过程700确定是否存在可被用户采取的更多的位置/姿态。在下一次迭代中,用户可能会被要求向前看、向右看等。可为各种各样的位置收集数据。

当合适的数据被收集时,过程700前进到框710以为用户确定hrtf。在一些实施例中,存在可从其中选择hrtf的hrtf库。这些hrtf可与用户的各种物理特征相关联。示例包括但不限于头部大小和宽度、耳廓特征、身体大小。例如,具体的hrtf可与关于头部大小和耳廓的特定度量相关联。度量可能是范围或单个值。例如,一度量可能是可以用单个值或范围来表示的头部宽度。过程700可然后通过将用户的物理特征与库中的hrtf相关联的物理特征相匹配来为用户选择hrtf。任何技术都可被用于确定最佳匹配。在一些实施例中,过程700内插以确定用户的hrtf。例如,用户的度量可位于两个hrtf的度量之间,在此情况下,可通过对两个hrtf的参数进行内插来确定用户的hrtf。

接下来,过程700可执行附加步骤来验证此hrtf确定是良好的,但也可能为该用户选择更好的hrtf。在框712,系统为用户播放音频信号。这可通过由用户穿戴的头戴耳机(例如,图1a的设备110)来播放。在框714,过程700可要求用户指向音频信号的表现源。在框716,过程700使用相机和/或一个或多个其他传感器确定用户正指向的位置。在一些实施例中,过程700可使用其他声音来重复框712-716,直到过程700(在框717)确定已收集到足够的数据。

在框718,过程700确定hrtf的有效性。例如,过程700确定用户能够多精确地定位虚拟声音。系统然后确定是否应该为该用户确定不同的hrtf。如果是,则通过返回到框710来确定新的hrtf。过程700可重复框712-718直到确定令人满意的hrtf。

在框722,过程700存储该用户的hrtf。注意到,这不一定是过程700中测试的最后一个hrtf。即,过程700可确定在过程700中较早测试的hrtf之一可能是更优的。还注意到,可为给定用户存储多于一个的hrtf。例如,可针对用户穿戴眼镜和未穿戴眼镜的两种情况重复过程700,并针对每种情况存储一个hrtf。

如上所述,确定用户的详细特征以使得可为用户存储hrtf的过程可能不被频繁地进行——也许只进行一次。图8描绘了基于先前收集的详细特征为用户选择hrtf的过程800的一个实施例的流程图。例如,过程700可在过程800之前被执行一次。然而,过程800可被执行多次。在框802,过程800使用生物测定信息来标识用户。请注意,此信息与过程700期间收集的信息不同。但是,可能会存在一些信息的重叠是有可能的。在一个实施例中,系统能够基于例如面部识别来识别收听者。

在框804,过程800为在框802被标识的用户选择合适的hrtf。在一个实施例中,选择由过程700为用户存储的hrtf。在另一实施例中,过程800可基于由过程700收集的用户特征来选择hrtf。如果需要的话,这些经存储的详细用户特征可通过当前收集的信息来增强。例如,过程800可基于用户是否正穿戴例如帽子和/或眼镜来选择不同的hrtf。

从上文将会认识到,在此已出于说明目的描述了本发明的各具体实施例,但是可以作出各种修改而不背离本发明的范围。因此,本发明只受所附权利要求限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1