使用面部识别调节扬声器的制造方法

文档序号：9915049阅读：334来源：国知局

使用面部识别调节扬声器的制造方法
【技术领域】
[0001]本公开涉及可变向扬声器，且更具体来说，涉及使用面部识别来调节可变向扬声器的方向。
【背景技术】
[0002]固定扬声器通常用于在车辆中输出音频。例如，机动车辆(诸如汽车)通常具有固定布置的多个扬声器以为车辆中的驾驶员和乘客输出音频(例如，音乐、有声书、广播节目等)。然而，固定扬声器不能响应于乘客处于收听环境中的不同位置进行调节。一个特定扬声器布置可能最适合于某一高度的乘客，但并非最适合于更高或更矮的乘客。此外，固定扬声器布置中的音频输出的方向不会根据车辆中的乘客的数量而改变。例如，如果当四名乘客在车辆中时，扬声器布置被设计成提供最佳性能，则当少于四名乘客在车辆中时，这个布置的性能可能不如扬声器的其他布置那么好。

【发明内容】

[0003]根据本公开的一个实施方案，一种方法包括基于由摄像头捕获的图像数据接收用户的位置；以及基于所述用户的位置识别一个或多个空间坐标。所述方法还包括基于所述一个或多个坐标产生用于调节至少一个致动器的控制信号，所述控制信号被配置成改变扬声器的定向，使得所述扬声器的音频输出区域包括所述一个或多个坐标。
[0004]本公开的另一实施方案为一种系统，其包括可变向扬声器、机械耦合到所述可变向扬声器的致动器，以及计算设备。所述计算设备被配置成基于由摄像头捕获的图像数据接收用户的位置；以及基于所述用户的位置识别一个或多个空间坐标。所述计算设备还被配置成基于所述一个或多个坐标产生用于调节所述致动器的控制信号，所述控制信号被配置成改变所述可变向扬声器的定向，使得所述可变向扬声器的音频输出区域包括所述一个或多个坐标。
[0005]本公开的另一实施方案为一种用于调节扬声器的计算机程序产品，其中所述计算机程序产品包括可由一个或多个计算机处理器执行的计算机可读程序代码。所述程序代码被配置成基于由摄像头捕获的图像数据接收用户的位置；以及基于所述用户的位置识别一个或多个空间坐标。此外，所述程序代码被配置成基于所述一个或多个坐标产生用于调节至少一个致动器的控制信号，所述控制信号被配置成改变所述扬声器的定向，使得所述扬声器的音频输出区域包括所述一个或多个坐标。
【附图说明】
[0006]图1是用于基于用户的位置调节可变向扬声器的系统；
[0007]图2是用于基于面部识别调节扬声器的系统的方框图；
[0008]图3是用于基于面部识别调节扬声器的方法；
[0009]图4A至图4C图示基于面部识别来识别位置以引导扬声器；
[0010]图5A和图5B图示基于车辆中的乘客的数量调节扬声器布置；
[0011]图6A和图6B图示基于车辆中的乘客的数量调节扬声器布置；
[0012]图7是用于识别路径以基于面部识别调节可变向扬声器的系统。
[0013]为了便于理解，在可能的情况下使用相同的参考数字指定图中所共有的相同的元件。可以预期的是，一个实施方案中所公开的元件可以有利地用于其他实施方案，而无需特别指明。这里所指的附图不应被理解为按比例绘制，除非特别注明。另外，为了清楚地呈现和解释，附图通常被简化并且细节或组件被省略。附图和讨论用来解释下面讨论的原理，其中相同的标号表示相同的元件。
【具体实施方式】
[0014]本文的实施方案描述了一种基于用户的位置调节的音频系统。本文所描述的音频系统根据用户的位置或数量调节一个或多个扬声器的音频输出的方向，而不是依赖于不能改变其音频输出的方向的固定扬声器。为此，音频系统可以包括摄像头；以及面部识别应用，其识别在摄像头前面的用户的位置和/或用户的数量。使用这个信息，音频系统调节耦合到扬声器的一个或多个致动器以改变扬声器的音频输出的方向一即，扬声器面向的方向。例如，面部识别应用可以识别用户在3D空间中的位置，并且作为响应，音频系统调节扬声器使得其面向该位置。随着用户继续移动或移位，音频系统可以继续调节扬声器以优化系统的性能。
[0015]在一个方面，面部识别应用检测在摄像头前面的多个用户。音频系统可以基于用户的各个位置调节扬声器。例如，如果扬声器被移动使得音频输出的方向是在两个用户之间，则可以实现最佳性能。或者，音频系统可以包括多个可调式扬声器，并且调节一个扬声器来面向用户中的一个并调节另一个扬声器来面向另一个扬声器。不管用户的数量或位置，音频系统可以被预编程来改变扬声器的方向以便优化(即，改进)音频性能。
[0016]图1是用于基于用户的位置调节可变向扬声器105的音频系统100。系统100包括扬声器105、致动器110、摄像头115和用户120。如图所示，扬声器105可以是响应于电信号输入产生声音的任何设备。扬声器105耦合到致动器110，其沿着一个或多个运动轴(例如，上下、左右、对角、圆周运动等)改变扬声器105的音频输出的方向。这里所示的致动器110是可以收缩或延伸以调节扬声器105面向的方向的活塞致动器。通过控制两个致动器IlOA和110B，系统100移动扬声器105来面向特定点或区域。例如，在扬声器105前面的区域可以被分为2D或3D网格，其中通过调节致动器110，系统100移动扬声器105来面向2D/3D网格内的点或区域。此外，在一个示例中，摄像头115的定向保持固定，而扬声器105的定向改变成面向点或区域。
[0017]这里所示的活塞致动器110只是合适的致动器的一个示例。致动器110可以使用球窝、螺钉、齿轮系统、链条等来调节扬声器105的方向。另外，致动器110可以使用用于产生运动的任何类型的驱动系统，诸如机械、电气、液压或气动系统。尽管图1图示两个致动器110，但是在其他示例中，扬声器105可以仅由一个致动器110移动。在一个方面，致动器110可能不直接附接到扬声器105。例如，电缆可以用于将由远程致动器110产生的力转移到扬声器105。这样做可能会减少扬声器105的形状因数，并且允许扬声器105适应在空间限制区域，诸如在仪表板或在分离车辆的挡风玻璃和门的支柱。
[0018]摄像头115可以包括一个或多个传感器，其用于基于接收的电磁信号(例如，红外或可见光信号)捕获图像。例如，摄像头115可以包括用于在约390nm至700nm(S卩，可见光)下检测电磁信号的可见光传感器、使用红外投影仪和传感器来捕获3D空间的图像的测距系统，或两者的组合。由摄像头115捕获的信息可以是2D或3D信息。在一个方面，深度(S卩，用户120与摄像头115之间的距离)可以是已知的。例如，音频系统可以被设计用于一个房间，其中用户120坐在距摄像头115和扬声器105预定义的距离的沙发上。因此，仅使用2D信息，音频系统110基于在沙发上的用户120的位置调节扬声器105。或者，深度可能不是已知的，因此，摄像头110捕获3D信息来确定用户120与摄像头115之间的距离。
[0019]使用由摄像头115捕获的信息，音频系统100跟踪用户120在ID、2D或3D空间中的运动。基于用户120的位置(例如，用户的脸部或耳朵的位置)，系统100将用于改变扬声器105的方向的指令提供给致动器110以便优化音频系统100的性能。例如，如果扬声器105面向用户120的耳朵，则可以获得最佳性能。当用户120移动时，致动器110改变扬声器105的方向以继续指向用户的耳朵在3D空间中的位置。
[0020]图2是用于基于面部识别调节扬声器105的系统200的方框图。系统200包括摄像头115、计算设备210和扬声器系统235。摄像头115包括用于收集深度信息的深度传感器205，所述深度信息用于确定摄像头115与用户之间的距离。然而，如上所述，在其他示例中，摄像头115可能不收集深度信息。
[0021]摄像头115耦合到计算设备210，计算设备210包括处理器215和存储器220。计算设备210可以是通用计算设备，诸如膝上型计算机、平板计算机、服务器、台式计算机等，或用于执行本文所描述的方面和示例的专用计算设备。处理器215可以是适合于执行本文所描述的功能的任何处理元件。处理器215可以代表单个处理元件或多个处理元件，其可以各自包括一个或多个处理核心。存储器220可以是易失性或非易失性存储器，其可以包括硬盘、RAM、闪速存储器等。如这里所示，存储器220包括面部识别应用225和致动器控制器230。面部识别应用225接收由摄像头115捕获的2D或3D数据，并且识别在摄像头115前面的区域中的用户。面部识别应用225可以产生一个或多个坐标，其识别用户在2D或3D空间中的位置(例如，用户的脸部的位置)。使用这些坐标，致动器控制器230确定致动器110的相应的控制信号，以便移动扬声器105以优化系统200的性能。例如，如果在扬声器105面向用户的耳朵的情况下性能得到改进，则致动器控制器240确定致使扬声器105面向在用户的耳朵方向上的控制信号。
[0022]在一个方面，致动器控制器230可以包括变换函数或算法，其用于将由面部识别应用225提供的坐标转换成致动器110的控制信号。例如，应用225可以返回一个或多个x、y和z坐标，其识别用户在摄像头115前面的位置。变换函数可以使用x、y和z坐标作为输入，并且输出致动器110的引起扬声器105面向用户的相应的控制信号。可以在配置阶段期间产生变换函数，其中自由空间中的一个或多个点被映射到致动器110的特定设置。这些映射接着可以被一般化以形成变换函数，其可以将

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：C.M.特雷斯坦;B.J.哈姆;
技术所有人：哈曼国际工业有限公司;
我是此专利的发明人