适应于用户位置的音频装置的制作方法

文档序号:17814304发布日期:2019-06-05 21:25阅读:230来源:国知局
适应于用户位置的音频装置的制作方法

根据示例性实施例的装置和方法涉及一种可以处理和输出来自各种源的音频信号以产生声音或向外部装置发送音频信号的音频装置和计算机可读介质,并且更具体地涉及一种允许用户通过用户的语音来控制各种设备而无需直接手动操纵的音频装置和计算机可读介质。



背景技术:

为了根据某些处理来计算和处理信息,电子装置通常包括中央处理单元(cpu)、芯片组、存储器等用于计算的电子组件。这样的电子装置可以根据将在其中处理什么类型的信息而被不同地分类。例如,电子装置可以被分类为:用于处理一般信息的信息处理装置,例如,个人计算机、服务器等;用于处理视频信息的图像处理装置;和用于处理音频信息的音频装置。这些各种电子装置分别作为独立装置来提供,以执行它们自己的预指派的功能。

在电子装置中,音频装置指代能够根据音频处理方法来处理音频信号的装置,并且可以根据音频信号的输入/输出方法以各种形式来实现。例如,就输入方法而言,音频装置可以通过通信模块从外部装置接收音频信号,或者基于通过麦克风从外部环境接收的声音来产生音频信号。就输出方法而言,音频装置可以通过扬声器将处理后的音频信号作为声音输出,或者通过通信模块向外部装置发送处理后的音频信号。

这种音频装置通常作为单个设备来提供特定功能。例如,用户通常使用专门与期望功能(例如,音乐播放、控制其他设备、消息传送等)相对应的音频装置。此外,如果用户想要使用户家中的空间充满从音频装置输出的声音,则家庭影院或类似的系统需要经历设置处理。尽管音频装置可以具有简单的结构或者便于使用,但是音频装置的性能可能达不到用户的期望。例如,由于墙壁和其他结构的放置,家中可能没有开放式内部格局(openfloorplan)并且具有复杂的形状。因此,单个音频装置可能不足以使该空间充满声音。

此外,支持许多功能的音频装置通常具有需要用户物理操纵的按钮、触摸屏或类似接口。当音频装置用于家中或办公室时,这对于用户来说可能是不方便的,因为用户必须接近这样的接口来控制音频装置。

在这方面,期望音频装置允许用户容易地控制其各种复杂功能而无需用户直接接触接口。



技术实现要素:

[技术方案]

根据示例性实施例的一方面,提供了一种音频装置,其包括置于彼此分离的位置处的多个子模块,每个子模块包括被配置为产生声音的扬声器和被配置为执行通信的通信器。所述多个子模块之中的第一子模块包括处理器,所述处理器处理音频信号以通过第一子模块的扬声器输出为声音,确定用户相对于所述多个子模块中的每个子模块的位置,并且根据所确定的用户位置改变从第一子模块的扬声器输出的声音的状态。因此,所述音频装置可以提供优化的环境,以使得无论用户在什么地方都能够收听与用户位置相对应的声音。

所述处理器可以基于所述多个子模块之间的距离来定义与所述多个子模块的位置相对应的区域,并且可以确定用户相对于所定义的区域的位置。因此,所述音频装置基于子模块的布局确定用户的相对位置。

第一子模块还可以包括麦克风,所述麦克风被配置为接收声音输入,并且所述处理器可以基于超声波从第一子模块的扬声器输出、从所述多个子模块之中的第二子模块反射并且被第一子模块的麦克风接收所花费的时间,来确定第一子模块和第二子模块之间的距离。因此,所述音频装置确定子模块之间的距离,以便确定子模块的布局。

所述处理器可以通过第一子模块的通信器,从第二子模块或所述多个子模块之中的第三子模块接收与第二子模块和第三子模块之间的距离有关的信息。因此,获得了不能通过第一子模块直接确定的与两个子模块之间的距离有关的信息,使得第一子模块可以确定由所述多个子模块形成的区域。

所述处理器可以通过在所定义的区域内确定用户相对于搜索多个子模块中的每个子模块的角度来确定用户位置。因此,所述音频装置确定用户相对于子模块的相对位置。

第一子模块可以包括被配置为接收声音的至少两个麦克风,并且所述处理器可以基于分别由所述至少两个麦克风接收的声音之间的相位差来确定用户位置。因此,子模块能够容易地确定用户的相对位置。

所述处理器可以选择音频信号内多个声道中的一个声道,所选择的声道与所确定的用户位置相对应。所述处理器可以控制所选择的声道的音量水平与所述多个声道中的其余声道的音量水平不同。因此,所述音频装置可以在当前用户位置处提供针对用户优化的声音输出环境。

所述处理器可以根据所确定的用户位置来控制通过扬声器输出的声音的音量水平。因此,所述音频装置可以根据当前用户位置提供针对用户优化的声音输出环境。

第一子模块还可以包括:显示器,被配置为显示与音频信号相关的信息;以及麦克风,被配置为接收声音输入。如果所确定的用户位置更靠近第一子模块而不是第二子模块,则所述处理器可以激活显示器和麦克风,并且如果所确定的用户位置更靠近第二子模块而不是第一子模块,则可以使显示器和/或麦克风去激活。因此,所述音频装置可以在当前用户位置处提供针对用户优化的子模块控制环境。

第一子模块还可以包括被配置为从用户接收语音的麦克风。所述处理器可以从可与第一子模块的通信器连接的移动电话取得由语音指定的呼叫接收方的联系人信息,并且可以通过移动电话拨打呼叫接收方。因此,所述音频装置使得用户能够通过子模块根据语音识别方法容易地进行电话呼叫,而无需物理地操纵移动电话。

一种音频装置的非暂时性计算机可读介质,所述音频装置可以具有置于彼此分离的位置处的多个子模块。所述非暂时性计算机可读介质可以存储要由所述多个子模块之中的第一子模块的处理器执行的方法的程序代码。所述方法可以包括:处理音频信号以通过第一子模块的扬声器输出为声音,确定用户相对于所述多个子模块中的每个子模块的位置,并且根据所确定的用户位置改变从第一子模块的扬声器输出的声音的状态。因此,所述音频装置可以提供优化的环境,以使得无论用户在什么地方都能够收听与用户位置相对应的声音。

确定用户相对于所述多个子模块中的每个子模块的位置可以包括:基于所述多个子模块之间的距离来定义与所述多个子模块的位置相对应的区域;以及确定用户相对于所定义的区域的位置。因此,所述音频装置基于子模块的布局确定用户的相对位置。

定义与所述多个子模块的位置相对应的区域可以包括:基于超声波从第一子模块的扬声器输出、从所述多个子模块之中的第二子模块反射并且被第一子模块的麦克风接收所花费的时间,来确定第一子模块和第二子模块之间的距离。因此,所述音频装置确定子模块之间的距离,以便确定子模块的布局。

定义与所述多个子模块的位置相对应的区域可以包括:通过第一子模块的通信器,从第二子模块和/或所述多个子模块之中的第三子模块接收与第二子模块和第三子模块之间的距离有关的信息。因此,获得了不能通过第一子模块直接确定的与两个子模块之间的距离有关的信息,使得第一子模块可以确定由所述多个子模块形成的区域。

确定用户相对于所定义的区域的位置可以包括:通过在所定义的区域内确定用户相对于所述多个子模块中的每个子模块的角度来确定用户位置。因此,所述音频装置确定用户相对于子模块的相对位置。

确定用户相对于每个子模块的角度可以包括:基于分别由第一子模块的至少两个麦克风接收的声音之间的相位差来确定用户位置。因此,子模块能够容易地确定用户的相对位置。

改变输出的声音的状态可以包括:选择音频信号内多个声道中的一个声道,所选择的声道与所确定的用户位置相对应;并且控制所选择的声道的音量水平与所述多个声道中的其余声道的音量水平不同。

因此,所述音频装置可以在当前用户位置处提供针对用户优化的声音输出环境。

改变输出的声音的状态可以包括:根据所确定的用户位置控制声音的音量水平。因此,所述音频装置可以在当前用户位置处提供针对用户优化的声音输出环境。

第一子模块还可以包括:显示器,被配置为显示与音频信号相关的信息;以及麦克风,被配置为接收声音输入。所述方法还可以包括:如果所确定的用户位置更靠近第一子模块而不是第二子模块,则激活显示器和麦克风;并且如果所确定的用户位置更靠近第二子模块而不是第一子模块,则使显示器和/或麦克风去激活。因此,所述音频装置可以在当前用户位置处提供针对用户优化的子模块控制环境。

所述方法还可以包括:与移动电话连接;从移动电话取得由用户通过第一子模块的麦克风输入的语音指定的呼叫接收方的联系人信息;并且通过移动电话拨打呼叫接收方。因此,所述音频装置使得用户能够通过子模块根据语音识别方法容易地进行电话呼叫,而无需直接操纵移动电话。

附图说明

从以下结合附图对示例性实施例的描述中,上述和/或其他方面将变得清楚并且更容易理解,在附图中:

图1示出了根据示例性实施例的处于安装状态的音频装置;

图2是音频装置的子模块的透视图;

图3是用于将子模块安装在安装表面上的结构的透视图;

图4是用于将子模块安装在安装表面上的另一结构的透视图;

图5是子模块中的信号处理元件的框图;

图6是控制音频装置中的子模块的流程图;

图7示出了由多个子模块产生的语音场;

图8示出了通过音频装置中的每个子模块确定语音场内用户位置的处理;

图9示出了音频装置中的子模块根据用户的位置输出立体声声道的声音;

图10示出了音频装置中的子模块根据用户的位置控制各种操作;

图11是示出了音频装置中的子模块的声音再现模式的框图;

图12是由用户操纵的音频装置中的子模块的背框的透视图;

图13是由用户操纵的音频装置中的子模块的前框的透视图;

图14是示出了在从外部装置接收的音频数据的类别之间进行切换的处理的框图;

图15是示出了音频装置中的子模块通过移动电话发送消息的方法的序列图;

图16是示出了音频装置中的子模块通过移动电话进行电话呼叫的方法的序列图;以及

图17示出了音频装置中的子模块通过中枢控制外部设备的处理。

具体实施方式

在下文中,将参考附图详细描述示例性实施例。通过参考在附图中示出的元件对示例性实施例进行以下描述,其中相似的数字指代具有实质相同功能的相似元件。

在示例性实施例的描述中,采用在诸如第一元件、第二元件等术语中使用的序数号来描述各种元件,并且这些术语用于区分一个元件与另一个元件。因此,元件的含义不被这些术语所限制,并且这些术语也仅用于解释对应的实施例,而不限制本发明的构思。

图1示出了根据示例性实施例的处于安装状态的音频装置。

如图1所示,音频装置1可以安装在各种地方(例如,家中),并且执行关于声音的各种任务,例如输入、处理、输出等。音频装置1可以支撑在诸如墙壁的竖直安装表面上,并且在安装状态下向前输出声音。然而,对安装位置没有限制。

与作为单个设备提供的常规音频装置相反,根据示例性实施例的音频装置1可以包括多个子模块100、200和300。多个子模块100、200和300被设置为彼此物理分离的单独设备,并且在各自处理音频信号时彼此协作。

多个子模块100、200和300可以安装在用户期望的任何位置,并且安装表面间隔开预定距离而不是彼此相邻。此外,对可以安装子模块100、200和300的高度没有限制。例如,子模块100、200和300可以安装在与用户头部相对应的高度处,使得用户可以容易地收听从子模块100、200和300输出的声音,并且使得用户的语音可以适当地到达子模块100、200和300。

音频装置1可以包括两个或更多个子模块100、200和300。在图1所示的示例中,三个子模块100、200和300构成用于音频装置1的集合,但是四个或更多个子模块也可以构成一个集合。在这种情况下,子模块100、200和300中的每一个子模块根据本文描述的示例性实施例的原理进行操作。

子模块100、200和300可以在被支撑或安装在安装表面上的同时与用于供电的电缆10连接。此外,子模块100、200和300可以设置有用于供电的内部电池,从而省去电缆10的使用。

可以有许多其他方式向子模块100、200和300中的每一个子模块供电。例如,子模块100、200和300可以各自包括独立的发电模块,或者可以从外部电源无线地接收电力,其中发电模块通过将太阳光或类似能量转换为电来产生电力。在子模块100、200和300使用电池的情况下,电池可以是可再充电的或不可再充电的。可再充电电池可以通过与子模块100、200和300分离的单独充电设备来充电,或者可以利用通过有线或无线方式直接向子模块100、200和300供应的电力来充电。

当被安装时,多个子模块100、200和300可以感测用户的相对位置,并且基于感测的位置分别处理音频信号。也就是说,根据示例性实施例的音频装置1可以包括安装在彼此分离的位置处的多个子模块100、200和300,并且子模块100、200和300中的每一个可以根据用户的位置单独地处理音频信号,从而为用户提供改善的音频处理环境。

以下,将描述子模块100的细节。在音频装置1中,多个子模块100、200和300可以包括相同或实质上相似的元件,因此将在以下示例性实施例中代表性地描述一个子模块100。

图2是音频装置的子模块的透视图。

如图2所示,子模块100的形状类似于具有预定厚度的圆形板,但是子模块100可以具有与图2中所示的形状和厚度不同的形状和厚度。子模块100包括被布置在子模块100背部的背框110和被布置在子模块100前部的前框120。用于操作子模块100的各种元件被容纳在通过将背框110和前框120耦接而形成的子模块100的内部空间中。

背框110可以被成形为盘状,并且由金属或塑料制成。子模块100的用于容纳各种元件的空间可以由背框110形成。背框110的侧面可以具有类似拨盘的结构,使得用户可以旋转背框110的侧壁。

前框120可以适配到背框110的前部,并且覆盖背框110的前部。前框120的要被适配到背框110的侧面可以由金属或塑料制成。另一方面,前框120的盘表面121可以由织物或纺织品制成。稍后将描述前框120可以由织物而不是硬质或不透明材料制成的原因。

前框120的织物表面121可以具有各种颜色。通过仅替换子模块100的前框120,可以向子模块100换入和换出具有用户期望的颜色的前框120。

子模块100可以包括安装在前框120上或前框120内部的显示器130。显示器130可以具有诸如用于显示图像的液晶显示(lcd)面板或用于显示简单文本的不太复杂的显示模块的结构。例如,显示器130可以是以矩阵形式布置的多个发光二极管(led),并且随着每个led接通/关断可以显示预定文本的信息。

在前框120的内部或之上,可以设置扬声器、麦克风等以及显示器130。也就是说,因为前框120由织物制成,因此用户不仅可以识别显示器130上显示的信息,还可以收听从扬声器输出的声音并向麦克风输入用户语音。

显示器130可以置于前框120内部,但是显示器130上显示的信息可以通过由织物或筛眼(screenmesh)制成的前框120对用户可见。也就是说,从显示器130的led发出的光穿过前框120的表面121,使得用户可以观看显示器130上显示的文本信息。当然,显示器130不限于led,并且可以具有各种结构,只要显示器130上显示的信息可以通过前框120对用户可见即可。

类似于背框110,前框120可以具有用户可旋转的拨盘结构。也就是说,子模块100可以具有位于前框120和背框110侧面上的两个拨盘结构。用户可以转动每个拨盘结构以控制子模块100的功能。稍后将描述要由拨盘结构控制的功能。

可以在前框120的边缘处(即,在由织物制成的盘表面121周围)安装指示环123。指示环123可以包括用于产生预定颜色的光的led。指示环123可以控制其发光状态,以指示子模块100的当前状态。

例如,指示环123的led可以在子模块100接通时被激活,并且在子模块100关断时被去激活。此外,指示环123可以在子模块100发出声音时被激活,并且在子模块100不产生任何声音时保持不活动。此外,可以与子模块100是否进入语音识别模式相对应地,选择性地激活或去激活指示环123。

可以在前框120的盘表面121的特定区域中,例如,在织物盘表面121的与显示器130相对应的区域下方,设置切换按钮125。每当用户按下该按钮时,切换按钮125可以在接通状态和关断状态之间交替。

图3是用于将子模块100安装在安装表面上的结构的透视图。

如图3所示,可以提供单独的支撑结构,以便将子模块100支撑在安装表面上。例如,可以将支架20固定到诸如墙壁的安装表面,并且可以将子模块100支撑在支架20上,从而允许支架20将子模块100定位在安装表面上。可以存在将支架20固定到安装表面的多种方法。例如,支架20可以通过螺钉固定到安装表面,或者通过粘合剂粘附到安装表面。

支架20可以包括板21和从板21的表面以预定高度突出的边23。支架20的边23的形状可以与子模块100的背框110相对应,使得子模块100的背框110可以适配到支架20的边23,从而将子模块100支撑在支架20上。在这种状态下,背框110的背面111可以设置成面向支架20的表面21,并且背框110的背面111的圆形边缘沿着支架20的边23布置。

可以在支架20的表面21上的特定区域中设置与电缆10电连接的连接器25。当子模块100附接到支架20时,支架20的连接器25可以电连接到子模块100的连接器113,其中连接器113设置在背框110的背面111上的特定区域中。连接器25和113可以包括对应的电端子(例如,公连接器和母连接器),使得当它们连接时电流可以流经彼此。因此,子模块100在被支撑在支架20上时可以接收电力。

在该示例性实施例中,子模块100可以以使得子模块100的背框110适配到支架20的方式而支撑在支架20上。然而,附接的方式没有限制。备选地,例如,支架20的表面21可以包括磁体。在这种情况下,背框110可以由金属或另一磁体制成,使得背框110可以通过磁力支撑在支架20的表面21上。

换句话说,子模块100支撑在安装表面上并接收电力的结构不限于图3中所示的结构。

图4是用于将子模块安装在安装表面上的另一结构的透视图。

如图4所示,子模块400可以包括诸如背框410的元件。子模块400的基本结构可以实质上等同于根据前述示例性实施例的子模块100,因此将避免其重复描述。

该示例性实施例中的子模块400与前述示例性实施例的子模块100的不同之处在于用于安装到安装表面上的结构。具体地,子模块400具有从背框410的下侧突出并具有预定形状的子框架420。电插头430从子框架420的背部突出。当电插头430连接到外部电源的插座(例如,用于交流电(ac)的墙壁插座)时,子模块400可以将其自身牢固地附接在安装表面上以及从外部电源接收电力。

下面,将描述用于处理音频信号的子模块的元件。

图5是子模块中的信号处理元件的框图。

如图5所示,子模块100可以包括显示器130、用于产生声音的扬声器140、用于接收语音输入的麦克风150、用于发送和接收信号的通信器160、用于在其中存储数据的存储装置170和用于根据预定处理来处理信号或数据的信号处理器180。子模块100的这些元件可以通过系统总线彼此访问,因此它们可以彼此协作。在它们之中,通信器160、存储装置170和信号处理器180可以分开设置,或者它们中的至少两个可以集成为片上系统(soc)。

显示器130可以通过在印刷电路板上以矩阵形式布置多个led来实现,并且通过接通/关断每个led来显示简单的文本信息。显示器130可以包括多个led和印刷电路板,在印刷电路板上印刷有用于供电的电线。

扬声器140可以基于由信号处理器180处理的音频信号来产生声音。扬声器140可以根据所支持的声道而包括与音频信号的声道相对应的单元扬声器。例如,扬声器140可以包括左单元扬声器和右单元扬声器这两个扬声器以支持立体声声道,或者可以包括分别与左声道、右声道和中央声道相对应的三个单元扬声器。

除了产生声音之外,扬声器140还可以发射超声波,用于感测子模块和预定对象之间的距离。从扬声器140输出的超声波与特定对象碰撞,并且由该碰撞引起的反射波由麦克风150收集,从而确定子模块100与对象之间的距离。稍后将描述该原理的使用。

麦克风150可以收集在子模块100外部产生的声音,并且将它们转换为音频信号。音频信号可以发送到信号处理器180。例如,麦克风150可以接收用户的语音,并且产生与语音相对应的音频信号。当然,麦克风150可收集的声音不限于用户的语音。备选地,可以收集由另一子模块产生的声音。

麦克风150不仅可以收集与用户的可听范围相对应的声音,还可以收集超声波的反射波。此外,麦克风150可以支持波束成形。为此,可以在子模块100中设置至少两个单元麦克风150。支持波束成形功能的麦克风150用于确定用户相对于子模块100的相对位置,其细节将在后面描述。

通信器160可以被设置为安装在印刷电路板上的通信模块芯片组。为了便于将子模块100容易地附接到安装表面,通信器160可以支持无线通信协议,例如,无线保真(wi-fi)、wi-fi直连、蓝牙等。根据无线通信协议,通信器160不仅可以与诸如电视、移动设备、物联网中枢、接入点等电子装置通信,还可以与其他子模块通信。特别地,通信器160可以支持先前被批准用于与音频装置的其他子模块通信的协议。

存储装置170可以存储由信号处理器180处理的数据。存储装置170可以包括闪存、硬盘驱动器、固态驱动器或类似的非易失性存储器。为了使子模块100轻量化和小型化,可以通过闪存来实现存储装置170。存储装置170可以存储要被执行以进行信号处理器180的计算和操作的操作系统、驱动器、固件、应用和类似的数据。此外,存储装置170还可以包括随机存取存储器(ram)或类似的易失性存储器,使得数据可以由信号处理器180执行。

信号处理器180可以通过诸如安装在印刷电路板上的芯片组、中央处理单元(cpu)、微控制器或片上系统(soc)之类的硬件电路来实现。从根本上讲,除了处理音频信号之外,信号处理器180还可以执行用于操作子模块100的各种处理,例如设置另一子模块的相对位置、设置用户的当前位置、控制显示器130等。当存储装置170的非易失性存储器中存储的数据被加载到存储装置的易失性存储器上并且信号处理器180执行所加载的数据时,可以执行这样的处理。

下面,将简要描述在信号处理器180的处理之中向扬声器140输出音频信号的处理的元件。下面要描述的元件涉及向扬声器140输出音频信号的处理,但是信号处理器180还可以包括用于执行其他处理的附加元件。

信号处理器180可以包括用于输出音频信号的数字信号的数字信号提供器181、用于基于从数字信号提供器181输出的数字信号输出脉冲宽度调制(pwm)信号的pwm处理器182和用于放大来自pwm处理器182的pwm信号的放大器183。

数字信号提供器181将输入音频信号调制成脉冲编码的数字信号。为此,数字信号提供器181包括数字信号处理(dsp)芯片、运动图像专家组(mpeg)转换器集成电路(ic)等。

pwm处理器182将从数字信号提供器181输出并具有小幅度的脉冲编码调制信号转换为低功率pwm信号。

放大器183采用开关电路的半导体开关器件(例如,场效应晶体管(fet)),以将从pwm处理器182输出的低功率pwm信号放大为高功率pwm信号。例如,放大器183可以将大约3.3v的低功率pwm信号接收成大约5v至40v的高功率pwm信号。放大器183对放大后的高功率pwm信号应用低通滤波,并且将滤波后的信号输出到扬声器140。

放大器183包括与音频信号的声道数量相对应的lc滤波器和放大电路。放大电路是用于放大输入音频信号的元件,并且利用fet。lc滤波器(也称为谐振电路)是用于对特定频带的信号进行滤波的元件,并且使用电感器和电容器。

pwm处理器182向放大器183的每个放大电路发送pwm信号。每个放大电路放大从pwm处理器182单独发送的pwm信号,并且每个lc滤波器针对特定频带对放大后的pwm信号进行滤波,从而解调pwm信号并将解调后的信号输出到扬声器140。扬声器140发出与音频信号的声道相对应的声音。

利用该结构,将描述根据示例性实施例的音频装置1中的子模块100的处理操作。

图6是控制音频装置中的子模块的流程图。

如图6所示,在操作s110处,接通子模块的系统电源。

在操作s120处,子模块确定是否预先存储了语音场或声场的设置信息。稍后将描述语音场的细节。

如果预先存储了语音场的设置信息,则在操作s130处,子模块获得语音场的设置信息。

另一方面,如果没有预先存储语音场的设置信息,则在操作s140处,子模块确定音频装置中的其他子模块的相对位置。这里,各个子模块可以彼此共享它们关于位置的确定信息。

在操作s150处,子模块基于与所确定的和共享的位置有关的信息来设置音频装置中的子模块的语音场。

在操作s160处,子模块存储所获得的关于语音场的设置信息。

当获得了关于语音场的设置信息时,在操作s170处,子模块确定用户在语音场中相对于子模块的当前位置。

在操作s180处,子模块根据用户的当前位置调整由扬声器产生的声音的输出水平。

因此,音频装置可以通过多个子模块形成语音场,使得每个子模块可以根据用户的当前位置调整声音输出状态。即使当用户在语音场内连续移动时,也可以实时地与用户的当前位置相对应地调整每个子模块的声音输出。因此,根据示例性实施例的音频装置提供针对用户优化的声音环境。

语音场是由音频装置中的多个子模块形成的区域(即,子模块的声音输入/输出范围中的范围或范围的组合)。在三个子模块构成一组音频装置的情况下,各个子模块可以被布置为形成三角形形状,并且语音场可以表示三角形内部的区域。

实际上,子模块的声音输入/输出将到达的范围不仅是三角形形状内部的区域,而且是围绕三角形的更大区域。然而,难以测量子模块的声音输入/输出将到达的精确范围,因此,可能难以清楚地界定这样的范围。因此,为方便起见,在该说明中将把三角形内部的区域视为语音场。

下面,将描述通过子模块设置(即,确定)语音场的方法。

图7示出了由音频装置1经由多个子模块100、200和300所确定的语音场。

如图7所示,音频装置1可以包括三个子模块100、200和300。语音场500可以包括由连接子模块100、200和300的线形成的三角形区域。为了确定语音场500,必须确定各条直线的长度(即,三个子模块100、200和300之间的距离)。一旦获得了三个距离,则可以确定包括由与所获得的距离相对应的边形成的三角形区域在内的语音场500。子模块100、200和300分别置于语音场500的顶点处。

可以存在计算多个子模块100、200和300之间的距离的许多不同的方法。例如,可以使用超声波测量距离。子模块100、200和300的每个扬声器不仅可以产生具有16hz至20,000hz的可听频率的声音,还可以产生频率高于20khz的超声波。

例如,第一子模块100包括脉冲发生器,以基于逆压电效应产生和发射超声波。第一子模块100在短时间内向压电器件交替地施加正电压和负电压,使得压电器件可以在变形和恢复之间交替。由压电器件的变形和恢复之间的交替产生的振动能量被转换成超声波,并且从第一子模块100发射。

当来自第一子模块100的超声波到达第二子模块200时,超声波从第二子模块200反射并被第二子模块200折射。反射波从第二子模块200传播到第一子模块100。

当第一子模块100接收到反射波时,第一子模块100的振动器基于压电现象通过反射波产生电压。通过电压表测量所产生的电压。

根据相同的原理,第一子模块100发送超声波并接收反射波。这里,第一子模块100通过测量超声波的发送和接收之间所经过的时间(即,从发送超声波的时刻到超声波从第二子模块200返回的时刻所经过的时间),来测量第一子模块100和第二子模块200之间的距离。

根据相同的原理,还可以计算第一子模块100和第三子模块300之间的距离以及第二子模块200和第三子模块300之间的距离。因为第一子模块100、第二子模块200和第三子模块300可以彼此通信,因此可以通过交换它们计算的距离信息在三个子模块100、200和300之间共享三个距离参数。例如,第二子模块200可以计算第二子模块200和第三子模块300之间的距离,并且向第一子模块100和/或第三子模块300发送该信息。

因此,子模块100、200和300中的每一个确定语音场500的范围,并且确定在语音场500内子模块100、200和300的相应位置。

下面,将描述在如上所述确定和设置的语音场500内确定用户位置的方法。

图8示出了通过音频装置1中的子模块100、200和300中的每一个确定用户在语音场内的位置的处理。

如图8所示,音频装置1可以包括三个子模块100、200和300,并且语音场500可以由连接子模块100、200和300的线510、520和530限定。

如果用户u在特定时间点位于语音场500上的特定位置,则存在许多方式来确定用户u相对于子模块100、200和300中的每一个的相对位置。例如,可以测量用户u与子模块100、200和300中的每一个之间的距离。备选地,可以测量用户u与子模块100、200和300中的每一个之间的角度。

在后一种情况下,用户u与子模块100、200和300之间的相对角度可以以各种形式表示。例如,可以相对于语音场500的边给出相对角度。第一子模块100与用户u之间的角度可以相对于语音场500的边510被给定为“d1”,第二子模块200与用户u之间的角度可以相对于语音场500的边520被给定为“d2”,并且第三子模块300与用户u之间的角度可以相对于语音场500的边530被给定为“d3”。然而,这些相对角度仅是示例,并且对角度的表示没有限制。

可以存在许多方法来测量用户u与子模块100、200和300之间的相对角度。例如,根据波束成形技术,可以通过使用全向麦克风来感测声音来自的方向。一个麦克风可能不足以利用波束成形技术,并且可能需要至少两个麦克风来分别计算分别接收的声音之间的相位差。也就是说,子模块100、200和300中的每一个可以各自包括至少两个麦克风。

具体地,如果子模块100、200和300中的每一个正在输出其自身的声音,则第一子模块100可以通过麦克风收集所输出的声音。第一子模块100可以接收与从第二子模块200输出的音频信号和从第三子模块300输出的音频信号有关的信息。

第一子模块100可以分析通过从麦克风中接收的声音的音频信号中去除子模块100、200和300的相应音频信号而获得的波形,从而确定相对于用户u的位置的相对角度d1。对波形的分析可以通过各种方法实现,例如与预定轮廓的比较、波形幅度与已知阈值之间的比较。

同样地,第二子模块200和第三子模块300可以基于前述原理计算角度d2和d3。通过这种方法,子模块100、200和300可以确定用户u的相对位置,并且基于所确定的位置控制它们各自的声音输出状态。

当子模块100、200和300中的每一个根据用户u的相对位置控制声音输出状态时所使用的声音输出状态的种类可以存在各种示例。

图9示出了音频装置1中的子模块100、200和300根据用户的位置输出立体声声道的声音。

如图9所示,如果用户u处于由多个子模块100、200和300形成的语音场500内的当前位置550处,则子模块100、200和300可以根据当前位置550控制它们的声音的输出状态。例如,如果子模块100、200和300中的每一个输出与左声道、中央声道和右声道相对应的音频信号的声音,则子模块100、200和300可以根据用户u的当前位置550在音频信号的主输出声道方面彼此不同。这里,主输出声道可以表示声道是排他性输出的,或者声道具有比其他声道高的音量水平。

如果确定用户u的当前位置550最靠近多个子模块100、200和300中的第二子模块200,则在输出声音时,第二子模块200可以相对强调中央声道的声音,并且第一子模块100和第三子模块300可以分别强调左声道和右声道的声音。这里,第一子模块100和第三子模块300可以以在左声道的声音和右声道的声音之间基本相同的强调量来输出左声道的声音和右声道的声音。

如果用户u已经从先前位置540移动到当前位置550,则分析可以揭示用户u可能当前正面向第二子模块200,并且正观察在他左边的第一子模块100和在他右边的第三子模块300。在这方面,第二子模块200可以强调输出中央声道的声音,而第一子模块100强调输出左声道的声音,第三子模块300强调输出右声道的声音。简而言之,音频装置1可以基于用户的移动历史来确定用户u的当前位置和/或定向,并且允许基于所确定的位置和/或定向调整从子模块100、200和300中的每一个输出的声音的声道。用户u的这种移动历史可以存储在子模块100、200和300中的每一个中。

以这种方式,音频装置1中的子模块100、200和300中的每一个根据用户u的当前位置550控制声音的输出状态。

在该实施例中,子模块100、200和300中的每一个根据用户u的位置控制声音的输出状态,但是本公开不限于此。例如,子模块100、200和300中的每一个可以根据音频装置1的设计来控制各种操作模式以及声音的输出状态。

图10示出了音频装置1中的子模块100、200和300分别根据用户的位置控制它们的各种操作模式。

如图10所示,在由多个子模块100、200和300形成的语音场500内,与第二子模块200或第三子模块300相比,用户u的当前位置更靠近第一子模块100。

在这种情况下,第一子模块100可以调高输出声音的音量水平,因为用户u相对靠近第一子模块100。另一方面,第二子模块200和第三子模块300可以调低输出声音的音量水平,因为用户u相对远离它们。

然而,当用户u更靠近对应的子模块时,不一定要调高声音的音量水平。例如,可以反向控制音频音量。也就是说,第一子模块100可以调低声音的音量,而第二子模块200和第三子模块300可以调高它们各自的声音音量。

如果用户u相对靠近第一子模块100,则用户u可能查看或控制第一子模块100而不是第二子模块200和第三子模块300。在这方面,第一子模块100可以接通或调亮led,并且第二子模块200和第三子模块300关断或调暗led。这里,led表示子模块100、200和300的相应的指示环或显示器。

此外,当用户u接近第一子模块100时,第一子模块100可以接通或调高麦克风,并且第二子模块200和第三子模块300可以关断或调低麦克风。

如这些示例中所示,音频装置1可以根据用户u相对于子模块100、200和300中的每一个的相对位置来控制子模块100、200和300的各种操作模式。

下面,将描述子模块100、200和300的这些操作模式中的一些。

图11是示出了音频装置1中的子模块100的声音再现模式的框图。

如图11所示,子模块100响应于特定事件而进入声音再现模式(即,声音回放模式)。例如,在操作s210处,可以通过麦克风150将预定义命令输入到子模块100,并且子模块100可以在声音再现模式下操作。

在操作s220处,通信器160可以按每单位时间从外部装置(例如,移动电话、平板计算机、台式计算机等)接收具有预定数据量的音频数据,并且向信号处理器180发送音频数据。通信器160按每单位时间接收的音频数据量可以根据各种因素(例如,通信器160支持的通信协议、存储装置170的容量、信号处理器180的处理能力等)而变化。

在操作s230处,信号处理器180可以将来自通信器160的音频数据缓冲(即,临时存储)在存储装置170中。音频数据可以直接从通信器160缓冲到存储装置170,而不通过信号处理器180。

在操作s240处,信号处理器180可以获得缓冲在存储装置170中的音频数据,并且在操作s250处,可以处理所获得的音频数据。例如,对音频数据的处理可以包括从音频数据中提取元数据、解码音频数据、对解码后的音频数据进行放大和音量控制等。在该处理中,信号处理器180可以如上所述的根据用户的位置来调整声音的输出状态。

在操作s260处,信号处理器180可以将处理后的音频数据输出到扬声器140。

此外,在操作s270处,信号处理器180可以在显示器130上显示元信息(即,元数据)。元信息可以包括各种类型的与音频数据有关的信息。例如,如果音频数据表示歌曲,则元信息可以包括标题、艺术家、发行日期、包括歌曲列表的专辑信息等。

这里,信号处理器180可以根据预定条件选择性地处理要显示的元信息。例如,可以在子模块100的语音识别模式被激活时显示元信息,但是可以在子模块100的语音识别模式被去激活时不显示元信息。

因此,如果子模块100在声音再现模式下输出声音,则子模块100可以提供两种接口以允许用户控制声音的输出状态。例如,可以在子模块100的语音识别模式被去激活时提供第一用户接口,并且第一用户接口可以使得用户能够通过直接操纵设置在子模块100中的拨盘来控制子模块100。另外,可以在子模块100的语音识别模式被激活时提供第二用户接口,并且第二用户接口可以使得用户能够通过用户的语音来控制子模块100。

下面,将描述用户对子模块100的语音识别模式的操纵。

图12是音频装置中的子模块100的背框110的透视图。

如图12所示,子模块100可以包括背框110、前框120、用户通过前框120的表面121可识别的显示器130和设置在前框120的表面121上的靠下部分中的切换按钮125。

切换按钮125可以由用户切换,以使子模块100的语音识别模式激活或去激活。如果语音识别模式通过切换按钮125被去激活,则用户可以通过直接转动子模块100的具有拨盘结构的背框110或前框120来执行操纵。

当用户转动背框110时,子模块100可以例如控制输出声音的音量。此外,子模块100可以在控制声音音量的同时显示关于受控音量的信息。

子模块100响应于转动背框110或前框120的用户操纵的操作可以与子模块100的语音识别模式的激活相关联地执行,或者与子模块100的语音识别模式的激活无关地执行。

在前一种情况下,当语音识别模式被激活时,子模块100响应于背框110或前框120的旋转而操作,但是当语音识别模式被去激活时,不响应于背框110或前框120的旋转而操作。在后一种情况下,子模块100响应于背框110或前框120的旋转而操作,而不管语音识别模式是否激活。

图13是由用户操纵的音频装置中的子模块100的前框120的透视图。

如图13所示,响应于用户转动前框120,子模块100可以在当前正在再现的音频数据的类别或声道之间切换。例如,子模块100可以将当前再现的音频数据的第一类别切换为第二类别,并且再现第二类别的音频数据。例如,如果多个音频数据文件属于第二类别,则可以按预定顺序选择音频数据文件。

如果多个音频数据文件属于第二类别,则存在各种方式来选择要切换和再现的文件。一个示例是:当第二类别的音频数据文件根据各种参数以预定顺序被排序时,总是选择第一文件。这里,如果音频数据与音乐相关,则参数可以例如包括文件名、文件修改时间、文件产生时间或艺术家姓名。

另一示例是:当第二类别的音频数据文件以预定顺序被排序时选择最后再现的(即,最后播放的)文件。在这种情况下,子模块100必须存储和访问使用历史。使用历史可以存储在子模块100中,或者存储在子模块100从其接收音频数据的外部装置中。

下面,将描述切换音频数据文件的类别的原理。

图14是示出了在从外部装置30接收的音频数据的类别之间进行切换的处理的框图。

如图14所示,外部装置30可以根据多个类别存储音频数据文件。子模块100可以与外部装置30通信,并且在声音再现模式下从外部装置30接收音频数据文件。

在操作s310处,子模块100可以接收用于声音再现的用户指令。

在操作s320处,子模块100可以访问使用历史610(即,回放历史),并且向外部装置30发送对由使用历史610指示的类别a的文件a01的请求。使用历史610可以存储在子模块100、外部装置30或另一单独的装置中。

在操作s330处,外部装置30可以响应于来自子模块100的请求,将多个先前存储的类别之中类别a的文件a01发送到子模块100。因此,子模块100可以再现类别a的文件a01。

在该实施例中,子模块100向外部装置30发送对一个文件的请求,并且外部装置30将与该请求相对应的所述一个文件发送到子模块100。然而,本公开不限于这种1∶1对应。备选地,1∶n对应、n∶1对应、n∶n对应等也是可行的。这里,n是正整数。例如,当子模块100请求类别a的文件a01时,外部装置30可以根据1∶n对应将文件a01与类别a内的预定数量的后续文件一起发送到子模块100。

在操作s340处,子模块100可以接收用于将当前类别从a切换到b的用户指令。可以如以上参考图13所述执行这种切换指令。

在操作s350处,子模块100调用使用历史610,检查类别b内的音频数据文件之中最后再现的文件b02,并且向外部装置30请求类别b的文件b02。

在操作s360处,外部装置30可以响应于来自子模块100的请求,选择类别b而不是类别a,并且向子模块100发送类别b的文件b02。

因此,子模块100可以再现文件b02。

此外,在语音识别模式被激活时,子模块100可以识别通过麦克风输入的用户语音,并且因此基于与识别的语音相对应的命令进行操作。在语音识别模式下,子模块100可以识别用户语音,并因此能够支持比使用更受限的输入方法(例如,操纵拨盘)时更复杂或特定的各种功能。在语音识别模式下,子模块100支持的功能可以包括使用移动电话进行电话呼叫、通过中枢控制另一设备等。

下面,将描述子模块100访问移动电话并向另一移动电话发送消息的示例性实施例。

图15是示出了音频装置1中的子模块100通过移动电话700发送消息的方法的序列图。

如图15所示,在操作s410处,子模块100可以执行配对以与移动电话700通信。

在操作s420处,子模块100可以从用户u接收消息发送准备指令。消息发送准备指令可以通过用户u的语音输入到子模块100,并且可以包括用于指定消息将被发送到的目标的信息。例如,该信息可以包括与登记到移动电话700的电话号码相对应地存储的姓名、昵称等。

在操作s430处,子模块100可以从移动电话700获取由消息发送准备指令指定的目标的联系人信息。例如,子模块100获取移动电话700中存储的人的电话号码,并且从电话号码之中取得由消息发送准备指令指定的目标的电话号码。

在操作s440处,子模块100可以显示所获取的联系人信息。因此,用户可以确认子模块100是否正确地识别了由消息发送准备指令指定的目标。

在操作s450处,子模块100可以从用户u接收消息输入。消息输入用于接收要被发送到由消息发送准备指令指定的电话号码的消息的内容。在该实施例中,基于用户u的语音,经由语音识别将消息输入到子模块100。

在操作s460处,子模块100可以向移动电话700发送消息。

在操作s470处,移动电话700可以向对应的电话号码发送所接收的消息。该消息可以经由例如短消息服务(sms)、即时消息、电子邮件等发送。

因此,子模块100可以经由移动电话700发送基于用户语音输入的消息。

下面,将描述子模块100访问移动电话并向另一移动电话发送消息的实施例。

图16是示出了音频装置1中的子模块100通过移动电话进行电话呼叫的方法的序列图。

如图16所示,在操作s510处,子模块100可以执行与移动电话700的配对。

在操作s520处,子模块100可以从用户u接收目标选择指令。目标选择指令包括用于指定子模块100通过移动电话700向其进行电话呼叫的目标的信息。目标选择指令可以通过用户u的语音输入到子模块100。

在操作s530处,子模块100可以获取由目标选择指令指定的目标的联系人信息,并且在操作s540处,子模块100可以显示所获取的信息。

如果在操作s550处用户u确认所显示的信息,则在操作s560处,子模块100可以向移动电话700发送针对目标的拨号指令。

在操作s570处,移动电话700可以响应于拨号指令开始针对目标进行拨号。在操作s570期间,子模块100可以显示正在执行拨号的消息。

如果在操作s580处移动电话700与目标联络上,则移动电话可以从目标移动电话接收音频信号并将音频信号发送到子模块100,从而通过子模块100的扬声器输出音频信号的声音。此外,在操作s590处,移动电话700可以向目标移动电话发送从子模块100接收的音频信号。

因此,子模块100可以响应于用户u的语音指令,通过移动电话700对另一移动电话进行电话呼叫。

下面,将描述子模块100通过基于物联网(iot)的中枢控制另一外部设备的示例性实施例。

图17示出了音频装置1中的子模块100通过中枢710控制外部设备720的处理。

如图17所示,子模块100可以设置为通过中枢710控制外部设备720。中枢710可以将子模块100、外部设备720和其他设备(例如,基于通用协议在相同网络中发现的设备)进行分组。

这里,通用协议如下。为了对网络中的多个“物”(即,电子设备)进行分组,需要物不仅能够彼此通信,还能够识别和处理它们之间交换的命令。为此,网络内的物需要在通用或兼容的应用或平台上操作。例如,在特定平台上操作的发送侧的物可以通过中枢向接收侧的物发送信号。在这种情况下,如果接收侧的物在与发送侧的物公用的平台上操作,则其可以识别和处理接收的信号。同样地,如果多个物在通用或兼容的应用或平台上操作,则相应的物被视为好像它们基于通用协议进行操作。

物可以包括:电视;能够显示图像的电子相框和类似的显示装置;能够在不直接显示图像的情况下处理视频信号的机顶盒和类似的图像处理装置;家用电器,例如洗衣机、冰箱、空调等;办公设备,例如打印机、复印机、扫描仪等;以及其他设备,例如灯泡、电加热器等。此外,物可以包括安装有传感器的各种可穿戴设备或移动设备。

例如,外部设备720可以是热水器,并且用户可以设置热水器的温度。在这种情况下,例如,如果用户可以发出语音命令“将温度设置为70度”,则子模块100可以识别和分析用户的语音。根据分析结果,子模块100可以基于用户的语音推断出目标和指令。在该示例中,子模块100可以根据用户的语音推断出目标是外部设备720(即,热水器),并且指令是将温度设置为70摄氏度。

子模块100可以通过中枢710向外部设备720发出命令,以将温度调整到70度。

外部设备720可以通过中枢710解译从子模块100接收的命令,并且响应于该命令将温度调整到70度。然后,外部设备720可以通过中枢710向子模块100发送指示该指令已被成功执行的响应。

子模块100可以基于从外部设备720接收的响应显示指示温度被设置为70度的消息630。

因此,子模块100可以以上述方式基于物联网(iot)技术来控制外部设备720的操作。

根据上述示例性实施例的方法可以以能够在各种计算机中执行并记录在计算机可读介质中的程序命令或指令的形式来实现。这样的计算机可读介质可以包括程序命令、数据文件、数据结构等或其组合。例如,计算机可读介质可以是非易失性存储装置(例如,只读存储器(rom)等),而不管存储装置是可擦除的还是可重写的。例如,计算机可读介质可以是ram、存储器芯片、类似器件或集成电路(ic)的存储器、光学或磁性可记录或机器可读存储介质(例如,光盘(cd)、数字通用盘(dvd)、磁盘、硬盘驱动器、固态驱动器、磁带等)。应当理解,可以包括在移动终端中的存储器是适于存储具有用于实现示例性实施例的指令的程序的机器可读存储介质的示例。记录在该存储介质中的程序命令可以根据示例性实施例被具体设计和配置,或者可以是计算机软件领域的技术人员公知的和可用的。

尽管已经示出并描述了几个示例性实施例,但是本领域技术人员应当认识到:在不脱离本发明原理和精神的前提下可以在这些示例性实施例中进行修改,本发明的范围由所附权利要求及其等同物限定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1