语音采集设备的制作方法

文档序号:16860887发布日期:2019-02-15 19:48阅读:158来源:国知局
语音采集设备的制作方法

本申请实施例涉及电子设备技术领域,尤其涉及一种语音采集设备。



背景技术:

目前,越来越多的电子设备具有语音采集功能,比如智能音箱、机器人等,通过对采集获取的语音信号进行语音识别,可以实现语音交互等操作。

但是在对用户发出的语音信号进行拾取的同时,通常也会拾取到外界噪音,导致获得的语音信号比较混乱,如果噪音干扰较大则将无法从中准确识别获得用户语音。



技术实现要素:

本申请实施例提供一种语音采集设备,用以解决现有技术中语音信号中噪音干扰较大的技术问题。

第一方面,本申请实施例中提供了一种语音采集设备,包括处理组件、以及分别与所述处理组件连接的检测组件及能够绕中心轴转动的至少一个麦克风;

所述检测组件用于监测进入语音采集设备感应范围内的目标对象,生成感应信号;

所述处理组件用于基于所述感应信号,获得所述目标对象的第一方位;确定拾音方向与所述第一方位相匹配的第一麦克风,并切换所述第一麦克风至启动状态,以采集所述目标对象的语音信号;基于所述感应信号,确定所述目标对象的对象方位发生变化时,控制所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号。

可选地,还包括安装所述至少一个麦克风的转动机构,所述转动机构绕中心轴转动;

所述处理组件具体是基于所述感应信号,确定所述目标对象的对象方位发生变化时,控制所述转动机构转动而带动所述第一麦克风跟随所述目标对象的方位变化而转动。

可选地,还包括与所述转动机构连接的驱动机构;

所述处理组件具体基于所述感应信号,确定所述目标对象的对象方位发生变化时生成驱动指令;发送所述驱动指令至所述驱动机构;

所述驱动机构用于响应所述驱动指令,控制所述转动机构转动以带动所述第一麦克风跟随所述目标对象的方位变化而转动。

可选地,所述至少一个麦克风构成至少一个麦克风阵列;所述转动机构包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中;所述驱动机构包括与每一个转动子机构连接的驱动子机构;

所述处理组件具体将所述驱动指令发送至所述第一麦克风所在第一麦克风阵列对应的第一驱动子机构;

所述第一驱动子机构具体响应所述驱动指令,控制所述第一麦克风阵列对应的第一转动子机构跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

可选地,还包括配置在每个麦克风输入端的声音过滤器;

每个麦克风用于采集经由各自对应的声音过滤器过滤之后的语音信号。

可选地,所述检测组件包括红外传感器、视觉传感器以及激光传感器中的一个或多个。

可选地,还包括与每个麦克风连接的控制开关;

所述处理组件具体是启动所述第一麦克风对应的第一控制开关,切换所述第一麦克风至启动状态,以采集所述目标对象的语音信号。

可选地,还包括与每个麦克风连接的用于调整俯仰角度的调节机构;

所述处理组件还用于基于所述感应信号确定所述目标对象的对象高度;基于所述对象高度生成调节指令;发送所述调节指令至所述第一麦克风对应的第一调节机构;

所述第一调节机构响应所述调节指令,调整所述第一麦克风的俯仰角度。

可选地,每个麦克风阵列包括多个麦克风时,所述多个麦克风环形分布在对应的转动子机构中。

可选地,每一个转动子机构包括中心齿轮以及至少一个连接臂;所述中心齿轮具有中心轴;每一个连接臂的第一端与中心齿轮连接以及第二端设置一麦克风;其中,每一个驱动子机构与其对应转动子机构中的中心齿轮连接;

所述第一驱动子机构具体响应所述驱动指令,控制所述第一转动机构中的中心齿轮跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

可选地,所述设备具体包括多个麦克风;

所述检测组件还用于如果监测所述感应范围内存在多个目标对象,生成相应的多个感应信号;

所述处理组件还用于基于所述多个感应信号,获得所述多个目标对象的第一方位;确定拾音方向与所述多个目标对象的第一方位一一对应的多个第一麦克风;切换所述多个第一麦克风至启动状态,以分别采集各自对应的目标对象的语音信号。

本申请实施例中,语音采集设备配置有分别与处理组件连接检测组件以及能够绕中心轴转动的至少一个麦克风,检测组件监测进入语音采集设备感应范围内的目标对象,生成感应信号;处理组件基于感应信号,可以获得所述目标对象的第一方位;确定拾音方向与所述第一方位相匹配的第一麦克风,并切换所述第一麦克风至启动状态,以采集所述目标对象的语音信号;基于所述感应信号,确定所述目标对象的对象方位发生变化时,控制所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号;在感应范围内存在多个目标对象时,还可以分别获得所述多个目标对象的第一方位,并确定拾音方向与所述多个目标对象的第一方位一一对应的多个第一麦克风;切换所述多个第一麦克风至启动状态,以分别采集各自对应的目标对象的语音信号。本申请实施例采用拾音方向与目标对象的方位相对的第一麦克风进行语音采集,使得第一麦克风的拾音方向可以对准声源方向,能够采集获得较大音量的目标语音,从而可以降低环境噪音对语音信号的干扰,且目标对象的方位发生变化时,可以控制对应的麦克风追踪目标对象,以保持对象方位与拾音方向的一致性,通过本申请实施例的语音采集设备可以有效降低语音信号中的噪音干扰,此外,通过采用一个麦克风采集一个目标对象的语音信号,还可以同时实现对多个目标对象的语音信号的采集,保证存在多个目标对象的情况下可以精确采集获得每个目标对象有效的语音信号,降低噪音干扰。

本申请的这些方面或其他方面在以下实施例的描述中会更加简明易懂。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1示出了本申请提供的一种语音采集设备一个实施例的结构示意图;

图2示出了本申请提供的一种语音采集设备又一个实施例的结构示意图;

图3a示出了本申请实施例在一个实际应用中语音采集设备的部分结构示意图;

图3b示出了本申请实施例在一个实际应用中语音采集设备的部分结构示意图;

图4示出了本申请提供的一种语音采集方法一个实施例的流程图;

图5示出了本申请提供的一种语音采集方法又一个实施例的流程图;

图6示出了本申请提供的一种语音采集方法又一个实施例的流程图;

图7示出了本申请提供的一种语音采集装置一个实施例的结构示意图;

图8示出了本申请提供的一种语音采集装置又一个实施例的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。

在本申请的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。

本申请的技术方案应用于语音采集场景中,目前诸如智能音箱、机器人等电子设备中均具有语音采集功能,用来采集用户的语音信号,并利用采集获得的语音信号实现语音交互等操作。

然而,如果采集环境中噪音较大或者干扰源较多等情况下,采集的语音信号中就会包括噪音,如果噪音较大就会导致无法准确识别获得用户语音。

为了降低采集获得的语音信号中的噪音,发明人经过一系列研究提出了本申请的技术方案,在本申请实施例中,语音采集设备配置有分别与处理组件连接检测组件以及至少一个麦克风,通过监测进入语音采集设备感应范围内的目标对象,可以获得目标对象的第一方位;确定拾音方向与所述第一方位相匹配的第一麦克风,并切换所述第一麦克风至启动状态,以采集所述目标对象的语音信号。在感应范围内存在多个目标对象时,还可以分别获得所述多个目标对象的第一方位,并确定拾音方向与所述多个目标对象的第一方位一一对应的多个第一麦克风;切换所述多个第一麦克风至启动状态,以分别采集各自对应的目标对象的语音信号。本申请实施例采用拾音方向与目标对象的方位相对的第一麦克风进行语音采集,使得第一麦克风的拾音方向可以对准声源方向,能够采集获得较大音量的目标语音,从而可以降低环境噪音对语音信号的干扰,在需要进行语音识别时,可以提高语音识别的准确度。且目标对象的方位发生变化时,可以控制对应的麦克风追踪目标对象,以保持对象方位与拾音方向的一致性,通过本申请实施例的语音采集设备可以有效降低语音信号中的噪音干扰。此外,通过采用一个麦克风采集一个目标对象的语音信号,还可以同时实现对多个目标对象的语音信号的采集,保证存在多个目标对象的情况下精确采集获得每个目标对象有效的语音信号,降低噪音干扰。

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

图1为本申请实施例提供的一种语音采集设备一个实施例的结构示意图,该语音采集设备可以包括处理组件101、分别与处理组件连接的检测组件102以及至少一个麦克风103;

所述检测组件102用于监测进入语音采集设备感应范围内的目标对象,生成感应信号;

所述处理组件101用于基于所述感应信号,获得所述目标对象的第一方位;确定拾音方向与所述第一方位相匹配的第一麦克风103,并切换所述第一麦克风103至启动状态,以采集所述目标对象的语音信号。

其中,所述语音采集设备的感应范围可以是指检测组件的检测范围,当然也可以基于检测组件的检测范围预先设定。

其中,该第一方位可以表示进入感应范围内的初始方位。因此,处理组件可以是基于所述感应信号,获得所述目标对象进入所述感应范围时的第一方位。

其中,所述至少一个麦克风的初始状态可以处于关闭状态,所述处理组件确定出第一麦克风之后,即可以切换第一麦克风至启动状态,以开始采集目标对象的语音信号。

其中,每个麦克风可以对应连接一个控制开关,处理组件具体用来控制第一麦克风对应的第一控制开发开启,以切换第一麦克风至启动状态,开始进行语音信号的采集。

其中,每个麦克风的拾音方向可以是指每个麦克风的输入端所在方向。

其中,拾音方向与所述第一方位相匹配可以是指拾音方向与该第一方位一致或者重合或者夹角在一定误差范围内,也即可以在一定程度上保证第一麦克风的拾音方向对准该第一方位。

在一个可选实施例中,处理组件如果在检测组件监测感应范围内不存在该目标对象时,即可以切换第一麦克风至关闭状态。

该目标对象例如可以是指用户等可以发声的声源对象。

其中,该检测组件可以包括红外传感器、视觉传感器以及激光传感器中的一个以及多个,视觉感应器例如可以为深度摄像头等。

处理组件可以包括一个或多个处理器来执行计算机指令,以完成上述的方法中的全部或部分步骤。当然处理组件也可以为一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

当然,可以理解的是,该语音采集设备必然还可以包括其它部件,例如存储组件、输入/输出接口、通信组件、显示组件等。

其中,存储组件中可以存储各种类型的数据以支持在语音采集设备中的操作,例如存储供处理组件执行的计算机程序等。

对于语音采集设备作为不同用途时,必然包括的其它部件,本申请实施例对此不进行具体限制。

本实施例采用拾音方向与目标对象的方位相匹配的第一麦克风进行语音采集,使得第一麦克风的拾音方向可以对准声源方向,能够采集获得较大音量的目标语音,从而可以降低环境噪音对语音信号的干扰,在需要进行语音识别时,可以提高语音识别的准确度。

其中,由于目标对象可能会随时移动,为了保证语音信号的准确性,在一种可选实现方式中,所述处理组件基于所述感应信号,确定所述目标对象的对象方位发生变化时获得所述目标对象的第二方位;确定与所述第二方位相对应的第二麦克风;切换所述第一麦克风至关闭状态并切换所述第二麦克风至启动状态,以继续采集所述目标对象的语音信号。

此时,该语音采集设备可以包括多个麦克风,该多个麦克风可以呈环形分布。

此外,该语音采集设备可以具体是包括多个麦克风阵列,每个麦克风阵列中可以包括呈环形分布的多个麦克风,该第一麦克风可以是第一麦克风阵列中拾音方向与所述第一方位相匹配的一个麦克风;

则可选低,可以是从第一麦克风阵列中确定拾音方向与所述第二方位相匹配的第二麦克风。

在另一种可选实现方式中,处理组件基于所述感应信号,确定所述目标对象的对象方位发生变化时,控制所述第一麦克风跟随所述目标对象的方位变化而转动,使得所述第一麦克风的拾音方向与目标对象的方位保持一致,以能够继续采集所述目标对象的语音信号。

其中,该至少一个麦克风可以围绕一中心轴转动,可选地,可以是围绕竖直方向的中心轴转动。

其中,处理组件还可以基于所述感应信号,识别所述目标对象的对象特征,具体基于所述目标对象的对象特征,确定所述目标对象的对象方位是否发生。

其中,该至少一个麦克风可以安装在转动机构中,所述转动机构具体能够绕中心轴转动,从而可以带动至少一个麦克风转动;可选地,转动机构具体可以是围绕竖直方向的中心轴转动。

因此,作为又一个实施例,如图2中所示,该语音采集设备还可以包括安装所述至少一个麦克风的转动机构104,所述转动机构104能够绕以中心轴转动;

所述处理组件具体基于所述感应信号,确定所述目标对象的对象方位发生变化时,控制所述转动机构104转动而带动所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号。

可选地,该转动机构可以通过驱动机构的驱动而发生转动,因此,作为又一个实施例,如图2中所示,该语音采集设备还可以包括与所述转动机构104连接的驱动机构105;

所述处理组件具体基于所述感应信号,确定所述目标对象的对象方位发生变化时生成驱动指令;发送所述驱动指令至所述驱动机构105;

所述驱动机构105响应所述驱动指令,控制所述转动机构104转动而带动所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号。也即处理组件通过驱动机构来控制所述转动机构转动。

作为一种可选方式,该转动机构可以包括至少一个转动子机构,每个转动子机构用于安装一个麦克风;该驱动机构可以包括与每一个转动子机构连接的驱动子机构;该驱动子机构可以具体是指驱动电机。

所述处理组件具体将所述驱动指令发送至所述第一麦克风对应的第一驱动子机构;

第一驱动子机构响应所述驱动指令,控制所述第一麦克风对应的第一转动子机构跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

另外,作为另一种可选方式,该至少一个麦克风可以构成至少一个麦克风阵列,该至少一个麦克风阵列可以分层设置,每个麦克风阵列中可以包括一个或多个麦克风;当每个麦克风阵列中包括多个麦克风时,该多个麦克风可以呈环形分布;

该转动机构可以包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中,可以呈环形分布,且可以均匀分布在转动子机构中;所述驱动机构包括与每一个转动子机构连接的驱动子机构;同一麦克风阵列跟随转动子机构的转动而整体转动。

其中,该驱动子机构可以具体是指驱动电机。

所述处理组件具体是将所述驱动指令发送至所述第一麦克风所在第一麦克风阵列对应的第一驱动子机构;

所述第一驱动子机构具体响应所述驱动指令,控制所述第一麦克风阵列对应的第一转动子机构跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

由于目标对象的高低程度不同,因此,作为又一个可选实施例,所述语音采集设备还可以包括与每个麦克风连接的调节机构;

所述处理组件还用于基于所述感应信号识别所述目标对象的对象高度;基于所述对象高度生成调节指令;发送所述调节指令至所述第一麦克风对应的第一调节机构;

所述第一调节机构响应所述调节指令,调整所述第一麦克风的俯仰角度。

可选地,该感应信号中可以包括视觉传感器检测的高度信息等。

为了方便理解,如图3a以及图3b所示分别示出了在一个实际应用中的语音采集设备的部分结构示意图,图3a具体为一个麦克风阵列安装在转动子机构上的结构部分的俯视图,图3b示出了图3a所示结构部分的剖视图。

结合图3a以及图3b可知,该转动子结构包括中心齿轮301以及至少一个连接臂302;其中,中心齿轮301具有中心轴303;每个连接臂302的第一端与中心齿轮301连接以及第二端设置一麦克风304;其中,每个连接臂302的第一端可以延伸至中心轴303所在位置处;图3a以及图3b中以麦克风阵列包括3个麦克风304为了进行介绍,一个连接臂302中设置一个麦克风304。

其中,驱动子机构305具体可以与中心齿轮301连接,以驱动该中心齿轮301转动,从而带动连接臂302围绕中心轴303转动,该驱动子结构305可以具体为一个驱动电机。

上述实施例中,第一驱动子机构也即具体响应所述驱动指令,控制对应的第一转动机构中的中心齿轮跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

此外,由于每一个麦克风还可以通过各自的调节机构结构调节其俯仰角度,如图3a以及图3b中所示,每一个麦克对应的调节机构可以包括第一齿轮306、第二齿轮307以及调节子机构308,该调节子机构308可以具体为一驱动电机,第一齿轮306与麦克风304连接,第一齿轮306与第二齿轮307耦合在一起;调节子机构308与第二齿轮307,以驱动第二齿轮307转动从而带动第一齿轮306转动,实现调整麦克风俯仰角度的目的。图3a以及图3b中包括3个麦克风,因此可以具有3个调节机构,为了方便绘图,图3a中只展示一个调节子机构307,可以理解的,每一个麦克风均会对应一调节子机构。

其中,语音采集设备还配置有安装底座309,上述转动子机构、驱动子机构以及调节机构等都安装与安装底座309上,安装底座可以呈圆形形状,方便执行围绕中心轴的转动操作。

由上文描述可知,由于麦克风可以转动,确定第一麦克风之后,第一麦克风可能并没有完全对准第一方位,为了进一步降低噪音干扰,在某些实施例中,所述处理组件确定与所述第一方位相对应的第一麦克风之后,还可以按照所述第一方位控制所述第一麦克风转动,以调整所述第一麦克风的拾音方向。

通过调整第一麦克风的拾音方向可以使得第一麦克风的拾音方向正对所述第一方位,以进一步降低噪音影响。

另外,在某些实施例中,所述处理组件确定与所述第一方位相对应的第一麦克风可以具体是按照所述第一方位控制第一麦克风转动,以调整所述第一麦克风的拾音方向与所述第一方位相匹配,可以是将拾音方向对准该第一方位。

其中,处理组件控制第一麦克风转动可以通过驱动机构以及转动机构实现,具体可以参见上文中所述,在此不再赘述。

为了进一步降低语音信号中的噪音干扰,所述语音采集设备还包括配置在每个麦克风输入端的声音过滤器;

所述第一麦克风具体用于采集经由所述声音过滤器过滤之后输出的所述目标对象的语音信号。

在一个实际应用中,感应范围内可能会同时存在多个目标对象,为了降低噪音干扰,可以控制一个麦克风仅采集一个目标对象的语音信号;

因此,作为又一个实施例,该语音采集设备中可以具体包括多个麦克风;

所述检测组件还可以用于如果监测所述感应范围内存在多个目标对象,生成相应的多个感应信号;

所述处理组件还可以用于基于所述多个感应信号,获得所述多个目标对象的第一方位;确定拾音方向与所述多个目标对象的第一方位一一对应的多个第一麦克风;切换所述多个第一麦克风至启动状态,以分别采集各自对应的目标对象的语音信号。

在某些实施例中,所述处理组件还可以用于基于任一目标对象对应的感应信号,确定所述任一目标对象的对象方位发生变化,控制所述任一目标对象对应的第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

其中,为了方便追踪目标对象,可以识别该目标对象的对象特征,可以通过对象特征来区分不同目标对象,例如目标对象为用户时,可以对目标对象进行人脸识别获得人脸特征,利用人脸特征来追踪同一个用户,其中,识别目标对象的对象特征可以通过摄像头实现,因此该感应信号中可以包括目标对象的图像信息等。

因此,在又一个可选实施例中,所述处理组件基于任一目标对象对应的感应信号,确定所述任一目标对象的对象方位发生变化,控制所述任一目标对象对应的第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号可以具体是:

识别所述多个目标对象的对象特征;

基于任一目标对象的对象特征,判断所述任一目标对象的对象方位是否发生变化;

如果所述任一目标对象的对象方位发生变化,基于所述任一目标对象的对象特征,控制所述任一目标对象对应的麦克风跟随所述任一目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

通过追踪任一目标对象的对象特征,即可以确定该任一目标对象的对象方位是否发生变化等。

其中,由于多个麦克风可以构成至少一个麦克风阵列,其中,每个麦克风阵列包括至少一个麦克风;

所述处理组件确定拾音方向与所述至少一个目标对象的第一方位一一对应的至少一个第一麦克风可以具体是:

确定与所述至少一个目标对象一一对应的至少一个麦克风阵列;

确定每个麦克风阵列中拾音方向与其对应目标对象的第一方位相匹配的第一麦克风。

结合上文描述可知,该语音采集设备还可以包括安装所述至少一个麦克风的转动机构,所述转动机构能够绕中心轴转动;

所述处理组件确定任一目标对象的对象方位发生变化时,可以具体是控制所述转动机构转动以带动所述任一目标对象对应的第一麦克风跟随所述任一目标对象的方位变化而转动。

其中,处理组件可以具体是通过驱动机构来控制转动机构转动,因此,所述处理组件可以是确定任一目标对象的对象方位发生变化时,生成驱动指令;发送所述驱动指令至所述驱动机构;

所述驱动机构响应所述驱动指令,以控制所述转动机构转动而带动所述任一目标对象对应的第一麦克风跟随所述任一目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

在语音采集设备包括至少一个麦克风阵列时,该至少一个麦克风阵列可以分层设置;所述转动机构可以包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中;所述驱动机构可以包括与每一个转动子机构连接的驱动子机构;

所述处理组件可以将驱动指令发送至所述任一目标对象对应的第一麦克风所在第一麦克风阵列对应的第一驱动子机构;由所述第一驱动子机构响应所述驱动指令,以控制所述任一目标对象对应的第一麦克风对应的第一转动子机构转动跟随所述任一目标对象的方位变化而转动,从而带动所述任一目标对象对应的第一麦克风而转动,以继续采集所述任一目标对象的语音信号。

此外,语音采集设备还包括配置在每个麦克风输入端的声音过滤器;

所述多个第一麦克风具体用于采集经由各自声音过滤器过滤之后输出的语音信号。

此外,该语音采集设备还包括与每个麦克风连接的用于调节俯仰角度的调节机构;

因此,处理组件还可以基于任一目标对象对应的感应信号确定任一目标对象的对象高度;基于该任一目标对象的对象高度生成调节指令;发送所述调节调整至所述任一目标对象对应的调节结构,以通过所述任一目标对象对应的调节结构响应所述调节指令,调整所述任一目标对象对应的第一麦克风的俯仰角度等。

本申请实施例提供的语音采集设备,在实际应用中,例如可以为智能音箱、手机、机器人以及其它语音交互设备等。

图4为本申请实施例提供的一种语音采集方法一个实施例的流程图,该方法可以包括以下几个步骤:

401:监测进入语音采集设备感应范围内的目标对象,获得所述目标对象的第一方位。

其中,该语音采集设备的具体结构可以参见上述各设备实施例中所述。

其中,可以通过检测组件监测进入语音采集设备感应范围内的目标对象,并基于检测组件的感应信号,获得目标对象的第一方位。

该目标对象例如可以是指用户等可以发声的声源对象。

402:确定拾音方向与所述第一方位相匹配的第一麦克风。

其中,每个麦克风的拾音方向可以是指每个麦克风的输入端所在方向。

拾音方向与所述第一方位相匹配可以是指拾音方向与该第一方位重合或者夹角在一定误差范围内,也即可以在一定程度上保证第一麦克风的拾音方向可以对准该第一方位。

403:切换所述第一麦克风至启动状态,以采集所述目标对象的语音信号。

本实施例采用拾音方向与目标对象的方位相对的第一麦克风进行语音采集,使得第一麦克风的拾音方向可以对准声源方向,能够采集获得较大音量的目标语音,从而可以降低环境噪音对语音信号的干扰,在需要进行语音识别时,可以提高语音识别的准确度。

由于目标对象可能会移动而变换方位,作为一种可选方式,该方法还可以包括:

监测所述目标对象的对象方位发生变化,获得所述目标对象的第二方位;

确定拾音方向与所述第二方位相匹配的第二麦克风;

切换所述第一麦克风至关闭状态并切换所述第二麦克风至启动状态,以继续采集所述目标对象的语音信号。

此时,该语音采集设备中可以包括多个麦克风,该多个麦克风可以呈环形分布。

此外,该语音采集设备可以包括多个麦克风阵列,每个麦克风阵列中可以包括呈环形分布的多个麦克风,该第一麦克风可以是第一麦克风阵列中拾音方向与所述第一方位相匹配的一个麦克风;

则可以是从第一麦克风阵列中确定拾音方向与所述第二方位相匹配的第二麦克风。

作为另一种可选方式,该方法还可以包括:

监测所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号。

其中,该至少一个麦克风可以围绕中心轴转动。可以通过驱动机构控制第一麦克风跟随所述目标对象的方位变化而转动。

另外,监测所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号可以包括:

识别所述目标对象的对象特征;

基于所述目标对象的对象特征,判断所述目标对象的对象方位是否发生。

如果所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动。

可选地,第一麦克风可以安装在转动机构,所述语音采集设备可以包括至少一个麦克风;因此,所述语音采集设备还可以包括安装所述至少一个麦克风的转动机构,所述转动机构能够绕中心轴转动;

所述监测所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动可以包括:

监测所述目标对象的对象方位发生变化,控制所述转动机构转动以带动所述第一麦克风跟随所述目标对象的方位变化而转动。

其中,可以通过驱动机构控制所述转动机构转动。

此外,所述至少一个麦克风可以构成至少一个麦克风阵列;

所述确定与所述第一方位相对应的第一麦克风可以包括:

确定第一麦克风阵列;

确定所述第一麦克风阵列中拾音方向与所述第一方位相匹配的第一麦克风。

在某些实施例中,所述转动机构可以包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中;

因此,所述控制所述转动机构转动以带动所述第一麦克风跟随所述目标对象的方位变化而转动可以包括:

控制所述第一麦克风阵列对应的第一转动子机构跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

其中,确定与第一方位匹配的第一麦克风之后,第一麦克风可能并没有完全对准第一方位,因此,为了进一步降低噪音干扰,在某些实施例中,所述确定与所述第一方位相对应的第一麦克风之后,所述方法还可以包括:

按照所述第一方位控制所述第一麦克风转动,以调整所述第一麦克风的拾音方向。通过调整第一麦克风的拾音方向可以使得第一麦克风的拾音方向正对所述第一方位,以进一步降低噪音影响。

此外,在又一个可选实施例中,所述确定与所述第一方位相对应的第一麦克风可以包括:

确定第一麦克风;

按照所述第一方位控制第一麦克风转动,以调整所述第一麦克风的拾音方向与所述第一方位相匹配。

如果语音采集设备仅包括一个麦克风的情况时,其即可以作为第一麦克风,如果第一麦克风的当前拾音方向与所述第一方位不一致,则可以按照所述第一方位控制第一麦克风转动,以调整所述第一麦克风的拾音方向与所述第一方位相匹配。之后再启动第一麦克风进行语音信号的采集。

其中,控制第一麦克风转动的具体实现方式可以参见上文中所述,例如通过驱动机构或者转动机构等,在此不再赘述。

此外,为了进一步降低噪音干扰,所述语音采集设备中,在所述第一麦克风的输入端还配置有声音过滤器;

所述切换所述第一麦克风至启动状态,采集所述目标对象的语音信号包括:

切换所述第一麦克风至启动状态,采集经由所述声音过滤器过滤之后输出的所述目标对象的语音信号。

由于目标对象的高低程度不同,因此,作为又一个实施例,所述方法还可以包括:

识别所述目标对象的对象高度;

按照所述对象高度调整所述第一麦克风的俯仰角度。

具体的,每一个麦克风可以配置一个调节机构,可以控制第一麦克风对应的调节机构按照所述对象高度调整所述第一麦克风的俯仰角度。

其中,可以通过视觉传感器等识别所述目标对象的对象高度。

在一个实际应用中,感应范围内可能会同时进入多个目标对象,那么可以针对每一个目标对象均可以按照图4所示实施例的技术方案执行。

此外,为了降低每一个麦克风采集的语音信号中的噪音干扰,可以利用一个麦克风仅采集一个目标对象的语音信号。因此,如图5所示,本申请实施例还提供了一种语音采集方法,所述方法可以包括以下几个步骤:

501:监测进入语音采集设备感应范围内的多个目标对象,分别获得所述多个目标对象的第一方位。

502:确定拾音方向与所述多个目标对象的第一方位一一匹配的多个第一麦克风。

其中,可以通过图像识别技术,对进入感应范围内的多个目标对象进行对象识别,以区分所述多个目标对象。从而可以确定拾音方向与任一目标对象的第一方位相匹配的一个第一麦克风。该多个目标对象对应的第一麦克风互不相同,也即多个第一麦克风与该多个目标对象一一对应。

503:切换所述多个第一麦克风至启动状态,以采集各自对应目标对象的语音信号。

本实施例中,如果感应范围内存在多个目标对象,则基于多个目标对象的第一方位,确定拾音方向与多个目标对象的第一方位一一匹配的多个第一麦克风,使得每一个第一麦克风拾音方向仅与一个目标对象的第一方位保持一致,从而可以使得每个麦克风仅采集其对应目标对象的语音信号,保证了存在多个目标对象的情况下可以精确采集获得每个目标对象有效的语音信号,且每个麦克风采集方位与其拾音方向匹配的目标对象的语音信号,可以保证采集获得的目标对象的语音信号音量最大,可以采集到较少噪音甚至无噪音,从而可以降低每个第一麦克风中语音信号中的噪音干扰,保证了存在多个目标对象的情况下仍然可以降低语音信号中的噪音干扰。

在某些实施例中,所述方法还可以包括:

监测任一目标对象的对象方位发生变化,控制所述任一目标对象对应的第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

其中,为了方便追踪目标对象,可以识别该目标对象的对象特征,可以通过对象特征来区分不同目标对象,例如目标对象为用户时,可以对目标对象进行人脸识别获得人脸特征,利用人脸特征来追踪同一个用户,其中,识别目标对象的对象特征可以通过摄像头实现,因此该感应信号中可以包括目标对象的图像信息等。

因此,作为又一个实施例,所述监测任一目标对象的对象方位发生变化,控制所述任一目标对象对应的麦克风跟随所述任一目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号可以包括:

识别所述至少一个目标对象的对象特征;

基于任一目标对象的对象特征,判断所述任一目标对象的对象方位是否发生变化;

如果所述任一目标对象的对象方位发生变化,基于所述任一目标对象的对象特征,控制所述任一目标对象对应的麦克风跟随所述任一目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

通过追踪任一目标对象的对象特征,即可以确定该任一目标对象的对象方位是否发生变化等。

在某些实施例中,语音采集设备的多个麦克风可以安装在转动机构中,所述转动机构能够绕中心轴转动;

因此,所述监测任一目标对象的对象方位发生变化,控制所述任一目标对象对应的麦克风跟随所述任一目标对象的方位变化而转动可以包括:

监测任一目标对象的对象方位发生变化,控制所述转动机构转动以带动所述任一目标对象对应的第一麦克风跟随所述任一目标对象的方位变化而转动。

其中,可以具体是通过驱动机构来控制转动机构转动。

在某些实施例中,所述语音采集设备可以包括多个麦克风阵列;其中,每个麦克风阵列包括至少一个麦克风;

所述确定拾音方向与所述多个目标对象的第一方位一一匹配的多个第一麦克风可以包括:

确定与所述多个目标对象一一对应的多个麦克风阵列;

确定每个麦克风阵列中拾音方向与其对应目标对象的第一方位相匹配的第一麦克风。

该多个麦克风阵列可以分层设置,转动机构可以包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中;所述驱动机构可以包括与每一个转动子机构连接的驱动子机构;

因此,监测任一目标对象的对象方位发生变化,控制所述转动机构转动以带动所述任一目标对象对应的第一麦克风跟随所述任一目标对象的方位变化而转动可以是:

监测任一目标对象的对象方位发生变化,通过所述任一目标对象对应的第一麦克风所在第一麦克风阵列对应的第一驱动子机构;控制所述任一目标对象对应的第一麦克风对应的第一转动子机构转动跟随所述任一目标对象的方位变化而转动,从而带动所述任一目标对象对应的第一麦克风而转动,以继续采集所述任一目标对象的语音信号。

此外,语音采集设备还包括配置在每个麦克风输入端的声音过滤器;

因此,所述切换所述多个第一麦克风至启动状态,以采集各自对应目标对象的语音信号可以包括:

切换所述多个第一麦克风至启动状态,以采集经由各自对应的声音滤波器过滤之后的各自对应目标对象的语音信号。

此外,作为又一个实施例,所述方法还可以包括:

基于任一目标对象对应的感应信号确定任一目标对象的对象高度;

基于该任一目标对象的对象高度,调整所述任一目标对象对应的第一麦克风的俯仰角度。

其中,该语音采集设备可以包括与每个麦克风连接的用于调节俯仰角度的调节机构,因此,可以具体通过所述任一目标对象对应的调节结构,调整所述任一目标对象对应的第一麦克风的俯仰角度。

在一个实际应用中,该目标对象可以即具体是指用户,该语音采集设备可以为智能音箱、各种类型的机器人等电子设备中,该语音采集设备包括的至少一个麦克风可以设置在语音采集设备外壳的凹陷部位,以实现隐藏。该语音采集设备可以监测其感应范围内是否存在用户,如果存在一个用户,则可以识别该用户的第一方位,根据该第一方位,确定拾音方向与该第一访问相匹配的第一麦克风,进而可以启动该第一麦克风采集用户发出的语音信号;如果用户发生方位变化,则扫地机器人根据变化之后的第二方位,可以切换至第二麦克风继续采集用户的语音信号;当然也可以控制第一麦克风跟随用户的方位变化而转动,实现追踪用户的目的,以保持第一麦克风的拾音方向与用户方位保持一致,采集获得的语音信号中噪音较少,从而可以降低噪音干扰。

如果感应范围内存在多个用户时,语音采集设备可以采用与多个用户一一对应的多个第一麦克风来分别采集每个用户的语音信号。每个第一麦克风的拾音方向与其对应用户的方位一致,为了保证不发生冲突,语音采集设备中可以配置多个麦克风阵列,该多个用户可以与该多个麦克风阵列一一对应,从而每个用户对应的第一麦克风可以是其对应麦克风阵列中拾音方向与其方位保持一致的一个麦克风,当然也可以将其对应麦克风阵列中的任一麦克风作为第一麦克风,并调整第一麦克风的拾音方向与其方位保持一致即可。如图6所示,以目标对象为用户为例,示出了本申请提供的一种语音采集方法又一个实施例的流程图,该方法可以包括以下几个步骤:

601:监测进入语音采集设备感应范围内的多个用户,分别获得所述多个用户的第一方位。

其中,可以采用人脸识别技术识别所述多个用户,以分别确定每个用户各自对应的第一方位。

602:确定拾音方向与所述多个用户一一对应的多个麦克风阵列。

其中,多个麦克风阵列可以分层设置。

603:确定每个麦克风阵列中拾音方向与其对应用户的第一方位相匹配的第一麦克风。

604:切换所述多个第一麦克风至启动状态,以采集各自对应用户的语音信号。

通过与多个用户一一对应的多个麦克风分别采集多个用户的语音信号,使得一个麦克风仅用来采集一个用户的语音信号,保证存在多个目标对象的情况下可以精确采集获得每个目标对象有效的语音信号,降低噪音干扰。

此时,如果任一用户的方位发生变化,则可以控制其对应的第一麦克风跟随其方位发生而转动,以始终保持其对应的第一麦克风拾音方向与该任一用户的方位保持一致,使得采集获得的语音信号中噪音较少,从而保证可以降低噪音干扰,因此,该方法还可以包括:

605:监测任一用户的用户方位发生变化,控制所述任一用户对应的第一麦克风跟随所述任一用户的方位变化而转动,以继续采集所述任一用户的语音信号。

其中,可以通过人脸识别技术,记录每个麦克风对应用户的人脸特征,从而基于人脸特征,可以确定每个用户是否发生方位变化,进而可以控制对应麦克风跟随用户方位变化而转动,以保持拾音方向与用户方位相匹配,使得可以继续采集该用户的语音信号,保证采集获得的语音信号中噪音干扰较小。

本实施例中,即便存在多个用户时,由于每个用户的语音由单独麦克风进行采集,从而可以方便区分不同用户,有利于准确识别用户语音。且可以保证每个麦克风采集的语音信号中噪音较少,从而保证可以降低噪音干扰。

图7为本申请实施例提供的一种语音采集装置一个实施例的结构示意图,该装置可以包括:

第一监测模块701,用于监测进入语音采集设备感应范围内的目标对象,获得所述目标对象的第一方位;

第一确定模块702,用于确定拾音方向与所述第一方位相匹配的第一麦克风;

第一采集模块703,用于切换所述第一麦克风至启动状态,采集所述目标对象的语音信号。

可选地,该第一监测模块还用于监测所述目标对象的对象方位发生变化,获得所述目标对象的第二方位;

所述第一确定模块还用于确定拾音方向与所述第二方位相匹配的第二麦克风;

第一切换模块还用于切换所述第一麦克风至关闭状态并切换所述第二麦克风至启动状态,以继续采集所述目标对象的语音信号。

可选地,该装置还可以包括:

第一控制模块,用于监测所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述目标对象的语音信号。

在某些实施例中,该装置还可以包括:

第一调整模块,用于确定拾音方向与所述第一方位相匹配的第一麦克风之后,按照所述第一方位控制所述第一麦克风转动,以调整所述第一麦克风的拾音方向。

在某些实施例中,所述第一确定模块可以具体用于确定第一麦克风;按照所述第一方位控制所述第一麦克风转动,以调整所述第一麦克风的拾音方向与所述第一方位相对应。

在某些实施例中,所述语音采集设备包括至少一个麦克风;所述语音采集设备还包括安装所述至少一个麦克风的转动机构,所述转动机构能够绕中心轴转动;

所述第一监测模块述监测所述目标对象的对象方位发生变化,控制所述第一麦克风跟随所述目标对象的方位变化而转动可以具体是:

监测所述目标对象的对象方位发生变化,控制所述转动机构转动以带动所述第一麦克风跟随所述目标对象的方位变化而转动。

可选地,所述至少一个麦克风可以构成至少一个麦克风阵列;所述第一确定模块可以具体用于确定第一麦克风阵列;确定所述第一麦克风阵列中拾音方向与所述第一方位相匹配的第一麦克风。

其中,所述转动机构可以包括至少一个转动子机构,同一麦克风阵列中的麦克风安装在同一转动子机构中;

所述第一确定模块控制所述转动机构转动以带动所述第一麦克风跟随所述目标对象的方位变化而转动可以包括:

控制所述第一麦克风阵列对应的第一转动子机构跟随所述目标对象的方位变化而转动,以带动所述第一麦克风转动。

此外,在某些实施例中,该装置还可以包括:

角度调整模块,用于识别所述目标对象的对象高度;按照所述对象高度调整所述第一麦克风的俯仰角度。

此外,在某些实施例中,所述第一麦克风的输入端配置有声音过滤器;所述第一采集模块可以具体用于切换所述第一麦克风至启动状态,采集经由所述声音过滤器过滤之后输出的所述目标对象的语音信号。

其中,图7所述的语音采集装置可以执行图4所示实施例所述语音采集方法,其实现原理和技术效果不再赘述。对于上述实施例中的语音采集装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

图8为本申请实施例提供的一种语音采集装置又一个实施例的结构示意图,该装置可以包括:

第二监测模块801,用于监测进入语音采集设备感应范围内的多个目标对象,分别获得所述多个目标对象的第一方位;

第二确定模块802,用于确定拾音方向与所述多个目标对象的第一方位一一匹配的多个第一麦克风;

第二采集模块803,用于切换所述多个第一麦克风至启动状态,以采集各自对应目标对象的语音信号。

可选地,所述语音采集设备包括多个麦克风阵列;其中,每个麦克风阵列包括至少一个麦克风;

所述第二确定模块可以具体用于确定与所述多个目标对象一一对应的多个麦克风阵列;确定每个麦克风阵列中拾音方向与其对应目标对象的第一方位相匹配的第一麦克风。

此外,在某些实施例中,所述第二监测模块还可以用于监测任一目标对象的对象方位发生变化,控制所述任一目标对象对应的第一麦克风跟随所述目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

此外,在某些实施例中,所述第二监测模块可以具体用于:

识别所述至少一个目标对象的对象特征;

基于任一目标对象的对象特征,判断所述任一目标对象的对象方位是否发生变化;

如果所述任一目标对象的对象方位发生变化,基于所述任一目标对象的对象特征,控制所述任一目标对象对应的麦克风跟随所述任一目标对象的方位变化而转动,以继续采集所述任一目标对象的语音信号。

图8所述的语音采集装置可以执行图5所示实施例所述语音采集方法,其实现原理和技术效果不再赘述。对于上述实施例中的语音采集装置其中各个模块、单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在本申请实施例中,对进入语音采集设备感应范围内的目标对象进行监测,获得目标对象所处的第一方位;基于该第一方位确定拾音方向与第一方位相对应的第一麦克风;从而可以切换该第一麦克风至启动状态,以采集目标对象的语音信号,

在一个可能的设计中,本申请实施例提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理组件执行时可以实现上述图4所示实施例的语音采集方法:

监测进入语音采集设备感应范围内的目标对象,获得所述目标对象的第一方位;

确定拾音方向与所述第一方位相匹配的第一麦克风;

切换所述第一麦克风至启动状态,采集所述目标对象的语音信号。

在又一个可能设计中,本申请实施例还提供了一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理组件执行时可以实现上述图5所示实施例的语音采集方法:

监测进入语音采集设备感应范围内的多个目标对象,分别获得所述多个目标对象的第一方位;

确定拾音方向与所述多个目标对象的第一方位一一匹配的多个第一麦克风;

切换所述多个第一麦克风至启动状态,以采集各自对应目标对象的语音信号。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是:以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1