远场拾音装置及电子设备的制作方法

文档序号:18255501发布日期:2019-07-24 10:09阅读:164来源:国知局
远场拾音装置及电子设备的制作方法

本公开属于语音识别技术领域,涉及一种远场拾音装置及电子设备。



背景技术:

在电子设备上设有拾音装置,该拾音装置用于将外界声源发出的声波转换成电子设备能识别的合成声音信息。其中,该拾音装置能根据内部程序的设定将部分杂音过滤。例如,在手机中设有两个麦克风用于接收声波,并利用两个麦克风接收到的声波的相位差进行声波的过滤,以最大限度地降低环境背景声音的干扰,以使用户能获得清晰的声音信息。

在相关技术中,拾音装置的拾音距离短,当声源处于预设收音距离外时,则容易导致声音分辨不清。如手机仅能在1米范围内的近场使用,当声源超出该范围达到2米时,则无法进行声音的识别。

此外,拾音装置无法判别声源的方向,导致拾音装置无法根据对应声源声波输出增强的合成声音信号,以及不能辨别其他声源输出的干扰声波,拾音效果差,声音的可分辨率低。



技术实现要素:

有鉴于此,本公开提供一种远场拾音装置及电子设备。

具体地,本公开是通过如下技术方案实现的:

根据本公开实施例的第一方面,提供了一种远场拾音装置,该装置包括:

拾音模块,所述拾音模块通过多条拾音通道采集至少一个待测声源的初始声音信号;

声源判断模块,与所述拾音模块通信连接,根据每条拾音通道采集的初始声音信号运算并确定待测声源方向;

声音合成模块,与所述声源判断模块通信连接,增强并合成对应待测声源方向的初始声音信号以形成合成声音信号;

声音输出模块,与所述声音合成模块通信连接,通过输出通道将合成声音信号输出。

在一实施例中,所述拾音模块包括四个及以上的拾音元件,每一拾音元件构成一所述拾音通道,其中,至少一条拾音元件与其他的拾音元件处于不同的直线方向。

在一实施例中,至少两个所述拾音元件处于同一直线上,该直线与其它的拾音元件的连线呈预设角度相交;或所述拾音元件呈环形间隔分布。

在一实施例中,所述拾音元件设有六个,其中三个拾音元件位于第一直线方向,其它三个拾音元件处于第二直线方向,其中,第一直线方向倾斜相交于第二直线方向。

在一实施例中,相邻两个所述拾音元件的间距大于或等于待测声源发出的声波波长的一半;和/或,相邻两个拾音元件的间距相等或间隔距离依次变化。

在一实施例中,所述声音合成模块包括声音加强子模块,所述声音加强子模块将符合待测声源发出的同一相位差的初始声音信号进行叠加;和/或,所述声音合成模块还包括声音过滤子模块,所述声音过滤子模块将其它声源向多条所述拾音通道发送的不同相位差的初始声音信号进行减弱或过滤。

在一实施例中,所述声源判断模块包括:根据多个初始声音信号的相位差异及拾音通道的所处的方位,确定所述待测声源的位置。

在一实施例中,所述声音输出模块包括:

所述输出通道设有一个及以上,待测声源的合成声音信息可通过其中一输出通道输出。

在一实施例中,该拾音装置还包括将其它声源向多条所述拾音通道发送的初始声音信息合成相应地合成声音信息,其它声源的合成声音信息通过其它相应的输出通道输出。

在一实施例中,所述远场拾音装置包括声源判断模块:所述声源判断模块判断所述合成声音信号是否为携带有相应讯息的声音信号;

当合成声音信号为携带有相应讯息的声音信号时,相应地合成声音信号通过输出通道向外输出;

当合成声音信号为未携带有相应讯息的声音信号时,相应地合成声音信号删除。

在一实施例中,所述远场拾音装置包括外壳,所述声源判断模块、声音合成模块及声音输出模块安装于所述外壳内,至少部分所述拾音模块设于所述外壳的表面。

根据本公开实施例的第二方面,提供了一种电子设备,所述的电子设备包括:

处理器;

用于存储处理器可执行指令的存储器;

其中,所述电子设备还包括如上所述的远场拾音装置。

本公开的实施例提供的技术方案可以具有以下有益效果:

通过多条拾音通道接收待测声源发送的声波,拾音通道之间会采集具有相位差异的初始声音信号。该远场拾音装置根据多条拾音通道的方位及相应地的初始声音信号的相位差异,从而确定待测声源的方位。该远场拾音装置能定向采集待测声源发出的初始声音信号,指向性好,采集准确度高。该远场拾音装置将确定方位的待测声源输出的初始声音信号相应增强并合成,以提高声波的可识别度,拾音范围广,噪音干扰少。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

图1是根据一示例性实施例示出的远场拾音装置的框图。

图2是根据一示例性实施例示出的判断合成声音信息是否携带讯息的远场拾音装置的框图。

图3是根据一示例性实施例示出的远场拾音装置应用于手机的结构示意图。

图4是根据一示例性实施例示出的合成声音信息是否携带讯息的判断过程原理框图。

图5是根据一示例性实施例示出的远场拾音方法的原理框图。

图6是根据一示例性实施例示出的具有远场拾音装置的电子设备的框图。

其中,拾音模块10;拾音元件11;声源判断模块20;声音合成模块30;声音加强子模块31;声音过滤子模块32;声音输出模块40;声源判断模块50;外壳60;电子设备70;处理组件71,存储器72,电源组件73,多媒体组件74,音频组件75,输入/输出(I/O)的接口76,传感器组件77,通信组件78,处理器79。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本公开可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本公开范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

如图1所示,远场拾音装置包括:拾音模块、声源判断模块、声音合成模块和声音输出模块,声源判断模块与拾音模块通信连接,声音合成模块与声源判断模块通信连接,声音输出模块与声音合成模块通信连接。

拾音模块通过多条拾音通道采集至少一个待测声源的初始声音信号。多条拾音通道按预设的方位排布,以使待测声源与每一条拾音通道的距离不同,从而使待测声源发出的声波在每一拾音通道处产生相应地具有相位差异的初始声音信号。其中,待测声源的位置与多条拾音通道之间的位置及角度可相对变化或相对固定。拾音模块能接收同一待测声源发出的声波,并将该声波转换成对应的初始声音信号。在一可选地实施例中,拾音通道为安装于设备的麦克风或拾音元件,拾音模块控制多个麦克风构成麦克风矩阵,以采集待测声源发出的声波并采集相应地初始声音信号。

声源判断模块每条拾音通道采集的初始声音信号运算并确定待测声源方向。拾音模块将每一拾音通道采集的初始声音信号传递至声源判断模块,声源判断模块的内置程序运行并根据初始声音信息中包含的相位信息及拾音通道所处的位置信息,确定待测声源的方位,以使远场拾音装置能识别并筛选该待测声源产生的对应初始声音信息,如远场拾音装置通过声波传递产生相位差异进行筛选等。

声音合成模块增强并合成对应待测声源方向的初始声音信号以形成合成声音信号。声音输出模块通过输出通道将合成声音信号输出。在声源判断模块筛选出符合待测声源发出的初始声音信号后,声音合成模块将相应地初始声音信号进行增强并合成,以提高待测声源输出声波的可辨识度。进一步的,远场拾音装置定向采集待测声源发出的初始声音信息,并通过增强及合成后形成高辨识度的合成声音信号,信号采集方便广,采集精度高。

远场拾音装置采用上述的远场拾音方法,待测声源发出的声波先通过多条拾音通道采集,再根据声波产生的相位差异确定待测声源的方位,如待测声源位于远场拾音装置的前端或后端。在待测声源的方位确定后,在每一拾音通道中筛选出该待测声源生成的相应地初始声音信号,并将多条拾音通道之间的初始声音信号进行增强及合成,如采用叠加或其它增强信号的方式进行初始声音信号的增强及合成。

该远场拾音装置能定向采集待测声源发出的声波,指向性好,声波采集准确度高。该远场拾音装置将确定方位的待测声源输出的初始声音信号相应增强并合成,以提高声波的可识别度,拾音范围广,噪音干扰少。

在一实施例中,拾音模块包括四个及以上的拾音元件,每一拾音元件构成一拾音通道,其中,至少一条拾音元件与其他的拾音元件处于不同的直线方向。如,拾音元件即设为麦克风。

拾音元件间隔分布并且至少部分拾音元件处于不同的直线上,以使待测声源发出的声波传递至多个拾音元件的拾音通道时,拾音通道采集相应地初始声音信息,该初始声音信息为包含有相位变化信息的电信号。每一条拾音通道均采集相对应的初始声音信息,并且不同的拾音通道之间采集的初始声音信息具有相应的相位差,再通过拾音通道采集的初始声音信息的相位差异运算并确定出待测声源的具体位置,声源的指向性好,定位精度高。

在一实施例中,根据多个初始声音信号的相位差异及拾音通道的所处的方位,确定待测声源的位置。

在一可选地实施例中,至少两个拾音元件处于同一直线上,该直线与其它的拾音元件的连线呈预设角度相交;或拾音元件呈环形间隔分布。

至少两个拾音元件处于同一直线上,在该直线上还可分布其它拾音元件,以构成多个拾音点,增加待测声源采集位置的数量,提高合成声音信息的质量。其它的拾音元件所处为的位置的连线构成一直线,以使拾音元件按预设的轨迹及角度分布。如两组拾音元件构成的连线相交呈45度、60度、90度等,该拾音元件的分布位置确定并结合多条拾音元件接收到的初始声音信息,可确定待测声源的位置。该远场拾音装置采集声音的指向性好,便于对远场声源的定位及采集,运算方便,定位精度高。可选地,两个拾音元件的连线可理解为拾音元件的拾音口部位的连线或拾音口的中心线的连线。当拾音元件设为麦克风时,该连线可以理解为麦克风中拾音部位的安装位置的连线。

在一可选的实施方式中,拾音元件设有六个,其中三个拾音元件位于第一直线方向,其它三个拾音元件处于第二直线方向,其中,第一直线方向倾斜相交于第二直线方向。其中,第一直线方向倾斜相交于第二直线方向。在一可选的实施方式中,第一直线方向与第二直线方向的相交角度可设为30度~90度,如第一直线方向与第二直线方向的相交角度设为45度、60度、90度等。

三个拾音元件处于同一直线上并且间隔预设距离,以使声波能大致同时传递至三个拾音元件,以使三个拾音元件所采集的声波的相位大致相同。另外三个拾音元件间隔设置并沿第二直线方向分布,以使得声波传递至每一个拾音元件处产生相应地相位差。

将上述实施例公开的远场拾音装置应用于手机等电子设备中,其中,三个拾音元件间隔分布于手机的顶部边框处,即,该手机的顶部边框设为横向。三个拾音元件间隔分布于手机的侧边边框处,即,该手机的侧边边框设为纵向。当手机放置于平面上时,第一声源位于手机顶部的延伸方向上,第二声源位于手机底部的延伸方向上。第一声源和第二声源其中一者发出的声波,则远场拾音装置能根据检测拾音模块采集的声波生成相应地初始声音信息,再通过声源判断模块判断第一声源或第二声源进行声源位置的判断并对相应地的初始声音信息进行合成及增加,再经声音合成模块将合成声音信息经对应的输出通道输出。

在一实施例中,相邻两个拾音元件的间距大于或等于待测声源发出的声波波长的一半;和/或,相邻两个拾音元件的间距相等或间隔距离依次变化。相应地,人发出声音的声波波长处于可识别的波长范围内。调整相邻拾音通道之间的间距,以使不同的拾音通道采集到的声波具有相应的相位差异,相应地,拾音通道可采集相应地的具有相位差异的初始声音信号。相邻两条拾音通道按预设的间距设置以确定拾音通道的位置,该位置的位置数据结合拾音通道采集的初始声音信息,以确定待测声源的位置及方向。可选地,相邻两拾音通道的间距设为1厘米~3厘米。具体地,该预设距离设为1厘米、2厘米、3厘米等。可选地,将两拾音通道的预设距离大于待测声源发出的声波波长的一半,以准确获取声波在不同拾音通道的相位差异,声波采集准确性高。

在一实施例中,声音合成模块包括声音加强子模块,声音加强子模块将符合待测声源发出的同一相位差的初始声音信息进行叠加。

在一实施例中,声音合成模块还包括声音过滤子模块,声音过滤子模块对其它声源发出的不同相位差的波形进行减弱或过滤。

声音加强子将符合待测声源发出的同一相位差的初始声音信息进行叠加,其中,每个拾音通道均接收到待测声源发出的声波并生成相应地初始声音信息。在声源判断模块确定待测声源的方位后,声音合成模块根据拾音通道采集的初始声音信息进行分析。其中,拾音通道的位置为确定值,同一待测声源在不同的拾音通道处的初始声音信息的相位差为确定范围,即构成同一相位差。将待测声源生成的初始声音信息进行提取并与其它拾音通道提取的同一待测声源的初始声音信息进行叠加,以增强与待测声源相对应的合成声音信息的强度,提高合成声音信息的清晰度及可辨识度,拾音效果好。

在拾音模块中还采集有其它声源发送的初始声音信息,如咳嗽声、放或取物品时的撞击声等杂音,或者其它声源通过拾音通道采集的初始声音信息。相应地,在过滤子模块处理当前的待测声源发出的初始声音信息时,其它声源发出的初始声音信息视为杂音或者通过相应地程序同时运算并通过其它输出通道输出。同理,当过滤子模块处理其它声源时,当前的待测声源发出的初始声音信息也可视为杂音或者通过相应地程序同时运算并通过相应地输出通道输出。

因此,增强待测声源发出的初始声音信息的一种方式可采用:过滤子模块对其它声源发出的不同相位差的初始声音信息进行减弱或过滤。即,声音输出模块通过程序的设定将不是待测声源发出的初始声音信息进行减弱或过滤,以避免其它声波干扰,提高待测声源的合成声音信息的强度,提高声音的可识别度。

在一实施例中,声音输出模块包括:输出通道设有一个及以上,待测声源的合成声音信息可通过其中一输出通道输出。

在一实施例中,将其它声源向多条拾音通道发送的初始声音信息合成相应地合成声音信息,其它声源的合成声音信息通过其它对应的输出通道输出。声音输出模块设有一个及以上的输出通道,不同方位的待测声源生成的合成声音信息能通过对应的输出通道输出,能根据不同的使用场景实现多通道输出,合成声音信息的输出通道丰富,能使应用该远场拾音方法的系统或装置具有更加便捷的操作性。如将该远场拾音装置应用于翻译机上,不同用户的合成声音信息能通过对应的输出通道输出,并对应排序并转换成相应地文字信息。

如图2所示,在一实施例中,远场拾音装置还包括声源判断模块:声源判断模块判断待测声源发出的声波是否为携带有相应讯息的声音信号;当声波为携带有相应讯息的声音信号时,相应地合成声音信号通过输出通道向外输出;当声波为未携带有相应讯息的声音信号时,相应地合成声音信号删除。

多条拾音通道采集的初始声音信息合成并形成合成声音信息,其中,该合成声音信息包括待测声源发出的声音信息,该声音信息携带有相应地讯息,如该讯息为人所表达讯息的语句,该类合成声音信息经判断后通过输出通道向外输出。而其它声源发出的声音信息中未携带有相应地讯息,则该类合成声音信息不能通过相应地输出通道输出。

在一可选地实施例中,声源判断模块判断合成声音信号是否携带有相应讯息的声音信号,可采用声源判断模块判断合成声音信号的音频变化是否符合预设频率范围;和/或,声源判断模块判断合成声音信号的响度变化是否符合预设响度范围;和/或,声源判断模块判断合成声音信号的音色变化是否符合预设音色范围。当然声源判断模块判断合成声音信号是否携带有相应讯息的声音信号,还可采用其它判断方式,如声源判断模块判断声波的持续时长是否大于预设时长。

以声源判断模块判断合成声音信号的音频变化是否符合预设频率范围为例进行说明。当合成声音信号的音频变化处于预设频率范围内时,合成声音信号携带有相应讯息。当合成声音信号的音频变化处于预设频率范围外时,合成声音信号未携带有相应讯息。声源判断模块通过构成声音的各个要素独立或综合判断,以确定输出的合成声音信息内包含有相应地讯息,避免未携带讯息的杂音及噪音通过输出通道向外输出,合成声音信息的输出准确性高,声音辨识度高。

如图2和图3所示,在一实施例中,远场拾音装置包括外壳,声源判断模块、声音合成模块及声音输出模块安装于外壳内,至少部分拾音模块设于外壳的表面。

拾音模块设为麦克风结构,拾音模块安装于外壳并与外壳外的空间连通,以采集相应地声音。可选地,拾音模块的拾音口设于外壳的表面。可选地,外壳开设有与拾音模块连通的孔洞,以使声音能延伸至拾音模块处。外壳的形状可根据应用场景灵活设置,如设为手机的外壳形状、翻译机的外壳形状等,拾音模块按预设的规律分布于壳体上,并根据采集的初始声音信息确定声源的方向,以实现定向获取声音并扩大声音的采集范围,拾音范围大。

本公开实施例公开的远场拾音装置采用于下述的远场拾音方法,以实现声音的远场拾音。

如图4所示,在一实施例中公开一种远场拾音方法,该方法包括以下步骤:

步骤S101:通过多条拾音通道采集至少一个待测声源的初始声音信号。多条拾音通道按预设的方位排布,以使待测声源与每一条拾音通道的距离不同,从而使待测声源发出的声波在每一拾音通道处产生相应地具有相位差异的初始声音信号。其中,待测声源的位置与多条拾音通道之间的位置及角度可相对变化或相对固定。多条拾音通道能接收同一待测声源发出的声波,并将该声波转换成对应的初始声音信号。在一可选地实施例中,拾音通道设为安装于设备的麦克风或拾音元件,可选地,多个麦克风构成麦克风矩阵,以采集待测声源发出的声波并生成相应地初始声音信号。

步骤S102:根据每条拾音通道采集的初始声音信号运算并确定待测声源方向。每一拾音通道根据接收到的待测声源发出的声波,生成相应地初始声音信号,该初始声音信息包含有待测声源发出声波的频率及相位信息。通过程序运行并根据初始声音信息中包含的相位信息及拾音通道所处的位置信息,确定待测声源的方位,以使程序能识别并筛选该待测声源产生的对应初始声音信息,如通过声波传递产生相位差异进行筛选等。

步骤S103:增强并合成对应待测声源方向的初始声音信号以形成合成声音信号。在筛选出符合待测声源发出的初始声音信号后,将相应地初始声音信号进行增强并合成,以提高待测声源输出声波的可辨识度。进一步的,定向采集待测声源发出的初始声音信息,并通过内部程序筛选后进行增强及合成以形成高辨识度的合成声音信号,信号采集方便广,采集精度高。

步骤S104:通过输出通道将合成声音信号输出。

在上述的远场拾音方法中,待测声源发出的声波先通过多条拾音通道采集,再根据声波产生的相位差异确定待测声源的方位,如待测声源位于拾音通道的前端或后端。在待测声源的方位确定后,在每一拾音通道中筛选出该待测声源生成的相应地初始声音信号,并将多条拾音通道之间的初始声音信号进行增强及合成,如采用叠加或其它增强信号的方式进行初始声音信号的增强及合成。

该远场拾音方法能定向采集待测声源发出的声波,指向性好,声波采集准确度高。该远场拾音方法将确定方位的待测声源输出的初始声音信号相应增强并合成,以提高声波的可识别度,拾音范围广,噪音干扰少。

在上述步骤S101中,拾音通道的设置包括以下形式:拾音通道设有四条及以上,其中,至少一条拾音通道与其他的拾音通道处于不同的直线方向。

拾音通道间隔分布并且至少部分拾音通道处于不同的直线上,以使待测声源发出的声波传递至多个拾音通道时,拾音通道采集相应地初始声音信息,该初始声音信息为包含有相位变化信息的电信号。每一条拾音通道均采集相对应的初始声音信息,并且不同的拾音通道之间采集的初始声音信息具有相应的相位差,再通过拾音通道采集的初始声音信息的相位差异运算并确定出待测声源的具体位置,声源的指向性好,定位精度高。

在一实施例中,根据多个初始声音信号的相位差异及拾音通道的所处的方位,确定待测声源的位置。

在一可选地实施例中,至少两条拾音通道处于同一直线上,该直线与其它的拾音通道的连线呈预设角度相交。至少两条拾音通道处于同一直线上,在该直线上还可分布其它拾音通道,以构成多个拾音点,增加待测声源采集位置的数量,提高合成声音信息的质量。其它的拾音通道所处为的位置的连线构成一直线,以使拾音通道按预设的轨迹及角度分布。如两组拾音通道构成的连线相交呈45度、60度、90度等,该拾音通道的分布位置确定并结合多条拾音通道接收到的初始声音信息,可确定待测声源的位置。该远场拾音方法采集声音的指向性好,便于对远场声源的定位及采集,运算方便,定位精度高。可选地,两条拾音通道的连线可理解为拾音通道的拾音口部位的连线或拾音口的中心线的连线。当拾音通道由麦克风结构形成时,该连线可以理解为麦克风中拾音部位的安装位置的连线。

在一可选的实施方式中,拾音通道设有六条,其中三条拾音通道位于第一直线方向,其它三条拾音通道处于第二直线方向。其中,第一直线方向倾斜相交于第二直线方向。在一可选的实施方式中,第一直线方向与第二直线方向的相交角度可设为30度~90度,如第一直线方向与第二直线方向的相交角度设为45度、60度、90度等。

三条拾音通道处于同一直线上并且间隔预设距离,以使声波能大致同时传递至三个拾音通道,以使三条拾音通道所采集的声波的相位大致相同。另外三条拾音通道间隔设置并沿第二直线方向分布,以使得声波传递至每一个拾音通道处产生相应地相位差。

在一具体的实施方式中,第一直线方向与第二直线方向设为90度,将第一直线方向定义为横向,则三条拾音通道位于横向。将第二直线方向定义为纵向,则另外三条拾音通道位于纵向。可选地,位于横向的其中一条拾音通道处于纵向的延长线上,相当于在纵向上形成有四条拾音通道,即位于纵向的三条拾音通道设为横向的一侧。多条拾音通道构成类似于坐标系结构,可精确定位待测声源的方位,并根据待测声源的方位信息筛选并合成高质量的合成声音信息,拾音范围广,音效好。

例如,当待测声源位于横向的另一侧时,待测声源发送的声波在横向的三个拾音通道的相位大致相同,而位于纵向的多个拾音通道通过距离待测声源的远近产生相应的相位差异,则确定待测声源位于横向的另一侧。相应地,通过每一拾音通道采集的声波的相位差异运算并获得待测声源的具体方位,指向性好。在确定待测声源的位置后进一步加强该待测声源输出的初始声音信息,能进行远场的拾音并保证拾音效果的可靠性,拾音范围广。例如,原有的近场拾音技术能准确分辨1米内的声波信息,而该远场拾音技术能准确采集6米内的声波信息,并确定声源所处的方位,指向性好,拾音范围远远大于原有的近场拾音技术。

在一可选地实施例中,拾音通道呈环形间隔分布。拾音通道呈环形分布,能有效采集各个角度的声源发出的初始声音信息,并根据内部运算数据计算出待测声源的位置。再定向加强及合成相应地合成声音信号,其信号采集范围广。

在一可选地实施例中,拾音通道之间的间距大于或等于待测声源发出的声波波长的一半。人发出声音的声波在常温常压下的空气中传播的速度稳定,相应地,声波的波长处于相应地波长范围内。调整相邻拾音通道之间的间距,以使不同的拾音通道采集到的声波具有相应的相位差异,相应地,拾音通道可采集相应地的具有相位差异的初始声音信号。

在一可选地实施例中,相邻两拾音通道的间距相等或间隔距离依次变化,如相邻两拾音通道的间距逐渐增加或逐渐减小。相邻两条拾音通道按预设的间距设置以确定拾音通道的位置,该位置的位置数据结合拾音通道采集的初始声音信息,以确定待测声源的位置及方向。可选地,相邻两拾音通道的间距设为1厘米~3厘米。具体地,该预设距离设为1厘米、2厘米、3厘米等。可选地,将两拾音通道的预设距离大于待测声源发出的声波波长的一半,以准确获取声波在不同拾音通道的相位差异,声波采集准确性高。

在一实施例中,在步骤S103中,增强并合成对应待测声源方向的初始声音信号以形成合成声音信号的方式包括以下方式:

将符合待测声源发出的同一相位差的初始声音信息进行叠加。每个拾音通道均接收到待测声源发出的声波并生成相应地初始声音信息。在确定待测声源的方位后,根据拾音通道采集的初始声音信息进行分析,其中,拾音通道的位置为确定值,同一待测声源在不同的拾音通道处的初始声音信息的相位差为确定范围,即构成同一相位差。将待测声源生成的初始声音信息进行提取并与其它拾音通道提取的同一待测声源的初始声音信息进行叠加,以增强与待测声源相对应的合成声音信息的强度,提高合成声音信息的清晰度及可辨识度,拾音效果好。

在拾音通道中还采集有其它声源发送的初始声音信息,如咳嗽声、放或取物品时的撞击声等杂音,或者其它声源通过拾音通道采集的初始声音信息。相应地,在处理当前的待测声源发出的初始声音信息时,其它声源发出的初始声音信息视为杂音或者通过相应地程序同时运算并通过其它输出通道输出。同理,当处理其它声源时,当前的待测声源发出的初始声音信息也可视为杂音或者通过相应地程序同时运算并通过相应地输出通道输出。

因此,增强待测声源发出的初始声音信息的一种方式可采用:对其它声源发出的不同相位差的初始声音信息进行减弱或过滤。即,通过程序的设定将不是待测声源发出的初始声音信息进行减弱或过滤,以避免其它声波干扰,提高待测声源的合成声音信息的强度,提高声音的可识别度。

在一实施例中,在上述的步骤S104中,通过输出通道将合成声音信号输出,包括:输出通道设有一个及以上,将待测声源的合成声音信息可通过其中一输出通道输出。

在一实施例中,将其它声源向多条所述拾音通道发送的初始声音信息合成相应地合成声音信息,其它声源的合成声音信息通过其它相应的输出通道输出。

输出通道设有一个及以上,不同方位的待测声源生成的合成声音信息能通过对应的输出通道输出,能根据不同的使用场景实现多通道输出,合成声音信息的输出通道丰富,能使应用该远场拾音方法的系统或装置具有更加便捷的操作性。如将该远场拾音方法应用于翻译机上,不同用户的合成声音信息能通过对应的输出通道输出,对应排序并转换成相应地文字信息。

如图5所示,在一实施例中,在上述步骤S104中,通过输出通道将合成声音信号输出之前还需要判断该合成声音信息是否为有效的声音信号,即判断该合成声音信息是否携带有相应的讯息。其包括以下判断步骤:

步骤S201,接收合成声音信号。

步骤S202,判断合成声音信号是否为携带有相应讯息的声音信号。

步骤S203,当合成声音信号为携带有相应讯息的声音信号时,相应地合成声音信号通过输出通道向外输出。

步骤S204,当合成声音信号为未携带有相应讯息的声音信号时,相应地合成声音信号删除。

多条拾音通道采集的初始声音信息合成并形成合成声音信息,其中,该合成声音信息包括待测声源发出的声音信息,该声音信息携带有相应地讯息。如该讯息为发言人所表达带有讯息的语句,该类合成声音信息经判断后通过输出通道向外输出。而其它声源发出的声音信息中未携带有相应地讯息,则该类合成声音信息不能通过相应地输出通道输出。

在一可选地实施例中,判断合成声音信号是否携带有相应讯息的声音信号,可采用判断合成声音信号的音频变化是否符合预设频率范围;和/或,判断合成声音信号的响度变化是否符合预设响度范围;和/或,判断合成声音信号的音色变化是否符合预设音色范围。当然判断合成声音信号是否携带有相应讯息的声音信号,还可采用其它判断方式,如判断声波的持续时长是否大于预设时长。

以判断合成声音信号的音频变化是否符合预设频率范围为例进行说明。当合成声音信号的音频变化处于预设频率范围内时,合成声音信号携带有相应讯息。当合成声音信号的音频变化处于预设频率范围外时,合成声音信号未携带有相应讯息。通过构成声音的各个要素独立或综合判断,以确定输出的合成声音信息内包含有相应地讯息,避免未携带讯息的杂音及噪音通过输出通道向外输出,合成声音信息的输出准确性高,声音辨识度高。

将上述实施例提供远场拾音装置应用于一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;及如上述实施例公开的远场拾音装置。

例如,电子设备70可以是移动电话,计算机,数字广播终端,消息收发设备,游戏控制台,平板设备,医疗设备,健身设备,个人数字助理、翻译机等。

如图6所示,电子设备70可以包括以下一个或多个组件:处理组件71,存储器72,电源组件73,多媒体组件74,音频组件75,输入/输出(I/O)的接口76,传感器组件77,以及通信组件78。

处理组件71通常控制电子设备70的整体操作,诸如与显示,电话呼叫,数据通信,相机操作和记录操作相关联的操作。处理组件71可以包括一个或多个处理器79来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件71可以包括一个或多个模块,便于处理组件71和其他组件之间的交互。例如,处理组件71可以包括多媒体模块,以方便多媒体组件74和处理组件71之间的交互。

存储器72被配置为存储各种类型的数据以支持在电子设备70的操作。这些数据的示例包括用于在电子设备70上操作的任何应用程序或方法的指令,联系人数据,电话簿数据,消息,图片,视频等。存储器72可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。

电源组件73为电子设备70的各种组件提供电力。电源组件73可以包括电源管理系统,一个或多个电源,及其他与为电子设备70生成、管理和分配电力相关联的组件。

多媒体组件74包括在电子设备70和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件74包括一个前置摄像头和/或后置摄像头。当电子设备70处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。

音频组件75被配置为输出和/或输入音频信号。例如,音频组件75包括一个麦克风(MIC),当电子设备70处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器72或经由通信组件78发送。在一些实施例中,音频组件75还包括一个扬声器,用于输出音频信号。

输入/输出(I/O)的接口76为处理组件71和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。

传感器组件77包括一个或多个传感器,用于为电子设备70提供各个方面的状态评估。例如,传感器组件77可以检测到设备的打开/关闭状态,组件的相对定位,例如组件为电子设备70的显示器和小键盘,传感器组件77还可以检测电子设备70或电子设备70一个组件的位置改变,用户与电子设备70接触的存在或不存在,电子设备70方位或加速/减速和电子设备70的温度变化。传感器组件77可以包括接近传感器,被配置用来在没有任何的物理接触时检测附近物体的存在。传感器组件77还可以包括光传感器,如CMOS或CCD图像传感器,用于在成像应用中使用。在一些实施例中,该传感器组件77还可以包括加速度传感器,陀螺仪传感器,磁传感器,压力传感器或温度传感器。

通信组件78被配置为便于电子设备70和其他设备之间有线或无线方式的通信。电子设备70可以接入基于通信标准的无线网络,如WiFi,2G或3G,或它们的组合。在一个示例性实施例中,通信组件78经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,通信组件78还包括近场通信(NFC)模块,以促进短程通信。例如,在NFC模块可基于射频识别(RFID)技术,红外数据协会(IrDA)技术,超宽带(UWB)技术,蓝牙(BT)技术和其他技术来实现。

在示例性实施例中,电子设备70可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。

以上仅为本公开的较佳实施例而已,并不用以限制本公开,凡在本公开的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本公开保护的范围之内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1