麦克风阵列指向的调整方法和装置与流程

文档序号:11279739阅读:804来源:国知局
麦克风阵列指向的调整方法和装置与流程

本发明涉及麦克风技术领域,尤其涉及一种麦克风阵列指向的调整方法和装置。



背景技术:

线控耳机已经在人们的日常生活中被广泛使用。比如,人们可以通过线控耳机控制诸如手机终端中音乐的播放、音量的调整,还可以通过线控耳机与朋友进行语音通话。

为了保证通话质量,在线控耳机中一般都会设置有麦克风阵列,通常使用的麦克风阵列包含双麦克阵列,当然,也有包含更多麦克风的麦克风阵列。

在使用线控耳机进行通话的过程中,由于用户的使用习惯不同,有的喜欢线控自然下垂,有的喜欢用手拿着线控,因此容易导致麦克风阵列的指向发生改变,使得在通话过程中麦克风阵列并非保持指向用户嘴部方向,即声源方向,导致通话语音质量不佳。



技术实现要素:

有鉴于此,本发明提供一种麦克风阵列指向的调整方法和装置,通过调整麦克风阵列一直指向声源方向,以保证通话质量。

第一方面,本发明实施例提供一种麦克风阵列指向的调整方法,包括:

通过麦克风阵列接收多路语音信号,所述多路语音信号与所述麦克风阵列中的多个麦克风一一对应;

对所述多路语音信号中的至少两路语音信号进行相关性分析;

根据所述相关性分析结果和所述至少两路语音信号的传播距离差,确定声源向所述麦克风阵列的声源入射角;

根据所述声源入射角调整所述麦克风阵列的主瓣方向。

可选地,所述至少两路语音信号包括第一语音信号s1(t)和第二语音信号s2(t),以及,所述对所述多路语音信号中的至少两路语音信号进行相关性分析,包括:

确定所述第一语音信号s1(t)与所述第二语音信号s2(t)的相关函数corr[s1(t),s2(t+t12)]在最大值时所对应的传播时间差t12(0);

其中,t12为所述第一语音信号s1(t)与所述第二语音信号s2(t)的传播时间差范围,t12=[-l12/c,l12/c],l12为所述第一语音信号s1(t)与所述第二语音信号s2(t)对应的两个麦克风之间的距离,c为声速。

可选地,所述根据所述相关性分析结果和所述至少两路语音信号的传播距离差,确定声源向所述麦克风阵列的声源入射角,包括:

根据如下公式确定第一声源入射角θ12:a12=l12·cos(θ12)=t12(0)·c;

其中,a12为所述第一语音信号s1(t)与所述第二语音信号s2(t)的传播距离差;

所述根据所述声源入射角调整所述麦克风阵列的主瓣方向,包括:

根据所述第一声源入射角θ12调整所述麦克风阵列的主瓣方向。

可选地,所述至少两路语音信号还至少包括第三语音信号s3(t),所述方法还包括:

根据所述第三语音信号s3(t)和第四语音信号s4(t),确定第二声源入射角θ34,其中,所述第四语音信号s4(t)与所述第一语音信号s1(t)或所述第二语音信号s2(t)相同或不同;

若根据所述第一声源入射角θ12调整后的主瓣方向与所述第二声源入射角θ34的角度偏差大于预设阈值,则根据所述第二声源入射角θ34再调整所述麦克风阵列的主瓣方向。

可选地,所述对所述多路语音信号中的至少两路语音信号进行相关性分析,包括:

对于所述多路语音信号中的任意两个语音信号,确定所述任意两个语音信号的相关函数在最大值时所对应的传播时间差;

所述根据所述相关性分析结果和所述至少两路语音信号的传播距离差,确定声源向所述麦克风阵列的声源入射角,包括:

根据所述任意两个语音信号的传播距离差和所述任意两个语音信号的相关函数在最大值时所对应的传播时间差,确定所述任意两个语音信号对应的声源入射角;

确定所述声源向所述麦克风阵列的第二声源入射角为:全部的任意两个语音信号对应的声源入射角的均值。

第二方面,本发明实施例提供一种麦克风阵列指向的调整装置,包括:

接收模块,用于通过麦克风阵列接收多路语音信号,所述多路语音信号与所述麦克风阵列中的多个麦克风一一对应;

确定模块,用于对所述多路语音信号中的至少两路语音信号进行相关性分析;根据所述相关性分析结果和所述至少两路语音信号的传播距离差,确定声源向所述麦克风阵列的声源入射角;

调整模块,用于根据所述声源入射角调整所述麦克风阵列的主瓣方向。

本发明提供的麦克风阵列指向的调整方法和装置,当用户触发通过线控耳机通话时,通过包含多个麦克风的麦克风阵列接收多路语音信号,进而通过对多路语音信号中的至少两路语音信号进行相关性分析,基于相关性分析结果和至少两路语音信号的传播距离差与该分析结果的关联关系,可以确定在线控耳机处于当前的状态下时,声源向麦克风阵列的声源入射角,以便于基于该声源入射角调整麦克风阵列的主瓣方向,使得主瓣方向指向该声音入射角方向,以保证输出的通话语音的信号质量。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的麦克风阵列指向的调整方法实施例一的流程图;

图2为麦克风阵列在实际使用时的位置形态的示意图;

图3为一种双麦克风阵列的结构示意图;

图4为本发明实施例提供的麦克风阵列指向的调整方法实施例二的流程图;

图5为确定声源入射角的原理示意图;

图6为本发明实施例提供的麦克风阵列指向的调整方法实施例三的流程图;

图7为本发明实施例提供的麦克风阵列指向的调整装置的结构示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

应当理解,尽管在本发明实施例中可能采用术语第一、第二、第三等来描述xxx,但这些xxx不应限于这些术语。这些术语仅用来将xxx区分开。例如,在不脱离本发明实施例范围的情况下,第一xxx也可以被称为第二xxx,类似地,第二xxx也可以被称为第一xxx。

取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者系统中还存在另外的相同要素。

进一步值得说明的是,本发明各实施例中各步骤之间的顺序是可以调整的,不是必须按照以下举例的顺序执行。

图1为本发明实施例提供的麦克风阵列指向的调整方法实施例一的流程图,本实施例提供的该麦克风阵列指向的调整方法可以由一麦克风阵列指向的调整装置来执行,该麦克风阵列指向的调整装置可以实现为软件,或者实现为软件和硬件的组合,该麦克风阵列指向的调整装置可以集成设置在线控耳机中。如图1所示,该方法包括如下步骤:

101、通过麦克风阵列接收多路语音信号。

102、对多路语音信号中的至少两路语音信号进行相关性分析。

103、根据相关性分析结果和至少两路语音信号的传播距离差,确定声源向麦克风阵列的声源入射角。

104、根据声源入射角调整麦克风阵列的主瓣方向。

本发明实施例中,该麦克风阵列可以是双麦克风阵列,也可以是由超过两个麦克风组成的多麦克风阵列。上述多路语音信号与麦克风阵列中的多个麦克风一一对应,即为各麦克风接收到的用户的连续语音信号。

如图2所示,用户在使用含有麦克风阵列的耳机进行通话的过程中,由于个人使用习惯的不同,耳机可能呈现各种不同的形态,导致麦克风阵列可能呈现不同的位置形态。而如果不对麦克风阵列的主瓣方向进行调整,那么在不同位置处,麦克风阵列的主瓣方向指向不同,很可能不会指向声源方向,导致基于接收到的多路语音信号最终合成的语音信号质量不佳,影响通话效果。

因此,本发明实施例中,为保证语音通话质量,当用户触发语音通话需求后,通过对麦克风阵列主瓣方向进行适应性调整,使得其主瓣方向指向声源方向。

可选地,本实施例提供的上述麦克风阵列指向的调整方法的执行时机,可以是在用户触发呼叫某用户,该用户接听后开始,也可以是在用户被呼叫,触发接听电话开始,还可以是在用户按下触发调整的某预设按钮后开始。如图3所示,图3中示意出的双麦克风阵列结构中,可以设置一按钮,当用户开始通话时,或者在通话的过程中改变耳机的位置形态时,可以按下该按钮,以触发对麦克风阵列主瓣方向的调整。

因此,当上述举例的触发条件满足时,可以通过麦克风阵列接收到多路语音信号。为了调整麦克风阵列的主瓣方向使其指向声源方向,首先需要确定出相对于当前麦克风阵列所保持的位置形态的声源入射角,以便根据该声源入射角,通过波束成形调整麦克风阵列的主瓣指向,使其指向声源方向。

而确定声源入射角,可以先对多路语音信号中的至少两路语音信号进行相关性分析,进而根据相关性分析结果和该至少两路语音信号的传播距离差,确定声源向麦克风阵列的声源入射角。

可选地,当麦克风阵列中包含了三个或三个以上的麦克风时,上述至少两路语音信号可以是从麦克风阵列中随机选定的全部或部分麦克风。

可选地,对上述至少两路语音信号进行相关性分析,可以采用相关函数的方式实现,也可以采用卷积运算的方式实现。该相关性分析的主要目的可以是:寻找使得该至少两路语音信号相关程度最强的传播参数,该传播参数可以是传播时间差。

以任意两个麦克风为例,由于麦克风1和麦克风2相距声源的距离不同,同一声源发出的同一语音信号传播到麦克风1和麦克风2时的时间也不相同,比如:同一语音信号在某时刻t1传播到麦克风1,由麦克风1接收,在之后的另一时刻t2传播到麦克风2,由麦克风2接收,则t2-t1这一时间差是使得麦克风1和麦克风2接收到的两路语音信号相关性最强的传播时间差。

经过上述相关性分析得到至少两路语音信号的传播时间差后,基于传播时间差与传播距离差的对应关系以及结合传播距离差与声源入射角的对应关系,可以确定麦克风阵列对应的声源入射角,从而通过波束成形调整麦克风阵列的主瓣方向,以指向声源方向。

本实施例中,当用户触发通过线控耳机通话时,通过包含多个麦克风的麦克风阵列接收多路语音信号,进而通过对多路语音信号中的至少两路语音信号进行相关性分析,基于相关性分析结果和至少两路语音信号的传播距离差与该分析结果的关联关系,可以确定在线控耳机处于当前的状态下时,声源向麦克风阵列的声源入射角,以便于基于该声源入射角调整麦克风阵列的主瓣方向,使得主瓣方向指向该声音入射角方向,以保证输出的通话语音的信号质量。

图4为本发明实施例提供的麦克风阵列指向的调整方法实施例二的流程图,如图4所示,可以包括如下步骤:

201、通过麦克风阵列接收多路语音信号。

202、对于多路语音信号中的第一语音信号s1(t)和第二语音信号s2(t),确定第一语音信号s1(t)与第二语音信号s2(t)的相关函数corr[s1(t),s2(t+t12)]在最大值时所对应的传播时间差t12(0)。

其中,t12为第一语音信号s1(t)与第二语音信号s2(t)的传播时间差范围,t12=[-l12/c,l12/c],l12为第一语音信号s1(t)与第二语音信号s2(t)对应的两个麦克风之间的距离,c为声速。

203、根据如下公式确定第一声源入射角θ12:a12=l12·cos(θ12)=t12(0)·c。

其中,a12为第一语音信号s1(t)与第二语音信号s2(t)的传播距离差。

204、根据第一声源入射角θ12调整麦克风阵列的主瓣方向。

在麦克风阵列中仅包含麦克风1和麦克风2时,麦克风1和麦克风2分别用于接收上述第一语音信号s1(t)与第二语音信号s2(t),则通过上述步骤的处理即可完成对麦克风阵列主瓣方向指向的调整。而当麦克风阵列中不仅包含麦克风1和麦克风2,还包括其他麦克风比如麦克风3、麦克风4时,用于接收上述第一语音信号s1(t)与第二语音信号s2(t)的上述麦克风1和麦克风2可以是麦克风阵列中的任意两个麦克风。

本实施例中,对麦克风阵列接收到的多路语音信号中的至少两路语音信号进行相关性分析,可以采用相关函数的方式进行分析。具体来说,可以先计算求得第一语音信号s1(t)与第二语音信号s2(t)的相关函数corr[s1(t),s2(t+t12)]在最大值时所对应的传播时间差t12(0)。

具体地,可以预先存储有麦克风1和麦克风2之间的距离l12,以便基于该距离确定第一语音信号s1(t)与第二语音信号s2(t)的传播时间差的取值范围:t12=[-l12/c,l12/c]。进而,可以以一定步长逐个尝试该取值范围内的各传播时间差取值,以得到在取不同传播时间差取值时相关函数的函数值,从中选出函数值最大时对应的传播时间差t12(0)。进而,基于传播距离差与传播时间差、两个麦克风相距的距离、声源入射角的对应关系,即基于上述公式得到第一声源入射角θ12。根据第一声源入射角θ12调整麦克风阵列的主瓣方向。该第一声源入射角的确定原理可以参见图5所示。

205、对于多路语音信号中的第三语音信号s3(t)和第四语音信号s4(t),根据第三语音信号s3(t)和第四语音信号s4(t),确定第二声源入射角θ34。

其中,第四语音信号s4(t)与第一语音信号s1(t)或第二语音信号s2(t)相同或不同。

206、若根据第一声源入射角θ12调整后的主瓣方向与第二声源入射角θ34的角度偏差大于预设阈值,则根据第二声源入射角θ34再调整麦克风阵列的主瓣方向。

本实施例中,可选地,可以不管麦克风阵列中除了麦克风1和麦克风2之外是否还包含其他麦克风,以第一声源入射角θ12作为唯一的调整麦克风阵列主瓣方向的依据。但是,为了提高调整准确性,即提高麦克风阵列主瓣方向指向声源方向的准确性,当麦克风阵列中还包含其他麦克风时,还可以继续结合其他麦克风对基于第一声源入射角θ12调整后的麦克风阵列的主瓣方向再进行调整。此时,进行该再次调整时所采用的麦克风只要是不与已经使用的麦克风1和麦克风2完全一致即可,比如,假设麦克风阵列中还包含麦克风3,则可以再结合麦克风3与麦克风1或麦克风2对麦克风阵列的主瓣方向再进行调整。

从而,假设上述的第三语音信号s3(t)和第四语音信号s4(t)为与第一语音信号s1(t)与第二语音信号s2(t)不同的两路语音信号,则参见对第一语音信号s1(t)与第二语音信号s2(t)进行相关性分析的处理方法,可以得到第三语音信号s3(t)和第四语音信号s4(t)对应的传播时间差t34(0),进而确定对应的第二声源入射角θ34。当根据第一声源入射角θ12调整后的主瓣方向与第二声源入射角θ34的角度偏差大于预设阈值时,说明之前基于第一声源入射角θ12调整后的麦克风阵列的主瓣方向未能够很好地指向声源方向,则根据第二声源入射角θ34再次调整麦克风阵列的主瓣方向,相反地,如果根据第一声源入射角θ12调整后的主瓣方向与第二声源入射角θ34的角度偏差小于或等于预设阈值,说明之前基于第一声源入射角θ12调整后的麦克风阵列的主瓣方向已经能够很好地指向声源方向,则无需再次调整。一般地,该预设阈值可以设置在5度左右。

本实施例中,通过对多路语音信号中的至少两路语音信号进行相关性分析,以确定在线控耳机处于当前的状态下时,声源向麦克风阵列的声源入射角,以便于基于该声源入射角调整麦克风阵列的主瓣方向,使得主瓣方向指向该声音入射角方向,以保证输出的通话语音的信号质量。

图6为本发明实施例提供的麦克风阵列指向的调整方法实施例三的流程图,如图6所示,可以包括如下步骤:

301、通过麦克风阵列接收多路语音信号。

302、对于多路语音信号中的任意两个语音信号,确定任意两个语音信号的相关函数在最大值时所对应的传播时间差。

303、根据所述任意两个语音信号的传播距离差和所述任意两个语音信号的相关函数在最大值时所对应的传播时间差,确定所述任意两个语音信号对应的声源入射角。

304、确定声源向麦克风阵列的声源入射角为:全部的任意两个语音信号对应的声源入射角的均值。

305、根据声源入射角调整麦克风阵列的主瓣方向。

本实施例中,假设麦克风阵列包含麦克风1、麦克风2、麦克风3,分别用于接收第一语音信号、第二语音信号和第三语音信号。针对麦克风1和麦克风2接收到的第一语音信号和第二语音信号,可以参见上述实施例的方法,得到对应的传播时间差t12(0),进而,基于该传播时间差t12(0)确定第一声源入射角θ12。针对麦克风1和麦克风3接收到的第一语音信号和第三语音信号,可以参见上述实施例的方法,得到对应的传播时间差t13(0)进而,基于该传播时间差t13(0)确定第二声源入射角θ13。针对麦克风2和麦克风3接收到的第二语音信号和第三语音信号,可以参见上述实施例的方法,得到对应的传播时间差t23(0)进而,基于该传播时间差t23(0)确定第三声源入射角θ23。最后,确定声源向麦克风阵列的声源入射角为:全部的任意两个语音信号对应的声源入射角的均值,即为θ12、θ13、θ23的均值,根据该平均声源入射角调整麦克风阵列的主瓣方向,使得主瓣方向指向该声音入射角方向,以保证输出的通话语音的信号质量。

图7为本发明实施例提供的麦克风阵列指向的调整装置的结构示意图,如图7所示,该装置包括:接收模块11、确定模块12、调整模块13。

接收模块11,用于通过麦克风阵列接收多路语音信号,所述多路语音信号与所述麦克风阵列中的多个麦克风一一对应。

确定模块12,用于对所述多路语音信号中的至少两路语音信号进行相关性分析;根据所述相关性分析结果和所述至少两路语音信号的传播距离差,确定声源向所述麦克风阵列的声源入射角。

调整模块13,用于根据所述声源入射角调整所述麦克风阵列的主瓣方向。

可选地,所述至少两路语音信号包括第一语音信号s1(t)和第二语音信号s2(t),以及,所述确定模块12包括:第一确定单元121、第二确定单元122。

第一确定单元121,用于确定所述第一语音信号s1(t)与所述第二语音信号s2(t)的相关函数corr[s1(t),s2(t+t12)]在最大值时所对应的传播时间差t12(0)。

其中,t12为所述第一语音信号s1(t)与所述第二语音信号s2(t)的传播时间差范围,t12=[-l12/c,l12/c],l12为所述第一语音信号s1(t)与所述第二语音信号s2(t)对应的两个麦克风之间的距离,c为声速。

第二确定单元122,用于根据如下公式确定第一声源入射角θ12:

a12=l12·cos(θ12)=t12(0)·c;其中,a12为所述第一语音信号s1(t)与所述第二语音信号s2(t)的传播距离差。

可选地,所述调整模块13包括:第一调整单元131。

第一调整单元131,用于根据所述第一声源入射角θ12调整所述麦克风阵列的主瓣方向。

可选地,所述至少两路语音信号还至少包括第三语音信号s3(t),所述确定模块12还包括:第三确定单元123。

第三确定单元123,用于根据所述第三语音信号s3(t)和第四语音信号s4(t),确定第二声源入射角θ34,其中,所述第四语音信号s4(t)与所述第一语音信号s1(t)或所述第二语音信号s2(t)相同或不同。

其中,第三确定单元123的实现过程可以参见第一确定单元121和第二确定单元122的实现过程。

所述调整模块13还包括:第二调整单元132。

第二调整单元132,用于若根据所述第一声源入射角θ12调整后的主瓣方向与所述第二声源入射角θ34的角度偏差大于预设阈值,则根据所述第二声源入射角θ34再调整所述麦克风阵列的主瓣方向。

可选地,所述确定模块12还包括:第四确定单元124、第五确定单元125、第六确定单元126。

第四确定单元124,用于对于所述多路语音信号中的任意两个语音信号,确定所述任意两个语音信号的相关函数在最大值时所对应的传播时间差。

第五确定单元125,用于根据所述任意两个语音信号的传播距离差和所述任意两个语音信号的相关函数在最大值时所对应的传播时间差,确定所述任意两个语音信号对应的声源入射角。

第六确定单元126,用于确定所述声源向所述麦克风阵列的声源入射角为:全部的任意两个语音信号对应的声源入射角的均值。

图7所示装置可以执行图1、图4、图6所示实施例的方法,本实施例未详细描述的部分,可参考对图1、图4、图6所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1、图4、图6所示实施例中的描述,在此不再赘述。

以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1