数据处理方法及其系统、计算机系统和计算机可读介质与流程

文档序号:18074150发布日期:2019-07-03 04:06阅读:173来源:国知局
数据处理方法及其系统、计算机系统和计算机可读介质与流程

本公开涉及数据处理领域,更具体地,涉及一种用于麦克风阵列的数据处理方法及其系统、计算机系统和计算机可读介质。



背景技术:

对于麦克风阵列中的任意两个麦克风来说,是将两个麦克风的信号耦合为一个信号,即在两个麦克风的正前方形成一个接收区域,进而削减两个麦克风侧向的收音效果。可以建立与麦克风阵列中麦克风的空间布局相匹配的模型,通过计算被测声源到达模型中对应的不同麦克风之间的时间差,即时延估计,来建立时延表,以实现对声源的定位。例如,对于manyears开源工程采用的分别位于正方体八个顶点的麦克风组成的麦克风阵列来说,可以以其中心点为球心,建立由5120个三角形和2562个点组成的全球模型,利用近场假设计算时延。

在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:时延估计与麦克风阵列中麦克风的空间布局密切相关,不同布局的麦克风阵列计算时延的方法也大不相同,上述适用于manyears开源工程的麦克风阵列时延估计方法由于需要建立全球模型,因此并不适用于平面麦克风阵列,因为建立全球模型会增大平面麦克风阵列的时延估计方法的工作量,且估计的精度不高。

针对相关技术中的上述问题,目前还未提出有效的解决方案。



技术实现要素:

有鉴于此,本公开提供了一种用于麦克风阵列的数据处理方法及其系统、计算机系统和计算机可读介质。

本公开的一个方面提供了一种用于麦克风阵列的数据处理方法,其中,上述麦克风阵列中的各麦克风设置在同一个平面上,上述方法包括:获取上述麦克风阵列中至少一个麦克风的位置向量,其中,上述至少一个麦克风的位置向量为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量;获取波面向量,其中,上述波面向量为从声源位置到上述半球模型的球心位置的向量;以及基于上述至少一个麦克风的位置向量以及上述波面向量,确定上述至少一个麦克风的麦克风位置相对于上述半球模型的球心位置的时延。

根据本公开的实施例,上述至少一个麦克风包括第一麦克风和第二麦克风,上述方法还包括:确定上述第一麦克风的第一位置向量以及上述第二麦克风的第二位置向量;以及基于上述第一位置向量、上述第二位置向量和上述波面向量,确定上述第一麦克风和上述第二麦克风之间的时延。

根据本公开的实施例,基于上述第一位置向量、上述第二位置向量和上述波面向量,确定上述第一麦克风和上述第二麦克风之间的时延包括:确定上述第一位置向量投影在上述波面向量上所形成的第一投影向量,以及上述第二位置向量投影在上述波面向量上所形成的第二投影向量;基于上述第一投影向量的模值,确定上述第一麦克风的麦克风位置相对于上述半球模型的球心位置的第一时延,以及基于上述第二投影向量的模值,确定上述第二麦克风的麦克风位置相对于上述半球模型的球心位置的第二时延;以及计算上述第一时延与上述第二时延的差值,得到上述第一麦克风的麦克风位置和上述第二麦克风的麦克风位置之间的时延。

根据本公开的实施例,基于上述第一投影向量的模值,确定上述第一麦克风的麦克风位置相对于上述半球模型的球心位置的第一时延包括:确定上述声源所发出的声波的传播速度;以及基于上述第一投影向量的模值和上述传播速度进行计算,得到上述第一麦克风的麦克风位置相对于上述半球模型的球心位置的第一时延。

根据本公开的实施例,上述方法还包括:计算上述第一位置向量和上述波面向量的点积;以及基于点积计算结果,确定上述第一位置向量投影在上述波面向量上所形成的第一投影向量的模值。

根据本公开的实施例,基于点积计算结果,确定上述第一位置向量投影在上述波面向量上所形成的第一投影向量的模值包括:在上述波面向量为单位向量的情况下,将上述第一位置向量和上述波面向量的点积计算结果直接作为上述第一位置向量投影在上述波面向量上所形成的第一投影向量的模值。

本公开的另一个方面提供了一种用于麦克风阵列的数据处理系统,其中,上述麦克风阵列中的各麦克风设置在同一个平面上,上述系统包括:第一获取模块,用于获取上述麦克风阵列中至少一个麦克风的位置向量,其中,上述至少一个麦克风的位置向量为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量;第二获取模块,用于获取波面向量,其中,上述波面向量为从声源位置到上述半球模型的球心位置的向量;以及第一确定模块,用于基于上述至少一个麦克风的位置向量以及上述波面向量,确定上述至少一个麦克风的麦克风位置相对于上述半球模型的球心位置的时延。

根据本公开的实施例,上述系统还包括:第二确定模块,用于确定上述第一麦克风的第一位置向量以及上述第二麦克风的第二位置向量;以及第三确定模块,用于基于上述第一位置向量、上述第二位置向量和上述波面向量,确定上述第一麦克风和上述第二麦克风之间的时延。

根据本公开的实施例,第三确定模块包括:第一确定单元,用于确定上述第一位置向量投影在上述波面向量上所形成的第一投影向量,以及上述第二位置向量投影在上述波面向量上所形成的第二投影向量;第二确定单元,用于基于上述第一投影向量的模值,确定上述第一麦克风的麦克风位置相对于上述半球模型的球心位置的第一时延,以及基于上述第二投影向量的模值,确定上述第二麦克风的麦克风位置相对于上述半球模型的球心位置的第二时延;以及第一计算单元,用于计算上述第一时延与上述第二时延的差值,得到上述第一麦克风的麦克风位置和上述第二麦克风的麦克风位置之间的时延。

根据本公开的实施例,第二确定单元包括:确定子单元,用于确定上述声源所发出的声波的传播速度;以及处理子单元,用于基于上述第一投影向量的模值和上述传播速度进行计算,得到上述第一麦克风的麦克风位置相对于上述半球模型的球心位置的第一时延。

根据本公开的实施例,上述系统还包括:第二计算单元,用于计算上述第一位置向量和上述波面向量的点积;以及第三确定单元,用于基于点积计算结果,确定上述第一位置向量投影在上述波面向量上所形成的第一投影向量的模值。

根据本公开的实施例,第三确定单元还用于:在上述波面向量为单位向量的情况下,将上述第一位置向量和上述波面向量的点积计算结果直接作为上述第一位置向量投影在上述波面向量上所形成的第一投影向量的模值。

本公开的另一方面提供了一种计算机系统,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,其中,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现上述任一项的用于麦克风阵列的数据处理方法。

本公开的另一方面提供了一种计算机可读介质,其上存储有可执行指令,该指令被处理器执行时使处理器实现上述任一项的用于麦克风阵列的数据处理方法。

根据本公开的实施例,通过建立与平面麦克风阵列中各麦克风的空间布局相匹配的半球模型,并提供了一种适用于二维平面麦克风阵列的时延估计方法,可以至少部分地减轻甚至避免建立并不适用于平面麦克风阵列的全球模型而导致的时延估计的计算工作量大且估计结果精度不高的技术问题,并因此可以实现减少平面麦克风阵列时延估计的计算量,提高计算精度,进而达到改善利用时延计算结果将某一个方向传来的声音增强或抑制的技术效果。

附图说明

通过以下参照附图对本公开实施例的描述,本公开的上述以及其他目的、特征和优点将更为清楚,在附图中:

图1示意性示出了根据本公开实施例的用于麦克风阵列的数据处理方法的应用场景;

图2示意性示出了根据本公开实施例的用于麦克风阵列的数据处理方法的流程图;

图3a示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理方法的流程图;

图3b示意性示出了根据本实施例的确定第一麦克风和第二麦克风之间的时延的流程图;

图3c示意性示出了根据本公开实施例的确定第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延的流程图;

图3d示意性示出了二维平面的向量示意图;

图3e示意性示出了本公开的实施例的麦克风阵列二维平面的向量示意图;

图3f示意性示出了本公开的实施例的麦克风阵列三维空间的向量示意图;

图3g示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理方法的流程图;

图4示意性示出了根据本公开实施例的用于麦克风阵列的数据处理系统的框图;

图5a示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理系统的框图;

图5b示意性示出了根据本实施例的第三确定模块的框图;

图5c示意性示出了根据本公开实施例的第二确定单元的框图;

图5d示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理系统的框图;以及

图6示意性示出了根据本公开实施例的适于实现数据处理的计算机系统的方框图。

具体实施方式

以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。

在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。

在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。

在使用类似于“a、b和c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b和c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。在使用类似于“a、b或c等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有a、b或c中至少一个的系统”应包括但不限于单独具有a、单独具有b、单独具有c、具有a和b、具有a和c、具有b和c、和/或具有a、b、c的系统等)。本领域技术人员还应理解,实质上任意表示两个或更多可选项目的转折连词和/或短语,无论是在说明书、权利要求书还是附图中,都应被理解为给出了包括这些项目之一、这些项目任一方、或两个项目的可能性。例如,短语“a或b”应当被理解为包括“a”或“b”、或“a和b”的可能性。

本公开的实施例提供了一种用于麦克风阵列的数据处理方法,其中,麦克风阵列中的各麦克风设置在同一个平面上,该方法包括:获取麦克风阵列中至少一个麦克风的位置向量,其中,至少一个麦克风的位置向量为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量;获取波面向量,其中,波面向量为从声源位置到半球模型的球心位置的向量;以及基于至少一个麦克风的位置向量以及波面向量,确定至少一个麦克风的麦克风位置相对于半球模型的球心位置的时延。

图1示意性示出了根据本公开实施例的用于麦克风阵列的数据处理方法的应用场景100。需要注意的是,图1所示仅为可以应用本公开实施例的应用场景的示例,以帮助本领域技术人员理解本公开的技术内容,但并不意味着本公开实施例不可以用于其他设备、系统、环境或场景。

如图1所示,该实施例的应用场景100可以为平面麦克风阵列,如二维八麦克圆形麦克风阵列。

随着物联网的发展,智能语音交互技术也成了各大公司关注的重点,并且相继研发出一些产品和研究成果,而这些智能电子产品中的麦克风布局各异,因此计算时延表的方法也各不相同。对立体三维的麦克风阵列来说,八个麦克分别位于正方体的八个顶点。如manyears开源工程,该工程以其中心点为球心,建立全球模型,该全球模型由5120个三角形和2562个点组成,然后使用近场假设,计算时延。

由于平面圆形麦克风阵列只能定位出水平方位角和垂直方位角,不能判断声源是在麦克风平面的上方还是下方,而上述适用于manyears开源工程的麦克风阵列时延估计方法,需要建立全球模型,会导致计算量的增大,因此,适合三维麦克风阵列的时延估计算法并不适用于平面麦克风阵列。

应该理解,图1中的麦克风阵列中麦克风的数目和各麦克风之间的平面布局仅仅是示意性的。根据具体的实现需要,可以具有任意数目的麦克风。

图2示意性示出了根据本公开实施例的用于麦克风阵列的数据处理方法的流程图。

如图2所示,该方法包括在操作s210~s230。其中:

在操作s210,获取麦克风阵列中至少一个麦克风的位置向量。

在操作s220,获取波面向量。

在操作s230,基于至少一个麦克风的位置向量以及波面向量,确定至少一个麦克风的麦克风位置相对于半球模型的球心位置的时延。

需要说明的是,根据声源和麦克风阵列距离的远近,可以将声场模型分为远场模型和近场模型。其中,近场模型可以将声波看成球面波,考虑各麦克风接收声源信号之间的幅度差,而远场模型可以将声波看成平面波,忽略各麦克风接收声源信号之间的幅度差,近似认为各接收信号之间是简单的时延关系,即声源信号到达麦克风阵列中的不同麦克风之间存在时间差。

可以理解的是,依据声源和麦克风阵列距离的远近划分得到的近场模型和远场模型没有绝对的划分标准,相对的,在声源离麦克风阵列中心参考点的距离大于声源信号的波长的情况下,可以视为远场模型,否则视为近场模型。如均匀线性麦克风阵列中任意两个相邻麦克风之间的距离为s,声源信号最高频率语音的波长(即声源的最小波长)为λ,如果声源信号到麦克风阵列中心参考点的距离大于2s2/λ,则该声场模型为远场模型,否则为近场模型。

由于麦克风阵列的应用场景为室内,所以用远场模型建模效果会更好。本公开的实施例将以远场模型为例,提供一种基于半球模型计算平面麦克风阵列时延,以达到对两两麦克风之间接收的语音信号进行时延补偿的目的。

需要说明的是,向量是既有大小又有方向的量,也称为矢量,向量的大小就是向量的长度(或称模),在与麦克风阵列中各麦克风的空间布局相匹配的半球模型中,根据半球模型上的任意一个麦克风的位置(坐标)可以确定出麦克风的位置向量,即该麦克风的位置向量m为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量。由于是远场模型,可以将声源信号看成平面波,波面向量w为从声源位置到半球模型的球心位置的向量。

对麦克风阵列中的任一麦克风来说,声源信号在传播的过程中,可以被该麦克风接收,本公开的实施例以半球模型的球心为参照点,可以根据声源信号到达球心位置与任意一个麦克风的位置的传播距离大小,确定麦克风的麦克风位置相对于所述半球模型的球心位置的时延。具体地,可以根据麦克风的位置向量m以及所述波面向量w,可以根据直角三角形的标准几何学的相关理论,确定麦克风的麦克风位置相对于所述半球模型的球心位置的时延,如向量点积(也称为内积)。

通过本公开的实施例,通过建立与平面麦克风阵列中各麦克风的空间布局相匹配的半球模型,并提供了一种适用于二维平面麦克风阵列的时延估计方法,可以至少部分地减轻甚至避免建立并不适用于平面麦克风阵列的全球模型而导致的时延估计的计算工作量大且估计结果精度不高的技术问题,并因此可以实现减少平面麦克风阵列时延估计的计算量,提高计算精度,进而达到改善利用时延计算结果将某一个方向传来的声音增强或抑制的技术效果。

下面参考图3a~图3g,结合具体实施例对图2所示的方法做进一步说明。

图3a示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理方法的流程图。

如图3a所示,该方法包括操作s311和s312。其中:

在操作s311,确定第一麦克风的第一位置向量以及第二麦克风的第二位置向量。

在操作s312,基于第一位置向量、第二位置向量和波面向量,确定第一麦克风和第二麦克风之间的时延。

根据本公开的实施例,可以基于上述确定麦克风的麦克风位置相对于所述半球模型的球心位置的时延的计算方法,可以确定麦克风阵列中任意两个麦克风之间的时延。此处,对任意两个麦克风在麦克风阵列中的布局不做具体限定。

具体地,在至少一个麦克风包括第一麦克风和第二麦克风的情况下,可以基于第一麦克风的第一位置向量m1和波面向量w,确定第一麦克风与球心的第一波面时延delay1,基于第二麦克风的第二位置向量m2和波面向量w,确定第二麦克风与球心的第二波面时延delay2,根据第一波面时延和第二波面时延确定第一麦克风和第二麦克风之间的时延delay。

通过本公开的实施例,由于采用基于第一位置向量、第二位置向量和波面向量,确定第一麦克风和第二麦克风之间的时延的技术方案,可以至少部分地减轻甚至避免建立并不适用于平面麦克风阵列的全球模型而导致的时延估计的计算工作量大且估计结果精度不高的技术问题,并因此可以实现减少平面麦克风阵列时延估计的计算量,提高计算精度,进而达到改善利用时延计算结果将某一个方向传来的声音增强或抑制的技术效果。

图3b示意性示出了根据本实施例的基于第一位置向量、第二位置向量和波面向量,确定第一麦克风和第二麦克风之间的时延的流程图。

如图3b所示,该方法包括操作s321~s323。其中:

在操作s321,确定第一位置向量投影在波面向量上所形成的第一投影向量,以及第二位置向量投影在波面向量上所形成的第二投影向量。

在操作s322,基于第一投影向量的模值,确定第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延,以及基于第二投影向量的模值,确定第二麦克风的麦克风位置相对于半球模型的球心位置的第二时延。

在操作s323,计算第一时延与第二时延的差值,得到第一麦克风的麦克风位置和第二麦克风的麦克风位置之间的时延。

需要说明的是,波面向量可以理解为声源信号通过半球模型的球心位置处的传播距离,将麦克风的位置向量投影在波面向量上即可得到麦克风相对于球心的传播距离差。

根据本公开的实施例,确定第一位置向量m1投影在波面向量w上所形成的第一投影向量d1,以及第二位置向量m2投影在波面向量w上所形成的第二投影向量d2。

同理,基于第一投影向量d1的模值,确定第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延delay1,以及基于第二投影向量d2的模值,确定第二麦克风的麦克风位置相对于半球模型的球心位置的第二时延delay2。

通过本公开的实施例,通过向量点积的方法,给两个麦克风之间的时延计算提供了一种简单快捷的计算思路,使得时延估算更加简便,计算量大大降低,提高了时延估算效率,改善了麦克风阵列接收声源信号的效果。

图3c示意性示出了根据本公开实施例的基于第一投影向量的模值,确定第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延的流程图。

如图3c所示,该方法包括操作s331~s332。其中:

在操作s331,确定声源所发出的声波的传播速度。

在操作s332,基于第一投影向量的模值和传播速度进行计算,得到第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延。

具体地,对麦克风阵列中任意一个麦克风来说,如第一麦克风,根据运动学理论可知,声源信号到达该麦克风位置与到达半球模型的球心位置的时延可以通过以下方式获得:确定声源信号到达该麦克风与声源信号到达半球模型的球心之间的传播距离的差值,基于该传播距离的差值和声源信号的传播速度v即可确定出该麦克风和球心接收该声源信号的时间差delay1,即时延。

如图3d所示的二维平面,向量c是向量a在b上的投影。

a·b=|a||b|cosθ

a·b=axbx+ayby

|c|=|a|cosθ

使用直角三角形的标准几何学,根据向量a的长度和两个向量之间的夹角θ,可以得到向量c的长度。

|c|=|a|cosθ

使用向量点积的计算公式,可以根据向量a和b的点积以及向量b的长度,重新整理出向量c的长度。

a·b=|a||b|cosθ

将上述向量点积计算的方法应用在计算波面时延场景中,如图3e所示,使用的两个向量是麦克风的位置向量和波面向量。具体地,该平面波到达麦克风阵列中该麦克风和到达球心的时延可以根据图示中的向量d计算得出,而该向量为麦克风的位置向量m在波面向量w上的投影,向量d的模值为该平面波到达麦克风阵列中该麦克风的传播距离与该平面波到达球心的传播距离的差值。具体的根据麦克风的位置向量m和波面向量w得出向量d的过程下文将详细介绍,此处不再赘述。

如图3f所示的三维空间,对本公开的实施例做进一步地详细说明。具体地,在三维空间中,可以确定第一麦克风的位置坐标为(mx1,my1,mz1),第二麦克风的位置坐标为(mx2,my2,mz2),波面源的方向角分别为φ(00≤φ≤900),θ(-1800≤θ≤1800)。

根据本公开的实施例,在确定出第一投影向量d1之后,可以依据第一投影向量d1的模值和声波的传播速度v,得到第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延delay1。

同理,在确定出第二投影向量d2之后,可以依据第二投影向量d2的模值和声波的传播速度v,得到第二麦克风的麦克风位置相对于半球模型的球心位置的第二时延delay2。

具体地,基于第一投影向量d1的模值和传播速度v进行计算,得到第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延delay1的计算公式如下:

如上所述,以球心为参考点,第一麦克风的时延delayl为:

同理,第二麦克风的时延delay2为:

需要说明的是,麦克风阵列可以通过不同的采样率来采集声源信号,因此,在根据第一波面时延delay1和第二波面时延delay2确定第一麦克风和第二麦克风之间的时延delay的时候,还可以考虑麦克风阵列对声源信号的采样率samplingrate,具体计算公式如下:

delay=(delay1-delay2)*samplingrate

通过本公开的实施例,利用向量既有大小又有方向的属性,将麦克风的时延计算巧妙的转换为向量点积,向量的模值为时延对应的声源的传播距离,结合声源所发出的声波的传播速度,可以得到麦克风的麦克风位置相对于所述半球模型的球心位置的时延,减少计算量,提供时延估计效率,改善麦克风接收的效果。

图3g示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理方法的流程图。

如图3g所示,该方法包括操作s341~s342。其中:

在操作s341,计算第一位置向量和波面向量的点积。

在操作s342,基于点积计算结果,确定第一位置向量投影在波面向量上所形成的第一投影向量的模值。

根据本公开的实施例,根据位置向量和波面向量的点积,可以确定第一位置向量投影在波面向量上所形成的第一投影向量的模值。

同理,根据位置向量和波面向量的点积,可以确定第二位置向量投影在波面向量上所形成的第二投影向量的模值。

通过本公开的实施例,通过向量点积的方法,给两个麦克风之间的时延计算提供了一种简单快捷的计算思路,使得时延估算更加简便,计算量大大降低,提高了时延估算效率,改善了麦克风阵列接收声源信号的效果。

根据本公开的实施例,在波面向量w为单位向量的情况下,即|w|=1的情况下,将第一位置向量和波面向量的点积计算结果直接作为第一位置向量投影在波面向量上所形成的第一投影向量的模值。即:

可以根据水平方位角θ和垂直方位角φ将波面转换为波面向量w(wx,wy,wz)。

波面源的方向角分别为φ,θ,将波面方向转化为单位向量:

用pythagoras定理检查得知,(wx,wv,wz)为单位向量。具体地转换方法,此处不再赘述。

通过本公开的实施例,由于采用将波面向量简化为单位向量的技术方案,可以大幅度减少时延计算的计算量,提高计算效率。

图4示意性示出了根据本公开实施例的用于麦克风阵列的数据处理系统的框图。

如图4所示,该系统400包括第一获取模块410、第二获取模块420和第一确定模块430。其中:

第一获取模块410用于获取麦克风阵列中至少一个麦克风的位置向量,其中,至少一个麦克风的位置向量为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量。

第二获取模块420用于获取波面向量,其中,波面向量为从声源位置到半球模型的球心位置的向量。

第一确定模块430用于基于至少一个麦克风的位置向量以及波面向量,确定至少一个麦克风的麦克风位置相对于半球模型的球心位置的时延。

可以理解的是,第一获取模块410、第二获取模块420和第一确定模块430可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本发明的实施例,第一获取模块410、第二获取模块420和第一确定模块430中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(fpga)、可编程逻辑阵列(pla)、片上系统、基板上的系统、封装上的系统、专用集成电路(asic),或可以以对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式的适当组合来实现。或者,第一获取模块410、第二获取模块420和第一确定模块430中的至少一个可以至少被部分地实现为计算机程序模块,当该程序被计算机运行时,可以执行相应模块的功能。

通过本公开的实施例,通过建立与平面麦克风阵列中各麦克风的空间布局相匹配的半球模型,并提供了一种适用于二维平面麦克风阵列的时延估计方法,可以至少部分地减轻甚至避免建立并不适用于平面麦克风阵列的全球模型而导致的时延估计的计算工作量大且估计结果精度不高的技术问题,并因此可以实现减少平面麦克风阵列时延估计的计算量,提高计算精度,进而达到改善利用时延计算结果将某一个方向传来的声音增强或抑制的技术效果。

图5a示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理系统的框图。

如图5a所示,该系统400还包括第二确定模块511和第三确定模块512。其中:

第二确定模块511用于确定第一麦克风的第一位置向量以及第二麦克风的第二位置向量。

第三确定模块512用于基于第一位置向量、第二位置向量和波面向量,确定第一麦克风和第二麦克风之间的时延。

通过本公开的实施例,由于采用基于第一位置向量、第二位置向量和波面向量,确定第一麦克风和第二麦克风之间的时延的技术方案,可以至少部分地减轻甚至避免建立并不适用于平面麦克风阵列的全球模型而导致的时延估计的计算工作量大且估计结果精度不高的技术问题,并因此可以实现减少平面麦克风阵列时延估计的计算量,提高计算精度,进而达到改善利用时延计算结果将某一个方向传来的声音增强或抑制的技术效果。

图5b示意性示出了根据本实施例的第三确定模块的框图。

如图5b所示,第三确定模块512包括第一确定单元521、第二确定单元522和第一计算单元523。其中:

第一确定单元521用于确定第一位置向量投影在波面向量上所形成的第一投影向量,以及第二位置向量投影在波面向量上所形成的第二投影向量。

第二确定单元522用于基于第一投影向量的模值,确定第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延,以及基于第二投影向量的模值,确定第二麦克风的麦克风位置相对于半球模型的球心位置的第二时延。

第一计算单元523用于计算第一时延与第二时延的差值,得到第一麦克风的麦克风位置和第二麦克风的麦克风位置之间的时延。

通过本公开的实施例,通过向量点积的方法,给两个麦克风之间的时延计算提供了一种简单快捷的计算思路,使得时延估算更加简便,计算量大大降低,提高了时延估算效率,改善了麦克风阵列接收声源信号的效果。

图5c示意性示出了根据本公开实施例的第二确定单元的框图。

如图5c所示,第二确定单元522包括确定子单元531和处理子单元532。其中:

确定子单元531用于确定声源所发出的声波的传播速度。

处理子单元532用于基于第一投影向量的模值和传播速度进行计算,得到第一麦克风的麦克风位置相对于半球模型的球心位置的第一时延。

通过本公开的实施例,利用向量既有大小又有方向的属性,将麦克风的时延计算巧妙的转换为向量点积,向量的模值为时延对应的声源的传播距离,结合声源所发出的声波的传播速度,可以得到麦克风的麦克风位置相对于所述半球模型的球心位置的时延,减少计算量,提供时延估计效率,改善麦克风接收的效果。

图5d示意性示出了根据本公开另一实施例的用于麦克风阵列的数据处理系统的框图。

如图5d所示,该系统还包括第二计算单元541和第三确定单元542。其中:

第二计算单元541用于计算第一位置向量和波面向量的点积。

第三确定单元542用于基于点积计算结果,确定第一位置向量投影在波面向量上所形成的第一投影向量的模值。

通过本公开的实施例,通过向量点积的方法,给两个麦克风之间的时延计算提供了一种简单快捷的计算思路,使得时延估算更加简便,计算量大大降低,提高了时延估算效率,改善了麦克风阵列接收声源信号的效果。

根据本公开的实施例,基于点积计算结果,确定第一位置向量投影在波面向量上所形成的第一投影向量的模值包括:在波面向量为单位向量的情况下,将第一位置向量和波面向量的点积计算结果直接作为第一位置向量投影在波面向量上所形成的第一投影向量的模值。

通过本公开的实施例,由于采用将波面向量简化为单位向量的技术方案,可以大幅度减少时延计算的计算量,提高计算效率。

图6示意性示出了根据本公开实施例的适于实现数据处理的计算机系统的方框图。图6示出的计算机系统仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图6所示,根据本公开实施例的计算机系统600包括处理器601,其可以根据存储在只读存储器(rom)602中的程序或者从存储部分608加载到随机访问存储器(ram)603中的程序而执行各种适当的动作和处理。处理器601例如可以包括通用微处理器(例如cpu)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(asic)),等等。处理器601还可以包括用于缓存用途的板载存储器。处理器601可以包括用于执行参考图2以及图3a~图3g描述的根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。

在ram603中,存储有系统600操作所需的各种程序和数据。处理器601、rom602以及ram603通过总线604彼此相连。处理器601通过执行rom602和/或ram603中的程序来执行以上参考图2以及图3a~图3g描述的数据处理方法的各种操作。需要注意,所述程序也可以存储在除rom602和ram603以外的一个或多个存储器中。处理器601也可以通过执行存储在所述一个或多个存储器中的程序来执行以上参考图2以及图3a~图3g描述的数据处理方法的各种操作。

根据本公开的实施例,系统600还可以包括输入/输出(i/o)接口605,输入/输出(i/o)接口605也连接至总线604。系统600还可以包括连接至i/o接口605的以下部件中的一项或多项:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(crt)、液晶显示器(lcd)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如lan卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至i/o接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。

根据本公开的实施例,上文参考流程图描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被处理器601执行时,执行本公开实施例的系统中限定的上述功能。根据本公开的实施例,上文描述的系统、设备、装置、模块、单元等可以通过计算机程序模块来实现。

需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、rf等等,或者上述的任意合适的组合。根据本公开的实施例,计算机可读介质可以包括上文描述的rom602和/或ram603和/或rom602和ram603以外的一个或多个存储器。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

作为另一方面,本公开还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行数据处理方法,包括:获取麦克风阵列中至少一个麦克风的位置向量,其中,至少一个麦克风的位置向量为从与麦克风阵列中各麦克风的空间布局相匹配的半球模型的球心位置到对应的麦克风位置的向量;获取波面向量,其中,波面向量为从声源位置到半球模型的球心位置的向量;以及基于至少一个麦克风的位置向量以及波面向量,确定至少一个麦克风的麦克风位置相对于半球模型的球心位置的时延。

以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1