音频信号校正方法、装置及设备与流程

文档序号:11262560阅读:311来源:国知局
音频信号校正方法、装置及设备与流程

本发明涉及信号处理技术领域,特别涉及一种音频信号校正方法、装置及设备。



背景技术:

麦克风阵列由于采用了空间滤波技术,因而具有较好的抗噪性能、抗干扰性能和抗混响性能,其逐渐替代了传统的单一麦克风,而广泛应用于远场语音采集等技术领域。

麦克风阵列的后续语音增强处理环节(如声源定位、波束形成等)要求其各通道普通音频信号相互匹配(例如幅度和时延匹配),以实现最大限度地提高语音增强性能。

然而实际应用中,各通道麦克风往往具有较大的分散度,且各自信号采集通道的电子元器件的特性会受温湿度等外界条件影响,因而导致各通道之间存在较大的差异,导致各通道普通音频信号不匹配,因而影响了后续语音增强处理环节的性能。



技术实现要素:

有鉴于此,本发明提供一种音频信号校正方法、装置及设备,以使麦克风阵列各通道采集信号相互匹配,提高后续语音增强处理环节的性能。

第一方面,本发明实施例提供了一种音频信号校正方法,所述方法用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;所述方法包括:

获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

可选地,所述样本差异参数的确定方法,包括:

获取所述麦克风阵列采集的样本声源的多路样本音频信号;其中,所述多路样本音频信号包括所述参考麦克风采集的参考样本音频信号,以及所述普通麦克风采集的普通样本音频信号;

分别确定所述普通样本音频信号中各路样本音频信号与所述参考样本音频信号的样本差异参数。

可选地,所述分别确定所述普通样本音频信号中各路普通样本音频信号与所述参考样本音频信号的样本差异参数,包括:

计算所述参考样本音频信号的均方值;

计算所述普通样本音频信号的均方值;

计算所述参考样本音频信号与所述各路普通样本音频信号的互相关函数;

对所述互相关函数进行插值运算,得到插值互相关函数;

根据所述参考样本音频信号的均方值、所述普通样本音频信号的均方值及所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的样本差异参数。

可选地,所样本差异参数包括时延值;

所述根据所述参考样本音频信号的均方值、所述普通样本音频信号的均方值及所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的样本差异参数,包括:

根据所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的视在时延值;

分别确定所述各路普通样本音频信号与所述参考样本音频信号的传输路径时延差;

根据所述视在时延值与所述传输路径时延差分别计算所述各路普通样本音频信号与所述参考样本音频信号的时延值。

可选地,所述分别确定所述各路普通样本音频信号与所述参考样本音频信号的传输路径时延差,包括:

将所述参考麦克风作为坐标原点,建立三维直角坐标系;

根据所述样本声源的坐标,以及所述样本声源与所述坐标原点之间的距离确定声源方向矢量;其中,所述样本声源的坐标为所述样本声源在所述三维直角坐标系中对应的坐标;

根据所述普通麦克风各自的坐标和所述声源方向矢量分别确定所述各路普通样本音频信号与所述参考样本音频信号的传输路径时延差;其中,所述普通麦克风各自的坐标为所述普通麦克风在所述三维直角坐标系中各自对应的坐标。

可选地,所述基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数,包括:

将所述各路普通样本音频信号与所述参考样本音频信号的时延值,作为所述各路普通音频信号与所述参考音频信号的时延值;

所述基于所述差异参数对所述普通音频信号进行校正,包括:

分别根据所述各路普通音频信号与所述参考音频信号的时延值,对所述各路普通音频信号进行滤波延时运算。

可选地,所样本差异参数包括幅度比值;

所述根据所述参考样本音频信号的均方值、所述普通样本音频信号的均方值及所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的样本差异参数,包括:

分别根据所述各路普通样本音频信号的均方值和所述参考样本音频信号的均方值的比值,确定所述各路普通样本音频信号与所述参考样本音频信号的幅度比值。

可选地,所述基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数,包括:

将所述各路普通样本音频信号与所述参考样本音频信号的幅度比值,作为所述各路普通音频信号与所述参考音频信号的幅度比值;

所述基于所述差异参数对所述普通音频信号进行校正,包括:

分别根据所述各路普通音频信号与所述参考音频信号的幅度比值,以及所述各路普通音频信号进行除运算。

第二方面,本发明实施例提供了一种音频信号校正装置,所述装置用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;所述装置包括:

信号获取模块,用于获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

参数确定模块,用于基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

信号校正模块,用于基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

第三方面,本发明实施例提供了一种电子设备,所述电子设备用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;所述电子设备包括:

处理器;

被配置为存储处理器可执行指令的存储器;

其中,所述处理器被配置为:

获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

第四方面,本发明实施例提供了一种计算机可读存储介质,所述存储介质用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;所述存储介质上存储有计算机程序,该程序被处理器处理时实现:

获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

由上述技术方案可知,本发明提供的音频信号校正方法、装置及设备,通过获取麦克风阵列采集的多路音频信号,并基于预先确定的样本差异参数确定普通音频信号与参考音频信号之间的差异参数,进而基于差异参数对普通音频信号进行校正,得到与参考音频信号匹配的校正音频信号,可以很大程度上消除各路麦克风采集的音频信号之间的差异,提高后续语音增强处理环节的性能。

附图说明

图1是本发明一种音频信号校正方法实施例的流程图;

图2是本发明确定样本差异参数实施例的流程图;

图3是本发明确定各路普通样本音频信号与参考样本音频信号的样本差异参数实施例的流程图;

图4a是本发明另一种音频信号校正方法实施例的流程图;

图4b是本发明的三维麦克风阵列排布及声源位置实施例的示意图;

图5是本发明一种音频信号校正装置实施例的结构框图;

图6是本发明另一种音频信号校正装置实施例的结构框图;

图7是本发明一种电子设备实施例的结构框图。

具体实施方式

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示普通含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解,尽管在本申请中可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

图1是本发明一种音频信号校正方法实施例的流程图。该方法用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风。如图1所示,该方法包括以下步骤s11-s13:

s11:获取所述麦克风阵列采集的多路音频信号;

其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

在一可选的实施例中,麦克风阵列可以由两个以上麦克风组成,并在三维空间任意排列为三维阵。其中,二维平面阵和一维线阵被视为该三维阵的特殊形式。

在一可选的实施例中,上述麦克风阵列采集的音频信号为经过模数变换之后的数字音频信号。

在一可选的实施例中,参考麦克风可以是麦克风阵列中的任一路麦克风,例如可以采用离麦克风阵列中心最近的麦克风作为参考麦克风。

在一可选的实施例中,上述麦克风阵列可以根据实际需要采集目标环境或目标声源的音频信号,本发明实施例对此不进行限定。

s12:基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

在一可选的实施例中,上述的样本差异参数为根据上述麦克风阵列之前采集的多路样本音频信号确定的参数。

在一可选的实施例中,可以按照下述图2所示实施例的方法确定上述样本差异参数,在此先不详述。

s13:基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

在一可选的实施例中,根据上述确定的普通音频信号与参考音频信号之间的差异参数,可以对上述普通音频信号进行校正,以使校正后的普通音频信号与参考音频信号相匹配。

由上述技术方案可知,本发明提供的音频信号校正方法,通过获取麦克风阵列采集的多路音频信号,并基于预先确定的样本差异参数确定普通音频信号与参考音频信号之间的差异参数,进而基于差异参数对普通音频信号进行校正,得到与参考音频信号匹配的校正音频信号,可以很大程度上消除各路麦克风采集的音频信号之间的差异,提高后续语音增强处理环节的性能。

图2是本发明确定样本差异参数实施例的流程图;本实施例在上述实施例的基础上,以如何确定样本差异参数为例进行示例性说明。如图2所示,上述样本差异参数的确定方法,可以包括以下步骤s21-s22:

s21:获取所述麦克风阵列采集的样本声源的多路样本音频信号;

其中,所述多路样本音频信号包括所述参考麦克风采集的参考样本音频信号,以及所述普通麦克风采集的普通样本音频信号;

在一可选的实施例中,该样本声源可以设置于空间中的一固定位置。其中,样本声源是指位于同一个位置的至少一个声源,而并不是限定声源个数。

在一可选的实施例中,通过麦克风阵列采集样本声源的音频信号时,可使该样本声源对准麦克风阵列的中心,以确保音频信号采集的质量。

在一可选的实施例中,可以在预设时间段内,通过麦克风阵列采集样本声源的音频信号,该预设时间可以自由设置,例如可以设置为大于1秒。

s22:分别确定所述普通样本音频信号中各路样本音频信号与所述参考样本音频信号的样本差异参数。

由上述技术方案可知,本实施例通过获取所述麦克风阵列采集的样本声源的多路样本音频信号,并分别确定所述普通样本音频信号中各路样本音频信号与所述参考样本音频信号的样本差异参数,可以准确地确定样本差异参数,进而可以确定所述普通音频信号与所述参考音频信号之间的差异参数,为后续消除各路麦克风采集的音频信号之间的差异提供依据,提高后续语音增强处理环节的性能。

图3是本发明确定各路普通样本音频信号与参考样本音频信号的样本差异参数实施例的流程图;本实施例在上述实施例的基础上,以如何确定各路普通样本音频信号与参考样本音频信号的样本差异参数为例进行示例性说明。如图3所示,步骤s22中分别确定所述普通样本音频信号中各路普通样本音频信号与所述参考样本音频信号的样本差异参数,可以包括步骤s31-s34:

s31:计算所述参考样本音频信号的均方值,并计算所述各路普通样本音频信号的均方值;在一可选的实施例中,设麦克风阵列采集的m路样本音频信号为sk(n),k=1,2,…m,设其中由参考麦克风采集的参考样本音频信号为sr(n),则计算参考样本音频信号sr(n)的均方值rrr(0)=e{sr(n)sr(n)},计算第k路普通样本音频信号sk(n)的均方值rkk(0)=e{sk(n)sk(n)}。

s32:计算所述参考样本音频信号与所述各路普通样本音频信号的互相关函数;

在一可选的实施例中,根据以下公式计算参考样本音频信号sr(n)与第k路麦克风采集的样本音频信号sk(n)的互相关函数:

rrk(τ)=e{sr(n)sk(n+τ)},τ=…,0,1,2,3,…;(1.1)

s33:根据所述互相关函数进行插值运算,得到插值互相关函数;

在一可选的实施例中,若记互相关函数的最大值点为:i=argmax{rrk(τ)},则可在[i-0.5,i+0.5]区间对互相关函数rrk(τ)进行插值,得到插值互相关函数:

rrk(η)=rrk(i+t)=rrk(τ)·sinc(i+t-τ),(1.2)

其中,-0.5≤t≤0.5,式中·表示内积运算;

s34:根据所述参考样本音频信号的均方值、所述各路普通样本音频信号的均方值及所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的样本差异参数。

在一可选的实施例中,上述样本差异参数可以包括时延值;

相应地,步骤s34可以包括步骤s41-s42:

s41:根据所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的视在时延值;

在一可选的实施例中,可以将插值互相关函数rrk(η)的最大值点对应的时延值作为sk(n)相对于sr(n)的视在时延值d(k)=argmax{rrk(η)}。

需要说明的是,该视在时延值可以指直接从采集的音频信号计算出来的时延值,而没有考虑路径时延。

s42:分别确定所述各路普通样本音频信号与所述参考样本音频信号的传输路径时延差。

在一可选的实施例中,本步骤s42可以包括以下步骤s421-s424:

s421:将所述参考麦克风作为坐标原点,建立三维直角坐标系;

s422:根据所述样本声源的坐标,以及所述样本声源与所述坐标原点之间的距离确定声源方向矢量;其中,所述样本声源的坐标为所述样本声源在所述三维直角坐标系中对应的坐标;

s423:根据所述普通麦克风各自的坐标和所述声源方向矢量分别确定所述各路普通样本音频信号与所述参考样本音频信号的传输路径时延差;其中,所述普通麦克风各自的坐标为所述普通麦克风在所述三维直角坐标系中各自对应的坐标。

在一可选的实施例中,设第k路麦克风坐标位置为(xk,yk,zk),声源位置坐标为(x,y,z),则根据以下公式(1.3)计算第k路麦克风相对于参考麦克风的传输路径时延差:

l(k)=-(xk×x+yk×y+zk×z)/(x×x+y×y+z×z)0.5;(1.3)

s424:根据所述视在时延值与所述传输路径时延差分别计算所述各路普通样本音频信号与所述参考样本音频信号的时延值。

在一可选的实施例中,将视在时延值d(k)减去传输路径时延差l(k)得到sk(n)相对于sr(n)的时延值:

d(k)=d(k)-l(k);(1.4)

在上述实施例的基础上,步骤s12中基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数,可以包括:

将所述各路普通样本音频信号与所述参考样本音频信号的时延值,作为所述各路普通音频信号与所述参考音频信号的时延值;

相应地,步骤s13中基于所述差异参数对所述普通音频信号进行校正,可以包括:

分别根据所述各路普通音频信号与所述参考音频信号的时延值,对所述各路普通音频信号进行滤波延时运算。

在一可选的实施例中,将第k路(k=1,2,…m)音频信号sk1(n)与sinc(n+d(k))进行卷积运算,以使sk1(n)延迟-d(k),实现补偿该第k路信号的时延。

在一可选的实施例中,所样本差异参数可以包括幅度比值;

相应地,步骤s34还可以包括:

分别根据所述各路普通样本音频信号的均方值和所述参考样本音频信号的均方值的比值,确定所述各路普通样本音频信号与所述参考样本音频信号的幅度比值。

在一可选的实施例中,将sk(n)的均方值除以sr(n)的均方值然后开根号得到sk(n)相对于sr(n)的幅度比值:

a(k)=(rkk(0)/rrr(0))0.5;(1.5)

在此基础上,步骤s12中基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数,可以包括:

将所述各路普通样本音频信号与所述参考样本音频信号的幅度比值,作为所述各路普通音频信号与所述参考音频信号的幅度比值。相应地,步骤s13中基于所述差异参数对所述普通音频信号进行校正,可以包括:

分别根据所述各路普通音频信号与所述参考音频信号的幅度比值,以及所述各路普通音频信号进行除运算。

在一可选的实施例中,将延迟后的第k路(k=1,2,…m)音频信号除以a(k),以补偿该路信号的幅度。

在一可选的实施例中,可以将m路经过时延和幅度补偿后的校正信号输出至外部系统。

由上述技术方案可知,本发明提供的音频信号校正方法,基于预先确定的样本差异参数确定普通音频信号与参考音频信号之间的差异参数,并基于差异参数对普通音频信号进行校正,得到与参考音频信号匹配的校正音频信号,可以很大程度上消除各路麦克风采集的音频信号之间的差异,提高后续语音增强处理环节的性能。

对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用普通顺序或者同时进行。

其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于可选实施例,所涉及的动作和模块并不一定是本发明所必须的。

下面以一具体实施例说明本发明,但不用于限制本发明的范围。

图4a是本发明另一种音频信号校正方法实施例的流程图;如图4a所示,该方法包括:

a1:通过麦克风阵列采集样本声源的样本音频信号。

在一可选的实施例中,步骤a1可以包括以下步骤a11-a12:

a11:在预设时间段内,通过麦克风阵列采集样本声源的音频信号。

其中,该样本声源可以设置于空间中的一固定位置。

在一可选的实施例中,样本声源是指位于同一个位置的至少一个声源,而并不是限定声源个数。

在一可选的实施例中,麦克风阵列可以由两个以上麦克风组成,并在三维空间任意排列为三维阵。其中,二维平面阵和一维线阵被视为该三维阵的特殊形式。

在一可选的实施例中,通过麦克风阵列采集音频信号时,可使该样本声源对准麦克风阵列的中心,以确保音频信号采集的质量。

在一可选的实施例中,上述预设时间可以自由设置,例如可以设置为大于1秒。

a12:选取麦克风阵列中的一路麦克风作为参考麦克风。

在一可选的实施例中,参考麦克风可以是麦克风阵列中的任一路麦克风,例如可以采用离麦克风阵列中心最近的麦克风作为参考麦克风,并采用参考麦克风所采集的信号作为参考样本音频信号。

举例来说,图4b是本发明的三维麦克风阵列排布及声源位置实施例的示意图。如图4b所示,该麦克风阵列包含m个麦克风,选取位于麦克风阵列中心的麦克风作为参考麦克风,将样本声源对准麦克风阵列中心,该声源位置坐标为(x,y,z)。在此基础上,设m路麦克风阵列采集的样本声源的样本音频信号为sk(n),k=1,2,…m,设其中由参考麦克风采集的样本声源的参考样本音频信号为sr(n),设第k路麦克风坐标位置为(xk,yk,zk)。

a2:计算多路麦克风采集的样本音频信号与参考样本音频信号之间的幅度比值和时延值两种校正参数。

在一可选的实施例中,步骤a2可以包括以下步骤a21-a29:

a21:计算参考样本音频信号sr(n)的均方值rrr(0)=e{sr(n)sr(n)};

a22:计算参考样本音频信号sr(n)与第k路麦克风采集的样本音频信号sk(n)的互相关函数:

rrk(τ)=e{sr(n)sk(n+τ)},τ=…,0,1,2,3,…;(2.1)

a23:记i=argmax{rrk(τ)},在[i-0.5,i+0.5]区间对互相关函数rrk(τ)进行插值,得到插值互相关函数:

rrk(η)=rrk(i+t)=rrk(τ)·sinc(i+t-τ),(2.2)

其中,-0.5≤t≤0.5,式中·表示内积运算;

a24:将rrk(η)的最大值点对应的时延值作为sk(n)相对于sr(n)的视在时延值d(k)=argmax{rrk(η)};

其中,视在时延值指直接从采集的音频信号计算出来的时延值,而没有考虑路径时延。

a25:计算第k路麦克风相对于参考麦克风的传输路径时延差:

l(k)=-(xk×x+yk×y+zk×z)/(x×x+y×y+z×z)0.5;(2.3)

a26:将d(k)减去l(k)得到sk(n)相对于sr(n)的时延值:

d(k)=d(k)-l(k);(2.4)

a27:计算第k路普通音频信号sk(n)的均方值:

rkk(0)=e{sk(n)sk(n)};(2.5)

a28:将sk(n)的均方值除以sr(n)的均方值然后开根号得到sk(n)相对于sr(n)的幅度比值:

a(k)=(rkk(0)/rrr(0))0.5;(2.6)

a29:输出m路幅度比值a(k),k=1,2,3,…,m和时延值d(k),k=1,2,3,…,m两种校正参数。

a3:存储m路幅度比值a(k)和时延值d(k)两种校正参数。

在一可选的实施例中,将步骤s29中输出的m路幅度比值a(k)和时延值d(k)两种校正参数存储到非易失性存储器中。

在一可选的实施例中,可以根据后续读取指令从该存储器读出该幅度比值a(k)和时延值d(k)两种校正参数。

a4:根据读取的上述m路幅度比值a(k)和时延值d(k)两种校正参数,对通过上述麦克风阵列采集的目标声源的多路音频信号进行幅度和时延校正。

在一可选的实施例中,步骤a4可以包括:

a41:通过上述麦克风阵列采集目标声源的多路音频信号。

在一可选的实施例中,设m路麦克风阵列采集的目标声源的音频信号为sk1(n),其中,k=1,2,…m,设其中由参考麦克风所采集的目标声源的音频信号为参考音频信号sr1(n)。

a42:将第k路(k=1,2,…m)音频信号sk1(n)与sinc(n+d(k))进行卷积运算,以使sk1(n)延迟-d(k),实现补偿该第k路信号的时延;

a43:将延迟后的第k路(k=1,2,…m)音频信号除以a(k),以补偿该路信号的幅度;

a5:将经过时延和幅度补偿后的校正信号输出至外部系统。

本实施例的音频信号校正方法,通过麦克风阵列采集样本声源的多路样本音频信号,并计算出参考样本音频信号与各路音频信号之间的幅值比值和时延值两种校正参数,进而在通过麦克风阵列采集目标声源的多路音频信号后,基于计算出的幅值比值和时延值两种校正参数,对采集的多路音频信号分别进行幅度和时延校正,得到多路经过时延和幅度补偿的校正信号,可以很大程度上消除各路麦克风采集的音频信号之间的差异,提高后续语音增强处理环节的性能。

图5是本发明一种音频信号校正装置实施例的结构框图;所述装置用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;如图5所示,该装置包括信号获取模块410、参数确定模块420以及信号校正模块430,其中:

信号获取模块410,用于获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

参数确定模块420,用于基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

信号校正模块430,用于基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

由上述技术方案可知,本发明提供的音频信号校正装置,通过获取麦克风阵列采集的多路音频信号,并基于预先确定的样本差异参数确定普通音频信号与参考音频信号之间的差异参数,进而基于差异参数对普通音频信号进行校正,得到与参考音频信号匹配的校正音频信号,可以很大程度上消除各路麦克风采集的音频信号之间的差异,提高后续语音增强处理环节的性能。

图6是本发明另一种音频信号校正装置实施例的结构框图;其中,信号获取模块510、参数确定模块520以及信号校正模块530与图5所示实施例中的信号获取模块410、参数确定模块420以及信号校正模块430的功能相同,在此不进行赘述。如图6所示,在上述实施例的基础上,该装置还可以包括:

样本信号获取模块540,用于获取所述麦克风阵列采集的样本声源的多路样本音频信号;其中,所述多路样本音频信号包括所述参考麦克风采集的参考样本音频信号,以及所述普通麦克风采集的普通样本音频信号;

样本差异确定模块550,用于分别确定所述普通样本音频信号中各路样本音频信号与所述参考样本音频信号的样本差异参数。

在一可选的实施例中,样本差异确定模块550可以包括:

均方值计算单元551,用于计算所述参考样本音频信号的均方值;

相关函数确定单元552,用于根据所述参考样本音频信号的均方值分别确定所述参考样本音频信号与所述各路普通样本音频信号的互相关函数;

插值函数确定单元553,用于根据所述互相关函数进行插值运算,得到插值互相关函数;

差异参数确定单元554,用于根据所述参考样本音频信号的均方值、所述各路普通样本音频信号的均方值及所述插值互相关函数分别确定所述各路普通样本音频信号与所述参考样本音频信号的样本差异参数。需要说明的是,对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可,在此不进行赘述。

本发明的信号处理装置的实施例可以应用在网络设备上。装置实施例可以通过软件实现,也可以通过硬件或者软硬件结合的方式实现。以软件实现为例,作为一个逻辑意义上的装置,是通过其所在设备的处理器运行存储器中对应的计算机程序指令形成的。从硬件层面而言,如图7所示,为本发明的信号处理装置所在设备的一种硬件结构图,除了图7所示的处理器、网络接口、内存以及非易失性存储器之外,实施例中装置所在的设备通常还可以包括普通硬件,如负责处理报文的转发芯片等等;从硬件结构上来讲该设备还可能是分布式的设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。

本发明实施例还提供了一种计算机可读存储介质,所述存储介质用于对麦克风阵列采集的音频信号进行处理,所述麦克风阵列包括一个参考麦克风,以及一个或多个普通麦克风;所述存储介质上存储有计算机程序,其特征在于,该程序被处理器处理时实现:

获取所述麦克风阵列采集的多路音频信号;其中,所述多路音频信号包括所述参考麦克风采集的参考音频信号,以及所述普通麦克风采集的普通音频信号;

基于预先确定的样本差异参数,确定所述普通音频信号与所述参考音频信号之间的差异参数;

基于所述差异参数对所述普通音频信号进行校正,得到与所述参考音频信号匹配的校正音频信号。

本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与普通实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1