一种语音降噪方法及装置与流程

文档序号:28162986发布日期:2021-12-24 20:53阅读:276来源:国知局
一种语音降噪方法及装置与流程

1.本发明涉及音频处理技术领域,尤其涉及一种语音降噪方法及装置。


背景技术:

2.从通讯回音产生的原因看,可以分为声学回音(acoustic echo)和线路回音(line echo),相应的回声消除技术就叫声学回声消除(acoustic echo cancellation,aec)和线路回声消除(line echo cancellation,lec)。声学回音是由于在免提或者会议应用中,扬声器的声音多次反馈到麦克风引起的。
3.例如:用户a在说话的过程中,其语音信号speech1传到用户b所在的房间,由于房间的反射,会形成回音信号echo,重新从麦克风输入,同时叠加了用户b的语音信号speech2。此时,用户a将会听到用户b的语音信号speech2叠加了自己声音及回音speech1+echo,将会影响正常的通话质量。
4.为解决这一问题,现有技术中是通过将多个麦克风组成多麦克风阵列的形式(如六麦克风阵列),利用空间分布的多路麦克风拾取声音信号,通过对麦克风阵列的各路输出信号进行分析和处理,得到一个或多个声源的位置信息,实现声源定位功能;同时利用麦克风阵列的空域滤波特性,通过对唤醒人的角度定位,形成定向拾音波束,并对拾音波束以外的噪音进行抑制,以克服噪声的影响。
5.但由于现有技术所采用的多麦克风阵列进行语音降噪处理的方法,用于进行声学回声消除的aec算法需在波束成型之前进行,故需要对多路信号同时进行aec处理,且波束成型的计算复杂度与麦克风数目也近似为线性,均将带来极大的计算量,普通成本的芯片都不支持使用这种方案在本地做信号处理,而云端处理则会带来通信稳定性差和高延迟问题。


技术实现要素:

6.本发明提供一种语音降噪方法及装置,用以解决现有技术中采用多麦克风阵列进行语音降噪时存在的运算量大缺陷,具有低功耗、低延时、部署轻便、空域滤波性能好的优点。
7.第一方面,本发明提供一种语音降噪方法,包括:分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;对所述双路数字信号进行回声消除,获取双路语音信号;对所述双路语音信号进行波束成型处理,获取语音增强信号。
8.根据本发明提供的一种的语音降噪方法,所述对所述双路数字信号进行回声消除,获取双路语音信号,包括:将所述双路数字信号中的回音信号作为近端信号,将引起回音的参考信号作为远端信号,构建回音路径函数;将所述远端信号作为自适应滤波器的输入信号,将所述近端信号作为所述自适应滤波器的期望信号,获取收敛后的所述自适应滤波器;将所述参考信号输入至所述收敛后的所述自适应滤波器,计算出所述近端信号;利用所述双路数字信号减去所述近端信号,获取所述双路语音信号。
9.根据本发明提供的一种的语音降噪方法,所述将所述远端信号作为自适应滤波器的输入信号,将所述近端信号作为所述自适应滤波器的期望信号,获取收敛后的所述自适应滤波器,包括:利用预先构建的长短期记忆网络模型的前向计算,获取每个频点的语音存在概率;根据所述每个频点的语音存在概率,调整自适应滤波器的自适应步长;基于所述自适应步长对所述自适应滤波器进行收敛,获取所述收敛后的所述自适应滤波器。
10.根据本发明提供的一种的语音降噪方法,对所述双路语音信号进行波束成型处理,获取语音增强信号,包括:在所述双路语音信号为低频信号的情况下,计算所述双路语音信号中的两路信号之间的相对延时;根据所述相对延时,对所述两路信号进行延时对齐之后再作相减处理,获取所述语音增强信号;在所述双路语音信号为高频信号的情况下,分别确定所述双路语音信号中两路信号相关的一阶差分麦克风阵列的第一权重系数和第二权重系数;分别将所述第一权重系数和第二权重系数作为所述两路信号的权重,对所述两路信号进行加权求和获取所述语音增强信号。
11.根据本发明提供的一种的语音降噪方法,在获取所述语音增强信号之后,还包括:利用广义旁瓣相消器,对所述语音增强信号进行噪声去除。
12.根据本发明提供的一种的语音降噪方法,在生成单路语音增强信号之后,还包括:对所述语音增强信号进行单通道维纳滤波,获取去噪语音信号。
13.根据本发明提供的一种的语音降噪方法,在获取去噪语音信号之后,还包括:对所述去噪语音信号进行增益处理,以调整所述去噪语音信号的强度。
14.第二方面,本发明还提供一种语音降噪装置,包括:
15.模数转换模块,用于分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;
16.声学回声消除模块,用于对所述双路数字信号进行回声消除,获取双路语音信号;
17.波束成型模块,用于对所述双路语音信号进行波束成型处理,获取语音增强信号。
18.根据本发明提供的一种语音降噪装置,还包括:维纳滤波模块,用于对所述语音增强信号进行单通道维纳滤波,获取去噪语音信号。
19.根据本发明提供的一种语音降噪装置,还包括:增益控制模块,用于对所述去噪语音信号进行增益处理,以调整所述去噪语音信号的强度。
20.第三方面,本发明提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述语音降噪方法的步骤。
21.第四方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述语音降噪方法的步骤。
22.本发明提供的语音降噪方法及装置,利用两个麦克风构建的双麦克风阵列,同时采集音频信号,通过对采集的两路音频信号,分别进行模数转换后,基于小间距差分波束成形技术,对回声消除后的两路信号,进行波束成型处理,能获取到单通道语音增强信号,能够实现较强的空域滤波效果,实现了现有技术需多麦克风阵列才能达到的语音降噪效果,且有效地降低麦克风数量、降低本地信号处理的计算量和内存占用。
附图说明
23.为了更清楚地说明本发明或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
24.图1是本发明提供的语音降噪方法的流程示意图;
25.图2是本发明提供的一种语音降噪方法的整体结构示意图;
26.图3是本发明提供的一种抑制90度方向的波束示意图;
27.图4是本发明提供的一种抑制180度方向的波束示意图;
28.图5是本发明提供的一种改进后的广义旁瓣相消器的结构示意图;
29.图6是本发明提供的语音降噪装置的结构示意图;
30.图7是本发明提供的电子设备的结构示意图。
具体实施方式
31.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
32.需要说明的是,在本发明实施例的描述中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、装置、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。术语“上”、“下”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
33.本技术的说明书和权利要求书中的术语“第一”、“第二”等是用于区别类似的对象,而不用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施,且“第一”、“第二”等所区分的对象通常为一类,并不限定对象的个数,例如第一对象可以是一个,也可以是多个。此外,说明书以及权利要求中“和/或”表示所连接对象的至少其中之一,字符“/”,一般表示前后关联对象是一种“或”的关系。
34.下面结合图1

图6描述本发明实施例所提供的语音降噪方法和装置。
35.图1是本发明提供的语音降噪方法的流程示意图,如图1所示,包括但不限于以下步骤:
36.步骤101:分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;
37.步骤102:对所述双路数字信号进行回声消除,获取双路语音信号;
38.步骤103:对所述双路语音信号进行波束成型处理,获取语音增强信号。
39.图2是本发明提供的一种语音降噪方法的整体结构示意图,如图2所示,本发明为克服现有技术的不足,在其基础上,通过使用两个麦克风组成的双麦克风阵列,代替现有的多麦克风阵列作为声音传感器,对用户的声音进行采集,分别生成两路音频信号。
40.其中,两个麦克风之间的间距被缩小至1厘米左右,这样可以保证其可以置于穿戴设备上,如翻译机、翻译笔、ar眼镜、头戴式耳机和无线蓝牙耳机等。
41.可选地,还可以通过在双麦克风阵列上增设选择性透过膜,对其进行防尘防水处理,选择性透过膜防水等级可达ip67/ip68。
42.在同时采集到两路音频信号之后,将其传输至模数转换模块(analogue to digital,ad),已将两路音频信号所对应的模拟信号,分别转换成数字信号,获取到双路数字信号。
43.然后,将双路数字信号和用于回声消除的回采信号,一起发送至声学回声消除(acoustic echo cancellation,aec)模块中,以对双路数字信号中的回声信号进行消除。
44.其中,aec模块是基于现有的aec技术进行构建的。aec模块是以双路数字信号与由音频信号所产生的多路径回声的相关性为基础,所建立的远端信号的语音模块,利用它对回声进行估计,并不断地修改滤波器的系数,使得回声估计值更加逼近真实的回声。最后,将回声估计值从话筒的音频信号中减去,从而达到消除回声的目的。
45.具体来说,aec模块的主要功能是估计本地扬声器到本地麦克风的包括了反射路径的声学传输函数。通过估计的声学传输函数,过滤传入的音频信号,从而得到回波信号的估计y(n)。
46.然后,从麦克风阵列采集的音频信号d(n)中减去这个估计的回声y(n),则得到无回声的信号e(n),即e(n)=d(n)

y(n)。
47.最后,将信号e(n)而非麦克风信号d(n)通过信道传输到远端。最好的情况下,当估计的y(n)是准确的,就可以完全消除回声。
48.本发明提供的回声消除方法,实际的回声消除器能够实现40至45db范围内的回声降低。
49.进一步地,将对双路数字信号进行回声消除后所生成的双路语音信号,输入至波束成形(beam forming,bf)模块,以实现对双路语音信号的波束成型处理,获取到语音增强信号。
50.可选地,bf模块,可以采用广义旁瓣相消器(general sidelobe canceller,gsc)实现。其中的固定波束形成器(fix beamforming,fbf)可以采用双麦克风差分波束成形技术构建,具体为:将差分波束算法(differential microphone arrays,dma)和延迟相减算法(delay sub)相结合,在进行波束成型处理的过程中分别对高频和低频采用不同的算法进行处理,其中上述高频和低频是针对语音信号的频率进行划分的,一般来说低频是指频率在200赫兹(内倍频程)及以下的部分,而高频是指频率在600赫兹(内倍频程)及以下的部分。
51.本发明分别对语音信号中的高频和低频部分分别采用不同的方式进行消噪,能够综合平衡波束灵敏度和频率一致性两个指标。
52.其中,fbf工作的基本原理是:对于双麦克风阵列而言,由于各个麦克风的分布位置不同,阵元接收的语音信号会存在一定的时间差。利用这一信息可以确定声源的方向和位置。其能够对双路语音信号进行合并处理,抑制非目标方向的干扰信号,增强目标方向的声音信号。
53.其主要是通过调整相位阵列的基本单元参数,使得某些角度的信号获得相长干涉,而另一些角度的信号获得相消干涉。对双麦克风阵列中各个阵元输出的语音信号加权求和、滤波,最终输出期望方向的语音增强信号,相当于形成一个“波束”。
54.针对远场情况,由于信号源到阵列的距离远大于阵元间距,不同阵元接收信号的幅度差异较小,因此把不同阵元采集的语音信号的幅值认为都是一样的,只需对各阵元接收信号的相位差异进行处理即可。针对近场情况,不同阵元接收到的信号幅度受信号源到各阵元距离差异的影响非常明显,故此时需考虑信号源到达不同阵元的波程差。
55.dma是一种波束成形方法,有延时累加(delay

sum),滤波相加(filter

sum)以及自适应波束形成等,这些方法都是将麦克风阵列所采集到的音频信号同步后相加输出,与相加相对应的是相减。差分阵列表现的是空间声压的差异性,声压的一阶差分可以由两个相近放置的全向麦克风输出相减得到。
56.图3是本发明提供的一种抑制90度方向的波束示意图,图4是本发明提供的一种抑制180度方向的波束示意图,以理想的麦克风全向性模式为例,这种情况下麦克风对360度范围内各个方向的信号具有相同的灵敏度。如图3以及图4所示,表示了指向性模式,麦克风只在某个方向上具有最大灵敏度,在指定方向以外的所有方向不敏感。delay sub波束成形的作用就是创建这种指向性的灵敏度模式,从而让麦克风能够“监听”来自指定方向的信号。
57.综上所述,麦克风阵列的最大输出值会固定在0度角度上(即垂直阵列入射的角度)。
58.那么,如果想要双麦克风阵列的最大输出值固定在其他角度,则无需物理上手动调整双麦克风阵列的方向,可以在软件上控制麦克风阵列波束图的特定指向角度。通过在每个麦克风的输出之后、在求和之前,增加一个时间延迟计算,就可以简单地实现波束图的转向功能。这也是delay

sum的由来。
59.假设双麦克风之间的间距为1cm,频率为4khz、麦克风阵元为2个,如图3以及图4所示,分别展示了主瓣和旁瓣,旁瓣的增益与主瓣相当,但是波束成形不需要这些旁瓣,因为这些旁瓣会导致主瓣角度以外的方向的信号被同时被检测到,这与波束成形的目标是相违背的。
60.当处于某个角度下,对于相邻的两个麦克风,声波传播的波程差是声波波长的整数倍的时候,旁瓣出现了。因为这时候,每个麦克风输出的音频信号高度相关,与0度的垂直入射情况一样,会有阵列输出的最大幅值。若要获取45度方向的声波信号,那么通过时间延迟计算,对来自45度方向的声波信号的每个麦克风的音频信号进行对齐,使得45度方向的麦克风阵列输出有着最大的输出幅度值,这样就能设定主瓣角度为45度,使得波束图转向了。因此,通过控制延迟计算,就可以控制主瓣的角度方向。
61.另外,自动增益控制(automatic gain control,agc),对放大器的增益进行自动调节的过程,通常是为了使得随输入信号电平变化而引起的输出信号电平变化的更少,包含增益受控放大电路和控制电压形成电路。增益受控放大电路的放大倍数随控制电压u
c
而变化。控制电压形成电路主要有整流与滤波电路,有时也包含直流放大器等部件,产生控制电压u
c
。输入信号经放大后出现在输出端,经整流器件变成单一的方向,再经过滤波(通常是rc低通滤波电路)成为比较平滑的直流,用以控制放大器件的工作点或衰减网络的衰减系数,达到增益控制的目的将经过模数转换、回声消除以及波束成型处理后的语音增强信号。
62.本发明提供的语音降噪方法,利用两个麦克风构建的双麦克风阵列,同时采集音频信号,通过对采集的两路音频信号,分别进行模数转换后,基于小间距差分波束成形技术,对回声消除后的两路信号,进行波束成型处理,能获取到单通道语音增强信号,能够实现较强的空域滤波效果,实现了现有技术需多麦克风阵列才能达到的语音降噪效果,且有效地降低麦克风数量、降低本地信号处理的计算量和内存占用。
63.基于上述实施例的内容,作为一种可选实施例,所述对所述双路数字信号进行回声消除,获取双路语音信号,包括:
64.将所述双路数字信号中的回音信号作为近端信号,将引起回音的参考信号作为远端信号,构建回音路径函数;
65.将所述远端信号作为自适应滤波器的输入信号,将所述近端信号作为所述自适应滤波器的期望信号,获取收敛后的所述自适应滤波器;
66.将所述参考信号输入至所述收敛后的所述自适应滤波器,计算出所述近端信号;
67.利用所述双路数字信号减去所述近端信号,获取所述双路语音信号。
68.具体地,在本发明提供的语音降噪方法中,可以通过对双麦克风阵列所采集到音频信号进行模数转换,获取双路数字信号,该双路数字信号包括实际需要发送的语音speech和实际不需要的回音信号echo混合而成的语音流所对应的双路数字信号作为近端信号。
69.另外,本发明还可以通过双麦克风阵列通过对原始的引起回音的语音进行采集,获取参考信号fe作为远端信号。
70.由于回音信号echo与参考信号fe是不完全一样的,两者之间是存在差异的,但是却存在高度相关性(回音信号echo是由参考信号fe引起的)。本发明正是利用这一高度相关性,将回音信号echo表示为参考信号fe的数学函数:echo=f(fe),其中,回音路径函数f被称之为回音路径,在声学回声消除里面,回音路径函数f表示声音在墙壁,天花板等障碍物上多次反射的物理过程。
71.进一步地,本发明通过求解回音路径函数f的就可以通过获取的参考信号fe计算得到回音信号echo。
72.在此之前,可以利用下列实施例,简单的描述整个回音的产生过程:
73.1)房间a的音频会议系统接收到房间b中的声音;
74.2)声音被双麦克风阵列采样,这一采样信号被称为参考信号fe;
75.3)随后声音被送到房间a的音箱和声学回声消除器中;
76.4)房间b的声音和房间a的声音一起被房间a的双麦克风阵列拾取,获取音频信号;
77.5)音频信号也被送到声学回声消除器中,与原始的参考信号进行回声消除,以移除房间b的声音信号。
78.自适应滤波器是以输入和输出信号的统计特性的估计为依据,采取特定算法自动地调整滤波器系数,使其达到最佳滤波特性的一种算法或装置。自适应滤波器可以是连续域的或是离散域的。离散域自适应滤波器由一组抽头延迟线、可变加权系数和自动调整系数的机构组成。附图表示一个离散域自适应滤波器用于模拟未知离散系统的信号流图。自适应滤波器对输入信号序列x(n)的每一个样值,按特定的算法,更新、调整加权系数,使输出信号序列y(n)与期望输出信号序列d(n)相比较的均方误差为最小,即输出信号序列y(n)逼近期望信号序列d(n)。
79.有鉴于此,考虑求解回音路径函数f的过程就是从音频信号中移除房间b的声音信号的过程,本发明利用自适应滤波器原理求解回音路径函数f。
80.作为一种可选实施例,本发明可以采用归一化最小均方差算法(normalized least mean square,nlms)来实现自适应滤波器的收敛,对此本发明不作赘述。
81.本发明提供的语音降噪方法,在降低麦克风数量的基础上,采用使用自适应算法计算出双路数字信号中的回音信号,能在有效地降低麦克风数量、降低本地信号处理的计算量和内存占用的基础上,确保具有较强的空域滤波效果。
82.基于上述实施例的内容,作为一种可选实施例,所述将所述远端信号作为自适应滤波器的输入信号,将所述近端信号作为所述自适应滤波器的期望信号,获取收敛后的所述自适应滤波器,包括:
83.利用预先构建的长短期记忆网络模型的前向计算,获取每个频点的语音存在概率;
84.根据所述每个频点的语音存在概率,调整自适应滤波器的自适应步长;
85.基于所述自适应步长对所述自适应滤波器进行收敛,获取所述收敛后的所述自适应滤波器。
86.具体来说,本发明提供的语音降噪方法,将神经网络模型的特征识别与传统信号处理向结合,利用神经网络模型预测的目标方向语音的存在概率,指导自适应滤波器的步长调整,能够加速滤波器收敛和稳态误差(系统误差),包括:
87.利用长短期记忆网络模型(long short

term memory,lstm)前向计算获得每个频点语音存在概率g_v。
88.在训练时,lstm的输入特征为bark域64维特征,对应最高频率点为128,且更高频率点的值全部用第128点值。
89.然后,根据g_v来调节自适应步长:u,u=1

g_v。
90.基于上述实施例的内容,作为一种可选实施例,对所述双路语音信号进行波束成型处理,获取语音增强信号,包括:
91.在所述双路语音信号为低频信号的情况下,计算所述双路语音信号中的两路信号之间的相对延时;根据所述相对延时,对所述两路信号进行延时对齐之后再作相减处理,获取所述语音增强信号;
92.在所述双路语音信号为高频信号的情况下,分别确定所述双路语音信号中两路信号相关的一阶差分麦克风阵列的第一权重系数和第二权重系数;分别将所述第一权重系数
和第二权重系数作为所述两路信号的权重,累加获取所述语音增强信号。
93.本发明在利用bf模块,采用改进的广义旁瓣相消器gsc实现波束成型处理。
94.在利用gsc实现波束成型处理的过程中有一重要步骤,即上支路的固定波束成形。
95.假设双麦克风阵列的间距为1厘米,根据差分波束的权重计算公式,在低频(如:400hz以下)时,白噪声增益会急剧增大,白噪声增益就是对应频点波束权重的模值,结果就是bf模块处理后的低频信号会被放大很多倍。
96.因此,本发明所提供的语音降噪方法,在低频段采用delay sub算法实现固定波束成形,这样就可以解决白噪声增益过大的问题。
97.图5是本发明提供的一种改进后的广义旁瓣相消器的结构示意图,如图5所示,假设双路语音信号为x1(k),声源方向为θ(靠近0度或180度方向),假设帧长选择256,快速傅里叶变换(fast fourier transform,fft)的窗长为512采样点,那么k从1到257,表示频率从0到1/2采样频率处。
98.对于低频400hz(此处是经验值,400

900hz之间,和麦克风间距有关),利用声源的反方向,计算出对应的延时τ1,将双路语音信号进行延时对齐,再相减,则可以得到增强的声源方向的语音增强信号:
99.y(k)=x1(k)

x2(k)*e
jwτ1

100.其中,y(k)为语音增强信号,x1(k)和x2(k)分别为双路语音信号和回音信号。
101.对于高频(400hz)至最高有效频率,则分别计算一阶差分dma的第一权重系数h1(k)和第二权重系数h2(k),再根据公式:
102.y(k)=x1(k)*h1(k)
h
+x2(k)*h2(k)
h

103.获得处理后的频域输出,即为语音增强信号。
104.本发明提供的语音降噪方法,在进行波束成型处理的时候,通过对高频音频信号和低频音频信号分别采用不同的成型方法进行处理,能够综合平衡波束灵敏度和频率一致性两个指标,以至于不需要按照常规的降噪方法那样需要同时布设较多个麦克风,才能实现噪声和干扰的有效抑制消除。
105.基于上述实施例的内容,如图5所示,在获取所述语音增强信号之后,还包括:利用广义旁瓣相消器,对所述语音增强信号进行噪声去除,包括:
106.基于矩阵分块(block matrix,bm)对双路语音信号进行两两相减处理,以清除语音信号中的干扰和噪声进行消除之后,由于上下两路信号在做延时对齐时选择的参照不同,故需对获取的语音增强信号进行延迟处理(delay),并一起输入至自适应噪声消除器(abapitve noise canceller,anc),以进一步去除残留的干扰或噪声。
107.需要说明的是,如果上下两路信号的参照一致,则该处延迟为0,故无需对获取的语音增强信号进行延迟处理。
108.本发明采用双麦克风波束成形技术,通过差分波束成形和广义旁瓣相消器来实现目标方向的语音增强,非目标方向的噪声抑制和干扰消除。
109.基于上述实施例的内容,结合图2所示,在生成语音增强信号之后,还包括:
110.对所述语音增强信号进行单通道维纳滤波,获取去噪语音信号。
111.在对双路语音信号进行波束成型处理,获取语音增强信号之后,将语音增强信号输入至维纳滤波(noise suppression,ns)模块,以对语音增强信号进行去噪,获取去噪语
音信号。
112.ns模块的工作原理可以是:把启动前50帧的音频数据拿来构建噪声模型,把启动前200帧的信号强度用来计算归一化的频谱差值计算模型。
113.根据这两个模型使用概率目的函数来计算出每帧的信噪比并区分出噪声和声音,然后根据计算出的信噪比在频域使用维纳滤波器对噪声信号进行噪声消除,最后在根据降噪前后的能量比和信号噪声似然比对降噪后的数据进行修复和调整后输出。
114.本发明提供的语音降噪方法,通过增设ns模块,可去除平稳噪声、白噪声、常见粉红噪声以及长时追踪的强干扰,实现噪声抑制,
115.基于上述实施例的内容,作为一种可选实施例,在获取去噪语音信号之后,还包括:
116.对所述去噪语音信号进行增益处理,以调整所述去噪语音信号的强度。
117.agc能够使放大电路的增益自动地随信号强度而调整的自动控制方法,即agc模块是限幅输出模块的一种,其利用线性放大和压缩放大的有效组合对输出的语音信号进行调整。当弱信号输入时,线性放大电路工作,保证输出信号的强度;当输入信号达到一定强度时,启动压缩放大电路,使输出幅度降低。也就是说,agc功能可以通过改变输入输出压缩比例自动控制增益的幅度。agc细分为agci(输入自动增益控制)和agco(输出自动增益控制)。
118.本发明提供的语音降噪方法,在获取去噪语音信号之后,将其输入至自动增益控制(automatic gain control,agc)模块,可实现响度动态调整,保证输出语音信号的响度在目标响度范围内。
119.图6是本发明提供的语音降噪装置的结构示意图,如图6所示,主要包括:
120.模数转换模块61,主要用于分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;
121.声学回声消除模块62,主要用于对所述双路数字信号进行回声消除,获取双路语音信号;
122.波束成型模块63,主要用于对所述双路语音信号进行波束成型处理,获取语音增强信号。
123.基于上述实施例的内容,作为一种可选实施例,本发明提供的语音降噪装置,还包括:nc模块,用于对所述语音增强信号进行单通道维纳滤波,获取去噪语音信号。
124.基于上述实施例的内容,作为一种可选实施例,本发明提供的语音降噪装置,还包括:agc模块,用于对所述去噪语音信号进行增益处理,以调整所述去噪语音信号的强度。
125.需要说明的是,本发明实施例提供的语音降噪装置,在具体运行时,可以执行上述任一实施例所述的语音降噪方法,对此本实施例不作赘述。
126.本发明提供的语音降噪装置,利用两个麦克风构建的双麦克风阵列,同时采集音频信号,通过对采集的两路音频信号,分别进行模数转换后,基于小间距差分波束成形技术,对回声消除后的两路信号,进行波束成型处理,能获取到单通道语音增强信号,能够实现较强的空域滤波效果,实现了现有技术需多麦克风阵列才能达到的语音降噪效果,且有效地降低麦克风数量、降低本地信号处理的计算量和内存占用。
127.图7是本发明提供的电子设备的结构示意图,如图7所示,该电子设备可以包括:处理器(processor)710、通信接口(communications interface)720、存储器(memory)730和
通信总线740,其中,处理器710,通信接口720,存储器730通过通信总线740完成相互间的通信。处理器710可以调用存储器730中的逻辑指令,以执行语音降噪方法,该方法包括:分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;对所述双路数字信号进行回声消除,获取双路语音信号;对所述双路语音信号进行波束成型处理,获取语音增强信号。
128.此外,上述的存储器730中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read

only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
129.另一方面,本发明还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法所提供的语音降噪方法,该方法包括:分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;对所述双路数字信号进行回声消除,获取双路语音信号;对所述双路语音信号进行波束成型处理,获取语音增强信号。
130.又一方面,本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的语音降噪方法,该方法包括:分别对双麦克风阵列所采集到的音频信号进行模数转换,获取双路数字信号;对所述双路数字信号进行回声消除,获取双路语音信号;对所述双路语音信号进行波束成型处理,获取语音增强信号。
131.以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
132.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
133.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和
范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1