一种基于联合抑制的麦克风阵列语音增强方法

文档序号:7995398阅读:252来源:国知局
专利名称:一种基于联合抑制的麦克风阵列语音增强方法
技术领域
本发明涉及语音增强的技术领域,具体就是,本发明涉及的是面向从二元麦克风小尺度阵列到多元麦克风大尺度阵列的目标语音增强算法。
背景技术
当前从移动通讯、电话会议、笔记本语音交流、汽车通话到电视互动等应用无一例外的面临着各种类型噪音如混响、回声和其他环境噪音的干扰,这给通讯双方造成了不便, 因而噪音抑制问题自然而然的被提出并被广泛研究。目前噪音抑制或者说是语音增强技术主要有两个方向,一个是面向单麦克风的单道语音增强技术,其优势是成本低,但处理后的目标语音损伤较大,同时对非平稳噪音抑制能力有限;另外一个方向是麦克风阵列语音增强技术,相对单道麦克风语音增强技术,其处理后目标语音损伤小,且能够抑制非平稳噪音,因而近年来被广泛关注和研究。
麦克风阵列语音增强算法一般采用波束形成噪音抑制方法,其思想是期望在阵列中心到目标语音间形成一个波束,而波束外的信号被抑制掉,然后对波束内渗入的噪音采用单道噪音抑制算法进行处理,得到最终的目标语音输出。麦克风阵列波束形成算法根据估计和跟踪噪音过程的不同可分为固定波束形成算法和自适应波束形成算法,固定波束形成算法包括延迟求和波束形成技术和超指向性波束形成技术等;自适应波束形成算法包括最小均方自适应滤波器、递归最小二乘自适应滤波器以及基于它们的改进算法。固定波束形成算法的缺陷是抑制效果有限或条件要求较高,如延迟求和波束形成器需要大量的阵元条件,或敏感,如超指向性波束形成技术对不相关噪音以及麦克风阵列特性(增益、位置、 相位)误差敏感;而自适应波束形成器面临最大的问题是收敛性问题,收敛性与噪音复杂度以及噪音与目标语音的相关性有关,另外还需要语音活动检测技术支持。一般实际应用和研究时,往往采用固定波束形成器结合自适应波束形成器的方法,如广义旁瓣抵消器 (Generalized Sidelobe Canceller, GSC)结构和差分麦克风阵列结构。但差分麦克风阵列面向的是微阵列语音增强技术,且要求目标语音为端射方向,否则目标语音会有变形。
而对于已有公开的麦克风阵列噪音抑制技术,普遍存在算法复杂度高,计算量大或仅对某一阵列环境的语音增强应用等特点,造成普适性不够。如2009年1月21日公开的专利CN101351058,是面向的圆形麦克风阵列,仅能对特定应用有效,另外它期望通过获得某个弧度范围的入射方向推算其他弧度访问的入射方向,由于入射方向估计难度较大, 误差不可避免,这样推算其他弧度内的入射角误差可能会更大,这些都会对最终语音增强造成不利影响;而2009年2月18日公开的专利CN101369427,利用GSC结构,采用功率谱密度估计代替时域或频域信号,进行自适应估计,获得估计噪声功率谱,进而通过相减获得波束形成信号功率谱密度,然后进行后置滤波,该算法波束形成算法中由于需要计算功率谱密度,当阵元数较多时,计算量相对其他方法,计算量较大,另外波束形成中通过减去噪音功率谱密度,与单道谱减法缺点一样,容易引起乐噪。发明内容
当前麦克风阵列波束形成算法中采用的自适应滤波器对与目标声源不相关的噪音有很好的抑制效果,但对与目标语音相关性的噪音则效果较差,对这些残留的相关噪音抑制一般采用单道后置滤波器进行处理,例如谱减法、维纳滤波器等,这些方法一般都需要利用语音活动检测的方法,用非语音段的噪音代替或估计语音段方法,因而会造成目标声源变形或形成乐噪。为了克服这些缺点,本发明提出一种与已有的阵列语音增强技术相比, 噪音抑制效果更好、处理后的语音质量更高、且算法稳定并适合各种尺度和类型的麦克风阵列的语音增强方法。
一种基于联合抑制的麦克风阵列语音增强方法,包括以下步骤
步骤1,构建麦克风阵列、以接收外界模拟信号,由二到多个以上全指向性麦克风组成线性、圆形或球形阵列;将接收到的模拟信号转换为待处理的数字信号;
步骤2,分析所述的数字信号,获取目标语音相对阵列中每个阵元的相对时延;根据时延,以阵列中某个阵元接收的语音信号作为参考,对其他阵元接收到的数字信号进行时延补偿,获得补偿后的信号;利用子带分解分别将每个阵元的时延补偿信号分解成若干个子带信号,然后分别对每个子带信号进行固定波束形成,以获得每个频带范围内目标声源方向的初步增益;
步骤3,利用阻塞矩阵分别获得每个子带内的噪音参考信号;
步骤4,利用变步长归一化LMS算法对步骤4的每个子带进行自适应滤波处理,处理结束后进行子带合并处理,获得输出信号e。
步骤5,利用阵列中两个阵元补偿后的信号进行改进的递推噪音互功率谱密度估计(Iterative noise Cross Power Spectral Density,ICPSD)算法,获得去除相关噪音的滤波器H,结合步骤4获得的增强信号e,进而获得最终的目标语音输出y。
进一步,步骤1中的阵列可以从间距为Icm左右的致密型阵列到阵元间距大于km 的大尺度常规阵列,每个阵元接收到的模拟信号使用音频采集卡对阵列接收到的模拟信号进行A/D转换,形成待处理的数字信号。
步骤2包括以下子步骤
2. 1,分别获取目标声源到达基准麦克风和其他麦克风的相对时延,如第i个麦克风接受的信号相对基准麦克风1的信号时延,其时延值通过公式1来估计1 T
Rv = -~ Xbl(I)Xbi(t-τ) ......公式 ι1 ‘ T-Tjr
其中Τ为麦克风阵列采集语音信号的实际时间,Xb1 (t),Xbi (t)分别对应的是t 时刻第一麦克风(基准麦克风),第i麦克风所对应的数字信号,Wv,表示Xb1Uhxbi(t)的互相关函数,其最大值对应的τ就是两个麦克风相对时延值;
?^,分别对办⑴,…,叉比⑴进行时延校正,获得Xb2 (t)的校正后信号&(t),依次类推,xbn(t)的校正后信号;为了统一书写格式,把基准麦克风信号xbi(t)代替;
2. 3,利用子带分解方法分别把上述时延补偿后的信号分解成k个子带例如 X1 (t)分解成 X-IsuHa),x-lsub-2(t),……,x-lsub-k(t) ;x2(t)到依次类推。
2. 4,对每个子带分别进行固定波束形成,如第i个子带的固定波束形成获得的信号yU由公式2计算
权利要求
1.一种基于联合抑制的麦克风阵列语音增强方法,包括以下步骤步骤1,构建麦克风阵列、以接收外界模拟信号,由二到多个以上全指向性麦克风组成线性、圆形或球形阵列;将接收到的模拟信号转换为待处理的数字信号;步骤2,分析所述的数字信号,获取目标语音相对阵列中每个阵元的相对时延;根据时延,以阵列中某个阵元接收的语音信号作为参考,对其他阵元接收到的数字信号进行时延补偿,获得补偿后的信号;利用子带分解分别将每个阵元的时延补偿信号分解成若干个子带信号,然后分别对每个子带信号进行固定波束形成,以获得每个频带范围内目标声源方向的初步增益;步骤3,利用阻塞矩阵分别获得每个子带内的噪音参考信号;步骤4,利用变步长归一化LMS算法对步骤4的每个子带进行自适应滤波处理,处理结束后进行子带合并处理,获得输出信号e。步骤5,利用阵列中两个阵元补偿后的信号进行改进的递推噪音互功率谱密度估计 (Iterative noise Cross Power Spectral Density, ICPSD)算法,获得去除相关噪音的滤波器H,结合步骤4获得的增强信号e,进而获得最终的目标语音输出y。
2.根据权利要求1所述的一种基于联合抑制的麦克风阵列语音增强方法,其特征在于步骤1中的阵列可以从间距为Icm左右的致密型阵列到阵元间距大于4cm的大尺度常规阵列,每个阵元接收到的模拟信号使用音频采集卡对阵列接收到的模拟信号进行A/D转换,形成待处理的数字信号。
3.根据权利要求2所述的一种基于联合抑制的麦克风阵列语音增强方法,其特征在于步骤2包括以下子步骤2.1,分别获取目标声源到达基准麦克风和其他麦克风的相对时延,如第i个麦克风接受的信号相对基准麦克风1的信号时延,其时延值通过公式1来估计
4.根据权利要求3所述的一种基于联合抑制的麦克风阵列语音增强方法,其特征在于步骤3中,通过公式3获取每个子带中η个元素的参考噪音向量Nsulri,Nsub_2……,Nsub_k, 其中第i个子带的参考噪音向量为X-IisuH (t)]T……公式 3公式3中B为阻塞矩阵(Blocking Matrix, BM),它由公式4确定 -1,-1,...,-1-\η-\···-\^=……公式4-1,-1,—, -1 公式4中的η表示阵列中的阵元数,η >= 2。
5.根据权利要求4所述的一种基于联合抑制的麦克风阵列语音增强方法,其特征在于步骤4中,通过归一化最小均方(NormalizedLeast Mean Squares,NLMS)自适应滤波器算法实现与目标语音不相关的噪音抑制,包含以下步骤4. 1、假定NLMS滤波器长度为M,则子带i第m个参考噪音序列Vsulrf (m)和权系数向量 Wsub^i (m)可分别表示为Vsub^i (m) = [Ν-— (m),Ν-— (m_l),...,Nsub^i (m-M+1) ]τ......公式 5Wsub_i (m) = [w0 (m), W1 (m),…,wn (m) ]τ......公式 6公式6中的W。(m), W1 (m), -,wn(m)的初始值均为O。 4. 2、估计的噪音信号Clsulrf为4. 3、NLMS输出信号即误差信号为期望信号减去估计的噪音信号eSUb-i (m) = ybsub_i (m) -d—— (m)......公式 84. 4、下一个权系数向量由下式计算Kub-r 如 + O = Kub-r ㈣ +㈣ /Pi,㈣。—,(爪))……公式 9其中μ为步长因子,初始阶段让其从一个较大的值逐步变化到一个稳定的较小值,用以加速滤波器初始阶段的收敛性;VTV为归一化系数,用以提高LMS算法的收敛性。4.5、最后将获得的k个子带输出信号进行子带合并,得到输出信号e。6.根据权利要求5所述的一种基于联合抑制的麦克风阵列语音增强方法,其特征在于步骤5中包括以下子步骤5.1、对步骤2中得到的信号Xl (t),xn(t)分别进行短时傅里叶变换并进行分帧和加窗操作得到)(1江,1)411江,1),其中€表示频率因子,1代表第几帧。用^3vJP &# 分别表示为第1和第η两个阵元接收信号的互功率谱密度(Cross Power Spectral Density, CPSD) 以及两个阵元接收信号的估计噪音的CPSD ; ^P^jn Aa分别为这两个阵元信号的功率谱密度(Power Spectral Density, PSD)。则滤波器H(f,1)可由公式10计算dSUb-, ο)=Kb-, (mWsub-, ο)=Σ wJ (m>sub-, ο - !)……公式 7H(fJ)- l2L*JMJL·……μ“.C驅……ΛΑ公式105. 2、公式10中的R(f,1)由公式11定义R(ZJ)+(I-Ad)AC/,/)…公式 n5. 3、公式11中的I p(f,1)由公式12定义
全文摘要
一种基于联合抑制的麦克风阵列语音增强方法,包括构建麦克风阵列、以接收外界信号;分析信号,获取目标声源相对麦克风阵列中不同阵元信号相对基准阵元信号的时延;根据时延,分别对与两个麦克风所对应的数字信号进行时延补偿,获得补偿后的信号;对补偿后的阵列信号分别进行子带分解,然后再每个子带上进行固定波束形成;同时分别在每个子带上使用阻塞矩阵获取每个子带上的噪音参考信号;然后在每个子带上分别通过自适应滤波处理算法,将相应子带上固定波速形成器中的与目标语音无关的噪音去除并进行子带合并,从而形成初步增益信号;同时利用前面补偿后的任意两个阵元信号,通过递推互功率谱密度获得抑制与目标语音相关噪音信号的滤波器,进而结合初步增益信号得到最终的目标语音信号。
文档编号H04R3/04GK102509552SQ20111032474
公开日2012年6月20日 申请日期2011年10月21日 优先权日2011年10月21日
发明者杨立春, 钱沄涛 申请人:浙江大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1