一种基于独立成分分析的四麦克语音增强方法

文档序号:2827296阅读:233来源:国知局
一种基于独立成分分析的四麦克语音增强方法
【专利摘要】本发明公开了一种基于独立成分分析的四麦克语音增强方法,包含以下步骤:使用四个麦克组成阵列,采集四路带噪语音信号变换至频域信号;随机选择四个麦克阵列中同一边上的两路信号作为第一组输入信号,将另外两路信号作为第二组输入信号,分别估计一个分离矩阵Wf;步骤3:将步骤1中的得到的频域信号,利用多重信号分类算法进行处理,得到语音信号源方向θ;步骤4:将步骤3中计算得到的语音信号源方向θ作为参考信息,从步骤2中每组分离信号中提取语音信号;步骤5:进行频率排序,对所得语音信号进行幅度平滑,利用一个窗函数对相邻频率的信号进行幅度平滑;步骤6:经过加窗和逆傅里叶变换得到语音信号的时域信号。
【专利说明】一种基于独立成分分析的四麦克语音增强方法
【技术领域】
[0001]本发明涉及一种语音增强的方法,特别是一种基于独立成分分析的四麦克语音增强方法。
【背景技术】
[0002]现实的通信系统中,经常需要一个麦克采集声音,在采集的过程中目标语音经常会被背景噪声污染。因此,麦克采集到的带噪信号需要经过语音增强系统,去除噪声的影响后再播放、传输或保存。语音增强算法的研究已经有40多年的历史,最早是由Bell实验室中的Schroeder提出的一种算法。之后陆续有很多人提出了其他算法,其中谱减法是至今应用最广泛的算法,但是谱减法存在明显的缺陷,在抑制噪声的同时会损伤语音,并且人为的引入噪声,如,“音乐”(musical)噪声。
[0003]基于单麦克的语音增强算法不能同时提高语音质量和语音可懂度,语音质量的提高往往伴随着语音可懂度的降低。近年来,基于麦克阵列的语音增强算法越来越受到重视,麦克阵列可以利用信号源位置的空间信息,因此基于麦克阵列的语音增强算法可以在不损伤语音的情况下抑制噪声。基于麦克阵列的语音增强算法已经成为一种新的研究趋势。较为成熟的基于麦克阵列的语音增强算法有:自适应波束成型算法、无失真最小化方差响应波束成型、广义旁瓣相消和广义奇异值分解等算法。现有的基于麦克阵列的语音增强算法中麦克阵列规模较大,算法的空间复杂度和时间复杂度都较高,不能灵活应用与便携式通信设备中,例如手机和对讲机。

【发明内容】

[0004]为了克服上述现有语音增强算法存在的问题,本发明提供了一种基于独立成分分析的四麦克语音增强方法,可以减小语音增强过程中对语音的损伤,达到良好的降噪效果。
[0005]本发明一种基于独立成分分析的四麦克语音增强方法的所采用的技术方案为:
[0006]步骤1:利用麦克阵列采集的四路带噪语音信号,对信号进行预处理,经过傅立叶变换变换至频域信号;
[0007]步骤2:将四麦克方阵中同一边上的两路信号作为第一组输入信号,另外两路信号作为第二组输入信号,对每组预处理后的频域信号,利用频域独立成分分析算法,针对频域中的每个频点f分别估计一个分离矩阵Wf,每组信号对应得到包括一路语音信号和一路噪声信号的分离信号;
[0008]步骤3:将步骤I中的得到的频域信号,利用多重信号分类算法进行处理,得到语音信号源方向Θ ;
[0009]步骤4:将步骤3中估计得到的语音信号源方向Θ作为参考信息,用于从每组分离信号中提取语音信号;
[0010]步骤5:对频域语音信号进行幅度平滑;
[0011]步骤6:经过加窗和逆傅里叶变换得到语音信号的时域信号。[0012]步骤4中,利用步骤3中估计得到的语音信号源方向Θ作为参考信息,从步骤2每组分离信号中提取语音信号包括如下步骤:
[0013]I)利用频点f的分离矩阵Wf计算语音信号源方向,每个频点计算得到两个信号源方向0 (f)和& (f),频点数为傅里叶变换长度的一半;
[0014]2)将上述所有频点计算得到的信号源方向进行K均值聚类,聚成两类,利用语音信号源方向Θ,选择语音信号源方向Θ角度相差10度以内的聚类作为语音信号的入射方向;
[0015]3)剔除可信度低的频点:对于同一频点,如果其中一个信号的入射方向与语音信号源方向Θ相差10°以内,且其另一个信号的入射方向距离另一个聚类的中心小于20°,则该频点的可信度高,选择距离语音信号源方向Θ近的语音信号的入射方向作为最终的语音信号源方向;否则,判定该频点为失效频点;
[0016]4)对于失效频点,利用相邻频点谱包络的相关性重新提取:
[0017]首先,计算失效频点的频谱Ii(/)与有效频点的谐波结构鳥fe)的相关性之和cor(f),计算公式为:

[0019]其中
【权利要求】
1.一种基于独立成分分析的四麦克语音增强方法,其特征在于,包含以下步骤: 步骤1:使用四个麦克组成阵列,采集四路带噪语音信号,对信号进行预处理,经过傅立叶变换变换至频域信号; 步骤2:随机选择四个麦克阵列中同一边上的两路信号作为第一组输入信号,将另外两路信号作为第二组输入信号,对每组预处理后的频域信号,利用频域独立成分分析算法,针对频域中的每个频点f分别估计一个分离矩阵Wf,每组信号对应得到包括一路语音信号和一路噪声信号的分离信号; 步骤3:将步骤I中的得到的频域信号,利用多重信号分类算法进行处理,得到语音信号源方向Θ ; 步骤4:将步骤3中计算得到的语音信号源方向Θ作为参考信息,从步骤2中每组分离信号中提取语音信号; 步骤5:进行频率排序,对所得语音信号进行幅度平滑,利用一个窗函数对相邻频率的信号进行幅度平滑; 步骤6:经过加窗和逆傅里叶变换得到语音信号的时域信号。
2.根据权利要求1中所述一种基于独立成分分析的四麦克语音增强方法,其特征在于,步骤4中,利用步骤3中估计得到的语音信号源方向Θ作为参考信息,从步骤2每组分离信号中提取语音信号包括如下步骤: 1)利用频点f的分离矩阵Wf计算语音信号源方向,每个频点计算得到两个信号源方向4 (f)和4 (f),频点 数为傅里叶变换长度的一半; 2)将上述所有频点计算得到的信号源方向进行K均值聚类,聚成两类,利用语音信号源方向Θ,选择语音信号源方向Θ角度相差10度以内的聚类作为语音信号的入射方向; 3)剔除可信度低的频点:对于同一频点,如果其中一个信号的入射方向与语音信号源方向Θ相差10°以内,且其另一个信号的入射方向距离另一个聚类的中心小于20°,则该频点的可信度高,选择距离语音信号源方向Θ近的语音信号的入射方向作为最终的语音信号源方向;否则,判定该频点为失效频点; 4)对于失效频点,利用相邻频点谱包络的相关性重新提取: 首先,计算失效频点的频谱焉(f)与有效频点的谐波结构《(g)的相关性之和coHf),计算公式为: mr(f)
其中 g =..., l/3f, l/2f, 2f, 3f,…, 其中g为有效频点, 若相关性之和cor(f)超过0.9,则提取该频点为有效频点; 反复进行上述迭代步骤.直到迭代次数超过100次,对于最终未提取的频点, 将所述频点与其相邻的已提取的频点计算相关性,进行提取。
3.根据权利I中所述的一种基于独立成分分析的四麦克语音增强方法,其特征在于,步骤5中对提取的语音信号进行加窗平滑,使用汉宁窗,加窗函数如下:
【文档编号】G10L21/028GK103854660SQ201410061180
【公开日】2014年6月11日 申请日期:2014年2月24日 优先权日:2014年2月24日
【发明者】张彦芳, 王芳, 周海瑞, 王犇, 朱冰 申请人:中国电子科技集团公司第二十八研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1