一种基于双麦克的语音混响消减方法和装置的制作方法

文档序号：7868482阅读：357来源：国知局

专利名称：一种基于双麦克的语音混响消减方法和装置的制作方法
技术领域：
本发明涉及语音增强技术领域，特别涉及一种基于双麦克的语音混响消减方法和
装直。
背景技术：
声音信号在室内的传播过程中，由于墙壁、地面等硬质界面对声音的反射，到达传声器的声音除了直接从声源传来的直达声外，还有经过一次或多次反射传来的声音信号，这些非直达声构成了混响信号。经过一次或少量的几次反射的声音信号称为早期反射信号，早期反射信号构成了早期混响信号，早期混响信号能够对语音起到增强作用。经过多次反射的声音信号称为后期反射信号，后期反射信号构成了后期混响信号，后期混响较强则会降低语音的清晰度。在一些免提语音通讯中，通话者距离麦克风较远，语音清晰度会因房间混响而下降，导致通话质量下降。因此需要一些技术消减混响，提升语音清晰度。麦克风接收信号包括直达声信号和混响信号，而由前述可知混响又可以分为早期混响和后期混响。其中降低语音清晰度的主要是后期混响，而早期混响一般对语音有增强作用。因此提升清晰度的关键是降低后期混响信号。在各种混响消减技术中，基于双麦克的谱减去混响方法受到较多关注。现有的一种基于双麦克风谱减的去混响方法中，采用自适应波束形成(GSC)的结构得到两路信号，第一路信号是延时-求和波束形成器的输出；第二路信号是阻塞矩阵的输出。两路信号的能量包络通过一个自适应滤波器估计出第一路信号的混响，再利用谱减法去除混响。这种方法有几个缺点I)会去除早期混响，使处理后的声音变得单薄。2)对混响强弱没有判断，在不同混响情况下都沿用一样的谱减处理，这样在混响弱、语音清晰度原本比较高时可能损伤语音质量。3)需要准确估计直达声波达方向，分离直达声，因而要求麦克风具有很高一致性，对声学设计也有严格的限制。

发明内容
鉴于上述问题，提出了本发明以便提供一种克服上述问题的基于双麦克的语音混响消减方法和装置。依据本发明的一个方面，提供了一种基于双麦克的语音混响消减方法，该方法包括接收主麦克输入信号和辅麦克输入信号，逐巾贞做如下处理根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t)；获取传递函数h(t)的拖尾部分匕⑴，并根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子3 ;
用辅麦克输入信号与hjt)作卷积，得到主麦克输入信号的后期混响估计信号；对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱；对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱；根据主麦克输入信号的频谱、增益函数的调节因子P以及主麦克输入信号的后期混响谱计算增益函数；用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱；对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号；将主麦克输入信号去混响后的时域信号逐巾贞叠接相加后，输出主麦克输入信号去混响后的连续信号。依据本发明的另一方面，提供了一种基于双麦克的语音混响消减装置，对主麦克和辅麦克接收到的信号逐帧进行处理；该装置包括混响谱估计单元和谱减单元，其中混响谱估计单兀，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h (t)，获取传递函数h (t)的拖尾部分hjt)，并根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子P输出给谱减单元，用辅麦克输入信号与hjt)作卷积，得到主麦克输入信号的后期混响估计信号，对主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给谱减单元；谱减单元，用于接收主麦克输入信号和混响谱估计单元输出的增益函数的调节因子以及主麦克输入信号的后期混响谱，对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱，根据主麦克输入信号的频谱、增益函数的调节因子0以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号，将主麦克输入信号去混响后的时域信号逐巾贞叠接相加后，输出主麦克输入信号去混响后的连续信号。由上述可见，本发明通过根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t)，取传递函数h(t)的拖尾部分hjt)，并且根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子P ;然后根据辅麦克输入信号与\(t)作卷积，得到主麦克输入信号的后期混响估计信号，并根据主麦克输入信号的频谱、增益函数的调节因子@以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，即通过谱减法从主麦克输入信号的频谱中减去主麦克输入信号的后期混响估计谱，因此能从主麦克的输入信号中有效地消除其后期混响，而保留其早期混响，不会使处理后的声音变得单薄，提高了语音的质量。同时在估计后期混响中根据混响强弱调节谱减力度，在混响弱的时候少做甚至不做谱减，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音，保护语音质量。并且这种方案中不需要准确估计直达声波达方向，因而不要求麦克风具有很高一致性，对声学设计也没有严格的限制。

图1是本发明实施例中给出的激励信号到麦克输入信号的传递函数示意图；图2是本发明实施例中给出的辅麦克到主麦克的传递函数h(t)的示意图；图3是本发明一个实施例中的一种基于双麦克的语音混响消减方法的流程示意图；图4是本发明又一个实施例中的基于双麦克的语音混响消减方法的整体流程示意图。图5a是本发明实施例中的声源到主麦克距离为0. 5m时辅麦克到主麦克的传递函数的示意图；图5b是本发明实施例中的声源到主麦克距离为Im时辅麦克到主麦克的传递函数的不意图；图5c是本发明实施例中的声源到主麦克距离为2m时辅麦克到主麦克的传递函数的不意图；图5d是本发明实施例中的声源到主麦克距离为4m时辅麦克到主麦克的传递函数的不意图；图6a是本发明实施例中的主辅麦克之间的间距为6cm时的频率补偿滤波器的幅频特性示意图；图6b是本发明实施例中的主辅麦克之间的间距为18cm时的频率补偿滤波器的幅频特性示意图；图7a是本发明实施例中的主麦克输入信号的时域图；图7b是本发明实施例中的主麦克去混响后的时域图；图7c是本发明实施例中的主麦克输入信号的语谱图；图7d是本发明实施例中的主麦克去混响后的语谱图；图8是本发明实施例中的一种基于双麦克的语音混响消减装置的组成结构图；图9是本发明的一个较佳实施例中的基于双麦克的语音混响消减装置的详细组成结构及其输入输出示意图。
具体实施例方式首先需要声明的是为使申请文件简要，在本申请文件中将“麦克风”简称为“麦克”。根据对现有技术的分析，为了更好的混响消减需要在去除后期混响的同时保护直达声和早期混响，因而需要准确稳定的后期混响估计和混响强弱判断。本发明提出了基于双麦克的去混响方案，充分的利用了混响和双麦克空间传递函数之间的近似关系，利用双麦克空间传递函数估计后期混响并判断混响强弱，与谱减模块配合在各种混响环境下都可以在满足清晰度的同时得到接近最优的语音质量。另外发明中的方案不需要分离直达声也不用做波达方向估计，因而不要求麦克风一致性，放宽了对声学设计的要求。本发明的基本原理是通过双麦克之间传递函数的尾部估计后期混响，因此谱减中可以很好的保留直达声和早期混响。并且在估计后期混响中进一步利用双麦克传递函数的头部和尾部能量差异估计房间混响的程度，调节谱减力度，在混响弱的时候少做甚至不做谱减，保护语音质量。为使本发明的技术方案清楚，下面对本发明的技术原理进行分析说明。早期混响信号能够对语音起到增强作用，后期混响则会降低语音的清晰度。图1是本发明实施例中给出激励信号到麦克输入信号的传递函数示意图。参见图1，在激励信号到麦克输入信号的传递函数上，峰值最大的地方对应直达声，通常将距离最大峰的某个点作为早期反射和后期反射的分界点，最大峰到分界点的部分对应早期混响，分界点后的部分对应后期混响。在图1中，该分界点为50ms。将激励信号记为s(t),麦克输入信号记为x(t),激励信号到麦克输入信号的传递函数记为tf(t)，对应直达声和早期混响部分的传递函数记为tfd(t)，对应后期混响部分的传递函数记为那么，麦克输入信号可以表示为激励信号与传递函数的卷积x(t)=s(t)*tf (t),麦克输入信号的直达声和早期混响成分可以表示为xd(t) = s(t)*tfd(t),麦克输入信号的后期混响成分可以表示为\(t) = s(t)*tfr(t) o则麦克输入信号也可以表示为 X(t) =s(t)*tf(t) = s(t)*(tfd(t)+tfr(t)) = xd(t)+xr(t)。语音的清晰度可以用C5tl来表示，其计算公式为

权利要求
1.一种基于双麦克的语音混响消减方法，其特征在于，该方法包括接收主麦克输入信号和辅麦克输入信号，逐巾贞做如下处理根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h(t)；获取传递函数h(t)的拖尾部分hjt)，并根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子3 ；用辅麦克输入信号与hjt)作卷积，得到主麦克输入信号的后期混响估计信号；对主麦克输入信号的后期混响估计信号进行时域到频域的转换得到主麦克输入信号的后期混响谱；对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱；根据主麦克输入信号的频谱、增益函数的调节因子0以及主麦克输入信号的后期混响谱计算增益函数；用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱；对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号；将主麦克输入信号去混响后的时域信号逐巾贞叠接相加后，输出主麦克输入信号去混响后的连续信号。
2.根据权利要求1所述的方法，其特征在于，在所述得到主麦克输入信号的后期混响估计信号之后，并在进行时域到频域的转换之前，该方法进一步包括对主麦克输入信号的后期混响估计信号进行频率补偿，并且，主麦克与辅麦克之间的距离越大，对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小；对进行频率补偿后的信号进行时域到频域的转换得到主麦克输入信号的后期混响谱。
3.根据权利要求1所述的方法，其特征在于，所述根据传递函数h(t)判断混响的强弱具体为根据如下公式计算表示混响强弱的参数P
4.根据权利要求1所述的方法，其特征在于，所述根据主麦克输入信号的频谱、增益函数的调节因子P以及主麦克输入信号的后期混响谱计算增益函数，具体为根据如下公式计算增益函数G(l，k)
5.根据权利要求1所述的方法，其特征在于，所述获取传递函数h(t)的拖尾部分hjt)包括在传递函数h(t)的时间轴上取早期混响和后期混响的分界点，将传递函数h(t)的该分界点之前的值置O，得到传递函数h (t)的拖尾部分匕(t)。
6.一种基于双麦克的语音混响消减装置，其特征在于，该装置对主麦克和辅麦克接收到的信号逐帧进行处理，该装置包括混响谱估计单元和谱减单元，其中混响谱估计单兀，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h (t)，获取传递函数h (t)的拖尾部分hjt)，并根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子P输出给谱减单元，用辅麦克输入信号与hjt)作卷积，得到主麦克输入信号的后期混响估计信号，对主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给谱减单元；谱减单元，用于接收主麦克输入信号和混响谱估计单元输出的增益函数的调节因子以及主麦克输入信号的后期混响谱，对主麦克输入信号进行时域到频域的转换得到主麦克输入信号的频谱，根据主麦克输入信号的频谱、增益函数的调节因子P以及主麦克输入信号的后期混响谱计算增益函数，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号，将主麦克输入信号去混响后的时域信号逐巾贞叠接相加后，输出主麦克输入信号去混响后的连续信号。
7.根据权利要求6所述的装置，其特征在于，所述混响估计单元包括传递函数计算单元、传递函数拖尾计算单元、混响强弱判断单元、后期混响估计单元和第一时频转换单元；此外所述混响估计单元还包括频率补偿单元；所述谱减单元包括第二时频转换单元、增益函数计算单元、去混响单元、频时转换单元和叠接相加单元；其中传递函数计算单元，用于接收主麦克输入信号和辅麦克输入信号，根据主麦克输入信号和辅麦克输入信号计算辅麦克到主麦克的传递函数h (t)，并将传递函数h (t)输出给传递函数拖尾计算单元和混响强弱判断单元；传递函数拖尾计算单元，用于求取传递函数h(t)的拖尾部分hjt)，并输出给后期混响估计单元；混响强弱判断单元，用于根据传递函数h(t)判断混响的强弱，计算出增益函数的调节因子P输出给增益函数计算单元；后期混响估计单元，用于接收辅麦克输入信号，用辅麦克输入信号与hjt)作卷积，得到主麦克输入信号的后期混响估计信号并输出给频率补偿单元；频率补偿单元，用于对主麦克输入信号的后期混响估计信号进行频率补偿并输出给第一时频转换单元，其中，在主麦克与辅麦克之间的距离越大时，对主麦克输入信号的后期混响估计信号进行频率补偿的程度越小；第一时频转换单元，用于对频率补偿后的主麦克输入信号的后期混响估计信号进行时域到频域的转换，得到主麦克输入信号的后期混响谱后输出给增益函数计算单元；第二时频转换单元，用于接收主麦克输入信号，进行时域到频域的转换得到主麦克输入信号的频谱并输出给增益函数计算单元；增益函数计算单元，用于根据第二时频转换单元输出的主麦克输入信号的频谱、混响强弱判断单元输出的增益函数的调节因子0以及第一时频转换单元输出的主麦克输入信号的后期混响谱计算增益函数并输出给去混响单元；去混响单元，用主麦克输入信号的频谱乘以增益函数得到主麦克输入信号去混响后的频谱，并输出给频时转换单元；频时转换单元，用于对主麦克输入信号去混响后的频谱进行频域到时域的转换，得到主麦克输入信号去混响后的时域信号并输出给叠接相加单兀；叠接相加单元，用于将主麦克输入信号去混响后的时域信号逐帧叠接相加后，输出主麦克输入信号去混响后的连续信号。
8.根据权利要求7所述的装置，其特征在于，所述混响强弱判断单元，用于根据如下公式计算表示混响强弱的参数P
9.根据权利要求7所述的装置，其特征在于，所述增益函数计算单元，用于根据如下公式计算增益函数g(i，k)
10.根据权利要求7所述的装置，其特征在于，所述传递函数拖尾计算单元，具体用于在传递函数h(t)的时间轴上取早期混响和后期混响的分界点，将传递函数h(t)的该分界点之前的值置0，得到传递函数h(t)的拖尾部分 hr(t)。
全文摘要
本发明公开了一种基于双麦克的语音混响消减方法和装置。该方法中，根据主麦克的输入信号x2(t)和辅麦克的输入信号x1(t)计算辅麦克到主麦克的传递函数h(t)，取h(t)的拖尾部分hr(t)，根据h(t)判断混响的强弱，计算出增益函数的调节因子β；x1(t)与hr(t)作卷积，得到x2(t)的后期混响估计信号并根据x2(t)的频谱、β以及的频谱计算增益函数，用x2(t)的频谱乘以增益函数得到x2(t)去混响后的频谱，频时转换得到x2(t)去后期混响后的时域信号。这样能从主麦克输入信号中消除后期混响，而保留早期混响，不会使处理后的声音变得单薄，提高了语音的质量。同时根据混响强弱调节谱减力度，保证了在混响弱、语音清晰度原本比较高的情形下不会损伤语音。并且不需要准确估计直达声波达方向，因而不要求麦克风具有很高一致性。
文档编号H04R3/00GK103067821SQ201210536578
公开日2013年4月24日申请日期2012年12月12日优先权日2012年12月12日
发明者楼厦厦, 李波, 黄秋晨申请人:歌尔声学股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：楼厦厦;李波;黄秋晨
技术所有人：歌尔声学股份有限公司
我是此专利的发明人

上一篇：图像传感器及增大其电荷-电压增益的方法
上一篇：基于无线通信的输电线路实时视频状态监测系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。