一种通信耳机的语音增强方法、装置及降噪通信耳机的制作方法

文档序号：7749078阅读：177来源：国知局

专利名称：一种通信耳机的语音增强方法、装置及降噪通信耳机的制作方法
技术领域：
本发明涉及语音增强降噪技术领域，更为具体地，涉及一种通过复用多个麦克风所拾取的声音信号在通信耳机的送、受话端提供降噪的语音增强方法和装置，以及一种降噪通信耳机。
背景技术：
社会信息化程度的提高使得人们能随时随地的进行通信和交流，各种各样的通信设备和技术的广泛应用极大地方便了人们的生活和提高了工作效率。然而社会的发展带来的一个比较严重的问题是噪声问题，在噪声环境中进行通信，严重影响到通信语音的清晰度和可懂度，当噪声高到一定程度时，不但通信无法进行，而且会对人的听力和身心健康产生伤害。针对在强噪声背景下进行通信问题，现有的技术解决方案从以下两个方面来进行降噪处理一方面是在通信耳机送话端采用声学信号处理技术提高麦克风拾取的语音信号的信噪比，使得远端用户能够听清通信耳机使用者的讲话。另一方面需要在通信耳机受话端提高受话端语音的信噪比，使得近端耳机佩戴者能够听清远端用户送过来的语音信号。目前常用的通信耳机送话端的语音增强方法主要是采用单个或多个普通麦克风拾取信号，然后通过声学信号处理方法来达到语音增强的目的。单个麦克风语音增强一般称之为单通道谱减语音增强技术(参见中国发明专利申请公开说明书CN1684143A，CN101477800A)，这种技术一般通过对历史数据的分析来估计当前语音中稳态噪声的能量，然后通过频谱相减的方法消除语音中的噪声来达到语音增强的目的，但是这种方法只能抑制稳态的噪声(如白噪声)，而且降噪量有限，降噪量过大就会损害语音，对于非稳态噪声(如周围的语音噪声，敲击噪声)不能准确估计其能量，因此不能被有效消除。另一种可以有效的抑制非稳态噪声的方法是采用两个或多个麦克风组成的麦克风阵列语音增强技术(参见中国发明专利申请公开说明书CN101466055A，CN1967158A)，这种技术通常是用一个麦克风接收到的信号作为参考信号，通过自适应滤波的方法实时估计并抵消另外一个麦克风拾取信号中的噪声成分，保留语音成分，从而达到语音增强的目的，多麦克风技术可以抑制非稳态噪声而且降噪量大于单麦克风技术。但是这种方法需要准确检测语音状态，否则语音有可能会被当作噪声被消除。现有的一些多麦克风技术是利用指向性麦克风(参见中国发明专利申请公开说明书CN101466055A)或多个麦克风形成指向性(参见中国发明专利申请公开说明书 CN101466056A)对来自特定方向的语音进行检测，这种方法只适用于麦克风阵列形状固定、且与使用者的相对位置或方向固定的情况。当用户偏离麦克风阵列的指向范围，或麦克风阵列形状位置发生变化导致麦克风阵列的指向偏离用户时，语音就会被当作噪声抑制。如图1所示的麦克风装配在耳机软线上的情形。在图1所示的通信耳机中，麦克风112设置在耳机软线上，在具体应用过程中，这种耳机麦克风相对于使用者的嘴是不固定的，并且与设置在耳机上其他部位的麦克风所构成的麦克风阵列的形状也不固定，通话时使用者会将软线上的麦克风拿到嘴边的任意位置，当用户把麦克风拿到麦克风阵列的指向性范围外，语音就会被当成噪声来处理，此时利用麦克风阵列的指向性就不能准确检测到语音。目前常用的通信耳机受话端的语音增强方法主要采用两种技术。一种是采用自动音量控制技术(参见中国发明专利申请公开说明书CN1507^3A)，即外界噪声高的时候自动提高输出给扬声器单元的功率，这是一种被动的方法，受限于扬声器单元本身的功率及入耳式耳塞馈入人耳声压的行业标准，扬声器单元的音量不可能无限制的提高，另外扬声器发出的高强度的语音对使用者本身的听力和身心健康也会产生伤害。另外一种方法是把传统的主动/被动相结合的噪声控制技术(参见中国发明专利申请公开说明书 CN101432798A)应用于通信耳机，这种耳机分头戴式和耳塞型两种，耳塞型耳机一般采用皮套和人耳进行密封性的耦合形式，一方面通过材料的吸声和隔声来降低中、高频噪声，另一方面通过主动噪声控制技术有效的降低低频(主要在300Hz以下)噪声，从而实现在全频带对外界噪声较好的控制效果，可以较有效的提升通信耳机受话端语音的信噪比。但是长期佩戴密封式的耳塞型通信耳机，使用者会有耳道内外气压不均衡的感觉，因此，佩戴的舒适性是制约这种结构的主动降噪技术不能广泛应用于通信耳机的主要原因。另外，在强噪声环境下进行通信，需要同时对送、受话端语音进行降噪增强(参见中国发明专利CN101853667A)，这种分别在送话端提供自适应滤波加单通道降噪和在受话端提供封闭式反馈主动降噪来实现通信双方的语音增强技术，除了分别在送、受话端存在前述提到的应用局限性之外，由于其近端自适应滤波的噪声参考信号取自受话端的封闭式反馈主动噪声控制系统，也存在无法保证噪声相关性和因果性的问题。

发明内容
鉴于上述问题，本发明的目的是提供一种复用多个麦克风所采集到的信号来进行语音增强和降噪的技术。其中送话端的语音增强技术根据多个麦克风拾取到的语音信号能量差异来识别耳机的佩戴状态，从而选择不同的降噪处理方法，以保证无论耳机如何佩戴，语音都不会受到损伤，而且在耳机正常佩戴时，可以提供很好的降噪效果。而受话端采用非封闭式前馈主动噪声控制技术，降噪的同时保证了耳机佩戴的舒适性。根据本发明的一个方面，提供了一种通信耳机的语音增强方法，该通信耳机包括由至少两个麦克风构成的送话端和由至少一个麦克风及一个扬声器构成的受话端，所述方法复用多个麦克风信号在所述通信耳机的送话端和受话端分别提供降噪处理，其中，在所述送话端的降噪处理包括通过比较所述通信耳机的麦克风拾取的声音信号的能量差异确定所述通信耳机的佩戴状态；如果所述能量差异大于第一预置阈值，确定所述通信耳机正常佩戴，则先对所述声音信号进行多麦克风降噪，然后通过单通道降噪进一步抑制残留的稳态噪声；否则，确定所述通信耳机非正常佩戴，直接通过单通道降噪抑制所述声音信号中的稳态噪声。其中，优选的方案是，在对所述声音信号进行多麦克风降噪的过程中，具体包括通过比较所述声音信号中各频率成分的能量差异来区分所述声音信号中的语音信号成分和噪声信号成分；对所述噪声信号成分进行衰减处理。根据本发明的另一方面，提供了一种通信耳机，所述通信耳机包括由至少两个麦克风构成的送话端和由至少一个麦克风和一个扬声器构成的受话端，以及送话端降噪处理单元和受话端降噪处理单元，其中，所述送话端降噪处理单元包括佩戴状态确定模块，用于通过比较构成送话端的麦克风拾取的声音信号的能量差异确定所述通信耳机的佩戴状态，如果所述能量差异大于第一预置阈值，确定所述通信耳机正常佩戴，否则，确定所述通信耳机非正常佩戴；多麦克风降噪模块，用于在所述通信耳机正常佩戴时，对所述声音信号进行多麦克风降噪处理；单通道降噪模块，用于在所述多麦克风降噪模块对所述声音信号进行降噪处理后，进一步抑制残留的稳态噪声，以及，在所述通信耳机非正常佩戴时，直接对所述声音信号中的稳态噪声进行抑制处理。根据本发明的另一方面，提供了一种语音增强装置，包括送话端降噪处理单元和受话端降噪处理单元，其中，所述送话端降噪处理单元包括送话端降噪模式确定模块，用于通过比较构成所述送话端的麦克风拾取的声音信号的能量差异确定所述送话端的降噪模式；多麦克风降噪模块，用于在所述能量差异大于第一预置阈值时，对所述声音信号进行多麦克风降噪处理；单通道降噪模块，用于在所述多麦克风降噪模块对所述声音信号进行降噪处理后，进一步抑制残留的稳态噪声，以及，在所述能量差异小于等于所述第一预置阈值，直接对所述声音信号中的稳态噪声进行抑制处理。另外，在受话端，本发明的耳塞设计为非封闭式的入耳结构，以保证长期佩戴的舒适性，同时在非封闭式耳机上实现前馈主动噪声控制技术，在语音频带上实现降噪，保证受话端语音的高信噪比。在本发明的一个优选实施方式中，还增加了啸叫检测单元以通过对送话端所拾取的声音信号的变化及时调整受话端的降噪处理方式，从而增加系统的鲁棒性。利用上述根据本发明的通信耳机的语音增强方法、通信耳机以及语音增强装置，可以有效复用多个麦克风拾取到的信号，同时在通信耳机送、受话端采用声学信号处理方法实现语音增强，保证噪声环境下，近端和远端语音的高信噪比，为通信双方提供高清晰度和可懂度的语音信号。为了实现上述以及相关目的，本发明的一个或多个方面包括后面将详细说明并在权利要求中特别指出的特征。下面的说明以及附图详细说明了本发明的某些示例性方面。然而，这些方面指示的仅仅是可使用本发明的原理的各种方式中的一些方式。此外，本发明旨在包括所有这些方面以及它们的等同物。

通过参考以下结合附图的说明及权利要求书的内容，并且随着对本发明的更全面理解，本发明的其它目的及结果将更加明白及易于理解。在附图中图1为现有技术中麦克风在通信耳机上的装配结构示意图2为根据本发明实施例的通信耳机的结构示意图；图3为本发明实施例的通信耳机的系统结构示意图；图4为根据本发明的通信耳机的语音增强方法中送话端降噪处理部分的流程图；图5为根据本发明实施例的送话端降噪处理单元的逻辑结构示意图；图6为根据本发明的通信耳机的语音增强方法中受话端降噪处理部分的流程图；图7为根据本发明实施例的受话端降噪处理单元的逻辑结构示意图；图8为根据本发明实施例的耳机正常佩戴状态示意图；图9为根据本发明实施例的耳机非正常佩戴状态示意图。在所有附图中相同的标号指示相似或相应的特征或功能。
具体实施例方式为了克服现有技术在降噪方案上所存在的不足，在不损害语音信号的基础上有效地衰减和抑制噪声，本发明从送话端和受话端同时进行降噪，并根据多个麦克风所接收的声音信号的具体特点，主要是其中所包含的语音信号和噪声信号的成分能量差异来识别耳机的佩戴状态，并采用相应的语音增强、降噪方法，使得降噪处理更有针对性，保证语音质量，并达到更好的降噪。下面以常用的通信耳机为例来对本发明提出的语音增强方法流程和装置的结构进行详细说明。本发明所提供的通信耳机的语音增强方法的关键在于有效复用麦克风阵列所采集到的声音信号，在通信耳机送、受话端分别采用多麦克风语音增强技术和非封闭式前馈主动噪声控制技术用来提高噪声环境下通信耳机送、受话端语音的信噪比，保证通信语音的清晰度和可懂度。其中，本发明在送话端提出结合用户佩戴状态识别的多麦克降噪技术，此技术不需要利用麦克风指向性来检测语音，而是通过检测麦克风所拾取的声音信号中主信号和参考信号的能量差异来识别不同的用户佩戴状态来相对应采用不同的降噪方法，从而保证在麦克风位置或形状不固定时降噪处理不会损伤语音。在受话端，本发明采用非封闭式前馈主动噪声控制技术，保证佩戴舒适性的同时有效降低语音频带内的噪声信号。以下将结合附图对本发明的具体实施例进行详细描述。本发明所提供的通信耳机的语音增强方法从送话端和受话端两方面进行降噪处理，由于本发明是在复用麦克风所采集到的声音信号的基础上进行降噪处理，所以本发明所应用的通信耳机中包括由至少两个麦克风构成的送话端、由至少一个麦克风和一个扬声器构成的受话端以及对声音信号进行降噪处理的主机。图2为应用本发明的一个通信耳机实施例的结构示意图。如图2所示，本实施例所应用的通信耳机的入耳部分采用传统的非封闭入耳式耳塞结构，能够与耳朵较好耦合，提供佩戴的牢固性，又不会完全密封住耳道，保证长期佩戴的舒适性。通信耳机包括送话端、受话端、耳机线和主机230，其中，送话端利用三个麦克风所采集到的信号，麦克风212设置在耳机线上，麦克风214和216分别设置在耳机支杆的背部，开孔朝外。受话端包括两个麦克风214和216及两个扬声器2M和226。在这种通信耳机中，在耳机正常佩戴通话时使用者会把安装在耳机线上的麦克风212拿到嘴边(如图8所示)，由于此麦克风212与嘴部距离较近，能够拾取信噪比比较高的声音信号，因此将该麦克风212视为主麦克风。而麦克风214和216由于设置在耳机支杆的背部，开孔朝外，在通信耳机的正常使用过程中距离使用者的嘴部距离较远，便于拾取较好的噪声参考信号，因此将这两个麦克风视为参考麦克风。在本发明的一个具体实施方式
中，采用三麦克风通信耳机300的系统方框图示于图3，其中主机端包括DSP单元200和模拟电路构成的受话端语音降噪处理单元700，DSP 部分的送话端降噪处理单元400完成送话端语音的增强，同时啸叫检测单元500为受话端语音增强模块提供啸叫检测控制信号；受话端语音降噪处理单元700完成受话端的语音降噪。其中主机端可以采用DSP加一些模拟电路来单独实现，也可以作为一些音频设备或手机的一部分来实现。需要说明的是，图3所示的实施例中所采用的麦克风的个数为3，但在本发明的具体应用中也可以采用其他数量的麦克风，如仅采用均设置在耳机支杆背部的两个麦克风 (如214和216)，此时送话端不存在主麦克风和参考麦克风之分，只使用单通道降噪模式即可；如果采用分设在耳机线和耳机支杆背部的两个麦克风(如212和214)，则可以根据使用者的佩戴情况选择多麦克风降噪模式和/或单通道降噪模式；或者根据具体通信产品的需要采用更多的麦克风以达到更好的拾取有用语音信号和噪声信号的目的，此时可以根据麦克风所具体拾取到的声音信号判断是否有主、从麦克风的区分，从而采用相应的降噪模式。下面将分别从送话端和受话端两大部分对本发明的语音增强方法和装置进行阐述。图4为根据本发明的通信耳机的语音增强方法中送话端降噪处理部分的流程图。如图4所示，送话端降噪处理部分的降噪处理流程包括S410:通过比较通信耳机受话端的麦克风拾取的声音信号的能量确定麦克风拾取信号能量差异，其中的声音信号包括语音信号和噪声信号；S420 判断所确定的能量差异是否大于第一预置阈值来识别耳机佩戴状态，如果该能量差异大于第一预置阈值耳机正常佩戴(如图8所示)，则进入步骤S430，否则，耳机非正常佩戴(如图9所示)，进入步骤S440 ；S430 对所拾取的声音信号进行多麦克风降噪；S440 通过单通道降噪抑制声音信号中的稳态噪声。图5为根据本发明实施例的在通信耳机送话端采用声信号处理方法进行语音增强的送话端降噪处理单元的逻辑结构示意图。如图5所示，送话端降噪处理单元400包括佩戴状态确定模块420、多麦克风降噪模块440以及单通道降噪模块460。其中，佩戴状态确定单元420用于通过比较构成送话端的麦克风拾取的声音信号的能量差异确定通信耳机的佩戴状态，如果能量差异大于第一预置阈值，确定所述通信耳机正常佩戴，否则，确定所述通信耳机非正常佩戴。其中，所拾取的声音信号包括语音信号和噪声信号；多麦克风降噪模块440用于在上述能量差异大于第一预置阈值、通信耳机正常佩戴时，对麦克风所拾取的声音信号进行多麦克风降噪处理；
单通道降噪模块460用于在多麦克风降噪模块440对声音信号进行降噪处理后，进一步抑制残留的稳态噪声，以及，在上述能量差异小于等于第一预置阈值、通信耳机处于非正常佩戴状态时，直接对声音信号中的稳态噪声进行抑制处理。下面结合图3、图4和图5对本发明在送话端的降噪处理方法以及降噪处理模块做更为细致的说明。当通信耳机的耳塞处于佩戴状态时，麦克风214、216相对于人嘴的距离和位置都基本上是确定的，在本发明中被视为参考麦克风，它们所拾取的声音信号被视为参考信号。在正常应用状态中，麦克风212被拿到相对于人嘴的距离很近的位置，在本发明中被视为主麦克风，所拾取的声音信号被视为主信号。但是麦克风212的位置在实际使用过程中却存在很大的不确定性。它可能与人嘴的距离比较近，也可能与麦克风214、216到人嘴的距离相当。通常定义麦克风212与人嘴距离较近时为正常佩戴模式，此时麦克风212拾取的主信号比麦克风214、216拾取的参考信号高，在通常的通信环境下处在送话状态时，一般主信号会比参考信号高6dB以上；而当麦克风212偏离人嘴过远时则为非正常佩戴模式，此时麦克风212拾取到的主信号能量与麦克风214、216拾取的参考信号能量接近。通过这一特点，即可以在区分了主麦克风和参考麦克风的基础上，通过比较通信耳机的主、参考麦克风分别拾取的声音信号的能量差异来判断出耳机是否处于正常佩戴状态。具体地，作为示例，在确定能量差异的过程中，首先把主麦克风212和参考麦克风 214采集到的信号分别分为每N(N= 51 个采样点的一帧数据，求这两帧数据的能量和 P_112，P_114 ；然后求能量和的比值Rp = P_112/P_114。当Rp大于阈值Rth(如=Rth > 6dB)时，为正常佩戴模式，此时利用多麦克风降噪单元460对声音信号进行多麦克降噪处理，然后再进行单通道降噪。当Rp小于阈值Rth，这时为非正常佩戴模式，不能很好区分语音与噪声，如果也同样采用多麦克降噪处理语音可能会被当成噪声抑制，因此只采用单通道降噪单元480作降噪处理，以避免语音损伤。其中，多麦克风降噪模块440包括声音信号成分区分模块442和噪声信号衰减模块444。声音信号成分区分模块442用于通过比较声音信号中各频率成分的能量差异来区分声音信号中的语音信号成分和噪声信号成分；噪声信号衰减模块444用于对声音信号成分区分模块442所区分出的噪声信号成分进行衰减处理。具体地，作为示例，当用户正常佩戴时，麦克风212拾取到的近场的语音信号成分要比麦克风214和216大6dB以上，而麦克风214、216和212拾取到的噪声成分能量相当。因此多麦克风降噪单元460利用麦克风212和麦克风214 (也就是主麦克风和参考麦克风) 拾取到的信号中各个频率成分的能量差异来区分语音成分和噪声成分，并对噪声成分进行降噪处理。首先，利用声音信号成分区分模块442区分出语音信号和噪声信号。具体的处理过程包括把麦克风112和214的一帧数据分别进行快速傅里叶变换，把时域数据变换成各个频率成分Fi_112，Fi_114(i表示第i个频率成分)；计算每个频率的能量Pi_112，Pi_114 ；对每个频率成分的能量进行比较得到能量比值 Ri = Pi_112/Pi_114 ；
当Ri大于阈值Rthi (Rthi > 6dB)，则第i个频率成分是语音；当Ri小于阈值 Rthi (Rthi > 6dB)，则第i个频率成分是噪声。然后，保持语音成分，利用噪声信号衰减模块444衰减噪声成分。也就是说，当Ri 大于阈值Rthi (Rthi > 6dB)时，对于Fi_112不做处理；当Ri小于阈值Rthi (Rthi > 6dB)，对Fi_112乘上一个增益Gi(0 <Gi < 1)，从而达到降噪的效果。最后，把经过处理的Fi_112进行反傅里叶变换，就得到了经过降噪处理后的纯净
语音信号。本发明中的单通道降噪模块460的降噪原理是根据噪声平稳的特性统计出输入信号各个频带中的平稳噪声的能量进而消除。在本发明的一个实施方式中，单通道降噪模块460包括噪声能量统计模块462和噪声能量去除模块464，其中，噪声能量统计模块462 用于利用平滑平均的方法统计出声音信号中各频率的噪声能量；噪声能量去除模块464用于在声音信号中去除噪声能量统计模块462所统计出的噪声能量，从而进一步降低了噪声成分并保留了语音成分，以达到提高语音信号信噪比的效果。本发明在受话端采用前馈主动噪声控制方法进行降噪处理。通信耳机的入耳部分采用非封闭式的耳塞结构，主要是保证佩戴上耳机后耳道内气压是一致的，保证长期佩戴的舒适性。而前馈主动噪声控制麦克风一般置于通信耳机的外表面，尽可能多的拾取外界噪声的信息。因此应用在通信耳机上的这种前馈主动噪声控制的结构一般能满足系统对因果性的要求，从麦克风正面传过来的声音肯定是先到达麦克风处，然后再到达人耳处，从其他方向传过来的噪声因为要经过人头部的绕射所以基本也是先被麦克风拾取到。图6为根据本发明的通信耳机的语音增强方法中受话端降噪处理部分的流程图。如图6所示，本发明在受话端采用前馈主动噪声控制方法降低所接收的语音频带内的噪声信号的过程具体包括S610 利用通信耳机受话端的麦克风拾取噪声信号；S620 根据所拾取的噪声信号确定反噪声信号；S630:将所确定的反噪声信号与受话端接收的语音信号混合后通过构成受话端的扬声器馈入人耳，所述反噪声和入耳的原始噪声相互抵消而语音信号不变，从而降低所接收的语音频带内的噪声信号。进而，在步骤S620根据噪声信号确定反噪声信号的过程中，首先利用反相器对噪声信号进行反相处理，确定初级反噪声信号；然后利用相位补偿器在音频范围内对初级反噪声信号的相位进行修正和调整，确定于所述噪声信号的相位完全反相的反噪声信号，并且采用包括双T型网络实现的有源滤波器，用来补偿低频部分由于非封闭式结构导致的低频相位损失。图7为根据本发明实施例的受话端降噪处理单元的逻辑结构示意图。如图7所示，受话端降噪处理单元700包括噪声信号确定模块720、反噪声信号确定模块740和输出信号混合模块760，其中，反噪声信号确定模块740可以包括反相器743 和相位补偿器744。噪声信号拾取模块720用于利用通信耳机受话端的麦克风拾取噪声信号，由于受话端在接收远端语音信号时，麦克风所拾取的声音信号一般全部视为噪声信号，因此，设置在耳机支杆的背部的麦克风214和216也就相当于此处的噪声信号拾取模块720。反噪声信号确定模块740用于根据噪声信号确定模块720所确定的噪声信号确定反噪声信号；输出信号混合模块760用于将反噪声信号确定模块740所确定的反噪声信号与所述受话端接收的语音信号混合后通过构成受话端的扬声器2M馈入人耳，该反噪声和入耳的原始噪声 (由自然的声学通道传递)相互抵消而语音信号不变，从而降低所接收的语音频带内的噪
声信号。反相器742用于对所述噪声信号进行反相处理，确定初级反噪声信号；相位补偿器744用于在音频范围内对初级反噪声信号的相位进行修正和调整，确定与噪声信号的相位完全反相的反噪声信号，并且采用包括双T型网络实现的有源滤波器，用来补偿低频部分由于非封闭式结构导致的低频相位损失。另外，受话端降噪处理单元700还可以包括第一放大器730和第二放大器750，第一放大器730用以对噪声信号拾取模块720所拾取的噪声信号进行放大，第二放大器750 用于对混有反噪声信号和语音信号的混合信号进行放大。具体地，作为示例，麦克风214拾取到的噪声信号经过前置第一放大器730放大，然后经过一个反相器742和相位补偿器744，来产生与原始噪声幅度相同相位相反的反噪
声信号。相位补偿器744主要是为了解决前馈主动噪声控制技术应用于非封闭式通信耳机所存在的时延问题，从电路上在音频范围内对反噪声信号的相位进行相应的修正和调整，以期达到反噪声和原始噪声相位刚好反相的目的。其一般的实现方式是采用无源或有源的双T型网络来实现。反噪声信号和输入的语音信号经过一个由加法器构成的输出信号混合模块760 在电路上混合，作为后端第二放大器750的输入，第二放大器750把混有反噪声和语音信号的混合信号放大后直接去推动扬声器224。同样，麦克风216拾取到的噪声信号经过前置第一放大器730放大、反相器742反相、相位补偿器744补偿以及加法器的混合、第二放大器750的放大后，直接去推动扬声器 226。麦克风前置第一放大器730、反相器742、相位补偿器744、加法器、扬声器功率第二放大器750等部分可以采用单独的器件实现也可以由同一器件来实现一个或者几个模块的功能。混有反噪声和语音的混合信号经过扬声器，变成声信号馈入人耳，从扬声器发出的反噪声信号和从声学通道传播到人耳处的原始噪声信号幅度相同相位相反，所以会在人耳处发生相互叠加抵消，从而达到同时消除原始噪声和反噪声的目的，噪声得到了降低，而语音能量不变，有效提高了语音信号的信噪比，传播到人耳处的将是清晰可懂较纯净的语
音信号。对于传统的采用封闭式的前馈主动噪声控制耳机，外界噪声从参考麦克风传播到人耳处需要经过被动隔声材料，会增加声学通道的延迟，从而为电子通道提供更多的处理时间，保证了系统的因果性。为了解决前馈主动噪声控制技术应用于非封闭式结构通信耳机的时延问题，需要从二个方面对系统进行很好的选择和设计，首先需要对扬声器单体的前、后腔进行较好设计和处理，调整前后腔的大小和开孔以改善由扬声器到人耳之间在音频范围内的相位响应，其次需要在电路上对反相器进行相位补偿，从电路本身对时延进行修正和补偿，以期在整个音频范围内都有较好的降噪效果。从麦克风和人耳处的距离设计来看，一方面希望越近越好，麦克风与人耳靠得越近，两点的噪声相关性就越好，噪声消除就能做的越好；但另一方面要求麦克风和人耳有一定的距离，以保证当噪声从麦克风处传播到人耳这段时间内，电子层面上有较多的处理时间。另外，麦克风与扬声器之间也需要保持一定的空间距离并较好的进行声学隔离，避免由扬声器发出的信号被麦克风拾取到，从而避免麦克风拾取的噪声信号里面包括有用的语音信号和导致整个系统形成反馈啸叫的反馈回路，如果存在反馈回路，系统增益过高的话就有可能出现啸叫现象。另外，对于非封闭式前馈主动降噪耳机，扬声器和拾取外界噪声的参考麦克风之间存在固有的泄露通道。在耳机正常佩戴时，从扬声器到参考麦克风之间的声学传递函数幅度非常小，所以正常使用时，非封闭式前馈主动噪声控制技术不会对语音信号造成损伤，系统也不会存在不稳定的啸叫现象。但当把耳机放在一个密闭或者半密闭空间内时，扬声器到参考麦克风之间的声学传递函数的幅度将急剧增大，特别是高频部分。这种较大幅度的声学传递函数，与具有高增益的控制电路，就构成了一个闭环反馈系统，当闭环反馈系统的幅度和相位满足一定条件时，系统将发生自激啸叫，存在鲁棒性问题。因此，在本发明的一个优选实施方式中，DSP单元还包括啸叫检测模单元，用于为受话端语音增强模块提供啸叫检测控制信号，具体而言，就是在通信耳机的麦克风所拾取的声音信号的频谱中某一频率点的能量相比于其他频带的能量高出预设值、并且该频率点的能量不断增加时，通过控制信号自主调整对受话端的降噪处理。通常，如果判断出在某个频率点的能量比旁边其他频带的能量高IOdB以上并在此频率能量不断增加，将判断系统处在不正常状态，啸叫检测单元将输出控制信号，调整主动噪声控制电路。控制方式可以采用减小第一放大器的增益或者直接切断主动噪声控制电路电源来实现。对于送话端、受话端的语音信号，可以采用有线的方式和其他设备连接，也可以采用蓝牙等无线连接方式和其他设备连接。以上结合附图和多个具体实施方式
对本发明的用于提高噪声环境中通信耳机送、受话端语音信噪比的技术和装置。显然，本领域的普通技术人员在不偏离本发明概念的条件下，不需要付出创造性的劳动，就可以对在此公开的特定装置和技术进行许多应用和修改并且可以与在此所公开的特定装置和技术有所不同。因此，本发明应该被理解成包括此处所公开的装置和技术所提出或拥有的每一个新颖特征和新颖的特征组合，但凡本领域普通技术人员根据本发明所揭示的内容所作的等效修饰和变化，皆应纳入权利要求书中记载的保护范围内。
权利要求
1.一种通信耳机的语音增强方法，所述通信耳机包括由至少两个麦克风构成的送话端和由至少一个麦克风及一个扬声器构成的受话端，所述方法复用多个麦克风信号在所述通信耳机的送话端和受话端分别提供降噪处理，其中，在所述送话端的降噪处理包括通过比较构成送话端的麦克风拾取的声音信号的能量差异确定所述通信耳机的佩戴状态；如果所述能量差异大于第一预置阈值，确定所述通信耳机正常佩戴，则先对所述声音信号进行多麦克风降噪，然后通过单通道降噪进一步抑制残留的稳态噪声；否则，确定所述通信耳机非正常佩戴，直接通过单通道降噪抑制所述声音信号中的稳态噪声。
2.如权利要求1所述的通信耳机的语音增强方法，其中，在对所述声音信号进行多麦克风降噪的过程中，具体包括通过比较所述声音信号中各频率成分的能量差异来区分所述声音信号中的语音信号成分和噪声信号成分；对所述噪声信号成分进行衰减处理。
3.如权利要求2所述的通信耳机的语音增强方法，其中，在通过比较所述声音信号中各频率成分的能量差异来区分所述声音信号中的语音信号成分和噪声信号成分的过程中，如果所述声音信号中某频率成分的能量差异大于第二预置阈值，则将能量差异大于所述第二预置阈值的该频率成分作为语音信号成分；如果所述声音信号中某频率成分的能量差异小于等于所述第二预置阈值，则将能量差异小于等于所述第二预置阈值的该频率成分作为噪声信号成分。
4.如权利要求1所述的通信耳机的语音增强方法，其中，在通过单通道降噪抑制稳态噪声的过程中，具体包括利用平滑平均的方法统计出所述声音信号中各频率的噪声能量；在所述声音信号中去除所述噪声能量。
5.如权利要求1 4中任一项所述的通信耳机的语音增强方法，其中，所述通信耳机的入耳部分采用非封闭式耳塞结构，正常佩戴状态下所述通信耳机的扬声器与人耳耳道之间的耦合位置相对固定；并且，在所述受话端降噪处理包括利用构成所述受话端的麦克风拾取噪声信号；根据所述噪声信号确定反噪声信号；将所述反噪声信号与所述受话端接收的语音信号混合后通过构成受话端的扬声器馈入人耳。
6.如权利要求5所述的通信耳机的语音增强方法，其中，在根据所述噪声信号确定反噪声信号的过程中，首先利用反相器对所述噪声信号进行反相处理，确定初级反噪声信号；然后利用相位补偿器在音频范围内对所述初级反噪声信号的相位进行修正和调整，确定与所述噪声信号的相位完全反相的反噪声信号，其中所述相位补偿器包括采用双T型网络实现的有源滤波器，用来补偿低频部分由于非封闭式结构导致的低频相位损失。
7.如权利要求1所述的通信耳机的语音增强方法，其中，所述方法还包括检测并抑制啸叫的处理，具体包括如果在所述通信耳机的麦克风拾取的声音信号的频谱中某一频率点的能量比其他频带的能量高出预设值，并且所述频率点的能量不断增加，则自主调整对所述受话端的降噪处理。
8.一种通信耳机，所述通信耳机包括由至少两个麦克风构成的送话端和由至少一个麦克风和一个扬声器构成的受话端，以及送话端降噪处理单元和受话端降噪处理单元，其中，所述送话端降噪处理单元包括佩戴状态确定模块，用于通过比较构成所述送话端的麦克风拾取的声音信号的能量差异确定所述通信耳机的佩戴状态，如果所述能量差异大于第一预置阈值，确定所述通信耳机正常佩戴，否则，确定所述通信耳机非正常佩戴；多麦克风降噪模块，用于在所述通信耳机正常佩戴时，对所述声音信号进行多麦克风降噪处理；单通道降噪模块，用于在所述多麦克风降噪模块对所述声音信号进行降噪处理后，进一步抑制残留的稳态噪声，以及，在所述通信耳机非正常佩戴时，直接对所述声音信号中的稳态噪声进行抑制处理。
9.如权利要求8所述的通信耳机，其中，所述多麦克风降噪模块进一步包括声音信号成分区分模块，用于通过比较所述声音信号中各频率成分的能量差异来区分所述声音信号中的语音信号成分和噪声信号成分；噪声信号衰减模块，用于对所述噪声信号成分进行衰减处理。
10.如权利要求8所述的通信耳机，其中，所述单通道降噪模块进一步包括噪声能量统计模块，用于利用平滑平均的方法统计出所述声音信号中各频率的噪声能量；噪声能量去除模块，用于在所述声音信号中去除所述噪声能量。
11.如权利要求8 10中任一项所述的通信耳机，其中，所述通信耳机的入耳部分采用非封闭式耳塞结构，正常佩戴状态下所述通信耳机的扬声器与人耳耳道之间的耦合位置相对固定；并且，所述受话端降噪处理单元包括噪声信号拾取模块，用于利用构成所述受话端的麦克风拾取噪声信号；反噪声信号确定模块，用于根据所述噪声信号确定反噪声信号；输出信号混合模块，用于将所述反噪声信号与所述受话端接收的语音信号混合后通过构成受话端的扬声器馈入人耳。
12.如权利要求11所述的通信耳机，其中，所述反噪声信号确定模块进一步包括反相器，用于对所述噪声信号进行反相处理，确定初级反噪声信号；相位补偿器，用于在音频范围内对所述初级反噪声信号的相位进行修正和调整，确定与所述噪声信号的相位完全反相的反噪声信号，并且采用包括双T型网络实现的有源滤波器，用来补偿低频部分由于非封闭式结构导致的低频相位损失。
13.如权利要求8所述的通信耳机，所述通信耳机进一步包括啸叫检测单元，用于在所述通信耳机的麦克风所拾取的声音信号的频谱中某一频率点的能量相比于其他频带的能量高出预设值、并且所述频率点的能量不断增加时，通过控制信号自主调整对所述受话端的降噪处理。
全文摘要
本发明提供了一种通信耳机的语音增强方法，包括送话端降噪处理和受话端降噪处理两部分，其中，送话端降噪处理部分包括通过比较通信耳机的麦克风拾取的声音信号的能量差异确定耳机的佩戴状态；如果耳机正常佩戴，则先对声音信号进行多麦克风降噪，然后通过单通道降噪进一步抑制残留的稳态噪声；否则，直接通过单通道降噪抑制声音信号中的稳态噪声。本发明有效复用多个麦克风拾取到的信号，同时在通信耳机送、受话端分别采用声学信号处理和主动噪声控制方法实现语音增强，保证噪声环境下，近端和远端语音的高信噪比，为通信双方提供高清晰度和可懂度的语音信号。
文档编号H04R1/10GK102300140SQ20111022900
公开日2011年12月28日申请日期2011年8月10日优先权日2011年8月10日
发明者刘崧, 李波, 赵剑申请人:歌尔声学股份有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘崧;李波;赵剑
技术所有人：歌尔声学股份有限公司
我是此专利的发明人

上一篇：主动式信息分享系统及其主装置与副装置的制作方法
上一篇：用于外环功率控制的方法和系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。