一种可用于强噪声环境的语音采集装置的制作方法

文档序号：2835238阅读：359来源：国知局

专利名称：一种可用于强噪声环境的语音采集装置的制作方法
技术领域：
本实用新型涉及信号处理领域，特别是一种可用于强噪声环境的语音采集装置。
背景技术：
语音是人类交流最自然的手段，但在语音通信、语音识别等实际应用中，往往存在着各种各样的环境噪声。当这些环境噪声较强时，会严重影响语音通信的质量和识别的正确率。例如在工厂、集会等嘈杂环境中，不但语音通信的音质、可懂度会显著变差，语音识别器的识别率也会急剧下降。语音增强是一种常用的减少环境噪声影响、提高语音通信质量的方法，也可以用于识别前语音的预处理，以提高语音识别器的识别率。目前语音增强方法主要包括两类，一类是基于单麦克风的语音增强方法，包括谱减法、维纳滤波、MMSE、卡尔曼滤波、小波变换等，这类方法利用单麦克风接收语音信号，通过时域、频域、小波变换域等滤波和处理来抑制噪声，提高语音的质量；另一类是基于麦克风阵列的语音增强方法，这类方法将阵列信号处理技术应用到语音增强中，利用多个麦克风接收到的语音信号里包含的空间相位信息对输入语音进行空间滤波，形成具有指向性的空间波束，对指定方向上的语音信号进行增强，同时抑制其他方向上的干扰，可提供比传统语音增强方法更好的噪声抑制效果。现有的语音增强技术能在一定程度上提高带噪语音的质量，但由于这些技术均基于麦克风等空气传导的语音传感器，在接收信号中，环境噪声直接叠加在语音信号上，因此随着环境噪声的增强，其性能不可避免地下降，特别在强噪声环境下，现有的语音增强技术仍很难取得好的效果O为了能适应强噪声环境下的语音通信，一些语音通信系统采用了非空气传导的语音传感器，如喉部送话器和骨传导语音传感器等。这些语音传感器在使用时紧贴使用者的喉部、颚骨等部位，使用者说话时声带振动带动传感器中的簧片发生形变，将簧片的振动转化为电信号即可得到语音信号。由于空气中传导的声波无法使这类语音传感器的簧片发生形变，因此这类语音传感器不受声学噪声的影响，具有很强的抗干扰能力，常用于坦克、工厂等强噪声环境中的语音通信和语音识别。但由于非空气传导语音传感器检测到的语音信号在传播信道的特性上与说话时声道的特性有较大的不同，因此与麦克风等空气传导语音传感器接收到的语音相比自然度差，听起来并不舒适。

实用新型内容针对现有基于空气传导语音传感器的语音增强技术在强噪声环境中效果不佳和非空气传导语音传感器音质差等不足，本实用新型提供了一种可用于强噪声环境的语音采集装置。本实用新型体积小、抗噪声能力强、语音质量好、使用方便，可以广泛用于各种强噪声环境下的语音通信、记录、识别等场合。本实用新型具体技术方案如下。一种可用于强噪声环境的语音采集装置，其包括空气传导语音传感器、非空气传导语音传感器、多路数据采集模块和数据处理装置，空气传导语音传感器、非空气传导语音传感器均各自与多路数据采集模块连接，多路数据采集模块与数据处理装置连接，其中，空气传导语音传感器和非空气传导语音传感器分别用于采集空气传导和非空气传导的语音信号，多路数据采集模块用于采集接收空气传导语音传感器和非空气传导语音传感器的输出信号，数据处理装置用于对多路数据采集模块采集的数据进行处理并对空气传导语音传感器检测语音进行增强并输出。进一步的，上述可用于强噪声环境的语音采集装置中，所述数据处理装置包括噪声模型估计模块、联合模型修正模块、语音增强模块、联合模型训练和自适应模块，空气传导语音传感器、非空气传导语音传感器、噪声模型估计模块、语音增强模块分别与多路数据采集模块连接，噪声模型估计模块、联合模型修正模块、语音增强模块顺次连接，联合模型训练和自适应模块与多路数据采集模块和联合模型修正模块连接；其中，噪声模型估计模块用于估计当前空气传导语音传感器检测语音的噪声模型，联合模型修正模块用于根据当前的噪声模型对联合模型的参数进行修正，语音增强模块根据修正前和修正后的联合模型对空气传导语音传感器检测语音进行增强，联合模型训练和自适应模块用于训练联合模型，并对模型参数进行在线的自适应调整。进一步的，所述数据处理装置包括DSP处理芯片。进一步的，所述多路数据采集模块采用多路数据采集芯片。进一步的，所述空气传导语音传感器采用麦克风，所述非空气传导语音传感器采用喉部送话器。本实用新型将空气传导语音传感器和非空气传导语音传感器相结合，首先建立空气传导语音传感器检测语音和非空气传导语音传感器检测语音的联合模型，在增强时利用非空气传导语音传感器检测语音来准确估计声学噪声模型，并据此对联合模型的参数进行修正，然后利用修正后的联合模型对输入的空气传导语音传感器检测语音进行增强。由于同时利用了空气传导语音传感器检测语音和非空气传导语音传感器检测语音来恢复语音信号，因此与现有技术相比，本实用新型提供的方法能在强噪声环境中输出音质更好的语音信号。上述可用于强噪声环境的语音采集装置的语音增强方法，具体包含以下步骤:步骤1:建立干净环境下空气传导语音传感器检测语音和非空气传导语音传感器检测语音的联合模型；步骤2:根据非空气传导语音传感器检测的语音信号，估计当前接收的空气传导语音传感器检测语音信号的噪声模型；步骤3:利用步骤2得到的噪声模型对联合模型的参数进行修正；步骤4:用修正前和修正后的联合模型对空气传导语音传感器检测语音信号进行增强，并输出增强后的语音信号。进一步的，上述步骤I中空气传导语音传感器检测语音和非空气传导语音传感器检测语音的联合模型，为空气传导语音传感器检测语音和非空气传导语音传感器检测语音的联合概率模型或它们之间的映射关系。进一步的，上述步骤I中联合模型的建立，包含以下步骤:步骤1.1:采集同步、干净的空气传导语音传感器检测语音和非空气传导语音传感器检测语音数据作为训练数据；[0020]步骤1.2:对步骤1.1中采集的空气传导语音传感器检测语音和非空气传导语音传感器检测语音数据进行分帧，提取每帧语音的声道参数和激励参数；步骤1.3:利用空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的声道参数和激励参数分别训练声道参数和激励参数的联合模型。上述步骤2中当前接收的空气传导语音传感器检测语音信号的噪声模型估计，包含以下步骤:步骤2.1:同步采集空气传导语音传感器检测语音和非空气传导语音传感器检测语音；步骤2.2:利用非空气传导语音传感器检测的语音数据进行语音的端点检测；步骤2.3:依据步骤2.2检测的语音端点，提取空气传导语音传感器检测语音中的纯噪声段；步骤2.4:利用步骤2.3中得到的空气传导语音传感器检测语音中的纯噪声段数据，估计噪声的统计模型。上述步骤3中，根据空气传导语音传感器检测语音信号的噪声模型和步骤I中训练得到的声道参数联合模型，采用模型补偿技术对声道参数联合模型的参数进行修正。上述步骤4中的空气传导语音传感器检测语音信号增强，具体包含以下步骤:步骤4.1:利·用修正前和修正后的声道参数联合模型，以及当前空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的声道参数，按选定的优化准则估计干净的空气传导语音传感器检测语音声道参数；步骤4.2:求出当前非空气传导语音传感器检测语音的激励参数；步骤4.3:利用空气传导语音传感器检测语音和非空气传导语音传感器检测语音激励参数的联合模型，将非空气传导语音传感器检测语音的激励参数映射为空气传导语音传感器检测语音的激励参数，并重构空气传导语音传感器检测语音的激励；步骤4.4:利用步骤4.3得到的空气传导语音传感器检测语音的激励和步骤4.1得到的空气传导语音传感器检测语音声道参数，合成增强后的语音。进一步优选的，上述步骤4.1中的优化准则为最小均方误差准则。上述方法中，空气传导语音传感器检测语音和非空气传导语音传感器检测语音联合模型的参数，在声学噪声小于预设门限时采用模型自适应技术进行调整。与现有技术相比，本实用新型有以下主要优点:(I)体积小，使用方便。与基于麦克风阵列的语音增强相比，本实用新型使用一个空气传导语音传感器和一个非空气传导语音传感器，可以按人头部的构造设计成紧凑的耳机，体积更小，使用更方便。(2)与基于空气传导语音传感器的语音增强相比，抗噪声的能力更强。本实用新型将空气传导语音传感器与非空去传导传感器相结合，而空气中传导的声波不会对非空气传导的传感器产生影响，因而具有很强的抗噪声能力，在强噪声环境中仍能得到较清晰的语
曰 (3)与基于非空气传导语音传感器的语音增强相比，语音质量更好。本实用新型在语音增强时利用了非空气传导语音和空气传导语音之间的映射关系来重建干净语音，因此与基于非空气传导语音传感器的语音增强方法相比具有更好的自然度。
图1为本实用新型实施例提供的语音增强装置结构图；图2为本实用新型实施例提供的语音增强方法流程图；图3为本实用新型实施例提供的语音增强方法中建立语音联合模型的流程图；图4为本实用新型实施例提供的语音增强方法中建立噪声模型的流程图；图5为本实用新型实施例提供的语音增强方法中对空气传导语音传感器检测语音进行增强的流程图。
具体实施方式
以下结合附图和实施例对本实用新型的具体实施步骤作进一步说明，但本实用新型的实施和保护范围不限于此。本实用新型实施例提供的语音增强装置的系统结构图如图1所示，包括空气传导语音传感器、非空气传导语音传感器、多路数据采集模块和数据处理装置，其中数据处理装置包括噪声模型估计模块、联合模型修正模块、语音增强模块、联合模型训练和自适应模块，其中空气传导语音传感器、非空气传导语音传感器、噪声模型估计模块、语音增强模块分别与多路数据采集模块连接，噪声模型估计模块、联合模型修正模块、语音增强模块顺次连接，联合模型训练和自适应模块与多路数据采集模块和联合模型修正模块连接。空气传导语音传感器和非空气传导语音传感器分别用于采集空气传导和非空气传导的语音信号，上述实施例中，空气传导语音传感器采用麦克风实现，非空气传导语音传感器采用喉部送话器实现；多路数据采集模块用于采集接收空气传导语音传感器和非空气传导语音传感器的输出信号，上述实施例中，多路数据采集模块采用多路数据采集芯片来实现；噪声模型估计模块用于估计当前空气传导语音传感器检测语音的噪声模型，联合模型修正模块用于根据当前的噪声模型对联合模型中对应于空气传导语音的参数进行修正，语音增强模块根据修正前和修正后的联合模型对空气传导语音传感器检测语音进行增强，联合模型训练和自适应模块用于训练联合模型，并对模型参数进行在线的自适应调整，上述实施例中，噪声模型估计模块，联合模型修正模块，语音增强模块，联合模型训练和自适应模块在DSP芯片中实现。上述实施例中，语音增强方法如图2所示，采用如下步骤来实现:步骤1:建立干净环境下空气传导语音传感器检测语音和非空气传导语音传感器检测语音的联合模型，其流程如图3所示，具体可分为以下步骤:步骤1.1:采集同步、干净的空气传导语音传感器检测语音和非空气传导语音传感器检测语音数据作为训练数据。上述实施例中，在安静的环境下通过多路数据采集芯片同步采集麦克风和喉部送话器收集的语音数据作为联合模型的训练数据。步骤1.2:对步骤1.1中采集的空气传导语音传感器检测语音和非空气传导语音传感器检测语音数据进行分帧，提取每帧语音的声道参数和激励参数。上述实施例中，将空气传导语音传感器检测语音和非空气传导语音传感器检测语音按IOms的间隔进行分帧，对于声道参数，采用线性预测分析法提取一帧空气传导语音传感器检测语音和非空气传导语音传感器检测语音的线性预测系数(即LPC系数)。将原始语音通过LPC分析滤波器，得到预测残差的幅度谱即为所需的激励参数。步骤1.3:利用空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的声道参数和激励参数分别训练声道参数联合模型和激励参数联合模型。空气传导语音传感器检测语音和非空气传导语音传感器检测语音参数的联合模型可以采用联合概率模型或它们之间的映射关系来表示，上述实施例中，使用高斯模型来对空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的声道参数和激励参数进行建模，具体方法如下:对于声道参数的联合模型训练，首先将同一时刻空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的LPC参数转换为线性预测倒谱系数(即LPCC系数)，将两者合并为一个联合矢量，记为C=[ClT，c2T]T，其中C1为空气传导语音传感器检测语音的LPCC系数，C2为非空气传导语音传感器检测语音的LPCC系数，然后使用J个高斯模型来拟合这个联合矢量的概率分布。令λ ^表示第j个高斯模型，则其模型参数包括高斯函数的均值、方差和该高斯模型的先验概率。高斯模型的参数有多种成熟的训练方法，上述实施例中，采用以下步骤来训练J个高斯模型的参数:步骤1.3.1:将所有训练用的联合矢量分成J个群，每个群使用一个高斯模型来拟合其概率分布，求出该群中所有联合矢量的均值和方差作为高斯函数的均值和方差，该群中包含的联合矢量的个数与所有训练用的联合矢量个数之比为该高斯模型的先验概率。步骤1.3.2:根据上一步所得的高斯模型参数对所有训练用的联合矢量重新划分所属的群，其原则是如果某一联合矢量c属于群j，则有P(c I λ P >P(c| Ai), i Φ j。步骤1.3.3:如果迭代次数达到预设值，则当前的高斯模型参数即为训练好的高斯模型参数。否则，按步骤1.3.2的分群结果重新计算所有高斯模型的均值、方差和先验概率，并转步骤1.3.2。对于激励参数的联合概率模型训练，将同一时刻空气传导语音传感器检测语音和非空气传导语音传感器检测语音中提取的激励的幅度谱合并为一个联合矢量，记为s=[SlT, s2T]T，其中S1为空气传导语音传感器检测语音激励的幅度谱，S2为非空气传导语音传感器检测语音激励的幅度谱。使用K个高斯模型来拟合该联合矢量的概率分布，采用与声道参数相同的训练方法，可以得到激励参数的K个高斯模型的参数。步骤2:根据非空气传导语音传感器检测的语音信号，估计当前接收的空气传导语音传感器检测语音信号的噪声模型，其流程如图4所示，具体步骤如下:步骤2.1:同步采集空气传导语音传感器检测语音和非空气传导语音传感器检测语音。上述实施例中，通过数据采集芯片同时采集的麦克风语音信号和喉部送话器语音信号，并送入噪声模型估计模块进行噪声模型的估计；步骤2.2:利用非空气传导语音传感器检测的语音数据进行语音的端点检测。由于非空气传导语音传感器检测的语音信号不受声学环境噪声的影响，因此可以在有声学噪声的环境下准确地检测出语音的端点。语音端点检测有多种方法，上述实施例中，采用经典的基于能量和过零率的方法对喉部送话器检测到的语音进行端点检测；步骤2.3:依据步骤2.2检测的语音端点，提取空气传导语音传感器检测语音中的纯噪声段。由于空气传导语音传感器检测语音和非空气传导语音传感器检测语音同步采集，因此两者语音的端点在时间上是一致，依据步骤2.2检测的语音端点可以检测出空气传导语音传感器检测语音的无话音段，即纯噪声信号。步骤2.4:利用步骤2.3中得到的空气传导语音传感器检测语音中的纯噪声段数据，估计噪声的统计模型。上述实施例中，仅对噪声的声道参数进行建模，建模模型采用单高斯函数，提取若干帧纯噪声信号的声道参数并计算其均值和方差，即可得到噪声声道参数的高斯模型。步骤3:利用步骤2得到的噪声模型对联合模型的参数进行修正，使其与当前的使用环境匹配。上述步骤在联合模型修正模块完成，根据空气传导语音传感器检测语音信号的噪声模型和步骤I中训练得到的声道参数联合模型，采用模型补偿技术对声道参数联合模型的参数进行修正，使其与当前的使用环境匹配。上述实施例中，非空气传导传感器检测语音被认为未受到声学噪声的影响，因此非空气传导传感器检测语音中的噪声设置为0，模型补偿中所用到的噪声参数均按此设置提取。此外，声道参数联合模型中的高斯模型先验概率保持不变，激励参数的联合模型不进行修正。模型补偿技术在语音识别中已得到广泛的应用，对于声道参数，上述实施例中采用了一种适用于线性预测系数(LPCC)的模型补偿技术来对GMM中的高斯模型参数进行修正(见参考文献:Ivandro Sanches.Noise-Compensated Hidden Markov Models.1EEETRANSACTIONS ON SPEECH AND AUDIO PROCESSING, 2000,8 (5):533_540)，具体方法如下:(I)均值的补偿令cs表示线性倒谱域中高斯模型的均值，则其修正按以下步骤来进行:步骤3.1A:用式(I)将Cs从LPCC域变换到LPC域
权利要求1.一种可用于强噪声环境的语音采集装置，其特征在于包括空气传导语音传感器、非空气传导语音传感器、多路数据采集模块和数据处理装置，空气传导语音传感器、非空气传导语音传感器均各自与多路数据采集模块连接，多路数据采集模块与数据处理装置连接，其中，空气传导语音传感器和非空气传导语音传感器分别用于采集空气传导和非空气传导的语音信号，多路数据采集模块用于采集接收空气传导语音传感器和非空气传导语音传感器的输出信号，数据处理装置用于对多路数据采集模块采集的数据进行处理并对空气传导语音传感器检测语音进行增强并输出。
2.根据权利要求1所述的一种可用于强噪声环境的语音采集装置，其特征在于所述数据处理装置包括噪声模型估计模块、联合模型修正模块、语音增强模块、联合模型训练和自适应模块，空气传导语音传感器、非空气传导语音传感器、噪声模型估计模块、语音增强模块分别与多路数据采集模块连接，噪声模型估计模块、联合模型修正模块、语音增强模块顺次连接，联合模型训练和自适应模块与多路数据采集模块和联合模型修正模块连接；其中，噪声模型估计模块用于估计当前空气传导语音传感器检测语音的噪声模型，联合模型修正模块用于根据当前的噪声模型对联合模型的参数进行修正，语音增强模块根据修正前和修正后的联合模型对空气传导语音传感器检测语音进行增强，联合模型训练和自适应模块用于训练联合模型，并对模型参数进行在线的自适应调整。
3.根据权利要求1所述的一种可用于强噪声环境的语音采集装置，其特征在于所述数据处理装置包括DSP处理芯片。
4.根据权利要求1所述的一种可用于强噪声环境的语音采集装置，其特征在于所述多路数据采集模块采用多路数据采集芯片。
5.根据权利要求Γ4任一项所述的一种可用于强噪声环境的语音采集装置，其特征在于所述空气传导语音传感器采用麦克风，所述非空气传导语音传感器采用喉部送话器。
专利摘要本实用新型公开一种可用于强噪声环境的语音采集装置，所述装置包括空气传导语音传感器、非空气传导语音传感器、多路数据采集模块、噪声模型估计模块、联合模型修正模块、语音增强模块、联合模型训练和自适应模块，非空气传导语音传感器、噪声模型估计模块、语音增强模块分别与多路数据采集模块连接，噪声模型估计模块、联合模型修正模块、语音增强模块顺次连接，联合模型训练和自适应模块与多路数据采集模块和联合模型修正模块连接。本实用新型与现有技术相比，具有体积更小，使用更方便，抗噪声能力更强，语音质量更好等优点。
文档编号G10L25/84GK203165457SQ201320107350
公开日2013年8月28日申请日期2013年3月8日优先权日2013年3月8日
发明者张军, 朱颖莉, 宁更新, 冯义志, 余华, 韦岗申请人:华南理工大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张军;朱颖莉;宁更新;冯义志;余华;韦岗
技术所有人：华南理工大学
我是此专利的发明人