一种语音采集中回路消噪的装置及方法与流程

文档序号：11097908阅读：785来源：国知局

本发明涉及音频技术领域，尤其涉及一种语音采集中回路消噪的装置及方法。

背景技术：

经过数十年的发展，越来越多的电子产品离不开语音的采集，来获取用户的语音数据信息。作为人机交互的一部分，语音采集在现在的电子产品显得格外重要，与其是进入人工智能时代，各种智能产品迫切需求语音采集的高效与高质量。但在实际应用中，语音采集面临着许多问题，如背景噪声问题、产品本身的回声问题，所以高质量的语音采集都会采取背景降噪，回路消除等降噪手法。目前，在回路消除降噪的处理中，通常存在着硬件复杂、采集到的语音数据在时间起点上不同步的问题，导致硬件成本和软件计算量的提高。

图1为现有的语音采集中回路消噪装置的结构示意图，如图1中所示：MIC电路1采集到的环境背景声音经AD转换模块2转换后发送给语音识别处理器3；编译码器(CODEC)4接语音识别处理器3的播放通路上采集回路声音，并将采集到的回路声音处理为数字信号后发送给语音识别处理器3；语音识别处理器3获取到环境背景声音数字信号数据与回路声音数字信号数据后，通过相关软件处理，把环境背景声音数据中的回路声音数据部分去掉，就达到了消噪(消除回声)的目的。

图1所示回路消噪方案的主要缺点是：系统在获取环境背景声音与回路声音时必须设计两部分采集电路，语音识别处理器3在分别获取环境背景声音数据与回路声音数据时，由于环境背景声音与回路声音分别由AD转换模块2和CODEC4采集，语音识别处理器3需要分别获取AD转换模块2和CODEC4准备好的音频数据，由于执行顺序先后的原因或者多线程之间切换的原因，必然会导致获取的两路数据在时间起点上是不同步的。因此，为了保证回路消噪的效果，必须采用软件处理来保证环境背景声音与回路声音时间起点的同步，这会导致在回声消噪的算法上需要额外增加计算量，增加系统的开销；同时由于时间的不同步，也会给消噪的处理带来一定的误判操作。

技术实现要素：

本发明提供一种语音采集中回路消噪的装置及方法，用于解决现有的回路消噪方案无法保证环境背景声音与回路声音时间起点的同步的问题，本发明提供的语音采集中回路消噪方案能够采集到时间起点同步的环境背景声音与回路声音，能够简化消噪算法，减少计算量，减少系统开销。

本发明提供一种语音采集中回路消噪的装置，包括MIC电路、语音识别处理器、编译码器CODEC，所述MIC电路连接所述CODEC的左声道，所述语音识别处理器的播放回路连接所述CODEC的右声道；所述CODEC的输出端与所述语音识别处理器的输入端连接；

所述MIC电路采集环境背景声音模拟信号并输出给所述CODEC的左声道；

所述CODEC的右声道采集回路声音模拟信号，所述CODEC对左声道接收的所述环境背景声音模拟信号和右声道采集的回路声音模拟信号进行处理后得到I2S格式的双通道数字音频数据，并将所述双通道数字音频数据通过I2S数字音频接口发送给所述语音识别处理器；

所述语音识别处理器通过I2S数字音频接口接收所述双通道数字音频数据，并根据I2S协议，从所述双通道数字音频数据中分离出环境背景声音数字信号和回路声音数字信号，随后将环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

本发明实施例的一些有益效果可以包括：

上述语音采集中回路消噪的装置中，环境背景声音与回路声音使用同一CODEC采集并将二者编码为I2S格式的双通道数字音频数据，语音识别处理器采集数据过程中根据I2S协议提取出所需的声音，可以做到回路声音与环境背景声音在时间起点上同步，得到的数据可以完美提供给消噪算法处理，解决了软件处理回路消噪时在时间起点不同步方面带来的困扰，减小了因时间起点不同步带来的软件开销，同时增强了软件算法在消除回路声音时的效果。该方案可以在需要做回路消除的语音采集方案中使用，对降低硬件成本、缩小软件开发周期有很大帮助。

在一个实施例中，所述CODEC包括：

采集模块，用于通过右声道采集所述语音识别处理器的播放回路上的回路声音模拟信号，并通过左声道采集所述MIC电路输出的环境背景声音模拟信号；

模数转换模块，用于将所述环境背景声音模拟信号和回路声音模拟信号分别转换为左声道数字音频信号和右声道数字音频信号；

编码模块，用于将所述左声道数字音频信号和右声道数字音频信号按I2S协议编码为I2S格式的双通道数字音频数据。

该实施例中，编译码器CODEC同时采集环境声音数据和回路声音数据，将其转换为数字信号后编码为I2S格式的双通道数字音频数据发送给语音识别处理器，利用CODEC采集音频数据时的编码特性与I2S协议的特性，相比传统的硬件回路设计，不受语音识别处理器提取数据的先后影响，在时间起点同步方面更加有保障。

在一个实施例中，所述语音识别处理器包括：

I2S数字音频接口，用于接收所述CODEC发来的双通道数字音频数据；

分离模块，用于根据I2S协议，将所述I2S数字音频接口接收的双通道数字音频数据中的左、右声道音频数据分离，得到左声道音频片段数据集合和右声道音频片段数据集合；

重组模块，用于将所述分离模块得到的左声道音频片段数据集合中的音频片段数据重组为环境背景声音数字信号，将所述右声道音频片段数据集合中的音频片段数据重组为回路声音数字信号；

消噪模块，用于将所述重组模块得到的环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

该实施例中，语音识别处理器通过I2S数字音频接口采集双通道数字音频数据，并根据I2S协议的特殊数据格式，将双通道数字音频数据的左声道音频数据与右声道音频数据分离出来，重新组成单通道数据，得到所需的回路声音与环境背景声音；且环境背景声音与回路声音在时间起点上保持同步。

本发明提供一种语音采集中回路消噪的方法，包括：

采集环境背景声音模拟信号和回路声音模拟信号；

编译码器CODEC对所述环境背景声音模拟信号和回路声音模拟信号进行处理后得到I2S格式的双通道数字音频数据；

语音识别处理器根据I2S协议，从所述双通道数字音频数据中分离出环境背景声音数字信号和回路声音数字信号；

语音识别处理器将所述环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

在一个实施例中，所述编译码器CODEC对所述环境背景声音模拟信号和回路声音模拟信号进行处理后得到I2S格式的双通道数字音频数据，包括：

所述CODEC将所述环境背景声音模拟信号通过模数转换为左声道数字音频信号，并将回路声音模拟信号通过模数转换为右声道数字音频信号；

所述CODEC将所述左声道数字音频信号和右声道数字音频信号按I2S协议编码为I2S格式的双通道数字音频数据。

在一个实施例中，所述语音识别处理器根据I2S协议，从所述双通道数字音频数据中分离出环境背景声音数字信号和回路声音数字信号，包括：

所述语音识别处理器根据I2S协议，将所述双通道数字音频数据中的左、右声道音频数据分离，得到左声道音频片段数据集合和右声道音频片段数据集合；

所述语音识别处理器将所述左声道音频片段数据集合中的音频片段数据重组为环境背景声音数字信号，将所述右声道音频片段数据集合中的音频片段数据重组为回路声音数字信号。

在一个实施例中，所述采集环境背景声音模拟信号和回路声音模拟信号，包括：

通过MIC电路采集环境背景声音模拟信号并输入给所述CODEC的左声道，所述CODEC的右声道通过接所述语音识别处理器的播放回路上采集回路声音。

该实施例中，通过常用的MIC电路采集环境背景声音，方便快捷，易于实现。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为现有的语音采集中回路消噪装置的结构示意图；

图2为本发明实施例提供的一种语音采集中回路消噪的装置的结构示意图；

图3为本发明实施例提供的另一种语音采集中回路消噪的装置的结构示意图；

图4为I2S数据格式示意图；

图5为本发明实施例提供的另一种语音采集中回路消噪的装置的结构示意图；

图6为本发明实施例中一种语音采集中回路消噪的方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

图2为本发明实施例提供的一种语音采集中回路消噪的装置的结构示意图，如图2中所示，包括：MIC电路21、语音识别处理器22、编译码器CODEC23，MIC电路21连接CODEC23的左声道，语音识别处理器22的播放回路连接CODEC23的右声道，语音识别处理器22的输入端与CODEC23的输出端连接。

图2中，MIC电路21采集环境背景声音模拟信号并输出给CODEC23的左声道。CODEC23的右声道采集回路声音模拟信号，CODEC23对左声道接收的环境背景声音模拟信号和右声道采集的回路声音模拟信号进行处理后得到I2S格式的双通道数字音频数据，并将双通道数字音频数据通过I2S数字音频接口发送给语音识别处理器22。语音识别处理器22通过I2S数字音频接口采集CODEC23输出的双通道数字音频数据，并根据I2S协议，从双通道数字音频数据中分离出环境背景声音数字信号和回路声音数字信号，随后将环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

本发明实施例提供的语音采集中回路消噪的装置中，环境背景声音与回路声音使用同一CODEC采集并将二者编码为I2S格式的双通道数字音频数据，相对于现有技术，可以少使用一个AD转换模块，此外，环境背景声音使用CODEC的左声道采集，可以减少一个语音识别处理器的数字音频接口；语音识别处理器采集数据过程中根据I2S协议提取出所需的声音，可以做到回路声音与环境背景声音在时间起点上同步，得到的数据可以完美提供给消噪算法处理，解决了软件处理回路消噪时在时间起点不同步方面带来的困扰，减小了因时间起点不同步带来的软件开销，同时增强了软件算法在消除回路声音时的效果。该方案可以在需要做回路消除的语音采集方案中使用，对降低硬件成本、缩小软件开发周期有很大帮助。

图3为本发明实施例提供的另一种语音采集中回路消噪的装置的结构示意图，如图3所示，本实施例的装置在图2所示装置的基础上，进一步的，CODEC23包括：

采集模块231，用于通过右声道采集语音识别处理器22的播放回路上的回路声音模拟信号，此外，并通过左声道采集接收MIC电路2输出的环境背景声音模拟信号；

模数转换模块232，用于将采集模块231采集到的环境背景声音模拟信号和回路声音模拟信号分别转换为左声道数字音频信号和右声道数字音频信号；

编码模块233，用于将模数转换模块232得到的左声道数字音频信号和右声道数字音频信号按I2S协议编码为I2S格式的双通道数字音频数据并输出。

如图4所示，根据I2S协议，CODEC23的编码模块233把左声道数据和右声道数据组成为“左+右+左+…”形式的双通道数据。

图5为本发明实施例提供的另一种语音采集中回路消噪的装置的结构示意图，如图5所示，本实施例的装置在图3所示装置的基础上，进一步的，语音识别处理器22包括：

I2S数字音频接口221，用于接收CODEC23发来的双通道数字音频数据；

分离模块222，用于根据I2S协议，将I2S数字音频接口221接收的双通道数字音频数据中的左、右声道音频数据分离，得到左声道音频片段数据集合和右声道音频片段数据集合；

重组模块223，用于将分离模块222得到的左声道音频片段数据集合中的音频片段数据重组为环境背景声音数字信号，将右声道音频片段数据集合中的音频片段数据重组为回路声音数字信号；

消噪模块224，用于将重组模块223得到的环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

图5所示实施例中，由于编码模块233将左声道数字音频信号和右声道数字音频信号编码为“左+右+左+…”形式的双通道数据，因此分离模块222可以把左声道音频数据与右声道音频数据从I2S数字音频接口221收到的双通道数字音频数据中分离出来，由重组模块223重新组成单通道数据，得到所需的回路声音与环境背景声音，且环境背景声音与回路声音在时间起点上保持同步，因此，消噪模块224直接将得到的环境背景声音数字信号中的回路声音数字信号去掉，即可得到消噪后的环境声音。

对应于本发明实施例提供的语音采集中回路消噪的装置，本发明实施例还提供一种语音采集中回路消噪的方法。图6为本发明实施例中一种语音采集中回路消噪的方法的流程图，如图6所示，该方法包括以下步骤S101-S104：

步骤S101：采集环境背景声音模拟信号和回路声音模拟信号。

其中，可以通过MIC电路采集环境背景声音模拟信号并输入给CODEC的左声道，将CODEC的右声道连接语音识别处理器的播放回路上采集回路声音。

步骤S102：CODEC对环境背景声音模拟信号和回路声音模拟信号进行处理后得到I2S格式的双通道数字音频数据。

其中，CODEC首先将环境背景声音模拟信号通过模数转换为左声道数字音频信号，将回路声音模拟信号通过模数转换为右声道数字音频信号；随后CODEC将左声道数字音频信号和右声道数字音频信号按I2S协议编码为I2S格式的双通道数字音频数据发送给语音识别处理器，即将左声道数字音频信号和右声道数字音频信号按照“左+右+左+…”的形式编码。

步骤S103：语音识别处理器根据I2S协议，从双通道数字音频数据中分离出环境背景声音数字信号和回路声音数字信号。

其中，语音识别处理器首先根据I2S协议(即“左+右+左+…”的编码形式)，将所述双通道数字音频数据中的左、右声道音频数据分离，得到左声道音频片段数据集合和右声道音频片段数据集合；随后，将所述左声道音频片段数据集合中的音频片段数据重组为环境背景声音数字信号，将所述右声道音频片段数据集合中的音频片段数据重组为回路声音数字信号。

步骤S104：语音识别处理器将所述环境背景声音数字信号中的回路声音数字信号去掉，得到消噪后的环境声音。

上述语音采集中回路消噪的方法中，环境背景声音与回路声音使用同一CODEC采集并将二者编码为I2S格式的双通道数字音频数据，语音识别处理器采集数据过程中根据I2S协议提取出所需的声音，可以做到回路声音与环境背景声音在时间起点上同步，得到的数据可以完美提供给消噪算法处理，解决了软件处理回路消噪时在时间起点不同步方面带来的困扰，减小了因时间起点不同步带来的软件开销，同时增强了软件算法在消除回路声音时的效果。该方案可以在需要做回路消除的语音采集方案中使用，对降低硬件成本、缩小软件开发周期有很大帮助。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：邱国良
技术所有人：北京云知声信息技术有限公司
我是此专利的发明人

上一篇：一种ZnPc‑UCNP‑PEG‑G纳米复合物的制备方法与制造工艺
上一篇：一种磷系阻燃剂的制造方法与工艺