一种可减少无用语音识别的语音采集处理方法及装置与流程

文档序号：13983678阅读：185来源：国知局

本发明涉及语音识别技术领域，尤其涉及一种可减少无用语音识别的语音采集处理方法及装置。

背景技术：

相关技术中，在会议场景下，会场常会摆放多个麦克风，一个人对着一个麦克风讲话，系统会对每个麦克风采集的语音进行语音识别，最终形成每个人的会议发言记录。这样便存在一个问题：比如有三个麦克风1/2/3，对着麦克风1说话的发言者a的语音，同时会被麦克风2/3采集到，那么，麦克风2/3采集到的发言者b/c的语音中，就会夹杂a的语音，最终影响会议发言记录的准确性。

技术实现要素：

本发明实施例提供一种可减少无用语音识别的语音采集处理方法及装置，用以实现确定与用户对应的目标语音采集装置，以在进行语音识别时提高语音识别的准确率。

根据本发明实施例的第一方面，提供一种可减少无用语音识别的语音采集处理方法，包括：

通过多个语音采集装置采集语音信息；

分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值；

根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置；

将所述目标语音采集装置采集的第一语音信息的第一强度值进行增强处理，将所述多个语音采集装置中其他语音采集装置采集的第二语音信息的第二强度值进行减弱处理。

在该实施例中，在通过多个语音采集装置采集用户的语音信息后，分析每个语音采集装置采集的语音信息的强度值，进而确定出强度值最高的目标语音采集装置，从而增强该目标语音采集装置采集的语音信息的强度值，而减弱其他语音采集装置采集的语音信息的强度值。这样，可以从多个语音采集装置中筛选出正在被用户使用的目标语音采集装置，从而使得在进行语音识别时，不仅可以减少无用的语音识别，还可以提高语音识别的准确率。

在一个实施例中，所述分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值，包括：

计算每个语音采集装置所采集的语音信息的强度值的平均值，得到对应的平均强度值；

计算每个语音采集装置所采集的语音信息的平均强度值与所述多个语音采集装置中其他所有语音采集装置所采集的语音信息的平均强度值总和之间的差距值。

在该实施例中，可以分析每个语音采集装置所采集的语音信息的强度值。具体的算法可以是，计算每个语音采集装置所采集的语音信息的强度值的平均值，并将平均强度值与其他所有语音采集装置所采集的语音信息的平均强度值总和之间的差距值，进而根据该差距值确定目标语音采集装置。

在一个实施例中，所述根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置，包括：

从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置；

将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。

在该实施例中，差距值最大且差距值大于零，则说明该语音采集装置采集的语音信息的强度值最大，因此，确定其为目标语音采集装置，进而增强其强度值，从而使得在进行语音识别时，将该语音采集装置采集的语音信息作为主要识别依据。

在一个实施例中，所述将所述多个语音采集装置中其他语音采集装置采集的第二语音信息的第二强度值进行减弱处理，包括：

计算所述其他语音采集装置中每个语音采集装置采集的第二语音信息对应的第二强度值与预设强度阈值之间的差值；

将所述差值确定为对应的语音采集装置采集的第二语音信息的新强度值。

在该实施例中，为避免除目标语音采集装置外的其他语音采集装置对语音识别造成干扰，可以减小其采集的当前语音信息的强度值，具体减弱算法可以是计算其他语音采集装置中每个语音采集装置采集的第二语音信息的第二强度值减去预设强度阈值，进而得到对应的新的强度值。

在一个实施例中，所述预设强度阈值包括以下任一项：

所述多个语音采集装置对应的平均强度值的算数和均值，所述多个语音采集装置对应的平均强度值的能量均值。

根据本发明实施例的第二方面，提供一种可减少无用语音识别的语音采集处理装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

通过多个语音采集装置采集语音信息；

分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值；

根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置；

在一个实施例中，所述分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值，包括：

计算每个语音采集装置所采集的语音信息的强度值的平均值，得到对应的平均强度值；

在一个实施例中，所述根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置，包括：

从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置；

将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。

在一个实施例中，所述将所述多个语音采集装置中其他语音采集装置采集的第二语音信息的第二强度值进行减弱处理，包括：

计算所述其他语音采集装置中每个语音采集装置采集的第二语音信息对应的第二强度值与预设强度阈值之间的差值；

将所述差值确定为对应的语音采集装置采集的第二语音信息的新强度值。

在一个实施例中，所述预设强度阈值包括以下任一项：

所述多个语音采集装置对应的平均强度值的算数和均值，所述多个语音采集装置对应的平均强度值的能量均值。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本发明。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本发明的实施例，并与说明书一起用于解释本发明的原理。

图1是根据一示例性实施例示出的一种可减少无用语音识别的语音采集处理方法的流程图。

图2是根据一示例性实施例示出的另一种可减少无用语音识别的语音采集处理方法的流程图。

图3是根据一示例性实施例示出的一种可减少无用语音识别的语音采集处理方法中步骤s104的流程图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。

图1是根据一示例性实施例示出的一种可减少无用语音识别的语音采集处理方法的流程图。该可减少无用语音识别的语音采集处理方法可以应用于语音识别设备中或具有语音识别功能的终端设备等，该终端设备可以是移动电话，计算机，数字广播终端，消息收发设备，游戏控制台，平板设备，医疗设备，健身设备，个人数字助理等任一具有语音识别功能的设备。如图1所示，该方法包括步骤s101-s104：

在步骤s101中，通过多个语音采集装置采集语音信息；

在步骤s102中，分析多个语音采集装置中每个语音采集装置所采集的语音信息的强度值；

在步骤s103中，根据分析结果从多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置；

在步骤s104中，将目标语音采集装置采集的第一语音信息的第一强度值进行增强处理，将多个语音采集装置中其他语音采集装置采集的第二语音信息的第二强度值进行减弱处理。

图2是根据一示例性实施例示出的另一种可减少无用语音识别的语音采集处理方法的流程图。

如图2所示，在一个实施例中，上述步骤s102包括步骤s201-s202：

在步骤s201中，计算每个语音采集装置所采集的语音信息的强度值的平均值，得到对应的平均强度值；

在步骤s202中，计算每个语音采集装置所采集的语音信息的平均强度值与多个语音采集装置中其他所有语音采集装置所采集的语音信息的平均强度值总和之间的差距值。

在一个实施例中，上述步骤s103包括步骤s203-s204：

在步骤s203中，从多个语音采集装置中选取出差距值大于零且差距值最大的语音采集装置；

在步骤s204中，将差距值大于零且差距值最大的语音采集装置确定为目标语音采集装置。

例如，通过4个语音采集装置采集语音信息，其中，第一个语音采集装置采集的语音信息的平均强度值为m1，其他三个语音采集装置采集的语音信息的平均强度值分别为m2，m3和m4，则计算第一语音采集装置与其他三个语音采集装置对应的平均强度值总和的差距值，即m1-(m2+m3+m4)，其他三个语音采集装置的计算方法同上，最后将差距值最大且差距值大于零的语音采集装置确定为目标语音采集装置。

当然，除了上述计算平均强度值的差距值外，还可以计算平均强度值的能量差距值，如m1²-(m2²+m3²+m4²)。

图3是根据一示例性实施例示出的一种可减少无用语音识别的语音采集处理方法中步骤s104的流程图。

如图3所示，在一个实施例中，上述步骤s104包括步骤s301-s302：

在步骤s301中，计算其他语音采集装置中每个语音采集装置采集的第二语音信息对应的第二强度值与预设强度阈值之间的差值；

在步骤s302中，将差值确定为对应的语音采集装置采集的第二语音信息的新强度值。

另外，如果不采用其他语音采集装置采集的语音信息，还可以直接将其他语音采集装置采集的语音信息的强度值设置为0，即只使用目标语音采集装置采集的语音信息，从而使得在进行语音识别时，不仅可以减少无用的语音识别，还可以提高语音识别的准确率。

在一个实施例中，预设强度阈值包括以下任一项：

多个语音采集装置对应的平均强度值的算数和均值，多个语音采集装置对应的平均强度值的能量均值。

下述为本发明装置实施例，可以用于执行本发明方法实施例。

根据本发明实施例的第二方面，提供一种可减少无用语音识别的语音采集处理装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

通过多个语音采集装置采集语音信息；

分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值；

根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置；

在一个实施例中，所述分析所述多个语音采集装置中每个语音采集装置所采集的语音信息的强度值，包括：

计算每个语音采集装置所采集的语音信息的强度值的平均值，得到对应的平均强度值；

在一个实施例中，所述根据分析结果从所述多个语音采集装置中选择出语音信息强度值最高的目标语音采集装置，包括：

从所述多个语音采集装置中选取出所述差距值大于零且所述差距值最大的语音采集装置；

将所述差距值大于零且所述差距值最大的语音采集装置确定为所述目标语音采集装置。

在一个实施例中，所述将所述多个语音采集装置中其他语音采集装置采集的第二语音信息的第二强度值进行减弱处理，包括：

计算所述其他语音采集装置中每个语音采集装置采集的第二语音信息对应的第二强度值与预设强度阈值之间的差值；

将所述差值确定为对应的语音采集装置采集的第二语音信息的新强度值。

在一个实施例中，所述预设强度阈值包括以下任一项：

所述多个语音采集装置对应的平均强度值的算数和均值，所述多个语音采集装置对应的平均强度值的能量均值。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘军;秦晓伟
技术所有人：北京云知声信息技术有限公司
我是此专利的发明人

上一篇：一种英语口语的测评方法及装置与流程
上一篇：音频转换方法及装置与流程