语音信号处理方法及装置、可读存储介质与流程

文档序号：21398710发布日期：2020-07-07 14:31阅读：156来源：国知局

本发明属于通讯技术领域，特别涉及一种语音信号处理方法及装置、可读存储介质。

背景技术：

在地铁、商场和繁华的马路等嘈杂环境下接听手机时，由于环境噪声太大，难以听清通话内容，导致通话体验不佳。在这种情况下，用户通常会手动调大下行语音的音量。当音量调到最大，用户仍然无法听清楚对方的语音时，用户可能会更换一个相对安静的地方继续通话。在一些特殊的应用场景，若用户无法更换地方，例如用户乘坐地铁时，通话将终止。

目前，存在一种场景识别并自动增益下行语音信号的方法，通过采用人工智能算法不断学习当前的场景噪声，识别出当前噪声是商场噪声或游乐场噪声等；之后，再根据场景噪声的特点，处理下行的语音信号，放大特定频率的信号，以改善嘈杂环境中的通话体验，使通话正常进行。但是，现有的场景识别算法计算量大、复杂度高，在手机有限的内存空间和计算能力下，不易实现。

技术实现要素：

本发明实施例解决的问题是改善用户在嘈杂背景噪声中通话体验，使通话正常进行。

为解决上述技术问题，本发明实施例提供一种语音信号处理方法，语音信号处理方法包括：获取下行语音信号和当前通话场景的背景噪声；计算所述下行语音信号和所述当前通话场景的背景噪声的信噪比；当所述信噪比小于预设阈值时，对所述下行语音信号进行增益放大。

可选的，所述获取当前通话场景的背景噪声，包括：获取当前通话场景的上行信号；对所述当前通话场景的上行信号进行噪声估计，获取所述当前通话场景的背景噪声。

可选的，对所述下行语音信号进行增益放大之后，还包括：实时获取所述当前通话场景的背景噪声的能量；根据实时获取的所述当前通话场景的背景噪声的能量，对所述下行语音信号的增益进行调整。

可选的，所述对所述下行语音信号的增益进行调整，包括：当所述信噪比小于预设阈值，且所述背景噪声增大时，增大对所述下行语音信号的增益；当所述信噪比小于预设阈值，且所述背景噪声减小时，减小对所述下行语音信号的增益；当所述信噪比小于预设阈值，且所述背景噪声不变时，保持对所述下行语音信号的增益。

可选的，所述增大对所述下行语音信号的增益，包括：对所述增益进行平滑处理，平滑增大对所述下行语音信号的增益。

可选的，所述减小对所述下行语音信号的增益，包括：在预设时间内，增大所述增益的降低速率。

为解决上述技术问题，本发明实施例还公开了一种语音信号处理装置，语音信号处理装置包括获取单元，用于获取下行语音信号和当前通话场景的背景噪声；计算单元，用于计算所述下行语音信号和所述当前通话场景的背景噪声的信噪比；增益调整单元，用于当所述信噪比小于预设阈值时，对所述下行语音信号进行增益放大。

可选的，所述获取单元，用于：获取当前通话场景的上行信号；对所述当前通话场景的上行信号进行噪声估计，获取所述当前通话场景的背景噪声。

可选的，所述增益调整单元，还用于：实时获取所述当前通话场景的背景噪声的能量；根据实时获取的所述当前通话场景的背景噪声的能量，对所述下行语音信号的增益进行调整。

可选的，所述增益调整单元，用于：对所述下行语音信号的增益进行调整，包括：当所述信噪比小于预设阈值，且所述背景噪声增大时，增大对所述下行语音信号的增益；当所述信噪比小于预设阈值，且所述背景噪声减小时，减小对所述下行语音信号的增益；当所述信噪比小于预设阈值，且所述背景噪声不变时，保持对所述下行语音信号的增益。

可选的，所述增益调整单元，用于：增大对所述下行语音信号的增益，包括：对所述增益进行平滑处理，平滑增大对所述下行语音信号的增益。

可选的，所述增益调整单元，用于：减小对所述下行语音信号的增益，包括：在预设时间内，增大所述增益的降低速率。

本发明实施例还公开了一种计算机可读存储介质，计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其上存储有计算机指令，所述计算机指令运行时执行上述任一种所述的语音信号处理方法的步骤。

本发明实施例还提供了一种语音信号处理装置，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所述计算机指令时执行上述任一种所述的语音信号处理方法的步骤。

与现有技术相比，本发明实施例的技术方案具有以下有益效果：

通过计算下行语音信号和所述当前通话场景的背景噪声的信噪比。当所述信噪比小于预设阈值时，自动对所述下行语音信号进行增益放大，以计算量较小的方式改善用户在嘈杂背景噪声中通话体验，使通话正常进行。

附图说明

图1是本发明实施例中一种语音信号处理方法的流程图；

图2是本发明实施例中一种语音信号处理方法的下行语音信号图；

图3是本发明实施例中一种语音信号处理装置的结构示意图。

具体实施方式

现有技术中，存在一种场景识别并自动增益下行语音信号的方法，通过采用人工智能算法不断学习当前的场景噪声，识别出当前噪声是商场噪声或游乐场噪声等；之后，再根据场景噪声的特点，处理下行的语音信号，放大特定频率的信号，以改善嘈杂环境中的通话体验，使通话正常进行。但是，现有的场景识别算法计算量大、复杂度高，在手机有限的内存空间和计算能力下，不易实现。

本发明实施例中，通过计算下行语音信号和所述当前通话场景的背景噪声的信噪比。当所述信噪比小于预设阈值时，自动对所述下行语音信号进行增益放大，以计算量较小的方式改善用户在嘈杂背景噪声中通话体验，使通话正常进行。

为使本发明的上述目的、特征和有益效果能够更为明显易懂，下面结合附图对本发明的具体实施例做详细的说明。

本发明实施例提供了一种语音信号处理方法，参照图1，以下通过具体步骤进行详细说明。

本发明实施例中提供的语音信号处理方法可以应用于通讯设备。

步骤s101，获取下行语音信号和当前通话场景的背景噪声。

在实际应用中，通话双方的通讯设备都可以通过音频采集模块获取相应的背景噪声，例如手机通过麦克风获取通话中的背景噪声。因此，通话双方获取各自所处环境的背景噪声，进而判断当前所处的环境的背景噪声是否会干扰对话。

在具体实施中，可以先获取当前通话场景的上行信号，再对所述当前通话场景的上行信号进行噪声估计，获取所述当前通话场景的背景噪声。在本发明实施例中，当用户a与用户b进行语音通话时，对于用户a而言，其输出的通话信号为上行信号，接收到的b输出的语音信号为下行语音信号。

通讯设备(例如手机)在音频信号处理过程中，会对音频采集模块(例如麦克风)采集到的上行信号做降噪处理，降噪处理的包括噪声估计，即背景噪声大小的计算。因此，可以采用通讯设备中现有的上行降噪算法中获得的噪声估计得到当前通话场景的背景噪声，无需增加其他硬件模块，易于实现。

步骤s102，计算所述下行语音信号和所述当前通话场景的背景噪声的信噪比。

在获取到下行语音信号和当前通话场景的背景噪声之后，可以直接获取到的下行语音信号和背景噪声计算二者之间的计算信噪比。

步骤s103，当所述信噪比小于预设阈值时，对所述下行语音信号进行增益放大。

在实际应用中，在一般环境下，当前通话场景的背景噪声不是特别大，不会干扰正常通话。即下行语音信号和背景噪声的信噪比较大，不需要放大下行语音信号。当手机通话中的一方或多方的背景噪声很大时，一方或多方相应的下行语音信号和背景噪声的信噪比会比较小。当信噪比小于一定的阈值时，通话一方或多方的手机都可以对下行语音信号进行增益放大，以对下行语音信号进行放大处理，从而可以提高下行语音信号的声压级，使通话顺畅进行。

在实际应用中，若下行语音信号和当前通话场景的背景噪声的信噪比超过预设阈值，说明通话正常，无需对下行语音信号进行增益放大。因此，可以继续获取下行语音信号和当前通话场景的背景噪声，并继续判断下行语音信号和背景噪声的信噪比是否小于预设阈值，以实时检测通话是否正常。

在具体实施中，在对所述下行语音信号进行增益放大之后，继续实时获取当前通话场景的背景噪声的能量。根据实时获取的所述当前通话场景的背景噪声的能量，可以继续对下行语音信号的增益进行调整，以改善用户在嘈杂环境中的通话体验，使通话正常进行。

在具体实施中，当所述信噪比小于预设阈值，且当前通话场景的背景噪声在继续增大时，增大对所述下行语音信号的增益。在增大对下行语音信号的增益时，可以对所述增益进行平滑处理，平滑增大对所述下行语音信号的增益，以平缓提高下行语音信号的声压级，保证用户的听觉体验。

在具体实施中，当所述信噪比小于预设阈值，且当前通话场景的背景噪声在逐渐减小时，可以相应减小对所述下行语音信号的增益。并且，还可以在预设时间内，增大所述增益的降低速率，即快速减小对下行语音信号的增益，避免声压的突兀变化，保证用户的听觉体验。

在具体实施中，当所述信噪比小于预设阈值，且当前通话场景的背景噪声在一定预设范围内保持不变时，可以继续保持对所述下行语音信号的增益，以改善用户在嘈杂环境中的通话体验，使通话正常进行。

参照图2给出了本发明实施例中一种语音信号处理方法的下行语音信号图。

由图2可知，在正常背景噪声下，下行语音信号和当前通话场景的背景噪声的信噪比超过预设阈值，无需自动放大下行语音信号。此时，用户可以清楚听到下行语音信号，即信噪比较大，不对下行语音信号进行增益放大。随后，背景噪声增大，此刻下行语音信号和背景噪声的信噪比小于预设阈值，自动增益下行语音信号，下行语音信号被放大，使得用户可以继续进行通话。最后，背景噪声减小，信噪比变大，此时不需要放大下行语音信号增益，下行语音信号快速变小，恢复到之前正常背景噪声下的下行语音信号。

综上所述，通过计算下行语音信号和所述当前通话场景的背景噪声的信噪比。当所述信噪比小于预设阈值时，自动对所述下行语音信号进行增益放大，以计算量较小的方式改善用户在嘈杂背景噪声中通话体验，使通话正常进行。

参照图3，本发明实施例还提供了一种语音信号处理装置30，包括：获取单元301、计算单元302和增益调整单元303；

其中，所述获取单元301，用于获取下行语音信号和当前通话场景的背景噪声；

所述计算单元302，用于计算所述下行语音信号和所述当前通话场景的背景噪声的信噪比；

所述增益调整单元303，用于当所述信噪比小于预设阈值时，对所述下行语音信号进行增益放大。

在具体实施中，所述获取单元301，可以用于：获取当前通话场景的上行信号；再对所述当前通话场景的上行信号进行噪声估计，获取所述当前通话场景的背景噪声。

在具体实施中，所述增益调整单元303，还可以用于：实时获取所述当前通话场景的背景噪声的能量；再根据实时获取的所述当前通话场景的背景噪声的能量，对所述下行语音信号的增益进行调整。

在具体实施中，所述增益调整单元303，可以用于：对所述下行语音信号的增益进行调整，具体包括：当所述信噪比小于预设阈值，且当前通话场景的背景噪声增大时，增大对所述下行语音信号的增益；当所述信噪比小于预设阈值，且当前通话场景的背景噪声减小时，减小对所述下行语音信号的增益；当所述信噪比小于预设阈值，且当前通话场景的背景噪声不变时，保持对所述下行语音信号的增益。

在具体实施中，所述增益调整单元303，可以用于：增大对所述下行语音信号的增益，具体包括：对所述增益进行平滑处理，平滑增大对所述下行语音信号的增益。

在具体实施中，所述增益调整单元303，可以用于：减小对所述下行语音信号的增益，包括：在预设时间内，增大所述增益的降低速率。

本发明实施例还提供了一种计算机可读存储介质，计算机可读存储介质为非易失性存储介质或非瞬态存储介质，其上存储有计算机指令，所述计算机指令运行时执行本发明上述实施例中提供的任一种语音信号处理方法的步骤。

本发明实施例还提供了一种语音信号处理装置，包括存储器和处理器，所述存储器上存储有可在所述处理器上运行的计算机指令，所述处理器运行所示计算机指令时，执行本发明上述实施例中提供的任一种语音信号处理方法的步骤。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于任一计算机可读存储介质中，存储介质可以包括：rom、ram、磁盘或光盘等。

虽然本发明披露如上，但本发明并非限定于此。任何本领域技术人员，在不脱离本发明的精神和范围内，均可作各种更动与修改，因此本发明的保护范围应当以权利要求所限定的范围为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：雍雅琴;董斐;孟建华;纪伟;潘思伟;罗本彪;于伟维;林福辉
技术所有人：展讯通信(上海)有限公司
我是此专利的发明人

上一篇：一种防压实抽屉式填装内筒珍珠岩粉末的机构的制作方法
上一篇：一种倾斜转弯式环形分拣机及其分拣方法与流程