一种语音信息验证方法与流程

文档序号：15494776发布日期：2018-09-21 21:26阅读：201来源：国知局

导航： X技术> 最新专利>乐器;声学设备的制造及制作,分析技术

本发明语音信息处理领域，尤其涉及一种语音信息验证方法。

背景技术：

音频信号处理是一个复杂的交叉技术领域。近年来，音频处理技术得到了广泛的应用。

音频处理的基础是语音检测，音频检测的目的是检测语音信号是否存在。

现有技术中，语音信息的检测，由环境噪音的存在，导致对语音信息的识别精度不高。目前，音频检测的过程通常是：获取各音频信号，从各音频信号中提取特征参数进行语义分析，再根据语义分析的结果获知该音频信号是否为语音。

但是，语义分析需要进行大量的计算和模板的匹配，影响了音频检测的效率。

因此，现有技术有待于进一步的改进。

技术实现要素：

鉴于上述现有技术中的不足之处，本发明的目的在于为用户提供一种语音信息验证方法，克服现有技术中音频检测效率低缺陷。

本发明提供的实施例为：一种语音信息验证方法，其中，所述方法包括：

接收客户端发出的待验证音频信号；

对所述音频信号进行快速傅里叶变换得到频域信号；

根据所述频域信号计算谱幅度值；

计算所述谱幅度值的概率密度，根据所述概率密度计算所述音频信号的谱熵，以及根据所述谱熵确定所述音频信号是否为语音信号；

若为语音信号则识别出所述语音信号中包含的语音信息；所述语音信息包含数字、英文字符和/或汉字；

将所述语音信号中识别出的语音信息与预设的验证信息相比对，若相同，则通过验证。

可选的，所述根根据所述频域信号计算谱幅度值的步骤中，采用以下公式进行计算：

其中，x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值，z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度，n表示快速傅里叶变换的变化长度，k小于或等于n，exp(-j2πkn/n)表示幅角为2π的kn/n倍的复数。

可选的，所述计算所述谱幅度值的概率密度的步骤包括：

根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量；

根据所述总能量以及所述谱幅度值计算概率密度。

可选的，所述带噪语音功率谱总能量的计算公式为：

其中，esum(y)表示第y个音频信号所在帧的带噪语音功率谱总能量,x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值，n表示快速傅里叶变换的变化长度。

可选的，所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中，采用以下公式进行计算：

d(k,y)＝|x(k,y)|²/esum(y)；

其中，d(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度，x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。

可选的，根据所述概率密度计算所述音频信号的谱熵的具体过程：

其中，h(y)表示第y个音频信号的谱熵，d(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。

可选的，所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括：

计算所述音频信号的能量；

根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号；

所述计算所述音频信号的能量的公式为：

其中，e(y)表示第y个音频信号的能量，m表示音频信号所在帧的帧长，z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度；

根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括：

判断p(y)是否大于预置门限值，若是，则确定音频信号是语音信号，若否，则确定音频信号不是语音信号，其中，

可选的，所述将所述语音信号中识别出的语音信息与预设的验证信息相比对的步骤还包括：

获取发送该语音信号的客户端的设备号、用户名或者ip地址；

获取与所述设备号、用户名或者ip地址相对应的验证码；

根据所述验证码与识别出的语音信息是否相同，若相同，则通过验证，否则，提示验证不通过。

可选的，所述语音信息验证方法，还包括步骤：

若提示验证不通过，则向客户端发出重新验证提示信息，并记录验证不通过的次数；

若在预定时间内验证失败的次数超出预设次数，则发出所述客户端验证失败的提示信息。

可选的，所述语音信息验证方法，还包括步骤：

若提示所述客户端验证失败的提示信息，则向客户端发出是否更换验证方式，若是，则进入文字验证页面，否则退出本次验证。

本发明中，可以根据音频信号的谱熵来进行音频信号检测，谱熵的计算过程主要涉及时频变换、幅度计算和能量计算等，这些计算过程所针对的都是语音信号本身的属性，而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式，从而减少了计算量，提高了音频信息检测的效率。

附图说明

图1为本发明所述一种语音信息验证方法的步骤流程图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

本发明提供的实施例为：一种语音信息验证方法，如图1所示，所述方法包括：

步骤s101，接收客户端发出的待验证音频信号。

本实施例可以在服务器上实现，连接到客户端的服务器接收客户端传送的待验证音频信号，对该音频信号进行验证。

可以想到的是，在具体实施时，本发明所公开的语音信息验证的方法，可以应用在需要通过验证才能登录成功的应用程序上，也可以应用在需要进行验证的设备进行网络连接上，或者其他可能需要进行账号或者设备合法性认证的地方。

步骤s102，对所述音频信号进行快速傅里叶变换得到频域信号。

分别对音频信号进行快速傅里叶变换，得到该音频信号的频域信号。

步骤s103，根据所述频域信号计算谱幅度值。

利用上述步骤s102中获取到频域信号，计算其对应的谱幅度值。

具体的，所述根据所述频域信号计算谱幅度值的步骤中，采用以下公式进行计算：

步骤s104，计算所述谱幅度值的概率密度，根据所述概率密度计算所述音频信号的谱熵，以及根据所述谱熵确定所述音频信号是否为语音信号。

本步骤中进行以下计算：

首先、需要根据谱幅度值计算概率密度；

其次，再根据概率密度计算出音频信号的谱熵；

再次，根据所述谱熵确定所述第一音频信号和第二音频信号是否均为语音信号；

具体的，所述计算所述第一谱幅度值和所述第二谱幅度值的概率密度的步骤包括：

根据所述谱幅度值计算第y个音频信号所在帧的带噪语音功率谱总能量；

根据所述总能量以及所述谱幅度值计算概率密度。

所述带噪语音功率谱总能量的计算公式为：

其次，所述根据所述总能量以及所述谱幅度值计算概率密度的步骤中，采用以下公式进行计算：

d(k,y)＝|x(k,y)|²/esum(y)；

其中，d(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度，x(k,y)表示第y个音频信号所在帧的第k个频段的谱幅度值。

再次，根据所述概率密度计算所述音频信号的谱熵的具体过程：

其中，h(y)表示第y个音频信号的谱熵，d(k,y)表示第y个音频信号所在帧的第k个频段所对应的概率密度。

根据计算出的与第一音频信号相对应的谱熵确定所述第一音频信号是否为语音信号，根据计算出的与第二音频信号相对应的谱熵确定所述第二音频信号是否为语音信号。

或者，通过以下方法实现音频信号是否为语音信号的识别：

所述根据所述谱熵确定所述音频信号是否为语音信号的步骤包括：

计算所述音频信号的能量；

根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号；

所述计算所述音频信号的能量的公式为：

其中，e(y)表示第y个音频信号的能量，m表示音频信号所在帧的帧长，z(n,y)表示第y个音频信号所在帧的音频中的第n个点的幅度；

根据所述音频信号的能量以及所述谱熵确定所述音频信号是否为语音信号的步骤包括：

判断p(y)是否大于预置门限值，若是，则确定音频信号是语音信号，若否，则确定音频信号不是语音信号，其中，

步骤s105，若为语音信号则识别出所述语音信号中包含的语音信息；所述语音信息包含数字、英文字符和/或汉字。

若为语音信号则通过语音识别，识别出所述音频信号所包含的语音信息。

具体的所述语音识别可以通过语音识别算法将音频信号与数据库中存储的语音特征比对和计算得到。通过将音频信号与数据库中存储的数据进行比对，或者将所述音频信号发送至云端服务器，并获取云端服务器返回的与音频信号相对应的语音信息。

可以想到的是，所述语音信息可以为数字、英文字符和/或汉字等的组合。

步骤s106，将所述语音信号中识别出的语音信息与预设的验证信息相比对，若相同，则通过验证。

若客户端传输的待验证音频信号中含有的语音信息与预设的验证信息相同，则通过验证，否则，提示验证不通过。

具体的，在具体实施时，所述将所述语音信号中识别出的语音信息与预设的验证信息相比对的步骤还包括：

获取发送该语音信号的客户端的设备号、用户名或者ip地址；

获取与所述设备号、用户名或者ip地址相对应的验证码；

根据所述验证码与识别出的语音信息是否相同，若相同，则通过验证，否则，提示验证不通过。

可选的，所述语音信息验证方法，还包括步骤：

若提示验证不通过，则向客户端发出重新验证提示信息，并记录验证不通过的次数；

若在预定时间内验证失败的次数超出预设次数，则发出所述客户端验证失败的提示信息。

较佳的，当上述步骤中出现验证失败的提示信息后，所述语音信息验证方法还包括步骤：

若提示所述客户端验证失败的提示信息，则向客户端发出是否更换验证方式，若是，则进入文字验证页面，否则退出本次验证。

本发明提供了一种语音信息验证方法，通过接收客户端发出的待验证音频信号；对所述音频信号进行快速傅里叶变换得到频域信号；根据所述频域信号计算谱幅度值；计算所述谱幅度值的概率密度，根据所述概率密度计算所述音频信号的谱熵，以及根据所述谱熵确定所述音频信号是否为语音信号；若为语音信号则识别出所述语音信号中包含的语音信息；将所述语音信号中识别出的语音信息与预设的验证信息相比对，若相同，则通过验证，本发明中所采用的方法所针对的都是语音信号本身的属性，而不必进行语义分析这种需要涉及到人工智能和神经网络的计算方式，从而减少了计算量，提高了语音信息验证的效率。

以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：向湘杰
技术所有人：东莞市华睿电子科技有限公司
我是此专利的发明人

上一篇：一种安全的复合材料横担绝缘子的制作方法
上一篇：一种地线融冰绝缘悬垂串的制作方法