语音验证处理方法及装置与流程

文档序号：12624419阅读：291来源：国知局

本发明涉及信息安全技术领域，尤其涉及一种语音验证处理方法及装置。

背景技术：

随着互联网科技的发展，互联网上的各种恶意攻击造成了严重的信息泄露、甚至用户财产的损失，因此互联网上的信息的安全成为现有互联网发展过程中的一个重大关注点。

目前，为了防止恶意攻击，大部分应用都采取了验证码方案，只有能够正确识别出验证码的用户才可以访问该应用。现在大部分应用采用的验证码可以为数字、字母、文字或者图片等信息，由用户识别验证码的内容，并输入验证码的内容，由服务器端检测用户识别的验证码是够正确，当用户输入的验证正确时，验证通过，并允许用户访问该应用。现有技术中，为了防止由机器自动识别验证码，现有技术中通常还采用视觉模糊策略对验证码进行视觉上的模糊处理，进一步增强了互联网的信息安全性。

但是，现有技术中，验证码的实现算法都较为简单，还是无法有效地防止采用机器进行验证码输入时对系统造成的恶意攻击，造成信息的安全性较差。

技术实现要素：

本发明提供一种语音验证处理方法及装置，用于有效地防止采用机器进行验证码输入时对系统造成的恶意攻击，提高信息的安全性。

本发明提供一种语音验证处理方法，所述方法包括：

确定用户输入的语音验证码的语义与预设验证码的原始语义相符；所述用户输入的所述语音验证码是根据所述预设验证码进行语音输入的；

从所述语音验证码中提取语音音频特征；

计算所述语音音频特征与对应的历史同语义的音频特征的相似度；

基于所述相似度，检测所述语音验证码是否为有效输入。

进一步可选地，如上所述的方法中，所述语音特征包括每两个字发音之间的过度音、连音、停顿音以及背景噪声中的至少一种。

进一步可选地，如上所述的方法中，确定用户输入的语音验证码的语义与预设验证码的原始语义相符之前，所述方法还包括：

获取所述用户输入的所述语音验证码；

对所述用户输入的所述语音验证码进行语义识别，得到语义文本信息。

进一步可选地，如上所述的方法中，确定用户输入的语音验证码的语义与预设验证码的原始语义相符，具体包括：

判断所述语义文本信息与所述预设验证码的原始语义文本信息的语义是否一致，若一致，确定所述用户输入的所述语音验证码的语义与所述预设验证码的原始语义相符。

进一步可选地，如上所述的方法中，计算所述语音音频特征与对应的历史同语义的音频特征的相似度之前，所述方法还包括：

检测历史音频特征库中是否存在历史同语义的音频特征；

若存在，从所述历史音频特征库中获取所述历史同语义的音频特征。

进一步可选地，如上所述的方法中，当所述历史音频特征库中不存在所述历史同语义的音频特征时，所述方法还包括：

确定所述语音验证码为有效输入；

将所述语音验证码对应的所述语音音频特征和所述语义文本信息存储在所述历史音频特征库中。

进一步可选地，如上所述的方法中，基于所述相似度，检测所述语音验证码是否为有效输入，具体包括：检测所述相似度是否小于预设相似度阈值，若是，确定所述语音验证码为有效输入；否则确定所述语音验证码为无效输入。

本发明提供一种语音验证处理装置，所述装置包括：

确定模块，用于确定用户输入的语音验证码的语义与预设验证码的原始语义相符；所述用户输入的所述语音验证码是根据所述预设验证码进行语音输入的；

提取模块，用于从所述语音验证码中提取语音音频特征；

计算模块，用于计算所述语音音频特征与对应的历史同语义的音频特征的相似度；

检测模块，用于基于所述相似度，检测所述语音验证码是否为有效输入。

进一步可选地，如上所述的装置中，所述语音特征包括每两个字发音之间的过度音、连音、停顿音以及背景噪声中的至少一种。

进一步可选地，如上所述的装置中，所述装置还包括：

获取模块，用于获取所述用户输入的所述语音验证码；

识别模块，用于对所述用户输入的所述语音验证码进行语义识别，得到语义文本信息。

进一步可选地，如上所述的装置中，所述确定模块，具体用于判断所述语义文本信息与所述预设验证码的原始语义文本信息的语义是否一致，若一致，确定所述用户输入的所述语音验证码的语义与所述预设验证码的原始语义相符。

进一步可选地，如上所述的装置中，所述检测模块，还用于检测历史音频特征库中是否存在历史同语义的音频特征；

所述获取模块，还用于若所述检测模块检测所述历史音频特征库中存在所述历史同语义的音频特征时，从所述历史音频特征库中获取所述历史同语义的音频特征。

进一步可选地，如上所述的装置中，所述装置还包括存储模块；

所述确定模块，还用于当所述历史音频特征库中不存在所述历史同语义的音频特征时，确定所述语音验证码为有效输入；

所述存储模块，用于将所述语音验证码对应的所述语音音频特征和所述语义文本信息存储在所述历史音频特征库中。

进一步可选地，如上所述的装置中，所述检测模块，具体用于检测所述相似度是否小于预设相似度阈值；

所述确定模块，还用于当所述检测模块检测到所述相似度小于所述预设相似度阈值，确定所述语音验证码为有效输入；

所述确定模块，还用于当所述检测模块检测到所述相似度大于或者等于所述预设相似度阈值，确定所述语音验证码为无效输入。

本实施例的语音验证处理方法及装置，通过确定用户输入的语音验证码的语义与预设验证码的原始语义相符，从语音验证码中提取语音音频特征；检测语音音频特征与对应的历史同语义的音频特征的相似度；并基于相似度，检测语音验证码是否为有效输入。通过采用本实施例的技术方案，可以有效地防止现有技术中通过采用机器进行验证码输入对系统造成的恶意攻击，提高信息的安全性。而且使用时，用户通过输入语音验证码即可实现对语音验证的处理，在提高信息安全性的同时，还能够有效地提高用户的体验度。

【附图说明】

图1为本发明的语音验证处理方法实施例一的流程图。

图2为本发明的语音验证处理方法实施例二的流程图。

图3为本发明的语音验证处理装置实施例一的结构图。

图4为本发明的语音验证处理装置实施例二的结构图。

【具体实施方式】

为了使本发明的目的、技术方案和优点更加清楚，下面结合附图和具体实施例对本发明进行详细描述。

图1为本发明的语音验证处理方法实施例一的流程图。如图1所示，本实施例的语音验证处理方法，具体可以包括如下步骤：

100、确定用户输入的语音验证码的语义与预设验证码的原始语义相符；

本实施例的语音验证处理方法的执行主体为语音验证处理装置，该语音验证处理装置可以设置在服务器一侧，用于对客户端输入的语音验证码进行处理。本实施例的语音验证处理方法的适应场景为：为了防止恶意攻击，客户端在登录时需要用户通过客户端输入验证码进行安全验证，本实施例中，用户通过客户端输入的验证码为语音验证码。使用时，服务器先向客户端发送预设验证码，该预设验证码可以为文字，用于提示用户输入语音验证码。然后用户根据客户端显示的预设验证码，输入语音验证码，即本实施例中的用户输入的语音验证码是根据预设验证码进行语音输入的。服务器在接收到客户端发送的语音验证码时，需要先进行语义检测，本实施例的技术方案适用于确定用户输入的语音验证码的语义与预设验证码的原始语义相符的情况下。

101、从语音验证码中提取语音音频特征；

例如，本实施例的语音音频特征可以为包括每两个字发音之间的过度音、连音、停顿音以及背景噪声中的至少一种。

由于用户作为人，其正常输入的语音和机器发音对比会至少存在如下特征：

(1)每两个字发音之间会存在过度音、连音或者停顿音；而机器发音是将单个发音组合。比如读“牡丹花”，“123”，用户发声时，会在“丹”后有顿音，在“3”后无意识发高音。

(2)用户在正常发音时，由于处在自然生活环境中，而非绝对静音环境，会混入环境噪声(即背景噪声)，环境噪声在计算领域可以认为为真随机数，即任意两次音频不可能存在相同的环境噪声。

(3)由于人类的自然生理特征，即使发音同样的词语，也不可能完全一致。

因此，本实施例中可以提取每两个字发音之间的过度音、连音、停顿音以及背景噪声中的至少一种，作为语音音频特征。

102、计算语音音频特征与对应的历史同语义的音频特征的相似度；

103、基于相似度，检测语音验证码是否为有效输入。

例如，该步骤103具体可以包括：检测相似度是否小于预设相似度阈值，若相似度小于预设相似度阈值时，确定语音验证码为有效输入，结束；否则，当相似度大于或者等于预设相似度阈值时，确定语音验证码为无效输入，结束。

由于上述所述的语音音频特征的特殊性，可以认为任两次语音音频特征不应该完全相似。即如果语音音频特征与对应的历史同语义的音频特征的相似度大于或者等于预设相似度阈值时，可以认为本次的语音验证码为无效输入，本次的语音验证码可能是机器输入的。而只有当语音音频特征与对应的历史同语义的音频特征的相似度小于预设相似度阈值时，才能认为本次输入的语音验证码为有效输入。本实施例的技术方案是在认为存在语音音频特征的历史同语义的音频特征。

本实施例的语音验证处理方法，通过确定用户输入的语音验证码的语义与预设验证码的原始语义相符，从语音验证码中提取语音音频特征；检测语音音频特征与对应的历史同语义的音频特征的相似度；并基于相似度，检测语音验证码是否为有效输入。通过采用本实施例的技术方案，可以有效地防止现有技术中通过采用机器进行验证码输入对系统造成的恶意攻击，提高信息的安全性。而且使用时，用户通过输入语音验证码即可实现对语音验证的处理，在提高信息安全性的同时，还能够有效地提高用户的体验度。

图2为本发明的语音验证处理方法实施例二的流程图。如图2所示，本实施例的语音验证处理方法在上述实施例的技术方案的基础上，进一步更加详细地介绍本发明的技术方案。如图2所示，本实施例的语音验证处理方法，具体可以包括如下步骤：

200、客户端发起验证码获取请求；

例如，用户在通过客户端登录时，可以先点击客户端的显示界面的验证码获取请求。

201、服务器接收验证码获取请求，并向客户端返回预设验证码，并提示用户要通过语音输入；

202、用户根据预设验证码通过客户端输入语音验证码，客户端并向服务器发送语音验证码；

203、服务器接收用户输入的语音验证码，并对用户输入的语音验证码进行语义识别，得到语义文本信息；

204、服务器判断语音验证码的语义文本信息与预设验证码的原始语义文本信息的语义是否一致；若一致，执行步骤205；否则若不一致，执行步骤206；

205、服务器确定用户输入的语音验证码的语义与预设验证码的原始语义相符；执行步骤207；

步骤204和步骤205具体为步骤1 00的一种具体实现方式。

206、服务器确定用户输入的语音验证码的语义与预设验证码的原始语义不相符；执行步骤208；

207、服务器检测历史音频特征库中是否存在历史同语义的音频特征；若存在，执行步骤209；若不存在，执行步骤210；

208、服务器确定本次语音验证码为无效输入，结束。

209、服务器从历史音频特征库中获取历史同语义的音频特征；执行步骤212；

210、服务器确定语音验证码为有效输入；执行步骤211；

211、服务器将语音验证码对应的语音音频特征和语义文本信息存储在所述历史音频特征库中，结束；

也就是说，本实施例中，当首次接收该语义的音频特征时，即历史音频特征库中不存在历史同语义的音频特征，此时可以先认为本次的语音验证码为有效输入；同时，服务器将语音验证码对应的语音音频特征和语义文本信息存储在所述历史音频特征库中，以便于下次再接收到同语义的音频特征时进行检测。

212、服务器计算语音音频特征与对应的历史同语义的音频特征的相似度；执行步骤213；

213、服务器检测相似度是否小于预设相似度阈值，若是，执行步骤214；否则，执行步骤208；

214、服务器确定语音验证码为有效输入，结束。

本实施例的语音验证处理方法，通过采用上述实施例的技术方案，可以有效地防止现有技术中通过采用机器进行验证码输入对系统造成的恶意攻击，提高信息的安全性。而且使用时，用户通过输入语音验证码即可实现对语音验证的处理，在提高信息安全性的同时，还能够有效地提高用户的体验度。

图3为本发明的语音验证处理装置实施例一的结构图。如图3所示，本实施例的语音验证处理装置，具体可以包括：确定模块10、提取模块11、计算模块12和检测模块13。

其中确定模块10用于确定用户输入的语音验证码的语义与预设验证码的原始语义相符；用户输入的语音验证码是根据预设验证码进行语音输入的；确定模块10触发提取模块11启动，提取模块11用于从语音验证码中提取语音音频特征；计算模块12用于计算语音音频特征与对应的历史同语义的音频特征的相似度；检测模块13用于基于计算模块12计算的相似度，检测语音验证码是否为有效输入。

本实施例的语音验证处理装置，通过采用上述模块实现语音验证处理的实现原理以及技术效果与图1所示方法实施例的实现效果相同，详细可以参考上述实施例的记载，在此不再赘述。

图4为本发明的语音验证处理装置实施例二的结构图。如图4所示，本实施例的语音验证处理装置在上述图1所示实施例的技术方案的基础上，进一步还可以包括如下技术方案。

本实施例的语音验证处理装置中的语音特征包括每两个字发音之间的过度音、连音、停顿音以及背景噪声中的至少一种。

如图4所示，本实施例的语音验证处理装置，还包括：获取模块14和识别模块15。

其中获取模块14用于获取用户输入的语音验证码；识别模块15用于对获取模块14获取的用户输入的语音验证码进行语义识别，得到语义文本信息。具体地，确定模块10与识别模块15连接，具体用于判断识别模块15识别的语音验证码的语义文本信息，与预设验证码的原始语义文本信息的语义是否一致，若一致，确定用户输入的语音验证码的语义与预设验证码的原始语义相符。

进一步可选地，本实施例的语音验证处理装置中，检测模块13还用于检测历史音频特征库中是否存在历史同语义的音频特征；获取模块14还用于若检测模块13检测历史音频特征库中存在历史同语义的音频特征时，从历史音频特征库中获取历史同语义的音频特征。

进一步可选地，如图4所示，本实施例的语音验证处理装置中，还包括存储模块16。

其中确定模块10还用于当检测模块13检测得到历史音频特征库中不存在历史同语义的音频特征时，确定语音验证码为有效输入；存储模块16用于根据确定模块10的确定结果，将语音验证码对应的语音音频特征和语义文本信息存储在历史音频特征库中。

进一步可选地，本实施例的语音验证处理装置中，检测模块13具体用于检测相似度是否小于预设相似度阈值；确定模块10还用于当检测模块13检测到相似度小于预设相似度阈值，确定语音验证码为有效输入；确定模块10还用于当检测模块检测到相似度大于或者等于预设相似度阈值，确定语音验证码为无效输入。

本实施例的语音验证处理装置，通过采用上述模块实现语音验证处理的实现原理以及技术效果与图2所示方法实施例的实现效果相同，详细可以参考上述实施例的记载，在此不再赘述。

在本发明所提供的几个实施例中，应该理解到，所揭露的系统，装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本发明各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用硬件加软件功能单元的形式实现。

上述以软件功能单元的形式实现的集成的单元，可以存储在一个计算机可读取存储介质中。上述软件功能单元存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)或处理器(processor)执行本发明各个实施例所述方法的部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内，所做的任何修改、等同替换、改进等，均应包含在本发明保护的范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：郝运峰;
技术所有人：百度在线网络技术(北京)有限公司;
我是此专利的发明人

上一篇：导光板激光精密微细加工、清洗和吸取装置的制作方法
上一篇：一种变电站绝缘子串清洗机器人的制作方法与工艺

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。