一种语音验证的方法、服务器及系统与流程

文档序号：15221470发布日期：2018-08-21 17:31阅读：143来源：国知局

导航： X技术> 最新专利>电子通信装置的制造及其应用技术

本发明涉及语音识别技术领域，特别涉及一种语音验证的方法、服务器及系统。

背景技术：

在业务处理的过程中，为了区分用户是人还是计算机，一般通过验证码的形式来验证。

现有技术中，验证过程一般是通过文字的方式来实现。在验证的界面上显示验证问题，用户根据验证问题输入答案。但是，计算机可以很容易地抓取界面上的文字，进而确定出答案。因此，现有的验证过程的安全性较低。

技术实现要素：

本发明实施例提供了一种语音验证的方法、服务器及系统，能够提高验证过程的安全性。

第一方面，本发明实施例提供了一种语音验证的方法，应用于服务器，包括：

将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端，以使所述客户端播放所述验证音频文件，并输出所述验证问题；

接收所述客户端发来的所述验证问题的响应；

根据所述验证音频文件和所述响应，确定是否通过验证。

进一步地，

该方法进一步包括：

预先设置至少一个第一问题，为每个所述第一问题设置对应的至少两个第一音频文件，设置每个所述第一音频文件的信息；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之前，进一步包括：

从所述至少一个第一问题中确定所述验证问题；

从所述验证问题对应的所述至少两个第一音频文件中，确定至少两个第一目标音频文件；

根据所述至少两个目标第一音频文件，生成所述验证音频文件，其中，每个所述目标第一音频文件对应所述验证音频文件的一个音轨；

所述根据所述验证音频文件和所述响应，确定是否通过验证，包括：

根据所述至少两个第一目标音频文件的信息，确定所述验证问题针对所述至少两个第一目标音频文件的第一验证答案；

判断所述响应是否与所述第一验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

进一步地，

该方法进一步包括：

预先设置至少一个包含至少两个音轨的第二音频文件；

预先设置每个所述第二音频文件对应的第二问题以及答案；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之前，进一步包括：

从至少一个所述第二音频文件中确定所述验证音频文件；

确定所述验证音频文件对应的所述验证问题以及第二验证答案；

所述根据所述验证音频文件和所述响应，确定是否通过验证，包括：

判断所述响应是否与所述第二验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

进一步地，

该方法进一步包括：

预先设置验证时间长度；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之后，进一步包括：

开始计时；

判断是否在所述验证时间长度内接收到所述响应，如果是，则执行所述根据所述验证音频文件和所述响应，确定是否通过验证，否则，确定不通过验证，结束当前流程。

进一步地，

在所述根据所述验证音频文件和所述响应，确定是否通过验证之后，进一步包括：

当通过验证时，确定输入所述响应为真人；

当没有通过验证时，确定输入所述响应不是真人。

进一步地，

所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应。

第二方面，本发明实施例提供了一种语音验证的服务器，包括：

发送单元，用于将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端，以使所述客户端播放所述验证音频，并输出所述验证问题；

接收单元，用于接收所述客户端发来的所述验证问题的响应；

验证单元，用于根据所述验证音频文件和所述响应，确定是否通过验证。

进一步地，

该服务器进一步包括：

第一保存单元，用于保存至少一个第一问题，每个所述第一问题对应的至少两个第一音频文件，每个所述第一音频文件的信息；

进一步包括：

生成单元，用于从所述至少一个第一问题中确定所述验证问题，从所述验证问题对应的所述至少两个第一音频文件中，确定至少两个第一目标音频文件，根据所述至少两个目标第一音频文件，生成所述验证音频文件，其中，每个所述目标第一音频文件对应所述验证音频文件的一个音轨；

所述验证单元，用于根据所述至少两个第一目标音频文件的信息，确定所述验证问题针对所述至少两个第一目标音频文件的第一验证答案，判断所述响应是否与所述第一验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

进一步地，

该服务器进一步包括：

第二保存单元，用于至少一个包含至少两个音轨的第二音频文件，每个所述第二音频文件对应的第二问题以及答案；

进一步包括：

确定单元，用于从至少一个所述第二音频文件中确定所述验证音频文件，确定所述验证音频文件对应的所述验证问题以及第二验证答案；

所述验证单元，用于判断所述响应是否与所述第二验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

进一步地，

该服务器进一步包括：

设置单元，用于设置验证时间长度；

进一步包括：

计时单元，用于开始计时，判断是否在所述验证时间长度内接收到所述响应，如果是，则执行触发所述验证单元，否则，确定不通过验证。

进一步地，

在所述根据所述验证音频文件和所述响应，确定是否通过验证之后，进一步包括：

当通过验证时，确定输入所述响应为真人；

当没有通过验证时，确定输入所述响应不是真人。

进一步地，

所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应。

第三方面，本发明实施例提供了一种语音验证的系统，包括：

至少一个客户端和第二方面中任一所述服务器；

所述客户端，用于接收所述服务器发来的验证音频文件和验证问题，播放所述验证音频文件，并输出所述验证问题，接收所述验证问题的响应，将所述响应发送给所述服务器。

进一步地，

所述客户端包括声音输入设备和声音输出设备；

所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应；

所述客户端，用于利用所述声音输出设备播放所述验证音频文件和音频格式的所述验证问题，利用所述声音输入设备接收语音形式的所述响应。

在本发明实施例中，通过客户端播放包含至少两个音轨的验证音频文件，并输出验证问题，以使用户根据播放的验证音频文件中的内容来回答该验证问题，由于计算机很难识别包含至少两个音轨的音频文件中的内容，也就很难得到准确的验证问题的响应，但是，真人可以能够很容易识别包含至少两个音轨的音频文件中的内容，进而能够很容易得到准确的验证问题的响应，进而提高了验证过程的安全性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种语音验证的方法的流程图；

图2是本发明一实施例提供的另一种语音验证的方法的流程图；

图3是本发明一实施例提供的一种语音验证的服务器的示意图；

图4是本发明一实施例提供的一种语音验证的系统的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例，基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本发明保护的范围。

如图1所示，本发明实施例提供了一种语音验证的方法，应用于服务器，该方法可以包括以下步骤：

步骤101：将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端，以使所述客户端播放所述验证音频文件，并输出所述验证问题；

步骤102：接收所述客户端发来的所述验证问题的响应；

步骤103：根据所述验证音频文件和所述响应，确定是否通过验证。

一般来说，验证问题是比较简单的，真人在听了验证音频文件的内容后，能够根据该内容很容易的得到正确答案。而计算机由于无法识别验证音频文件的内容，所以很难得到正确答案。

在本发明一实施例中，该方法进一步包括：

预先设置至少一个第一问题，为每个所述第一问题设置对应的至少两个第一音频文件，设置每个所述第一音频文件的信息；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之前，进一步包括：

从所述至少一个第一问题中确定所述验证问题；

从所述验证问题对应的所述至少两个第一音频文件中，确定至少两个第一目标音频文件；

根据所述至少两个目标第一音频文件，生成所述验证音频文件，其中，每个所述目标第一音频文件对应所述验证音频文件的一个音轨；

所述根据所述验证音频文件和所述响应，确定是否通过验证，包括：

根据所述至少两个第一目标音频文件的信息，确定所述验证问题针对所述至少两个第一目标音频文件的第一验证答案；

判断所述响应是否与所述第一验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

在本发明实施例中，针对不同问题，设置不同的音频文件。在确定验证问题时，可以从预先设置的至少一个第一问题中随机选择。而在确定至少两个第一目标音频文件时，可以从该验证问题对应的至少两个第一音频文件中随机选择。

这里的验证音频文件不是固定的，随着确定的目标音频文件的不同，得到的验证音频文件也不同。第一验证答案也不是固定，随着确定的目标音频文件的不同，第一验证答案也不同。该方案的安全性更高

举例来说，问题是：请说出其中一首歌曲的歌曲名？针对该问题的至少两个音频文件需要是歌曲，而这些音频文件的信息中包括歌曲名。针对该问题，从这两个音频文件的信息中查找歌曲名，判断响应中的歌曲名是否是其中的一个，如果是，则通过验证，不是，不通过验证。另外，为了使得真人能够更加容易的得到正确的答案，这些歌曲优选比较常见的，利用国歌等。

在本发明一实施例中，该方法进一步包括：

预先设置至少一个包含至少两个音轨的第二音频文件；

预先设置每个所述第二音频文件对应的第二问题以及答案；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之前，进一步包括：

从至少一个所述第二音频文件中确定所述验证音频文件；

确定所述验证音频文件对应的所述验证问题以及第二验证答案；

所述根据所述验证音频文件和所述响应，确定是否通过验证，包括：

判断所述响应是否与所述第二验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

在本发明实施例中，第二音频文件、第二问题和答案都是预先设置好的，验证音频文件无需合成，第二验证答案也是固定的。

举例来说，第二音频文件中可以包括：至少两个歌曲，每个歌曲对应一个音轨，第二问题可以是其中一首歌曲的歌曲名，答案是至少两个歌曲中任意一个歌曲的歌曲名。

在本发明一实施例中，该方法进一步包括：

预先设置验证时间长度；

在所述将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端之后，进一步包括：

开始计时；

在本发明一实施例中，通过验证时间长度限定回答验证问题的时间，当回答验证问题的时间超过验证时间长度时，可以确定不通过验证。这样，避免计算机能够通过较长时间解析出验证音频文件的可能，提高了验证过程的安全性。

这里的验证时间长度可以是3秒-5秒中的任一值。

在本发明一实施例中，在所述根据所述验证音频文件和所述响应，确定是否通过验证之后，进一步包括：

当通过验证时，确定输入所述响应为真人；

当没有通过验证时，确定输入所述响应不是真人。

在本发明一实施例中，所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应。

在本发明实施例中，验证问题可以是音频格式的，响应可以是语音形式的。这样，客户端的输入输出设备只需具有声音输出单元(例如扬声器)和声音输入单元(例如麦克风)即可，实现比较简单。

如图2所示，本发明实施例提供了一种语音验证的方法，应用于服务器，该方法可以包括以下步骤：

步骤201：预先设置至少一个第一问题，为每个第一问题设置对应的至少两个第一音频文件，设置每个第一音频文件的信息。

具体地，每个第一问题可以是音频格式。

举例来说，一个第一问题为：请说出其中一首歌曲的歌曲名？针对该第一问题，设置对应的至少两个歌曲的音频文件。较优地，这里的歌曲选择比较常见的，例如：《义勇军进行曲》、《甜蜜蜜》。每个歌曲的音频文件的信息中包括歌曲名。

步骤202：从该至少一个第一问题中确定验证问题。

具体地，可以随机选择，也可以根据办理的业务不同，选择不同的验证问题。

举例来说，验证问题为：请说出其中一首歌曲的歌曲名？

步骤203：从验证问题对应的至少两个第一音频文件中，确定至少两个第一目标音频文件。

举例来说，从至少两个歌曲的音频文件中，确定出《义勇军进行曲》、《甜蜜蜜》作为第一目标音频文件。

步骤204：根据该至少两个目标第一音频文件，生成验证音频文件，其中，每个目标第一音频文件对应验证音频文件的一个音轨。

具体地，目标第一音频文件与验证音频文件一一对应。

举例来说，将《义勇军进行曲》和《甜蜜蜜》合成为验证音频文件，其中，验证音频文件中包括两个音轨，一个音轨对应《义勇军进行曲》，另一个音轨对应《甜蜜蜜》。

步骤205：将包含至少两个音轨的验证音频文件和针对验证音频文件的验证问题发送给客户端，以使客户端播放验证音频文件，并输出验证问题。

具体地，在接收到验证音频文件和验证问题后，先播放验证问题，然后播放验证音频文件。客户端的用户(可能是真人，有可能是计算机)可以通过语音的形式输入响应。

步骤206：接收客户端发来的验证问题的响应。

具体地，客户端将用户输入的响应发送给服务器。

举例来说，该响应是语音形式的，内容是：《甜蜜蜜》。

步骤207：根据该至少两个第一目标音频文件的信息，确定验证问题针对该至少两个第一目标音频文件的第一验证答案。

具体地，针对不同的第一目标音频文件，同一个验证问题的答案可能不同。

举例来说，根据《义勇军进行曲》和《甜蜜蜜》这两首歌曲的信息，确定“请说出其中一首歌曲的歌曲名？”这个验证问题的答案是：“义勇军进行曲”和/或“甜蜜蜜”。

步骤208：判断响应是否与第一验证答案相符合，如果是，则执行步骤209，否则，执行步骤210。

举例来说，通过解析语音形式的响应，如果解析出的内容包含“义勇军进行曲”、“甜蜜蜜”中的任意一个，则通过验证，如果解析出的内容中不包含“义勇军进行曲”和“甜蜜蜜”中的任意一个，则不通过验证。

步骤209：确定通过验证。

具体地，通过验证说明客户端的用户是真人。

步骤210：确定不通过验证。

具体地，不通过验证说明客户端的用户不是真人。

在本发明实施例中，真人能够较容易的通过验证，机器和软件等很难在没有人类智力参与的情况下通过验证。

如图3所示，本实施例提供的一种语音验证的服务器，包括：

发送单元301，用于将包含至少两个音轨的验证音频文件和针对所述验证音频文件的验证问题发送给客户端，以使所述客户端播放所述验证音频，并输出所述验证问题；

接收单元302，用于接收所述客户端发来的所述验证问题的响应；

验证单元303，用于根据所述验证音频文件和所述响应，确定是否通过验证。

在本发明一实施例中，该服务器进一步包括：

第一保存单元，用于保存至少一个第一问题，每个所述第一问题对应的至少两个第一音频文件，每个所述第一音频文件的信息；

进一步包括：

在本发明一实施例中，该服务器进一步包括：

第二保存单元，用于至少一个包含至少两个音轨的第二音频文件，每个所述第二音频文件对应的第二问题以及答案；

进一步包括：

确定单元，用于从至少一个所述第二音频文件中确定所述验证音频文件，确定所述验证音频文件对应的所述验证问题以及第二验证答案；

所述验证单元，用于判断所述响应是否与所述第二验证答案相符合，如果是，则确定通过验证，否则，确定不通过验证。

在本发明一实施例中，该服务器进一步包括：

设置单元，用于设置验证时间长度；

进一步包括：

计时单元，用于开始计时，判断是否在所述验证时间长度内接收到所述响应，如果是，则执行触发所述验证单元，否则，确定不通过验证。

在本发明一实施例中，在所述根据所述验证音频文件和所述响应，确定是否通过验证之后，进一步包括：

当通过验证时，确定输入所述响应为真人；

当没有通过验证时，确定输入所述响应不是真人。

在本发明一实施例中，所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应。

如图4所示，本发明实施例提供了一种语音验证的系统，包括：

至少一个客户端401和本发明实施例中任一所述服务器402；

所述客户端401，用于接收所述服务器402发来的验证音频文件和验证问题，播放所述验证音频文件，并输出所述验证问题，接收所述验证问题的响应，将所述响应发送给所述服务器402。

图4中示出了三个客户端401。

在本发明一实施例中，所述客户端包括声音输入设备和声音输出设备；

所述验证问题包括：音频格式的所述验证问题；

所述响应包括：语音形式的所述响应；

所述客户端，用于利用所述声音输出设备播放所述验证音频文件和音频格式的所述验证问题，利用所述声音输入设备接收语音形式的所述响应。

在本发明实施例中，声音输入设备可以包括麦克风、麦克风阵列及相应降噪设备。

在本发明实施例中，客户端无需依赖按键、遥控器、触摸屏、摄像头等非声音输入设备。

在本发明实施例中，声音输出设备可以包括音箱、耳机等。

在本发明实施例中，客户端无需依赖显示屏等非声音输出设备。

在本发明实施例中，客户端仅依赖声音输入设备进行输入，声音输出设备作为输出。应用于没有显示设备的智能语音产品上具有极大的便利。同时对于视觉障碍的用户更加友好。

上述装置内的各单元之间的信息交互、执行过程等内容，由于与本发明方法实施例基于同一构思，具体内容可参见本发明方法实施例中的叙述，此处不再赘述。

本发明实施例提供了一种可读介质，包括执行指令，当存储控制器的处理器执行所述执行指令时，所述存储控制器执行本发明实施例提供的任意一种语音验证的方法。

本发明实施例提供了一种存储控制器，包括：处理器、存储器和总线；

所述存储器用于存储执行指令，所述处理器与所述存储器通过所述总线连接，当所述存储控制器运行时，所述处理器执行所述存储器存储的执行指令，以使所述存储控制器执行本发明实施例提供的任意一种语音验证的方法。

本发明各个实施例至少具有如下有益效果：

1、在本发明实施例中，通过客户端播放包含至少两个音轨的验证音频文件，并输出验证问题，以使用户根据播放的验证音频文件中的内容来回答该验证问题，由于计算机很难识别包含至少两个音轨的音频文件中的内容，也就很难得到准确的验证问题的响应，但是，真人可以能够很容易识别包含至少两个音轨的音频文件中的内容，进而能够很容易得到准确的验证问题的响应，进而提高了验证过程的安全性。

2、在本发明实施例中，通过验证时间长度限定回答验证问题的时间，当回答验证问题的时间超过验证时间长度时，可以确定不通过验证。这样，避免计算机能够通过较长时间解析出验证音频文件的可能，提高了验证过程的安全性。

3、在本发明实施例中，客户端仅依赖声音输入设备进行输入，声音输出设备作为输出，应用于没有显示设备的智能语音产品上具有极大的便利，实现比较简单。

需要说明的是，在本文中，诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个〃····〃”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同因素。

本领域普通技术人员可以理解：实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成，前述的程序可以存储在计算机可读取的存储介质中，该程序在执行时，执行包括上述方法实施例的步骤；而前述的存储介质包括：rom、ram、磁碟或者光盘等各种可以存储程序代码的介质中。

最后需要说明的是：以上所述仅为本发明的较佳实施例，仅用于说明本发明的技术方案，并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所做的任何修改、等同替换、改进等，均包含在本发明的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：罗华欣
技术所有人：山东浪潮商用系统有限公司
我是此专利的发明人

上一篇：一种智能分类系统的制作方法
上一篇：一种适用于多种尺寸类型的发电机定子线棒耐压试验工装的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。