一种资源调用的方法及装置与流程

文档序号：11590886阅读：186来源：国知局

本申请涉及信息技术领域，尤其涉及一种资源调用的方法及装置。

背景技术：

随着信息技术的发展，通过网络执行的业务越来越多，其中，较为常见的一种业务是通过网络对资源进行调用的业务，由于很多资源都可以通过网络调用，使得终端无需再将资源存储在本地，而是在需要时通过网络调用。

一般情况下以共享方式的不同，网络上共享的资源可分为无条件共享的资源以及有条件共享的资源，前者任何用户都可以调用，而后者只有符合条件的用户才可以调用该非共享资源。通常有条件的共享资源，通过设置提取码、设置密码、设置口令等等方式(以下将该提取码、密码、口令等统称为字符口令)，确定符合条件的用户，并赋予符合条件的用户调用该共享资源的权限(即，可调用该资源)。例如，用户a分享了一张照片，但是仅希望得到自己允许的用户可以看到(如，该用户a的亲友)，所以该用户a可通过设置字符口令，使得只有知道该字符口令的用户才可调用该照片，其中，输入该字符口令的用户可视为符合条件的用户，具有调用该照片的权限。

但是，现有技术中在调用有条件的共享资源时用户输入的字符口令，通常都是数字、字母、特殊符号等字符，一方面需要用户手动输入，导致用户操作繁琐，另一方面增加了用户输入错误概率，导致资源调用的效率低。

技术实现要素：

本申请实施例提供一种资源调用的方法，用于解决由于现有技术在通过字符口令调用资源时，由于输入方式的操作繁琐，导致资源调用的效率低的问题。

本申请实施例提供一种资源调用的装置，用于解决由于现有技术在通过字符口令调用资源时，由于输入方式的操作繁琐，导致资源调用的效率低的问题。

本申请实施例采用下述技术方案：

一种资源调用的方法，包括：

接收资源调用请求；

根据所述资源调用请求，显示验证字符；

采集用户根据所述验证字符输入的待识别音频；

对所述待识别音频进行语音识别；

根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许调用所述资源。

一种资源调用的方法，包括：

接收资源调用请求；

根据所述资源调用请求，播放标准发音；

采集用户根据播放的所述标准发音输入的待识别音频；

对所述待识别音频进行语音识别；

根据对所述待识别音频的识别结果以及针对所述标准发音预设的基准字符，确定是否允许调用所述资源。

一种资源调用的方法，包括：

接收获取红包请求；

根据所述获取红包请求，显示验证字符；

采集用户根据所述验证字符输入的待识别音频；

对所述待识别音频进行语音识别；

根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许获取所述红包。

一种资源调用的装置，包括：

接收模块，接收资源调用请求；

显示模块，根据所述资源调用请求，显示验证字符；

采集模块，采集用户根据所述验证字符输入的待识别音频；

识别模块，对所述待识别音频进行语音识别；

对比调用模块，根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许调用所述资源。

一种资源调用的装置，包括：

接收模块，接收资源调用请求；

播放模块，根据所述资源调用请求，播放标准发音；

采集模块，采集用户根据播放的所述标准发音输入的待识别音频；

识别模块，对所述待识别音频进行语音识别；

对比调用模块，根据对所述待识别音频的识别结果以及针对所述标准发音预设的基准字符，确定是否允许调用所述资源。

一种资源调用的装置，包括：

接收模块，接收获取红包请求；

显示模块，根据所述获取红包请求，显示验证字符；

采集模块，采集用户根据所述验证字符输入的待识别音频；

识别模块，对所述待识别音频进行语音识别；

对比调用模块，根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许获取所述红包。

本申请实施例采用的上述至少一个技术方案能够达到以下有益效果：

首先根据接收的资源调用请求，显示验证字符，之后采集用户根据所述验证字符输入的待识别音频，进而对该待识别音频进行语音识别，最后根据该待识别音频的语音识别结果，与针对该验证字符预设的基准字符，确定是否允许要用所述资源。可见，在本申请中，在调用资源时，不再需要用户输入字符口令，而只需要根据显示的验证字符，输入对应的待识别音频即可，以该识别结果该基准字符进行对比的结果，可以确定是否进行资源调用。避免了用户手动输入字符口令的繁琐操作，避免了用户输入字符口令的错误概率，提高了资源调用的效率。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本申请实施例提供的一种资源调用的过程；

图2为本申请实施例提供的一种验证页面的界面的示意图；

图3为本申请实施例提供的另一种验证页面的界面的示意图；

图4为本申请实施例提供的资源调用的详细过程；

图5为本申请实施例提供的另一种资源调用的过程；

图6为本申请实施例提供的另一种资源调用的过程；

图7为本申请实施例提供的另一种验证页面的界面的示意图；

图8为本申请实施例提供的一种资源调用的装置结构示意图；

图9为本申请实施例提供的另一种资源调用的装置结构示意图；

图10为本申请实施例提供的另一种资源调用的装置结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本申请实施例提供的一种资源调用的过程，具体包括以下步骤：

s101：接收资源调用请求。

s102：根据所述资源调用请求，显示验证字符。

在现有技术中，通常服务器之间的资源调用，可以通过预先设置的调用协议自动的进行，而当终端需要从服务器中调用资源时，若该资源存在对应的调用条件，则该终端需要先获取验证页面，并在通过该验证页面的验证之后，才可调用该资源，其中，获取验证页面的服务器与提供资源的服务器可以是同一个服务器也可以是不同的服务器。

于是，同理在本申请实施例中，可由终端确定资源调用请求，并且当该终端确定资源调用请求时，该终端可以监测用户的操作，并接收根据该用户的操作生成的资源调用请求，以使得后续该终端可以将该资源调用请求发送至服务器，进行后续操作。当然，步骤s101中的执行主体也可是该服务器，即，该服务器可以接收该终端发送的该资源调用请求，也就是说，在本申请中并不限定本申请步骤s101的执行主体是终端还是服务器，当然，为了方便后续说明，以下本申请提供的实施例中均视为以终端执行资源调用的过程。

具体的，由于资源调用可以视为一种业务，所以当该终端通过用户的操作，接收资源调用请求后，该终端还可以将该资源调用请求发送至业务服务器，即，该服务器可以是业务服务器。

之后，该终端还可接收该业务服务器返回的验证页面，其中，该验证页面可为该业务服务器预先设置好的验证页面，则该业务服务器在接收到该资源调用请求后，可向该终端返回该验证页面，该验证页面的内容可由工作人员根据需要进行设置。当然，在本申请中并不限定该终端必须向该业务服务器发送资源调用请求，具体该资源调用请求可以根据实际应用的需要(如，设置由哪个服务器接收资源调用请求)，而由工作人员进行设置。

另外，由于该验证页面是提示用户进行验证操作的页面，所以该验证页面可以显示验证字符，以便用户可以根据该验证字符执行操作进行验证，其中，该操作可包括：点击的手势操作、长按的手势操作等等，该验证字符为至少一种语种对应的字符，即，该验证字符可包括：中文字符、英文字符、日文字符、德文字符、韩文字符、法文字符、越南语字符、泰国语字符、西班牙语字符、拉丁语字符、俄语字符、孟加拉语字符、葡萄牙语字符、意大利语字符、印地语字符、阿拉伯语字符等字符中的至少一种。例如，当该验证字符为英文时，该验证页面可以显示“hello”，当该验证字符为德文字符时，该验证页面可以显示“gutentag”，当该验证字符为法语字符时，该验证页面可以显示“bonjour”等等。

需要说明的是，该验证页面可以是通过任一应用程序打开的网页页面，其中应用程序可以是，浏览器软件、即时通讯软件等等，并且，由于通过应用程序打开网页页面已经是现有技术中较为成熟的方法，本申请不再对此做过多说明，另外，该验证页面的构架可以采用超文本标记语言第五版(hypertextmarkuplanguage5，html5)，由于涉及到用户在该验证页面中的操作，所以该验证页面中还可携带脚本语言(javascript，js)代码、vbscript或者实用摘录和报告语言(practicalextractionandreportlanguage，perl)等等代码，本申请并不做具体限定。

在本申请实施例中，该业务服务器可以是单独的一台设备，也可以是由多台设备组成的系统，即，分布式服务器，该终端可以是手机、平板电脑、个人电脑等设备。

s103：采集用户根据所述验证字符输入的待识别音频。

在本申请实施例中，当该终端接收到了该验证页面之后，由于用户可根据该验证页面的验证要求，执行对应的操作进行验证，所以该终端可见监测用户的操作，并将根据该操作采集的待识别音频发送至语音识别服务器，以便后续步骤的操作。

具体的，该验证页面中可以携带脚本语言(javascript，js)代码，即，该终端通过接收该验证页面，以及运行该验证页面可以运行该js代码。其中，该验证页面中还可以携带有提示信息，以使得使用该终端的用户，在该终端显示该验证页面之后可以确定如何操作以进行验证，例如，该提示信息可以是：请您跟我一起说日语的“你好”、可按住下方按键并说出日语的“你好”等等，以使得该终端显示该验证页面之后，该用户可以确定需要执行何种的操作，其中，该验证页面的js代码中，还可以有调用该终端的传感器接口的js代码以及录音按键的js代码，以便后续执行采集该用户根据该验证字符输入的待识别音频等操作。

其中，该验证页面的界面可如图2所示，可见，在该验证界面中验证字符为法语字符“bonjour”、提示信息：请您跟我一起说法语的“你好”、提示信息：按住下方按键并说出法语的“你好”以及录音按键。

另外，由于在该验证页面中显示的验证字符可以是非汉语的语言，所以该终端采集的待识别音频可以是不同语言的语音。

进一步地，由于用户并不能完全的确定非汉语的语言如何发音，所以对于该验证页面显示的该验证字符来说，用户并不一定能够根据该验证字符输入对应的待识别音频，于是，在本申请中该验证页面还可携带有与该验证字符对应的标准发音，以及对应的播放按键的js代码，如图3所示。在图3所示的验证页面的界面中，可见，在该验证界面中验证字符为法语字符“bonjour”、提示信息：请您跟我一起说法语的“你好”、提示信息：按住下方按键并说出法语的“你好”、录音按键、以及播放按键。则该终端可通过监测用户对该播放按键的手势操作，播放该标准发音。于是，该终端采集的可以是用户根据播放的该标准发音输入的待识别音频。

更进一步地，由于该验证页面中可携带有录音按键的js代码、播放按键的js代码以及调用该终端的传感器接口的js代码，所以该终端可以监测用户针对该按键的操作，并当监测到用户对该按键的操作时，通过运行该验证页面的js代码，调用该终端的传感器接口以采集用户根据播放的该标准发音输入的该待识别音频。其中，该用户操作可以是点击手势操作、长按手势操作等等，本申请并不做具体限定，只要该终端通过监测用户操作，确定采集待识别音频即可，该传感器可以是该终端的麦克风。

s104：对所述待识别音频进行语音识别。

在本申请实施例中，当该终端采集了用户的输入的该待识别音频之后，该终端还可对该待识别音频进行语音识别，以便后续根据该语音识别的结果进行后续的操作。

具体的，由于通常语音识别所需要占用的资源较多，终端对语音进行识别的过程相对服务器进行语音识别的过程较慢，所以通常终端在需要进行语音识别时，可将待识别音频发送至语音识别服务器中进行语音识别，并接收该语音识别服务器返回的识别结果。同理，在本申请中，该终端也可将该待识别音频发送至语音识别服务器，以使得该语音识别服务器对该待识别音频进行语音识别，并接收该语音识别服务器返回的识别结果。

另外，由于现有的语音识别服务器通常仅能进行特定语言的识别，例如，对英语进行语音识别的语音服务器，无论接收到的音频对应的是哪国语音，该对英语进行语音识别的语音服务器输出的只能是英文的识别结果，同理对汉语进行语音识别的语音服务器，输出的语音识别结果也只能是汉语。

而由于在本申请步骤s101中，该验证页面中显示的验证字符可以是多种语言对应的字符，所以在步骤s102中该终端向该语音服务器发送的待识别音频也有较高概率的是对应于多种语言的音频，所以该语音识别服务器仅可识别出待识别音频对应于一种语言的文字。

于是，在本申请中，当该语音识别服务器可以是对汉语进行语音识别的服务器时，该语音识别服务器返回至该终端的识别结果，可以是根据中文语音发音对该待识别音频的识别结果，并且，该识别结果可以是中文字符。例如，假设待识别音频的发音为“buruhe”，对应于法语的“bonjou”，则该语音识别服务器并不会识别出法语“bonjou”，而是会识别出该待识别音频“buruhe”对应的中文，例如，“卜如河”，于是，该终端可以接收该语音识别终端返回的语音识别结果为“卜如河”。

也就是说，在本申请中，该语音识别服务器并没有识别出不同语种对应的文字，而是仅识别出不同语种的语音在中文中对应的文字。

需要说明的是，该语音识别服务器可以是单独的一台设备，如，专门用于进行语音识别的服务器，或者该语音识别服务器可以是由多台服务器组成的系统，如，分布式服务器，并且，在本申请中并不限定该语音识别服务器仅可用于进行语音识别，即，该语音识别服务器可以与步骤s101中的该业务服务器是相同的服务器，或者与该提供资源的服务器是相同的服务器，当然，该语音识别服务器、该业务服务器以及该提供资源的服务器也可以是不同服务器，本申请对此并不做具体限定。

s105:根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许调用所述资源。

在本申请实施例中，当该终端接收了该语音识别服务器返回的识别结果后，便可根据对该待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许调用该资源。而由于对于中文来说存在同音字的问题，所以对于相似发音，该语音识别服务器返回的识别结果对应的汉语字符可能存在不同，例如，“tong”这一发音，该语音识别服务器可能返回的是“同”，也可能是“铜”，但是“同”和“铜”是两个不同的中文字符，所以为了方便将该识别结果与该基准字符进行对比，该服务器还可以将该识别结果转换为英文字符，以进行对比。

具体的，由于在中文中每个词的发音是以单个字的发音组合而成的，并没有对应对每个词的中文拼音，而将两个字的中文拼音连在一起是无法对应出一个词发音的，所以在本申请中，该终端可以根据预存的中文字符与英文字符的对应关系，确定该识别结果中的各中文字符分别对应的英文字符，并与该验证页面中携带的每个基准字符对应的英文字符进行对，以确定识别结果的正确率。

首先，由于该终端需要对该识别结果的正确与否进行确定，以确定是否允许调用该资源，所以该终端需要该验证字符对应的正确“答案”以与该识别结果进行对比，于是，在本申请中，该业务服务器返回的该验证页面对应的js代码中可以携带有与该验证字符的发音对应的基准字符。

其中，该验证字符的发音对应的基准字符可以是英文字符，并且，由于后续该基准字符需要分别与该识别结果的中文字符对应的应为字符进行对比，所以该基准字符是对应于该验证字符的每个中文发音的中文字符，并以中文拼音的形式对应于每一个中文字符。例如，当该验证页面显示英文字符“hello”时，与该验证字符对应的基准字符可以是“ha”和“lou”，即，英语hello的发音对应于汉语发音的“哈”和“喽”的拼音，当该验证页面显示德文字符“gutentag”时，与该验证字符对应的基准字符可以是“gu”、“teng”、“ta”以及“ge”，即，德语gutentag的发音分别对应于汉语发音的“顾”、“疼”、“踏”以及“哥”的拼音，当该验证页面显示法语字符“bonjour”时，与该验证字符对应的基准字符可以是“ben”和“zhu”，即，法语bonjour的发音对应于汉语发音的“本”和“猪”的拼音等等。

其次，该终端可根据预存的中文字符与中文拼音的对应关系，确定该识别结果中的各中文字符分别对应的中文拼音，作为所述识别结果中的各中文字符分别对应的英文字符，即，该终端通过运行该验证页面的js代码，调用预先存储的中文字符与中文拼音的对应关系，并根据该中文字符与中文拼音的对应关系确定该识别结果对应的中文拼音，作为该识别结果对应的英文字符。

之后，该终端可以将该识别结果对应的该英文字符，与该基准字符对应的英文字符进行对比，确定该识别结果的正确率，并根据该正确率，确定是否允许调用该资源。

进一步地，由于中文拼音中还存在有发音音调，所以在本申请中，为了确定发音音调还可以通过在该待识别音频的识别结果后加入数字，以及在该基准字符对应的英文字符中加入数字以表示每一个字的音调，具体的，如一声至四声的“啊”可以分别标注为“a1”、“a2”、“a3”以及“a4”。

另外，由于在本申请中该验证页面携带有与该验证字符的发音对应的基准字符，该基准字符是该验证字符的发音对应的英文字符，所以该终端在将该识别结果对应的该英文字符与该基准字符进行对比时，可以是将该识别结果的每个中文字符对应的该英文字符，分别与该基准字符的每个英文字符进行对比。例如，假设该识别结果对应的英文字符分别为“bu”、“ru”、“he”，该验证字符为“bonjou”，与该验证字符对应的基准字符为“benzhu”，则该终端可将该“bu”、“ru”、“he”与该“ben”、“zhu”分别进行对比，确定该识别结果的正确率。

进一步地，确定该识别结果的正确率，可以采用与现有语音识别技术的正确率确定方式相同的方法，如，边界距离算法等，本申请对此不再赘述。

最后，该终端可以通过运行该验证页面中携带的js代码，判断该识别结果的正确率是否大于预设的阈值，当确定该正确率大于该预设的阈值时，该终端可以确定允许调用该资源，并发送该资源调用的指令，当确定该正确率不大于该预设的阈值时，该终端可以确定不允许调用该资源，并不发送该资源调用的指令，并显示错误信息。

另外，由于通常资源存储于单独的设备中，例如，数据库、提供资源的服务器等，所以该终端在确定发送该资源调用的指令时，可根据预设的调用地址，向该预设的调用地址发送资源调用的指令，其中，该调用地址可以是该数据库、提供资源的服务器等设备的地址。

需要说明的是，该提供资源的服务器与该业务服务器以及该语音识别服务器，可以是相同的服务器，也可以是不同服务器，本申请对此不做具体限定。

通过如图1所示的资源调用的方法，无论是终端还是服务器在接收到资源调用请求后，均可以根据该资源调用请求，确定显示的验证字符的验证页面，该验证字符可以是任一语种对应的字符，并且，由于通常用户调用资源时需要确定是否允许调用资源，所以该验证页面可以发送至用户使用的该终端中，以使得该终端可以显示该验证页面以及该验证页面上的该验证字符，进一步地，由于该验证字符可以是任一语种的对应的字符，所以该验证页面中还可以携带有该验证字符的标准发音的音频文件，以使得通过播放该标准发音，采集用户根据该验证字符的标准发音输入的待识别音频(即，通过播放该标准发音，使用户根据该标准发音，作为该终端采集的该用户输入的待识别音频)，最后通过对该待识别音频进行语音识别，确定该待识别音频的识别结果与针对该验证字符预设的基准字符比对的正确率，确定是否允许调用该资源。可见，在对该资源是否允许调用进行确定时，用户无需再手动输入字符口令，而只需跟读标准发音即可，即节省了输入字符所需要的时间，使得用户操作变得简便，提高了资源调用时的效率。

另外，在本申请中，该语音识别服务器可以是用于对任何语音进行语音识别的服务器，并且，由于一般情况下语音识别服务器是对哪种语言进行语音识别的，则该语音是被服务器返回的识别结果就是哪种语言的字符，所以在本申请中，该语音识别服务器可以返回任一语种对应的字符，当然，则在本申请中，该业务服务器返回至该终端的验证页面中携带的针对该验证字符预设的该基准字符，也同样可以是该语音识别服务器可以返回任一语种对应的字符的发音对应的语种的字符。

当然，由于大部分语种的发音均可以通过英文字符表示，所以通常该基准字符可以是英文字符，本申请对此并不做具体限定。

另外，在本申请中，由于通常用户需要先登录自己持有的账户，再执行业务，所以当该终端向该业务服务器发送该资源调用请求时，该终端也可以是通过已登录的账户向该业务服务器发送该资源调用请求，于是，该业务服务器在接收到该资源调用请求之后，还可以根据该账户确定该账户对应的账户信息，并根据该账户信息中的该用户的国籍信息，进一步确定该用户的国际信息对应的语种。例如，该用户的国籍信息为美利坚合众国，则该业务服务器可以确定该用户的国籍信息对应的语种为英语，而若该用户的国际信息为中华人民共和国，则该业务服务器可以确定该用户的国籍信息对应的语种为汉语。

于是，该业务服务器在确定该验证页面携带的该验证字符时，就可以根据该用户的国籍对应的语种，确定非该用户的国籍对应的语种的其他语种，作为该验证字符对应的语种，例如，当确定该用户的国籍信息对应的语种为英语时，则该验证字符为非英语的其他语种对应的字符，如，法文字符、德文字符、中文字符等等。

进一步地，由于属于同一国籍但是不同地区的用户所使用的语言可能存在不同，例如，国籍为加拿大的用户，若该用户生活在魁北克省，则该用户有较高几率使用法语作为日常生活使用的语言，而若该用户生活在渥太华市，则该用户有较高几率使用应用作为日常生活使用的语言，所以在本申请中，该业务服务器还可以进一步确定该用户的出生地址、生活地区等账户信息，确定该用户的常用语言对应的语种，并确定非该用户的常用语言对应的语种的其他语种，作为该验证字符对应的语种，则该验证页面中显示的可以是该用户不常用的语种对应的字符。

更进一步地，也可由该终端根据发送该资源调用请求的用户的账户信息，确定该用户的国籍信息，并采用与上述过程相同的方法，确定显示的验证字符。其中，该用户信息可以存储与该终端中，也可存储于该服务器中，并由该终端从该服务器获取，并且该验证字符对应的语种也可由该终端确定，即，本申请并不限定由服务器确定该验证字符为除该用户对应的语种以外，其他语种对应的验证字符，具体是通过终端还是服务器确定该验证字符对应的语种，可由工作人员根据实际应用的需要进行设置。

另外，基于图1所示的资源调用过程，本申请提供一种资源调用的详细流程，如图4所示。

图4为本申请实施例提供的资源调用的详细过程，包括：

s201：终端接收资源调用请求。

s202：该终端转发资源调用请求至业务服务器。

s203：该业务服务器返回验证页面至该终端。

s204：该终端显示该验证页面中的验证字符。

s205：该终端监测用户的播放操作，播放该验证字符对应的标准发音。

s206：该终端监测该用户的录音操作，采集该用户根据该验证字符输入的待识别音频。

s207：该终端将该待识别音频发送至语音识别服务器。

s208：该语音识别服务器返回识别结果至该终端。

s209：该终端根据该识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源。

其中，该业务服务器以及该语音是被服务器可以是同一设备，该播放操作以及该录音操作可以是用户的手势操作，并且，该播放操作以及该录音操可以相同(如，均为点击手势操作)，或者该播放操作以及该录音操可以不相同(如，播放操作为点击手势操作，该录音操作为长按手势操作)，本申请对此不做具体限定，可由工作人员根据实际应用的需要进行设置。

另外，由于步骤s101、s104以及s105可以由该终端执行，也可由预设的服务器执行，所以在本申请中也可由服务器接收终端发送的资源调用请求，并向该终端返回该验证页面，以使得该终端通过运行该验证页面显示该验证字符，可由该服务器将该识别结果转换为英文字符，并与该验证字符对应的基准字符进行对比，确实该识别结果的正确率，以根据该识别结果的正确率，确定是否允许调用该资源，即，可以不由该终端运行该验证页面的js代码来执行各步骤，也可由服务器执行上述步骤，本申请对比不再赘述。

在本申请的另一实施例中，该调用资源的请求，可以是获取红包请求，该验证页面可以是抢红包的页面，该资源可以是该获取红包请求中该红包中的余额，如图5所示。

图5为本申请实施例提供的一种资源调用的过程，具体包括以下步骤：

s301：该终端首先可以接收获取红包请求，并将该获取红包请求发送至业务服务器。

s302：接收该业务服务器返回的该抢红包的页面，并通过运行该抢红包的页面，显示该验证字符，其中，该验证字符可以是任一语种对应的字符。

s303：该终端可通过监测用户的操作，播放该验证字符对应的标准发音，并采集用户根据该验证字符的标识发音输入的待识别音频。

s304：将该待识别音频发送至该语音识别服务器，进行语音识别。

s305：通过接收该语音识别服务器返回的识别结果，与针对该验证字符预设的基准字符，确定该识别结果的正确率，并根据该正确率确定是否允许调用该红包内的余额。

进一步地，通常当该终端确定该识别结果的正确率大于预设的阈值时，该终端可确定允许调用该红包内的余额，但是由于红包内的余额也是可以限制调用次数的，例如，设置该红包内余额可被领取的次数为5次，则只有5个终端可以调用该红包内的余额，而其他终端无法调用到该红包内的余额，并接收返回的错误信息，如，“红包已经被抢完了！”，其中，该红包可被领取的次数可有工作人员根据实际应用的需要进行设置，本申请并不做具体限定。

另外，在图1、图4以及图5所示的资源调用过程中，本申请并不限定，该终端必须通过运行该验证页面中携带的js代码执行各步骤，当然该终端也可通过预先接收整合有该js代码的应用程序，或者接收该js代码对应的sdk包的应用程序，并通过运行整合有该js代码的应用程序或者接收该js代码对应的sdk包的应用程序执行各步骤。

在本申请提供的另一实施例中，该验证页面也可以不显示该验证字符，而是直接播放该验证字符对应的标准发音，则该资源调用的过程可如图6所示。

图6为本申请实施例提供的一种资源调用的过程，具体包括以下步骤：

s601：接收资源调用请求。

s602：根据所述资源调用请求，播放标准发音。

s603：采集用户根据播放的所述标准发音输入的待识别音频。

s604：对所述待识别音频进行语音识别。

s605：根据对所述待识别音频的识别结果以及针对所述标准发音预设的基准字符，确定是否允许调用所述资源。

其中，在步骤s602中，该终端可接收该业务服务器返回的验证页面，该验证页面中可以携带有该标准发音、该播放按键对应的js代码、该录音按键对应的js代码，以使得用户可以通过对该播放按键执行手势操作，播放该标准发音，其界面可如图7所示。在图7中可见，该验证页面中并没有显示如图2或者图3中显示的验证字符，而仅显示提示信息、播放按键以及录音按键，则用户可根据该提示信息的提示，播放该标准发音，其中，该提示信息包括：按住下方按键并说出法语的“你好”，以及点击播放法语的“你好”。

于是，进一步地在步骤s603中，该终端可以采集该用户该局播放的所述标准发音输入的待识别音频。

进一步地，该验证页面中还可以携带有针对该标准发音预设的基准字符，以便在步骤s605中，根据该识别结果以及该基准字符，确定该识别结果的正确率，并根据该正确率确定是否允许调用该资源。例如，该标准发音为法语“bonjou”的标准发音，则该基准字符可以是“ben”和“zhu”，于是该终端将该识别结果的每个中文字符对应的该英文字符，分别与该基准字符的英文字符进行对比。

更进一步地，在步骤s602中该终端在接收到该验证页面之后，通过运行该验证页面的代码，直接播放该标准发音，即，无需用户操作该验证页面可直接播放该标准发音。当然，该标准发音可以自动播放的次数，播放之间的时间间隔也可由工作人员根据实际应用的需要进行设置，本申请对此并不做具体限定。当然，由于用户可能需要对该标准发音返回播放时，所以该终端可以通过监测用户对该播放按键的手势操作，重播该标准发音。

需要说明的是，本申请实施例所提供方法的各步骤的执行主体均可以是同一设备，或者，该方法也由不同设备作为执行主体。比如，步骤s101和步骤s102的执行主体可以为设备1，步骤s103的执行主体可以为设备2；又比如，步骤s101的执行主体可以为设备1，步骤s102和步骤s103的执行主体可以为设备2；等等，即，该服务器可以是由多台设备组成的分布式服务器。同时，本申请实施例所提供的方法的各步骤的执行主体也不限定为服务器，也可以是终端，该终端可以是手机、个人电脑、平板电脑等设备。

以图1提供的资源调用过程为例，步骤s101可由服务器接收资源调用请求，步骤s102可由终端根据该资源调用请求，显示验证字符，步骤s103可由该终端采集用户根据该验证字符输入的待识别音频，步骤s104可由该服务器对该待识别音频进行语音识别，步骤s105可由该服务器根据对该待识别音频的识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源，或者；

步骤s101可由该终端接收资源调用请求，步骤s102可由终端根据该资源调用请求，显示验证字符，步骤s103可由该终端采集用户根据该验证字符输入的待识别音频，步骤s104可由该服务器对该待识别音频进行语音识别，步骤s105可由该服务器根据对该待识别音频的识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源，又或者；

步骤s101可由该终端接收资源调用请求，步骤s102可由终端根据该资源调用请求，显示验证字符，步骤s103可由该终端采集用户根据该验证字符输入的待识别音频，步骤s104可由该服务器对该待识别音频进行语音识别，步骤s105可由该终端根据对该待识别音频的识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源，又或者；

步骤s101可由该服务器接收资源调用请求，步骤s102可由终端根据该资源调用请求，显示验证字符，步骤s103可由该终端采集用户根据该验证字符输入的待识别音频，步骤s104可由该终端对该待识别音频进行语音识别，步骤s105可由该服务器根据对该待识别音频的识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源，又或者；

步骤s101可由该终端接收资源调用请求，步骤s102可由终端根据该资源调用请求，显示验证字符，步骤s103可由该终端采集用户根据该验证字符输入的待识别音频，步骤s104可由该终端对该待识别音频进行语音识别，步骤s105可由该服务器根据对该待识别音频的识别结果以及针对该验证字符预设的基准字符，确定是否允许调用该资源，等等。

需要说明的是，该步骤s102中显示该验证字符可由该终端来执行，但是根据该资源调用请求，确定该验证字符的过程，既可由该终端来进行，也可由该服务器来进行，本申请对此并不做具体限定。

可见，在本申请提供的资源调用过程中，各步骤的执行主体可以根据实际应用的需要进行设置，可以是终端也可以是服务器，并且正如前述的，该服务器可以是同一个服务器执行多种操作，或者是由不同的服务器分别执行不同的操作，进一步地，该服务器可以是单独的一台设备，也可以是分布式服务器。需要说明的是，该服务器是单独的设备还是分布式服务器与该服务器是执行多种操作还是执行一种操作并不冲突，即，该服务器可以是一台设备并执行多种操作，或者该服务器是分布式服务器并执行一种操作等等。

基于图1所示的资源调用的过程，本申请实施例还对应提供一种资源调用的装置，如图8所示。

图8为本申请实施例提供的一种资源调用的装置的结构示意图，包括：

接收模块401，接收资源调用请求；

显示模块402，根据所述资源调用请求，显示验证字符；

采集模块403，采集用户根据所述验证字符输入的待识别音频；

识别模块404，对所述待识别音频进行语音识别；

对比调用模块405，根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许调用所述资源。

所述显示模块402，将所述资源调用请求发送至服务器，接收所述服务器返回的验证页面，并显示所述验证页面中携带的验证字符。

所述验证字符为至少一种语种对应的字符。

所述采集模块403，接收所述服务器返回的验证页面，以及所述验证页面携带的所述验证字符对应的标准发音，播放所述标准发音，采集用户根据播放的所述标准发音输入的待识别音频。

所述识别模块404，将所述待识别音频发送至服务器，以使得所述服务器对所述待识别音频进行语音识别，接收所述服务器返回的识别结果。

所述识别结果为中文字符，所述基准字符为英文字符，所述对比调用模块405，根据预存的中文字符与英文字符的对应关系，确定所述识别结果中的各中文字符分别对应的英文字符，将所述识别结果对应的所述中文拼音，与所述基准字符对应的英文字符进行对比，确定所述识别结果的正确率，根据所述正确率，确定是否允许调用所述资源。

所述对比调用模块405，根据预存的中文字符与中文拼音的对应关系，确定所述识别结果中的各中文字符分别对应的中文拼音，作为所述识别结果中的各中文字符分别对应的英文字符。

具体的，上述如图8所示的资源调用的装置可以位于终端中，该终端具体可以是手机、平板电脑、个人电脑等设备。

基于图6所示的资源调用的过程，本申请实施例还对应提供一种资源调用的装置，如图9所示。

图9为本申请实施例提供的一种资源调用的装置的结构示意图，包括：

接收模块701，接收获取红包请求；

播放模块702，根据所述获取红包请求，播放标准发音；

采集模块703，采集用户根据播放的所述标准发输入的待识别音频；

识别模块704，对所述待识别音频进行语音识别；

对比调用模块705，根据对所述待识别音频的识别结果以及针对所述标准发音预设的基准字符，确定是否允许获取所述红包。

所述播放模块702，将所述资源调用请求发送至业务服务器，接收所述业务服务器返回的验证页面，并播放所述验证页面中携带的标准发音。

所述标准发音为至少一种语种对应的音频。

所述识别模块704，将所述待识别音频发送至语音识别服务器，以使得所述语音识别服务器对所述待识别音频进行语音识别，接收所述语音识别服务器返回的识别结果。

所述识别结果为中文字符，所述基准字符为英文字符，所述对比调用模块705，根据预存的中文字符与英文字符的对应关系，确定所述识别结果中的各中文字符分别对应的英文字符，将所述识别结果对应的所述中文拼音，与所述基准字符对应的英文字符进行对比，确定所述识别结果的正确率，根据所述正确率，确定是否允许调用所述资源。

所述对比调用模块705，根据预存的中文字符与中文拼音的对应关系，确定所述识别结果中的各中文字符分别对应的中文拼音，作为所述识别结果中的各中文字符分别对应的英文字符。

具体的，上述如图9所示的资源调用的装置可以位于终端中，该终端具体可以是手机、平板电脑、个人电脑等设备。

基于图5所示的资源调用的过程，本申请实施例还对应提供一种资源调用的装置，如图10所示。

图10为本申请实施例提供的一种资源调用的装置的结构示意图，包括：

接收模块501，接收获取红包请求；

显示模块502，根据所述获取红包请求，显示验证字符；

采集模块503，采集用户根据所述验证字符输入的待识别音频；

识别模块504，对所述待识别音频进行语音识别；

对比调用模块505，根据对所述待识别音频的识别结果以及针对所述验证字符预设的基准字符，确定是否允许获取所述红包。

所述显示模块502，将所述资源调用请求发送至业务服务器，接收所述业务服务器返回的验证页面，并显示所述验证页面中携带的验证字符。

所述验证字符为至少一种语种对应的字符。

所述采集模块503，接收所述业务服务器返回的验证页面，以及所述验证页面携带的所述验证字符对应的标准发音，播放所述标准发音，采集用户根据播放的所述标准发音输入的待识别音频。

所述识别模块504，将所述待识别音频发送至语音识别服务器，以使得所述语音识别服务器对所述待识别音频进行语音识别，接收所述语音识别服务器返回的识别结果。

所述识别结果为中文字符，所述基准字符为英文字符，所述对比调用模块505，根据预存的中文字符与英文字符的对应关系，确定所述识别结果中的各中文字符分别对应的英文字符，将所述识别结果对应的所述中文拼音，与所述基准字符对应的英文字符进行对比，确定所述识别结果的正确率，根据所述正确率，确定是否允许调用所述资源。

所述对比调用模块505，根据预存的中文字符与中文拼音的对应关系，确定所述识别结果中的各中文字符分别对应的中文拼音，作为所述识别结果中的各中文字符分别对应的英文字符。

具体的，上述如图10所示的资源调用的装置可以位于终端中，该终端具体可以是手机、平板电脑、个人电脑等设备。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(programmablelogicdevice,pld)(例如现场可编程门阵列(fieldprogrammablegatearray，fpga))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片pld上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logiccompiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(hardwaredescriptionlanguage，hdl)，而hdl也并非仅有一种，而是有许多种，如abel(advancedbooleanexpressionlanguage)、ahdl(alterahardwaredescriptionlanguage)、confluence、cupl(cornelluniversityprogramminglanguage)、hdcal、jhdl(javahardwaredescriptionlanguage)、lava、lola、myhdl、palasm、rhdl(rubyhardwaredescriptionlanguage)等，目前最普遍使用的是vhdl(very-high-speedintegratedcircuithardwaredescriptionlanguage)与verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(applicationspecificintegratedcircuit，asic)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：arc625d、atmelat91sam、microchippic18f26k20以及siliconelabsc8051f320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(ram)和/或非易失性内存等形式，如只读存储器(rom)或闪存(flashram)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带，磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitorymedia)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白，本申请的实施例可提供为方法、系统或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：项臻;方莉娜;周苏强;刘阳;陆殷
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：可预览画面的视讯档案回放系统及其方法与电脑程式产品与流程
上一篇：图像评价装置以及图像评价方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。