人机识别的方法、装置和系统与流程

文档序号：16047178发布日期：2018-11-24 10:58阅读：527来源：国知局

本发明涉及互联网技术应用领域，具体而言，涉及一种人机识别的方法、装置和系统。

背景技术

目前现有技术中常用行为、生物特征作为人机识别方案，受限于操作平台及用户体验限制，能够采集到的用户行为数据有严重限制，从采集到的行为数据提炼出的行为生物特征能够带来的信息增益受到限制。

目前针对行为验证码原理来进行人机识别，其中人机识别用于区分当前操作是否为机器发生还是人为操作发生，在现有技术中在做人机识别的过程中，首先，采集用户行为数据；第二，提取行为数据中的行为特征；最后依据该行为特征进行人机判断，如图1所示，图1是现有技术中人机识别流程示意图。但是现有人机识别存在如下缺陷：

第一，不同终端web、pc、h5、andriod、ios等采集行为特征各不相同。例如，在同一个人手机上，用户操作虚拟键盘速度与在物理键盘敲击速度会不同，使用鼠标滑动与直接在手机屏幕进行轨迹滑动速度、停顿也会不一样。

第二，在有限动作集下，行为特征的唯一度不够强。当唯一性不够强，攻击者使用相同或者非常接近数据进行重放攻击时，人机识别系统由于无法识别导致人机识别系统无法拒绝机器的多次请求攻击。

第三，在有限动作集下，行为特征的稳定性没有得到过确认。并且，由于行为特征模拟成本较低，根据行为生物特征，很难逆向定位自然人，导致攻击者肆无忌惮。

以微信声纹锁为例，在微信声纹锁启动设置时，微信客户端显示一串字符，并显示提示，该提示指示客户按压屏幕指示处然后朗读字符，微信客户端通过录取用户朗读字符的声纹上报服务器，由服务器生成该用户对应的声纹锁，以便后期用户登录微信时通过该声纹锁登录微信。

由上可知，如果通过录音设备录制用户声音样本，若攻击者使用该声音样本登录微信，在收到一串验证字符后，通过播放器朗读验证字符对应的用户声音样本，则微信客户端也会由于无法识别是自然人操作还是机器操作，导致攻击者通过使用声音样本登录微信。

针对上述由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的问题，目前尚未提出有效的解决方案。

技术实现要素：

本发明实施例提供了一种人机识别的方法、装置和系统，以至少解决由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的技术问题。

根据本发明实施例的一个方面，提供了一种人机识别的系统，包括：终端，用于采集用户声纹信息和行为数据信息；服务器，与终端连接，用于依据预存模型对终端上传的用户声纹信息和行为数据信息进行识别，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

可选的，终端包括：显示屏幕、天线和传感器组，其中，显示屏幕，用于显示待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；传感器组，用于采集用户依据待验证声音信息对应的用户声纹信息，和待验证行为信息对应的行为数据信息；天线，与传感器组连接，用于将用户声纹信息和行为数据信息发送至服务器。

可选的，服务器包括：存储器和处理器，其中，存储器，用于存储预存模型；处理器，用于依据存储模型识别用户声纹信息和行为数据信息，判断用户声纹信息和行为数据信息是否与预存模型中的目标对象相同，在判断结果为是的情况下，若目标对象为自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若目标对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人，并告警。

进一步地，可选的，预存模型包括：自然人模型和机器人模型，其中，自然人模型，用于解析用户声纹信息和行为数据信息，分别判断用户声纹信息是否满足预设自然人声纹特征，以及判断行为数据信息是否满足预设自然人行为特征，在用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，接收终端发送的所有请求；机器人模型，用于解析用户声纹信息和行为数据信息，分别判断用户声纹信息是否满足预设机器人声纹特征，以及判断行为数据信息是否满足预设机器人行为特征，在用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，拒绝处理终端发送的所有请求。

可选的，处理器，还用于在判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，判断在预设时间内是否接收到操作对象对应的用户声纹信息和行为数据信息，在判断结果为在预设时间内接收到操作对象对应的用户声纹信息和行为数据信息的情况下，拒绝处理终端发送的所有请求。

可选的，服务器还包括：报警器，其中，报警器，与处理器连接，用于在判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，输出告警信号，以使得处理器拒绝处理终端发送的所有请求。

根据本发明实施例的另一方面，还提供了一种人机识别的方法，包括：接收终端发送的验证请求；向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

可选的，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同包括：通过预存模型解析用户声纹信息和行为数据信息，得到用户声纹信息中的用户声纹特征、用户朗读内容信息和用户行为特征；判断述用户朗读内容信息是否与待验证信息中的待验证声音信息相同，以及判断用户行为特征是否与待验证信息中的待验证行为信息相同；在目标对象包括自然人和机器人，且在用户朗读内容信息和用户行为特征均与待验证声音信息和待验证行为信息相同的情况下，通过预存模型判断用户声纹特征是否为自然人声纹特征。

进一步地，可选的，用户声纹特征包括：用户声音频谱、用户声音响度和音量；用户行为特征包括：触碰轨迹和触碰频率。

可选的，依据目标对象的类型输出对应的判断结果包括：若判断用户声纹特征和用户行为特征所属的操作对象为自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若判断用户声纹特征和用户行为特征所属的操作对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人。

进一步地，可选的，在判断用户声纹特征和用户行为特征所属的操作对象为自然人之后，方法还包括：在用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，判断在预设时间内是否接收到操作对象对应的用户声纹信息和行为数据信息；在判断结果为在预设时间内接收到操作对象对应的用户声纹信息和行为数据信息的情况下，拒绝处理终端发送的验证请求；在判断结果为在预设时间内未接收到操作对象对应的用户声纹信息和行为数据信息的情况下，处理终端发送的验证请求。

可选的，在输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人之后，方法还包括：输出告警信号，并拒绝处理终端发送的验证请求。

根据本发明实施例的另一方面，还提供了另一种人机识别的方法，包括：向服务器发送验证请求；接收服务器依据验证请求返回的待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息；向服务器发送用户声纹信息和行为数据信息。

可选的，采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息包括：采集用户朗读待验证声音信息时的语音内容、用户声音频谱、用户声音响度和音量；采集用户只需待验证行为信息时的触碰轨迹和触碰频率。

根据本发明实施例的又一方面，还提供了一种人机识别的装置，包括：第一接收模块，用于接收终端发送的验证请求；发送模块，用于向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；第二接收模块，用于接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；识别模块，用于判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

根据本发明实施例的又一方面，还提供了另一种人机识别的装置，包括：第一发送模块，用于向服务器发送验证请求；接收模块，用于接收服务器依据验证请求返回的待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；采集模块，用于采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息；第二发送模块，用于向服务器发送用户声纹信息和行为数据信息。

根据本发明实施例的再一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行上述人机识别的方法。

根据本发明实施例的再一方面，还提供了一种处理器，处理器用于运行程序，其中，程序运行时执行上述人机识别的方法。

在本发明实施例中，通过终端，用于采集用户声纹信息和行为数据信息；服务器，与终端连接，用于依据预存模型对终端上传的用户声纹信息和行为数据信息进行识别，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人，达到了防护机器请求攻击的目的，从而实现了提升人机识别准确率的技术效果，进而解决了由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是现有技术中人机识别流程示意图；

图2是根据本申请实施例一的人机识别的系统的结构示意图；

图3是根据本申请实施例一的人机识别的系统的执行流程图；

图4是本申请实施例的一种人机识别的方法的服务器的硬件结构框图

图5是根据本申请实施例二的人机识别的方法的流程图；

图6是根据本申请实施例三的人机识别的方法的流程图；

图7是根据本申请实施例三的人机识别的方法中终端显示的示意图；

图8是根据本申请实施例四的人机识别的装置的结构示意图；

图9是根据本申请实施例五的人机识别的装置的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本申请涉及的技术名词

重放攻击：在利用生物特征的人机识别场景中，攻击者可以通过某种工具(如按键精灵)等录制正常人数据，然后进行多次攻击；

唯一性：不同人的生物特征具有足够的差异性；

稳定性：同一个人的在不同时候的生物特征变动很小。

实施例1

本申请提供了如图2所示的人机识别的系统。图2是根据本申请实施例一的人机识别的系统的结构示意图，如图2所示，该人机识别的系统包括：终端22和服务器24，

终端22，用于采集用户声纹信息和行为数据信息；服务器24，与终端22连接，用于依据预存模型对终端上传的用户声纹信息和行为数据信息进行识别，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

具体的，这里本申请提供的人机识别的系统中终端22可以包括：智能手机(例如：适用ios系统、android系统或windows系统的手机)、平板电脑、笔记本电脑、个人电脑(personalcomputer，简称pc)、掌上商务或智能穿戴设备(例如谷歌眼镜、智能手表、增强现实ar设备或虚拟现实vr设备)等具备通信及数据处理、存储能力的移动终端。服务器24通过有线或无线的方式与终端22连接，建立通信链路。

其中，本申请实施例提供的人机识别的系统以适用于身份验证环境为例进行说明，终端22以智能手机(后续简称为：手机)为例进行说明，在用户使用手机登录app时，在输入账号和密码待app验证的过程中，若账号和密码不一致，则app显示登录失败，在用户多次录入账号密码均登录失败的情况下，app显示密码找回功能，提示用户通过密码找回的方式重新登录，当手机检测到用户点击密码找回功能项后，手机向服务器发送验证请求，服务器在接收验证请求后，向手机发送待验证信息，其中，该待验证信息包括：待验证声音信息和待验证行为信息；手机在接收到该待验证信息之后，通过手机中与显示屏连接的传感器和麦克风采集用户声纹信息和行为数据信息，并在采集用户声纹信息和行为数据信息之后，将用户声纹信息和行为数据信息上传至服务器，以使得服务器依据用户声纹信息和行为数据信息进行识别，判断该用户声纹信息和行为数据信息为自然人操作产生，或机器人操作产生；若为机器人操作产生，则禁止手机的验证请求，密码找回流程结束；而当识别到的为自然人操作产生时，接收手机的验证请求，用户进入密码重置流程，并通过密码重置，重新登陆app。

例如，手机接收到的待验证信息包括：字符串123456以及“按住当前标亮区域，朗读字符串，并在朗读完毕后将标亮区域的滑块由左向右滑动”，此时，手机的麦克风检测是否采集到声音，且检测手机显示屏中显示标亮区域中的滑块是否由左向右滑动；当手机显示屏检测到按压标亮区域时，麦克风检测接收用户朗读123456的声音；并在麦克风检测用户朗读123456结束之后，手机显示屏检测到标亮区域的滑块由左向右滑动，手机将采集到的“123456”声音信息和“按压标亮区域，以及手机显示屏检测到标亮区域的滑块由左向右滑动”的行为数据信息上传至服务器，服务器通过预存模型识别“123456”声音信息和“按压标亮区域，以及手机显示屏检测到标亮区域的滑块由左向右滑动”的行为数据信息，判断采集到的“123456”声音信息和“按压标亮区域，以及手机显示屏检测到标亮区域的滑块由左向右滑动”的行为数据信息是否为机器人发送，其中，本实施例中目标对象包括：自然人和机器人，当检测到“123456”声音信息和“按压标亮区域，以及手机显示屏检测到标亮区域的滑块由左向右滑动”的行为数据信息为自然人操作产生时，接收手机发送的验证请求；当检测到“123456”声音信息和“按压标亮区域，以及手机显示屏检测到标亮区域的滑块由左向右滑动”的行为数据信息为机器人操作产生时，终止处理该手机发送的验证请求，并拒绝该手机后续发送的所有请求。从而避免重放攻击的发生。

需要说明的是，本实施例之所以要通过声纹信息和行为信息一起识别是由于每个人声纹的唯一性，由于声纹的不可变以及唯一性确定了声纹验证的稳定性，并且通过行为数据的稳定性的综合考虑提升验证稳定性，且由于行为特征容易被机器人模仿产生，通过声纹特征和行为特征的双重标准，对终端侧上传的用户声纹信息和行为数据信息进行识别，提升了人机识别的准确率。

并且值得说明的是，本实施例中在服务器侧，不需要保存任何用户的声纹历史记录，仅通过预存模型的学习能力，通过获取自然人的声纹特征和机器人的声纹特征识别接收到的用户声纹信息，并且通过预存模型中的行为特征识别自然人好机器人的行为特征，减轻了服务器的存储压力，节约了服务器的系统资源，提升了运算效率。

这里本申请上述示例仅以实现本实施例通过的人机识别的系统为准，具体不做限定。

在本申请实施例中，通过终端，用于采集用户声纹信息和行为数据信息；服务器，与终端连接，用于依据预存模型对终端上传的用户声纹信息和行为数据信息进行识别，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人，达到了防护机器请求攻击的目的，从而实现了提升人机识别准确率的技术效果，进而解决了由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的技术问题。

具体的，在实现人机识别的过程中，本实施例提供的人机识别的系统具体如下：

可选的，终端22包括：显示屏幕、天线和传感器组，其中，显示屏幕，用于显示待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；传感器组，用于采集用户依据待验证声音信息对应的用户声纹信息，和待验证行为信息对应的行为数据信息；天线，与传感器组连接，用于将用户声纹信息和行为数据信息发送至服务器24。

具体的，仍旧以上述示例为例进行说明，以密码找回为例，在用户使用终端22发起密码找回的情况下，终端22向服务器24发送密码找回请求，通过天线接收服务器24发送的待验证信息，终端22的传感器组采集用户依据待验证信息产生的用户声纹信息和行为数据信息，最后由天线将将用户声纹信息和行为数据信息发送至服务器24。

其中，在本实施例中终端22的传感器组可以包括：麦克风、压力传感器、轨迹传感器、陀螺仪等传感器，用于采集用户声音以及用户的行为。

可选的，服务器24包括：存储器和处理器，其中，存储器，用于存储预存模型；处理器，用于依据存储模型识别用户声纹信息和行为数据信息，判断用户声纹信息和行为数据信息是否与预存模型中的目标对象相同，在判断结果为是的情况下，若目标对象为自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若目标对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人，并告警。

具体的，在本实施例提供的人机识别的系统中，服务器24包括存储器和处理器，其中，存储器存储预存模型，处理器通过该预存模型识别终端上传的用户声纹信息和行为数据信息，并由预存模型识别用户声纹信息和行为数据信息所属操作对象是否为预存模型中的目标对象，如果该操作对象是预存模型中的目标对象，如果该目标对象是自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若目标对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人，并告警。

具体的，在预存模型中设立有自然人模型和机器人模型，自然人模型存储有自然人声纹特征以及自然人行为特征，同理，机器人模型中存储有机器人声纹特征和机器人行为特征，在识别终端22上传的用户声纹信息和行为数据信息的过程中，服务器24通过该预存模型中的自然人模型和机器人模型别终端22上传的用户声纹信息和行为数据信息是由自然人产生还是由机器人产生，同时在得到判断结果之后，对应自然人和机器人配置有对应的处理策略，例如，在用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，接收终端发送的所有请求；在用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，拒绝处理终端发送的所有请求。

具体的，为了避免机器录制用户(自然人)的声音样本，通过声音样本仿造用户声纹信息的情况发生，由于如果是机器人发起请求，机器人在短时间内能够发起多次请求(例如1分钟内发送上千条请求，此时服务器24会认为有攻击者发起重放攻击)，因此服务器24的处理器在接收到终端22上传的用户声纹信息和行为数据信息之后，除了识别该用户声纹信息和行为数据信息为自然人产生之外，还会检测在预设时间内是否多次接收到该终端22发送的请求，或，在处理器的历史记录中有该自然人的识别记录，如果存在该自然人的识别记录或检测到在短时间内收到了多次该终端22发送的请求，则认为该终端22发送的请求为机器人发起的，对应的将拒绝处理该终端发送的所有请求。其中，本实施例中的短时间可以包括1分钟内的检测，本实施例仅以1分钟为例进行说明，以实现本实施例提供的人机识别的系统为准，具体不做限定。

可选的，服务器24还包括：报警器，其中，报警器，与处理器连接，用于在判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，输出告警信号，以使得处理器拒绝处理终端发送的所有请求。

具体的，本实施例提供的服务器24中还包括报警器，该报警器与处理器连接，在判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，输出告警信号，并将该终端22录入告警记录，以使得在后续接收到该终端22发送的请求时，服务器24拒绝处理该终端发送的请求。

综上，本实施例提供的人机识别的系统，如图3所示，图3是根据本申请实施例一的人机识别的系统的执行流程图。

step1，服务器发送待验证信息，该待验证信息用于指示用户朗读待验证信息中的字符串，以及依据待验证信息执行对应行为操作，该待验证信息可以包括：数字、字母、文字、图片或音频中的一种或至少两种的组合。

step2,终端的客户端依据该待验证信息采集用户的音频和行为数据，并将用户的音频和行为数据发送至服务器；

step3，服务器判断用户的音频和行为数据(即，本实施例中的用户声纹信息和行为数据信息)是否符合生物特征(即，本实施例中预存模型存储的自然人模型和机器人模型，通过上述模型判断判断用户的音频和行为数据是否符合生物特征)；在判断结果为是的情况下执行step4，在判断结果为否的情况下执行step5；

step4，判断该声纹是否符合生物特征，在判断结果为是的情况下，执行step6,在判断结果为否的情况下执行step5；

step5，该请求为机器人发起的请求，属于攻击请求；

step6，判断是否为重放攻击，在判断结果为是的情况下，执行step7,在判断结果为否的情况下执行step5；

step7,服务器判定该请求为正常请求。

实施例2

根据本申请实施例，还提供了一种人机识别的方法实施例，需要说明的是，在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行，并且，虽然在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤。

本申请实施例一所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在服务器上为例，图4是本申请实施例的一种人机识别的方法的服务器的硬件结构框图。如图4所示，服务器40可以包括一个或多个(图中仅示出一个)处理器402(处理器402可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)、用于存储数据的存储器404、以及用于通信功能的传输模块406。本领域普通技术人员可以理解，图4所示的结构仅为示意，其并不对上述电子装置的结构造成限定。例如，服务器40还可包括比图4中所示更多或者更少的组件，或者具有与图4所示不同的配置。

存储器404可用于存储应用软件的软件程序以及模块，如本申请实施例中的人机识别的方法对应的程序指令/模块，处理器402通过运行存储在存储器404内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的应用程序的人机识别的方法。存储器404可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器404可进一步包括相对于处理器402远程设置的存储器，这些远程存储器可以通过网络连接至服务器40。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输装置406用于经由一个网络接收或者发送数据。上述的网络具体实例可包括服务器40的通信供应商提供的无线网络。在一个实例中，传输装置406包括一个网络适配器(networkinterfacecontroller，nic)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输装置406可以为射频(radiofrequency，rf)模块，其用于通过无线方式与互联网进行通讯。

在上述运行环境下，本申请提供了如图5所示的人机识别的方法。在服务器侧，图5是根据本申请实施例二的人机识别的方法的流程图。

步骤s502，接收终端发送的验证请求；

步骤s504，向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；

步骤s506，接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；

步骤s508，判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

具体的，结合实施例1中对应的服务器24，本实施例提供的人机识别的方法可以适用于服务器中，本申请实施例提供的人机识别的方法以适用于身份验证环境为例进行说明，终端以智能手机(后续简称为：手机)为例进行说明，在用户使用手机登录app时，在输入账号和密码待app验证的过程中，若账号和密码不一致，则app显示登录失败，在用户多次录入账号密码均登录失败的情况下，app显示密码找回功能，提示用户通过密码找回的方式重新登录，当手机检测到用户点击密码找回功能项后，手机向服务器发送验证请求，服务器在接收验证请求后，向手机发送待验证信息，其中，该待验证信息包括：待验证声音信息和待验证行为信息；手机在接收到该待验证信息之后，通过手机中与显示屏连接的传感器和麦克风采集用户声纹信息和行为数据信息，并在采集用户声纹信息和行为数据信息之后，将用户声纹信息和行为数据信息上传至服务器，以使得服务器依据用户声纹信息和行为数据信息进行识别，判断该用户声纹信息和行为数据信息为自然人操作产生，或机器人操作产生；若为机器人操作产生，则禁止手机的验证请求，密码找回流程结束；而当识别到的为自然人操作产生时，接收手机的验证请求，用户进入密码重置流程，并通过密码重置，重新登陆app。

这里本申请上述示例仅以实现本实施例通过的人机识别的方法为准，具体不做限定。

在本申请实施例中，通过接收终端发送的验证请求；向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人，达到了防护机器请求攻击的目的，从而实现了提升人机识别准确率的技术效果，进而解决了由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的技术问题。

可选的，步骤s508中判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同包括：

step1,通过预存模型解析用户声纹信息和行为数据信息，得到用户声纹信息中的用户声纹特征、用户朗读内容信息和用户行为特征；

step2,判断述用户朗读内容信息是否与待验证信息中的待验证声音信息相同，以及判断用户行为特征是否与待验证信息中的待验证行为信息相同；

step3,在目标对象包括自然人和机器人，且在用户朗读内容信息和用户行为特征均与待验证声音信息和待验证行为信息相同的情况下，通过预存模型判断用户声纹特征是否为自然人声纹特征。

进一步地，可选的，用户声纹特征包括：用户声音频谱、用户声音响度和音量；用户行为特征包括：触碰轨迹和触碰频率。

需要说明的是，本申请提供的人机识别的方法仅以用户声纹特征包括：用户声音频谱、用户声音响度和音量；用户行为特征包括：触碰轨迹和触碰频率为例进行说明，以实现本实施例提供的人机识别的方法为准，具体不做限定。

可选的，步骤s508中依据目标对象的类型输出对应的判断结果包括：

step4，若判断用户声纹特征和用户行为特征所属的操作对象为自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；

step5，若判断用户声纹特征和用户行为特征所属的操作对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人。

进一步地，可选的，在step4判断用户声纹特征和用户行为特征所属的操作对象为自然人之后，本申请实施例提供的人机识别的方法还包括：

步骤1，在用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，判断在预设时间内是否接收到操作对象对应的用户声纹信息和行为数据信息；

步骤2，在判断结果为在预设时间内接收到操作对象对应的用户声纹信息和行为数据信息的情况下，拒绝处理终端发送的验证请求；

步骤3，在判断结果为在预设时间内未接收到操作对象对应的用户声纹信息和行为数据信息的情况下，处理终端发送的验证请求。

具体的，服务器包括存储器和处理器，其中，存储器存储预存模型，处理器通过该预存模型识别终端上传的用户声纹信息和行为数据信息，并由预存模型识别用户声纹信息和行为数据信息所属操作对象是否为预存模型中的目标对象，如果该操作对象是预存模型中的目标对象，如果该目标对象是自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若目标对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人。

可选的，在step5输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人之后，本申请实施例提供的人机识别的方法还包括：

step6，输出告警信号，并拒绝处理终端发送的验证请求。

具体的，本实施例提供的服务器中还包括报警器，该报警器与处理器连接，在判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人的情况下，输出告警信号，并将该终端录入告警记录，以使得在后续接收到该终端22发送的请求时，服务器拒绝处理该终端发送的请求。

实施例3

本申请提供了如图6所示的人机识别的方法。在终端侧，图6是根据本申请实施例三的人机识别的方法的流程图。

步骤s602，向服务器发送验证请求；

步骤s604，接收服务器依据验证请求返回的待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；

步骤s606，采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息；

步骤s608，向服务器发送用户声纹信息和行为数据信息。

具体的，对应实施例1中的终端，本实施例提供的人机识别的方法可以适用于终端侧，本申请提供的人机识别的方法中终端可以包括：智能手机(例如：适用ios系统、android系统或windows系统的手机)、平板电脑、笔记本电脑、个人电脑(personalcomputer，简称pc)、掌上商务或智能穿戴设备(例如谷歌眼镜、智能手表、增强现实ar设备或虚拟现实vr设备)等具备通信及数据处理、存储能力的移动终端。服务器24通过有线或无线的方式与终端连接，建立通信链路。

其中，本申请实施例提供的人机识别的方法以适用于身份验证环境为例进行说明，终端22以智能手机(后续简称为：手机)为例进行说明，在用户使用手机登录app时，在输入账号和密码待app验证的过程中，若账号和密码不一致，则app显示登录失败，在用户多次录入账号密码均登录失败的情况下，app显示密码找回功能，提示用户通过密码找回的方式重新登录，当手机检测到用户点击密码找回功能项后，手机向服务器发送验证请求，服务器在接收验证请求后，向手机发送待验证信息，其中，该待验证信息包括：待验证声音信息和待验证行为信息；手机在接收到该待验证信息之后，通过手机中与显示屏连接的传感器和麦克风采集用户声纹信息和行为数据信息，并在采集用户声纹信息和行为数据信息之后，将用户声纹信息和行为数据信息上传至服务器。

例如，在用户使用终端发起密码找回的情况下，终端向服务器发送密码找回请求，通过天线接收服务器发送的待验证信息，终端的传感器组采集用户依据待验证信息产生的用户声纹信息和行为数据信息，最后由天线将将用户声纹信息和行为数据信息发送至服务器。

在本申请实施例中，通过向服务器发送验证请求；接收服务器依据验证请求返回的待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息；向服务器发送用户声纹信息和行为数据信息，达到了防护机器请求攻击的目的，从而实现了提升人机识别准确率的技术效果，进而解决了由于现有技术中针对人机识别存在的缺陷，导致人机识别准确率低的技术问题。

具体的，如图7所示，图7是根据本申请实施例三的人机识别的方法中终端显示的示意图。在终端接收服务器发送的待验证信息后，显示待验证信息中的字符，以及需要用户按压的麦克图标，进而在检测到用户按压麦克图标之后，检测到用户朗读字符的声音，终端将声音和按压操作上传至服务器等待服务器验证，待服务器验证成功后返回验证成功界面，若检测到该终端上传的声音无法识别，将重新发起验证流程。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的人机识别的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如rom/ram、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本申请各个实施例所述的方法。

实施例4

根据本申请实施例，还提供了一种用于实施上述人机识别的方法的装置，在服务器侧，如图8所示，图8是根据本申请实施例四的人机识别的装置的结构示意图，该装置包括：

第一接收模块81，用于接收终端发送的验证请求；发送模块82，用于向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；第二接收模块83，用于接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；识别模块84，用于判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

实施例5

根据本申请实施例，还提供了一种用于实施上述人机识别的方法的装置，在终端侧，如图9所示，图9是根据本申请实施例五的人机识别的装置的结构示意图，该装置包括：

第一发送模块91，用于向服务器发送验证请求；接收模块92，用于接收服务器依据验证请求返回的待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；采集模块93，用于采集与待验证声音信息对应的用户声纹信息，以及采集待验证行为信息对应的行为数据信息；第二发送模块94，用于向服务器发送用户声纹信息和行为数据信息。

实施例6

根据本申请实施例的再一方面，还提供了一种存储介质，存储介质包括存储的程序，其中，在程序运行时控制存储介质所在设备执行上述实施例2和实施3中的人机识别的方法。

实施例7

根据本申请实施例的再一方面，还提供了一种处理器，处理器用于运行程序，其中，程序运行时执行上述实施例2和实施3中的人机识别的方法。

实施例8

本申请的实施例还提供了一种存储介质。可选地，在本实施例中，上述存储介质可以用于保存上述实施例一所提供的人机识别的方法所执行的程序代码。

可选地，在本实施例中，上述存储介质可以位于计算机网络中计算机终端群中的任意一个计算机终端中，或者位于移动终端群中的任意一个移动终端中。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：接收终端发送的验证请求；向终端发送待验证信息，其中，待验证信息包括：待验证声音信息和待验证行为信息；接收终端上传的对应待验证信息的用户声纹信息和行为数据信息；判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同，并依据目标对象的类型输出对应的判断结果，其中，判断结果包括：操作对象为自然人；或，操作对象为机器人。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：判断用户声纹信息和行为数据信息所属的操作对象是否与预存模型中的目标对象相同包括：通过预存模型解析用户声纹信息和行为数据信息，得到用户声纹信息中的用户声纹特征、用户朗读内容信息和用户行为特征；判断述用户朗读内容信息是否与待验证信息中的待验证声音信息相同，以及判断用户行为特征是否与待验证信息中的待验证行为信息相同；在目标对象包括自然人和机器人，且在用户朗读内容信息和用户行为特征均与待验证声音信息和待验证行为信息相同的情况下，通过预存模型判断用户声纹特征是否为自然人声纹特征。

进一步地，可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：用户声纹特征包括：用户声音频谱、用户声音响度和音量；用户行为特征包括：触碰轨迹和触碰频率。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：依据目标对象的类型输出对应的判断结果包括：若判断用户声纹特征和用户行为特征所属的操作对象为自然人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为自然人；若判断用户声纹特征和用户行为特征所属的操作对象为机器人，则输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人。

进一步地，可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：在判断用户声纹特征和用户行为特征所属的操作对象为自然人之后，方法还包括：在用户声纹信息和行为数据信息所属的操作对象为自然人的情况下，判断在预设时间内是否接收到操作对象对应的用户声纹信息和行为数据信息；在判断结果为在预设时间内接收到操作对象对应的用户声纹信息和行为数据信息的情况下，拒绝处理终端发送的验证请求；在判断结果为在预设时间内未接收到操作对象对应的用户声纹信息和行为数据信息的情况下，处理终端发送的验证请求。

可选地，在本实施例中，存储介质被设置为存储用于执行以下步骤的程序代码：在输出判断结果为用户声纹信息和行为数据信息所属的操作对象为机器人之后，方法还包括：输出告警信号，并拒绝处理终端发送的验证请求。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的技术内容，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、只读存储器(rom，read-onlymemory)、随机存取存储器(ram，randomaccessmemory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：梁庆欢;刘刚;赵情恩
技术所有人：阿里巴巴集团控股有限公司
我是此专利的发明人

上一篇：一种印刷包装设备用纸张引导装置的制作方法
上一篇：一种防火防爆电液执行机构的制作方法