一种校验方法及装置与流程

文档序号:12123229阅读:214来源:国知局
一种校验方法及装置与流程

本发明涉及识别技术领域,有其涉及一种校验方法及装置。



背景技术:

为了识别真实的自然人用户和恶意程序,校验技术的应用越来越多。较为常见的校验技术有输入验证数字、识别图像中的物体等等。

但是,这些方式可以较容易利用图像识别技术进行破解,进而会导致无法正确识别真实用户。



技术实现要素:

本发明解决的技术问题是提升校验方法的安全性。

为解决上述技术问题,本发明实施例提供一种校验方法,包括:提供问题语句以及N个校验选项,所述问题语句对应M个目标语句,M为正整数,所述N个校验选项包括所述M个目标语句和(N-M)个错误语句,所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,N为正整数,且N>M;接收用户对多个校验选项的选择信息;判断所述选择信息是否与所述M个目标语句相对应,若是,则通过验证;若否,则验证失败。

可选的,所述目标语句为所述问题语句的扩展语句,所述错误语句为所述问题语句以外的其他语句,或所述其他语句的扩展语句,其中,所述问题语句的扩展语句的语义相似度大于第二预设的阈值。

可选的,所述其他语句与所述问题语句的语义相似度小于第三预设的阈值。

可选的,所述问题语句以及所述多个校验选项通过如下方式生成:根据标准语句生成多个扩展语句;在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项。

可选的,所述根据所述标准语句生成多个扩展语句包括:根据所述标准语句,采用机器学习的方式和/或采用大数据的方式生成所述多个扩展语句。

可选的,在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项包括:分别计算所述多个扩展语句与所述标准语句的语义相似度;根据所述多个扩展语句与所述标准语句的语义相似度对所述多个扩展语句进行排序;确定所述标准语句为所述问题语句;根据所述排序的结果选取所述多个校验选项,其中,所述目标语句为与所述标准语句相似度最大的扩展语句,或者为与所述标准语句相似度最小的扩展语句。

可选的,所述语义相似度是利用大数据相似度计算技术计算得到的。

可选的,所述大数据相似度计算技术包括:K最近邻算法。

可选的,所述问题语句是从语句库中随机选择的。

可选的,所述问题语句是根据所述校验方法使用的领域在对应的语句库中选择的。

可选的,所述语句库存储有人机对话中的问答语句。

可选的,若验证失败,所述校验方法还包括:标记记录用户选择的所述校验选项与所述问题语句的相似度值。

本发明实施例还提供一种校验装置,包括:问题语句及校验选项提供单元,适于提供问题语句以及N个校验选项,所述问题语句对应M个目标语句,M为正整数,所述N个校验选项包括所述M个目标语句和(N-M)个错误语句,所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,N为正整数,且N>M;选择信息接收单元,适于接收用户对多个校验选项的选择信息;验证单元,适于判断所述选择信息是否与所述M个目标语句相对应,若是,则通过验证;若否,则验证失败。

可选的,所述目标语句为所述问题语句的扩展语句,所述错误语句为所述问题语句以外的其他语句,或所述其他语句的扩展语句,其中,所述问题语句的扩展语句的语义相似度大于第二预设的阈值。

可选的,所述其他语句与所述问题语句的语义相似度小于第三预设的阈值。

可选的,问题语句及校验选项提供单元包括:扩展语句生成单元,适于根据标准语句生成多个扩展语句;选取单元,适于在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项。

可选的,所述扩展语句生成单元,适于根据所述标准语句,采用机器学习的方式和/或采用大数据的方式生成所述多个扩展语句。

可选的,所述选取单元包括:语义相似度计算单元,适于分别计算所述多个扩展语句与所述标准语句的语义相似度;排序单元,适于根据所述多个扩展语句与所述标准语句的语义相似度对所述多个扩展语句进行排序;问题语句确定单元,适于确定所述标准语句为所述问题语句;校验选项确定单元,适于根据所述排序的结果选取所述多个校验选项,其中,所述目标语句为与所述标准语句相似度最大的扩展语句,或者为与所述标准语句相似度最小的扩展语句。

可选的,所述语义相似度是利用大数据相似度计算技术计算得到的。

可选的,所述大数据相似度计算技术包括:K最近邻算法。

可选的,所述问题语句是从语句库中随机选择的。

可选的,所述问题语句是根据所述校验方法使用的领域在对应的语句库中选择的。

可选的,所述语句库存储有人机对话中的问答语句。

可选的,所述校验装置还包括:记录单元,适于若所述验证单元验证失败,则标记记录用户选择的所述校验选项与所述问题语句的相似度值。

与现有技术相比,本发明实施例的技术方案具有以下有益效果:

在本发明实施例中,通过提供问题语句和校验选项供用户选择,接收用户对多个校验选项的选择信息,判断所述选择信息是否与所述M个目标语句相对应,若对应,则通过验证,否则验证失败。由于问题语句和校验选项均为文字信息,真实的自然人用户可以理解并且进行判断和选择,但由于语言的多样性,可以生成多种多样的问题语句和校验选项,较难利用机器进行自动破解,进而可以提升校验方法的安全性。

附图说明

图1是本发明实施例中一种校验方法的流程图;

图2是本发明实施例中一种问题语句以及多个校验选项的生成方法的流程图;

图3是图2中步骤S22的一种具体实现的流程图;

图4是本发明实施例中一种校验装置的结构示意图;

图5是图4问题语句及校验选项提供单元41的一种具体实现的结构示意图;

图6是图5中选取单元52的一种具体实现的结构示意图。

具体实施方式

如前所述,为了识别真实的自然人用户和恶意程序,校验技术的应用越来越多。较为常见的校验技术有输入验证数字、识别图像中的物体等等。但是,这些方式可以较容易利用图像识别技术进行破解,进而会导致无法正确识别真实用户。

在本发明实施例中,通过提供问题语句和校验选项供用户选择,接收用户对多个校验选项的选择信息,判断所述选择信息是否与所述M个目标语句相对应,若对应,则通过验证,否则验证失败。由于问题语句和校验选项均为文字信息,真实的自然人用户可以理解并且进行判断和选择,由于问题语句和校验选项均为文字信息,真实的自然人用户可以理解并且进行判断和选择,但由于语言的多样性,可以生成多种多样的问题语句和校验选项,较难利用机器进行自动破解,进而可以提升校验方法的安全性。

为使本发明的上述目的、特征和有益效果能够更为明显易懂,下面结合附图对本发明的具体实施例做详细的说明。

图1是本发明实施例中一种校验方法的流程图,具体可以包括如下步骤:

步骤S11,提供问题语句以及N个校验选项,所述问题语句对应M个目标语句,M为正整数,所述N个校验选项包括所述M个目标语句和(N-M)个错误语句,所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,N为正整数,且N>M;

步骤S12,接收用户对多个校验选项的选择信息;

步骤S13,判断所述选择信息是否与所述M个目标语句相对应,若是,则通过验证;若否,则验证失败。

提供问题语句以及N个校验选项是向用户提供,例如可以在需要验证的页面向用户提供问题语句以及N个校验选项,以供用户进行选择。这里的用户既可以是自然人用户,也可以是恶意程序伪装成的用户。

本领域人员可以理解的是,只要满足标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值的一组句子,即可作为问题语句和校验选项。也即,问题语句和校验选项可以是在步骤S11之前生成的,也可以是从数据库中直接获取的。

其中,问题语句可以是随机确定的,或者根据校验方法使用的领域,在对应的领域中确定。在具体实施中,问题语句可以是从语句库中进行选择的,或者也可以是根据所述校验方法使用的领域在对应的语句库中选择的。语句库中可以存储由人机对话中的问答语句。

目标语句与问题语句的语义相似度以及所述错误语句与问题语句的语义相似度均可以是利用大数据相似度计算技术计算得到的,例如可以利用K最近邻算法计算语义相似度。

在具体实施中,可以向用户提供需要用户如何根据所述问题语句进行选择的说明,例如:“请选择与问题语句意思最为近似的两个句子”、“请选择与问题语句意思差异最大的句子”。

在一个非限定性的例子中,问题语句可以是:“你晚饭吃了吗”;校验选项可以包括:“你晚饭有没有吃”、“你有没有吃晚饭”“你晚上去哪了”“你晚上干嘛去”“你喜欢吃西瓜吗”。

当需要选择的是与问题语句意思最为近似的两个句子时,目标语句可以是“你晚饭有没有吃”、“你有没有吃晚饭”,其余为错误语句;当需要选择的是与问题语句意思差异最大的句子时,目标语句可以是“你喜欢吃西瓜吗”,其余为错误语句。

可以看出,目标语句的数目和与问题语句的语义关系可以根据需要设定,仅需所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,即可使得自然人用户较为明确的对目标语句和错误语句进行区分,进而做出选择。

但当用户是恶意程序伪装的时,则很难对各个校验选项进行区分。若利用机器自动破解,通常需要基于问题语句和校验选项生成时基于的算法和数据库,由于自然语言的多样性,可以生成多样化的问题语句以及校验选项,破解方较难获得生成时依据的算法和数据库,故较难进行自动破解,进而可以提升校验方法的安全性。

在具体实施中,为了使得正确语句和错误语句的区别度更高,目标语句可以是问题语句的扩展语句,错误语句可以是问题语句以外的其他语句,或者问题语句以外的其他语句的扩展语句,其中,所述问题语句的扩展语句的语义相似度大于第二预设的阈值。

例如,沿用上例,目标语句“你晚饭有没有吃”、“你有没有吃晚饭”可以是问题语句“你晚饭吃了吗”的扩展语句。

所述其他语句与所述问题语句的语义相似度可以小于预设的第三阈值。若问题语句和其它语句的相似度较高,会导致分辨度交差,导致自然人用户误选。因此,通过设定第三阈值,可以使得错误语句与目标语句之间的差异性更大,也即二者的语义相似度更低,进而可以避免自然人用户的误选,进一步可以提升利用校验方法进行识别的准确性。

参见图2,所述问题语句以及所述多个校验选项可以通过如下方式生成:

步骤S21,根据标准语句生成多个扩展语句;

步骤S22,在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项。

其中,标准语句可以是从语句库中随机确定的,或者也可以是根据校验方法的应用领域,从对应的语句库中确定的。

标准语句可以作为所述问题语句,或者也可以在扩展语句中进行选取,以作为问题语句,只要满足目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值即可。

在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项时,由于问题语句与各个校验选项之间均有一定程度的语义联系,会给自动破解的过程带来更多的困难,进而可以增加校验方法的安全性。

在具体实施中,可以根据所述标准语句,采用机器学习的方式和/或采用大数据的方式生成所述多个扩展语句。例如,可以通过大数据相似度计算技术生成扩展语句。其中,所述大数据相似度计算技术可以包括:K最近邻算法。

在具体实施中,也可以根据用于与用户交互问答的知识库里预先存储的一个标准问作为所述标准语句,且根据所述知识库中预先存储的扩展问作为所述标准语句的扩展语句,其中,该扩展问与标准问表达形式有略微差异,但是表达相同的含义。其中,知识库中的基本知识点最原始和最简单的形式就是平时常用的FAQ,一般的形式是“问-答”对。例如,“彩铃的资费”就是表达清晰的标准问描述。这里的“问”不应被狭义地理解为“询问”,而应广义地来理解一“输入”,该“输入”具有对应的“输出”。例如,对于用于控制系统的语义识别而言,用户的一个指令,例如“打开收音机”也应可以被理解为是一个“问”,此时对应的“答”可以是用于执行相应控制的控制程序的调用。

用户在向机器输入时,最理想的情况是使用标准问,则机器的智能语义识别系统马上能够理解用户的意思。然而,用户往往并非使用的是标准问,而是标准问的一些变形的形式。例如,若对于收音机的电台切换的标准问形式是“换一个电台”,那么用户可能使用的命令是“切换一个电台”,机器也需要能够识别用户表达的是同一个意思。

参见图3,以下对图2中步骤S22进行进一步说明。在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项具体可以包括:

步骤S31,分别计算所述多个扩展语句与所述标准语句的语义相似度;

步骤S32,根据所述多个扩展语句与所述标准语句的语义相似度对所述多个扩展语句进行排序;

步骤S33,确定所述标准语句为所述问题语句;

步骤S34,根据所述排序的结果选取所述多个校验选项,其中,所述目标语句为与所述标准语句相似度最大的扩展语句,或者为与所述标准语句相似度最小的扩展语句。

其中,对扩展语句进行排序可以是按照各个扩展语句与标准语句的相似度进行从小到大或者从大到小的顺序进行排序。

由于通过上述方式生成的校验语句,与问题语句之间均具有一定程度的语义相似性,故恶意破解程序进行破解的难度较大。另外,通过选取与所述标准语句相似度最大的扩展语句或与所述标准语句相似度最小的扩展语句作为目标语句,对自然人用户来讲,可识别度较高。由此,可以兼顾校验方法的安全性与准确性。

本领域技术人员可以理解的是,也可以在所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值的条件下,按照扩展语句的排序,依次选取更多的语句作为目标语句,具体可以根据需要或者进行试验后得到的经验数据进行。

在具体实施中,若验证失败,用户可以进行刷新,以重新获取问题语句和校验选项并重新进行选择。

在验证失败时,可以标记记录用户选择的所述校验选项与所述问题语句的相似度值。这些标记记录可以作为经验数据,对本发明实施例中的校验方法进行调整,以使得本发明实施例中的校验方法的安全性和准确性更高。

在本发明实施例中,通过提供问题语句和校验选项供用户选择,接收用户对多个校验选项的选择信息,判断所述选择信息是否与所述M个目标语句相对应,若对应,则通过验证,否则验证失败。由于问题语句和校验选项均为文字信息,真实的自然人用户可以理解并且进行判断和选择,但由于语言的多样性,可以生成多种多样的问题语句和校验选项,较难利用机器进行自动破解,进而可以提升校验方法的安全性。

本发明实施例还提供一种校验装置,其结构示意图参见图4,具体可以包括:

问题语句及校验选项提供单元41,适于提供问题语句以及N个校验选项,所述问题语句对应M个目标语句,M为正整数,所述N个校验选项包括所述M个目标语句和(N-M)个错误语句,所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,N为正整数,且N>M;

选择信息接收单元42,适于接收用户对多个校验选项的选择信息;

验证单元43,适于判断所述选择信息是否与所述M个目标语句相对应,若是,则通过验证;若否,则验证失败。

其中,问题语句及校验选项提供单元41,可以从数据库获取所述问题语句及校验选项,或直接生成所述问题语句及校验选项。

可以看出,目标语句的数目和与问题语句的语义关系可以根据需要设定,仅需所述目标语句与所述问题语句的语义相似度以及所述错误语句与所述问题语句的语义相似度之间的差值大于或等于第一预设阈值,即可使得自然人用户较为明确的对目标语句和错误语句进行区分,进而做出选择。

但当用户是恶意程序伪装的时,则很难对各个校验选项进行区分。若利用机器自动破解,通常需要基于问题语句和校验选项生成时基于的算法和数据库,由于自然语言的多样性,可以生成多样化的问题语句以及校验选项,破解方较难获得生成时依据的算法和数据库,故较难进行自动破解,进而可以提升校验方法的安全性。

在具体实施中,所述目标语句可以是所述问题语句的扩展语句,所述错误语句可以是所述问题语句以外的其他语句,或所述其他语句的扩展语句,其中,所述问题语句的扩展语句的语义相似度大于第二预设的阈值。

另外,所述其他语句与所述问题语句的语义相似度可以小于第三预设的阈值。若问题语句和其它语句的相似度较高,会导致分辨度较差,导致自然人用户误选。故设定第三阈值,可以使得错误语句与目标语句之间的差异性更大,也即二者的语义相似度更低,进而可以避免自然人用户的误选,进一步可以提升利用校验方法进行识别的准确性。

参见图5,图4中问题语句及校验选项提供单元41可以包括:

扩展语句生成单元51,适于根据标准语句生成多个扩展语句;

选取单元52,适于在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项。

在具体实施中,所述扩展语句生成单元51,适于根据所述标准语句,采用机器学习的方式和/或采用大数据的方式生成所述多个扩展语句。

在所述标准语句与所述多个扩展语句中选取所述问题语句以及所述N个校验选项时,由于问题语句与各个校验选项之间均有一定语义联系,会给自动破解的过程带来更多的困难,进而可以增加校验方法的安全性。

参见图6,图5中选取单元52可以包括:

语义相似度计算单元61,适于分别计算所述多个扩展语句与所述标准语句的语义相似度;

排序单元62,适于根据所述多个扩展语句与所述标准语句的语义相似度对所述多个扩展语句进行排序;

问题语句确定单元63,适于确定所述标准语句为所述问题语句;

校验选项确定单元64,适于根据所述排序的结果选取所述多个校验选项,其中,所述目标语句为与所述标准语句相似度最大的扩展语句,或者为与所述标准语句相似度最小的扩展语句。

由于通过上述单元生成的校验语句,与问题语句之间均具有一定的语义相似性,故恶意破解程序进行破解的难度较大。另外,通过选取与所述标准语句相似度最大的扩展语句或与所述标准语句相似度最小的扩展语句作为目标语句,对自然人用户来讲,可识别度较高。由此,可以兼顾校验方法的安全性与准确性。

在具体实施中,所述语义相似度是利用大数据相似度计算技术计算得到的。

其中,所述大数据相似度计算技术可以包括:K最近邻算法。

在具体实施中,问题语句是从语句库中随机选择的;也可以是根据所述校验方法使用的领域在对应的语句库中选择的。

其中,所述语句库中可以存储有人机对话中的问答语句。

继续参见图4,校验装置还可以包括记录单元44,适于若所述验证单元43验证失败,则标记记录用户选择的所述校验选项与所述问题语句的相似度值。

这些标记记录可以作为经验数据,对本发明实施例中的校验方法进行调整,以使得本发明实施例中的校验方法的安全性和准确性更高。

本发明实施例中的校验装置,可以利用通用处理器结合人机交互设备实现,例如可以利用单台计算机、计算机集群、手机、平板电脑实现,在替换方案中,也可以利用种解说性逻辑板块、模块、和电路实现。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:ROM、RAM、磁盘或光盘等。

虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,均可作各种更动与修改,因此本发明的保护范围应当以权利要求所限定的范围为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1