意图识别方法、装置、计算机设备和计算机可读存储介质与流程

文档序号：25423718发布日期：2021-06-11 21:36阅读：100来源：国知局

导航： X技术> 最新专利>计算;推算;计数设备的制造及其应用技术

本发明涉及互联网技术领域，特别是涉及一种意图识别方法、装置、计算机设备和计算机可读存储介质。

背景技术：

随着互联网技术的快速发展，越来越多的电商平台涌现。用户通过电商平台进行购物的过程中，可能需要与商家进行交流，例如，咨询商品情况、售后服务，等等。

随着用户数量的剧增，出现了采用智能客服机器人代替人工客服的情况。目前，普遍是针对一个业务单独训练一个分类模型，将该分类模型置于智能客服机器人中，这样，用户每来一个问题，智能客服机器人则基于该分类模型进行一次分类判断，以此来确定用户的意图。

然而，上述方式必须针对每个业务单独训练一个分类模型，而对于未训练分类模型的业务，智能客服机器人则不能进行用户意图的识别，这就导致智能客服机器人的用户意图识别的灵活性较差。

技术实现要素：

基于此，有必要针对上述技术问题，提供一种能够提升用户意图识别的灵活性的意图识别方法、装置、计算机设备和计算机可读存储介质。

第一方面，本申请实施例提供了一种意图识别方法，所述方法包括：

获取待识别的目标文本问句，在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，并确定各所述候选相似问句对应的候选意图；

对于每个所述候选意图，根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征；

将各所述候选意图的意图特征输入至排序树模型中，得到各所述候选意图的排序分值，并基于各所述候选意图的排序分值，从各所述候选意图中确定所述目标文本问句对应的目标意图。

在其中一个实施例中，所述基于各所述候选意图的排序分值，从各所述候选意图中确定所述目标文本问句对应的目标意图，包括：

获取所述目标文本问句对应的目标问句向量，并确定各所述候选相似问句对应的相似问句向量；

确定所述目标问句向量和各所述相似问句向量之间的相似度值，并确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值；

将所述和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为所述目标意图。

在其中一个实施例中，所述确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值之前，所述方法还包括：

检测各所述相似度值是否大于预设的相似度阈值；

若大于，则执行所述确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值的步骤。

在其中一个实施例中，所述获取所述目标文本问句对应的目标问句向量，包括：

对所述目标文本问句添加起始标志位和结束标志位；

将添加后的所述目标文本问句输入至深度双向预训练语言模型中，得到所述深度双向预训练语言模型输出的所述目标问句向量。

在其中一个实施例中，所述根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征，包括：

获取各所述候选相似问句对应的召回分值，对于每个所述候选相似问句，所述候选相似问句对应的召回分值的大小与所述目标文本问句和所述候选相似问句的匹配程度正相关；

根据各所述候选相似问句、各所述候选相似问句对应的相似度值以及各所述候选相似问句对应的召回分值，提取所述候选意图的所述意图特征。

在其中一个实施例中，所述在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，包括：

确定所述目标文本问句对应的业务标识，并根据所述业务标识，在所述问句数据库中筛选包括所述业务标识的多个初始相似问句；

获取所述目标文本问句与各所述初始相似问句之间的文本相似度，并根据各所述文本相似度，从所述多个初始相似问句中确定预设数量的所述多个候选相似问句。

在其中一个实施例中，所述根据各所述文本相似度，从所述多个初始相似问句中确定预设数量的所述多个候选相似问句，包括：

按照各所述文本相似度从大到小的顺序，从所述多个初始相似问句中确定所述预设数量的所述多个候选相似问句。

在其中一个实施例中，所述方法还包括：

若所述目标意图的数量为一个，则查找所述目标意图对应的问句答案，并展示所述问句答案。

在其中一个实施例中，所述方法还包括：

若所述目标意图的数量为多个，则展示所述多个目标意图，并获取用户输入的针对所述多个目标意图中任一个目标意图的选择指令；

根据所述选择指令，查找所述选择指令指示的目标意图对应的问句答案，并展示所述问句答案。

第二方面，本申请实施例提供一种意图识别装置，所述装置包括：

筛选模块，用于获取待识别的目标文本问句，在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，并确定各所述候选相似问句对应的候选意图；

提取模块，用于对于每个所述候选意图，根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征；

确定模块，用于将各所述候选意图的意图特征输入至排序树模型中，得到各所述候选意图的排序分值，并基于各所述候选意图的排序分值，从各所述候选意图中确定所述目标文本问句对应的目标意图。

第三方面，本申请实施例提供一种计算机设备，包括存储器和处理器，存储器存储有计算机程序，处理器执行计算机程序时实现如上述第一方面的方法的步骤。

第四方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

本申请实施例提供的技术方案带来的有益效果至少包括：

通过获取待识别的目标文本问句，在预设的问句数据库中确定目标文本问句对应的多个候选相似问句，并确定各候选相似问句对应的候选意图，而后，对于每个候选意图，根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征，接着，将各候选意图的意图特征输入至排序树模型中，得到各候选意图的排序分值，这样，基于各候选意图的排序分值，即可从各候选意图中确定目标文本问句对应的目标意图；从而，本申请实施例不必针对每个业务单独训练分类模型来进行用户意图的分类，这就避免了传统的基于分类模型的方式进行意图识别的过程中，对于未训练分类模型的业务不能进行用户意图识别的问题，本申请实施例提升了意图识别的灵活性。

附图说明

图1-a为一个实施例提供的意图识别方法的应用环境图；

图1-b为另一个实施例提供的意图识别方法的应用环境图；

图2为一个实施例提供的意图识别方法的流程示意图；

图3为另一个实施例提供的基于各候选意图的排序分值从各候选意图中确定目标意图的流程示意图；

图4为另一个实施例提供的步骤302的流程示意图；

图5为另一个实施例提供的获取目标问句向量的流程示意图；

图6为另一个实施例提供的步骤202的流程示意图；

图7为另一个实施例提供的确定目标文本问句对应的多个候选相似问句的流程示意图；

图8为另一个实施例提供的意图识别方法的流程示意图；

图9为一个实施例提供的意图识别装置的结构框图；

图10为一个实施例提供的计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的意图识别方法、装置、计算机设备和计算机可读存储介质，旨在解决传统技术中，用户意图识别的灵活性差的技术问题。下面将通过实施例并结合附图具体地对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体地实施例可以相互结合，对于相同或相似的概念或过程可能在某些实施例中不再赘述。

下面结合本申请实施例所应用的场景，对本申请实施例涉及的技术方案进行介绍。

图1-a为本申请实施例提供的意图识别方法所涉及到的一种实施环境的示意图，如图1-a所示，该实施环境可以包括终端101，终端101可以为智能机器人、智能手机、平板电脑、个人计算机、笔记本电脑、可穿戴设备、车载设备等。

在图1-a所示的实施环境中，终端101可以获取待识别的目标文本问句，在预设的问句数据库中确定目标文本问句对应的多个候选相似问句，并确定各候选相似问句对应的候选意图；终端101对于每个候选意图，根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征；终端101将各候选意图的意图特征输入至排序树模型中，得到各候选意图的排序分值，终端101基于各候选意图的排序分值，从各候选意图中确定目标文本问句对应的目标意图。

可选地，本申请实施例提供的意图识别方法所涉及到的实施环境还可以包括终端和服务器。如图1-b所示，该实施环境还可以包括终端101和服务器102，终端101和服务器102之间可以通过有线网络或无线网络进行通信。其中，终端101可以为智能机器人、智能手机、平板电脑、个人计算机、笔记本电脑、可穿戴设备、车载设备等；服务器102可以为一台服务器，也可以为由多台服务器组成的服务器集群。

在图1-b所示的实施环境中，终端101可以将待识别的目标文本问句发送至服务器102，服务器102获取该待识别的目标文本问句，在预设的问句数据库中确定目标文本问句对应的多个候选相似问句，并确定各候选相似问句对应的候选意图；服务器102对于每个候选意图，根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征；服务器102将各候选意图的意图特征输入至排序树模型中，得到各候选意图的排序分值，并基于各候选意图的排序分值，从各候选意图中确定目标文本问句对应的目标意图。可选地，服务器102可以将该目标文本问句对应的目标意图发送至终端101。

在一个实施例中，如图2所示，提供了一种意图识别方法，以该方法应用于图1-a中的终端101为例进行说明，包括以下步骤：

步骤201，终端获取待识别的目标文本问句，在预设的问句数据库中确定目标文本问句对应的多个候选相似问句，并确定各候选相似问句对应的候选意图。

本申请实施例中，目标文本问句可以是用户输入的文本形式的问句，或者，用户也可以输入语音形式的问句，终端对该语音形式的问句进行语音识别，得到目标文本问句。

例如，用户在电商平台购物的过程中，可能需要与商家进行交流，该目标文本问句则可以是用户咨询商品情况的问句、咨询售后服务的问句、咨询用户权益的问句，等等。以咨询售后服务中的退货服务为例，该目标文本问句例如可以是“怎么退货”、“如何退货”、“我要退货”或“退货”，等等；以咨询用户权益中的积分权益为例，该目标文本问句例如可以是“我还有多少积分”、“我的积分”、“剩余积分”或“当前积分”，等等，在此对目标文本问句的具体内容不做具体限制。

本申请实施例中，预设的问句数据库中包括多个预置的问句，预置的问句可以是用户与商家交流过程中可能输入的各种类型的问句。以下，对终端根据目标文本问句，在问句数据库中的多个预置的问句中确定目标文本问句对应的多个候选相似问句的过程进行介绍。

在一种可能的实施方式中，问句数据库中的各个问句均包括其对应的业务标识，业务标识可以是问句所属业务的标识，终端可以确定目标文本问句对应的业务标识，这样，终端则可以在该预设的问句数据库中筛选出包括业务标识的多个候选相似问句。

在另一种可能的实施方式中，终端可以计算目标文本问句与问句数据库中各个问句的文本相似度，并根据各文本相似度从该预设的问句数据库中筛选出多个与目标文本问句相似的候选相似问句。

终端在预设的问句数据库中确定目标文本问句对应的多个候选相似问句后，则可以确定各候选相似问句对应的候选意图，以下，对终端确定各候选相似问句对应的候选意图的过程进行介绍。

可选地，候选相似问句可以包括多个不同的字段，例如包括标识字段、意图字段、问句字段等等，该标识字段用于记录该候选相似问句对应的业务标识，该意图字段用于记录该候选相似问句对应的意图，该问句字段用于记录该候选相似问句的问句内容，终端确定多个候选相似问句后，则可以读取各个候选相似问句的意图字段，确定各个候选相似问句对应的候选意图。

步骤202，终端对于每个候选意图，根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征。

可以理解的是，多个相似的候选相似问句对应的候选意图可能相同。例如，候选相似问句a“怎么退货”、候选相似问句b“如何退货”、候选相似问句c“我要退货”以及候选相似问句d“退货”对应的候选意图均为“退货”。

终端对于每个候选意图，确定该候选意图对应的至少一个候选相似问句，即，终端将各候选相似问句按其对应的候选意图进行分类。而后，对于每个候选意图，终端根据该候选意图对应的全部的候选相似问句，提取该候选意图的意图特征。

在一种可能的实施方式中，对于每个候选意图，终端获取各个候选相似问句对应的召回分值，召回分值的大小与目标文本问句和各候选相似问句的匹配程度正相关，作为一种实施方式，终端可以从预设的召回接口中读取各候选相似问句对应的召回分值。

终端确定该候选意图对应的全部候选相似问句的召回分值中的最大召回分值以及最小召回分值，并确定该候选意图对应的全部候选相似问句的第一数量。

终端将全局候选相似问句(即各个候选意图对应的全部候选相似问句)的召回分值按照从大到小的顺序排序，得到召回分值排序序列，终端确定该召回分值排序序列的前m个召回分值对应的候选相似问句中，属于当前候选意图的候选相似问句的第二数量。

终端可以将该最大召回分值、最小召回分值、第一数量、第二数量中的一个或多个确定为候选意图的意图特征。

可以理解的是，在其他实施例中，候选意图的意图特征还可以包括其他更多或更少的特征，在此对候选意图的意图特征不做具体限制。

步骤203，终端将各候选意图的意图特征输入至排序树模型中，得到各候选意图的排序分值，并基于各候选意图的排序分值，从各候选意图中确定目标文本问句对应的目标意图。

本申请实施例中，排序树模型可以是lambdamart排序树模型，终端将各候选意图的意图特征输入至该排序树模型中，则得到各候选意图的排序分值，排序分值越大，则表征该候选意图与目标文本问句的意图越相似。

在一种可能的实施方式中，终端得到各候选意图的排序分值后，可以将各候选意图的排序分值与预设的分值阈值进行比较，并将排序分值大于预设的分值阈值的至少一个候选意图作为目标意图。

上述实施例通过获取待识别的目标文本问句，在预设的问句数据库中确定目标文本问句对应的多个候选相似问句，并确定各候选相似问句对应的候选意图，而后，对于每个候选意图，根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征，接着，将各候选意图的意图特征输入至排序树模型中，得到各候选意图的排序分值，这样，基于各候选意图的排序分值，即可从各候选意图中确定目标文本问句对应的目标意图；从而，本申请实施例不必针对每个业务单独训练分类模型来进行用户意图的分类，这就避免了传统的基于分类模型的方式进行意图识别的过程中，对于未训练分类模型的业务不能进行用户意图识别的问题，本申请实施例提升了意图识别的灵活性。

在一个实施例中，基于图2所示的实施例，参见图3，本实施例涉及的是终端如何基于各候选意图的排序分值，从各候选意图中确定目标文本问句对应的目标意图的过程。如图3所示，该过程包括步骤301、步骤302和步骤303：

步骤301，终端获取目标文本问句对应的目标问句向量，并确定各候选相似问句对应的相似问句向量。

终端可以采用预设的文本向量化模型获取目标文本问句对应的目标问句向量，文本向量化模型例如可以是向量空间模型、基于局部敏感哈希算法的模型，等等。

以下，对终端确定各候选相似问句对应的相似问句向量的方式进行介绍。

在一种可能的实施方式中，候选相似问句还可以包括问句向量字段，该问句向量字段中记录有该候选相似问句对应的相似问句向量。终端则可以读取候选相似问句的问句向量字段，确定该候选相似问句对应的相似问句向量。

在另一种可能的实施方式中，问句数据库中还可以存储每个候选相似问句与其对应的相似问句向量之间的k-v(key-value，键-值)映射关系，终端则可以通过该映射关系确定候选相似问句的相似问句向量。

这样，终端则得到各候选相似问句对应的相似问句向量。

步骤302，终端确定目标问句向量和各相似问句向量之间的相似度值，并确定各候选相似问句对应的相似度值和对应候选意图的排序分值的和值。

对于每个相似问句向量，终端可以利用向量相似度算法，计算目标问句向量与该相似问句向量之间的相似度值，向量相似度算法可以是余弦相似度、曼哈顿距离，等等。

终端得到各相似问句向量对应的相似度值后，终端计算各候选相似问句中的每个候选相似问句的相似度值和其对应的候选意图的排序分值的和值，得到每个候选相似问句的和值。

步骤303，终端将和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为目标意图。

终端检测各个候选相似问句的和值与预设和值阈值的大小，并将和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为目标意图，即终端确定的目标文本问句对应的目标意图可以是一个，也可以是多个，若确定的目标意图为多个，终端则可以展示该多个目标意图，供用户选择具体是哪个目标意图。

本申请实施例通过提取各候选意图的意图特征，并通过排序树模型对各候选意图进行打分，得到排序分值，结合排序分值和相似度值确定目标意图，从而丰富了目标意图的确定维度，相较于单纯依据相似度值确定目标意图，本实施例提升了意图识别的准确性。

在一个实施例中，基于图3所示的实施例，参见图4，本实施例中，步骤302可以包括图4所示的步骤3021、步骤3022和步骤3023：

步骤3021，终端确定目标问句向量和各相似问句向量之间的相似度值。

步骤3022，终端检测各相似度值是否大于预设的相似度阈值。

步骤3023，若大于，终端则确定各候选相似问句对应的相似度值和对应候选意图的排序分值的和值。

本申请实施例中，终端确定各候选相似问句对应的相似度值和对应候选意图的排序分值的和值之前，首先检测各相似度值是否大于预设的相似度阈值，若大于，终端则执行确定各候选相似问句对应的相似度值和对应候选意图的排序分值的和值的步骤。

可以理解的是，相似问句向量对应的相似度值越大，则表征该相似问句向量对应的候选相似问句与目标文本问句越相似，即相似程度越高。

本申请实施例中，终端可以设置相似度阈值，检测各相似度值是否大于该相似度阈值。若各相似度值均大于该相似度阈值，则表征各个候选相似问句与目标文本问句的相似程度均较高，终端则继续确定各候选相似问句对应的相似度值和对应候选意图的排序分值的和值，以从相似度值大于相似度阈值的各个候选相似问句对应的候选意图中，确定目标文本问句对应的目标意图。

而若某个相似问句向量对应的相似度值小于该相似度阈值，则表征该相似问句向量对应的候选相似问句与目标文本问句的相似程度较小，终端则过滤掉该候选相似问句对应的候选意图，而仅从相似度值大于相似度阈值的候选相似问句所对应的候选意图中确定目标意图，从而可以提升意图识别的准确性。

在一个实施例中，基于图3所示的实施例，参见图5，本实施例涉及的是终端如何获取目标文本问句对应的目标问句向量的过程。如图5所示，该过程包括步骤501和步骤502：

步骤501，终端对目标文本问句添加起始标志位和结束标志位。

起始标志位和结束标志位均可以是预设的字符。例如，目标文本问句为“我还有多少积分”，终端在该目标文本问句的起始处添加“[cls]”标志(即起始标志位)，并在目标文本问句的结束处添加“[sep]”标志(即结束标志位)。

步骤502，终端将添加后的目标文本问句输入至深度双向预训练语言模型中，得到深度双向预训练语言模型输出的目标问句向量。

终端将添加后的目标文本问句输入至深度双向预训练语言模型中，得到[cls]位置(即起始标志位)输出的结果，即为目标问句向量。

这样，终端则获取到目标文本问句对应的目标问句向量，终端可以进一步计算目标问句向量和各相似问句向量之间的相似度值，并根据各相似度值，从各候选相似问句对应的候选意图中确定目标文本问句对应的目标意图，从而不必依赖于意图分类模型，也可以对用户意图准确识别，提升了意图识别的灵活性。

在一个实施例中，基于图2所示的实施例，参见图6，本实施例涉及的是终端如何根据候选意图对应的至少一个候选相似问句，提取候选意图的意图特征。如图6所示，步骤202可以包括图6所示的步骤2021和步骤2022：

步骤2021，终端获取各候选相似问句对应的召回分值，对于每个候选相似问句，候选相似问句对应的召回分值的大小与目标文本问句和候选相似问句的匹配程度正相关。

本申请实施例中，候选相似问句对应的召回分值越大，则表征该候选相似问句与候选相似问句的匹配程度越高。作为一种实施方式，终端可以从预设的召回接口中读取各候选相似问句对应的召回分值。

步骤2022，终端根据各候选相似问句、各候选相似问句对应的相似度值以及各候选相似问句对应的召回分值，提取候选意图的意图特征。

终端获取目标文本问句对应的目标问句向量，并确定各候选相似问句对应的相似问句向量，终端分别计算目标问句向量和各相似问句向量之间的相似度值，则得到各候选相似问句对应的相似度值。

终端确定各候选相似问句对应的相似度值以及各候选相似问句对应的召回分值后，终端提取各个候选意图的意图特征。

可选地，对于每个候选意图，终端确定该候选意图对应的全部候选相似问句的召回分值中的最大召回分值以及最小召回分值，确定该候选意图对应的全部候选相似问句的相似度值中的最大相似度值和最小相似度值，并确定该候选意图对应的全部候选相似问句的第一数量。

终端将全局候选相似问句(即各个候选意图对应的全部候选相似问句)的相似度值按照从大到小的顺序排序，得到相似度值排序序列，终端确定该相似度值排序序列的前m个相似度值对应的候选相似问句中，属于当前候选意图的候选相似问句的第三数量。进一步地，终端计算该前m个相似度值的第一平均相似度值，并计算该相似度值排序序列的前p(p<m)个相似度值的第二平均相似度值。

终端将当前候选意图的全部候选相似问句的相似度值按照从大到小的顺序排序，得到排序结果，终端计算该排序结果中的前m个相似度值的第三平均相似度值，并计算该排序结果中的前p个相似度值的第四平均相似度值。

终端可以将该最大召回分值、最小召回分值、最大相似度值、最小相似度值、第一数量、第二数量、第三数量、第一平均相似度值、第二平均相似度值、第三平均相似度值以及第四平均相似度值中的一个或多个确定为候选意图的意图特征。

可以理解的是，在其他实施例中，候选意图的意图特征还可以包括其他更多或更少的特征，在此对候选意图的意图特征不做具体限制。

在一个实施例中，基于图2所示的实施例，参见图7，本实施例涉及的是终端如何在预设的问句数据库中确定目标文本问句对应的多个候选相似问句。如图7所示，该过程包括步骤701和步骤702：

步骤701，终端确定目标文本问句对应的业务标识，并根据业务标识，在问句数据库中筛选包括业务标识的多个初始相似问句。

本申请实施例中，预设的问句数据库中包括多个预置的问句，预置的问句可以是用户与商家交流过程中可能输入的各种类型的问句，问句数据库中的各个问句均包括其对应的业务标识，业务标识可以是问句所属业务的标识。

终端获取到待识别的目标文本问句，则可以确定该目标文本问句对应的业务标识，该业务标识可以是目标文本问句所属业务的标识。在一种可能的实施方式中，电商平台中的一个店铺可以是一个业务，那么，用户在该店铺输入的目标文本问句所对应的业务标识则可以是该店铺的店铺标识。在另一种可能的实施方式中，若电商平台中未设置店铺，那么，用户在该电商平台输入的目标文本问句所对应的业务标识则可以是该电商平台的平台标识，等等。由此，则可以得到目标文本问句对应的业务标识。

预设的问句数据库中预置的多个问句均包括其对应的业务标识，这样，终端确定目标文本问句对应的业务标识后，则可以在该预设的问句数据库中筛选出包括业务标识的多个初始相似问句。

可以理解的是，不同店铺(或电商平台)业务可能是相似的，例如，均提供换货服务、退货服务，等等。可选地，每个初始相似问句可以包括一个业务标识或者多个业务标识，不同的业务标识对应不同的店铺(或电商平台)。

例如，初始相似问句“如何退货”可以包括业务标识a以及业务标识b，该业务标识a为店铺a的店铺标识，该业务标识b为店铺b的店铺标识，这样，用户在店铺a或者店铺b输入目标文本问句咨询退货服务时，终端均可筛选到到该初始相似问句，这就避免了相同或相似的业务重复创建同样的初始相似问句导致的磁盘资源的浪费。本申请实施例通过目标文本问句对应的业务标识即可快速召回包括该业务标识的多个初始相似问句，并且通过业务标识召回的方式降低了磁盘资源的浪费。

步骤702，终端获取目标文本问句与各初始相似问句之间的文本相似度，并根据各文本相似度，从多个初始相似问句中确定预设数量的多个候选相似问句。

对于每个初始相似问句，终端利用文本相似度算法，计算目标文本问句与该初始相似问句之间的文本相似度，文本相似度算法可以是编辑距离算法、共有字符数算法等，这样，终端则可以得到每个初始相似问句对应的文本相似度。

本申请实施例中，终端得到每个初始相似问句对应的文本相似度后，根据各文本相似度，从多个初始相似问句中确定预设数量的候选相似问句。

在一种可能的实施方式中，终端可以按照各文本相似度从大到小的顺序，从多个初始相似问句中确定预设数量的多个候选相似问句。可选地，终端可以按照各文本相似度从大到小的顺序，对各初始相似问句进行排序，得到排序序列，终端从该排序序列中选取文本相似度最大的预设数量的初始相似问句，则得到该预设数量的候选相似问句。其中，预设数量在实施时可以自行设置，例如可以是50个、100个，等等。

在另一种可能的实施方式中，终端还可以设置文本相似度阈值，并将每个初始相似问句对应的文本相似度与该文本相似度阈值进行比较。终端确定文本相似度大于文本相似度阈值的n个初始相似问句，并对该n个初始相似问句按其文本相似度从大到小的顺序进行排序，接着，终端从排序结果中选取文本相似度最大的预设数量的初始相似问句，则得到该预设数量的候选相似问句，这样也可以实现终端从多个初始相似问句中确定预设数量的候选相似问句的过程，在此对该过程的实施方式不做具体限制。本申请实施例中，文本相似度阈值在实施时可以自行设置。

本申请实施例中，作为一种实施方式，每个候选相似问句中可以包括该候选相似问句对应的意图，例如，候选相似问句为“我要退货”，那么该候选相似问句包括的意图则为“退货”。在一种可能的实施方式中，候选相似问句可以包括多个不同的字段，例如包括标识字段、意图字段、问句字段等等，该标识字段用于记录该候选相似问句对应的业务标识，该意图字段用于记录该候选相似问句对应的意图，该问句字段用于记录该候选相似问句的问句内容。

可以理解的是，终端确定多个候选相似问句后，终端需要从各候选相似问句对应的意图中匹配出目标文本问句对应的目标意图。为了提升匹配效率，终端从预设的问句数据库中确定目标文本问句对应的多个候选相似问句之前，首先，根据业务标识，在问句数据库中筛选包括业务标识的多个初始相似问句，再获取目标文本问句与各初始相似问句之间的文本相似度，并根据各文本相似度，从多个初始相似问句中确定预设数量的多个候选相似问句，这就实现了对候选相似问句的数量过滤，从而大大缩小了匹配范围，提升了意图识别的效率。

在一个实施例中，基于图2所示的实施例，参见图8，本实施例意图识别方法还包括以下步骤：

步骤204，若目标意图的数量为一个，终端则查找目标意图对应的问句答案，并展示问句答案。

本申请实施例中，终端若从各候选相似问句对应的候选意图中确定目标文本问句对应的目标意图为一个，终端则查找该目标意图对应的问句答案，并在终端展示该问句答案，实现对目标文本问句的自动回答。

步骤205，若目标意图的数量为多个，终端则展示多个目标意图，并获取用户输入的针对多个目标意图中任一个目标意图的选择指令。

步骤206，终端根据选择指令，查找选择指令指示的目标意图对应的问句答案，并展示问句答案。

终端若从各候选相似问句对应的候选意图中确定目标文本问句对应的目标意图为多个，终端则以输入控件的形式在终端展示该多个目标意图供用户输入选择指令。终端若获取用户输入的针对多个目标意图中任一个目标意图的选择指令，终端则确定该目标意图为用户的真实意图，终端则查找该选择指令指示的目标意图对应的问句答案，并展示问句答案，实现对目标文本问句的自动回答。

本申请实施例在识别出目标意图后，针对不同数量的目标意图，采用不同的方式进行问句答案的获取，提升了终端的问答能力。

应该理解的是，虽然上述流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，上述流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中，如图9所示，提供了一种意图识别装置，包括：

筛选模块10，用于获取待识别的目标文本问句，在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，并确定各所述候选相似问句对应的候选意图；

提取模块20，用于对于每个所述候选意图，根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征；

确定模块30，用于将各所述候选意图的意图特征输入至排序树模型中，得到各所述候选意图的排序分值，并基于各所述候选意图的排序分值，从各所述候选意图中确定所述目标文本问句对应的目标意图。

可选地，确定模块30，包括：

获取单元，用于获取所述目标文本问句对应的目标问句向量，并确定各所述候选相似问句对应的相似问句向量；

第一确定单元，用于确定所述目标问句向量和各所述相似问句向量之间的相似度值，并确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值；

第二确定单元，用于将所述和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为所述目标意图。

可选地，所述第一确定单元具体用于确定所述目标问句向量和各所述相似问句向量之间的相似度值，检测各所述相似度值是否大于预设的相似度阈值；若大于，则确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值。

可选地，获取单元具体用于对所述目标文本问句添加起始标志位和结束标志位；将添加后的所述目标文本问句输入至深度双向预训练语言模型中，得到所述深度双向预训练语言模型输出的所述目标问句向量。

可选地，提取模块20具体用于获取各所述候选相似问句对应的召回分值，对于每个所述候选相似问句，所述候选相似问句对应的召回分值的大小与所述目标文本问句和所述候选相似问句的匹配程度正相关；根据各所述候选相似问句、各所述候选相似问句对应的相似度值以及各所述候选相似问句对应的召回分值，提取所述候选意图的所述意图特征。

可选地，筛选模块10具体用于确定所述目标文本问句对应的业务标识，并根据所述业务标识，在所述问句数据库中筛选包括所述业务标识的多个初始相似问句；获取所述目标文本问句与各所述初始相似问句之间的文本相似度，并根据各所述文本相似度，从所述多个初始相似问句中确定预设数量的所述多个候选相似问句。

其中，筛选模块10具体可以按照各所述文本相似度从大到小的顺序，从所述多个初始相似问句中确定所述预设数量的所述多个候选相似问句，以实现根据各所述文本相似度，从所述多个初始相似问句中确定预设数量的所述多个候选相似问句的过程。

可选地，所述装置还包括：

第一查找模块，用于若所述目标意图的数量为一个，则查找所述目标意图对应的问句答案，并展示所述问句答案。

展示模块，用于若所述目标意图的数量为多个，则展示所述多个目标意图，并获取用户输入的针对所述多个目标意图中任一个目标意图的选择指令；

第二查找模块，用于根据所述选择指令，查找所述选择指令指示的目标意图对应的问句答案，并展示所述问句答案。

本实施例提供的意图识别装置，可以执行上述意图识别方法实施例，其实现原理和技术效果类似，在此不再赘述。关于意图识别装置的具体限定可以参见上文中对于意图识别方法的限定，在此不再赘述。上述意图识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，还提供了一种如图10所示的计算机设备，该计算机设备可以是终端，其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信，无线方式可通过wifi、运营商网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种意图识别方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏，该计算机设备的输入装置可以是显示屏上覆盖的触摸层，也可以是计算机设备外壳上设置的按键、轨迹球或触控板，还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解，图10中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现以下步骤：

获取待识别的目标文本问句，在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，并确定各所述候选相似问句对应的候选意图；

对于每个所述候选意图，根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征；

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

获取所述目标文本问句对应的目标问句向量，并确定各所述候选相似问句对应的相似问句向量；

确定所述目标问句向量和各所述相似问句向量之间的相似度值，并确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值；

将所述和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为所述目标意图。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

检测各所述相似度值是否大于预设的相似度阈值；

若大于，则执行所述确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值的步骤。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

对所述目标文本问句添加起始标志位和结束标志位；

将添加后的所述目标文本问句输入至深度双向预训练语言模型中，得到所述深度双向预训练语言模型输出的所述目标问句向量。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

根据各所述候选相似问句、各所述候选相似问句对应的相似度值以及各所述候选相似问句对应的召回分值，提取所述候选意图的所述意图特征。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

确定所述目标文本问句对应的业务标识，并根据所述业务标识，在所述问句数据库中筛选包括所述业务标识的多个初始相似问句；

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

按照各所述文本相似度从大到小的顺序，从所述多个初始相似问句中确定所述预设数量的所述多个候选相似问句。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

若所述目标意图的数量为一个，则查找所述目标意图对应的问句答案，并展示所述问句答案。

在一个实施例中，该处理器执行计算机程序时还实现以下步骤：

若所述目标意图的数量为多个，则展示所述多个目标意图，并获取用户输入的针对所述多个目标意图中任一个目标意图的选择指令；

根据所述选择指令，查找所述选择指令指示的目标意图对应的问句答案，并展示所述问句答案。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram以多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(ramb微秒)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

在一个实施例中，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现以下步骤：

获取待识别的目标文本问句，在预设的问句数据库中确定所述目标文本问句对应的多个候选相似问句，并确定各所述候选相似问句对应的候选意图；

对于每个所述候选意图，根据所述候选意图对应的至少一个所述候选相似问句，提取所述候选意图的意图特征；

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

获取所述目标文本问句对应的目标问句向量，并确定各所述候选相似问句对应的相似问句向量；

确定所述目标问句向量和各所述相似问句向量之间的相似度值，并确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值；

将所述和值大于预设和值阈值的至少一个候选相似问句所对应的候选意图作为所述目标意图。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

检测各所述相似度值是否大于预设的相似度阈值；

若大于，则执行所述确定各所述候选相似问句对应的相似度值和对应候选意图的排序分值的和值的步骤。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

对所述目标文本问句添加起始标志位和结束标志位；

将添加后的所述目标文本问句输入至深度双向预训练语言模型中，得到所述深度双向预训练语言模型输出的所述目标问句向量。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

根据各所述候选相似问句、各所述候选相似问句对应的相似度值以及各所述候选相似问句对应的召回分值，提取所述候选意图的所述意图特征。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

确定所述目标文本问句对应的业务标识，并根据所述业务标识，在所述问句数据库中筛选包括所述业务标识的多个初始相似问句；

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

按照各所述文本相似度从大到小的顺序，从所述多个初始相似问句中确定所述预设数量的所述多个候选相似问句。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

若所述目标意图的数量为一个，则查找所述目标意图对应的问句答案，并展示所述问句答案。

在一个实施例中，计算机程序被处理器执行时还实现以下步骤：

若所述目标意图的数量为多个，则展示所述多个目标意图，并获取用户输入的针对所述多个目标意图中任一个目标意图的选择指令；

根据所述选择指令，查找所述选择指令指示的目标意图对应的问句答案，并展示所述问句答案。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本发明的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对发明专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。因此，本发明专利的保护范围应以所附权利要求为准。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：王路;赵正锐;刘云峰
技术所有人：深圳追一科技有限公司
我是此专利的发明人

上一篇：一种用于机械加工厂的碎铁屑清理设备的制作方法
上一篇：一种基于固液相变材料的、压力驱动的制冷方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。