语句意图的确定方法及装置、存储介质与流程

文档序号:22916186发布日期:2020-11-13 15:57阅读:148来源:国知局
语句意图的确定方法及装置、存储介质与流程

本申请实施例涉及但不限于电子技术,尤其涉及一种语句意图的确定方法及装置、存储介质。



背景技术:

现有聊天机器人的意图理解,是基于已定义的意图分类体系的训练模型得到的。在对已定义的意图分类体系进行改变的情况下,需要对意图分类体系中增加的意图类别收集训练数据,并将收集到的训练数据加入到已定义的意图分类体系的训练数据中,对分类体系进行重新训练,从而对已定义的模型进行更新。

然而,收集增加的意图类别的训练数据耗时长、数据量少。并且,存在更新后的意图分类体系识别初始意图类别的效果变差等问题。因此,通过重新训练更新已定义的意图分类体系的方法会增加时间和人力成本,且不能保证分类效果,降低了分类体系的可维护性和可拓展性,不适用于实际的业务场景。



技术实现要素:

有鉴于此,本申请实施例提供一种语句意图的确定方法及装置、存储介质。

本申请实施例的技术方案是这样实现的:

第一方面,本申请实施例提供一种语句意图的确定方法,应用于意图分析模型,所述意图分析模型包括机器学习编码器和第一意图确定模型,所述方法包括:

所述机器学习编码器获得待分类的输入语句对应的输入向量;

所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

所述第一意图确定模型确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

第二方面,本申请实施例提供一种语句意图的确定装置应用于意图分析模型,所述意图分析模型包括机器学习编码器和第一意图确定模型,所述装置包括:

第一获得模块,用于获得待分类的输入语句对应的输入向量;

第二获得模块,用于获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

确定模块,用于确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

第三获得模块,用于在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

添加模块,用于将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

第三方面,本申请实施例提供语句意图的确定设备,包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述方法中的步骤。

第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行上述提供的语句意图的确定方法。

本申请实施例中,可以实现对待分类的输入语句与意图的向量化,便于计算意图与对待分类的输入语句之间的相似度,有利于实现语句意图的确定,并有利于在每一意图均不满足特定的相似度的情况下,添加待分类的输入语句对应的目标意图,从而有利于增加目标意图后,不需要对模型进行重新训练,实现线上模型更新;进一步地,对特定的意图集合增加的新意图的训练数据要求较低,且不会影响原有意图的预测效果,能够在新意图训练数据少的情况下,在线上实现较好的意图分类的效果。

附图说明

图1为本申请实施例提供的语句意图的确定方法的实现流程示意图;

图2为本申请实施例提供的语句意图的确定方法的实现流程示意图;

图3为本申请实施例提供的语句意图的确定方法的实现流程示意图;

图4为本申请实施例提供的语句意图的确定方法的实现流程示意图;

图5为本申请实施例提供的语句意图的确定方法的实现流程示意图;

图6为本申请实施例提供的语句意图的确定装置的组成结构示意图;

图7为本申请实施例中计算机设备的一种硬件实体示意图。

具体实施方式

下面结合附图和实施例对本申请的技术方案进一步详细阐述。

图1为本申请实施例提供的语句意图的确定方法的实现流程示意图,如图1所示,该方法包括:

步骤s110,机器学习编码器获得待分类的输入语句对应的输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

这里,所述机器学习编码器可以为深度学习网络,例如,可以为卷积神经网络(convolutionalneuralnetworks,cnn),还可以为递归神经网络(recursiveneuralnetwork,rnn)。例如,机器学习编码器可以为时间rnn中的长短期记忆人工神经网络(long-shorttermmemory,lstm)。所述机器学习编码器可以用于将一个用户语句转换为一个高维语义向量。

这里,所述待分类的输入语句可以为用户发送的语音。例如,可以为线上聊天室(chatbot)中发送的语音。这里,所述输入向量可以为根据将所述用户发送的语音通过机器学习编码器转换得到的高位语义向量。

这里,所述意图分析模型可以为具有自动更新功能的模型,用于在增加新意图的情况下,不需要对模型重新训练,也能够自动且快速地实现模型的更新。这里,第一意图确定模型可以为具有相似度计算、相似度比较和归一化功能的模型。

步骤s120,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

这里,所述特定的意图集合可以为待分类的输入语句对应的可能类别。例如,待分类的输入语句为“鼠标维修”,可能的类别为“维修”、“鼠标”、“售后”……等,这些可能类别组成的集合即为特定的意图集合。

步骤s130,所述第一意图确定模型确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

这里,对所述输入向量与向量集合中的每一所述语义向量进行相似度计算,得到的每一相似度都可以表示该语义向量与输入向量的相似程度。

步骤s140,在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

这里,所述特定的相似度值可以为预设的相似度值,在所述相似度集合中不存在大于等于所述预设的相似度值的情况下,表征当前意图集合中的意图类别无法表示待分类的输入语句。

这里,所述意图分析模型的外部获取的方式可以为网络搜索的方式。所述目标意图可以为与待分类的输入语句对应的意图,例如,可以为与待分类输入语句的相似度大于0.95的语句。

在一些实施例中,通过网络搜索的方式获得与待分类的输入语句对应的目标意图。

步骤s150,所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

这里,还可以利用机器学习编码器对所述目标意图转换为一个高维语义向量,即得到目标向量,然后第一意图确定模型将目标向量加入向量集合,以实现更新向量集合。

所述第二意图确定模型可以看作为是在更新第一意图确定模型的基础上得到一个模型,也就是当前意图确定模型都可以作为训练过程或使用模型进行处理图像过程中的一个中间模型。

在一些实施例中,将所述第一意图确定模型更新为第二意图确定模型后,不需要对模型进行重新训练,在所述待分类的输入语句更新的情况下,将更新后的第二意图确定模型作为当前的意图分析模型,对新的输入语句进行语句意图的确定。

在本申请实施例中,可以实现对待分类的输入语句与意图的向量化,便于计算意图与对待分类的输入语句之间的相似度,有利于实现语句意图的确定,并有利于在每一意图均不满足特定的相似度的情况下,添加待分类的输入语句对应的目标意图,从而有利于增加目标意图后,不需要对模型进行重新训练,实现线上模型更新;进一步地,对特定的意图集合增加的新意图的训练数据要求较低,且不会影响原有意图的预测效果,能够在新意图训练数据少的情况下,在线上实现较好的意图分类的效果。

图2为本申请实施例提供的语句意图的确定方法的实现流程示意图,如图2所示,该方法包括:

步骤s210,机器学习编码器获得待分类的输入语句对应的输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

步骤s220,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

步骤s230,所述第一意图确定模型确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

步骤s240,在确定所述相似度集合中存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型将相似度满足大于等于特定的相似度值的意图,确定为所述输入语句所对应的目标意图。

在一些实施例中,步骤s240,所述第一意图确定模型将相似度满足大于等于特定的相似度值的意图,确定为所述输入语句所对应的目标意图,包括:

步骤s241,所述第一意图确定模型将每一所述相似度进行归一化,得到所述输入语句属于对应意图的概率;

这里,所述归一化的方法可以为softmax。

步骤s242,所述第一意图确定模型将概率满足第二条件的意图,确定为所述输入语句所对应的目标意图。

举例说明,所述待分类的输入语句为用户语句u,用户语句u与每个意图的描述iij的相似度可以表示为cossim(u,iij),其中,iij代表第i个意图的第j个描述话语。对cossim(u,iij)进行softmax归一化,得到用户语句u属于每个意图的概率p(ii|u);取概率值最大的意图作为用户语句的意图。

在本申请实施例中,对每一所述相似度进行归一化,得到所述输入语句属于对应意图的概率。这样,可以将概率值最大的意图确定为所述输入语句所对应的目标意图,有利于提高用于输入语句意图确定的准确性。

图3为本申请实施例提供的语句意图的确定方法的实现流程示意图,如图3所示,该方法包括:

步骤s310,机器学习编码器将所述特定的意图集合中每一所述意图,按照均匀分布或正态分布随机生成第一初始向量;

这里,所述第一初始向量进行向量化的过程为:按照均匀分布或正态分布随机生成高维向量。例如,按照均匀分布或正态分布随机生成128维的初始向量。

步骤s320,所述机器学习编码器将每一所述第一初始向量进行线性变换,得到对应意图的语义向量;

步骤s330,机器学习编码器将待分类的输入语句,按照均匀分布或正态分布随机生成初始输入向量;

步骤s340,所述机器学习编码器将所述初始输入向量进行线性变换,得到输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

步骤s350,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

步骤s360,所述第一意图确定模型确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

步骤s370,在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

步骤s380,所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

在本申请实施例中,通过机器学习编码器将待分类的输入语句和特定的意图集合进行向量化,这样,有利于将待分类的输入语句和特定的意图集合中的每一意图进行相似度计算,提高用于输入语句意图确定的准确性。

图4为本申请实施例提供的语句意图的确定方法的实现流程示意图,如图4所示,该方法包括:

步骤s410,机器学习编码器获得待分类的输入语句对应的输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

步骤s420,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

步骤s430,所述意图集合中的每一意图包括至少一种定义描述和至少一种答案描述,每一所述意图对应的语义向量中包括至少一个定义描述向量和至少一个答案描述向量;所述第一意图确定模型利用余弦相似度对所述输入向量与每一定义描述对应的定义描述向量进行相似度计算,得到对应的第一相似度;

这里,所述定义描述为意图的定义,用于定义这个意图类别具有哪些内容;所述答案描述是针对意图的答案。

举例说明,当意图为鼠标维修时,所述意图的定义描述为“与鼠标相关”。所述意图的答案描述为“售后维修”、“检查鼠标插口”、“检查指示灯是否点亮”等。又例如,一个意图为“订单”,所述定义描述是“订单退款”或“订单查询”。

步骤s440,所述第一意图确定模型利用余弦相似度对所述输入向量与每一答案描述对应的答案描述向量进行相似度计算,得到对应的第二相似度;

步骤s450,所述第一意图确定模型根据每一所述定义描述的第一相似度和每一所述答案描述的第二相似度,确定所述相似度,得到相似度集合;

这里,所述相似度集合中至少包括一个第一相似度与至少2个第二相似度。

这里,确定所述相似度为每一输入向量与每一意图的语义向量之间的相似度。这里,所述每一意图的语义向量中包括至少一个定义描述向量和至少一个答案描述向量。

在一些实施例中,首先,将所述输入向量分别与每一意图的n1个定义描述向量,或者,n2个答案描述向量进行相似度计算,得到至n1个第一相似度,或者,n2个第二相似度;其次,根据(n1+n2)个相似度,确定输入向量与每一意图之间的相似度;最后,n3意图确定的相似度组成相似度集合。

步骤s460,在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

步骤s470,所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

在本申请实施例中,首先,对所述输入向量与每一定义描述对应的定义描述向量进行相似度计算,得到对应的第一相似度;其次,对所述输入向量与每一答案描述对应的答案描述向量进行相似度计算,得到对应的第二相似度。如此,可以提供更丰富的意图内容,提高用于输入语句意图确定的准确性。

本申请实施例提供的语句意图的确定方法,该方法包括:

步骤s510,机器学习编码器获得待分类的输入语句对应的输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

步骤s520,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

步骤s530,所述意图集合中的每一意图包括至少一种定义描述和至少一种答案描述,每一所述意图对应的语义向量中包括至少一个定义描述向量和至少一个答案描述向量;所述第一意图确定模型利用余弦相似度对所述输入向量与每一定义描述对应的定义描述向量进行相似度计算,得到对应的第一相似度;

步骤s540,所述第一意图确定模型利用余弦相似度对所述输入向量与每一答案描述对应的答案描述向量进行相似度计算,得到对应的第二相似度;

步骤s550,所述第一意图确定模型从每一所述定义描述的第一相似度和每一所述答案描述的第二相似度中,确定最大的相似度为所述相似度,得到相似度集合;或者,所述第一意图确定模型确定每一所述定义描述的第一相似度和每一所述答案描述的第二,将所述算术平均值,确定为所述相似度,得到相似度集合;

步骤s560,在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

步骤s570,所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

在本申请实施例中,通过将确定最大的相似度,或者,相似度的算术平均值确定为所述相似度;如此,可以通过确定最大值实现对相似度的筛选,或,通过计算平均值缩小相似度数值分布的区间,从而提高模型准确性,提升意图分析模型确定语句意图的性能。

本申请实施例提供的语句意图的确定方法,该方法包括:

步骤s610,机器学习编码器获得待分类的输入语句对应的输入向量;其中,所述语句意图的确定方法应用于意图分析模型,所述意图分析模型包括所述机器学习编码器和第一意图确定模型;

步骤s620,所述第一意图确定模型获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

步骤s630,所述第一意图确定模型确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

步骤s640,在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

步骤s650,所述第一意图确定模型将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

步骤s660,所述第一意图确定模型将获得新增的意图加入所述意图集合;

这里,需要说明的是,新增的意图与前述的目标意图不同,所述新增的意图是根据业务需求,新增加的意图。这里,所述新增的意图中包括新意图的定义描述inew-definition以及对应的答案描述inew-answer。

步骤s670,所述第一意图确定模型将所述新增的意图,按照均匀分布或正态分布随机生成第二初始向量;

步骤s680,所述第一意图确定模型将所述第二初始向量进行线性变换,得到新增的语义向量;

步骤s690,所述第一意图确定模型将所述新增的语义向量加入所述特定的向量集合,以完成从所述第一意图确定模型更新到第三意图确定模型。

这里,所述第三意图确定模型为增加了新的语义向量的模型。

举例说明,假设业务又新增加了一个新的意图inew,不需要对之前的模型重新训练,需要将新意图的定义描述inew-definition以及对应的答案inew-answer输入到模型中得到对应的语义向量,然后将其加入到原有的意图集合中,即可完成模型的更新。

在本申请实施例中,将所述第一意图确定模型将所述新增的语义向量加入所述特定的向量集合,以完成从所述第一意图确定模型更新到第三意图确定模型,如此,在意图增加时,不需要对模型重新进行训练,在将训练后的模型发布上线,而是可以实现线上的模型更新,增加模型更新的时效性。

本申请实施例提供的语句意图的确定方法,其中,以所述待分类的输入语句为用户语句,所述机器学习编码器为深度学习模型训练意图向量编码器为例,该方法包括:

第一部分:模型训练,包括步骤s11至步骤s15:

步骤s11,n个用户语句与意图的描述,作为训练数据,通过深度学习模型训练意图向量编码器;

这里,所述意图的描述可以包括意图的定义描述以及意图的答案描述。所述深度学习模型可以为cnn或lstm等深度学习模型。所述意图向量编码器用于将输入的用户语句转化为n维向量,代表用户语句的语义。

举例说明,用户语句为text1,text2,…,textn。意图的定义描述为intent1-definition,意图的答案描述为intent1-answer1,intent1-answer2,…,intent1-answern。将n个用户语句与每个意图对应的定义描述和它对应的n个答案描述,作为训练数据,通过cnn的深度学习模型训练意图向量编码器。这里,通过损失函数判断模型的训练情况,所述损失函数表征预测结果和实际结果之间的差别。当损失函数计算得到的损失值最小时,网络参数对应的意图分析模型为最优的意图分析模型。

步骤s12,利用意图向量编码器将所述用户语句u以及每个意图的描述转换为语义向量;

步骤s13,计算用户语句u与每个意图的描述iij的相似度;

这里,所述相似度代表语义的接近程度,所述相似度的计算可以通过余弦相似度得到,用户语句u与每个意图的描述iij的相似度可以表示为cossim(u,iij),其中,iij代表第i个意图的第j个描述话语。

这里,用户语句u与每个意图的相似度cossim(u,iij),可以通过取相似度平均值,或相似度的最大值确定相似度,可以表示为公式(1):

cossim(u,ii)=max{cossim(u,iij)};(1);

或者,

cossim(u,ii)=average{cossim(u,iij)};(1);

步骤s14,对所述相似度进行归一化,得到用户语句u属于每个意图的概率p(ii|u);

这里,所述归一化的方法可以为softmax。取概率值最大的意图作为用户语句的意图。

步骤s15,根据损失函数确定损失值,并利用反向传播不断更新网络参数,完成意图分析模型的训练。

这里,所述损失函数可以为交叉熵损失函数,所述网络参数可以为网络的权重w和偏差b。

第二部分:模型预测,包括步骤s21至步骤s23:

步骤s21,将用户的语句及每个意图的描述作为输入,添加到意图分析模型中,得到对应的语义向量集合;

步骤s22,对每一个语义向量计算相似度,并将得到的相似度进行归一化;

这里,所述归一化为数据变成(0,1)或者(1,1)之间的小数。通过归一化的方法可以简化数据处理。

步骤s23,选择概率p(ii|u)最大的意图,作为预测结果输出。

第三部分:更新意图分类体系,包括步骤s21至步骤s132:

步骤s31,在增加了一个意图inew的情况下,将新意图的定义描述inew-definition以及对应的答案描述inew-answer作为输入,添加到模型中,得到意图对应的语义向量;

步骤s32,将所述语义向量加入到语义向量集合中,完成模型的更新。

图5为本申请实施例提供的语句意图的确定方法的实现流程示意图,如图5所示,该方法包括:

(1)模型训练:

步骤s51,计算余弦相似度;

这里,所述余弦相似度为用户语句对应的语义向量与初始意图集合对应的语义向量,这里,初始意图集合为意图对应的语义向量集合。每一初始的意图集合中的语义向量与用户语句得到每一相似度,所述每一相似度组成相似度集合。

步骤s52,确定用户语句对应的相似度;

这里,将所述相似度集合中的最大值,或者,将相似度集合的平均值确定为用户语句对应的相似度similarity(u,i1)。

步骤s53,softmax归一化;

在一些实施例中,对相似度similarity(u,i1)进行softmax归一化,得到,得到用户语句u属于每个意图的概率p(ii|u)。

步骤s54a,直接输出概率最大对应的意图。

这里,将概率p(ii|u)最大的意图确定为用户语句对应的意图。

(2)模型预测:

步骤s51,计算余弦相似度;

步骤s52,确定用户语句对应的相似度;

步骤s53,softmax归一化;

步骤s54b,计算交叉熵损失;

这里,所述交叉熵损失可以为softmax交叉熵损失。通过得到的损失值,对意图向量编码器进行更新,从而更新用户语句对应的语义向量,进而更新第一意图确定模型,由此更新意图分析模型。

这里,在意图分析模型添加新意图的情况下,可以通过意图向量编码器对新意图进行向量化,得到对应的语义向量,并将所述对应的语义向量加入初始的意图集合,得到新的意图集合,并更新意图分析模型。

在本申请实施例中,通过更新意图分类体系,不需要对模型重新训练,能够自动、快速地实现线上模型更新;并且对新增加意图的训练数据要求较低,且不会影响原有意图的预测效果,能够在新意图训练数据少的情况下,也能在线上实现较好的意图分类的效果。

基于前述的实施例,本申请实施例提供一种语句意图的确定装置,该装置包括所包括的各单元、以及各单元所包括的各模块,可以通过计算机设备中的处理器来实现;当然也可通过具体的逻辑电路实现;在实施的过程中,处理器可以为中央处理器(cpu)、微处理器(mpu)、数字信号处理器(dsp)或现场可编程门阵列(fpga)等。

图6为本申请实施例提供的语句意图的确定装置的组成结构示意图,如图6所示,所述装置600包括第一获得模块601、第二获得模块602、第一确定模块603、第三获得模块604和第一添加模块605,其中:

所述第一获得模块601,用于获得待分类的输入语句对应的输入向量;

所述第二获得模块602,用于获得特定的向量集合,其中,所述向量集合为机器学习编码器对特定的意图集合中每一意图进行解码后得到的语义向量所组成的集合;

所述第一确定模块603,用于确定所述输入向量与所述向量集合中每一所述语义向量之间的相似度,得到相似度集合;

所述第三获得模块604,用于在确定所述相似度集合中不存在相似度大于等于特定的相似度值情况下,从所述意图分析模型的外部获取所述输入语句所对应的目标意图;

所述第一添加模块605,用于将所述输入向量加入所述特定的向量集合,以更新所述向量集合,将所述目标意图加入所述特定的意图集合,以更新所述意图向量,以完成从所述第一意图确定模型更新到第二意图确定模型。

在一些实施例中,所述装置600还包括第二确定模块,其中:所述第二确定模块,用于在确定所述相似度集合中存在相似度大于等于特定的相似度值情况下,所述第一意图确定模型将相似度满足大于等于特定的相似度值的意图,确定为所述输入语句所对应的目标意图。

在一些实施例中,所述第二确定模块包括归一化子模块和第一确定子模块,其中:所述归一化子模块,用于将每一所述相似度进行归一化,得到所述输入语句属于对应意图的概率;所述第一确定子模块,用于所述将概率满足第二条件的意图,确定为所述输入语句所对应的目标意图。

在一些实施例中,所述第一获得模块601包括生成子模块和线性变换子模块,其中:所述生成子模块,用于将所述待分类的输入语句,按照均匀分布或正态分布随机生成初始输入向量;所述线性变换子模块,用于将所述初始输入向量进行线性变换,得到所述输入向量。

在一些实施例中,所述装置600还包括第一生成模块和第一线性变换模块,其中:所述第一生成模块,用于将所述特定的意图集合中每一所述意图,按照均匀分布或正态分布随机生成第一初始向量;所述第一线性变换模块,用于将每一所述第一初始向量进行线性变换,得到对应意图的语义向量。

在一些实施例中,所述意图集合中的每一意图包括至少一种定义描述和至少一种答案描述,每一所述意图对应的语义向量中包括至少一个定义描述向量和至少一个答案描述向量;所述第一确定模块603包括第一计算子模块、第二计算子模块和第二确定子模块,其中:所述第一计算子模块,用于利用余弦相似度对所述输入向量与每一定义描述对应的定义描述向量进行相似度计算,得到对应的第一相似度;所述第二计算子模块,用于利用余弦相似度对所述输入向量与每一答案描述对应的答案描述向量进行相似度计算,得到对应的第二相似度;所述第二确定子模块,用于根据每一所述定义描述的第一相似度和每一所述答案描述的第二相似度,确定所述相似度,得到相似度集合。

在一些实施例中,所述第二确定子模块包括第一确定单元和第二确定单元,其中:所述第一确定单元,用于从每一所述定义描述的第一相似度和每一所述答案描述的第二相似度中,确定最大的相似度为所述相似度,得到相似度集合;或者,所述第二确定单元,用于确定每一所述定义描述的第一相似度和每一所述答案描述的第二相似度的算术平均值,将所述算术平均值,确定为所述相似度,得到相似度集合。

在一些实施例中,所述装置600还包括第四获得模块、第二生成模块、第二线性变换模块和第二添加模块,其中:第四获得模块,用于将获得新增的意图加入所述意图集合;第二生成模块,用于将所述新增的意图,按照均匀分布或正态分布随机生成第二初始向量;第二线性变换模块,用于将所述第二初始向量进行线性变换,得到新增的语义向量;第二添加模块,用于将所述新增的语义向量加入所述特定的向量集合,以完成从所述第一意图确定模型更新到第三意图确定模型。

这里需要指出的是:以上装置实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请装置实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。

需要说明的是,本申请实施例中,如果以软件功能模块的形式实现上述的语句意图的确定方法,并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:u盘、移动硬盘、只读存储器(readonlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。这样,本申请实施例不限制于任何特定的硬件和软件结合。

对应地,本申请实施例提供一种语句意图的确定设备(实现时可以为一台计算机设备),包括存储器和处理器,所述存储器存储有可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例中提供的方法中的步骤。

对应地,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可执行指令,所述计算机可读存储介质中存储有计算机可执行指令,该计算机可执行指令配置为执行所述程序时实现上述实施例中提供的语句意图的确定方法。

这里需要指出的是:以上存储介质和设备实施例的描述,与上述方法实施例的描述是类似的,具有同方法实施例相似的有益效果。对于本申请存储介质和设备实施例中未披露的技术细节,请参照本申请方法实施例的描述而理解。

需要说明的是,图7为本申请实施例中计算机设备的一种硬件实体示意图,如图7所示,该计算机设备700的硬件实体包括:处理器701、通信接口702和存储器703,其中

处理器701通常控制计算机设备700的总体操作。

通信接口702可以使计算机设备通过网络与其他计算机设备通信。

存储器703配置为存储由处理器701可执行的指令和应用,还可以缓存待处理器701以及计算机设备700中各模块待处理或已经处理的数据(例如,图像数据、音频数据、语音通信数据和视频通信数据),可以通过闪存(flash)或随机访问存储器(randomaccessmemory,ram)实现。

应理解,说明书通篇中提到的“一个实施例”或“一实施例”意味着与实施例有关的特定特征、结构或特性包括在本申请的至少一个实施例中。因此,在整个说明书各处出现的“在一个实施例中”或“在一实施例中”未必一定指相同的实施例。此外,这些特定的特征、结构或特性可以任意适合的方式结合在一个或多个实施例中。应理解,在本申请的各种实施例中,上述各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。

需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。

在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。以上所描述的设备实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,如:多个单元或组件可以结合,或可以集成到另一个系统,或一些特征可以忽略,或不执行。另外,所显示或讨论的各组成部分相互之间的耦合、或直接耦合、或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性的、机械的或其它形式的。

上述作为分离部件说明的单元可以是、或也可以不是物理上分开的,作为单元显示的部件可以是、或也可以不是物理单元;既可以位于一个地方,也可以分布到多个网络单元上;可以根据实际的需要选择其中的部分或全部单元来实现本实施例方案的目的。

另外,在本申请各实施例中的各功能单元可以全部集成在一个处理单元中,也可以是各单元分别单独作为一个单元,也可以两个或两个以上单元集成在一个单元中;上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。

本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:移动存储设备、只读存储器(readonlymemory,rom)、磁碟或者光盘等各种可以存储程序代码的介质。

或者,本申请上述集成的单元如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请实施例的技术方案本质上或者说对相关技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机等)执行本申请各个实施例所述方法的全部或部分。而前述的存储介质包括:移动存储设备、rom、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本申请的实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1