多场景应用下的意图识别方法、装置、设备及存储介质与流程

文档序号:21639251发布日期:2020-07-29 02:50阅读:228来源:国知局
多场景应用下的意图识别方法、装置、设备及存储介质与流程

本发明涉及人工智能领域,尤其涉及多场景应用下的意图识别方法、装置、设备及存储介质。



背景技术:

随着计算机技术的快速发展,人工智能技术应用的领域越来越广泛,通过人工智能技术能够让机器解读用户意图,帮助用户完成特定任务,为用户带来了人性化的服务体验和服务便利。

在人工智能技术中,在自然语言处理时通常需要应用到文本分类器,文本分类器与基于神经网络的分类算法相比具有保持高精度、提高训练速度、提高测试速度以及准确率比肩深度学习模型的优点。

但是,在传统的文本分类器应用中,往往单个任务需要配置一个对应的分类器,若项目需求中存在n个任务场景,那么需要配置n个文本分类器;当模型容量较小时,文本分类器的数量对终端的影响可能还不明显;当模型容量较大时,同时加载多个文本分类器会占用大量的内存空间,且对终端的内存空间造成较大的负荷,造成不可预测的结果。



技术实现要素:

本发明实施例提供了一种多场景应用下的意图识别方法、装置、设备及存储介质,用于通过一个输入层提取不同场景文本的特征向量,利用预置场景标识控制特征向量进入对应的隐藏层进行非线性操作,得到目标人员的意图,降低了内存空间的占用,减少了终端需要处理的任务量。

本发明实施例的第一方面提供一种多场景应用下的意图识别方法,包括:在目标人员的多种语音场景信息中获取场景文本数据;将所述场景文本数据输入预置场景模型进行标签预测,得到预测场景标签;将所述预测场景标签与多个预置场景标识匹配,得到目标场景标识,所述目标场景标识属于所述多个预置场景标识;根据所述目标场景标识将所述场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,所述目标场景隐藏层属于所述多个预置场景隐藏层;根据所述目标场景向量和预置输出层,获取目标标签,并根据所述目标标签得到意图场景标签;根据所述意图场景标签,确定目标人员的意图。

可选的,在本发明实施例第一方面的第一种实现方式中,所述根据所述目标场景标识将所述场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,所述目标场景隐藏层属于所述多个预置场景隐藏层包括:将所述场景文本数据输入至预置输入层,得到场景特征向量;根据所述目标场景标识,在所述多个预置场景隐藏层中获取目标场景隐藏层,并将所述场景特征向量传输至所述目标场景隐藏层;在所述目标场景隐藏层中对所述场景特征向量进行非线性计算,得到多个文档向量;将所述多个文档向量进行拼接,得到目标场景向量。

可选的,在本发明实施例第一方面的第二种实现方式中,所述根据所述目标场景标识,在所述多个预置场景隐藏层中获取目标场景隐藏层,并将所述场景特征向量传输至所述目标场景隐藏层包括:将所述目标场景标识与所述多个预置场景隐藏层进行匹配,得到隐藏层概率序列;在所述隐藏层概率序列中搜寻最大概率,得到最大隐藏层概率;根据所述最大隐藏层概率,得到目标场景隐藏层,并将所述场景特征向量输入至所述目标场景隐藏层,所述目标场景隐藏层为最大隐藏层概率对应的预置场景隐藏层。

可选的,在本发明实施例第一方面的第三种实现方式中,所述将所述场景文本数据输入至预置输入层,得到场景特征向量包括:对所述场景文本数据进行分词,得到分词数据;基于预置向量模型,将所述分词数据转换为词向量;将所述词向量相加,得到场景特征向量。

可选的,在本发明实施例第一方面的第四种实现方式中,所述根据所述目标场景向量和预置输出层,获取目标标签,并根据所述目标标签得到意图场景标签包括:基于预置输出层中的预置概率函数,计算所述目标场景向量的标签概率,得到目标标签概率序列;在所述目标标签概率序列中搜寻最小的两个标签概率,并将所述两个标签概率相加,构建二叉树,得到节点概率;判断所述节点概率是否为概率阈值;若所述节点概率不为概率阈值,则在剩余目标标签概率序列中搜寻最小的两个标签概率,构建二叉树,直到得到的节点概率为概率阈值时停止搜寻,得到目标二叉树;根据所述目标二叉树进行霍夫曼编码,得到目标标签编码;基于所述目标标签编码,得到目标标签,并根据所述目标标签得到意图场景标签。

可选的,在本发明实施例第一方面的第五种实现方式中,在所述在目标人员的多种语音场景信息中获取场景文本数据之后,在所述将所述场景文本数据输入预置场景模型进行标签预测,得到预测场景标签之前,所述多场景应用下的意图识别方法还包括:将所述场景文本数据输入预置初始场景模型,得到输入层权重、隐藏层权重、输出层权重和输出标签;根据所述输入层权重、所述隐藏层权重、所述输出层权重和所述输出标签,更新所述预置初始场景模型,得到预置场景模型。

可选的,在本发明实施例第一方面的第六种实现方式中,所述根据所述输入层权重、所述隐藏层权重、所述输出层权重和所述输出标签,更新所述预置初始场景模型,得到预置场景模型包括:判断所述输出标签与预置真实标签的误差值是否大于误差阈值;若所述输出标签与所述预置真实标签的误差值大于所述误差阈值,则采用梯度下降法将所述误差值进行反向传播,将所述误差值传播至所述预置输入层,并调整所述输入层权重、所述隐藏层权重和所述输出层权重,得到预置场景模型。

本发明实施例的第二方面提供一种多场景应用下的意图识别装置,包括:

第一获取单元,用于在目标人员的多种语音场景信息中获取场景文本数据;

预测单元,用于将所述场景文本数据输入预置场景模型进行标签预测,得到预测场景标签;

匹配单元,用于将所述预测场景标签与多个预置场景标识匹配,得到目标场景标识,所述目标场景标识属于所述多个预置场景标识;

第二获取单元,用于根据所述目标场景标识将所述场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,所述目标场景隐藏层属于所述多个预置场景隐藏层;

第三获取单元,用于根据所述目标场景向量和预置输出层,获取目标标签,并根据所述目标标签得到意图场景标签;

确定单元,用于根据所述意图场景标签,确定目标人员的意图。

可选的,在本发明实施例第二方面的第一种实现方式中,所述第二获取单元具体包括:获取模块,用于将所述场景文本数据输入至预置输入层,得到场景特征向量;处理模块,用于根据所述目标场景标识,在所述多个预置场景隐藏层中获取目标场景隐藏层,并将所述场景特征向量传输至所述目标场景隐藏层;计算模块,用于在所述目标场景隐藏层中对所述场景特征向量进行非线性计算,得到多个文档向量;拼接模块,用于将所述多个文档向量进行拼接,得到目标场景向量。

可选的,在本发明实施例第二方面的第二种实现方式中,所述处理模块具体用于:将所述目标场景标识与多个所述预置场景隐藏层进行匹配,得到隐藏层概率序列;在所述隐藏层概率序列中搜寻最大概率,得到最大隐藏层概率;根据所述最大隐藏层概率,得到目标场景隐藏层,并将所述场景特征向量输入至所述目标场景隐藏层,所述目标场景隐藏层为最大隐藏层概率对应的预置场景隐藏层。

可选的,在本发明实施例第二方面的第三种实现方式中,所述获取模块具体用于:对所述场景文本数据进行分词,得到分词数据;基于预置向量模型,将所述分词数据转换为词向量;将所述词向量相加,得到场景特征向量。

可选的,在本发明实施例第二方面的第四种实现方式中,所述第三获取单元具体用于:基于预置输出层中的预置概率函数,计算所述目标场景向量的标签概率,得到目标标签概率序列;在所述目标标签概率序列中搜寻最小的两个标签概率,并将所述两个标签概率相加,构建二叉树,得到节点概率;判断所述节点概率是否为概率阈值;若所述节点概率不为概率阈值,则在剩余目标标签概率序列中搜寻最小的两个标签概率,构建二叉树,直到得到的节点概率为概率阈值时停止搜寻,得到目标二叉树;根据所述目标二叉树进行霍夫曼编码,得到目标标签编码;基于所述目标标签编码,得到目标标签,并根据所述目标标签得到意图场景标签。

可选的,在本发明实施例第二方面的第五种实现方式中,所述多场景应用下的意图识别装置还包括:第四获取单元,用于将所述场景文本数据输入预置初始场景模型,得到输入层权重、隐藏层权重、输出层权重和输出标签;更新单元,用于根据所述输入层权重、所述隐藏层权重、所述输出层权重和所述输出标签,更新所述预置初始场景模型,得到预置场景模型。

可选的,在本发明实施例第二方面的第六种实现方式中,所述更新单元具体用于:判断所述输出标签与预置真实标签的误差值是否大于误差阈值;若所述输出标签与所述预置真实标签的误差值大于所述误差阈值,则采用梯度下降法将所述误差值进行反向传播,将所述误差值传播至所述预置输入层,并调整所述输入层权重、所述隐藏层权重和所述输出层权重,得到预置场景模型。

本发明实施例的第三方面提供了一种多场景应用下的意图识别设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施方式所述的多场景应用下的意图识别方法。

本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述第一方面所述的方法。

从以上技术方案可以看出,本发明实施例具有以下优点:

本发明的提供一种多场景应用下的意图识别方法、装置、设备及存储介质,在目标人员的多种语音场景信息中获取场景文本数据;将所述场景文本数据输入预置场景模型进行标签预测,得到预测场景标签;将所述预测场景标签与多个预置场景标识匹配,得到目标场景标识,所述目标场景标识属于所述多个预置场景标识;根据所述目标场景标识将所述场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,所述目标场景隐藏层属于所述多个预置场景隐藏层;根据所述目标场景向量和预置输出层,获取目标标签,并根据所述目标标签得到意图场景标签;根据所述意图场景标签,确定目标人员的意图。本发明实施例根据场景标识控制场景特征向量进入相对应的场景隐藏层进行非线性操作,得到目标人员的意图,降低了终端内存空间的占用,减少了终端需要处理的任务量。

附图说明

图1为本发明中多场景应用下的意图识别方法的一个实施例示意图;

图2为本发明中多场景应用下的意图识别方法的另一个实施例示意图;

图3为本发明中多场景应用下的意图识别装置的一个实施例示意图;

图4为本发明中多场景应用下的意图识别装置的另一个实施例示意图;

图5为本发明中多场景应用下的意图识别设备的一个实施例示意图。

具体实施方式

本发明实施例提供了一种多场景应用下的意图识别方法、装置、设备及存储介质,用于通过一个输入层提取不同场景文本的特征向量,利用预置场景标识控制特征向量进入对应的隐藏层进行非线性操作,得到目标人员的意图,降低了内存空间的占用,减少了终端需要处理的任务量。

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外,术语“包括”或“具有”及其任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

请参阅图1,本发明实施例中多场景应用下的意图识别方法一个实施例包括:

101、在目标人员的多种语音场景信息中获取场景文本数据。

终端在目标人员的多种语音场景信息中获取场景文本数据。

在本实施例中,终端从多种任务场景中获取场景文本数据,比如,终端可以从对话场景a中获取场景文本数据a,从对话场景b中获取场景文本数据b。

为了便于理解,下面结合具体场景进行说明:

目标人员说出“请问是张先生吗”的对话信息,终端获取“请问是张先生吗”的语音场景信息,再将“请问是张先生吗”的语音场景信息转换为相对应的场景文本数据,终端获取“请问是张先生吗”的场景文本数据。

102、将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签。

终端将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签。

终端在正式识别目标标签之前,先对场景文本数据进行预测,得到一个预测场景标签。例如,获取的场景文本数据为“请问是张先生吗?”,终端将“请问是张先生吗?”的场景文本数据作为一个训练数据,依次输入预置场景模型中的预置输入层、预置场景隐藏层和预置输出层,最终得到一个预测标签“确认身份”。

103、将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识。

终端将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识。

终端将预测场景标签与多个预置场景标识匹配,在多个预置场景标识中选择一个与预测场景标签最相似的预置场景标识作为目标场景标识。

104、根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层。

终端根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层。

终端首先将场景文本数据输入至预置输入层,得到场景特征向量,然后终端根据目标场景标识,在多个预置场景隐藏层中进行选择,得到目标场景隐藏层,终端将场景特征向量输入至目标场景标识相对应的目标场景隐藏层中,得到多个文档向量,终端最后将多个文档向量进行拼接,得到目标场景向量。

105、根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签。

终端根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签。

由于场景模型内部无法处理意图场景标签这种文字意图,所以终端只能通过预置场景模型将场景文本数据这种文字意图处理目标标签,终端再根据目标标签得到意图场景标签。

例如“请问您是张先生吗?”这组场景文本数据的意图是“确认身份”,我们可以定义“确认身份”这个目标人员的意图场景标签的类别为“标签1”,将目标场景向量输入至输出层,得到“标签1”的目标标签,根据“标签1”的目标标签,得到“确认身份”的意图场景标签。

106、根据意图场景标签,确定目标人员的意图。

终端根据意图场景标签,确定目标人员的意图。

例如“请问您是张先生吗?”这组场景文本数据的意图是“确认身份”,我们可以定义“确认身份”这个意图的类别为“标签1”,将目标场景向量输入至输出层,得到“标签1”的目标标签,根据“标签1”的目标标签,得到“确认身份”的意图场景标签,根据“确认身份”的意图场景标签确定目标人员的意图为“确认身份”。

本发明实施例根据场景标识控制场景特征向量进入相对应的场景隐藏层进行非线性操作,得到目标人员的意图,降低了终端内存空间的占用,减少了终端需要处理的任务量。

请参阅图2,本发明实施例中多场景应用下的意图识别方法另一个实施例包括:

201、在目标人员的多种语音场景信息中获取场景文本数据。

终端在目标人员的多种语音场景信息中获取场景文本数据。

在本实施例中,终端从多种任务场景中获取场景文本数据,比如,终端可以从对话场景a中获取场景文本数据a,从对话场景b中获取场景文本数据b。

202、将场景文本数据输入预置初始场景模型,得到输入层权重、隐藏层权重、输出层权重和输出标签。

终端将场景文本数据输入预置初始场景模型,得到输入层权重、隐藏层权重、输出层权重和输出标签。

终端将场景文本数据作为训练数据输入初始预置模型,训练数据经过输入层传入隐藏层,经过隐藏层传入输出层,在这个传播的过程中终端会得到输入层权重、隐藏层权重、输出层权重和输出标签。

203、根据输入层权重、隐藏层权重、输出层权重和输出标签,更新预置初始场景模型,得到预置场景模型。

终端根据输入层权重、隐藏层权重、输出层权重和输出标签,更新预置初始场景模型,得到预置场景模型。

具体的,终端判断输出标签与预置真实标签的误差值是否大于误差阈值;若输出标签与预置真实标签的误差值大于误差阈值,终端则采用梯度下降法将误差值进行反向传播,将误差值传播至预置输入层,并调整输入层权重、隐藏层权重和输出层权重,得到预置场景模型。

终端根据输出标签与预置真实标签计算的误差值,如果误差值大于误差阈值,终端则将误差值进行反向传播,反向传播时,将误差值使用梯度下降法计算。从隐藏层反向传播,直至输入层,在这过程中终端将误差值分到各层,使得输入层、隐藏层和输出层获得各自的误差信号,并通过误差信号修正输入层权重、隐藏层权重和输出层权重。终端通过调整各层权重,使误差值降到最低,达到更新初始预置模型的目的,终端最终获得预置文本分类器中的预置模型。

204、将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签。

终端将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签。

终端在正式识别目标标签之前,先对场景文本数据进行预测,得到一个预测场景标签。例如,获取的场景文本数据为“请问是张先生吗?”,终端将“请问是张先生吗?”的场景文本数据作为一个训练数据,依次输入预置场景模型中的预置输入层、预置场景隐藏层和预置输出层,最终得到一个预测标签“确认身份”。

205、将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识。

终端将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识。

终端将预测场景标签与多个预置场景标识匹配,在多个预置场景标识中选择一个与预测场景标签最相似的预置场景标识作为目标场景标识。

206、根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层。

终端根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层。

终端首先将场景文本数据输入至预置输入层,得到场景特征向量,然后终端根据目标场景标识,在多个预置场景隐藏层中进行选择,得到目标场景隐藏层,终端将场景特征向量输入至目标场景标识相对应的目标场景隐藏层中,得到多个文档向量,终端最后将多个文档向量进行拼接,得到目标场景向量。

具体的,终端将场景文本数据输入至预置输入层,得到场景特征向量;终端根据目标场景标识,在多个预置场景隐藏层中获取目标场景隐藏层,并将场景特征向量传输至目标场景隐藏层;终端在目标场景隐藏层中对场景特征向量进行非线性计算,得到多个文档向量;终端将多个文档向量进行拼接,得到目标场景向量。

终端将场景文本数据输入预置输入层进行向量化,得到场景特征向量,终端根据目标场景标识控制与场景特征向量进入对应的隐藏层,通过目标场景标识将场景特征向量输入至对应的隐藏层之后,场景特征向量不再进入其他预置场景隐藏层,在目标场景隐藏层中,对场景特征向量进行非线性计算,得到多个文档向量,由于进入到目标场景隐藏层中的场景特征向量不再进入其他预置场景隐藏层,则其他预置场景隐藏层的文档向量为0,那么将多个文档向量拼接得到目标场景向量。

对场景特征向量进行非线性计算时,终端用到如下公式:

式中,h为目标场景隐藏层中的文档向量,c为词语个数,w为预置输入层到目标场景隐藏层的预置权重矩阵。xi为场景特征向量。

终端根据上式得到多个文档向量中的一个文档向量,根据同样的方式,计算多个文档向量中的其他文档向量,得到多个文档向量。

在得到多个文档向量之后,终端对多个文档向量进行拼接,在拼接多个文档向量时,终端用到如下公式:

h=h1+0+0+0

式中,h为目标特征向量,h1和0为文档向量。

可选的,根据目标场景标识,在多个预置场景隐藏层中获取目标场景隐藏层,并将场景特征向量传输至目标场景隐藏层具体还包括:将目标场景标识与多个预置场景隐藏层进行匹配,得到隐藏层概率序列;在隐藏层概率序列中搜寻最大概率,得到最大隐藏层概率;根据最大隐藏层概率,得到目标场景隐藏层,并将场景特征向量输入至目标场景隐藏层,目标场景隐藏层为最大隐藏层概率对应的预置场景隐藏层。

终端使用softmax函数计算目标场景标识与多个预置场景隐藏层的匹配结果,得到隐藏层概率序列,在隐藏层概率序列中搜寻最大概率,得到最大隐藏层概率,最大隐藏层概率对应的预置场景隐藏层为目标场景隐藏层。

可选的,将场景文本数据输入至预置输入层,得到场景特征向量具体还包括:对场景文本数据进行分词,得到分词数据;基于预置向量模型,将分词数据转换为词向量;将词向量相加,得到场景特征向量。

文本向量化指的是将文本数据表示成一系列能够表达文本语义的向量。在进行文本向量化之前,首先要对文本数据进行分词,词是最小的能够独立活动的有意义的语言成分,英文单词之间是以空格作为自然分界符的,而汉语是以字为基本的书写单位,词语之间没有明显的区分标记,因此,中文词语分析是中文信息处理的基础与关键。

在本实施例中,采用正向最大匹配法对场景文本数据进行分词,终端首先从左向右取待切分场景文本数据的n个字符作为匹配字段,n为大机器词典中最长词条个数。然后查找大机器词典并进行匹配;如果匹配成功,将这个匹配字段作为一个分词数据切分出来。如果匹配不成功,将这个匹配字段的最后一个字去掉,剩下的字符串作为新的分词数据,进行再次匹配,重复以上过程,直到切分出所有分词数据为止。

例如,终端对“请问是张先生吗”这个场景文本数据进行分词,终端先从句子中拿出前三个字符“请问是”,将这3个字符与大机器词典进行匹配,结果显示匹配失败,则显示没有这个词,那就缩短取字符个数,取前两个“请问”,结果与大机器词典能够匹配成功,则说明有这个词,就把“请问”一次词切分出来,得到一个分词数据;然后再对剩余的五个字符进行正向最大匹配方法进行分词,终端最终得到“请问”、“是”、“张先生”和“吗”的分词数据。

在本实施例中,预置向量模型为n-gram模型,将分词数据输入n-gram模型中,得到词向量;

例如,“请问”的分词数据在n-gram模型识别到的汉语可能是“请问”或者是“晴闻”,终端需要通过n-gram模型求出每个分词数据出现的概率。

求解概率的过程如下所示:

p1=p(请|<bos>)×p(问|请)

p2=p(晴|<bos>)×p(闻|晴)

通过最大似然值,确定p1对应的分词数据为符合后续语义的分词数据,bos为大机器词典,“请”在大机器词典中出现的概率和“问”在大机器词典中及与“请”相匹配的概率,组成分词向量,终端最终将求得的分词向量相加,得到“请问是张先生吗”的特征向量,即场景特征向量。

207、根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签。

终端根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签。

由于场景模型内部无法处理意图场景标签这种文字意图,所以终端只能通过预置场景模型将场景文本数据这种文字意图处理目标标签,终端再根据目标标签得到意图场景标签。

例如“请问您是张先生吗?”这组场景文本数据的意图是“确认身份”,我们可以定义“确认身份”这个目标人员的意图场景标签的类别为“标签1”,将目标场景向量输入至输出层,得到“标签1”的目标标签,根据“标签1”的目标标签,得到“确认身份”的意图场景标签。

具体的,终端基于预置输出层中的预置概率函数,计算目标场景向量的标签概率,得到目标标签概率序列;终端在目标标签概率序列中搜寻最小的两个标签概率,并将两个标签概率相加,构建二叉树,得到节点概率;终端判断节点概率是否为概率阈值;若节点概率不为概率阈值,终端则在剩余目标标签概率序列中搜寻最小的两个标签概率,构建二叉树,直到得到的节点概率为概率阈值时停止搜寻,得到目标二叉树;终端根据目标二叉树进行霍夫曼编码,得到目标标签编码;终端基于目标标签编码,得到目标标签,并根据目标标签得到意图场景标签。

霍夫曼编码是一种编码方法,霍夫曼编码是可变字长编码的一种,霍夫曼编码使用变长编码表对源符号(如文本数据中的一个字母)进行编码,其中变长编码表是通过一种评估来源符号出现机率的方法得到的,出现机率高的字母使用较短的编码,反之出现机率低的则使用较长的编码,这便使编码之后的字符串的平均长度、期望值降低,从而达到无损压缩数据的目的。

在本实施例中,预置概率函数为softmax函数。终端首先使用softmax函数对目标场景向量进行计算,得到目标标签概率序列,然后将最小的两个标签概率相加,得到一个节点概率,此时的最小两个标签概率为第一二叉树的左右子树。如果此时节点概率不为1,则在剩余的标签概率(除上一次搜寻得到的最小的两个标签概率)中搜寻最小的两个标签概率,得到第一节点概率,此时的最小两个标签概率为第二二叉树的左右子树。重复构建二叉树的步骤,直至得到的节点概率为1,终端停止搜寻最小标签概率,此时,终端得到目标二叉树。终端将节点概率为1的每个二叉树的左子树指定为二进制中的0,右子树指定为二进制中的1,然后终端沿着最顶端的二叉树的顶部向下获取每个左右子树的编码,得到目标标签编码,终端根据得到的编码进行解码,得到目标标签,终端最终将目标标签映射为意图场景标签。

208、根据意图场景标签,确定目标人员的意图。

终端根据意图场景标签,确定目标人员的意图。

例如“请问您是张先生吗?”这组场景文本数据的意图是“确认身份”,我们可以定义“确认身份”这个意图的类别为“标签1”,将目标场景向量输入至输出层,得到“标签1”的目标标签,根据“标签1”的目标标签,得到“确认身份”的意图场景标签,根据“确认身份”的意图场景标签确定目标人员的意图为“确认身份”。

本发明实施例根据场景标识控制场景特征向量进入相对应的场景隐藏层进行非线性操作,得到目标人员的意图,降低了终端内存空间的占用,减少了终端需要处理的任务量。

上面对本发明实施例中多场景应用下的意图识别方法进行了描述,下面对本发明实施例中多场景应用下的意图识别装置进行描述,请参阅图3,本发明实施例中多场景应用下的意图识别装置一个实施例包括:

第一获取单元301,用于在目标人员的多种语音场景信息中获取场景文本数据;

预测单元302,用于将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签;

匹配单元303,用于将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识;

第二获取单元304,用于根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层;

第三获取单元305,用于根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签;

确定单元306,用于根据意图场景标签,确定目标人员的意图。

本发明实施例根据场景标识控制场景特征向量进入相对应的场景隐藏层进行非线性操作,得到目标人员的意图,降低了终端内存空间的占用,减少了终端需要处理的任务量。

请参阅图4,本发明实施例中多场景应用下的意图识别装置另一个实施例包括:

第一获取单元301,用于在目标人员的多种语音场景信息中获取场景文本数据;

预测单元302,用于将场景文本数据输入预置场景模型进行标签预测,得到预测场景标签;

匹配单元303,用于将预测场景标签与多个预置场景标识匹配,得到目标场景标识,目标场景标识属于多个预置场景标识;

第二获取单元304,用于根据目标场景标识将场景文本数据传输至对应的目标场景隐藏层,得到目标场景向量,目标场景隐藏层属于多个预置场景隐藏层;

第三获取单元305,用于根据目标场景向量和预置输出层,获取目标标签,并根据目标标签得到意图场景标签;

确定单元306,用于根据意图场景标签,确定目标人员的意图。

可选的,第二获取单元304具体包括:

获取模块3041,用于将场景文本数据输入至预置输入层,得到场景特征向量;

处理模块3042,用于根据目标场景标识,在多个预置场景隐藏层中获取目标场景隐藏层,并将场景特征向量传输至目标场景隐藏层;

计算模块3043,用于在目标场景隐藏层中对场景特征向量进行非线性计算,得到多个文档向量;

拼接模块3044,用于将多个文档向量进行拼接,得到目标场景向量。

可选的,处理模块3042具体用于:

将目标场景标识与多个预置场景隐藏层进行匹配,得到隐藏层概率序列;

在隐藏层概率序列中搜寻最大概率,得到最大隐藏层概率;

根据最大隐藏层概率,得到目标场景隐藏层,并将场景特征向量输入至目标场景隐藏层,目标场景隐藏层为最大隐藏层概率对应的预置场景隐藏层。

可选的,获取模块3041具体用于:

对场景文本数据进行分词,得到分词数据;

基于预置向量模型,将分词数据转换为词向量;

将词向量相加,得到场景特征向量。

可选的,第三获取单元305具体用于:基于预置输出层中的预置概率函数,计算目标场景向量的标签概率,得到目标标签概率序列;

在目标标签概率序列中搜寻最小的两个标签概率,并将两个标签概率相加,构建二叉树,得到节点概率;

判断节点概率是否为概率阈值;

若节点概率不为概率阈值,则在剩余目标标签概率序列中搜寻最小的两个标签概率,构建二叉树,直到得到的节点概率为概率阈值时停止搜寻,得到目标二叉树;

根据目标二叉树进行霍夫曼编码,得到目标标签编码;

基于目标标签编码,得到目标标签,并根据目标标签得到意图场景标签。

可选的,多场景应用下的意图识别装置还包括:

第四获取单元307,用于将场景文本数据输入预置初始场景模型,得到输入层权重、隐藏层权重、输出层权重和输出标签;

更新单元308,用于根据输入层权重、隐藏层权重、输出层权重和输出标签,更新预置初始场景模型,得到预置场景模型。

可选的,优选单元308具体用于:

判断输出标签与预置真实标签的误差值是否大于误差阈值;

若输出标签与预置真实标签的误差值大于误差阈值,则采用梯度下降法将误差值进行反向传播,将误差值传播至预置输入层,并调整输入层权重、隐藏层权重和输出层权重,得到预置场景模型。

本发明实施例根据场景标识控制场景特征向量进入相对应的场景隐藏层进行非线性操作,得到目标人员的意图,降低了终端内存空间的占用,减少了终端需要处理的任务量。

上面图3至图4从模块化功能实体的角度对本发明实施例中的多场景应用下的意图识别装置进行详细描述,下面从硬件处理的角度对本发明实施例中多场景应用下的意图识别设备进行详细描述。

下面结合图5对多场景应用下的意图识别设备的各个构成部件进行具体的介绍:

图5是本发明实施例提供的一种多场景应用下的意图识别设备的结构示意图,该多场景应用下的意图识别的设备500可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)501(例如,一个或一个以上处理器)和存储器509,一个或一个以上存储应用程序507或数据506的存储介质508(例如一个或一个以上海量存储设备)。其中,存储器509和存储介质508可以是短暂存储或持久存储。存储在存储介质508的程序可以包括一个或一个以上模块(图示没标出),每个模块可以包括对多场景应用下的意图识别设备中的一系列指令操作。更进一步地,处理器501可以设置为与存储介质508通信,在多场景应用下的意图识别设备500上执行存储介质508中的一系列指令操作。

多场景应用下的意图识别设备500还可以包括一个或一个以上电源502,一个或一个以上有线或无线网络接口503,一个或一个以上输入输出接口504,和/或,一个或一个以上操作系统505,例如windowsserve,macosx,unix,linux,freebsd等等。本领域技术人员可以理解,图5中示出的多场景应用下的意图识别设备结构并不构成对多场景应用下的意图识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。

下面结合图5对多场景应用下的意图识别设备的各个构成部件进行具体的介绍:

处理器501是多场景应用下的意图识别设备的控制中心,可以按照多场景应用下的意图识别方法进行处理。处理器501利用各种接口和线路连接整个多场景应用下的意图识别设备的各个部分,通过运行或执行存储在存储器509内的软件程序和/或模块,以及调用存储在存储器509内的数据,预置场景标识控制特征向量进入对应的隐藏层进行非线性操作,得到目标人员的意图,减少了终端需要处理的任务量。存储介质508和存储器509都是存储数据的载体,本发明实施例中,存储介质508可以是指储存容量较小,但速度快的内存储器,而存储器509可以是储存容量大,但储存速度慢的外存储器。

存储器509可用于存储软件程序以及模块,处理器501通过运行存储在存储器509的软件程序以及模块,从而执行多场景应用下的意图识别设备500的各种功能应用以及数据处理。存储器509可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据多场景应用下的意图识别设备的使用所创建的数据等。此外,存储器509可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在本发明实施例中提供的多场景应用下的意图识别程序和接收到的数据流存储在存储器中,当需要使用时,处理器501从存储器509中调用。

在计算机上加载和执行计算机程序指令时,全部或部分地产生按照本发明实施例的流程或功能。计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一计算机可读存储介质传输,例如,计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、双绞线)或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。计算机可读存储介质可以是计算机能够存储的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,光盘)、或者半导体介质(例如固态硬盘(solidstatedisk,ssd))等。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1