基于胶囊网络的意图识别方法及装置与流程

文档序号：26309866发布日期：2021-08-17 13:49阅读：179来源：国知局

本发明涉及人工智能，尤其是涉及到基于胶囊网络的意图识别方法、装置、计算机设备及计算机存储介质。

背景技术：

智能对话中，意图识别是非常重要的对话实现基础，即明确用户对话目的并进行反馈。在意图识别过程中，需要从用户的文字内容和用户的表情中发现情感和意图。相关技术中，意图识别主要由文本分类判别，但由于语言的博大精深和人类的丰富情感，意图在不同情感下也会有不同的意义。纯文本的方式识别，可能会对歧义意图误判，例如“我不需要”可能表达真的不需要、很厌烦不想再接听电话。情感识别作为另一个分类模块可和意图识别共同使用，情感识别通常分为文本情感识别和人脸情感识别。文本情感识别可根据说话文本识别表征情感的关键词，如喜怒哀乐，并经过文本分类器来判断具体的情感。人脸情感识别根据人的表情判断，如皱眉、笑、哭等，经过图像分类器来判断具体情感。进一步结合情感识别结果输出更细致的意图识别结果。

在实际应用场景中，意图识别和情感识别是两个相互独立的过程，单独人脸表情并不能非常准确捕捉用户的情感，比如皱眉，可能表示疑惑、无语、不耐烦、生气，需要很大量的图片训练，且每个人表情习惯有所不同，同样的，单独的意图识别并未考虑到交互过程中的情感信息，也不能够准确表达真实意图。但是由于交互过程中信息考察较少，即便输出意图和情感两个维度上的标签，也会使得最终意图识别结果存在偏差，影响意图识别的准确率。

技术实现要素：

有鉴于此，本发明提供了一种基于胶囊网络的意图识别方法、装置、计算机设备及计算机存储介质，主要目的在于解决现有技术中意图别和人脸表情识别作为两个相互独立的过程使得最终意图识别结果存在偏差，影响意图识别的准确率的问题。

依据本发明一个方面，提供了一种基于胶囊网络的意图识别方法，该方法包括：

获取交互对话中涉及的交互信息，并对所述交互信息进行标注，形成不同维度上的意图标签；

将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，所述意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，所述胶囊网络模型为包含多个神经元的载体，每个神经元表示交互对话中出现特定实体各种属性，所述属性为不同维度上的信息特征所形成不同类型的实例化参数；

响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。

在本发明另一实施例中，所述将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，具体包括：

从所述交互信息中抽象出文本意图维度上意图标签的信息、文本情感维度上意图标签的信息以及人脸情感维度上意图标签的信息，作为携带有不同维度上意图标签的交互信息；

将所述携带有不同维度上意图标签的交互信息进行量化来表示不同维度上意图标签的向量矩阵输入至胶囊网络模型中进行训练，构建意图识别模型。

在本发明另一实施例中，所述胶囊网络模型由多层结构组成，所述将所述携带有不同维度上意图标签的交互信息进行量化来表示不同维度上意图标签的向量矩阵输入至胶囊网络模型中进行训练，构建意图识别模型，包括：

利用所述胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征；

利用所述胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型。

在本发明另一实施例中，所述利用胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征，具体包括：

利用胶囊网络模型的编码层将携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵分别转换至文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量；

针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型；

利用所述适用于不同信息类型的交互信息进行预处理的特征提取模型，对所述文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量进行特征学习，得到文本意图维度上意图标签的信息特征、文本情感维度上意图标签的信息特征以及人脸情感维度上意图标签的信息特征。

在本发明另一实施例中，所述针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型，具体包括：

针对文本类型的交互信息，利用时间循环神经网络模型作为交互信息进行预处理的特征提取模型；

针对图片类型的交互信息，利用卷积神经网络模型作为交互信息进行预处理的特征提取模型。

在本发明另一实施例中，在所述利用胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型之后，所述方法还包括：

利用预先设置的损失函数，结合不同维度上意图标签对所述意图识别模型的模型参数进行调整，更新所述意图识别模型。

在本发明另一实施例中，所述意图识别模型的相关数据存储于区块链中，在所述响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果之后，所述方法还包括：

针对所述目标交互对话在不同维度上意图标签的意图识别结果，从预先设置的语料库中筛选出与所述不同维度上意图标签相匹配的语料作为回答语料进行输出。

依据本发明另一个方面，提供了一种基于胶囊网络的意图识别装置，所述装置包括：

获取单元，用于获取交互对话中涉及的交互信息，并对所述交互信息进行标注，形成不同维度上的意图标签；

构建单元，用于将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，所述意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，所述胶囊网络模型为包含多个神经元的载体，每个神经元表示交互对话中出现特定实体各种属性，所述属性为不同维度上的信息特征所形成不同类型的实例化参数；

识别单元，用于响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。

在本发明另一实施例中，所述构建单元包括：

抽象模块，用于从所述交互信息中抽象出文本意图维度上意图标签的信息、文本情感维度上意图标签的信息以及人脸情感维度上意图标签的信息，作为携带有不同维度上意图标签的交互信息；

构建模块，用于将所述携带有不同维度上意图标签的交互信息进行量化来表示不同维度上意图标签的向量矩阵输入至胶囊网络模型中进行训练，构建意图识别模型。

在本发明另一实施例中，所述胶囊网络模型由多层结构组成，所述构建模块包括：

提取子模块，用于利用所述胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征；

加权子模块，用于利用所述胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型。

在本发明另一实施例中，所述提取子模块，具体用于利用胶囊网络模型的编码层将携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵分别转换至文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量；

所述提取子模块，具体还用于针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型；

所述提取子模块，具体还用于利用所述适用于不同信息类型的交互信息进行预处理的特征提取模型，对所述文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量进行特征学习，得到文本意图维度上意图标签的信息特征、文本情感维度上意图标签的信息特征以及人脸情感维度上意图标签的信息特征。

在本发明另一实施例中，所述提取子模块，具体还用于针对文本类型的交互信息，利用时间循环神经网络模型作为交互信息进行预处理的特征提取模型；

所述提取子模块，具体还用于针对图片类型的交互信息，利用卷积神经网络模型作为交互信息进行预处理的特征提取模型。

在本发明另一实施例中，所述构建模块还包括：

调整子模块，用于在所述利用胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型之后利用预先设置的损失函数，结合不同维度上意图标签对所述意图识别模型的模型参数进行调整，更新所述意图识别模型。

在本发明另一实施例中，所述意图识别模型的相关数据存储于区块链中，所述装置还包括：

筛选单元，用于在所述响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果之后，针对所述目标交互对话在不同维度上意图标签的意图识别结果，从预先设置的语料库中筛选出与所述不同维度上意图标签相匹配的语料作为回答语料进行输出。

依据本发明又一个方面，提供了一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现基于胶囊网络的意图识别方法的步骤。

依据本发明再一个方面，提供了一种计算机存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现基于胶囊网络的意图识别方法的步骤。

借由上述技术方案，本发明提供一种基于胶囊网络的意图识别方法及装置，获取交互对话中涉及的交互信息，并对交互信息进行标注，形成不同维度上的意图标签，将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，该意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，响应于目标交互对话的意图识别指令，将目标交互对话中交互信息进行向量化后输入至意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。与现有技术中使用单一维度对交互信息进行意图识别的方式相比，通过将交互信息在不同维度上的信息特征经过意图识别模型进行意图识别，能够从多维度的信息特征对交互信息进行考察，增加意图识别的泛化能力，并在意图识别过程中融合多模态信息，可以节省内存和机器资源占用，提供更准确的意图识别结果。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中：

图1示出了本发明实施例提供的一种基于胶囊网络的意图识别方法的流程示意图；

图2示出了本发明实施例提供的另一种基于胶囊网络的意图识别方法的流程示意图；

图3示出了本发明实施例提供的基于胶囊网络模型的结构示意图；

图4示出了本发明实施例提供的一种基于胶囊网络的意图识别装置的结构示意图；

图5示出了本发明实施例提供的另一种基于胶囊网络的意图识别装置的结构示意图。

具体实施方式

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。

本发明实施例提供了一种基于胶囊网络的意图识别方法，该意图识别模型能够针对交互对话的交互信息融合多维度的信息特征进行意图识别，提供更准确的意图识别结果，如图1所示，该方法包括：

101、获取交互对话中涉及的交互信息，并对所述交互信息进行标注，形成不同维度上的意图标签。

其中，交互信息相当于从交互对话过程中所获取的文本、语音、图片等信息，这里交互信息包括不同信息类型，主要包括文本类型和图片类型，该交互对话可以是网络平台中服务人员与用户的对话，此时会沉淀出文本形式的对话内容，或者语音形式的对话内容，还可以为在实际场景中服务人员与用户的对话，此时会沉淀出语音形式的对话内容，或者图片形式的对话内容，图片形式的对话内容能够捕获用户表情信息。在实际应用过程中，这里针对文本形式的交互信息则无需进行处理，而针对语音形式的交互信息，还需要将语音转换为文本形式的交互信息。

具体在对交互信息进行标注过程中，可以结合交互信息在文本意图、文本情感和人脸情感上所表现的意图信息，对交互信息进行标注，这里可以根据业务需求预先定义多个文本意图以及情感标签，并针对交互信息中的语句进行标注，以形成不同维度上的意图标签，例如，针对语句a表现为文本意图维度上的意图标签为购物，文本情感维度上的意图标签为中性，人脸情感维度上的意图标签为高兴。

在本发明实施例中，执行主体可以为基于胶囊网络的意图识别装置，具体应用在服务端，现有技术中通过单一维度来判断用户的交互意图往往比较片面，使得意图识别结果中包含的歧义较多，容易误导用户，无法准确识别。由于交互对话中涉及的交互信息能够表现出不同维度上用户的交互意图，本申请通过从交互信息中提取出表现在不同维度上的信息特征，并融合不同维度上的信息特征来识别用户意图，能够提高意图识别结果的准确性。

102、将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型。

其中，意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，这里可以针对交互信息进行向量化所形成不同维度上的信息特征进行识别，以输出交互对话的意图标签，该意图标签相当于意图识别过程中结合不同维度进行判断所输出更准确的意图识别结果。具体对交互信息进行向量化过程可以为从交互信息中抽象出特征进行量化来表示不同维度上的信息特征，该信息特征主要包括文本意图维度上的信息特征、文本情感维度上的信息特征以及人脸情感维度的信息特征。需要强调的是，为进一步保证上述意图识别模型的相关数据的私密和安全性，上述意图识别模型的相关数据还可以存储于一区块链的节点中。

具体胶囊网络模型由编码器和解码器两部分组成，前三层为编码器，包括卷积层、主胶囊层和数字胶囊层，后三层为解码器，主要为全连接层，通过将前期向量化处理形成不同维度上的信息特征输入至网络模型，并结合不同维度上所标注的意图标签对网络模型训练过程中的模型参数进行调整，构建意图识别模型，以使得意图识别模型能够针对信息特征输出更准确的意图标签，该意图标签能够结合需求意图和情感趋向，提供更符合交互对话中用户真实意图的意图识别结果。

上述胶囊网络模型是一个包含多个神经元的载体，每个神经元表示了交互对话中出现特定实体各种属性，这些属性即为不同维度上的信息特征所形成不同类型的实例化参数，具体包括文本意图标签、文本情感标签和人脸情感标签，文本意图标签具体可以为兴趣意图，如电影、游戏、汽车等，还可以为行为意图，例如，加购、购买等，文本情感标签可以高兴、生气、不耐烦等，人脸情感标签与文本情感标签类似，同样包括可以反映用户喜怒哀乐的情感，进一步利用不同类型的实例化参数输出交互对话在不同维度上意图标签的存在概率。

103、响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。

可以理解的是，通过将不同维度上意图标签的交互信息进行向量化后形成的信息特征作为多模态融合输入至意图识别模型，与现有技术中分别对文本意图和情感意图进行意图识别以输出两个维度上的意图标签的方式相比，本申请中的意图识别模型能够针对文本和图像的交互信息进行考察，增加意图识别的泛化能力，并在意图识别过程中融合情感信息，不仅包括文本上的情感信息，还包括人脸表情上的情感信息，多模态融合在线上也可以节省内存和机器资源占用，达到准确率和资源节省的效果。

本发明实施例提供的一种基于胶囊网络的意图识别方法，获取交互对话中涉及的交互信息，并对交互信息进行标注，形成不同维度上的意图标签，将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，该意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，响应于目标交互对话的意图识别指令，将目标交互对话中交互信息进行向量化后输入至意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。与现有技术中使用单一维度对交互信息进行意图识别的方式相比，通过将交互信息在不同维度上的信息特征经过意图识别模型进行意图识别，能够从多维度的信息特征对交互信息进行考察，增加意图识别的泛化能力，并在意图识别过程中融合多模态信息，可以节省内存和机器资源占用，提供更准确的意图识别结果。

本发明实施例提供了另一种基于胶囊网络的意图识别方法，该意图识别模型能够针对交互对话的交互信息融合多维度的信息特征进行意图识别，提供更准确的意图识别结果，如图2所示，所述方法包括：

201、获取交互对话中涉及的交互信息，并对所述交互信息进行标注，形成不同维度上的意图标签。

由于不同信息类型的交互信息能够从不同维度反应出不同的交互意图，具体文本形式的交互信息可以从文字内容结合情感维度上来判断用户的交互意图，该交互意图可以场景上的需求意图，例如，购买意图，咨询意图，具体图片形式的交互信息主要从情感维度上来判断用户的需求意图是否存在偏差，通常情况下，用户在交互对话过程中所反映的交互意图虽然能说明用户的需求意图，但是用户在交互对话过程中的情感也能够从一定程度影响需求意图，例如，文本中关键字表明购物需求，文本中情感表现为中性，此时说明用户需求意图为购物，又例如，文本中关键词表明咨询意图，文本和图片中情感表现为厌烦，此时说明用户需求意图可能是想尽快结束咨询。

202、从所述交互信息中抽象出文本意图维度上意图标签的信息、文本情感维度上意图标签的信息以及人脸情感维度上意图标签的信息，作为携带有不同维度上意图标签的交互信息。

203、将所述携带有不同维度上意图标签的交互信息进行量化来表示不同维度上意图标签的向量矩阵输入至胶囊网络模型中进行训练，构建意图识别模型。

其中，胶囊网络模型由多层结构组成，这里包括编码层和解码层，具体可以利用胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征，利用胶囊网络模型的解码层对不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型。

具体在利用胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征的过程中，可以利用胶囊网络模型的编码层将携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵分别转换至文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量，针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型，利用适用于不同信息类型的交互信息进行预处理的特征提取模型，对文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量进行特征学习，得到文本意图维度上意图标签的信息特征、文本情感维度上意图标签的信息特征以及人脸情感维度上意图标签的信息特征。

具体构建意图识别模型的结构如图3所示，图3中embeddinglayer层能够针对意图识别所输入不同维度上意图标签的交互信息进行向量化处理，以形成不同维度上意图标签的信息向量，进一步对不同维度上意图标签的信息向量进行特征提取，以形成不同维度上的信息特征，通过attention加权输入至capsulelayer层，capsulelayer为胶囊网络，能够结合不同维度上意图标签的信息特征来识别交互对话在不同意图标签的概率值，最终选取概率值最高的意图标签进行输出，该意图标签携带相应的需求意图和情感趋势。

进一步地，胶囊网络模型特有的位置信息学习还可以辅助判断用户是否正在使用交互对话，排除外界噪声影响，文本信息也可以学到交互对话中短语的位置信息，进一步提高意图识别的精确度。

由于交互信息表现为多种信息类型，具体可以首先针对信息类型，将交互信息转换至不同维度上的描述信息，这里针对文本意图维度上的描述信息和文本情感维度上的描述信息主要为文本类型，针对人脸情感维度上的描述信息主要为图片类型，进一步对不同维度上的描述信息进行特征提取，这里特征提取相当于针对文本类型和图片类型的描述信息进行预处理过程，该预处理过程为将描述信息结合维度进行向量化，进而输出不同维度上的信息特征。通过将交互信息处理形成不同维度上的信息特征，结合不同维度上的信息特征进行意图识别，使得意图识别过程能够混合多模态信息以输出准确的意图识别结果。具体针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型，可以针对文本类型的交互信息，利用时间循环神经网络模型作为交互信息进行预处理的特征提取模型，针对图片类型的交互信息，利用卷积神经网络模型作为交互信息进行预处理的特征提取模型。

在实际应用中，针对文本类型的描述信息，预处理过程可以使用lstm对输入的向量进行特征学习，进而输出文本意图维度上的信息特征、文本情感维度上的信息特征，这里lstm能够考虑文本前后语句顺序，针对图片类型的描述信息，预处理过程可以使用cnn对输入的向量进行特征学习，进而输出人脸情感维度上的信息特征，进一步分别经过双向gru和attention加权，输出不同维度上的信息特征。

具体在将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练的过程中，为了提高模型构建的准确性，意图识别模型的参数还需要不断调整，这里可以利用预先设置的损失函数，结合不同维度上意图标签对意图识别模型的模型参数进行调整，更新意图识别模型。

204、响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。

205、针对所述目标交互对话在不同维度上意图标签的意图识别结果，从预先设置的语料库中筛选出与所述不同维度上意图标签相匹配的语料作为回答语料进行输出。

在具体应用场景中，意图识别可以应用到智能客服会话中，智能客服会话的核心是进行用户意图匹配，只有明确了用户意图，才能给出针对性的回答，这里预先设置的语料库中可以针对不同维度上的意图标签匹配相应的语料，例如，这张机票我不要了，利用意图识别模型所输出的意图识别结果为带有不开心情感意图标签的退票需求意图，而语料库中针对需求意图为退票场景的情况设置有针对不同情感意图标签的语料，进一步筛选出与不开心情感意图标签的退票需求意图相匹配的语料。

进一步地，作为图1所述方法的具体实现，本发明实施例提供了一种基于胶囊网络的意图识别装置，如图4所示，所述装置包括：获取单元31、构建单元32、识别单元33。

获取单元31，可以用于获取交互对话中涉及的交互信息，并对所述交互信息进行标注，形成不同维度上的意图标签；

构建单元32，可以用于将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，所述意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果；

识别单元33，可以用于响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。

本发明实施例提供的一种基于胶囊网络的意图识别装置，获取交互对话中涉及的交互信息，并对交互信息进行标注，形成不同维度上的意图标签，将携带有不同维度上意图标签的交互信息进行向量化后输入至胶囊网络模型中进行训练，构建意图识别模型，该意图识别模型结合不同维度的交互信息识别出融合多维度意图标签的意图识别结果，响应于目标交互对话的意图识别指令，将目标交互对话中交互信息进行向量化后输入至意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果。与现有技术中使用单一维度对交互信息进行意图识别的方式相比，通过将交互信息在不同维度上的信息特征经过意图识别模型进行意图识别，能够从多维度的信息特征对交互信息进行考察，增加意图识别的泛化能力，并在意图识别过程中融合多模态信息，可以节省内存和机器资源占用，提供更准确的意图识别结果。

作为图4中所示基于胶囊网络的意图识别装置的进一步说明，图5是根据本发明实施例另一种基于胶囊网络的意图识别装置的结构示意图，如图5所示，所述构建单元32包括：

抽象模块321，可以用于从所述交互信息中抽象出文本意图维度上意图标签的信息、文本情感维度上意图标签的信息以及人脸情感维度上意图标签的信息，作为携带有不同维度上意图标签的交互信息；

构建模块322，可以用于将所述携带有不同维度上意图标签的交互信息进行量化来表示不同维度上意图标签的向量矩阵输入至胶囊网络模型中进行训练，构建意图识别模型。

在具体应用场景中，所述胶囊网络模型由多层结构组成，所述构建模块322包括：

提取子模块3221，可以用于利用所述胶囊网络模型的编码层对携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵进行特征提取，得到不同维度上意图标签的信息特征；

加权子模块3222，可以用于利用所述胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型。

在具体应用场景中，所述提取子模块3221，具体可以用于利用胶囊网络模型的编码层将携带有不同维度上意图标签的交互信息进行向量化后形成的向量矩阵分别转换至文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量；

所述提取子模块3221，具体还可以用于针对交互信息对应的信息类型，确定适用于不同信息类型的交互信息进行预处理的特征提取模型；

所述提取子模块3221，具体还可以用于利用所述适用于不同信息类型的交互信息进行预处理的特征提取模型，对所述文本意图维度上意图标签的描述向量、文本情感维度上意图标签的描述向量以及人脸情感维度上意图标签的描述向量进行特征学习，得到文本意图维度上意图标签的信息特征、文本情感维度上意图标签的信息特征以及人脸情感维度上意图标签的信息特征。

在具体应用场景中，所述提取子模块3221，具体还可以用于针对文本类型的交互信息，利用时间循环神经网络模型作为交互信息进行预处理的特征提取模型；

所述提取子模块3221，具体还可以用于针对图片类型的交互信息，利用卷积神经网络模型作为交互信息进行预处理的特征提取模型。

在具体应用场景中，所述构建模块322还包括：

调整子模块3223，可以用于在所述利用胶囊网络模型的解码层对所述不同维度上意图标签的信息特征进行加权处理，并将交互信息在不同维度上意图标签的概率值作为意图识别结果，构建意图识别模型之后利用预先设置的损失函数，结合不同维度上意图标签对所述意图识别模型的模型参数进行调整，更新所述意图识别模型。

在具体应用场景中，所述意图识别模型的相关数据存储于区块链中，所述装置还包括：

筛选单元34，可以用于在所述响应于目标交互对话的意图识别指令，将所述目标交互对话中交互信息进行向量化后输入至所述意图识别模型中进行意图识别，得到携带有目标交互对话在不同维度上意图标签的意图识别结果之后，针对所述目标交互对话在不同维度上意图标签的意图识别结果，从预先设置的语料库中筛选出与所述不同维度上意图标签相匹配的语料作为回答语料进行输出。

需要说明的是，本实施例提供的一种基于胶囊网络的意图识别装置所涉及各功能单元的其他相应描述，可以参考图1、图2中的对应描述，在此不再赘述。

基于上述如图1、图2所示方法，相应的，本实施例还提供了一种存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述如图1、图2所示的基于胶囊网络的意图识别方法。

基于这样的理解，本申请的技术方案可以以软件产品的形式体现出来，该软件产品可以存储在一个非易失性存储介质（可以是cd-rom，u盘，移动硬盘等）中，包括若干指令用以使得一台计算机设备（可以是个人计算机，服务器，或者网络设备等）执行本申请各个实施场景所述的方法。

基于上述如图1、图2所示的方法，以及图4、图5所示的虚拟装置实施例，为了实现上述目的，本申请实施例还提供了一种计算机设备，具体可以为个人计算机、服务器、网络设备等，该实体设备包括存储介质和处理器；存储介质，用于存储计算机程序；处理器，用于执行计算机程序以实现上述如图1、图2所示的基于胶囊网络的意图识别方法。

可选地，该计算机设备还可以包括用户接口、网络接口、摄像头、射频（radiofrequency，rf）电路，传感器、音频电路、wi-fi模块等等。用户接口可以包括显示屏（display）、输入单元比如键盘（keyboard）等，可选用户接口还可以包括usb接口、读卡器接口等。网络接口可选的可以包括标准的有线接口、无线接口（如蓝牙接口、wi-fi接口）等。

本领域技术人员可以理解，本实施例提供的基于胶囊网络的意图识别装置的实体设备结构并不构成对该实体设备的限定，可以包括更多或更少的部件，或者组合某些部件，或者不同的部件布置。

存储介质中还可以包括操作系统、网络通信模块。操作系统是管理上述计算机设备硬件和软件资源的程序，支持信息处理程序以及其它软件和/或程序的运行。网络通信模块用于实现存储介质内部各组件之间的通信，以及与该实体设备中其它硬件和软件之间通信。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本申请可以借助软件加必要的通用硬件平台的方式来实现，也可以通过硬件实现。通过应用本申请的技术方案，与目前现有技术相比，本申请中通过将交互信息在不同维度上的信息特征经过意图识别模型进行意图识别，能够从多维度的信息特征对交互信息进行考察，增加意图识别的泛化能力，并在意图识别过程中融合多模态信息，可以节省内存和机器资源占用，提供更准确的意图识别结果。

本领域技术人员可以理解附图只是一个优选实施场景的示意图，附图中的模块或流程并不一定是实施本申请所必须的。本领域技术人员可以理解实施场景中的装置中的模块可以按照实施场景描述进行分布于实施场景的装置中，也可以进行相应变化位于不同于本实施场景的一个或多个装置中。上述实施场景的模块可以合并为一个模块，也可以进一步拆分成多个子模块。

上述本申请序号仅仅为了描述，不代表实施场景的优劣。以上公开的仅为本申请的几个具体实施场景，但是，本申请并非局限于此，任何本领域的技术人员能思之的变化都应落入本申请的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴岸城;孙梦轩
技术所有人：中国平安人寿保险股份有限公司
我是此专利的发明人

上一篇：一种批次包衣机的防物料离心溢出装置的制作方法
上一篇：一种剪机专用的剪刃吊装装置的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。