一种智能问答方法和装置与流程

文档序号：22627749发布日期：2020-10-23 19:36阅读：来源：国知局

技术特征：

1.一种智能问答方法，其特征在于，包括：

根据第一用户与客服的当前对话进程中的对话记录，生成语义特征向量集，所述语义特征向量集包括所述当前对话进程中的对话记录的语义特征向量；

对所述语义特征向量集进行语义聚合，以得到表示所述第一用户当前问句的真实意图和语义的第一聚合语义向量；

从存储问答信息的知识库中查找与所述第一聚合语义向量匹配的语义向量，并根据查找到的语义向量输出所述当前问句的答案。

2.根据权利要求1所述的方法，其特征在于，所述根据第一用户与客服的当前对话进程中的对话记录，生成语义特征向量集，包括：通过如下的方式一或方式二生成所述语义特征向量集：

方式一：通过第一语言模型对所述对话记录中的句子矢量化，以得到所述语义特征向量集；

方式二：利用第二语言模型将所述对话记录中的词矢量化，以得到相应的词向量，然后将所述词向量聚合为句向量，以得到所述语义特征向量集。

3.根据权利要求2所述的方法，其特征在于，所述通过第一语言模型对所述对话记录中的句子矢量化，以得到所述语义特征向量集，包括：

将所述对话记录中的句子的数值向量输入xlnet语言模型，通过所述xlnet语言模型对所述数值向量进行编码，并输出所述语义特征向量集，其中，所述数值向量是通过对所述对话记录中的句子数值化为向量得到的。

4.根据权利要求3所述的方法，其特征在于，所述对所述语义特征向量集进行语义聚合，以得到表示所述第一用户当前问句的真实意图和语义的第一聚合语义向量，包括：

采用注意力模型，从所述语义特征向量集的不同语义特征向量中抽取所述当前对话进程中的各对话记录的语义信息，所述各对话记录的语义信息包括所述当前问句的语义信息以及除所述当前问句以外其他句子的语义信息；

根据所述各对话记录的语义信息对应的权重系数，对所述各对话记录的语义信息进行加权求和，以聚合得到所述第一聚合语义向量，其中，所述权重系数通过训练所述注意力模型确定。

5.根据权利要求4所述的方法，其特征在于，所述从存储问答信息的知识库中查找与所述第一聚合语义向量匹配的语义向量，包括：

通过张量神经网络模型计算所述第一聚合语义向量与所述知识库中表示问题或答案的语义向量之间的匹配度，查找出所述匹配度最高的所述知识库中的语义向量；或者，

通过计算所述第一聚合语义向量与所述知识库中表示问题或答案的语义向量之间的向量相似度，根据所述向量相似度查找与所述第一聚合语义向量匹配的语义向量。

6.根据权利要求5所述的方法，其特征在于，还包括：

获取用户数据集中用户与所述客服的历史对话进程中的对话记录数据；

从所述对话记录数据中选出特定回复之前的目标对话记录数据，作为对话记录样本；

按照所述对话记录样本中各句子的时序构造训练样本，所述训练样本包括所述用户连续输入的问句、与所述连续输入的问句对应的答案、所述特定回复所对应的问句、所述特定回复的答案。

7.根据权利要求6所述的方法，其特征在于，还包括：

利用所述训练样本构成的训练集训练端到端的多轮对话匹配模型，所述端对端的多轮对话匹配模型包括所述xlnet语言模型、所述注意力模型、所述张量神经网络模型，训练过程包括：采用所述xlnet语言模型，分别生成所述训练样本中的所述用户连续输入的问句、与所述连续输入的问句对应的答案、所述特定回复所对应的问句的第一语义特征向量，以及所述特定回复的答案的第二语义特征向量；将所述第一语义特征向量输入所述注意力模型以进行语义聚合，得到第二聚合语义向量；将所述第二聚合语义向量和所述第二语义特征向量输入所述张量神经网络模型，最终训练得到所述注意力模型的参数和所述张量神经网络模型的参数，所述注意力模型的参数包括所述权重系数。

8.一种智能问答装置，其特征在于，包括：

语义特征向量集生成模块，用于根据第一用户与客服的当前对话进程中的对话记录，生成语义特征向量集，所述语义特征向量集包括所述当前对话进程中的对话记录的语义特征向量；

语义聚合模块，用于对所述语义特征向量集进行语义聚合，以得到表示所述第一用户当前问句的真实意图和语义的第一聚合语义向量；

答案查找和输出模块，用于从存储问答信息的知识库中查找与所述第一聚合语义向量匹配的语义向量，并根据查找到的语义向量输出所述当前问句的答案。

9.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储器，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行时，使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。

10.一种计算机可读介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。

技术总结
本发明公开了一种智能问答方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：根据第一用户与客服的当前对话进程中的对话记录，生成语义特征向量集，所述语义特征向量集包括所述当前对话进程中的对话记录的语义特征向量；对所述语义特征向量集进行语义聚合，以得到表示所述第一用户当前问句的真实意图和语义的第一聚合语义向量；从存储问答信息的知识库中查找与所述第一聚合语义向量匹配的语义向量，并根据查找到的语义向量输出所述当前问句的答案。该实施方式能够有效利用上下文信息进行检索，提高多轮对话场景下信息检索的准确度。

技术研发人员：闫永泽;陈利琴;刘设伟
受保护的技术使用者：泰康保险集团股份有限公司;泰康在线财产保险股份有限公司
技术研发日：2020.06.24
技术公布日：2020.10.23

完整全部详细技术资料下载

当前第2页1 2