角色对话模型的训练方法、对话生成方法、装置和设备与流程

文档序号：37208302发布日期：2024-03-05 14:46阅读：来源：国知局

技术特征：

1.一种角色对话模型的训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述问话样本特征输入所述初始对话模型，得到预测回复特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述样本拼接特征，得到所述预测回复特征，包括：

4.根据权利要求3所述的方法，其特征在于，所述基于所述键特征和所述值特征得到所述预测回复特征，包括：

5.根据权利要求4所述的方法，其特征在于，所述注意力分数矩阵包括第一子矩阵和第二子矩阵，所述第一子矩阵用于指示所述问话样本语句中的每个词与所述角色参数的当前参数取值之间的相似度，所述第二子矩阵用于指示所述问话样本语句中的每个词与所述问话样本语句中其他词之间的相似度；

6.根据权利要求2所述的方法，其特征在于，所述初始对话模型包括依次连接的多个注意力层，所述多个注意力层分别包括一个角色参数；所述将所述问话样本特征输入所述初始对话模型，得到预测回复特征，包括：

7.根据权利要求1所述的方法，其特征在于，所述获取目标角色的对话样本对，包括：

8.一种对话生成方法，其特征在于，所述方法包括：

9.根据权利要求8所述的方法，其特征在于，所述将所述问话语句特征输入角色对话模型，得到所述问话语句特征对应的回复语句特征，包括：

10.根据权利要求8所述的方法，其特征在于，所述角色对话模型包括依次连接的多个注意力层，所述多个注意力层分别包括一个角色参数；所述将所述问话语句特征输入角色对话模型，得到所述问话语句特征对应的回复语句特征，包括：

11.一种角色对话模型的训练装置，其特征在于，所述装置包括：

12.一种对话生成装置，其特征在于，所述装置包括：

13.一种计算机设备，其特征在于，所述计算机设备包括处理器和存储器，所述存储器用于存储至少一段程序，所述至少一段程序由所述处理器加载并执行权利要求1至7任一项所述的角色对话模型的训练方法或权利要求8-10任一项所述的对话生成方法。

14.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储至少一段程序，所述至少一段程序用于执行权利要求1至7任一项所述的角色对话模型的训练方法或权利要求8-10所述的对话生成方法。

15.一种计算机程序产品，其特征在于，所述计算机程序产品包括至少一段程序，所述至少一段程序存储在计算机可读存储介质中，计算机设备的处理器从所述计算机可读存储介质读取所述至少一段程序，所述处理器执行所述至少一段程序，使得所述计算机设备执行权利要求1至7任一项所述的角色对话模型的训练方法或权利要求8-10所述的对话生成方法。

技术总结
本申请提供了一种角色对话模型的训练方法、对话生成方法、装置和设备，属于人工智能技术领域。方法包括：基于预训练对话模型，获取初始对话模型，初始对话模型包括角色参数和预训练对话模型的模型参数，角色参数用于代表目标角色的对话风格；获取目标角色的对话样本对，目标角色的对话样本对包括问话样本语句的问话样本特征和回复样本语句的回复样本特征，回复样本语句为目标角色的回复语句；将问话样本特征输入初始对话模型，得到预测回复特征；基于回复样本特征和预测回复特征，调整初始对话模型中的角色参数，以得到目标角色的角色对话模型，角色对话模型用于生成具有目标角色的对话风格的回复语句。该方法提高了角色对话模型的训练效率。

技术研发人员：陈春全
受保护的技术使用者：腾讯科技（深圳）有限公司
技术研发日：
技术公布日：2024/3/4

完整全部详细技术资料下载

当前第2页1 2