基于大模型的客服对话摘要生成方法及可读存储介质与流程

文档序号:37688177发布日期:2024-04-18 21:03阅读:12来源:国知局
基于大模型的客服对话摘要生成方法及可读存储介质与流程

本发明涉及人工智能,具体而言,涉及一种基于大模型的客服对话摘要生成方法及可读存储介质。


背景技术:

1、随着互联网技术的发展,客服服务已经成为企业与用户沟通的重要渠道。然而,由于客服对话通常包含大量信息,并且对话内容复杂多样,这使得从对话中提取关键信息变得非常困难。传统的方法通常需要人工进行对话摘要,不仅耗时耗力,而且难以保证摘要的准确性和完整性。因此,如何通过自动化方式,从客服对话中生成高质量的摘要,是当前亟需解决的问题。


技术实现思路

1、本发明的目的在于提供一种基于大模型的客服对话摘要生成方法及可读存储介质。

2、第一方面,本发明实施例提供一种基于大模型的客服对话摘要生成方法,所述方法包括:

3、采集目标客户和目标客服的沟通记录;

4、将所述沟通记录输入预先训练完成的客服对话摘要生成模型中,输出得到所述沟通记录对应的目标客服对话摘要,所述客服对话摘要生成模型是基于大模型训练得到的。

5、在一种可能的实施方式中,所述客服对话摘要生成模型是通过以下方式训练得到的,包括:

6、获取样本沟通记录,并对所述样本沟通记录进行清洗;

7、将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果;

8、基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,其中,所述第一初始大模型的参数量超过所述第二初始大模型的参数量。

9、在一种可能的实施方式中,所述获取样本沟通记录,并对所述样本沟通记录进行清洗,包括:

10、对所述样本沟通记录进行语音转文本操作,并利用正则表达式对所述样本沟通记录进行清洗。

11、在一种可能的实施方式中,所述第一初始大模型为gpt-4大模型,所述将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果,包括:

12、将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型;

13、将所述基础客服对话摘要生成模型作为所述中间对话摘要训练结果。

14、在一种可能的实施方式中,所述将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型,包括:

15、将清洗后的所述样本沟通记录输入gpt-4大模型,并构建提示词;

16、基于所述gpt-4大模型的icl能力,在所述提示词中注入多个任务示例,并输出任务结果,以使所述gpt-4大模型学习到任务所需的知识;

17、基于所述gpt-4大模型的cot能力,通过所述提示词引导所述gpt-4大模型输出具体任务的推理思维过程,以提升模型的输出准确率;

18、结合所述icl能力和所述cot能力进行训练,得到所述基础客服对话摘要生成模型。

19、在一种可能的实施方式中,所述第二初始大模型为预设开源大模型,所述基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,包括:

20、将所述基础客服对话摘要生成模型作为教师模型,将所述预设开源大模型作为学生模型;

21、基于所述教师模型和所述学生模型的模型关系,将所述基础客服对话摘要生成模型的摘要知识通过知识蒸馏至所述预设开源大模型;

22、基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型。

23、在一种可能的实施方式中,所述基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型,包括:

24、利用p-tuningv2和lora训练法对所述预设开源大模型对应的指令训练集进行参数微调;

25、并基于微调完成的所述指令训练集对所述预设开源大模型进行训练,得到所述客服对话摘要生成模型。

26、第二方面,本发明实施例提供一种基于大模型的客服对话摘要生成装置,所述装置包括:

27、获取模块,用于采集目标客户和目标客服的沟通记录;

28、生成模块,用于将所述沟通记录输入预先训练完成的客服对话摘要生成模型中,输出得到所述沟通记录对应的目标客服对话摘要,所述客服对话摘要生成模型是基于大模型训练得到的。

29、第三方面,本发明实施例提供一种计算机设备,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行第一方面至少一种可能的实施方式中所述基于大模型的客服对话摘要生成方法。

30、第四方面,本发明实施例提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行第一方面至少一种可能的实施方式中所述的基于大模型的客服对话摘要生成方法。

31、相比现有技术,本发明提供的有益效果包括:采用本发明公开的一种基于大模型的客服对话摘要生成方法及可读存储介质,通过收集目标客户和目标客服之间的沟通记录;然后,将这些沟通记录输入到预先训练好的客服对话摘要生成模型中,输出得到相应的目标客服对话摘要。值得注意的是,这个客服对话摘要生成模型是基于大模型进行训练得到的。这种方法有效地实现了从庞大的客服对话中自动生成有用的摘要,有助于提升客服工作效率和服务质量。



技术特征:

1.一种基于大模型的客服对话摘要生成方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述客服对话摘要生成模型是通过以下方式训练得到的,包括:

3.根据权利要求2所述的方法,其特征在于,所述获取样本沟通记录,并对所述样本沟通记录进行清洗,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一初始大模型为gpt-4大模型,所述将清洗后的所述样本沟通记录输入第一初始大模型进行训练,得到中间对话摘要训练结果,包括:

5.根据权利要求4所述的方法,其特征在于,所述将清洗后的所述样本沟通记录输入gpt-4大模型进行训练,得到基础客服对话摘要生成模型,包括:

6.根据权利要求4所述的方法,其特征在于,所述第二初始大模型为预设开源大模型,所述基于所述中间对话摘要训练结果对第二初始大模型中进行知识蒸馏,得到所述客服对话摘要生成模型,包括:

7.根据权利要求6所述的方法,其特征在于,所述基于知识蒸馏后的所述预设开源大模型,得到所述客服对话摘要生成模型,包括:

8.一种基于大模型的客服对话摘要生成装置,其特征在于,所述装置包括:

9.一种计算机设备,其特征在于,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行权利要求1-7中任意一项所述基于大模型的客服对话摘要生成方法。

10.一种可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-7中任意一项所述的基于大模型的客服对话摘要生成方法。


技术总结
本发明公开了一种基于大模型的客服对话摘要生成方法及可读存储介质,包括:首先,收集目标客户和目标客服之间的沟通记录;然后,将这些沟通记录输入到预先训练好的客服对话摘要生成模型中,输出得到相应的目标客服对话摘要。值得注意的是,这个客服对话摘要生成模型是基于大模型进行训练得到的。这种方法有效地实现了从庞大的客服对话中自动生成有用的摘要,有助于提升客服工作效率和服务质量。

技术研发人员:蔡奕杰,姜睿思,华旭明,尚璟铭,谢淋,丁超仁,李嘉辉
受保护的技术使用者:上海创帧软件有限公司
技术研发日:
技术公布日:2024/4/17
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1