本发明涉及人工智能,尤其涉及一种话术推荐方法、装置、终端设备及计算机可读存储介质。
背景技术:
1、随着人们对客服提出了越来越高的要求,往往希望客服能够及时、准确地理解用户需求并且高效地解决用户问题。
2、而目前主流的话术推荐方法则是类似知识库问答方式,侧重于通过用户当前提出的问题返回匹配话术,其至少存在以下问题:
3、1)用户的回复通常较为简单,存在大量的省略和口语化表达,使得客服往往需要结合用户属性推断用户的真实意图,而传统的话术推荐方式仅根据对话文本进行匹配,难以匹配到用户的真实需求;
4、2)在由客服主导和引导的服务场景下,客服需要通过回复策略引导用户达成目标,对同样的用户问题存在多种合理的解决方案,而传统的话术推荐方式往往只将一个固定的回复当做标准答案,无法满足用户的多样化需求。
5、总的来说,现有的话术推荐方式,无法针对用户进行灵活精准的话术推荐,导致无法满足用户的多样化需求。
技术实现思路
1、本发明的主要目的在于提供一种话术推荐方法、装置、终端设备及计算机可读存储介质,旨在实现话术灵活精准推荐,满足用户需求,进而提升用户体验。
2、为实现上述目的,本发明提供一种话术推荐方法,所述方法包括以下步骤:
3、获取当前对话内容,并通过预设的回复策略分类模型,对所述当前对话内容进行回复策略分类,得到所述回复策略分类模型输出的客服回复预测策略;
4、基于所述客服回复预测策略,从预设话术库中获取初始候选话术,并对所述初始候选话术进行筛选得到候选话术;
5、基于所述对话内容,通过预设的话术评分模型,对所述候选话术打分得到与所述对话内容匹配的目标推荐话术,以基于所述目标推荐话术进行话术推荐。
6、可选地,在所述获取当前的对话内容,并通过预设的回复策略分类模型,对所述对话内容进行回复策略分类,得到所述回复策略分类模型输出的客服回复预测策略的步骤之前,还包括:
7、分别构建所述回复策略分类模型和所述话术评分模型。
8、可选地,所述构建所述回复策略分类模型的步骤,包括:
9、获取历史对话日志,并获取所述历史对话日志中的对话上文、用户属性以及所述对话上文对应的对话角色;
10、将所述对话上文、所述用户属性以及所述对话角色输入初始策略分类模型,得到所述对话上文的策略标签分布,并根据所述的策略标签分布,生成所述回复策略分类模型。
11、可选地,所述将所述对话上文、所述用户属性以及所述对话角色输入初始策略分类模型,得到所述对话上文的策略标签分布,并根据所述的策略标签分布,生成所述回复策略分类模型的步骤,包括:
12、将所述对话上文输入所述初始策略分类模型中的预训练语言表征层,得到所述对话上文中的句向量;
13、将所述对话角色和对应的角色相对位置分别输入所述初始策略分类模型的角色编码层和位置编码层,得到所述对话角色对应的角色编码以及所述角色相对位置对应的位置编码,并将所述句向量与所述角色编码和所述位置编码进行累加;
14、将所述用户属性输入所述初始策略分类模型的用户属性编码层,得到对应的用户特征;
15、将累加所述角色编码和所述位置编码的句向量与所述用户特征进行拼接,并将拼接所述用户特征后的句向量输入所述初始策略分类模型的交互层,得到所述句向量对应的对话序列特征;
16、将所述对话序列特征输入所述初始策略分类模型的对话表示层,得到对话内容整体特征;
17、基于所述历史对话日志中的各用户问题下的客服回复策略分布,将所述对话内容整体特征进行分类,以确定所述对话上文对应的策略标签分布;
18、针对所述策略标签分布进行训练,得到所述回复策略分类模型。
19、可选地,所述构建所述话术评分模型的步骤,包括:
20、基于所述历史对话日志中用户与客服之间的对话匹配关系,获取所述话术评分模型的训练样本,以对所述训练样本进行后训练,其中,所述训练样本包括:正样本和负样本,所述负样本包含了易分负样本和难分负样本;
21、针对所述正样本、所述易分负样本和所述难分负样本进行后训练,以通过所述预训练语言表征模型,构建初始话术评分模型;
22、根据所述正样本和所述负样本,对所述初始话术评分模型进行微调,得到所述话术评分模型。
23、可选地,在所述基于所述历史对话日志中用户与客服之间的对话匹配关系,获取所述话术评分模型的训练样本的步骤之后,包括:
24、将所述历史对话日志中用户与客服之间的对话进行拼接得到对话内容,并将所述对话内容与所述客服回复进行拼接;
25、将拼接所述客服回复后的对话内容输入所述话术评分模型的词嵌入层,得到所述对话内容中词语的词向量;
26、通过所述话术评分模型的角色编码层和位置编码层,分别获得所述对话内容的角色编码和位置编码,并所述词向量与所述角色编码和所述位置编码进行累加;
27、通过所述话术评分模型的交互层,将累加所述角色编码和所述位置编码后的词向量进行交互,得到词向量序列特征;
28、将所述词向量序列特征输入所述话术评分模型的句子表示层,得到对话上文-客户回复的整体特征,以构建所述话术评分模型。
29、可选地,在所述分别构建所述回复策略分类模型和所述话术评分模型的步骤之前,还包括:
30、获取历史对话语料;
31、对所述历史对话语料中的客服回复语料进行向量编码,得到回复句向量集合,并对所述回复句向量集合进行聚类得到多个候选话术簇;
32、获取所述候选话术簇的关键词,并基于所述关键词,对所述候选话术簇进行筛选得到表征客服回复策略的聚类簇,并将所述聚类簇中的候选话术添加至所述预设话术库;
33、对所述历史对话语料中的用户问题进行编码得到用户问题句向量集合,并对所述用户问题句向量集合进行聚类;
34、基于所述预设话术库中表征客服回复策略的聚类簇和聚类后的用户问题句向量集合,通过预设用户问题-客服回复之间的匹配关系,获取各个用户问题下的客服回复策略分布,以基于该客服回复策略分布,确定所述对话上文对应的策略标签分布。
35、可选地,将所述预设话术库中包含客服回复预测策略的回复话术作为初始候选话术;
36、确定所述初始候选话术与所述当前对话内容中的对话上文之间的匹配度;
37、根据所述匹配度,对所述初始候选话术进行筛选得到候选话术。
38、可选地,所述基于所述对话内容,通过预设的话术评分模型,对所述候选话术打分得到目标推荐话术的步骤,包括:
39、将所述候选话术与所述当前对话内容中的对话上文进行拼接,并将拼接对话上文的候选话术输入所述话术评分模型进行打分,得到各组对话上文-候选话术对应的得分;
40、根据所述得分,从所述候选话术中确定目标推荐话术。
41、为实现上述目的,本发明还提供一种话术推荐装置,所述话术推荐装置包括:
42、策略获取模块,用于获取当前对话内容,并通过预设的回复策略分类模型,对所述当前对话内容进行回复策略分类,得到所述回复策略分类模型输出的客服回复预测策略;
43、话术筛选模块,用于基于所述客服回复预测策略,从预设话术库中获取初始候选话术,并对所述初始候选话术进行筛选得到候选话术;
44、话术打分模块,用于基于所述对话内容,通过预设的话术评分模型,对所述候选话术打分得到与所述对话内容匹配的目标推荐话术,以基于所述目标推荐话术进行话术推荐。
45、为实现上述目的,本发明还提供一种终端设备,所述终端设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的话术推荐程序,所述话术推荐程序被所述处理器执行时实现如上所述的话术推荐方法的步骤。
46、此外,为实现上述目的,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有话术推荐程序,所述话术推荐程序被处理器执行时实现如上所述的话术推荐方法的步骤。
47、为实现上述目的,本发明还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现如上所述的话术推荐方法的步骤。
48、本发明提供一种话术推荐方法、装置、终端设备、计算机可读存储介质以及计算机程序产品,通过获取当前对话内容,并通过预设的回复策略分类模型,对所述当前对话内容进行回复策略分类,得到所述回复策略分类模型输出的客服回复预测策略;基于所述客服回复预测策略,从预设话术库中获取初始候选话术,并对所述初始候选话术进行筛选得到候选话术;基于所述对话内容,通过预设的话术评分模型,对所述候选话术打分得到与所述对话内容匹配的目标推荐话术,以基于所述目标推荐话术进行话术推荐。
49、相比于现有的话术推荐方式,在本发明中,能够通过回复策略分类模型对当前对话内容进行策略分类得到客服回复预测策略,进一步该客服回复预测策略,从话术库中获取初始候选话术,并从初始候选话术中筛选出候选话术。在此基础上,通过话术评分模型对候选话术进行打分,最终得到目标推荐话术。可见,本发明通过回复策略分类模型以及话术评分模型,获取与当前对话内容匹配的目标推荐话术,以利用该目标推荐话术回复用户,实现了话术精准且灵活的推荐,更加符合实际话术推荐场景,进一步满足了用户的多样化需求,提升了用户体验。