对话行为分类模型的训练方法、对话日志处理方法及装置与流程

文档序号:31736506发布日期:2022-10-05 03:49阅读:71来源:国知局
对话行为分类模型的训练方法、对话日志处理方法及装置与流程

1.本技术实施例涉及计算机技术领域,尤其涉及一种对话行为分类模型的训练方法、对话日志处理方法及装置。


背景技术:

2.随着计算机技术的发展,将客服机器人运用在客服行业成为可能。
3.为了能够使客服机器人像真人客服一样为客户提供精准的应答服务,需要利用能够体现客户需求和客服回答等有效信息的对话流对客服机器人进行训练,使得客服机器人可根据客户需求进行应答处理。而对话流质量将严重影响客服机器人的应答准确性。
4.在现有场景中,对话流为商家自行创建的,为了得到质量较好的对话流,商家往往需要花费大量的人力成本和时间成本对既往的对话日志进行分析,以从中提取有效信息作为对话流,其成本较高。


技术实现要素:

5.本技术实施例提供一种对话行为分类模型的训练方法、对话日志处理方法及装置,能够从对话日志中快速抽取对话流,使得客服可利用该对话流实现对客服机器人的智能客服功能的配置。
6.第一方面,本技术实施例提供了一种对话日志处理方法,包括:
7.确定待处理的对话日志,对话日志中包括客服与客户进行客服对话所产生的多个对话语句;利用预先训练的对话行为分类模型对对话日志进行处理,得到对话日志的行为序列,其中,行为序列中包括对话日志中每一对话语句的对话行为;对行为序列中的各对话行为进行遍历筛选得到有效行为序列;根据有效行为序列对对话日志进行片段抽取,得到对话日志的对话流。
8.可知的是,在本实施例中,可先利用预先训练的对话行为分类模型对对话日志进行分析处理以对对话日志进行对话行为分类,再基于各对话语句的对话行为对对话日志的行为序列进行遍历筛选,以能够基于遍历筛选后的有效行为序列对对话日志中的对话流进行快速抽取,其对话流的抽取效率高,抽取效果好。
9.可选的,对话行为包括意图对话行为、提问对话行为和回答对话行为;
10.对行为序列中的各对话行为进行遍历筛选得到有效行为序列,包括:根据各类型的对话行为在行为序列中的排列顺序,从行为序列中抽取连续的多个对话行为以构成有效行为序列;其中,构成有效行为序列的多个对话行为中,位于首位的对话行为的类型为意图对话行为,位于末位的对话行为的类型为回答对话行为,位于首位和末位之间的对话行为不包括类型为意图对话行为或回答对话行为的对话行为。
11.可知的是,本实施例中将对话行为划分为意图对话行为、提问对话行为和回答对话行为的类型,以使得模型可确定出每个对话语句对应的对话行为,而在筛选得到有效行为序列的过程中,通过基于各对话语句对应的对话行为的类型和排列顺序进行筛选判定,
能够从对话日志对应的行为序列中快速确定符合对话流对话行为习惯的有效行为序列,进而能够便于快速从对话日志中抽取得到对话流。
12.可选的,根据各类型的对话行为在行为序列中的排列顺序,从行为序列中抽取连续的多个对话行为以构成有效行为序列,包括:从行为序列中选出任意一个提问对话行为作为目标提问对话行为;在行为序列的各意图对话行为中,判断是否存在排列在目标提问对话行为之前的,且与目标提问对话行为之间不存在其他意图对话行为或回答对话行为的意图对话行为;若存在,则将该意图对话行为作为目标提问对话行为的目标意图对话行为,否则,从行为序列中选出下一个提问对话行为作为目标提问对话行为;在行为序列的各回答对话行为中,判断是否存在排列在目标提问对话行为之后的,且与目标提问对话行为之间不存在其他意图对话行为或回答对话行为的回答对话行为;若存在,则将该回答对话行为作为目标提问对话行为的目标回答对话行为,否则,从行为序列中选出下一个提问对话行为作为目标提问对话行为;抽取目标意图对话行为、目标回答对话行为以及目标意图对话行为与目标回答对话行为之间的各对话行为,构成有效行为序列。
13.可知的是,在本实施例提供的有效行为序列的抽取中,通过以目标提问对话行为为中心,判断行为序列中是否存在与该目标提问对话行为相应的目标意图对话行为和目标回答对话行为的方式,进而可基于判定结果从行为序列中抽取可用于表征对话日志中具有问答意义的有效行为序列。
14.将对话行为划分为意图对话行为、提问对话行为和回答对话行为的类型,以使得模型可确定出每个对话语句对应的对话行为,而在筛选得到有效行为序列的过程中,通过基于各对话语句对应的对话行为的类型和排列顺序进行筛选判定,能够从对话日志对应的行为序列中快速确定符合对话流对话行为习惯的有效行为序列,进而能够便于快速从对话日志中抽取得到对话流。
15.可选的,对话行为分类模型包括客服对话行为分类子模型和客户对话行为分类子模型;
16.利用预先训练的对话行为分类模型对对话日志进行处理,得到对话日志的行为序列,包括:将对话日志中的客服所发起的对话语句输入至客服对话行为分类子模型,输出客服的对话行为,其中,客服的对话行为包括提问对话行为和回答对话行为;将对话日志中的客户所发起的对话语句输入至客户对话行为分类子模型,输出客户的对话行为,其中,客户的对话行为包括意图对话行为;根据客服所发起的对话语句所对应的客服的对话行为,以及客户所发起的对话语句所对应的客户的对话行为,得到行为序列。
17.可知的是,通过利用客服对话行为分类子模型和客户对话行为分类子模型分别对对话日志中的客服所发起的对话语句和客户所发起的对话语句分别输入至相应的分子子模型中,能够使得输出的每一对话语句的对话行为更为准确,有效提升有效行为序列的抽取效果。
18.可选的,根据有效行为序列对对话日志进行片段抽取,得到对话日志的对话流,包括:在构成有效行为序列的多个对话行为中,将位于有效行为序列首位的对话行为所对应的对话语句作为对话流的首句;将位于有效行为序列末位的对话行为所对应的对话语句作为对话流的末句;首句、末句以及对话日志中位于首句和末句之间对话语句,构成对话流。
19.可选的,确定待处理的对话日志,包括:
20.获取历史对话日志集合,历史对话日志集合中包括客服与客户进行客服对话所产生的多个历史对话日志;对各历史对话日志进行场景定位,得到各历史对话的场景意图;和/或,确定各历史对话日志的交互轮次;和/或,确定各历史对话日志中是否包括客服进行答复的对话语句;从各历史对话日志中选出具备预设条件的历史对话日志作为待处理的对话日志;其中,预设条件包括:历史对话日志的场景意图为咨询意图,和/或,历史对话日志的交互轮次大于预设轮次阈值,和/或,历史对话日志中包括有客服进行答复的对话语句。
21.可知的是,为了更够使得对对话日志的处理有着更好的处理效果,本实施方式中还将对历史对话日志集合中的各历史对话日志进行预筛选,以使符合一定预设条件的历史对话日志作为待处理的对话日志,从而使得基于该待处理的对话日志所抽取得到的对话流,更能够表现出客服问答过程中的关键信息,有利于客服实现客服机器人的配置。
22.第二方面,本技术实施例提供了一种对话行为分类模型的训练方法,包括:
23.确定对话日志集合,对话日志集合中包括客服与客户进行客服对话所产生的多个对话日志,每个对话日志包括多个对话语句;
24.根据各对话日志中的各对话语句,确定各类型的对话行为所对应的对话规则;
25.根据各对话规则,对各对话日志中的各对话语句进行样本提取处理,得到各类型的对话行为所对应的正负样本集合;
26.利用各正负样本集合对预先构建的对话行为分类模型进行训练,得到训练后的对话行为分类模型,训练后的对话行为分类模型用于对待处理的对话日志进行行为分类识别处理,得到待处理的对话日志的行为序列,其中,行为序列中包括待处理的对话日志中每一对话语句的对话行为,对话日志的行为序列用于对对话日志进行处理以得到对话日志的对话流。
27.可知的是,本技术实施方式中,为了能够利用行为序列对对话日志进行抽取得到对话流,还需要对预先构建的对话行为分类模型进行训练,其中,通过利用基于对话规则的无监督式的训练方式能够有大大降低模型训练过程中所需的人力资源,在保证模型训练效果的情况下降低训练所需的各类成本,便于完成对对话日志中的对话流的准确快速的抽取。
28.可选的,对话规则包括:场景类规则,和/或,正则表达式类规则,和/或,负例关键词类规则。
29.可选的,对话行为包括意图对话行为、提问对话行为和回答对话行为;
30.其中,意图对话行为用于表征由客户发起的具有咨询意图的对话语句;提问标签用于表征由客服发起的针对客户咨询意图所进行提问的对话语句;回答标签用于表征由客服发起的针对客户咨询意图所进行答复的对话语句。
31.可选的,对话行为分类模型包括客服对话行为分类子模型和客户对话行为分类子模型。
32.可选的,该方法还包括:
33.根据所述校验结果对各类型的对话行为所对应的对话规则进行优化,并根据优化后的对话规则确定优化后的正负样本集合,所述优化后的正负样本集合用于对所述对话行为分类模型进行训练。
34.可知的是,本实施例中通过对正负样本集合进行校验,以基于校验结果对对话规
则进行优化,从而实现正负样本
35.第三方面,本技术实施例提供了一种电子设备,包括:存储器,处理器;
36.至少一个处理器;以及
37.存储器;
38.存储器存储计算机执行指令;
39.至少一个处理器执行存储器存储的计算机执行指令,使得至少一个处理器执行如第一方面或第二方面的方法。
40.第四方面,本技术实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,当处理器执行所述计算机执行指令时,实现如第一方面或第二方面的方法。
41.第五方面,本技术实施例提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面或第二方面的方法。
42.本技术实施例提供一种对话行为分类模型的训练方法、对话日志处理方法及装置,其中,可先利用预先训练的对话行为分类模型对对话日志进行分析处理以对对话日志进行对话行为分类,再基于各对话语句的对话行为对对话日志的行为序列进行遍历筛选,以能够基于遍历筛选后的有效行为序列对对话日志中的对话流进行快速抽取,其对话流的抽取效率高,抽取效果好。
附图说明
43.此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
44.图1为一种对话日志处理方法的示意图;
45.图2为本技术所基于的一种网络架构的示意图;
46.图3为本技术实施例提供的一种对话日志处理方法的流程示意图;
47.图4为本技术实施例提供的基于对话流配置智能客服的场景示意图;
48.图5为本技术实施例提供的一种对话行为分类模型的训练方法的流程示意图;
49.图6为本技术实施例提供的一种对话规则优化流程的示意图;
50.图7为本技术提供的一种电子设备的硬件结构示意图。
51.通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。
具体实施方式
52.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
53.本技术的技术方案中,所涉及的各类信息的收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。
54.随着计算机技术的发展,将客服机器人运用在客服行业成为可能。
55.下面将以商家的客服机器人承载于电商平台为例,对本技术基于的方案进行说明。图1为一种对话日志处理方法的示意图,如图1所示的,客户可通过电商平台提供的客服接口建立与商家之间的客服通信通道,并通过该客服通信通道享受商家提供的客服服务。如前所述的,为了使得客服机器人能够实现智能客服功能,商家一般会利用对话流预先对客服机器人进行训练,以使客服机器人能够学习并向真人客服一样为客户提供应答服务。
56.结合图1所示的,对于商家来说,为了能够使客服机器人像真人客服一样为客户提供精准的客服服务,需要利用对话流以对客服机器人进行训练。在客服场景下,对话流指的是一段有意义且完整的对话序列,其一般包含客户用于描述其需求的意图语句、客服用于对客户进行进一步发问的提问语句以及客服对客户进行答复的回答语句。
57.而一般的对话流是由商家自行创建挖掘的。目前,智能客服领域并没有相关方案能够辅助商家对智能客服机器人所需要的对话流进行提及和挖掘,这也使得商家在使用客服机器人的相关功能时,其需要大量时间成本和人力成本以挖掘对话日志中的对话流,其对于客服机器人的配置效率较低,十分不便于使用。
58.相对于图1所示方案,本技术提供了一种对话日志处理方法,其中,通过利用预先训练的对话行为分类模型对对话日志进行分析处理以对对话日志进行对话行为分类,再基于各对话语句的对话行为对对话日志的行为序列进行遍历筛选,以能够基于遍历筛选后的有效行为序列对对话日志中的对话流进行快速抽取,其对话流的抽取效率高,抽取效果好。基于此,商家可直接利用该方法抽取得到的对话流对智能机器人的客服功能进行快速配置,实现客服机器人的客服应答功能。
59.参考图2,图2为本技术所基于的一种网络架构的示意图,图2所示网络架构具体可包括服务器21、商家终端22以及客服终端23。
60.在图2所示架构中,服务器21具体可为设置在云端的服务器集群,其中的服务器21用于按照本技术提供的对话日志处理方法对待处理的对话日志进行相应处理,以得到对话日志的对话流。
61.商家终端22和客户终端23分别可为具有网络通信功能以及用户交互功能的硬件设备,其包括但不限于智能手机、平板电脑、台式电脑、物联网设备等。其中,商家可通过商家终端22获取服务器21所生成的对话日志的对话流,并利用生成的对话流对服务器21中所承载的客服机器人进行配置。客户则可通过其客户终端23与服务器21建立客服通信通道,并通过该客服通信通道与配置完毕的商家的客服机器人进行客服问答。
62.下面通过具体的实施例对本技术提供的对话行为分类模型的训练方法、对话日志处理方法及装置进行详细说明。下面的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。
63.需要说明的是,本实施例中提供的对话日志处理方法的执行主体为前述图2提及的服务器,图3为本技术实施例提供的一种对话日志处理方法的流程示意图。如图3所示的,该对话日志处理方法可以包括如下几个步骤:
64.步骤301、确定待处理的对话日志,对话日志中包括客服与客户进行客服对话所产生的多个对话语句。
65.需要说明的是,待处理的对话日志具体可为预先存储在服务器中的离线数据。该
对话日志用于记录客服与客服进行客服对话所产生的对话语句。
66.示例性的,对话日志可记录为:“67.客户:我之前在你家买过产品a,感觉很好用。
68.客户:今天能给我再推荐一款其他产品么?
69.客服:请问您是什么样的肤质呢?
70.客户:我的两颊和t字区都容易出油。
71.客服:请问您这次需要什么功效的产品呢?
72.客户:抗衰去斑,最近脸上有点皱纹。
73.客服:好的亲,推荐您用产品b呢。
74.客户:这个产品能在敏感肌肤上使用么?
75.客服:可以呢。
76.客服:还有什么可以帮到您的呢?
77.客户:没有了,谢谢。”78.如该示例中的,对话日志中将按照对话语序记录一次客服对话过程中客户和客服分别输入的对话语句。
79.为了能够使得对对话日志的处理有着更好的处理效果,在可选实施方式中,本实施方式中的待处理的对话日志是从历史对话日志集合中筛选获取的。
80.具体的,服务器可先获取历史对话日志集合,其中历史对话日志集合中包括客服与客户进行客服对话所产生的多个历史对话日志。可知的是,每一历史对话日志中均是按照对话语序记录的一次客服对话过程中客户和客服分别输入的对话语句。
81.随后,服务器可通过多种的预设条件从这些历史对话日志中选出待处理的对话日志。具体的,服务器可对各历史对话日志进行场景定位,得到各历史对话的场景意图;和/或,确定各历史对话日志的交互轮次;和/或,确定各历史对话日志中是否包括客服进行答复的对话语句。
82.其中,场景定位是一种对历史对话日志进行意图识别和意图理解以确定该历史对话日志中的对话场景的处理方法。当然,在本实施方式所涉及的智能客服场景中,该场景定位所得到的场景意图具体可包括但不限于:推荐意图、退货意图、咨询意图等与智能客服相关的场景意图。
83.其中,交互轮次是指客户与客服发生一轮交互对话的次数,如前述示例的“客户:这个产品能在敏感肌肤上使用么?客服:可以呢。”其中的客户提问和客服回答可作为一轮交互对话。通过统计客户提问和客服回答可确定出每一历史对话日志中的交互轮次。
84.其中,确定各历史对话日志中是否包括客服进行答复的对话语句是指,对历史对话日志中客服是否给出答复相关的对话语句的判定。依旧如前示例中出现的“客服:好的亲,推荐您用产品b呢。”则为客户给出的答复的对话语句。
85.通过对每一历史对话日志的判定和筛选,可从中选出具备预设条件的历史对话日志作为待处理的对话日志;其中,预设条件包括:历史对话日志的场景意图为咨询意图,和/或,历史对话日志的交互轮次大于预设轮次阈值,和/或,历史对话日志中包括有客服进行答复的对话语句。而可知的是,通过这样的处理方法能够使得待处理的对话日志中包括有效信息的概率较大,从该对话日志中抽取对话流的可能性较高。
86.步骤302、利用预先训练的对话行为分类模型对对话日志进行处理,得到对话日志的行为序列,其中,行为序列中包括对话日志中每一对话语句的对话行为。
87.步骤303、对行为序列中的各对话行为进行遍历筛选得到有效行为序列。
88.具体来说,在获取到待处理的对话日志之后,服务器将会调用预先训练的对话行为分类模型以对待处理的对话日志中的每一个对话语句分别进行处理,以输出每一对话语句所对应的对话行为。而按照各对话语句在对话日志中的顺序,各对话语句的对话行为将构成相应的行为序列。
89.其中,服务器中的对话行为分类模型可为已有模型,也可为对预先构建的模型进行训练获得的模型,本实施方式将不对模型的训练过程进行任何限制。
90.其中,对话行为是为发送者的对话打上的行为标签,例如经典的damsl体系中,将对话行为归为提问、生命、附和、反馈、打断等42个小类5个大类。
91.具体的,发明人通过对大量的对话日志进行分析发现,当一段对话片段中包括有意图对话行为的对话语句、提问对话行为的对话语句和回答对话行为的对话语句时,该段对话片段的信息较为完整,而利用这样的信息对客服机器人进行训练配置所得到的配置效果较好。
92.基于此,在本实施方式中,对话语句的对话行为的类型具体可包括意图对话行为、提问对话行为和回答对话行为。也就是说,将对话日志中的对话语句输入至模型后,模型将输出该对话语句属于意图对话行为、提问对话行为和回答对话行为的概率,而基于该概率可确定出该对话语句属于哪种对话行为。
93.其中,对话行为分类模型具体可采用bert模型,该模型是基于变换器的双向编码器表示技术而实现的,可用于文本编码和分类。
94.在该实施方式的基础上,为了进一步提升对每一对话语句的对话行为的分类准确性,在可选实施方式中,服务器中的模型具体可包括对话行为分类模型包括客服对话行为分类子模型和客户对话行为分类子模型。也就是说,在对对话日志中的各对话语句进行对话行为识别时,可基于每一对话语句的发起者的不同,将每一对话语句输入至不同的对话行为分类子模型中,以进行更准确的识别,从而有效提升对话行为的分类准确性。
95.具体的,服务器可将对话日志中的客服所发起的对话语句输入至客服对话行为分类子模型,输出客服的对话行为,其中,客服的对话行为包括提问对话行为和回答对话行为;服务器还可将对话日志中的客户所发起的对话语句输入至客户对话行为分类子模型,输出客户的对话行为,其中,客户的对话行为包括意图对话行为。最后,服务器将根据客服所发起的对话语句所对应的客服的对话行为,以及客户所发起的对话语句所对应的客户的对话行为,得到行为序列。
96.当然,在一些实施方式中,对话语句可能并不属于上述三种对话行为中的任意一种,此时,该对话行为可被标记为其他对话行为。
97.示例性的,假设待处理的对话日志s可表示为s={q1,

,qk},其中,每一对话语句将作为s中的一个元素q,而k则用于表示该对话日志中的对话语句的数量。
98.对前述示例中的对话日志s进行模型处理可得到如下的行为序列l={l1,

,lk}=
99.{其他对话行为,意图对话行为,提问对话行为,其他对话行为,提问对话行为,其他对话行为,回答对话行为,其他对话行为,其他对话行为,提问对话行为,其他对话行为}。
100.在确定行为序列的过程中,服务器将根据各类型的对话行为在行为序列中的排列顺序,从行为序列中抽取连续的多个对话行为以构成有效行为序列;其中,构成有效行为序列的多个对话行为中,位于首位的对话行为的类型为意图对话行为,位于末位的对话行为的类型为回答对话行为,位于首位和末位之间的对话行为不包括类型为意图对话行为或回答对话行为的对话行为。示例性的,基于上述行为序列所得到的有效行为序列可表示为{意图对话行为,提问对话行为,其他对话行为,提问对话行为,其他对话行为,回答对话行为}。
101.具体来说,抽取有效行为序列的过程可表示为:从行为序列中选出任意一个提问对话行为作为目标提问对话行为;在行为序列的各意图对话行为中,判断是否存在排列在目标提问对话行为之前的,且与目标提问对话行为之间不存在其他意图对话行为或回答对话行为的意图对话行为;若存在,则将该意图对话行为作为目标提问对话行为的目标意图对话行为,否则,从行为序列中选出下一个提问对话行为作为目标提问对话行为;以及,在行为序列的各回答对话行为中,判断是否存在排列在目标提问对话行为之后的,且与目标提问对话行为之间不存在其他意图对话行为或回答对话行为的回答对话行为;若存在,则将该回答对话行为作为目标提问对话行为的目标回答对话行为,否则,从行为序列中选出下一个提问对话行为作为目标提问对话行为;抽取目标意图对话行为、目标回答对话行为以及目标意图对话行为与目标回答对话行为之间的各对话行为,构成有效行为序列。
102.进一步来说,以前述示例中的行为序列l={l1,

,lk}={其他对话行为,意图对话行为,提问对话行为,其他对话行为,提问对话行为,其他对话行为,回答对话行为,其他对话行为,其他对话行为,提问对话行为,其他对话行为}为例,为了便于抽取有效行为序列,可先对行为序列中的各对话行为进行分类以将每一类对话行为在行为序列中的序号进行聚合,得到各对话行为对应的序列,即得到意图对话行为对应的序列pa、提问对话行为对应的序列pb和回答对话行为对应的序列pc;其中,序列pa={2},序列pb={3,5,10},序列pc={7}。
103.随后,以提问对话行为对应的序列pb中的每一个提问对话行为为中心,确定排在提问对话行为之前的与该提问对话行为排序最接近的意图对话行为,以及排在提问对话行为之后的与该提问对话行为排序最接近的回答对话行为。
104.如,针对序列pb中的{3},序列pa中的{2}以及序列pc中的{7}均满足条件。此时,还需要判定序列pb中的{3}与序列pa中的{2}之间是否包括有其他的意图对话行为或回答对话行为,同时,还需要判定序列pb中的{3}与序列pa中的{7}之间是否包括有其他的意图对话行为或回答对话行为。由于,pb中的{3}与序列pa中的{2}之间不包括有其他的意图对话行为或回答对话行为,并且,序列pb中的{3}与序列pa中的{7}之间也不包括有其他的意图对话行为或回答对话行为,因此,序列pa中的{2}至pc中的{7}的对话行为构成有效行为序列,即有效行为序列m={l2,

,l7}。
105.步骤304、根据有效行为序列对对话日志进行片段抽取,得到对话日志的对话流。
106.具体的,当确定出对话日志的有效行为序列之后,可基于有效行为序列中的对话行为对待处理的对话日志进行片段抽取。
107.在可选实施方式中,抽取过程可表示为:在构成有效行为序列的多个对话行为中,将位于有效行为序列首位的对话行为所对应的对话语句作为对话流的首句;将位于有效行为序列末位的对话行为所对应的对话语句作为对话流的末句;首句、末句以及对话日志中
位于首句和末句之间对话语句,构成对话流。
108.示例性的,当有效行为序列m={l2,

,l7}时,可确定l2对应的对话语句“客户:今天能给我再推荐一款其他产品么?”并将该对话语句作为对话流的首句;可确定l7对应的对话语句“客服:好的亲,推荐您用产品b呢”并将该对话语句作为对话流的末句,最终形成的对话流可表示为:“客户:今天能给我再推荐一款其他产品么?客服:请问您是什么样的肤质呢?客户:我的两颊和t字区都容易出油。客服:请问您这次需要什么功效的产品呢?客户:抗衰去斑,最近脸上有点皱纹。客服:好的亲,推荐您用产品b呢。”。
109.图4为本技术实施例提供的基于对话流配置智能客服的场景示意图,如图4所示的,商家可通过在当前界面上选中需要配置的产品的对话流,这些可被选中的对话流均是通过前述的对话日志的处理方法所获得的。当完成对对话流的选中后,对话流将被加载到配置页面,以输出给智能客服机器人供其学习和训练使用。当然,在可能的实现方式中,该对话流将被进一步拆解为思维导图,以便于智能客服机器人利用思维导图执行相应的客服应答对话。
110.本技术实施例提供一种对话日志处理方法,其中,可先利用预先训练的对话行为分类模型对对话日志进行分析处理以对对话日志进行对话行为分类,再基于各对话语句的对话行为对对话日志的行为序列进行遍历筛选,以能够基于遍历筛选后的有效行为序列对对话日志中的对话流进行快速抽取,其对话流的抽取效率高,抽取效果好。
111.在上述实施方式的基础上,本技术还提供了一种对话行为分类模型的训练方法,本实施例中提供的对话行为分类模型的训练方法的执行主体为前述提及的服务器,图5为本技术实施例提供的一种对话行为分类模型的训练方法的流程示意图。如图5所示的,该对话行为分类模型的训练方法可以包括如下几个步骤:
112.步骤501、确定对话日志集合,对话日志集合中包括客服与客户进行客服对话所产生的多个对话日志,每个对话日志包括多个对话语句。
113.具体来说,与前述实施例类似的是,对话日志集合中的每一对话日志均可为从历史对话日志集合中筛选得到的。即,通过对各历史对话日志进行场景定位,得到各历史对话的场景意图;和/或,确定各历史对话日志的交互轮次;和/或,确定各历史对话日志中是否包括客服进行答复的对话语句;然后,从各历史对话日志中选出具备预设条件的历史对话日志作为构成对话日志集合;其中,预设条件包括:历史对话日志的场景意图为咨询意图,和/或,历史对话日志的交互轮次大于预设轮次阈值,和/或,历史对话日志中包括有客服进行答复的对话语句。
114.步骤502、根据各对话日志中的各对话语句,确定各类型的对话行为所对应的对话规则。
115.具体来说,对话规则包括:场景类规则,和/或,正则表达式类规则,和/或,负例关键词类规则。
116.其中,场景类规则可表示该类对话行为所出现的意图场景类型,如意图对话行为对应的场景类规则可包括咨询场景。
117.其中,正则表达式类规则可表示该类对话行为所使用的用于表征关键词型或关键句式的正则表达式,如提问对话行为的正则表达式类规则可包括“您的



么?”;
118.其中,负例关键词类规则可表示该类对话行为不会使用的关键词或关键句,如,提
问对话行为对应的负例关键词类规则包括:“您是否还有其他问题”。
119.可选实施方式中,对话行为包括意图对话行为、提问对话行为和回答对话行为;其中,意图对话行为用于表征由客户发起的具有咨询意图的对话语句;提问标签用于表征由客服发起的针对客户咨询意图所进行提问的对话语句;回答标签用于表征由客服发起的针对客户咨询意图所进行答复的对话语句。
120.当然,可知的是,上述提及的对话规则具体可利用现有算法对对话日志集合中的对话日志进行提取获取,也可通过利用人工方式对对话日志集合中的对话日志进行标注提取获取。
121.步骤503、根据各对话规则,对各对话日志中的各对话语句进行样本提取处理,得到各类型的对话行为所对应的正负样本集合。
122.具体来说,基于不同类型对话行为的对话规则,可分别利用各对话规则对各对话日志中的对话语句进行处理,以将满足各类型对话规则的对话语句作为该类型对话行为的正样本集合,将不满足各类型对话规则的对话语句作为该类型对话行为的负样本集合。通过该处理,可得到每一类型对话行为对应的正样本集合和负样本集合。
123.步骤504、利用各正负样本集合对预先构建的对话行为分类模型进行训练,得到训练后的对话行为分类模型,训练后的对话行为分类模型用于对待处理的对话日志进行行为分类识别处理,得到待处理的对话日志的行为序列;其中,行为序列中包括待处理的对话日志中每一对话语句的对话行为,对话日志的行为序列用于对对话日志进行处理以得到对话日志的对话流。
124.具体的,利用各类型对话行为对应的正负样本集合可对预先构建的对话行为分类模型进行训练,以得到如前述实施例所述的,可用于识别各对话语句的对话行为的对话行为分类模型。其中,预先构建的对话行为分类模型具体可采用bert模型,该模型是基于变换器的双向编码器表示技术而实现的,可用于文本编码和分类。
125.在可选实施方式中,对话行为分类模型具体包括客服对话行为分类子模型和客户对话行为分类子模型。具体来说,上述提及的意图对话行为所对应的正负样本集合可用于对客户对话行为分类子模型进行训练,以使客户对话行为分类子模型可用于识别对话文本是否属于意图对话行为。类似的,上述提及的提问对话行为所对应的正负样本集合和回答对话行为所对应的正负样本集合,则可用于对客服对话行为分类子模型进行训练,以使客服对话行为分类子模型可用于识别对话文本是否属于提问对话行为以及回答对话行为。
126.在上述各实施方式的基础上,为了能够使得模型的训练效果更好,该训练方法还包括:对各类型的对话行为所对应的正负样本集合进行校验;根据校验结果对各类型的对话行为所对应的对话规则进行优化,并根据优化后的对话规则确定优化后的正负样本集合,优化后的正负样本集合用于对对话行为分类模型进行训练。
127.图6为本技术实施例提供的一种对话规则优化流程的示意图。如图6所示的,具体的,首先可建立一初始对话规则,该初始对话规则具体可根据既往经验构建。然后,利用该初始对话规则对对话日志集合中的各对话日志进行处理,以确定出正负样本集合。
128.随后,在完成一轮利用当前对话规则确定正负样本集合的处理之后,可通过人工校验或算法校验的方式对当前正负样本集合的正确性或准确性进行校验,并基于该校验结果对当前对话规则进行优化。
129.再后,利用优化后的当前对话规则可再次对各对话日志进行处理,以重新获得优化后的正负样本集合。可选的,可再次对该优化后的正负样本集合进行校验,并重复上述过程实现对当前对话规则的迭代优化处理。
130.最后,利用优化完毕的对话规则对对话日志进行处理,得到正负样本集合,该正负样本集合可用于对前述的模型进行训练。
131.当然,需要说明的是,本实施方式中利用模型进行对话日志的处理的具体处理流程可参见前述实施例,本实施例对该部分不再进行赘述。
132.本技术实施例提供一种对话行为分类模型的训练方法,其中,为了能够利用行为序列对对话日志进行抽取得到对话流,还需要对预先构建的对话行为分类模型进行训练,其中,通过利用基于对话规则的无监督式的训练方式能够有大大降低模型训练过程中所需的人力资源,在保证模型训练效果的情况下降低训练所需的各类成本,便于完成对对话日志中的对话流的准确快速的抽取。
133.图7为本技术提供的一种电子设备的硬件结构示意图,如图7所示的,本技术实施例提供一种电子设备,电子设备的存储器可用于存储至少一个程序指令,处理器用于执行至少一个程序指令,以实现上述方法实施例的技术方案。其实现原理和技术效果与上述方法相关实施例类似,此处不再赘述。
134.本技术实施例提供一种芯片。芯片包括处理器,处理器用于调用存储器中的计算机程序,以执行上述实施例中的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
135.本技术实施例提供一种计算机程序产品,当计算机程序产品在电子设备运行时,使得电子设备执行上述实施例中的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
136.本技术实施例提供一种计算机可读存储介质,其上存储有程序指令,程序指令被电子设备执行时,使得电子设备执行上述实施例的技术方案。其实现原理和技术效果与上述相关实施例类似,此处不再赘述。
137.以上的具体实施方式,对本技术的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本技术的具体实施方式而已,并不用于限定本技术的保护范围,凡在本技术的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本技术的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1