在线客服会话的控制方法、装置和电子设备与流程

文档序号:22084115发布日期:2020-09-01 19:50阅读:183来源:国知局
在线客服会话的控制方法、装置和电子设备与流程

本申请涉及人工智能技术领域,具体而言,涉及一种在线客服会话的控制方法、装置和电子设备。



背景技术:

服务提供系统的在线客服可以为用户提供多种服务,及时地解答用户的疑问,满足用户需求。为了避免某一用户长时间占据在线客服,造成客服资源的浪费,在相关技术中,用户和在线客服会话时,如果用户不再回应,也不主动断开会话,通常会采用超时断开的方式系统自动断开会话,但是该方式可能导致用户的需求没有被解决,另外超时断开的等待时间较长,依然会浪费人工客服的时间,从而减少了人工客服能够服务的用户量,降低了人工客服的工作效率。



技术实现要素:

有鉴于此,本申请实施例的目的在于提供一种在线客服会话的控制方法、装置和电子设备,以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高客服的工作效率。

根据本申请的一个方面,提供一种电子设备,可以包括一个或多个存储介质和一个或多个与存储介质通信的处理器。一个或多个存储介质存储有处理器可执行的机器可读指令。当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行所述机器可读指令,以执行一个或多个以下操作:

一种在线客服会话的控制方法,该方法包括:监听当前在线的客服会话;其中,客服会话为用户与服务提供方间的会话;如果服务提供方发送当前消息后的预设时长内未接收到用户的消息,获取客服会话对应的会话信息;其中,会话信息包括客服会话中的会话内容和/或会话统计参数;将会话信息输入至预先训练完成的概率预测模型,得到客服会话的继续概率;基于继续概率控制客服会话的在线状态。

在一些实施例中,上述如果服务提供方发送当前消息后的预设时长内未接收到用户的消息,获取客服会话对应的会话信息的步骤,包括:当服务提供方发送当前消息时,启动计时器;计时器的计时时长为预设时长;监听计时器的计时时长内是否接收到用户的消息;如果否,获取客服会话对应的会话信息。

在一些实施例中,上述会话内容包括:以服务提供方的当前消息为基准,当前消息和当前消息之前连续的至少一部分消息;会话统计参数包括:客服会话中相邻两消息间的间隔时长、当前消息距离当前时间的时长、用户的消息数量、服务提供方的消息数量中的多种。

在一些实施例中,上述概率预测模型通过下述方式训练得到:从预设的会话数据库中提取会话数据;基于会话数据确定多个训练样本;每个训练样本包括会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数;基于训练样本训练预设的初始模型,得到概率预测模型;其中,初始模型包括:卷积网络、递归网络和损失函数。

在一些实施例中,上述基于会话数据确定多个训练样本的步骤,包括:根据提取出的会话数据中的会话标识,将会话数据划分为多个;每个会话数据对应一个会话标识;提取每个会话数据包含的会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数,得到每个会话数据对应的训练样本。

在一些实施例中,上述得到每个会话数据对应的训练样本之后,方法还包括:对于每个训练样本,判断该训练样本中是否包含用户的消息和会话服务提供方的消息;如果否,剔除该训练样本。

在一些实施例中,上述基于训练样本训练预设的初始模型的步骤,包括:从多个训练样本中确定当前训练样本,将当前训练样本的会话内容输入至预设的初始模型的卷积网络中,输出会话内容对应的特征矩阵;将特征矩阵和会话统计参数输入至初始模型的递归网络中,输出当前训练样本对应的特征值;将特征值输入至初始模型的损失函数中,输出当前训练样本的会话关闭原因的预测结果;根据当前训练样本的会话关闭原因,以及会话关闭原因的预测结果,更新初始模型的预测准确率;基于预设条件判断是否终止训练,其中,预设条件包括:预测准确率大于或等于预设的准确率阈值,和/或,输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值;如果否,从多个训练样本中确定下一个当前训练样本,继续训练卷积网络、递归网络和损失函数;如果是,将当前训练样本训练后的初始模型作为概率预测模型。

在一些实施例中,上述卷积网络包括3d卷积神经网络;上述将当前训练样本的会话内容输入至预设的初始模型的卷积网络中,输出会话内容对应的特征矩阵的步骤,包括:通过3d卷积神经网络对当前训练样本的会话内容进行映射处理,得到会话内容对应的特征矩阵。

在一些实施例中,上述递归网络包括预设层数的门控循环单元网络;预设层数的门控循环单元网络依次连接;门控循环单元网络的层数与会话内容中的消息的数量相对应;上述将特征矩阵和会话统计参数输入至初始模型的递归网络中,输出当前训练样本对应的特征值的步骤,包括:将特征矩阵中第一层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至第一层门控循环单元网络中,得到第一层门控循环单元网络的输出结果;对于除第一层门控循环单元网络以外的每层门控循环单元网络,将该层门控循环单元网络的前一层门控循环单元网络的输出结果、该层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至该层门控循环单元网络,直至最后一层门控循环单元网络;将最后一层门控循环单元网络的输出结果作为当前训练样本对应的特征值。

在一些实施例中,上述损失函数包括softmax函数;当前训练样本对应的特征值的数量为多个;上述将特征值输入至初始模型的损失函数中,输出当前训练样本的会话关闭原因的预测结果的步骤,包括:通过softmax函数计算每个特征值的指数函数值;根据每个特征值的指数函数值,以及当前训练样本的每个特征值的指数函数值总和,确定每个特征值的概率;输出每个特征值中指定特征值的概率,将指定特征值的概率、以及指定特征值对应的会话关闭原因确定为当前训练样本的会话关闭原因的预测结果。

在一些实施例中,上述基于继续概率控制客服会话的在线状态的步骤,包括:如果继续概率小于预设的概率阈值,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述基于继续概率控制客服会话的在线状态的步骤,包括:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述基于继续概率控制客服会话的在线状态的步骤,包括:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,继续通过概率预测模型预测客服会话的新继续概率;当新继续概率低于预设的概率阈值时,断开客服会话或指示服务提供方断开客服会话。

根据本申请的另一方面,还提供一种在线客服会话的控制装置,该装置包括:会话监听模块,用于监听当前在线的客服会话;其中,客服会话为用户与服务提供方间的会话;信息获取模块,用于如果服务提供方发送当前消息后的预设时长内未接收到用户的消息,获取客服会话对应的会话信息;其中,会话信息包括客服会话中的会话内容和/或会话统计参数;概率预测模块,用于将会话信息输入至预先训练完成的概率预测模型,得到客服会话的继续概率;会话控制模块,用于基于继续概率控制客服会话的在线状态。

在一些实施例中,上述信息获取模块,用于:当服务提供方发送当前消息时,启动计时器;计时器的计时时长为预设时长;监听计时器的计时时长内是否接收到用户的消息;如果否,获取客服会话对应的会话信息。

在一些实施例中,上述会话内容包括:以服务提供方的当前消息为基准,当前消息和当前消息之前连续的至少一部分消息;会话统计参数包括:客服会话中相邻两消息间的间隔时长、当前消息距离当前时间的时长、用户的消息数量、服务提供方的消息数量中的多种。

在一些实施例中,上述装置还包括模型训练模块,用于:从预设的会话数据库中提取会话数据;基于会话数据确定多个训练样本;每个训练样本包括会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数;基于训练样本训练预设的初始模型,得到概率预测模型;其中,初始模型包括:卷积网络、递归网络和损失函数。

在一些实施例中,上述模型训练模块,用于:根据提取出的会话数据中的会话标识,将会话数据划分为多个;每个会话数据对应一个会话标识;提取每个会话数据包含的会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数,得到每个会话数据对应的训练样本。

在一些实施例中,上述装置还包括:消息判断模块,用于对于每个训练样本,判断该训练样本中是否包含用户的消息和会话服务提供方的消息;样本剔除模块,用于如果该训练样本中不包含用户的消息和会话服务提供方的消息,剔除该训练样本。

在一些实施例中,上述模型训练模块,用于:从多个训练样本中确定当前训练样本,将当前训练样本的会话内容输入至预设的初始模型的卷积网络中,输出会话内容对应的特征矩阵;将特征矩阵和会话统计参数输入至初始模型的递归网络中,输出当前训练样本对应的特征值;将特征值输入至初始模型的损失函数中,输出当前训练样本的会话关闭原因的预测结果;根据当前训练样本的会话关闭原因,以及会话关闭原因的预测结果,更新初始模型的预测准确率;基于预设条件判断是否终止训练,其中,预设条件包括:预测准确率大于或等于预设的准确率阈值,和/或,输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值;如果否,从多个训练样本中确定下一个当前训练样本,继续训练卷积网络、递归网络和损失函数;如果是,将当前训练样本训练后的初始模型作为概率预测模型。

在一些实施例中,上述卷积网络包括3d卷积神经网络;上述模型训练模块,用于:通过3d卷积神经网络对当前训练样本的会话内容进行映射处理,得到会话内容对应的特征矩阵。

在一些实施例中,上述递归网络包括预设层数的门控循环单元网络;预设层数的门控循环单元网络依次连接;门控循环单元网络的层数与会话内容中的消息的数量相对应;上述模型训练模块,用于:将特征矩阵中第一层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至第一层门控循环单元网络中,得到第一层门控循环单元网络的输出结果;对于除第一层门控循环单元网络以外的每层门控循环单元网络,将该层门控循环单元网络的前一层门控循环单元网络的输出结果、该层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至该层门控循环单元网络,直至最后一层门控循环单元网络;将最后一层门控循环单元网络的输出结果作为当前训练样本对应的特征值。

在一些实施例中,上述损失函数包括softmax函数;当前训练样本对应的特征值的数量为多个;上述模型训练模块,用于:通过softmax函数计算每个特征值的指数函数值;根据每个特征值的指数函数值,以及当前训练样本的每个特征值的指数函数值总和,确定每个特征值的概率;输出每个特征值中指定特征值的概率,将指定特征值的概率、以及指定特征值对应的会话关闭原因确定为当前训练样本的会话关闭原因的预测结果。

在一些实施例中,上述会话控制模块,用于:如果继续概率小于预设的概率阈值,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述会话控制模块,用于:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述会话控制模块,用于:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,继续通过概率预测模型预测客服会话的新继续概率;当新继续概率低于预设的概率阈值时,断开客服会话或指示服务提供方断开客服会话。

根据本申请的另一方面,还提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如上述在线客服会话的控制方法的步骤。

根据本申请的另一方面,还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述在线客服会话的控制方法的步骤。

基于上述任一方面,如果监听到当前在线的客服会话中,服务提供方发送当前消息后的预设时长内未接收到用户的消息,则获取该客服会话对应的会话信息;进而将该会话信息输入至概率预测模型得到客服会话的继续概率,基于该继续概率控制客服会话的在线状态。该方式中,概率预测模型可以根据客服会话的会话信息预测用户回应的概率,即客服会话的继续概率,基于该继续概率控制会话的在线状态;相对于相关技术中超时断开的方式,该方式可以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1示出了本申请实施例所提供的一种服务提供系统的框图;

图2示出了本申请实施例所提供的一种电子设备的示例性硬件和软件组件的示意图;

图3示出了本申请实施例所提供的一种在线客服会话的控制方法的流程图;

图4示出了本申请实施例所提供的一种概率预测模型的训练方法的流程图;

图5示出了本申请实施例所提供的另一种概率预测模型的训练方法的流程图;

图6示出了本申请实施例所提供的另一种在线客服会话的控制方法的流程图;

图7示出了本申请实施例所提供的一种在线客服会话的控制装置的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“租车服务”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕租车服务进行描述,但是应该理解,这仅是一个示例性实施例。本申请还可以应用于提供其他服务系统,例如,用于发送和/或接收快递的系统、用于买卖双方交易的服务系统等。

需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。

图1是本申请一些实施例的服务提供系统100的框图。例如,服务提供系统100可以是用于诸如出租车、代驾服务、快车、拼车、公共汽车服务、驾驶员租赁、或班车服务之类的运输服务、或其任意组合的在线运输服务平台。服务提供系统100可以包括服务器110、网络120、用户终端130、服务提供方终端140和数据库150中的一种或多种,服务器110中可以包括执行指令操作的处理器。

在一些实施例中,服务器110可以是单个服务器,也可以是服务器组。服务器组可以是集中式的,也可以是分布式的(例如,服务器110可以是分布式系统)。在一些实施例中,服务器110相对于终端,可以是本地的、也可以是远程的。例如,服务器110可以经由网络120访问存储在用户终端130、服务提供方终端140、或数据库150、或其任意组合中的信息和/或数据。作为另一示例,服务器110可以直接连接到用户终端130、服务提供方终端140和数据库150中至少一个,以访问存储的信息和/或数据。在一些实施例中,服务器110可以在云平台上实现。在一些实施例中,服务器110可以在具有本申请中图2所示的一个或多个组件的电子设备200上实现。在一些实施例中,服务器110可以包括处理器。处理器可以处理与服务请求有关的信息和/或数据,以执行本申请中描述的一个或多个功能。

网络120可以用于信息和/或数据的交换。在一些实施例中,服务提供系统100中的一个或多个组件(例如,服务器110,用户终端130,服务提供方终端140和数据库150)可以向其他组件发送信息和/或数据。例如,服务器110可以经由网络120从用户终端130获取服务请求。在一些实施例中,网络120可以是任何类型的有线或者无线网络,或者是他们的结合。仅作为示例,网络120可以包括有线网络、无线网络、光纤网络、远程通信网络等。在一些实施例中,网络120可以包括一个或多个网络接入点。例如,网络120可以包括有线或无线网络接入点,例如基站和/或网络交换节点,服务提供系统100的一个或多个组件可以通过该接入点连接到网络120以交换数据和/或信息。

在一些实施例中,“用户”和“用户终端”可以互换使用,“服务提供方”和“服务提供方终端”可以互换使用。在一些实施例中,用户终端130可以包括移动设备、平板计算机、膝上型计算机、或机动车辆中的内置设备等。在一些实施例中,用户终端130可以是具有用于定位用户和/或用户终端的位置的定位技术的设备。

在一些实施例中,服务提供方终端140可以是与用户终端130类似或相同的设备。在一些实施例中,服务提供方终端140可以是具有定位技术的设备,用于定位服务提供方和/或服务提供方终端的位置。在一些实施例中,用户终端130和/或服务提供方终端140可以与其他定位设备通信以确定用户、用户终端130、服务提供方、或服务提供方终端140、或其任意组合的位置。在一些实施例中,用户终端130和/或服务提供方终端140可以将定位信息发送给服务器110。

数据库150可以存储数据和/或指令。在一些实施例中,数据库150可以存储从用户终端130和/或服务提供方终端140获得的数据。数据库150可以存储在本申请中描述的示例性方法的数据和/或指令。数据库150可以包括大容量存储器、可移动存储器、易失性读写存储器、或只读存储器(read-onlymemory,rom)等。数据库150可以在云平台上实现。

在一些实施例中,数据库150可以连接到网络120以与服务提供系统100(例如,服务器110,用户终端130,服务提供方终端140等)中的一个或多个组件通信。服务提供系统100中的一个或多个组件可以经由网络120访问存储在数据库150中的数据或指令。在一些实施例中,数据库150可以直接连接到服务提供系统100中的一个或多个组件(例如,服务器110,用户终端130,服务提供方终端140等);或者,数据库150也可以是服务器110的一部分。

图2示出根据本申请的一些实施例的可以实现本申请思想的服务器110、用户终端130、服务提供方终端140的电子设备200的示例性硬件和软件组件的示意图。例如,处理器可以用于电子设备200上,并且用于执行本申请中的功能。

电子设备200可以是通用计算机或特殊用途的计算机,两者都可以用于实现本申请的在线客服会话的控制方法。本申请尽管仅示出了一个计算机,但是为了方便起见,可以在多个类似平台上以分布式方式实现本申请描述的功能,以均衡处理负载。

例如,电子设备200可以包括连接到网络的网络端口210、用于执行程序指令的一个或多个处理器220、通信总线230、和不同形式的存储介质240,例如,磁盘、rom、或ram,或其任意组合。示例性地,计算机平台还可以包括存储在rom、ram、或其他类型的非暂时性存储介质、或其任意组合中的程序指令。根据这些程序指令可以实现本申请的方法。电子设备200还包括计算机与其他输入输出设备(例如键盘、显示屏)之间的输入/输出(input/output,i/o)接口250。

为了便于说明,在电子设备200中仅描述了一个处理器。然而,应当注意,本申请中的电子设备200还可以包括多个处理器,因此本申请中描述的一个处理器执行的步骤也可以由多个处理器联合执行或单独执行。例如,若电子设备200的处理器执行步骤a和步骤b,则应该理解,步骤a和步骤b也可以由两个不同的处理器共同执行或者在一个处理器中单独执行。例如,第一处理器执行步骤a,第二处理器执行步骤b,或者第一处理器和第二处理器共同执行步骤a和b。

基于上述电子设备的描述,本申请实施例首先描述一种在线客服会话的控制方法,如图3所示,该方法包括如下步骤:

步骤s302,监听当前在线的客服会话;其中,该客服会话为用户与服务提供方间的会话;

服务提供方具体可以为服务提供系统的在线客服、人工客服等;该服务提供系统可以为租车系统、购物系统、教育系统、行政系统等;用户登录该系统可以享受相应的服务,因而用户也可以称为服务使用者。用户在使用服务提供系统提供的服务的过程中,经常会产生一些疑问或者纠纷,此时则需要连线服务提供方,解决疑问或纠纷。用户具体可以点击上述服务提供系统的网页页面或应用程序页面的在线客服或人工客服相关按钮,即可连线服务提供方。

用户连线服务提供方时,如果服务提供方的数量较少,连线服务提供方的用户数量较多,用户可能需要排队才能连线到服务提供方,进入与服务提供方的客服会话。当用户与服务提供方均进入会话时,即可开始上述客服会话。在实际实现时,网页页面或应用程序页面上可以设置一个会话窗口,以供用户和服务提供方进行会话。一个客服会话通常包含用户与服务提供方接通后,至该会话断开的所有消息,一个客服会话通常对应有唯一的会话标识。在会话过程中,系统可以全程实时监听当前在线的客服会话,即监听用户和服务提供方发出的消息(当然还可能包含系统发出的消息),以及一方发出消息后,等待另一方回复消息的时间;系统也可以仅在服务提供方发出消息后,监听用户回复的消息,以及等待用户回复消息的时间等。

步骤s304,如果服务提供方发送当前消息后的预设时长内未接收到用户的消息,获取客服会话对应的会话信息;其中,该会话信息包括客服会话中的会话内容和/或会话统计参数;

当服务提供方发出当前消息后,用户有时不会及时回复消息,此时有两种可能,一种是用户的疑问已经得到解答,会话已结束,但用户没有主动断开会话;另一种是用户可能还未查看服务提供方发送的消息,或者服务提供方发送的消息没有解决用户的疑问,但用户忙于其他事物没有来得及回复消息。

相关技术中,如果服务提供方发送当前消息后长时间内未接收到用户的消息,则系统会自行断开会话;但是该方式并没有考虑用户没有回复消息的可能原因,一方面会导致用户的疑问没有得到解答,影响用户体验度,另一方面会使服务提供方空等很长一段时间,从而降低服务提供方的工作效率;基于此,本实施例中拟通过当前的客服会话中双方已经发送的消息,推断用户疑问得到解答,且会话应当结束的概率,继而基于该概率,确定是否断开会话。

具体到上述步骤s304中,服务提供方发送当前消息后,即可进行计时,当计时到达预设时长后仍然没有接收到用户的消息,即获取客服会话对应的会话信息。该预设时长可以根据实际需求设置,如30秒、60秒等;该预设时长通常会短于相关技术中超时断开方式中使用的超时时长,以节约服务提供方的时间。上述获取到的客服会话对应的会话信息,可以仅包含客服会话中的会话内容或会话统计参数中的一种,也可以同时包含客服会话中的会话内容和会话统计参数。上述客服会话中的会话内容可以是客服会话中,用户和服务提供方发送的所有消息,也可以为部分消息,该部分消息可以为客服会话中用户发送的消息、服务提供方发送的消息、或者按照消息发送时间排序后,序列中指定位置的消息等。上述会话统计参数可以为与客服会话相关的统计信息,如发送各个消息的等待时长、上述服务提供方发送当前消息的时间距离当前时间的时长等,还可以包含与该客服会话中用户的统计信息,如该用户使用在线客服的次数等。

步骤s306,将会话信息输入至预先训练完成的概率预测模型,得到客服会话的继续概率;

该概率预测模型可以通过多种机器学习工具实现,如神经网络、决策树模型等。该概率预测模型在训练过程中,可以从客服会话的数据库中获取训练样本,该训练样本中通常包含有正样本和负样本,其中正样本可以从超时断开的会话中提取;负样本可以从用户主动断开的会话中提取;通过对正样本和负样本的学习训练,上述概率预测模型即可基于会话信息预测当前的客服会话的继续概率,该继续概率也可以理解为服务提供方发送消息后,用户回复消息的概率。

步骤s308,基于继续概率控制客服会话的在线状态。

客服会话的在线状态可以为在线或断开;如果上述继续概率较高,则说明基于上述会话消息,用户的疑问没有得到解决,用户发送消息的可能性较大,此时,可以保持会话为在线状态;如果上述继续概率较低,则说明基于上述会话信息,可以推测用户的疑问已解决,用户不再发送消息的可能性较大,此时,可以断开上述客服会话。另外,系统可以直接断开上述客服会话,也可以向服务提供方发送提示信息,由服务提供方根据实际情况确定是否断开会话。在实际实现时,可以设置一个概率阈值或概率区间,与将预测得到的继续概率与该概率阈值或概率区间进行比较,进而控制客服会话的在线状态。

本发明实施例提供的一种在线客服会话的控制方法,如果监听到当前在线的客服会话中,服务提供方发送当前消息后的预设时长内未接收到用户的消息,则获取该客服会话对应的会话信息;进而将该会话信息输入至概率预测模型得到客服会话的继续概率,基于该继续概率控制客服会话的在线状态。该方式中,概率预测模型可以根据客服会话的会话信息预测用户回应的概率,即客服会话的继续概率,基于该继续概率控制会话的在线状态;相对于相关技术中超时断开的方式,该方式可以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

上述实施例中提出了通过概率预测模型预测客服会话的继续概率,再基于该继续概率控制客服会话的在线状态;本实施例中,重点描述该概率预测模型的训练方式。

图4所示为一种概率预测模型的训练方法示意图;该方法包括如下步骤:

步骤s402,从预设的会话数据库中提取会话数据;

该会话数据库可以为hive形式的数据库,当然该会话数据库也可以通过其他hadoop架构或其他架构的数据库(或数据仓库)实现。该会话数据库中保存有服务提供系统中的用户与服务提供方进行会话时产生的会话数据。在提取会话数据的过程中,可以设置筛选字段,根据该筛选字段从上述会话数据库筛选出符合条件的会话数据。例如,该筛选字段可以包含用户标识(也可以称为用户id)、会话标识(也可以称为会话id)、会话关闭原因(包括正常关闭和超时断开)、会话中各消息类型(包括语音、文字、图片等);会话中各消息的发送时间、消息发送来源(包括服务提供方、用户、系统)、消息内容等。

步骤s404,基于会话数据确定多个训练样本;每个训练样本包括会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数;

上述提取到的会话数据中包含有多个会话对应的会话数据,并且,每个会话对应有唯一的会话标识。一个训练样本通常由一个会话对应的会话数据确定出来,具体可以从一个会话的会话数据中提取上述会话标识、会话内容、会话关闭原因以及会话统计参数等。其中,会话内容为该会话中用户和服务提供方发送的消息;该会话内容可以包含会话中所有的消息,也可以仅包含部分消息。例如,将会话中的消息按照时间排序后,仅将最后几条的消息作为会话内容,该会话内容中包含的消息的条数可以预先设定。会话统计参数具体可以为会话中的各个消息按照时间排序后相邻消息之间的时间差、最后一条消息与会话挂断时间的时间差、用户发送消息的条数、服务提供方发送消息的条数等。

另外,还可以根据会话关闭原因将确定出的训练样本划分为正样本和负样本;其中,正样本的会话关闭原因为超时断开,负样本的会话关闭原因为正常关闭。在实际实现时,可以预先确定正样本和负样本的数量,将二者的比例设置在合理的范围内,如正样本的数量和负样本的数量比值为1:1、4:1等。

步骤s406,基于训练样本训练预设的初始模型,得到概率预测模型;其中,初始模型包括:卷积网络、递归网络和损失函数。

在训练过程中,可以逐一将训练样本输入至初始模型中,使初始模型输出预测结果,该预测结果可以包含该训练样本对应的正常关闭的概率和超时断开的概率,将预测结果与该训练样本中的会话关闭原因进行比较,进而调整初始模型中的参数,到达训练模型的目的。

考虑到训练样本中多为文本数据,因此上述初始模型中包含有卷积网络、递归网络和损失函数;其中,卷积网络可以将文本数据转换为能够参与计算的向量或矩阵;递归网络可以考虑到样本数据中各消息的时间顺序,从而提取出预测用户后续是否再回复相关的特征数据;损失函数可以基于该特征数据,计算得到该训练样本正常关闭的概率和超时断开的概率。

上述模型训练方式可以得到概率预测模型,基于该概率预测模型可以预测得到客服会话的继续概率。为了进一步提高上述概率预测模型的准确性和稳定性,本实施例中还提供另一种模型训练方法,该方法进一步描述了模型的具体训练方式,以及对训练数据的数据清洗过程;如图5所示,该方法包括如下步骤:

步骤s502,从预设的会话数据库中提取会话数据;

步骤s504,根据提取出的上述会话数据中的会话标识,将会话数据划分为多个;每个会话数据对应一个会话标识;

由于提取到的会话数据中涉及到多个会话,且每个会话对应有唯一的会话标识,基于此,可以将上述会话数据进行划分,得到每个会话对应的会话数据。

步骤s506,提取每个会话数据包含的会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数,得到每个会话数据对应的训练样本。

上述划分后的每个会话对应的会话数据,通常包含有大量的信息,尤其是与概率预测无关的信息,如用户账号等;为了使训练数据更加简洁、高效,需要从每个会话数据中提取与概率预测相关的会话内容、会话关闭原因以及会话统计参数,将提取到的这些信息组成一个训练样本。

步骤s508,对于每个训练样本,判断该训练样本中是否包含用户的消息和会话服务提供方的消息;如果否,剔除该训练样本。直至遍历完所有的训练样本,得到最终的多个训练样本。

在得到每个会话数据对应的训练样本后,可以最终得到多个训练样本;在这些训练样本中,依然会存在一些对模型训练没有明显作用的训练样本,这些训练样本也可以称为无效样本;例如,仅有用户发送的消息的样本、仅有服务提供方发送的消息的样本;由于这些样本中不存在用户和服务提供方的消息互动,不利于模型训练,因而需要将这些样本剔除。

在实际实现时,可以逐一识别会话内容中各个消息的消息发送来源,确定该训练样本中是否包含用户的消息和会话服务提供方的消息;如果识别出的各个消息的消息发送来源包括用户和会话服务提供方,则无需剔除该训练样本;如果识别出的各个消息的消息发送来源仅包括用户或会话服务提供方,则剔除该训练样本。

步骤s510,从上述多个训练样本中确定第一个当前训练样本;

步骤s512,将当前训练样本的会话内容输入至预设的初始模型的卷积网络中,输出会话内容对应的特征矩阵;

在实际实现时,可以按照预设规则将多个训练样本进行排序,然后按照排列顺序逐一将训练样本确定为当前训练样本,并输入至卷积网络中;当然也可以从多个训练样本中随机地确定当前训练样本。上述卷积网络中可以包含有多次卷积层,每层卷积层通过对应的卷积核对会话内容进行卷积计算,进而将文本形式的会话内容转换成特征矩阵;相较于文本形式的会话内容,特征矩阵更便于参与计算,有利于后续网络的特征提取处理。

具体而言,该卷积网络可以通过3d卷积神经网络实现,该3d卷积神经网络有利于提取相邻字词之间,或者相邻消息之间的相关性;当模型中的卷积网络为3d卷积神经网络时,可以通过3d卷积神经网络对当前训练样本的会话内容进行映射处理,得到会话内容对应的特征矩阵。在实际实现时,通过3d卷积神经网络对会话内容中的每条消息进行映射处理,得到各消息对应的特征矩阵;对消息进行映射处理的过程,也可以称为对消息进行文本embedding的过程。

步骤s514,将特征矩阵和会话统计参数输入至初始模型的递归网络中,输出当前训练样本对应的特征值;

该递归网络可以为lstm(longshort-termmemory,长短期记忆)网络、gru(gatedrecurrentunit,门控循环单元)网络、结构递归神经网络等;该递归网络通常具有树状阶层结构和网络节点,可以对输入的信息进行递归处理;递归网络在处理文本语言时,可以解析文本语言中的语句,从而提取文本语言的语言含义。因而上述递归网络输出的当前训练样本对应的特征值,通常代表了该当前训练样本中会话内容的含义。

为了进一步理解,下面以递归网络包括预设层数的门控循环单元网络为例进行说明;预设层数的门控循环单元网络依次连接;门控循环单元网络的层数与会话内容中的消息的数量相对应;例如,如果训练样本的会话内容包含有五条消息,则递归网络中包含有五层门控循环单元网络,五层门控循环单元网络依次连接;这五条消息按照时间先后顺序排序后,由第一层门控循环单元网络处理第一条消息,由第二层门控循环单元网络处理第二条消息,直至第五层门控循环单元网络处理第五条消息,输出最终的特征值;其中,这些门控循环单元网络中,当前层门控循环单元网络的输入数据通常包含有前一层门控循环单元网络的输出数据,还包含当前层门控循环单元网络对应的消息,以及其他相关数据。

基于上述门控循环单元网络,上述步骤s514还可以通过下述步骤02-06实现:

步骤02,将特征矩阵中第一层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至第一层门控循环单元网络中,得到第一层门控循环单元网络的输出结果;

具体地,可以按照会话内容中各个消息的时间顺序,对特征矩阵中各消息的特征矩阵进行排序;由于消息的数量与门控循环单元网络的层数相对应;因此,可以按照排列顺序从特征矩阵中获取一个消息对应的特征矩阵;将获取到的特征矩形以及该会话内容的会话统计参数输入至第一层门控循环单元网络进行训练;通常,第一层门控循环单元网络会对输入数据进行卷积计算,门控循环单元网络的输出结果通常为对输入数据进行卷积计算后得到的特征矩阵或特征向量。输入至第一层门控循环单元网络中的会话统计参数,可以为会话内容对应的全部的会话统计参数,也可以为与输入的特征矩阵对应的消息相关联的部分会话统计参数。

步骤04,对于除第一层门控循环单元网络以外的每层门控循环单元网络,将该层门控循环单元网络的前一层门控循环单元网络的输出结果、该层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至该层门控循环单元网络,直至最后一层门控循环单元网络;

对于除第一层门控循环单元网络以外的每层门控循环单元网络,该门控循环单元网络之前都连接有前一层的门控循环单元网络;该门控循环单元网络的输入数据包含有前一层门控循环单元网络的输出结果、该层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数;该门控循环单元网络对输入数据进行卷积计算,该门控循环单元网络的输出结果通常为对输入数据进行卷积计算后得到的特征矩阵或特征向量。由于每层门控循环单元网络的输入数据包含有前一层门控循环单元网络的输出结果,因此,最后一层门控循环单元网络的输入数据中包含有之前所有层对应的输出结果,且最后一层门控循环单元网络的输出结果可以表征会话内容中所有消息对应的特征。

步骤06,将最后一层门控循环单元网络的输出结果作为当前训练样本对应的特征值。

最后一层门控循环单元网络的输出结果中通常包含有多维度的特征矩阵,因此当前训练样本对应的特征值中也包含多维度的特征矩阵,如300维甚至更多维。

步骤s516,将特征值输入至初始模型的损失函数中,输出当前训练样本的会话关闭原因的预测结果;

该损失函数可以为交叉熵函数、softmax函数、sigmoid函数等;该损失函数可以对每个维度的特征值求取概率,并输出指定的特征值;具体到本实施例中,每个维度的特征值通常代表不同的含义,但其中通常包含有表征会话关闭原因的特征值,例如,特征值a代表正常关闭,特征值b代表超时挂断;上述损失函数可以指定输出特征值a的概率和特征值b的概率,该特征值a的概率和特征值b的概率即为上述会话关闭原因的预测结果。

为了进一步说明,下面以损失函数包括softmax函数为例,说明上述步骤s516的实现方式,具体包括下述步骤12-16:

步骤12,通过softmax函数计算每个特征值的指数函数值;

具体地,该softmax函数的公式如下:

其中,xi表示第i个特征值;xj表示第j个特征值;n表示特征值总个数。

相对于特征值本身,特征值的指数函数值可以扩大各个特征值之间的差异,例如,特征值的向量为[3,1,-3],计算每个特征值的指数函数值后,该特征值对应的指数函数值向量为[20,2.7,0.05]。采用特征值的指数函数值计算各特征值的概率,可以增大彼此间的概率差距,使正确的识别结果的概率更高,有利于识别结果的准确性。

步骤14,根据每个特征值的指数函数值,以及当前训练样本的每个特征值的指数函数值总和,确定每个特征值的概率;

具体地,每个特征值的指数函数值除以每个特征值的指数函数值总和,即可得到特征值的概率。

步骤16,输出每个特征值中指定特征值的概率,将所述指定特征值的概率、以及所述指定特征值对应的会话关闭原因确定为所述当前训练样本的会话关闭原因的预测结果。

由于递归网络输出的特征值通常包含多维,而本实施例中仅关心与会话关闭原因相关的特征值的概率,因此,可以预先将与会话关闭原因相关的特征值确定为指定特征值,该损失函数可以仅输出指定特征值的概率。

例如,该指定特征值为特征值a和特征值b,其中,特征值a代表正常关闭,特征值b代表超时挂断;该特征值a对应的概率为0.7,特征值b对应的概率为0.2,说明该会话内容正常关闭的概率为0.7,超时挂断的概率为0.2,正常关闭的概率较高;如果该会话内容的会话关闭原因为正常关闭,则对该会话内容的预测结果与真实的会话关闭原因相符合。

步骤s518,根据当前训练样本的会话关闭原因,以及会话关闭原因的预测结果,更新初始模型的预测准确率;

在模型训练过程中,可以记录模型对每个训练样本是预测正确还是预测错误,进而统计出初始模型的预测准确率;每当一个新的当前训练样本预测完成时,即可根据当前训练样本更新该预测准确率。

步骤s520,基于预设条件判断是否终止训练;如果否,执行步骤s522;如果是,执行步骤s524;其中,该预设条件包括:预测准确率大于或等于预设的准确率阈值,和/或,输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值;

每完成一个当前训练样本的预测,即可判断是否满足上述预设条件;该预设条件可以仅包含预测准确率大于或等于预设的准确率阈值,或者输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值之一,也可以同时包含预测准确率大于或等于预设的准确率阈值,以及输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值,即,当模型的预测准确率大于或等于预设的准确率阈值,且输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值时,才可以终止训练。

上述准确率阈值和迭代次数阈值可以根据实际需求进行设置,如该准确率阈值可以设置为80%、90%等;该迭代次数阈值可以位置为1000次、5000次等。

步骤s522,从多个训练样本中确定下一个当前训练样本,继续执行上述步骤s512,即继续训练卷积网络、递归网络和损失函数。结束。

步骤s524,将当前训练样本训练后的初始模型作为概率预测模型。

通过上述方式训练得到的概率预测模型,性能可靠、稳定、且准确率较高,可以根据客服会话的会话信息预测客服会话的继续概率,并基于该继续概率控制会话的在线状态,从而避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

进一步地,本发明实施例还提供另一种在线客服会话的控制方法,该方法重点描述基于继续概率控制客服会话的在线状态的具体实现方式;如图6所示,该方法包括如下步骤:

步骤s602,监听当前在线的客服会话;其中,该客服会话为用户与服务提供方间的会话;

步骤s604,当服务提供方发送当前消息时,启动计时器;计时器的计时时长为预设时长;

步骤s606,监听计时器的计时时长内是否接收到用户的消息;如果是,结束;如果否,执行步骤s608;

步骤s608,获取客服会话对应的会话信息。

该会话信息中包括会话内容和会话统计参数;其中,该会话内容包括:以服务提供方的当前消息为基准,当前消息和当前消息之前连续的至少一部分消息;例如,可以预设该会话内容中包含指定数量的消息,从服务提供方的当前消息开始,获取连续的指定数量的消息;如该指定数量可以为五条,或其他条数。如果该会话中的消息较多,指定数量的消息仅为会话的一部分消息;如果该会话中的消息数量一共有指定数量个,则指定数量的消息为会话的全部消息;如果该会话中的消息数量小于指定数量个,则获取全部的会话中的消息数量。

上述会话统计参数包括:客服会话中相邻两消息间的间隔时长、当前消息距离当前时间的时长、用户的消息数量、服务提供方的消息数量中的多种。这些会话统计参数中,客服会话中相邻两消息间的间隔时长和当前消息距离当前时间的时长通常会较为明显地表征用户的意图,对概率预测的影响较大,因而在实际实现时,上述会话统计参数可以仅包含客服会话中相邻两消息间的间隔时长和当前消息距离当前时间的时长。由于用户或服务提供方在发送消息时,系统通常会自动记录消息的发送时间,因此,可以根据发送时间对会话中的消息进行排序,进而将相邻的会话的发送时间进行做差运算,即可得到客服会话中相邻两消息间的间隔时长,将当前时间与当前消息的发送时间进行做差运算,即可得到上述当前消息距离当前时间的时长。

步骤s610,将会话信息输入至预先训练完成的概率预测模型,得到客服会话的继续概率;

步骤s612,判断该继续概率是否小于预设的概率阈值;如果否,执行步骤s614;如果是,执行步骤s616;

该概率阈值可以根据实际需求设置,例如该概率阈值可以为50%、70%等。如果继续概率小于预设的概率阈值,说明用户回复消息的可能性不大,此时系统可以直接断开该客服会话;另外,为了更加可靠地控制客服会话,系统可以不直接断开该客服会话,向该客服会话的服务提供方发送提示信息,告知该服务提供方用户回复消息的可能性很小了,服务提供方接收到提示信息后,可以根据会话内容进一步判断是否可以断开客服会话。

步骤s614,监听在预设的超时时间阈值内是否接收到用户的消息;如果是,结束;如果否,执行步骤s616;

如果上述继续阈值较高,则暂时不断开客服会话或指示服务提供方断开客服会话,此时可以启动一个新的计时器,该计时器的计时时长为上述超时时间阈值,如果在该计时器的计时过程中,仍然没有收到用户的消息,再断开客服会话或指示服务提供方断开客服会话。

步骤s616,断开客服会话或指示服务提供方断开客服会话。

上述方式中,如果概率预测模型输出的继续概率小于预设的概率阈值,则断开客服会话或指示服务提供方断开客服会话;如果上述继续概率大于或等于预设的概率阈值,则通过超时断开的方式断开客服会话或指示服务提供方断开客服会话;该方式可以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

在另外一种方式中,如果继续概率等于或高于预设的概率阈值,可以监听在预设的超时时间阈值内是否接收到用户的消息;如果否,继续通过概率预测模型预测客服会话的新继续概率;当新继续概率低于预设的概率阈值时,断开客服会话或指示服务提供方断开客服会话。

具体地,如果在上述超时时间阈值内依然没有接收到用户的消息,则可以继续获取所述客服会话对应的会话信息;该会话信息中的会话内容,通常与上一次输入至概率预测模型的会话内容相同;而该会话信息中的会话统计参数,通常与上一次输入至概率预测模型的会话统计参数不同;例如,服务提供方发送的当前消息距离当前时间的时长,由于当前时间变化,当前消息距离当前时间的时长会变长,因而概率预测模型输出的继续概率也会变化。可以理解,当前消息距离当前时间的时长越长,继续概率越低。因此,即使概率预测模型第一次预测输出的继续概率较低,如果用户始终不发送消息,在后续的预测过程中,新继续概率会越来越低,直至新继续概率低于预设的概率阈值,则断开客服会话或指示服务提供方断开客服会话。

需要说明的是,如果采用上述多次预测的方式,则需要上述概率预测模型在训练过程中,训练样本中需要包含服务提供方最后发送的消息距离会话断开的时长,在第一次预测过程中,输入至概率预测模型中的会话统计参数中包含服务提供方发送的当前消息距离当前时间的时长。

上述方式中,如果概率预测模型输出的继续概率大于或等于预设的概率阈值,则再次获取客服会话对应的会话信息,并输入至概率预测模型中进行预测,输出新概率阈值;该方式同样可以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

对应于上述在线客服会话的控制方法的实施例,参见图7所示的一种在线客服会话的控制装置的结构示意图;该装置实现的功能对应上述方法执行的步骤。该装置可以理解为上述服务器,或服务器的处理器,也可以理解为独立于上述服务器或处理器之外的在服务器控制下实现本申请功能的组件,如图7所示,该装置包括:

会话监听模块70,用于监听当前在线的客服会话;其中,客服会话为用户与服务提供方间的会话;

信息获取模块72,用于如果服务提供方发送当前消息后的预设时长内未接收到用户的消息,获取客服会话对应的会话信息;其中,会话信息包括客服会话中的会话内容和/或会话统计参数;

概率预测模块74,用于将会话信息输入至预先训练完成的概率预测模型,得到客服会话的继续概率;

会话控制模块76,用于基于继续概率控制客服会话的在线状态。

本发明实施例提供的一种在线客服会话的控制装置,如果监听到当前在线的客服会话中,服务提供方发送当前消息后的预设时长内未接收到用户的消息,则获取该客服会话对应的会话信息;进而将该会话信息输入至概率预测模型得到客服会话的继续概率,基于该继续概率控制客服会话的在线状态。该方式中,概率预测模型可以根据客服会话的会话信息预测用户回应的概率,即客服会话的继续概率,基于该继续概率控制会话的在线状态;相对于相关技术中超时断开的方式,该方式可以避免用户问题未解决就断开会话,也可以避免用户问题解决后客服浪费时间等待用户回应,在保证用户体验度的同时提高了客服的工作效率。

上述在线客服会话的控制装置中的模块可以经由有线连接或无线连接彼此连接或通信。有线连接可以包括金属线缆、光缆、混合线缆等,或其任意组合。无线连接可以包括通过lan、wan、蓝牙、zigbee、或nfc等形式的连接,或其任意组合。两个或更多个模块可以组合为单个模块,并且任何一个模块可以分成两个或更多个单元。

在一些实施例中,上述信息获取模块,用于:当服务提供方发送当前消息时,启动计时器;计时器的计时时长为预设时长;监听计时器的计时时长内是否接收到用户的消息;如果否,获取客服会话对应的会话信息。

在一些实施例中,上述会话内容包括:以服务提供方的当前消息为基准,当前消息和当前消息之前连续的至少一部分消息;会话统计参数包括:客服会话中相邻两消息间的间隔时长、当前消息距离当前时间的时长、用户的消息数量、服务提供方的消息数量中的多种。

在一些实施例中,上述装置还包括模型训练模块,用于:从预设的会话数据库中提取会话数据;基于会话数据确定多个训练样本;每个训练样本包括会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数;基于训练样本训练预设的初始模型,得到概率预测模型;其中,初始模型包括:卷积网络、递归网络和损失函数。

在一些实施例中,上述模型训练模块,用于:根据提取出的会话数据中的会话标识,将会话数据划分为多个;每个会话数据对应一个会话标识;提取每个会话数据包含的会话标识,该会话标识对应的会话内容、会话关闭原因以及会话统计参数,得到每个会话数据对应的训练样本。

在一些实施例中,上述装置还包括:消息判断模块,用于对于每个训练样本,判断该训练样本中是否包含用户的消息和会话服务提供方的消息;样本剔除模块,用于如果该训练样本中不包含用户的消息和会话服务提供方的消息,剔除该训练样本。

在一些实施例中,上述模型训练模块,用于:从多个训练样本中确定当前训练样本,将当前训练样本的会话内容输入至预设的初始模型的卷积网络中,输出会话内容对应的特征矩阵;将特征矩阵和会话统计参数输入至初始模型的递归网络中,输出当前训练样本对应的特征值;将特征值输入至初始模型的损失函数中,输出当前训练样本的会话关闭原因的预测结果;根据当前训练样本的会话关闭原因,以及会话关闭原因的预测结果,更新初始模型的预测准确率;基于预设条件判断是否终止训练,其中,预设条件包括:预测准确率大于或等于预设的准确率阈值,和/或,输入至卷积网络的当前训练样本的数量等于预设的迭代次数阈值;如果否,从多个训练样本中确定下一个当前训练样本,继续训练卷积网络、递归网络和损失函数;如果是,将当前训练样本训练后的初始模型作为概率预测模型。

在一些实施例中,上述卷积网络包括3d卷积神经网络;上述模型训练模块,用于:通过3d卷积神经网络对当前训练样本的会话内容进行映射处理,得到会话内容对应的特征矩阵。

在一些实施例中,上述递归网络包括预设层数的门控循环单元网络;预设层数的门控循环单元网络依次连接;门控循环单元网络的层数与会话内容中的消息的数量相对应;上述模型训练模块,用于:将特征矩阵中第一层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至第一层门控循环单元网络中,得到第一层门控循环单元网络的输出结果;对于除第一层门控循环单元网络以外的每层门控循环单元网络,将该层门控循环单元网络的前一层门控循环单元网络的输出结果、该层门控循环单元网络对应的消息的特征矩阵和会话内容的会话统计参数输入至该层门控循环单元网络,直至最后一层门控循环单元网络;将最后一层门控循环单元网络的输出结果作为当前训练样本对应的特征值。

在一些实施例中,上述损失函数包括softmax函数;当前训练样本对应的特征值的数量为多个;上述模型训练模块,用于:通过softmax函数计算每个特征值的指数函数值;根据每个特征值的指数函数值,以及当前训练样本的每个特征值的指数函数值总和,确定每个特征值的概率;输出每个特征值中指定特征值的概率,将所述指定特征值的概率、以及所述指定特征值对应的会话关闭原因确定为所述当前训练样本的会话关闭原因的预测结果。

在一些实施例中,上述会话控制模块,用于:如果继续概率小于预设的概率阈值,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述会话控制模块,用于:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,断开客服会话或指示服务提供方断开客服会话。

在一些实施例中,上述会话控制模块,用于:如果继续概率等于或高于预设的概率阈值,监听在预设的超时时间阈值内是否接收到用户的消息;如果否,继续通过概率预测模型预测客服会话的新继续概率;当新继续概率低于预设的概率阈值时,断开客服会话或指示服务提供方断开客服会话。

本实施例还提供一种电子设备,包括:处理器、存储介质和总线,存储介质存储有处理器可执行的机器可读指令,当电子设备运行时,处理器与存储介质之间通过总线通信,处理器执行机器可读指令,以执行时执行如上述在线客服会话的控制方法的步骤。

本实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如上述在线客服会话的控制方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1