将用户咨询分配到客服业务组的方法及装置与流程

文档序号:18197575发布日期:2019-07-17 05:57阅读:209来源:国知局
将用户咨询分配到客服业务组的方法及装置与流程

本说明书一个或多个实施例涉及人工智能技术领域,尤其涉及利用人工智能将用户咨询分配给客服业务组的方法及装置。



背景技术:

计算机和网络技术的发展使得互联网已经渗透进人们生活的方方面面,服务商所提供的服务越来越趋于多样化和复杂化,例如支付宝app提供余额宝、花呗、借呗、口碑、保险、生活缴费、蚂蚁信用、蚂蚁庄园等等一系列的功能和服务。相应地,人们越来越多地利用互联网进行各种各样的操作,例如网络购物,电子支付,电子转账,在线理财,在线借贷等。在使用上述诸多服务过程中,不可避免的会遇到各种各样的问题,需要求助于客服。此时,由于服务内容的多样化,用户拨打客服热线提出的问题也趋于多样化。问题的多样性和复杂性给公司的客服带来了很大的压力。培训能回答所有问题的客服人员成本过高,因此常用的方法是将客服小二按照业务分成若干个技能组进行分别培训,每个技能组只回答一类问题。在用户进行客服咨询时,首先要求用户对当前遇到的困难进行简单描述,系统根据用户的描述猜测用户的问题,并得到用户的肯定/否定/补充等进一步的信息,最终,根据对话结果分配到合适的技能组,让人工客服和用户交流。这样的过程又称为“派单”。如果对用户问题的意图理解不够准确,从而将用户问题分配到不匹配的业务组,将无法有效地解决用户的问题,极大降低用户的体验和满足度。

因此,希望能有改进的方案,将用户咨询准确分配到对应的客服业务组,实现高效而准确的派单,从而提高客服服务的效率,以及提升用户体验。



技术实现要素:

本说明书一个或多个实施例描述了一种方法和装置,可以高效准确地将用户咨询分配到适合的客服业务组,从而提升用户进行客服咨询时的用户体验。

根据第一方面,提供了一种将用户咨询分配到客服业务组的方法,包括:

获取用户咨询对应的咨询文本;

利用深度神经网络处理所述咨询文本,获得第一输出结果,其中所述深度神经网络包括嵌入层和隐含层,所述嵌入层将所述咨询文本转换为嵌入向量,所述隐含层对所述嵌入向量进行处理,得到所述第一输出结果;

获取与用户的操作历史相关的历史特征,以及与所述用户的状态信息相关的状态特征;

利用全连接处理层处理所述第一输出结果,所述历史特征和所述状态特征,获得第二输出结果;

根据所述第二输出结果确定所述用户咨询对应的客服业务组,用以将该用户咨询分配给对应的客服业务组。

在一个实施例中,通过以下方式获取咨询文本:获取用户进行问题咨询的咨询语音;通过语音转文本工具,将所述咨询语音转换为所述咨询文本。

根据一种实施方式,通过以下方式获取咨询文本:获取用户与客服机器人进行的多轮会话;将所述多轮会话中,来自所述用户的会话整理为所述咨询文本。

在一个实施例中,上述深度神经网络的嵌入层将所述咨询文本转换为嵌入向量具体包括:

所述嵌入层对所述咨询文本进行分词处理,得到多个词语;

将所述多个词语转换为多个词向量;

基于所述多个词向量,确定所述咨询文本的嵌入向量。

在一个实施例中,上述用户的操作历史包括以下中的至少一项:

发起所述用户咨询所经由的界面接口,发起所述用户咨询之前浏览的内容,页面跳转轨迹,页面操作历史,所述用户的历史咨询所分配的客服业务组。

根据一种实施方式,上述用户的状态信息包括用户账户状态,所述用户账户状态包括以下中的至少一项:

借款状况,还款状况,交易状况,账户被锁定的状况。

进一步的,在一个实施例中,上述用户的状态信息还包括用户画像信息,所述用户画像信息包括以下中的至少一项:与注册信息相关的基本属性信息,人群分类信息,偏好信息。

根据一种实施方式,还获取第一预测模型针对所述用户咨询的预测结果,并利用所述全连接处理层处理所述第一输出结果,所述历史特征,所述状态特征,以及所述预测结果,从而获得所述第二输出结果。

进一步的,在一个实施例中,上述第一预测模型包括以下中的一个或多个:决策树模型,梯度提升决策树gbdt模型,xgboost模型;

所述预测结果包括以下中的一项或多项:

对所述历史特征和/或状态特征的分析结果;对所述用户咨询对应的意图的预测结果;对所述用户咨询对应的客服业务组的预测结果。

根据一种实施方式,所述深度神经网络和所述全连接处理层通过训练样本联合训练,所述训练样本包括样本特征和样本标签,所述样本特征基于历史咨询而生成,所述样本标签为,所述历史咨询所分配到的客服业务组。

根据第二方面,提供了一种将用户咨询分配到客服业务组的装置,包括:

第一获取单元,配置为获取用户咨询对应的咨询文本;

深度处理单元,配置为利用深度神经网络处理所述咨询文本,获得第一输出结果,其中所述深度神经网络包括嵌入层和隐含层,所述嵌入层将所述咨询文本转换为嵌入向量,所述隐含层对所述嵌入向量进行处理,得到所述第一输出结果;

第二获取单元,配置为获取与用户的操作历史相关的历史特征,以及与所述用户的状态信息相关的状态特征;

综合处理单元,配置为利用全连接处理层处理所述第一输出结果,所述历史特征和所述状态特征,获得第二输出结果;

确定单元,配置为根据所述第二输出结果确定所述用户咨询对应的客服业务组,用以将该用户咨询分配给对应的客服业务组。

根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。

根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。

通过本说明书实施例提供的方法及装置,采用了宽度和深度相结合的神经网络模型进行用户咨询的派单。结合用户咨询的具体场景,将用户咨询的咨询文本输入到上述神经网络模型的深度部分,将用户的历史特征信息和状态特征信息输入到神经网络模型的宽度部分,经过模型的综合处理,对用户咨询对应的客服业务组进行分类预测,从而确定出匹配的客服业务组,实现更准确的派单。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。

图1为本说明书披露的一个实施例的实施场景示意图;

图2示出根据一个实施例的宽度和深度结合的神经网络模型的结构示意图;

图3示出根据一个实施例的将用户咨询分配到客服业务组的方法的流程图;

图4示出在一个实施例中全连接处理层的处理示意图;

图5示出根据一个实施例的分配装置示意图。

具体实施方式

下面结合附图,对本说明书提供的方案进行描述。

如前所述,派单过程是根据用户咨询信息,将用户咨询分配到对应的客服业务组的过程,这个过程可以认为是一个分类过程,也就是,将不同技能的客服业务组认为是不同类别,根据用户的咨询信息,决定让哪个类别的客服业务组回答用户的问题。

为了更高效地进行业务组的分配,考虑采用机器学习的方式进行智能派单和分类。在机器学习领域,可以用于分类的模型和算法很多,包括传统的分类方法如线性回归模型,支撑向量机svm模型等。然而,这些模型泛化能力不强,往往需要预先进行大量的特征选取、加工工作,才能得到可用的分类结果。另一方面,近来发展的一些深度学习模型也可以用于分类,例如深度神经网络dnn,卷积神经网络cnn等。这些模型泛化能力较强,在很多领域都有了成功的应用。然而,在智能派单这个具体场景中,单纯的深度学习模型往往会因过度泛化而影响分类的精准,不能满足对用户意图的精确预测和分类。

为此,在本说明书提供的实施例中,采用宽度和深度结合的神经网络模型,来对用户咨询进行分类,从而将用户咨询分配到匹配的客服业务组。

图1为本说明书披露的一个实施例的实施场景示意图。如图1所示,用户可以通过热线电话、在线客服等多种渠道,发起用户咨询,向客服提出问题。该用户咨询通过图中的分发平台被分发到对应的客服业务组。在分配和转发到人工客服之前,首先会通过机器客服收集用户对咨询问题的描述信息。为了更好的进行派单,分发平台还会采集用户的与历史操作相关的历史特征,以及与状态相关的状态特征。并且,预先训练如前所述的宽度和深度结合的神经网络模型,作为派单所使用的预测模型。分发平台将用户的描述信息输入到上述神经网络模型的深度部分,将历史特征和状态特征输入到上述神经网络模型的宽度部分,通过该训练好的宽度与深度结合的神经网络模型,得到该用户咨询的分类结果,也就是对应客服业务组的预测结果。接着,分发平台就可以按照模型的预测结果,将用户咨询转发到对应的客服业务组,从而实现智能派单。

以上智能派单的实现主要通过宽度和深度结合的神经网络模型来实现。图2示出根据一个实施例的宽度和深度结合的神经网络模型的结构示意图。如图2所示,该神经网络模型主要包括深度部分、宽度部分和组合部分。深度部分可以是多层的深度神经网络,该深度神经网络获取用户的描述信息进行处理,得到深度中间结果。更具体的,深度神经网络包括嵌入层和若干隐含层,嵌入层用于将用户的描述信息转换为嵌入向量,隐含层对所述嵌入向量进行处理,得到深度中间结果。宽度部分获取用户的历史特征和状态特征作为输入。组合部分可以体现为一个或多个全连接处理层,其获取深度中间结果,以及宽度部分的历史特征和状态特征,进行进一步处理,从而输出预测结果,该预测结果即可用于确定对应的客服业务组。

下面结合图2的神经网络模型结构,描述图1的智能派单的实现过程。

图3示出根据一个实施例的将用户咨询分配到客服业务组的方法的流程图。该方法流程的执行主体可以是任何具有计算、处理能力的装置、设备和系统,例如图1中的分发平台。如图3所示,在该实施例中,将用户咨询分配到客服业务组的方法包括以下步骤:步骤31,获取用户咨询对应的咨询文本;步骤32,利用深度神经网络处理所述咨询文本,获得第一输出结果,其中所述深度神经网络包括嵌入层和隐含层,所述嵌入层将所述咨询文本转换为嵌入向量,所述隐含层对所述嵌入向量进行处理,得到所述第一输出结果;步骤33,获取与用户的操作历史相关的历史特征,以及与所述用户的状态信息相关的状态特征;步骤34,利用全连接处理层处理所述第一输出结果,所述历史特征和所述状态特征,获得第二输出结果;步骤35,根据所述第二输出结果确定所述用户咨询对应的客服业务组,用以将该用户咨询分配给对应的客服业务组。下面描述以上各个步骤的具体执行方式。

首先,在步骤31,获取用户咨询对应的咨询文本。

可以理解,用户可以通过多种渠道发起问题咨询。例如,在一个实施例中,用户通过拨打热线电话发起用户咨询。此时,用户通常通过语音的方式进行提问和问题描述。在这样的情况下,可以获取用户进行问题咨询的咨询语音,然后通过语音转文本工具,将咨询语音转换为咨询文本。已经存在多种语音转文本的现有工具,这些工具都可以用来进行上述咨询语音到文本的转换。

在另一实施例中,用户通过即时通讯工具im或其他在线方式发起用户咨询。在这样的情况下,用户往往通过输入文本来进行问题描述。在这样的情况下,可以直接获取用户输入的文本,作为上述咨询文本。

在一个实施例中,可以要求用户单方面进行问题描述。例如,当用户接入客服系统时,可以通过语音或文本提示用户:“请描述你的问题”,之后采集用户描述问题的语音或文本,从而得到上述咨询文本。

在另一实施例中,为了进一步明确用户问题,可以通过客服机器人与用户进行简单交互,形成多轮会话。该客服机器人可以经过预先训练,从而对用户问题进行猜测,给出一些确认问题或选项供用户选择,通过用户进一步的肯定/否定答复,或者用户选择的选项,更好地确定用户意图,用于后续分类。

例如,在一个具体例子中,用户与客服机器人可能进行如下会话:

用户:“我的钱怎么一直没有到账?已经过去3天了!”

小二:“您的问题是关于余额宝,蚂蚁花呗还是蚂蚁借呗?”

用户:“是余额宝”

小二:“请问您咨询的是余额宝转入还是转出?”

用户:“转出”

以上多轮会话可以是语音形式,也可以是通过在线工具进行的文本形式。

在这样的情况下,在步骤31,可以获取用户与客服机器人进行的多轮会话,将多轮会话中,来自用户的会话整理为上述咨询文本。

例如,对于上述例子中的会话,可以将来自用户的会话进行整理,得到如下咨询文本:

“我的钱怎么一直没有到账/已经过去3天了/余额宝/转出”。

以上,通过多种方式,获取到用户咨询对应的咨询文本。

接着,在步骤32,将上述咨询文本输入图2所示的宽度与深度结合的神经网络模型,利用该神经网络模型中的深度部分处理上述咨询文本,获得深度中间结果,为了描述的简单,又称为第一输出结果。

如图2所示,在本说明书实施例采用的宽度和深度结合的神经网络模型中,深度部分采用包括多个隐含层的深度神经网络。更具体的,该深度神经网络包括嵌入层和若干隐含层,上述咨询文本输入到深度神经网络后,通过嵌入层转换为嵌入向量,通过隐含层得到进一步处理,从而产生深度中间结果,即第一输出结果。

在一个实施例中,在深度神经网络的嵌入层,基于各个词语的词嵌入向量,得到整个咨询文本的嵌入向量。具体地,在一个实施例中,首先对咨询文本进行分词处理,得到多个词语。一般的,在进行分词处理时,还可以对咨询文本进行其他预处理,例如,去停用词。

例如,对于以上例子中的咨询文本:“我的钱怎么一直没有到账/已经过去3天了/余额宝/转出”,通过分词处理,可以得到多个词语,包括:我的、钱、怎么、一直、没有、到账、已经、余额宝,等等。

接着,可以将得到的各个词语转换为对应的词向量。在此,可以采用词嵌入模型进行词向量的转换。

可以理解,词嵌入模型是自然语言处理nlp中用到的一种模型,用于将单个词转换为一个向量。在最简单的模型中,为每个词语构造一组特征作为其对应词向量,例如采用one-hot编码方式,或者采用基于词频的编码方式。更进一步地,为了体现词语之间的关系,例如类别关系,从属关系,可以采用各种方式训练语言模型,优化向量表达。例如,word2vec的工具中包含了多种词嵌入的方法,能够快速得到词语的向量表达,并且向量表达能够体现词语之间的类比关系。例如,词语“北京”与词语“中国”的对应词向量之间的关系,与词语“巴黎”与词语“法国”的对应词向量之间的关系相一致,如此,通过词向量体现对应的词语之间的类别和类比关系。还存在一些其他的词嵌入算法,例如glove模型算法等,均可以用于将各个词语嵌入到向量空间,得到各个词语对应的词向量。

接着可以基于咨询文本中各个词语对应的词向量,确定咨询文本的嵌入向量。

在一个实施例中,可以将各个词语的词向量进行拼接,基于拼接结果确定咨询文本的嵌入向量。由于最终需要将各种不同的咨询文本转换为相同维度的嵌入向量,而不同咨询文本中包含的词语数量、词语类型均不相同,因此,可以在将各个词向量拼接之后,对于拼接结果进行裁剪或补足的操作,使得最终得到固定维度的嵌入向量。

在一个实施例中,还可以对各个词语的词向量进行一定的运算操作,基于运算操作结果确定咨询文本的嵌入向量,上述运算操作可以包括,例如求平均,加权求和等等。此外,也可以在运算操作的基础上再进行拼接,或者采用更复杂的方式对词向量进行组合操作,从而得到咨询文本的嵌入向量。

在另一实施例中,还可以将咨询文本划分为句子,基于句子中包含的词语的词向量,确定出句子对应的句子向量,然后对句子向量进行拼接或组合操作,得到整个咨询文本的嵌入向量。

在又一实施例中,在将咨询文本划分为句子之后,还可以通过一些模型,例如skip-thoughtsvector模型,直接将句子进行向量转换,得到各个句子的句子向量,进而基于句子向量确定整个咨询文本的嵌入向量。

以上,在深度神经网络的嵌入层,通过自然语言处理中各种模型和方法,将输入的用户的咨询文本转换为嵌入向量。

于是,深度神经网络后续的隐含层可以对该嵌入向量进行进一步处理。通常的,隐含层的神经元对应一些线性或非线性函数操作,典型的非线性函数操作包括,sigmoid函数,tanh函数等等。经过隐含层的处理,得到深度中间结果,即第一输出结果。

另一方面,在步骤33,获取与用户的操作历史相关的历史特征,以及与所述用户的状态信息相关的状态特征,作为图2所示的神经网络模型中的宽度部分的输入特征。

上述历史特征用于表征,用户发起所述用户咨询之前所进行的操作方面的历史轨迹。例如,该历史特征可以包括,发起该用户咨询所经由的界面接口,例如,用户可以通过余额宝主页面上的客服图标作为接口发起咨询,也可以通过通用的“我的客服”页面中的“挂失账户”作为接口发起咨询,等等,此时可以获取这些页面接口信息,作为历史特征。

在一个例子中,历史特征可以包括,发起用户咨询之前用户浏览的内容,例如浏览了哪些消息,收到了哪些提示,使用了哪些服务,等等。

在一个例子中,历史特征可以包括页面跳转轨迹,例如从支付宝主页面a1跳转到余额宝页面a2,又跳转到余额自动转入页面a3,从该页面发起了用户咨询,那么页面跳转轨迹可以是a1-a2-a3。

在一个例子中,历史特征可以包括,在发起用户咨询之前,用户在页面上的操作历史,例如放大、缩小、拖拽、输入内容等等。

在一个例子中,历史特征可以包括,用户的历史咨询所分配的客服业务组,例如用户的上一次咨询被分配到了哪个客服业务组。

以上历史轨迹和历史操作信息的获取,可以通过页面埋点等多种方式实现。并且,根据实际需要,历史特征可以选择性的包含上述诸多历史轨迹和历史操作信息中的一部分或全部。

除了上述历史特征,在步骤33,还获取与用户的状态信息相关的状态特征。

在一个实施例中,上述用户的状态信息包括用户账户状态,所述用户账户状态包括以下中的至少一项:借款状况(例如是否有借款,借款数额等),还款状况(例如是否已还款,已还款项数额,未还款项数额,等等),交易状况(近期交易笔数,交易金额,等等),账户被锁定的状况。相应地,可以基于上述账户状态信息,获取用户的状态特征。

在一个实施例中,用户的状态信息还包括用户画像信息。用户画像信息用于全面反映用户的特点和状态。具体的,在一个实施例中,用户画像信息可以包括,与注册信息相关的基本属性信息,例如,年龄,性别,职业,收入区间等等。在一个例子中,用户画像信息还可以包括,基于用户的基本属性信息以及可利用的大数据中的相关信息,对用户进行人群划分得到的人群分类信息。例如,已经存在一些人群划分方法,对大量用户进行分类或聚类,从而为各个用户赋予一定的人群标签作为其人群分类信息。在一个例子中,用户画像信息还可以包括,用户的偏好信息,例如app使用偏好,咨询工具使用偏好,等等。

相应地,还可以基于上述用户画像信息,获取用户的状态特征。

以上在步骤33分别获取了用户的历史特征和状态特征,这两部分特征可以共同输入到图2所示的神经网络模型中的宽度部分中。更具体的,在一个实施例中,宽度部分仅包含一个输入层。在一个例子中,该输入层用于读取上述的历史特征和状态特征作为输入。在另一例子中,该输入层还对历史特征和状态特征进行简单的处理,例如归一化,得到归一化的历史特征和状态特征。

需要理解,上述步骤31和32是对神经网络模型中深度部分的特征获取和处理过程,步骤33是对宽度部分的特征获取和处理,而深度部分和宽度部分是该神经网络模型中两个并列分支,因此,步骤33可以与步骤31-32并行执行,或者按照任意顺序执行。

如图2所示,在宽度和深度结合的神经网络模型中,在宽度部分和深度部分之上,还包括全连接处理层,用于将深度部分和宽度部分的结果进行融合处理。

相应的,在图3的步骤34,利用全连接处理层处理第一输出结果(即深度中间结果),上述历史特征和状态特征,从而获得第二输出结果,也就是模型预测结果。

可以理解,在全连接处理层中,每一个节点都与上一层的所有节点相连,用于把前边提取到的所有特征综合起来。因此,在步骤34,利用全连接处理层,对深度中间结果,和来自于宽度部分的用户历史特征和状态特征进行全面关联分析,从而提供全连接输出,即第二输出结果。

基于这样的第二输出结果,在步骤35,可以确定所述用户咨询对应的客服业务组,用以将该用户咨询分配给对应的客服业务组。

在一个实施例中,全连接处理层输出的第二输出结果为预测的客服业务组类别。相应的,在步骤35,可以直接根据该类别,确定出对应的客服业务组,从而将用户咨询分配到该客服业务组。

在一个实施例中,第二输出结果包括,预测的多个备选业务组以及对应的预测置信度。相应的,在步骤35,还可以参考预测置信度,确定对应的客服业务组。例如,在一个例子中,可以从多个备选客服业务组中,选择置信度最高的一个作为匹配的客服业务组,从而将用户咨询分配到该匹配的客服业务组。在另一例子中,进一步判断最高的置信度是否满足预定阈值,如果满足,才进行上述匹配客服业务组的确定和分配;如果不满足,则可以通过客服机器人,进一步要求用户补充信息,从而再次进行派单预测。

如此,通过以上过程,利用宽度和深度结合的神经网络模型,实现对用户咨询的智能派单,将用户咨询分配到合适的客服业务组,从而提升用户体验。

需要理解,图2所示的宽度和深度结合的神经网络模型需要经过监督训练,才可以在以上过程中进行预测。对上述神经网络模型的训练也可以认为是对其中的深度神经网络和全连接处理层一同进行联合训练。为了训练上述宽度和深度结合的神经网络模型,可以获取一些训练样本,其中训练样本包括样本特征和样本标签,所述样本特征基于历史咨询而生成,样本标签为,历史咨询所分配到的客服业务组。

更具体的,训练样本的样本特征与预测时分别输入到深度部分和宽度部分的特征相对应,即包括,历史咨询的咨询文本,历史咨询用户的用户历史特征和状态特征。在训练过程中,将这些样本特征分别输入深度部分和宽度部分,经由全连接处理层输出预测结果。通过将预测结果与样本标签进行比对确定预测误差,然后将预测误差进行反向传播,从而调整神经网络模型的参数,以训练该神经网络模型。在训练好该神经网络模型之后,即可以通过上述步骤31-35,对当前的用户咨询进行预测分类,从而进行智能派单。

在一个实施例中,为了更全面地分析用户意图,更准确地进行派单,还在上述宽度和深度结合的神经网络模型中,引入其他模型的初步预测结果,从而进一步提高派单准确率。

具体的,在一个实施例中,在以上的步骤34之前,还获取另一预测模型针对上述用户咨询的初步预测结果,为了描述简单,将该另一预测模型称为第一预测模型。相应的,在步骤34,将上述第一预测模型的初步预测结果也输入到图2所示的神经网络模型的宽度部分,使得全连接处理层对深度部分的第一输出结果,宽度部分的用户历史特征和状态特征,以及上述来自第一预测模型的初步预测结果,进行全连接处理,从而获得所述第二输出结果。

更具体而言,上述第一预测模型可以是,决策树模型,梯度提升决策树gbdt模型,xgboost模型等。在一个实施例中,上述第一预测模型也可以包括多个预测模型。

第一预测模型的初步预测结果可以包括,对用户历史特征和/或状态特征的分析结果;对用户咨询对应的意图的预测结果,等等。在一个例子中,第一预测模型的初步预测结果也可以包括,对所述用户咨询对应的客服业务组的初步预测结果。这些初步预测结果可以与用户历史特征和状态特征一起,输入到图2所示的神经网络模型的宽度部分,从而由全连接处理层进行进一步处理。这使得全连接处理层综合了更多更全面的信息进行处理,进一步提高准确度。

在一个实施例中,上述全连接处理层可以仅包含单个处理层,该处理层同时作为整个神经网络模型的输出层。

在另一实施例中,上述全连接处理层可以包含多个处理层。在一个实施例中,上述深度中间结果,用户历史特征和状态特征,以及可选的其他预测模型的初步预测结果,可以共同输入到上述多个处理层的同一接收层中,经后续处理层的处理,得到第二输出结果。或者,在另一实施例中,上述深度中间结果,用户历史特征和状态特征,以及可选的其他预测模型的初步预测结果,可以输入到上述多个处理层的不同层中进行处理,得到最终的第二输出结果。

图4示出在一个实施例中全连接处理层的处理示意图。在图4的示意图中,全连接处理层包括多个处理层,其中,深度神经网络输出的深度中间结果与用户的历史特征和状态特征一起,输入到全连接处理层中的第一层,而其他预测模型的初步预测结果可以直接输入到全连接处理层中的第二层。这样,使得用户的历史特征和状态特征与深度中间结果先进行融合。而其他预测模型的初步预测结果可能已经具有非常独立而明确的特征意义,并且已经较为接近最终的输出结果了,所以可以将其输入到更外层,更方便神经网络模型的训练和调试。最终,经由输出层的整合,输出最终预测结果。

以上,结合用户咨询的场景特点,采用宽度和深度结合的神经网络模型,将不同的特征内容输入到神经网络模型的不同分支,从而更好地对用户咨询进行派单,将其分配到适当的客服业务组。

根据另一方面的实施例,还提供一种将用户咨询分配到客服业务组的装置。图5示出根据一个实施例的分配装置,该装置可以部署在任何具有计算、处理能力的设备、平台或设备集群中。如图5所示,该分配装置500包括:

第一获取单元51,配置为获取用户咨询对应的咨询文本;

深度处理单元52,配置为利用深度神经网络处理所述咨询文本,获得第一输出结果,其中所述深度神经网络包括嵌入层和隐含层,所述嵌入层将所述咨询文本转换为嵌入向量,所述隐含层对所述嵌入向量进行处理,得到所述第一输出结果;

第二获取单元53,配置为获取与用户的操作历史相关的历史特征,以及与所述用户的状态信息相关的状态特征;

综合处理单元54,配置为利用全连接处理层处理所述第一输出结果,所述历史特征和所述状态特征,获得第二输出结果;

确定单元55,配置为根据所述第二输出结果确定所述用户咨询对应的客服业务组,用以将该用户咨询分配给对应的客服业务组。

在一个实施例中,所述第一获取单元51具体配置为:

获取用户进行问题咨询的咨询语音;

通过语音转文本工具,将所述咨询语音转换为所述咨询文本。

根据一种实施方式,所述第一获取单元51具体配置为:

获取用户与客服机器人进行的多轮会话;

将所述多轮会话中,来自所述用户的会话整理为所述咨询文本。

在一个实施例中,在上述深度神经网络中,所述嵌入层将所述咨询文本转换为嵌入向量包括:

所述嵌入层对所述咨询文本进行分词处理,得到多个词语;

将所述多个词语转换为多个词向量;

基于所述多个词向量,确定所述咨询文本的嵌入向量。

根据一种实施方式,所述用户的操作历史包括以下中的至少一项:

发起所述用户咨询所经由的界面接口,发起所述用户咨询之前浏览的内容,页面跳转轨迹,页面操作历史,所述用户的历史咨询所分配的客服业务组。

根据一种实施方式,所述用户的状态信息包括用户账户状态,所述用户账户状态包括以下中的至少一项:

借款状况,还款状况,交易状况,账户被锁定的状况。

进一步的,在一个实施例中,所述用户的状态信息还包括用户画像信息,所述用户画像信息包括以下中的至少一项:与注册信息相关的基本属性信息,人群分类信息,偏好信息。

根据一种实施方式,装置500还包括第三获取单元(未示出),配置为获取第一预测模型针对所述用户咨询的预测结果;相应的,所述综合处理单元54配置为,利用所述全连接处理层处理所述第一输出结果,所述历史特征,所述状态特征,以及所述预测结果,从而获得所述第二输出结果。

进一步的,在一个实施例中,上述第一预测模型包括以下中的一个或多个:决策树模型,梯度提升决策树gbdt模型,xgboost模型;所述预测结果包括以下中的一项或多项:对所述历史特征和/或状态特征的分析结果;对所述用户咨询对应的意图的预测结果;对所述用户咨询对应的客服业务组的预测结果。

根据一种实施方式,上述深度神经网络和所述全连接处理层通过训练样本联合训练,所述训练样本包括样本特征和样本标签,所述样本特征基于历史咨询而生成,所述样本标签为,所述历史咨询所分配到的客服业务组。

通过以上的装置500,可以将用户咨询分配到适合的客服业务组。

根据另一方面的实施例,还提供一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行结合图3所描述的方法。

根据再一方面的实施例,还提供一种计算设备,包括存储器和处理器,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现结合图3所述的方法。

本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明的保护范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1