客服信息推送方法、装置、计算机设备及存储介质与流程

文档序号:17722483发布日期:2019-05-22 02:16阅读:186来源:国知局
客服信息推送方法、装置、计算机设备及存储介质与流程

本申请实施例涉及机器学习技术领域,特别涉及一种客服信息推送方法、装置、计算机设备及存储介质。



背景技术:

随着网络服务的不断发展,为了及时解决用户在使用网络服务过程中遇到的问题,很多网络服务提供商向用户提供在线客服系统。

在相关技术中,用户需要联系客服时,可以通过终端打开在线客服的客服页面,并根据自己想要咨询的问题,在客服页面中输入问题描述内容;客服页面的服务器根据用户输入的问题描述内容,分析确定用户想要咨询的问题对应的客服信息(比如解决某一个具体问题的链接),并将分析出的客服信息推送给终端进行展示。

然而,相关技术中推送客服信息的方案中,用户输入的问题描述内容通常较为简略,服务器分析出的客服信息通常并不能解决用户想要咨询的问题,导致推送客服信息的准确性较低。



技术实现要素:

本申请实施例提供了一种客服信息推送方法、装置、计算机设备及存储介质,可以提高向用户推送客服信息的准确性,该技术方案如下:

一方面,提供了一种客服信息推送方法,所述方法包括:

接收终端发送的信息读取请求,所述信息读取请求是所述终端接收到展示客服页面的操作时发送的请求;

根据所述信息读取请求获取目标用户账号的预测特征,所述目标用户账号的预测特征是对所述目标用户账号的客服关联信息进行特征提取获得的特征;所述目标用户账号是在所述终端中登录的用户账号;

调用预测模型对所述目标用户账号的预测特征进行处理,获得所述预测模型输出的客服信息预测结果;所述预测模型是根据预测样本集训练获得的模型,所述预测样本集中包含预测特征样本以及所述预测特征样本对应的客服信息;

根据所述客服信息预测结果,向所述终端推送至少一条客服信息。

另一方面,提供了一种客服信息推送装置,所述装置包括:

请求接收模块,用于接收终端发送的信息读取请求,所述信息读取请求是所述终端接收到展示客服页面的操作时发送的请求;

第一特征获取模块,用于根据所述信息读取请求获取目标用户账号的预测特征,所述目标用户账号的预测特征是对所述目标用户账号的客服关联信息进行特征提取获得的特征;所述目标用户账号是在所述终端中登录的用户账号;

预测模块,用于调用预测模型对所述目标用户账号的预测特征进行处理,获得所述预测模型输出的客服信息预测结果;所述预测模型是根据预测样本集训练获得的模型,所述预测样本集中包含预测特征样本以及所述预测特征样本对应的客服信息;

信息推送模块,用于根据所述客服信息预测结果,向所述终端推送至少一条客服信息。

可选的,所述客服关联信息包括以下信息中的至少一种:

对应的用户账号的历史访问轨迹、对应的用户账号的历史客服记录、对应的用户账号的账号处理信息以及对应的用户账号的用户属性信息。

可选的,所述装置还包括:

分类提取模块,用于在预测模块根据所述信息读取请求获取目标用户账号的预测特征之前,对所述目标用户账号的客服关联信息进行分类提取,获得文本信息和数据信息;

第二特征获取模块,用于对所述文本信息进行特征提取,获得所述目标用户账号的客服关联信息对应的文本特征;

第三特征获取模块,用于对所述数据信息进行特征提取,获得所述目标用户账号的客服关联信息对应的数据特征;

预测特征获取模块,用于将所述文本特征和所述数据特征获取为所述目标用户账号的预测特征。

可选的,所述第二特征获取模块,用于将所述文本信息的词向量提取为所述目标用户账号的客服关联信息对应的文本特征。

可选的,所述第三特征获取模块,用于按照所述数据信息中包含的各项特征的特征类型,以及所述各项特征的特征值,对所述各项特征进行过滤,获得过滤后的至少一项特征;对过滤后的所述至少一项特征进行统计分析,获得所述目标用户账号的客服关联信息对应的数据特征;所述统计分析包括离散化、归一化以及特征组合中的至少一种。

可选的,所述装置还包括:

第一客服工单获取模块,用于在第一特征获取模块根据所述信息读取请求获取目标用户账号的预测特征之前,获取第一客服工单,所述第一客服工单是所述目标用户账号对应的客服工单,且所述第一客服工单是已完成的客服工单;

客服关联信息获取模块,用于在对所述第一客服工单进行归档时,获取所述目标用户账号的客服关联信息。

可选的,所述装置还包括:

文本内容获取模块,用于获取所述第一客服工单的文本内容,所述第一客服工单的文本内容包含问题描述内容以及对所述问题描述内容的回复内容;

第四特征获取模块,用于对所述第一客服工单的文本内容进行特征提取,获得所述第一客服工单的文本特征;

第一分类模块,用于调用第一分类模型对所述第一客服工单的文本特征进行处理,获得所述第一分类模型输出的至少一种工单分类;所述第一分类模型是通过第一样本集训练获得的模型,所述第一样本集包含第一工单样本的文本特征,以及所述第一工单样本的工单分类;

第一归档模块,用于根据所述第一分类模型输出的至少一种工单分类对所述第一客服工单进行归档。

可选的,所述第四特征获取模块,用于对所述第一客服工单的文本内容进行过滤,剔除所述第一客服工单的文本内容中的指定内容;对过滤后的所述第一客服工单的文本内容进行分词处理;根据分词处理结果,去除所述第一客服工单的文本内容中的无效词;对去除无效词之后的所述第一客服工单的文本内容进行分句处理,获得至少一个预定长度的语句;按照预设的转换关系,将所述至少一个预定长度的语句转化为所述第一客服工单的词序列;将所述第一客服工单的词序列获取为所述第一客服工单的文本特征。

可选的,所述第四特征获取模块,用于对所述第一客服工单的文本内容进行过滤,剔除所述第一客服工单的文本内容中的指定内容;对过滤后的所述第一客服工单的文本内容进行向量提取,获得过滤后的所述第一客服工单的文本内容的特征向量表;将过滤后的所述第一客服工单的文本内容的特征向量表获取为所述第一客服工单的文本特征。

可选的,所述第一归档模块,用于展示所述第一分类模型输出的至少一种工单分类;接收到根据展示的所述第一分类模型输出的至少一种工单分类执行的分类选择操作时,将所述第一客服工单归档至所述分类选择操作对应的工单分类。

可选的,所述装置还包括:

第五特征获取模块,用于获取第二客服工单的文本特征,所述第二客服工单是历史存储的客服工单;

第二分类模块,用于调用第二分类模型对所述第二客服工单的文本特征进行处理,获得所述第二分类模型输出的至少一种工单分类;所述第二分类模型是通过第二样本集训练获得的模型,所述第二样本集包含第二工单样本的文本特征,以及所述第二工单样本的工单分类;所述第二工单样本的工单分类是所述第一工单样本的工单分类之外的新的工单分类;

第二归档模块,用于根据所述第二分类模型输出的至少一种工单分类对所述第二客服工单进行归档;

第一添加模块,用于当所述第二客服工单归档的工单分类是所述新的工单分类时,将所述第二工单样本的文本特征,以及所述第二工单样本的工单分类添加入新的训练样本;

第二添加模块,用于当所述新的训练样本的数量达到预设的数量阈值时,将所述新的训练样本添加入所述第一样本集;

重训练模块,用于根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练。

可选的,所述装置还包括:

词性标注模块,用于在重训练模块根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练之前,对已归档的各个客服工单进行分词以及词性标注;

分布比例获取模块,用于根据所述已归档的各个客服工单的词性标注结果,获取各个工单分类中的词性分布比例;

交叉熵获取模块,用于根据所述各个工单分类中的词性分布比例,获取所述各个工单分类中的词性的交叉熵;

所述重训练模块,用于当所述交叉熵大于预设的交叉熵阈值时,根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练。

另一方面,提供了一种计算机设备,所述计算机设备包含处理器和存储器,所述存储器中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由所述处理器加载并执行以实现如上所述的客服信息推送方法。

另一方面,提供了一种计算机可读存储介质,所述存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现如上所述的客服信息推送方法。

本申请提供的技术方案可以包括以下有益效果:

本申请实施例提供的方案,通过由各个用户的客服关联信息训练获得的预测模型,来预测用户可能咨询的问题相关的客服信息,并将预测获得的客服信息推送给终端,由于用户的客服关联信息与用户本次想要咨询的问题之间通常存在一定的联系,比如,用户前几次的历史客服记录指示用户咨询了同一个或者同一类问题,则本次继续咨询同类问题的可能性很高,因此,通过本申请的推送方案,服务器能够较为准确的预测出用户可能咨询的问题对应的客服信息,从而提高客服信息推送的准确性。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。

图1是根据一示例性实施例示出的一种客服系统的结构示意图;

图2是相关技术涉及的一种客服界面示意图;

图3是根据一示例性实施例示出的一种模型训练及客服信息预测框架图;

图4是根据一示例性实施例示出的一种客服信息推送方法的流程图;

图5是图4所示实施例涉及的客服信息推送流程示意图;

图6是图4所示实施例涉及的客服界面示意图;

图7是是根据一示例性实施例示出的一种客服信息推送方法的流程图;

图8是图7所示实施例涉及的一种预测模型训练过程示意图;

图9是根据一示例性实施例示出的一种客服工单归档方法的流程图;

图10是图9所示实施例涉及的一种rcnn模型训练流程示意图;

图11是图9所示实施例涉及的一种工单归档流程示意图;

图12是图9所示实施例涉及的一种训练集添加流程示意图;

图13是图9所示实施例涉及的一种重训练流程示意图;

图14是根据一示例性实施例示出的客服信息推送装置的结构方框图;

图15是根据一示例性实施例示出的一种计算机设备的结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。

本申请实施例提出了一种高效并且高准确率的客服信息推送方案,该方案能够在用户输入问题描述内容之前,即可以较为准确的预测出用户可能想要咨询的问题并进行推送。为了便于理解,下面对本申请涉及的几个名词进行解释。

1)客服关联信息

在本申请实施例中,每个用户账号可以对应一个客服关联信息,该客服关联信息是与各个客服信息被对应的用户账号请求获取的概率相关联的信息。

换句话说,一个用户账号的客服关联信息,是与该用户账号对应的用户实际想要获取的客服信息之间存在一定的关联性的信息。

2)客服工单

在本申请实施例中,客服工单是用户通过客服系统(包括客服界面或者客服电话等)联系客服人员,提交相关信息(比如用户信息以及问题描述内容等)后,客服人员或者人工智能(artificialintelligence)客服对该问题描述内容进行回复,在上述过程完成之后,客服系统将用户提交的信息以及客服人员或者ai客服的回复内容合并,获得的信息即为客服工单。

3)客服信息

在本申请实施例中,用户通过客服系统提供的客服界面联系客服人员或者ai客服时,客服系统可以在客服界面中推送预先生成的,用户可能感兴趣的信息,每条信息通常可以用来引导用户解决一个或多个问题,这样的信息即为客服信息。通常情况下,客服信息是一个或多个链接,用户点击客服信息即可以跳转至引导解决相关问题的页面。

图1是根据一示例性实施例示出的一种客服系统的结构示意图。该系统包括:服务器120以及若干个终端140。

服务器120是一台服务器,或者由若干台服务器,或者是一个虚拟化平台,或者是一个云计算服务中心。

终端140可以是具有界面交互功能的终端设备,比如,终端140可以是手机、平板电脑、电子书阅读器、智能眼镜、智能手表、mp3播放器(movingpictureexpertsgroupaudiolayeriii,动态影像专家压缩标准音频层面3)、mp4(movingpictureexpertsgroupaudiolayeriv,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。

终端140与服务器120之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。

在本申请实施例中,终端140可以展示服务器120对应的客服界面,用户可以在该客服界面中与客服人员或者ai客服进行交互,以进行问题的咨询和解决。

可选的,该系统还可以包括管理设备(图1未示出),该管理设备与服务器120之间通过通信网络相连。可选的,通信网络是有线网络或无线网络。

可选的,上述的无线网络或有线网络使用标准通信技术和/或协议。网络通常为因特网、但也可以是任何网络,包括但不限于局域网(localareanetwork,lan)、城域网(metropolitanareanetwork,man)、广域网(wideareanetwork,wan)、移动、有线或者无线网络、专用网络或者虚拟专用网络的任何组合)。在一些实施例中,使用包括超文本标记语言(hypertextmark-uplanguage,html)、可扩展标记语言(extensiblemarkuplanguage,xml)等的技术和/或格式来代表通过网络交换的数据。此外还可以使用诸如安全套接字层(securesocketlayer,ssl)、传输层安全(transportlayersecurity,tls)、虚拟专用网络(virtualprivatenetwork,vpn)、网际协议安全(internetprotocolsecurity,ipsec)等常规加密技术来加密所有或者一些链路。在另一些实施例中,还可以使用定制和/或专用数据通信技术取代或者补充上述数据通信技术。

在相关技术中,终端140展示服务器120对应的客服界面之后,用户在客服界面中输入想要咨询的问题描述内容。比如,请参考图2,其示出了相关技术涉及的一种客服界面示意图。如图2所述,终端展示客服界面200后,用户在客服界面200中输入问题描述内容210,服务器根据用户输入的问题描述内容210,分析确定用户可能感兴趣的客服信息,并向终端推送分析出的客服信息,相应的,终端在客服界面200中展示客服信息220。然而,相关技术中客服信息220的推送准确性,与用户输入的问题描述内容的准确程度有关,如果用户不能准确的描述自己想要咨询的问题,则服务器可能推送错误的客服信息,从而影响客服信息的推送准确性。

而本申请实施例提供的方案,可以结合用户的客服关联信息自动预测用户可能咨询的客服问题,并推送相应的客服信息,从而提供准确且快速的客服信息推送。

本申请实施例的方案包括模型训练阶段和预测阶段。图3是根据一示例性实施例示出的一种模型训练及客服信息预测框架图。如图3所示,在模型训练阶段,模型训练设备310通过包含客服关联信息在内的客服关联信息样本,获取预测特征样本,并根据预先为该预测特征样本标注好的客服信息训练出预测模型,在预测阶段,预测设备320根据训练好的预测模型以及目标用户账号对应的预测特征直接预测出该目标用户账号对应的用户可能想要获得的客服信息。其中,由于本申请实施例中的预测模型是根据各个用户的客服关联信息训练获得的模型,因此能够根据单个用户的客服关联信息准确的预测用户可能需要咨询的问题,相比于相关技术中通过用户输入的问题描述内容来确定客服信息的方案来说,本申请中的预测模型可以不受用户输入的内容的影响,因此能够提高客服问题推送的准确性。

其中,上述模型训练设备310和预测设备320可以是具有机器学习能力的计算机设备,比如,该计算机设备可以是个人电脑、服务器以及固定式医疗设备等固定式计算机设备,或者,该计算机设备也可以是平板电脑、电子书阅读器或者便携式医疗设备等移动式计算机设备。

可选的,上述模型训练设备310和预测设备320可以是同一个设备,或者,模型训练设备310和预测设备320也可以是不同的设备。并且,当模型训练设备310和预测设备320是不同的设备时,模型训练设备310和预测设备320可以是同一类型的设备,比如模型训练设备310和预测设备320可以都是服务器;或者,模型训练设备310和预测设备320也可以是不同类型的设备,比如模型训练设备310可以是个人电脑,而预测设备320可以是服务器等。本申请实施例对于模型训练设备310和预测设备320的具体类型不做限定。

图4是根据一示例性实施例示出的一种客服信息推送方法的流程图,该客服信息推送方法可以用于计算机设备,比如上述图1所示系统的服务器120中。如图4所示,该客服信息推送方法可以包括如下步骤:

步骤401,接收终端发送的信息读取请求,该信息读取请求是该终端接收到展示客服页面的操作时发送的请求。

在本申请实施例中,当用户想要联系客服人员或者ai客服时,可以在终端安装的应用程序界面中点击打开客服界面,此时,终端确认接收到展示客服页面的操作,并展示该客服界面,同时向服务器发送信息读取请求。

步骤402,根据该信息读取请求获取目标用户账号的预测特征。

其中,该目标用户账号的预测特征是对该目标用户账号的客服关联信息进行特征提取获得的特征;该目标用户账号是在该终端中登录的用户账号。

服务器接收到该终端发送的信息读取请求后,即可以获取该终端中登录的目标用户账号的预测特征。

其中,服务器可以预先根据该目标用户账号的客服关联信息获取该目标用户账号的预测特征,并对应该目标用户账号进行存储,在接收到该终端发送的信息读取请求后,根据目标用户账号查询该目标用户账号的预测特征。

其中,客服关联信息可以包括以下信息中的至少一种:

对应的用户账号的历史访问轨迹、对应的用户账号的历史客服记录、对应的用户账号的账号处理信息以及对应的用户账号的用户属性信息。

步骤403,调用预测模型对目标用户账号的预测特征进行处理,获得该预测模型输出的客服信息预测结果。

其中,该预测模型是根据预测样本集训练获得的模型,该预测样本集中包含预测特征样本以及该预测特征样本对应的客服信息。

在本申请实施例中,该预测模型由预测设备预先训练获得。其中,预测模型输出的预测结果可以对应一条或者多条客服信息。

可选的,当预测模型输出的预测结果对应多条客服信息时,该预测结果中还包含该多条客服信息各自对应的概率值,每条客服信息对应的概率值是预测模型计算出该客服信息是用户想要咨询的问题对应的客服信息概率。

步骤404,根据该客服信息预测结果,向该终端推送至少一条客服信息。

在本申请实施例中,服务器可以将预测模型输出的预测结果对应的至少一条客服信息推送给终端。

或者,当预测模型输出的预测结果对应多条客服信息时,服务器还可以获取该多条客服信息的数量n,当n大于m时(m是大于或者等于1的整数),服务器将该n条客服信息中,对应概率从大到小排在前m位的客服信息推送给终端;当n不大于m时,服务器将该n条客服信息推送给终端。

请参考图5和图6,其中,图5示出了本申请实施例涉及的客服信息推送流程示意图,图6示出了本申请实施例涉及的客服界面示意图。如图5和图6所示,通过本申请实施例所示的方案,用户点击进入客服官网首页61,并点击页面底部“立即前往”按钮62,终端跳转至客服界面63,同时,服务器后台获取当前登录的用户账号的客服关联信息,包括历史访问轨迹、历史客服记录、账号处理信息以及用户属性信息等等,服务器对上述客服关联信息进行特征抽取,并通过预测模型对抽取到的预测特征进行处理,预测用户可能咨询的问题所对应的客服信息64,并向用户推送客服信息64。在此过程中,不需要用户输入问题描述内容,即可以实现客服信息的推送。

综上所述,本申请实施例提供的方案,通过由各个用户的客服关联信息训练获得的预测模型,来预测用户可能咨询的问题相关的客服信息,并将预测获得的客服信息推送给终端,由于用户的客服关联信息与用户本次想要咨询的问题之间通常存在一定的联系,比如,用户前几次的历史客服记录指示用户咨询了同一个或者同一类问题,则本次继续咨询同类问题的可能性很高,因此,通过本申请的推送方案,服务器能够较为准确的预测出用户可能咨询的问题对应的客服信息,从而提高客服信息推送的准确性。

此外,本申请实施例提供的方案,不需要用户输入问题描述内容,即可以根据用户的客服关联信息预测出用户可能感兴趣的客服问题并进行推送,使得终端展示客服界面之后,短时间内即可以展示推送的客服信息,缩短了客服信息推送的时长,极大的提高了客服信息的推送效率。

图7是根据一示例性实施例示出的一种客服信息推送方法的流程图,该客服信息推送方法可以用于计算机设备,比如上述图1所示系统的服务器120中。如图7所示,该客服信息推送方法可以包括如下步骤:

步骤701,对目标用户账号的客服关联信息进行特征提取,获得目标用户账号的预测特征。

在本申请实施例中,服务器可以预先对各个用户账号的客服关联信息进行特征提取,获得并存储各个用户账号的预测特征。

其中,上述客服关联信息可以包含以下信息中的至少一种:

对应的用户账号的历史访问轨迹、对应的用户账号的历史客服记录、对应的用户账号的账号处理信息以及对应的用户账号的用户属性信息。

其中,对应的用户账号的历史访问轨迹可以是对应的用户账号历史访问过哪些页面(比如什么时间访问过什么页面,以及,访问时长等)、对应的用户账号历史使用过哪些网络服务产品(比如什么时间玩过什么游戏,以及游戏时长等)。

对应的用户账号的历史客服记录可以包括该用户账号对应的,且已完成的客服工单。

其中,上述历史客服记录可以包括但不限于ai客服记录(用户与ai客服进行交互产生的客服记录)、人工在线客服记录(用户与人工客服通过客服页面进行交互产生的客服记录)以及人工电话客服记录(用户拨打客服电话产生的客服记录)等等。

对应的用户账号的账号处理信息可以包括系统是否对该用户账号执行过一项或多项处理操作,比如,是否被封号、是否被限额、是否参与违规活动等等。

对应的用户账号的用户属性信息可以包括用户的年龄、性别、学历、所在地区以及兴趣偏好等等。

其中,上述,对目标用户账号的客服关联信息进行特征提取的步骤可以包括如下步骤:

s701a,对该目标用户账号的客服关联信息进行分类提取,获得文本信息和数据信息。

在本申请实施例,服务器可以根据目标用户账号的客服关联信息中各项信息的信息类型,对客服关联信息进行分类提取,获得文本信息和数据信息。

比如,对于客服关联信息中的历史客服记录,服务器可以提取各条历史客服记录中的文本内容(即用户的问题描述内容以及客服人员回复内容),将提取到的文本内容获取为文本信息。

此外,对于客服关联信息中除了历史客服记录的其它信息,服务器可以将各项其它信息获取为数据信息,比如,年龄、性别、是否被封号、访问过的页面等等。

s701b,对该文本信息进行特征提取,获得该目标用户账号的客服关联信息对应的文本特征。

在本申请实施例,对于文本信息,服务器可以通过自然语言处理技术进行特征提取。

在一种可能的实现方式中,服务器可以将该文本信息的词向量提取为该目标用户账号的客服关联信息对应的文本特征。

比如,服务器可以根据文本信息训练word2vec词向量,从而获得目标用户账号的客服关联信息对应的文本特征。

s701c,对该数据信息进行特征提取,获得该目标用户账号的客服关联信息对应的数据特征。

在本申请实施例中,对于数据信息,服务器可以按照该数据信息中包含的各项特征的特征类型,以及该各项特征的特征值,对该各项特征进行过滤,获得过滤后的至少一项特征;对过滤后的该至少一项特征进行统计分析,获得该目标用户账号的客服关联信息对应的数据特征;该统计分析包括离散化、归一化以及特征组合中的至少一种。

比如,服务器可以首先对数据信息进行数据清洗,即确定数据信息中的特征数据的数据类型,对数值类型的数据进行范围分析,对超出数值范围的异常点进行检测,决定是保留还是丢弃(比如,当某一数值超出数值范围的幅度大于预设幅值,则丢弃该数值;反之,当某一数值超出数值范围的幅度不大于预设幅值,则保留该数值);对部分特征数据缺失采取直接删除或者依据完整部分特征值进行填补,比如,当某项特征数据中的各个数值中,缺失数值的占比高于预设占比阈值,则将该项特征数据删除;反之,若该项特征数据中缺失数值的占比不高于预设占比阈值,则通过已有的数值对缺失的数值进行填充。

此外,服务器对数据信息中的部分特征数据离散化,如根据用户的年龄数值,将用户年龄分段为未成年人、成年人和老年人等。

另外,服务器对数据信息中的部分特征数据归一化,如注册时长,登录时长,这种数据波动范围比较大,服务器将此类数据归一化在一个比较小的范围内(比如0~1的范围内)。

另外,服务器还对数据信息中的部分特征数据进行特征组合,形成新的特征数据,为模型增加更多的非线性表述,如服务器可以将用户登录率、登录时长和活动频率组合起来定义成用户活跃度。

s701d,将该文本特征和该数据特征获取为该目标用户账号的预测特征。

步骤702,接收终端发送的信息读取请求,该信息读取请求是该终端接收到展示客服页面的操作时发送的请求。

步骤703,根据该信息读取请求获取目标用户账号的预测特征。

步骤704,调用预测模型对目标用户账号的预测特征进行处理,获得该预测模型输出的客服信息预测结果。

步骤705,根据该客服信息预测结果,向该终端推送至少一条客服信息。

其中,上述步骤702至步骤705的执行过程可以参考上述图3所示实施例中的步骤701至步骤704下的描述,此处不再赘述。

其中,上述客服信息预测结果可以直接指示用户可能感兴趣的客服信息,或者,上述客服信息预测结果也可以直接指示用户可能感兴趣的客服信息所属的产品服务(比如,该产品服务可以是游戏或者小程序等产品服务)。

可选的,上述客服信息预测结果可以指示单条客服信息。比如,客服信息预测结果可以是每一条客服信息被推送的概率,当其中被推送的概率超过预设阈值的客服信息只有一条时,可以确定该客服信息预测结果指示单条客服信息;或者,客服信息预测结果可以是每一个产品服务对应的概率,当其中概率最高的产品服务只对应一条客服信息时,可以确定该客服信息预测结果指示单条客服信息。服务器可以向终端推送该单条客服信息,或者,服务器可以向终端发送跳转指令,该跳转指令用于指示终端跳转至该单条客服信息对应的信息详情页面。

上述客服信息预测结果也可以指示多条客服信息时。比如,客服信息预测结果可以是每一条客服信息被推送的概率,当其中被推送的概率超过预设阈值的客服信息包含多条时,可以确定该客服信息预测结果指示多条客服信息;或者,客服信息预测结果可以是每一个产品服务对应的概率,当其中概率最高的产品服务对应多条客服信息时,可以确定该客服信息预测结果指示多条客服信息。服务器可以向终端推送该多条客服信息。

通过本申请所示的方案可以通过预测模型来预测当前用户可能询问的客服问题,直接推送相应的单条客服问题,或者,直接进入单条客服问题对应的页面,能更加准确预测用户的意图,完成用户的诉求,从而使智能客服系统更加智能。

此外,对无法精准预测用户咨询的问题的情况,本申请所示的方案可以选出与用户最相关的多条客服信息供用户选择,用户无需关注所有的客服信息,从而提高用户的使用体验。

可选的,服务器在根据该信息读取请求获取目标用户账号的预测特征之前,可以获取第一客服工单,该第一客服工单是该目标用户账号对应的,已完成的客服工单;在对该第一客服工单进行归档时,服务器获取该目标用户账号的客服关联信息。

也就是说,在本申请实施例中,服务器可以在对目标用户账号的一次客户服务过程完成后,在对该目标用户账号本次客服过程对应的客服工单进行归档时,获取并更新该目标用户账号的客服关联信息。

服务器获取并存储各个用户账号的客服关联信息之后,还可以结合客服关联信息,以及对应的用户账号后续确定获取的客服信息(比如,用户在后续接受客户服务过程中点击的客服信息;或者,在用户后续接受客户服务过程中,客服人员/ai客服设置的与本次客户服务匹配的客服信息)或者获取的客服信息对应的产品服务,用户账号后续确定获取的客服信息作为该用户账号的客服关联信息对应的客服信息/产品服务。之后,服务器根据各个用户账号的客服关联信息,以及各个用户账号的客服关联信息对应的客服信息/产品服务器进行训练,获得上述预测模型。

请参考图8,其示出了本申请实施例涉及的一种预测模型训练过程示意图。如图8所示,上述模型训练过程可以如下:

1)服务器建立两个特征库,特征库1用于存放记录的各个用户账号的客服关联信息,特征库2用于存放对各个用户账号的客服关联信息进行获得处理的预测特征。

2)服务器自动构建标注数据:客服人员在处理完用户的问题后进行客服工单归档时,实时拉取用户的客服关联信息(包括对应的用户账号的历史访问轨迹、对应的用户账号的历史客服记录、对应的用户账号的账号处理信息以及对应的用户账号的用户属性信息等),以及从归档项中提取的产品信息等,并存入特征库1。

3)服务器通过自然语言处理技术和数据统计分析方法对特征库1中的各个用户账号的客服关联信息进行特征提取(包括数据清洗、离散化以及特征组合等),存入特征库2中。

4)服务器将特征库2中的数据以预设比例(比如10:1的比例)分别作为训练集和测试集。

5)服务器使用预设模型,比如深度学习模型作为训练的模型,用训练集训练出预测模型;并用测试集对预测模型进行效果评估,以调整模型参数。

如图8所示,上述预设的深度学习模型可以是一个双向长短期记忆网络模型(bidirectionallongshort-termmemory,bi-lstm)模型。其中,bi-lstm模型是一种时间递归神经网络模型,适合于处理和预测时间序列中间隔和延迟相对较长的重要事件。在图8所示的方案中,预测模型以文本特征和数据特征作为输入。

6)服务器生成模型文件(即上述预测模型)。

一个用户会使用同一个公司的多个产品,当用户碰到问题,并使用客服进行咨询时,系统如何判断出用户咨询的问题属于哪个客服信息是一个巨大的挑战。通过本申请上述实施例所示的方案,系统的服务器根据用户的历史浏览记录、客服服务记录和用户的基础信息等,搭建了客服信息的预测模型,预测用户可能咨询的客服信息,直接推送进入预测出的客服信息对应的详情页面,或者推荐相关性较高的多个客服信息供用户选择。这在已有的专业问答基础上,实现了多客服信息服务模式下的个性化合理推荐,更好的理解用户的意图,使智能客服更加智能,提升了智能客服解决问题的能力和用户的满意度。

本技术方案综合考虑了传统智能客服大多只针对单一产品服务,不具备面向多产品服务的服务模式。在多产品服务的环境下,预测模型结合了用户历史行为和用户基础信息等,为尚未交互的用户实施个性化推荐。经比对测试,使用本申请上述实施例所示的预测模型进行客服信息推送,可以有效提升用户在客服系统中的交互率,大幅度降低回拨率。

综上所述,本申请实施例提供的方案,通过由各个用户的客服关联信息训练获得的预测模型,来预测用户可能咨询的问题相关的客服信息,并将预测获得的客服信息推送给终端,由于用户的客服关联信息与用户本次想要咨询的问题之间通常存在一定的联系,比如,用户前几次的历史客服记录指示用户咨询了同一个或者同一类问题,则本次继续咨询同类问题的可能性很高,因此,通过本申请的推送方案,服务器能够较为准确的预测出用户可能咨询的问题对应的客服信息,从而提高客服信息推送的准确性。

此外,本申请实施例提供的方案,不需要用户输入问题描述内容,即可以根据用户的客服关联信息预测出用户可能感兴趣的客服问题并进行推送,使得终端展示客服界面之后,短时间内即可以展示推送的客服信息,缩短了客服信息推送的时长,极大的提高了客服信息的推送效率。

在本申请所示的方案中,服务器还可以根据用户接收客户服务之后生成的客服工单进行工单归档。其中,服务器在对目标用户账号的一次客户服务过程完成后,在对该目标用户账号本次客服过程对应的客服工单进行归档时,可以通过如下图9所示的步骤进行归档。

图9是根据一示例性实施例示出的一种客服工单归档方法的流程图,该客服工单归档方法可以用于计算机设备,比如上述图1所示系统的服务器120中。如图9所示,该客服工单归档方法可以包括如下步骤:

步骤901,获取该第一客服工单的文本内容,该第一客服工单的文本内容包含问题描述内容以及对该问题描述内容的回复内容。

在本申请实施例中,每个用户通过客服系统进行一次客服访问之后,客服系统将记录本次客服访问中,由用户提出的问题描述内容,以及客服人员/ai客服对该问题描述内容的回复内容,并根据记录的内容生成本次客服访问对应的客服工单。

步骤902,对该第一客服工单的文本内容进行特征提取,获得该第一客服工单的文本特征。

可选的,在对该第一客服工单的文本内容进行特征提取时,服务器可以对该第一客服工单的文本内容进行过滤,剔除该第一客服工单的文本内容中的指定内容;对过滤后的该第一客服工单的文本内容进行分词处理;根据分词处理结果,去除该第一客服工单的文本内容中的无效词;对去除无效词之后的该第一客服工单的文本内容进行分句处理,获得至少一个预定长度的语句;按照预设的转换关系,将该至少一个预定长度的语句转化为该第一客服工单的词序列;将该第一客服工单的词序列获取为该第一客服工单的文本特征。

比如,上述提取文本特征的过程可以如下:

s1、用正则表达式等方法过滤语句中非汉字部分(标点符号、特殊符号、数字、英文等)。

s2、采用分词工具(比如jieba分词工具)对处理后的语句进行分词。

s3、对分词后的结果做去停用词(感叹词、代词等)处理。

s4、填充序列。对句子长度小于预设长度的句子进行填充(填充0),对句子长度大于预设长度的句子进行截断,确保句子长度固定。

s5、将分词后的语句根据词索引列表转成词序列。

其中,词索引列表其实就是个词序表,每个词对应的序号。转成词序列是指句子中的每个词根据词索引列表,转成对应的序号。

在另一种可能的实现方式中,在对该第一客服工单的文本内容进行特征提取时,服务器可以对该第一客服工单的文本内容进行过滤,剔除该第一客服工单的文本内容中的指定内容;对过滤后的该第一客服工单的文本内容进行向量提取,获得过滤后的该第一客服工单的文本内容的特征向量表;将过滤后的该第一客服工单的文本内容的特征向量表获取为该第一客服工单的文本特征。

比如,服务器对该第一客服工单的文本内容进行过滤后,可以通过n-gram模型提取第一客服工单的文本内容的特征向量表。

步骤903,调用第一分类模型对该第一客服工单的文本特征进行处理,获得该第一分类模型输出的至少一种工单分类。

其中,该第一分类模型是通过第一样本集训练获得的模型,该第一样本集包含第一工单样本的文本特征,以及该第一工单样本的工单分类。

其中,当上述第一客服工单的文本特征是第一客服工单的词向量时,服务器可以将第一客服工单的词向量基于word2vec算法构建出句向量,并输入采用区域卷积神经网络(regionswithconvolutionalneuralnetworks,rcnn)算法构建的第一分类模型。

其中,当第一分类模型是rcnn模型时,请参考图10,其示出了本申请实施例涉及的一种rcnn模型训练流程示意图。如图10所示,该第一分类模型的训练过程可以如下:

步骤1,将人工标注过的历史工单划分训练集、测试集;

步骤2,对训练集进行jieba分词,得到词序列,作为输入矩阵;

步骤3,将输入矩阵放入rcnn模型进行初始训练,获得分类模型;

步骤4,利用初始训练后的分类模型对测试集进行分类预测;

步骤5,应用f1指标对模型进行效果评估,调整模型各项参数,确定最优参数组合,得到最终的第一分类模型。

本申请方案通过rcnn模型作为第一分类模型,相比于递归神经网络(recurrentneuralnetwork,rnn)模型的训练速度提升80%,较隐狄利克雷(latentdirichletallocation,lda)模型的训练速度则有更大提升。

在另一种可能的实现方式中,当上述第一客服工单的文本特征是第一客服工单的文本内容的特征向量表时,该第一分类模型可以是xgboost模型。

步骤904,根据该第一分类模型输出的至少一种工单分类对该第一客服工单进行归档。

可选的,服务器可以展示该第一分类模型输出的至少一种工单分类;接收到根据展示的该第一分类模型输出的至少一种工单分类执行的分类选择操作时,将该第一客服工单归档至该分类选择操作对应的工单分类。

在本申请实施例中,服务器可以获取文本分类模型的分类结果,并推送给客服;客服校验结果,存储工单、模型结果、人工归档进工单判断结果表中。如果推送的文本分类模型结果正确,则客服选择相应的归档项或从推送结果列表中选一项归档;如果不正确,则客服标记错误。服务器将工单推送归档和最终归档存储进工单判断结果表中。

请参考图11,其示出了本申请实施例涉及的一种工单归档流程示意图。如图11所示,上述工单归档流程如下:

服务器获取客服工单,判断是否包含问题描述内容和回复内容,若是,则获取该客服工单的工单数据(即问题描述内容和回复内容)。一方面,服务器获取用户的问题描述内容,对问题描述内容进行预处理,获得问题描述内容的文本,然后将问题描述内容的文本转化为词序列;另一方面,服务器获取客服的回复内容,对回复内容进行预处理,获得回复内容的文本,然后将回复内容的文本转化为词序列。服务器将问题描述内容的词序列和回复内容的词序列进行拼接,形成新的词序列。服务器通过rcnn模型对新的词序列进行序列特征提取,并输出至少一种工单分类及其概率。服务器判断至少一种工单分类的概率中,是否存在超过预设概率阈值的概率。若是,则服务器将超过预设概率阈值的概率对应的工单分类输出为分类结果;若否,则服务器将按照概率从高到低的顺序排列在前m位的工单分类输出为分类结果,其中,m为大于或者等于1的整数。服务器将分类结果输出给客服人员,由客服人员进行结果校验,如果推送的分类结果正确,则客服选择相应的归档项或从推送结果列表中选一项归档;如果不正确,则客服标记错误。服务器将客服人员校验后的工单分类以及该客服工单存储入工单判断结果表。在一种可能的实现方式中,工单判断结果表如下表1所示。

表1

经测试,本申请上述工单归档的方案应用于支付相关的归档项时,准确率可以达到89.3%。相比于通过人工对全部工单进行归档的方案,本方案中人工只需负责9.7%的工单归档纠错,节省了近90%的工作量。

在本申请实施例中,服务器在训练上述第一分类模型之后,还可以对第一分类模型进行更新。该更新过程可以如下述步骤905至步骤910所示。

步骤905,获取第二客服工单的文本特征,该第二客服工单是历史存储的客服工单。

其中,该第二客服工单可以是通过上述第一分类模型进行分类后存储的客服工单。

步骤906,调用第二分类模型对该第二客服工单的文本特征进行处理,获得该第二分类模型输出的至少一种工单分类。

该第二分类模型是通过第二样本集训练获得的模型,该第二样本集包含第二工单样本的文本特征,以及该第二工单样本的工单分类;该第二工单样本的工单分类是该第一工单样本的工单分类之外的新的工单分类。

在本申请实施例中,该第二分类模型可以是与第一分类模型不同的另一个分类模型。比如,上述第二分类模型可以是训练速度和分类速度比第一分类模型更快的分类模型,例如,在一种可能的实现方式中,上述第一分类模型可以是rcnn模型,第二分类模型可以是xgboost模型。

步骤907,根据该第二分类模型输出的至少一种工单分类对该第二客服工单进行归档。

其中,该步骤907与上述步骤904的执行过程类似,此处不再赘述。

步骤908,当该第二客服工单归档的工单分类是该新的工单分类时,将该第二工单样本的文本特征,以及该第二工单样本的工单分类添加入新的训练样本。

其中,该新的工单分类是指第一分类模型能够输出的工单分类之外的,其它的工单分类。

比如,随着业务调整等情形,客服系统中可能会在原有的工单分类的基础上,新增更多的工单分类,而原有的第一分类模型由于在训练时没有输入新的工单分类对应的训练数据,因此无法将客服工单分类为新的工单分类。通过本申请所示的方案,在通过第一分类模型对客服工单进行分类的过程中,服务器还可以调用另一个通过包含新的工单分类的训练数据训练获得的第二分类模型对已有的客服工单进行再分类,当再分类确定原有的客服工单是新的工单分类时,根据该已有的客服工单以及新的工单分类生成新的训练样本。

步骤909,当该新的训练样本的数量达到预设的数量阈值时,将该新的训练样本添加入该第一样本集。

由于模型训练的准确性与各个工单分类对应的训练样本的数量有很大关系,只有当一个工单分类对应的训练样本达到一定数量时,才能保证训练出的模型能够较为准确的属于对该工单分类的客服工单进行分类。因此,在本申请实施例中,当通过第二分类模型获取的新的训练样本的数量达到一定的数量阈值时,服务器才将新的训练样本添加入第一样本集中,以便自行后续的重训练过程。

步骤910,根据添加该新的训练样本之后的该第一样本集,对该第一分类模型进行重新训练。

其中,对第一分类模型进行重训练的过程与前述的第一分类模型的训练过程类似,此处不再赘述。

在本申请实施例中,服务器还可以离线判断是否需要更新第一分类模型。请参考图12,其示出了本申请实施例涉及的一种训练集添加流程示意图。如图12所示,该离线判断是否增加新的训练样本,以更新第一分类模型的步骤如下:

步骤1,读取工单判断结果表中新标签的工单;

步骤2,对工单进行预处理:首先用正则表达式等方法过滤非汉字部分(标点符号、特殊符号、数字、英文等);

步骤3,用ngram对预处理后的工单进行提取特征;

步骤4,对提取的特征进行训练,获得第二分类模型(xgboost模型);

步骤5,利用训练后的第二分类模型对原有的工单进行预测;

步骤6,客服人员人工校验被第二分类模型标记为新标签的工单;

步骤7,存储客服人员的校验结果进训练集,重复步骤2、3、4、5、6、7,直到训练集的样本数足够大为止。

可选的,根据添加该新的训练样本之后的该第一样本集,对该第一分类模型进行重新训练之前,还包括:

对已归档的各个客服工单进行分词以及词性标注;根据该已归档的各个客服工单的词性标注结果,获取各个工单分类中的词性分布比例;根据该各个工单分类中的词性分布比例,获取该各个工单分类中的词性的交叉熵。

在根据添加该新的训练样本之后的该第一样本集,对该第一分类模型进行重新训练的过程中,当该交叉熵大于预设的交叉熵阈值时,服务器根据添加该新的训练样本之后的该第一样本集,对该第一分类模型进行重新训练。

以第一分类模型可以是rcnn模型,第二分类模型可以是xgboost模型为例,请参考图13,其示出了本申请实施例涉及的一种重训练流程示意图。如图13所示,服务器可以通过以下过程对第一分类模型进行重训练:

步骤1,读取工单判断结果表中新标签的工单;

步骤2、判断新标签样本数是否超过阈值。如果超过,则将新标签样本数加入训练样本中,重新训练rcnn模型;如果没有超过,则进行下一步;

步骤3、对训练集进行ngram-xgboost初始化训练;

步骤4、利用初始化训练的ngram-xgboost对原有的工单进行预测;

步骤5、获取原有工单的分类为新标签的工单;

步骤6、将分为新标签的工单推送给客服,由客服做工单校验;

步骤7、存储工单校验结果,返回步骤s2;

步骤8、对工单数据进行分词、标注词性;

步骤9、计算各类别工单中词性分布比例情况;

步骤10、计算各类别工单中词性的交叉熵;

步骤11、判断交叉熵是否超过阈值,如果超过,则增加新训练样本;

步骤12、重新训练rcnn模型。

其中,交叉熵常用于语句消歧中,度量训练集和测试集分布的差异性。本申请实施例所示的方案借用交叉熵的思想,将交叉熵用于度量两个时间段的数据集分布的差异性。

通过本申请实施例上述方案,在对第一分类模型进行离线更新过程中,减少人工对新标签标注的数据量,快速从历史工单中找到相似的语料。本申请采用n-gram-xboost模型查找新的工单分类的样本,降低新词对模型的影响,更容易解释。

图14是根据一示例性实施例示出的一种客服信息推送装置的结构方框图。该客服信息推送装置可以用于计算机设备中,以执行图4、图7或图9所示实施例中的全部或者部分步骤。该客服信息推送装置可以包括:

请求接收模块1401,用于接收终端发送的信息读取请求,所述信息读取请求是所述终端接收到展示客服页面的操作时发送的请求;

第一特征获取模块1402,用于根据所述信息读取请求获取目标用户账号的预测特征,所述目标用户账号的预测特征是对所述目标用户账号的客服关联信息进行特征提取获得的特征;所述目标用户账号是在所述终端中登录的用户账号;

预测模块1403,用于调用预测模型对所述目标用户账号的预测特征进行处理,获得所述预测模型输出的客服信息预测结果;所述预测模型是根据预测样本集训练获得的模型,所述预测样本集中包含预测特征样本以及所述预测特征样本对应的客服信息;

信息推送模块1404,用于根据所述客服信息预测结果,向所述终端推送至少一条客服信息。

可选的,所述客服关联信息包括以下信息中的至少一种:

对应的用户账号的历史访问轨迹、对应的用户账号的历史客服记录、对应的用户账号的账号处理信息以及对应的用户账号的用户属性信息。

可选的,所述装置还包括:

分类提取模块,用于在预测模块1403根据所述信息读取请求获取目标用户账号的预测特征之前,对所述目标用户账号的客服关联信息进行分类提取,获得文本信息和数据信息;

第二特征获取模块,用于对所述文本信息进行特征提取,获得所述目标用户账号的客服关联信息对应的文本特征;

第三特征获取模块,用于对所述数据信息进行特征提取,获得所述目标用户账号的客服关联信息对应的数据特征;

预测特征获取模块,用于将所述文本特征和所述数据特征获取为所述目标用户账号的预测特征。

可选的,所述第二特征获取模块,用于将所述文本信息的词向量提取为所述目标用户账号的客服关联信息对应的文本特征。

可选的,所述第三特征获取模块,用于按照所述数据信息中包含的各项特征的特征类型,以及所述各项特征的特征值,对所述各项特征进行过滤,获得过滤后的至少一项特征;对过滤后的所述至少一项特征进行统计分析,获得所述目标用户账号的客服关联信息对应的数据特征;所述统计分析包括离散化、归一化以及特征组合中的至少一种。

可选的,所述装置还包括:

第一客服工单获取模块,用于在第一特征获取模块1402根据所述信息读取请求获取目标用户账号的预测特征之前,获取第一客服工单,所述第一客服工单是所述目标用户账号对应的客服工单,且所述第一客服工单是已完成的客服工单;

客服关联信息获取模块,用于在对所述第一客服工单进行归档时,获取所述目标用户账号的客服关联信息。

可选的,所述装置还包括:

文本内容获取模块,用于获取所述第一客服工单的文本内容,所述第一客服工单的文本内容包含问题描述内容以及对所述问题描述内容的回复内容;

第四特征获取模块,用于对所述第一客服工单的文本内容进行特征提取,获得所述第一客服工单的文本特征;

第一分类模块,用于调用第一分类模型对所述第一客服工单的文本特征进行处理,获得所述第一分类模型输出的至少一种工单分类;所述第一分类模型是通过第一样本集训练获得的模型,所述第一样本集包含第一工单样本的文本特征,以及所述第一工单样本的工单分类;

第一归档模块,用于根据所述第一分类模型输出的至少一种工单分类对所述第一客服工单进行归档。

可选的,所述第四特征获取模块,用于对所述第一客服工单的文本内容进行过滤,剔除所述第一客服工单的文本内容中的指定内容;对过滤后的所述第一客服工单的文本内容进行分词处理;根据分词处理结果,去除所述第一客服工单的文本内容中的无效词;对去除无效词之后的所述第一客服工单的文本内容进行分句处理,获得至少一个预定长度的语句;按照预设的转换关系,将所述至少一个预定长度的语句转化为所述第一客服工单的词序列;将所述第一客服工单的词序列获取为所述第一客服工单的文本特征。

可选的,所述第四特征获取模块,用于对所述第一客服工单的文本内容进行过滤,剔除所述第一客服工单的文本内容中的指定内容;对过滤后的所述第一客服工单的文本内容进行向量提取,获得过滤后的所述第一客服工单的文本内容的特征向量表;将过滤后的所述第一客服工单的文本内容的特征向量表获取为所述第一客服工单的文本特征。

可选的,所述第一归档模块,用于展示所述第一分类模型输出的至少一种工单分类;接收到根据展示的所述第一分类模型输出的至少一种工单分类执行的分类选择操作时,将所述第一客服工单归档至所述分类选择操作对应的工单分类。

可选的,所述装置还包括:

第五特征获取模块,用于获取第二客服工单的文本特征,所述第二客服工单是历史存储的客服工单;

第二分类模块,用于调用第二分类模型对所述第二客服工单的文本特征进行处理,获得所述第二分类模型输出的至少一种工单分类;所述第二分类模型是通过第二样本集训练获得的模型,所述第二样本集包含第二工单样本的文本特征,以及所述第二工单样本的工单分类;所述第二工单样本的工单分类是所述第一工单样本的工单分类之外的新的工单分类;

第二归档模块,用于根据所述第二分类模型输出的至少一种工单分类对所述第二客服工单进行归档;

第一添加模块,用于当所述第二客服工单归档的工单分类是所述新的工单分类时,将所述第二工单样本的文本特征,以及所述第二工单样本的工单分类添加入新的训练样本;

第二添加模块,用于当所述新的训练样本的数量达到预设的数量阈值时,将所述新的训练样本添加入所述第一样本集;

重训练模块,用于根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练。

可选的,所述装置还包括:

词性标注模块,用于在重训练模块根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练之前,对已归档的各个客服工单进行分词以及词性标注;

分布比例获取模块,用于根据所述已归档的各个客服工单的词性标注结果,获取各个工单分类中的词性分布比例;

交叉熵获取模块,用于根据所述各个工单分类中的词性分布比例,获取所述各个工单分类中的词性的交叉熵;

所述重训练模块,用于当所述交叉熵大于预设的交叉熵阈值时,根据添加所述新的训练样本之后的所述第一样本集,对所述第一分类模型进行重新训练。

图15是根据一示例性实施例示出的一种计算机设备的结构示意图。所述计算机设备1500包括中央处理单元(cpu)1501、包括随机存取存储器(ram)1502和只读存储器(rom)1503的系统存储器1504,以及连接系统存储器1504和中央处理单元1501的系统总线1505。所述计算机设备1500还包括帮助计算机内的各个器件之间传输信息的基本输入/输出系统(i/o系统)1506,和用于存储操作系统1513、应用程序1514和其他程序模块1515的大容量存储设备1507。

所述基本输入/输出系统1506包括有用于显示信息的显示器1508和用于用户输入信息的诸如鼠标、键盘之类的输入设备1509。其中所述显示器1508和输入设备1509都通过连接到系统总线1505的输入输出控制器1510连接到中央处理单元1501。所述基本输入/输出系统1506还可以包括输入输出控制器1510以用于接收和处理来自键盘、鼠标、或电子触控笔等多个其他设备的输入。类似地,输入输出控制器1510还提供输出到显示屏、打印机或其他类型的输出设备。

所述大容量存储设备1507通过连接到系统总线1505的大容量存储控制器(未示出)连接到中央处理单元1501。所述大容量存储设备1507及其相关联的计算机可读介质为计算机设备1500提供非易失性存储。也就是说,所述大容量存储设备1507可以包括诸如硬盘或者cd-rom驱动器之类的计算机可读介质(未示出)。

不失一般性,所述计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其他数据等信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括ram、rom、eprom、eeprom、闪存或其他固态存储其技术,cd-rom、dvd或其他光学存储、磁带盒、磁带、磁盘存储或其他磁性存储设备。当然,本领域技术人员可知所述计算机存储介质不局限于上述几种。上述的系统存储器1504和大容量存储设备1507可以统称为存储器。

计算机设备1500可以通过连接在所述系统总线1505上的网络接口单元1511连接到互联网或者其它网络设备。

所述存储器还包括一个或者一个以上的程序,所述一个或者一个以上程序存储于存储器中,中央处理器1501通过执行该一个或一个以上程序来实现图4、图7或图9所示的方法的全部或者部分步骤。

在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括计算机程序(指令)的存储器,上述程序(指令)可由计算机设备的处理器执行以完成本申请各个实施例所示的方法的全部或者部分步骤。例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求指出。

应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1