用户咨询的应对处理方法、装置、存储介质及电子设备与流程

文档序号:24552142发布日期:2021-04-06 12:04阅读:97来源:国知局
用户咨询的应对处理方法、装置、存储介质及电子设备与流程

本申请涉及智能问答技术领域,更具体地说,涉及一种用户咨询的应对处理方法、装置、存储介质及电子设备。



背景技术:

智能问答是人机交互智能化的一个重要方面。

如何使机器准确理解用户咨询内容,并且感知用户咨询时的情绪,从而以恰当的方式正确地解答用户咨询,是人机交互智能化发展中的重要研究内容,也是当前人机交互业务中的实际需求。



技术实现要素:

鉴于上述需求,本申请提供一种克服上述问题或者至少部分地解决上述问题的用户咨询的应对处理方法、装置、存储介质及电子设备,该方法在解答用户咨询内容时,能够兼顾用户情绪,以与用户情绪匹配的应对机制解答用户咨询的内容。

为了达到上手目的,本申请具体提出如下技术方案:

一种用户咨询的应对处理方法,包括:

获取用户咨询内容;

对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别;

对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别;其中,所述情感类别用于表征所述用户咨询时的情绪;

根据所述用户咨询内容的类别,按照与所述情感类别相匹配的应对机制解答所述用户咨询内容。

可选的,所述根据所述用户咨询内容的类别,按照与所述情感类别相匹配的应对机制解答所述用户咨询内容,包括:

输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息;

当所述用户选择所述专业服务人员中的任意一个专业服务人员时,联络该专业服务人员解答所述用户的咨询内容。

可选的,所述输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息,包括:

确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分;

从所述至少一个专业服务人员中,选出设定数量的专业服务人员;其中,被选出的专业服务人员中的任意一个专业服务人员的综合能力评分,均高于未被选出的专业服务人员中的任意一个专业服务人员的综合能力评分;

输出选出的所述设定数量的专业服务人员的信息。

可选的,所述确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分,包括:

根据与所述用户咨询内容的类别相对应领域的知识图谱,检索确定所述领域的至少一个专业服务人员;

根据所述至少一个专业服务人员所在服务机构的综合评分,以及所述至少一个专业服务人员的个人能力评分,确定所述至少一个专业服务人员的综合能力评分。

可选的,所述对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别,包括:

将所述用户咨询内容输入预先训练得到的问题分类模型,确定所述用户咨询内容的类别;

其中,所述问题分类模型至少通过对用户咨询内容样本进行分类训练得到。

可选的,所述问题分类模型基于bert-rnn模型训练得到。

可选的,所述对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别,包括:

将所述用户咨询内容属于预先训练得到的情感分析模型,确定所述用户咨询内容的情感类别;

其中,所述情感分析模型基于bert模型构建,并且至少通过对用户咨询内容样本进行情感分析训练得到。

一种用户咨询的应对处理装置,包括:

咨询获取单元,用于获取用户咨询内容;

第一分类单元,用于对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别;

第二分类单元,用于对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别;其中,所述情感类别用于表征所述用户咨询时的情绪;

咨询解答单元,用于根据所述用户咨询内容的类别,按照与所述情感类别相匹配的应对机制解答所述用户咨询内容。

一种存储介质,所述存储介质上存储有程序,所述程序被处理器执行时实现上述的用户咨询的应对处理方法。

一种电子设备,所述电子设备包括至少一个处理器、以及与所述处理器连接的至少一个存储器、总线;其中,所述处理器、所述存储器通过所述总线完成相互间的通信;所述处理器用于调用所述存储器中的程序指令,以执行上述的用户咨询的应对处理方法。

借由上述技术方案,本申请提供的用户咨询的应对处理方法在获取到用户咨询内容时,分别确定用户咨询内容的类别和情感类别,然后根据用户咨询内容的类别,按照与预设的情感类别相匹配的应对机制来解答用户咨询内容。采用本申请实施例技术方案应对用户咨询,可以根据用户咨询内容的情感不同,以不同的应对机制解答用户咨询内容,由此可以保证以恰当的、符合用户情绪的方式解答用户咨询,将该方案应用于人机交互或智能问答系统中,能够提升服务水平和服务效率。

上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。

附图说明

通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:

图1示出了本申请实施例提供的一种用户咨询的应对处理方法的流程示意图;

图2示出了本申请实施例提供的另一种用户咨询的应对处理方法的流程示意图;

图3示出了本申请实施例提供的一种司法知识图谱的示意图;

图4示出了本申请实施例提供的问题分类模型的构建及训练处理过程示意图;

图5示出了本申请实施例提供的语料集数据文件结构示意图;

图6示出了本申请实施例提供的标签列表文件的数据文件结构示意图;

图7示出了本申请实施例提供的问题分类模型的工作过程示意图;

图8示出了本申请实施例提供的情感分析模型的构建及训练处理过程示意图;

图9示出了本申请实施例提供的情感分析模型的工作过程示意图;

图10示出了本申请实施例提供的一种用户咨询的应对处理装置的结构示意图;

图11示出了本申请实施例提供的一种设备的结构示意图。

具体实施方式

本申请实施例技术方案适用于人机交互业务场景,具体适用于人机智能问答场景,智能问答机器或程序采用本申请实施例技术方案应对用户咨询,可以在理解所咨询的内容的同时,感知用户咨询时的情绪,进而以符合用户情绪的应对机制解答用户咨询。

示例性的,本申请实施例所提出的技术方案可以应用于处理器等硬件处理设备,也可以被封装成软件程序、软件系统等被执行。当硬件处理设备执行本申请实施技术方案的处理过程,或者上述的软件程序或软件系统等运行时,可以实现本申请提出的用户咨询的应对处理方法。

上述技术方案可适用于任意行业的人机交互智能问答业务场景中,本申请实施例以司法智能问答系统的人机交互问答业务场景为例,介绍本申请提出的用户咨询的应对处理方法的处理过程。

下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。

参见图1所示,本申请实施例提出的用户咨询的应对处理方法,包括:

s101、获取用户咨询内容;

具体的,上述用户咨询内容,是指用户提交的咨询内容,该咨询内容可以是文本数据形式,也可以是音频、图像等数据形式。在具体内容上,该用户咨询内容可以是问句,例如“请问······?”,也可以是陈述句、关键词等,例如“继承权的法律规定”“生命权”等,或者是用户提交的一幅图像、一段音频数据等。

原则上,只要是以咨询为目的的数据内容,均可以作为用户咨询内容。例如,当本申请技术方案应用于智能问答系统时,只要是用户在智能问答系统或人机交互系统中的用户提问区域输入的数据内容,均为用户咨询内容。本申请实施例不对上述的用户咨询内容的具体数据形式以及具体内容等做限定。

作为优选的实现方式,上述的用户咨询内容为用户提交的文本形式的咨询内容,例如“请问法律上对于继承权是如何规定的?”。本申请实施例以文本形式的用户咨询内容为例,介绍本申请提出的用户咨询的应对处理方法的具体处理过程。

当上述用户咨询内容为其它形式的数据内容时,针对该用户咨询内容的应对处理过程可以参见本申请实施例介绍而实现。

示例性的,当上述的用户咨询内容为图像数据内容或者为音频数据内容时,可以先对该用户咨询内容进行识别,将其转化为文本形式的数据内容,然后即可按照本申请实施例介绍,应对解答该用户咨询内容。

s102、对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别;

具体的,上述对用户咨询内容进行分类处理,确定用户咨询内容的类别,具体是指对该用户咨询内容的具体数据内容进行分类,从而确定用户所咨询的内容的类别。

例如,假设用户咨询内容为“请问法律上对于继承权是如何规定的?”,则对其进行分类处理,可以确定该用户所咨询的内容为关于继承权的内容,因此可以确定该用户咨询内容的类别为继承权类别。

对用户咨询内容进行分类,可以缩小解答用户所咨询的内容的检索范围,利于更快速地把握用户需求,提供用户满意的解答。

s103、对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别;其中,所述情感类别用于表征所述用户咨询时的情绪;

具体的,用户在操作智能问答系统进行提问时,通常会带有某种情绪。例如当用户首次提问时,用户情绪可能比较稳定;如果用户经过多次提问,均没有得到满意的答复,则可能会带有焦躁、生气等情绪。

通常情况下,用户情绪会体现在用户提交的文本语句中。例如,用户刚开始提问时,提问语句可能是类似于“请问法律上对于继承权是如何规定的?”等形式的普通问句,此时可以理解用户情绪较稳定;当用户多次提问都没有得到满意的答案时,用户提问的语句可能会变成“为什么不行!”、“快给我一个合理的解释!”等命令式的语句,此时可以通过这些语句看出,用户情绪有波动。

当用户咨询时的情绪发生变化时,应当以符合用户情绪的方式解答用户咨询,以免引起用户更大的情绪波动。因此,本申请实施例设定,在获取到用户咨询内容时,对用户咨询内容进行情感分析,确定用户咨询内容的情感类别,也就是确定用户咨询时的情绪。

示例性的,本申请实施例将用户咨询内容的情感类别分为负面情感和正面情感两类,其中,负面情感可以包括生气、急躁、愤怒等;除负面情绪之外其它情感类型则定义为正面情感,本申请实施例对所获取的用户咨询内容进行分类时,具体是分为负面情感类别,或分为正面情感类别。

作为一种示例性的实现方式,本申请实施例将获取的用户咨询内容设置内容类别和情感类别标签化。

当按照本申请上述实施例介绍确定用户咨询内容的类别时,为该用户咨询内容添加对应的内容类别标签,例如“继承权”、“财产纠纷”、“商标”等;当确定用户咨询内容的情感类别时,为该用户咨询内容添加对应的情感类别标签,例如“生气”、“急躁”等。

示例性的,与本申请实施例关于用户咨询内容的情感类别的设定相对应的,本申请实施例以标签0和标签1分别表示正面情感和负面情感。当用户咨询内容的情感类别为负面情感时,比如为生气、急躁、愤怒等情感时,为用户咨询内容标注标签1;否则,为用户咨询内容标注标签0。

则经过本申请实施例上述步骤s102和s103的处理,借助用户咨询内容的标签,可以显而易见地确定用户所咨询的内容的类别,以及确定用户咨询时的情感,即确定用户咨询内容的情感类别,更具体的,本申请实施例着重识别上述用户咨询内容的情感类别是否为负面情感。

在分别确定用户咨询内容的类别和情感类别后,本申请实施例根据用户咨询内容的类别,按照与用户咨询内容的情感类别相匹配的应对机制解答用户咨询内容。也就是说,本申请实施例将用户咨询内容的类别和情感类别相结合,选取与之匹配的应对机制解答用户咨询,摒弃了常规处理中按照固定模式应对所有类型的用户咨询的处理方式,使得对用户咨询的应对具有更高的灵活性和适用性。

示例性的,本申请实施例在根据用户咨询内容的类别,按照与用户咨询内容的情感类别相匹配的应对机制解答用户咨询内容时,具体进行如下处理:

s104、判断所述用户咨询内容的情感类别是否为预设的情感类别;

如果所述用户咨询内容的情感类别不是预设的情感类别,则执行步骤s105、按照通用的应对机制解答所述用户咨询内容。

其中,上述通用的应对机制,是指常用的、普通应对机制,例如自动化的咨询解答机制等。

当所述用户咨询内容的情感类别为预设的情感类别时,执行步骤s106、根据所述用户咨询内容的类别,按照与所述预设的情感类别相匹配的应对机制解答所述用户咨询内容。

示例性的,上述预设的情感类别,是指负面情感类别。借助为用户咨询内容添加的情感类别标签,可以判断用户咨询内容的情感是否为负面情感:当用户咨询内容的情感类别标签为标签1时,即可确定该用户咨询内容的情感类别为负面情感。

本申请实施例设定,当用户咨询内容的情感类别不同时,以不同的因对机制解答用户咨询内容。尤其是,当用户咨询内容的情感为负面情感,即当用户咨询时的情绪为负面情绪时,要按照与负面情感类别相匹配的应对机制解答用户咨询内容,而不能再按照常规的应对机制解答用户咨询内容,以免引起用户不满。

一般的,用户在咨询过程中产生负面情绪是因为自己咨询的内容没有得到正确解答,此时应该以更直接的方式更正确地解答用户咨询的内容。为了达到上述目的,作为优选的实现方式,本申请实施例设定,上述与预设的情感类别相匹配的应对机制,具体是联系人工服务解答用户咨询内容。

当获取的用户咨询内容的情感类别为负面情感时,本申请实施例根据用户咨询内容的类别,联系该类别对应领域的人工服务解答用户咨询内容,也就是建立该领域的人工服务与用户之间的直接交互,由服务人员直接与用户沟通,解答用户咨询内容。

可以理解,当用户在智能问答系统中咨询的过程中产生负面情绪时,及时联络人工介入,由人工解答用户咨询,可以快速地满足用户需求,利于消除用户负面情绪,提升用户的被服务感受。

通过上述介绍可见,本申请实施例提出的用户咨询的应对处理方法在获取到用户咨询内容时,分别确定用户咨询内容的类别和情感类别,当用户咨询内容的情感类别为预设的情感类别时,根据用户咨询内容的类别,按照与预设的情感类别相匹配的应对机制来解答用户咨询内容。采用本申请实施例技术方案应对用户咨询,可以根据用户咨询内容的情感不同,以不同的应对机制解答用户咨询内容,由此可以保证以恰当的、符合用户情绪的方式解答用户咨询,将该方案应用于人机交互或智能问答系统中,能够提升服务水平和服务效率。

作为一种可选的实现方式,参见图2所示,本申请另一实施例中公开了,上述的根据所述用户咨询内容的类别,按照与预设的情感类别相匹配的应对机制解答所述用户咨询内容,具体包括:

s206、确定与所述在用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分;

具体的,上述的与用户咨询内容的类别相对应领域,是指用户咨询内容所属的领域,例如,假设用户咨询的内容为“继承权”,可以确定其所属领域为法律领域,则可以确定用户咨询内容的类别相对应的领域为法律领域。而法律领域的专业服务人员,即为律师。

通过确定用户咨询内容所属领域,可以明确与用户咨询内容的类别相对应的领域,从该领域检索专业服务人员,即可得到上述的至少一个专业服务人员。进一步的,分别获取该至少一个专业服务人员的相关信息,对其各方面能力进行评分,即可确定该至少一个专业服务人员中的每个人员的综合能力评分。

作为一种示例性的实现方式,本申请实施例根据与所述用户咨询内容的类别相对应领域的知识图谱,检索确定所述领域的至少一个专业服务人员。

然后,根据所述至少一个专业服务人员所在服务机构的综合评分,以及所述至少一个专业服务人员的个人能力评分,确定所述至少一个专业服务人员的综合能力评分。

以检索法律领域的律师为例,法律领域的知识图谱即为司法知识图谱,该司法知识图谱的具体形式可参见图3所示。当根据司法知识图谱检索律师时,根据用户咨询内容的类别信息,从司法知识图谱中找到相应的问题类别节点,然后,根据“(问题类别)-[相关文书]->(文书)-[相关律师{胜负结果:胜}->(律师)]”和“(问题类别)<-[擅长类型]-(律所)<-[所在律所]-[律师]”两个条件共同查询或者其中任意一个条件进行查询到所有的律师作为候选的相关律师。

得到候选的相关律师后,需要对这些相关律师进行排序,然后选择出top-n位律师自动推荐给用户。想要对律师进行排序,需要进行综合能力评分计算。律师的综合能力评分包括两部分,一部分是律师自身的个人能力评分,另一部分是律师所在律所的综合分数,通常我们认为能进入好的律所的律师专业素养也好。律师自身的个人能力评分由“响应速度”,“执业年份”,“回答问题数量”,“服务态度”,“胜诉率”以及“主要成就的数量”等几个指标构成。响应速度越快、执业年份越长、回答问题数量越多、服务态度好评数越多,得到过类似于“中国十大律师”等成就并且数量越多的,个人能力评分也就越高。律所则直接根据“律所排名”来进行分值划分。本申请实施例将根据律师和其所在的律所的两个评分进行归一化求和之后得到的综合分数,作为律师的综合能力评分。

参照上述处理过程,可以分别确定上述至少一个专业服务人员中的各个人员的综合能力评分。

s207、从所述至少一个专业服务人员中,选出设定数量的专业服务人员;其中,被选出的专业服务人员中的任意一个专业服务人员的综合能力评分,均高于未被选出的专业服务人员中的任意一个专业服务人员的综合能力评分;

具体的,在确定出至少一个专业服务人员,并且确定各个专业服务人员的综合能力评分后,本申请实施例根据各个专业服务人员的综合能力评分,从中选出综合能力评分top-n的专业服务人员,其中n为正整数。

也就是,本申请实施例从上述的至少一个专业服务人员中,选出综合能力评分最高的设定数量的专业服务人员,则选出的专业服务人员,是能力比较凸出的服务人员。

s208、输出选出的所述设定数量的专业服务人员的信息;

具体的,将选出的设定数量的专业服务人员的信息,包括职业信息、照片、所得荣誉、业绩等,输出显示给用户,并且为用户提供选择窗口,使用户可以选择其中任意一个专业服务人员进行咨询。

经过上述步骤s206~s208的处理,可以输出与用户咨询内容的类别相对应领域的专业服务人员的信息,此时,用户可以从中任意选择一个专业服务人员进行咨询。

当用户选择上述专业服务人员中的任意一个专业服务人员时,执行步骤s209、联络该专业服务人员解答所述用户的咨询内容。

具体的,当用户选择了任意一个专业服务人员时,建立用户与所选择的专业服务人员之间的连接,具体可以采用网络连接、电话连接等形式,使用户与专业服务人员之间实现线上聊天或电话沟通,以便专业服务人员解答用户咨询。具体的用户与专业服务人员之间的联络沟通方式,可以由用户选择设定。

图2所示的实施例中的步骤s201~s205分别对应图1所示的方法实施例中的步骤s101~s105,其具体内容可参见图1所示的方法实施例的内容,此处不再赘述。

作为一种示例性的实现方式,本申请实施例在对用户咨询内容进行分类处理,确定用户咨询内容的类别时,具体是将所述用户咨询内容输入预先训练得到的问题分类模型,确定所述用户咨询内容的类别;

其中,所述问题分类模型至少通过对用户咨询内容样本进行分类训练得到。

上述的问题分类模型,具体可以采用基于深度学习的分类模型实现。示例性的,本申请实施例所构建的上述问题分类模型基于bert-rnn模型训练得到。

以本申请实施例技术方案应用于法律智能问答系统为例,参见图4所示,上述基于bert-rnn的问题分类模型的构建及训练过程,包括:

(1)建立分类体系;

本申请实施例以法律智能问答专业版和当事人版的分类体系构建为例。针对专业版,主要依据案由和罪名的分层体系来进行构建,采用最后一级的案由和罪名作为分类标签。比如“生命权、健康权、身体权纠纷”这个案由的层级为“人格纠纷权-人格纠纷权-生命权、健康权、身体权纠纷”,“同居关系析产纠纷”这个案由的层级为“婚姻家庭、继承纠纷-婚姻家庭纠纷-同居关系纠纷-同居关系析产纠纷”,不管有几个层级,都以最后一级案由作为分类标签,即“生命权、健康权、身体权纠纷”和“同居关系析产纠纷”为分类标签。针对当事人版,主要依据法律领域的常用主题分层体系来进行构建,将每一级标签使用连字符“_”进行连接之后作为分类标签。比如“知识产权”这一主题下还有下级子主题“商标”、“软件著作权”等,那么分类标签表示为“知识产权_商标”和“知识产权_软件著作权”等。

(2)准备语料集和标签列表文件;

建立好分类体系之后,需要进行大量的用户咨询内容的标注工作,已用户咨询内容为问句为例,因为本专利将问句分类看成一个多分类分体,因此遵循的原则是同一个问句不能标注多个标签,否则会影响分类的效果。语料集的数据文件结构如图5所示,其中,query为输入的问句。label为问句的分类标签,完成构建后将数据进行打乱。

除了准备语料集,因为问句分类是一个多分类问题,因此需要准备一个标签列表文件labellist。标签列表文件的数据文件结构如图6所示。

(3)划分数据集;

按照7:2:1的比例对标注语料集进行训练集、验证集和测试集的划分,用于语义匹配模型的训练、验证和测试。

(4)bert-rnn模型构建;

bert模型采用了transformer模型的encoder来作为语言模型,完全采用attention机制来进行input-output之间关系的计算。基于bert模型进行下游自然语言处理任务有两种方式,一种是微调(fine-tuning),另一种是固定特征提取器(fixedfeatureextractor)。本申请实施例采用微调的方式来对模型进行简单修改。本申请实施例使用谷歌的中文的bert预训练模型(bert-base-chinese)来实现问句分类。

问句分类是一个多分类的问题,首先需要对模型中获取标签的部分进行修改。然后,如图7所示,向模型输入单句文本,在句子开始加上一个分类任务标记符号[cls]。将这个文本输入bert预训练模型,使用bert_model.get_sequence_output()方法来获取encoder的最终隐含层输出token_outpt,shape=[batch_size,seq_length,hidden_size],该功能类似于wordembedding的作用,但表示能力比wordembedding要强。接下来再通过一层双向lstm层,最终通过一个softmax层之后来计算类别标签classlabel的概率。根据classlabel的概率向量(例如[0.00232,0.11233,…,0.9923])来确定最终匹配与否的类别。具体的,概率向量中索引为0的值0.00232表征标签列表(例如[a,b,…,m])对应索引的类别a的概率。

(5)问句分类模型训练。

进行微调后,设置好预训练模型路径等参数,加载谷歌提供的预训练好的中文bert模型,开始进行问句分类模型训练。

(6)使用训练好的模型对问题类型进行分类,即,将用户咨询内容输入训练好的模型,即可确定该用户咨询内容的类别。

参照上述处理过程,当本申请实施例技术方案应用于其他领域时,将上述的语料集替换为相应领域的语料集,同时按照上述的模型调整及构建方法构建模型,然后用获取的语料集与构建的模型进行训练,即可利用训练的模型对用户咨询内容进行分类,确定用户咨询内容的类别。

需要说明的是,上述的语料集选取、语料划分及模型训练过程,皆可参照常见的深度学习模型的训练过程进行处理,本申请实施例相对现有技术的改进主要是将性能优秀的bert模型用于对用户咨询内容进行分类,借助bert模型自身强大的自然语言处理能力,通过更少的语料、更少次数的训练,实现对用户咨询内容的准确分类。

作为一种示例性的实现方式,本申请实施例在对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别时,具体是将所述用户咨询内容属于预先训练得到的情感分析模型,确定所述用户咨询内容的情感类别;

其中,所述情感分析模型至少通过对用户咨询内容样本进行情感分析训练得到。

上述的问题分类模型,具体可以采用基于深度学习的分类模型实现。示例性的,本申请实施例上述的情感分析模型基于bert模型训练得到。

以本申请实施例技术方案应用于法律智能问答系统,并且将情感类别分为“生气”和“非生气”为例,参见图8所示,上述的基于bert模型构建及训练得到情感分析模型的具体处理过程,包括:

(1)构建语料集;

本申请实施例的语料集有两部分组成,大部分是清华大学黄民烈老师团队用在emotionalconversationgenerationchallengein2017和shorttextconversationchallengeatntcirin2018工作中的数据集stc-3_emotion_train,来自于微博对话的情感标注语料。该语料集包含0(other),1(like),2(sadness),3(disgust),4(anger),5(happiness)六种情绪的对话语料。标注为4的对话数据作为正例,其余标注的对话数据作为负例。语料集的数据文件结构如图5所示。

此时,query为输入的对话句子。label为句子的情感类别标签,包含“生气”和“非生气”两种值。另一部分,将百度敏感词数据标注上“生气”的标签,作为正例。完成构建后将数据进行打乱(shuffle)。

(2)划分训练集,验证集和测试集;

按照8:2的比例对标注语料集进行训练集和验证集的划分,用于语义匹配模型的训练、验证。

(3)bert模型微调;

bert模型采用了transformer模型的encoder来作为语言模型,完全采用attention机制来进行input-output之间关系的计算。基于bert模型进行下游自然语言处理任务有两种方式,一种是微调(fine-tuning),另一种是固定特征提取器(fixedfeatureextractor)。本申请实施例提出的方法采用微调的方式来对模型进行简单修改。本专利使用谷歌的中文的bert预训练模型(bert-base-chinese)来实现问句的情感极向分析。

参见图9所示,首先输入单句文本,在句子开始加上一个分类任务标记符号[cls]。然后输入bert预训练模型,使用bert_model.get_pooled_output()方法来获取[cls]单词的最后一个隐含状态c,shape=[batch_size,hidden_size],加一层权重w,再经过一个softmax层之后来计算classlabel的概率。根据classlabel的概率向量(例如[0.00232,0.9923])来确定最终匹配与否的类别,索引为0(0.00232)的值表征“非生气”,索引为1(0.9923)的值表征“生气”。

(4)问句情感极向分析模型训练。

进行微调后,设置好预训练模型路径等参数,加载谷歌提供的预训练好的中文bert模型,开始进行问句情感极向分析模型训练。

(5)使用训练好的模型对问题类型进行分类,即,将用户咨询内容输入训练好的模型,即可确定该用户咨询内容的情感类别。

参照上述处理过程,当本申请实施例技术方案应用于其他领域时,将上述的语料集替换为相应领域的语料集,同时按照上述的模型调整及构建方法构建模型,然后用获取的语料集与构建的模型进行训练,即可利用训练的模型对用户咨询内容进行情感类别分类,确定用户咨询内容的情感类别。

进一步的,当上述的情感类别分为更多类别时,参照本申请上述训练过程,可以训练模型对更多种类的情感类别的分类、识别。

需要说明的是,上述的语料集选取、语料划分及模型训练过程,皆可参照常见的深度学习模型的训练过程进行处理,本申请实施例相对现有技术的改进主要是将性能优秀的bert模型用于对用户咨询内容进行情感分类,借助bert模型自身强大的自然语言处理能力,通过更少的语料、更少次数的训练,实现对用户咨询内容的情感类别的准确分类。

与上述的用户咨询的应对处理方法相对应的,本申请另一实施例还公开了一种用户咨询的应对处理装置,参见图10所示,该装置包括:

咨询获取单元100,用于获取用户咨询内容;

第一分类单元110,用于对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别;

第二分类单元120,用于对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别;

咨询解答单元130,用于当所述用户咨询内容的情感类别为预设的情感类别时,根据所述用户咨询内容的类别,按照与所述预设的情感类别相匹配的应对机制解答所述用户咨询内容。

作为一种可选的实现方式,所述咨询解答单元,包括:

信息输出单元,用于输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息;

联络处理单元,用于当所述用户选择所述专业服务人员中的任意一个专业服务人员时,联络该专业服务人员解答所述用户的咨询内容。

作为一种可选的实现方式,所述信息输出单元输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息时,具体用于:

确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分;

从所述至少一个专业服务人员中,选出设定数量的专业服务人员;其中,被选出的专业服务人员中的任意一个专业服务人员的综合能力评分,均高于未被选出的专业服务人员中的任意一个专业服务人员的综合能力评分;

输出选出的所述设定数量的专业服务人员的信息。

作为一种可选的实现方式,所述信息输出单元确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分时,具体用于:

根据与所述用户咨询内容的类别相对应领域的知识图谱,检索确定所述领域的至少一个专业服务人员;

根据所述至少一个专业服务人员所在服务机构的综合评分,以及所述至少一个专业服务人员的个人能力评分,确定所述至少一个专业服务人员的综合能力评分。

作为一种可选的实现方式,所述第一分类单元对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别时,具体用于:

将所述用户咨询内容输入预先训练得到的问题分类模型,确定所述用户咨询内容的类别;

其中,所述问题分类模型至少通过对用户咨询内容样本进行分类训练得到。

其中,所述问题分类模型基于bert-rnn模型训练得到。

作为一种可选的实现方式,所述第二分类单元对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别时,具体用于:

将所述用户咨询内容属于预先训练得到的情感分析模型,确定所述用户咨询内容的情感类别;

其中,所述情感分析模型基于bert模型构建,并且至少通过对用户咨询内容样本进行情感分析训练得到。

所述用户咨询的应对处理装置包括处理器和存储器,上述咨询获取单元、第一分类单元、第二分类单元和咨询解答单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。

处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来应对用户咨询。

本申请实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述用户咨询的应对处理方法。

本申请实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述用户咨询的应对处理方法。

本申请实施例提供了一种设备,参见图11所示,该设备包括至少一个处理器200、以及与处理器200连接的至少一个存储器210、总线220;其中,处理器200、存储器210通过总线220完成相互间的通信;处理器200用于调用存储器210中的程序指令,以执行上述的用户咨询的应对处理方法。

本文中的设备可以是服务器、pc、pad、手机等。

本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:

获取用户咨询内容;

对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别;

对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别;

根据所述用户咨询内容的类别,按照与所述情感类别相匹配的应对机制解答所述用户咨询内容。

可选的,所述根据所述用户咨询内容的类别,按照与所述情感类别相匹配的应对机制解答所述用户咨询内容,包括:

输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息;

当所述用户选择所述专业服务人员中的任意一个专业服务人员时,联络该专业服务人员解答所述用户的咨询内容。

可选的,所述输出与所述用户咨询内容的类别相对应领域的专业服务人员的信息,包括:

确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分;

从所述至少一个专业服务人员中,选出设定数量的专业服务人员;其中,被选出的专业服务人员中的任意一个专业服务人员的综合能力评分,均高于未被选出的专业服务人员中的任意一个专业服务人员的综合能力评分;

输出选出的所述设定数量的专业服务人员的信息。

可选的,所述确定与所述用户咨询内容的类别相对应领域的至少一个专业服务人员,以及确定所述至少一个专业服务人员的综合能力评分,包括:

根据与所述用户咨询内容的类别相对应领域的知识图谱,检索确定所述领域的至少一个专业服务人员;

根据所述至少一个专业服务人员所在服务机构的综合评分,以及所述至少一个专业服务人员的个人能力评分,确定所述至少一个专业服务人员的综合能力评分。

可选的,所述对所述用户咨询内容进行分类处理,确定所述用户咨询内容的类别,包括:

将所述用户咨询内容输入预先训练得到的问题分类模型,确定所述用户咨询内容的类别;

其中,所述问题分类模型至少通过对用户咨询内容样本进行分类训练得到。

可选的,所述问题分类模型基于bert-rnn模型训练得到。

可选的,所述对所述用户咨询内容进行情感分析处理,确定所述用户咨询内容的情感类别,包括:

将所述用户咨询内容属于预先训练得到的情感分析模型,确定所述用户咨询内容的情感类别;

其中,所述情感分析模型基于bert模型构建,并且至少通过对用户咨询内容样本进行情感分析训练得到。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

在一个典型的配置中,设备包括一个或多个处理器(cpu)、存储器和总线。设备还可以包括输入/输出接口、网络接口等。

存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flashram)。存储器是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。

本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。

以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1