一种智能客服的对话方法及系统与流程

文档序号:18850884发布日期:2019-10-13 00:52阅读:296来源:国知局
一种智能客服的对话方法及系统与流程

本发明涉及通信技术领域,特别是一种智能客服的对话方法及其应用该方法的系统。



背景技术:

随着互联网及电子商务的普及应用,及人工智能技术的发展,智能客服越来越常见。智能客服是在大规模知识处理基础上发展起来的一项面向行业应用的,包括:大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等等,具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段;同时还能够为企业提供精细化管理所需的统计分析信息,可以大大降低企业在客服方面的人工成本。

智能客服的工作原理主要是基于大数据知识处理技术的应用,即通过提取访客的关键词来判断访客的意图,然后从语料库中匹配相应的答案给访客。传统客服的对话方式具有以下不足:

1.用户体验效果一般,对话模式固定,较为呆板。

2.智能客服回答问题的准确性不高,特别是针对不同的访客时,智能客服无法作为个性化的回答。

特别是由于中文的博大精深,同一个句往往会有不同的表达方式,传统做法是将相同或相似的问题作为一个分组,并且将这个分组的答案按出现的频率进行排序。当有新问题提出,且属于这个分组时,就把这个分组的答案里出现频率最高的一个推荐给访客。例如:

1、明天天气如何?

2、明天多少度?

3、明天会下雨吗?

4、明天冷吗?

对应答案:

1、明天是晴天,温度23-26。

2、明天温度23-26。

3、明天是晴天。

4、明天温度23-26,体感舒适。

一般做法是将以上问题分为一个组,然后当有新的相似问题进来时,都认为是同一组的问题,可以用该组的答案进行回答。对于该组的答案,一般为相同或相似,做法为将答案按频率进行排序,回答时自动推荐频率最高的一条。

由于地域性的原因,当一个北方访客和一个南方访客,在同一个时间问了上面的问题,得到了相同的答案,却和实际相差较远。或者时效性原因,同一个地域性的访客问了同一个问题,但时间间隔长达数月,仍然得到了相同的答案,显然也是和事实不符的。



技术实现要素:

本发明为解决上述问题,提供了一种智能客服的对话方法及系统,其通过对问题进行分类和排序,根据在各个类别中的排序顺序进行计算对应的属性值和进行打分,从而能够快速在数据库中搜索访客问题分值相近的相似问题,并根据相似问题向访客提供相应的推荐答案,提高了沟通效率和回答问题的准确性。

为实现上述目的,本发明采用的技术方案为:

一种智能客服的对话方法,其包括以下步骤:

10.获取大量的对话记录作为训练数据,并对所述对话记录进行提取问答对,每个问答对至少包括一个问题和一个对应的答案;

20.对所述问题进行分类,得到所述问题所属的类别,并对该类别中的所有问题的出现频率进行排序,根据排序的先后顺序进行计算得到所述问题在所述类别中的属性值,根据所述问题的类别及对应的属性值,进行创建打分函数模型;

30.利用所述打分函数模型对所述问题进行打分,得到所述问题的分值;

40.获取访客问题,利用所述打分函数模型对所述访客问题进行打分,得到所述访客问题的分值;

50.将所述访客问题的分值与数据库中的问题的分值进行比对分析,得到分值最接近的问题,作为推荐问题;

60.获取所述推荐问题的问答对中对应的答案,作为所述访客问题的推荐答案。

优选的,所述的步骤10中,每个问答对包括一个以上相似问题,各个相似问题对应一个相同的答案。

优选的,所述的步骤20中,对所述问题进行分类,包括以下类别:问题所属行业类别、访客所属地域类别、访客提问时间类别。

优选的,所述问题的分类,还进一步包括:访客所属群体类别、访客教育程度类别。

优选的,所述的步骤30或步骤40中,利用打分函数模型对问题进行打分,其计算方法如下:

Score=a x属性值1+b x属性值2+c x属性值3…+n x属性值N;

其中,Score为计算得到的问题的分值;1、2、3代表所述问题所属的类别;属性值1、属性值2、属性值3代表所述问题在所述类别中的属性值;a、b、c、n表示权重参数。

相应的,本发明还提供一种智能客服的对话系统,其包括:

数据预处理模块,用于获取大量的对话记录作为训练数据,并对所述对话记录进行提取问答对,每个问答对至少包括一个问题和一个对应的答案;

打分函数模型创建模块,用于对所述问题进行分类,得到所述问题所属的类别,并对该类别中的所有问题的出现频率进行排序,根据排序的先后顺序进行计算得到所述问题在所述类别中的属性值,根据所述问题的类别及对应的属性值,进行创建打分函数模型;

分值输出模块,其利用所述打分函数模型对所述问题进行打分,得到所述问题的分值;并获取访客问题,利用所述打分函数模型对所述访客问题进行打分,得到所述访客问题的分值;

相似问题分析模块,其将所述访客问题的分值与数据库中的问题的分值进行比对分析,得到分值最接近的问题,作为推荐问题;

答案推荐模块,用于获取所述推荐问题的问答对中对应的答案,作为所述访客问题的推荐答案。

本发明的有益效果是:

(1)本发明通过对问题进行分类,并对所属的类别中的所有问题的出现频率进行排序,根据排序的先后顺序进行计算得到所述问题在所述类别中的属性值,根据所述问题的类别及对应的属性值对问题进行打分,从而实现问题的分类量化,极大的减小了运算量,提高了沟通效率,使得访客能够快速获取问题的答案,用户体验更好;

(2)本发明综合考虑了问题的多种分类及各个类别所对应的属性值,同时还考虑不同类别的权重,利用所述分类信息、属性值、权重信息对问题进行打分,从而得到问题的综合分值,使得更加准确的查找到数据库中对应的推荐问题和推荐答案,从而能够更加准确的回答访客的问题。

附图说明

此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1为本发明一种智能客服的对话方法的交互过程示意图。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚、明白,以下结合附图及实施例对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。

如图1所示,本发明的一种智能客服的对话方法,其包括以下步骤:

10.获取大量的对话记录作为训练数据,并对所述对话记录进行提取问答对,每个问答对至少包括一个问题和一个对应的答案;

20.对所述问题进行分类,得到所述问题所属的类别,并对该类别中的所有问题的出现频率进行排序,根据排序的先后顺序进行计算得到所述问题在所述类别中的属性值,根据所述问题的类别及对应的属性值,进行创建打分函数模型;

30.利用所述打分函数模型对所述问题进行打分,得到所述问题的分值;

40.获取访客问题,利用所述打分函数模型对所述访客问题进行打分,得到所述访客问题的分值;

50.将所述访客问题的分值与数据库中的问题的分值进行比对分析,得到分值最接近的问题,作为推荐问题;

60.获取所述推荐问题的问答对中对应的答案,作为所述访客问题的推荐答案。

所述的步骤10中,每个问答对包括一个以上相似问题,各个相似问题对应一个相同的答案。

所述的步骤20中,对所述问题进行分类,包括以下类别:问题所属行业类别、访客所属地域类别、访客提问时间类别,以及访客所属群体类别、访客教育程度类别等等。

所述的步骤30或步骤40中,利用打分函数模型对问题进行打分,其计算方法如下:

Score=a x属性值1+b x属性值2+c x属性值3…+n x属性值N;

其中,Score为计算得到的问题的分值;1、2、3代表所述问题所属的类别;属性值1、属性值2、属性值3代表所述问题在所述类别中的属性值;a、b、c、n表示权重参数。

本发明的具体对话过程举例如下:

1.数据训练:

首先利用大量原始数据对打分函数模型进行训练,当有访客来访,并且和智能客服完成一次对话后,系统对其对话记录进行数据提取,作为训练数据;

2.问答对的提取:

对所有对话记录进行提取问答对,每个问答对至少包括一个问题和一个对应的答案,或者每个问答对包括一个以上的相似问题和一个共同的答案;

3.问题分类排序:

将所有问答对中的问题进行分类或者打标签操作,且在每一项类别中都对问题出现的频率进行排序。

例如:

按问题出现的总频率排序如下:Q1、Q2、Q3、Q4、Q5、Q6、Q7、Q8、……

分类1:按问题所属行业类别进行排序如下:

医药行业:Q1、Q2、Q3

餐饮行业:Q4、Q5、Q8

其它行业:Q6、Q7……

分类2:按访客所属地域类别进行排序如下:

北京:Q2、Q3、Q5

上海:Q4、Q6

其它:Q1、Q7、Q8……

分类3:按访客提问时间类别进行排序如下:

2016年8月:Q1、Q4、Q7

2016年7月:Q2、Q6

2016年6月:Q3、Q5、Q8……

分类4:按访客所属群体类别(年龄+性别)进行排序如下:

中年男性:Q2、Q5

老年男性:Q1、Q6

中年女性:Q3、Q7

其他群体:Q4、Q8……

分类5:按访访客教育程度类别进行排序如下:

本科以上:Q3

本科水平:Q2、Q5

大专水平:Q1、Q6、Q7

大专以下:Q4、Q8……

4.创建打分函数模型:

将所有问题进行分类排序后,每一个问题将会有一个分值:

Score=a x属性值1+b x属性值2+c x属性值3+d x属性值4+e x属性值5;

其中,Score为计算得到的问题的分值;1、2、3、4、5代表所述问题所属的类别;属性值1、属性值2、属性值3、属性值4、属性值5代表所述问题在所述类别中的属性值,即根据所述问题在问题所属行业类别、访客所属地域类别、访客提问时间类别,以及访客所属群体类别、访客教育程度类别中的排序的先后顺序所得到的关联度、地域性、时效性等属性的量化数值;a、b、c、d、e表示权重参数,通过大量训练实例,可以获得最优的a、b、c、d、e的参数组合。当这些参数确定后,机器学习系统完成学习,完成打分函数模型的创建,之后可利用这个打分函数模型对新问题进行打分。

5.与访客对话:

当有访客进行对话时,系统首先对访客问题利用所述打分函数模型计算分值,然后将数据库中分值最为接近的问题的答案反馈给访客。

例如一个北京的访客问:明天出门要穿什么衣服?

数据库中关于此问题有多个答案,如果只考虑问题的频率,则可能因为地域性季节差异或时效性原因造成答案脱离访客所期望的答案。但,如果根据本发明的打分函数模型计算后,综合了地域性、时效性等因素,智能客服将会给出一个同在北京的访客且是近期提出的相似问题的答案。

另外,本发明还提供一种智能客服的对话系统,其包括:

数据预处理模块,用于获取大量的对话记录作为训练数据,并对所述对话记录进行提取问答对,每个问答对至少包括一个问题和一个对应的答案;

打分函数模型创建模块,用于对所述问题进行分类,得到所述问题所属的类别,并对该类别中的所有问题的出现频率进行排序,根据排序的先后顺序进行计算得到所述问题在所述类别中的属性值,根据所述问题的类别及对应的属性值,进行创建打分函数模型;

分值输出模块,其利用所述打分函数模型对所述问题进行打分,得到所述问题的分值;并获取访客问题,利用所述打分函数模型对所述访客问题进行打分,得到所述访客问题的分值;

相似问题分析模块,其将所述访客问题的分值与数据库中的问题的分值进行比对分析,得到分值最接近的问题,作为推荐问题;

答案推荐模块,用于获取所述推荐问题的问答对中对应的答案,作为所述访客问题的推荐答案。

需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于系统实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。并且,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。另外,本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。

上述说明示出并描述了本发明的优选实施例,应当理解本发明并非局限于本文所披露的形式,不应看作是对其他实施例的排除,而可用于各种其他组合、修改和环境,并能够在本文发明构想范围内,通过上述教导或相关领域的技术或知识进行改动。而本领域人员所进行的改动和变化不脱离本发明的精神和范围,则都应在本发明所附权利要求的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1