基于人工智能的AI客服交互方法、装置、设备及介质与流程

文档序号:31051754发布日期:2022-08-06 07:40阅读:104来源:国知局
基于人工智能的AI客服交互方法、装置、设备及介质与流程
基于人工智能的ai客服交互方法、装置、设备及介质
技术领域
1.本技术涉及人工智能技术领域,尤其涉及一种基于人工智能的ai客服交互方法、装置、电子设备及存储介质。


背景技术:

2.随着智能ai外呼营销产品在市面上越来越普及,金融机构在电销场景下使用ai外呼的比例也与日俱增,智能ai具有的大规模知识处理技术、自然语言理解技术、知识管理技术、自动问答系统、推理技术等,并具有行业通用性,不仅为企业提供了细粒度知识管理技术,还为企业与海量用户之间的沟通建立了一种基于自然语言的快捷有效的技术手段,同时还能够为企业提供精细化管理所需的统计分析信息。
3.然而,统一的制式化交互流程难以平衡ai交互过程中的筛选精度与客户体验,企业难以有效的选取必要的问题,导致难以保证筛选精度的同时让交互流程尽量简洁以提升目标客户的留存率,从而降低了电话营销的营销效果。


技术实现要素:

4.鉴于以上内容,有必要提出一种基于人工智能的ai客服交互方法、装置、电子设备及存储介质,以解决如何提升电话营销的营销效果这一技术问题。
5.本技术提供一种基于人工智能的ai客服交互方法,所述方法包括:
6.在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集;
7.依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集;
8.基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集;
9.将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集;
10.基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。
11.如此,本技术通过预设的问题价值指标对电话营销中出现的问题进行量化评估以获取问题价值评分集,然后根据自定义阈值算法计算出相应的阈值来对电话营销中出现的问题进行筛选,从而可以保留高价值问题进行电话营销,有效提升了电话营销的营销效果和沟通效率。
12.在一些实施例中,所述在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集包括:
13.依据智能语音管理平台解析通话语音获取语音沟通文本,所述语音沟通文本包括问题文本和答案文本;
14.基于所述问题文本对所述答案文本进行分类以获取初始分类数据集;
15.依据数据降维算法对所述初始分类数据集进行降维以获取所述初始问答数据集。
16.如此,可以将沟通过程中客户针对同一问题的回答归于一类,便于后续过程在此
基础上根据回答对相应的问题进行评估,同时通过数据降维可以有效降低大量沟通数据的存储空间,提升沟通数据的处理效率。
17.在一些实施例中,所述问题价值指标包括客群占比指标和客群转化率指标,所述依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集包括:
18.依据文本相似度算法计算所述初始问答数据集中同一问题文本所对应的不同答案文本之间的文本相似度以获取答案语义度;
19.计算所述答案语义度的方差以作为客群占比指标;
20.对所述初始问答数据集中同一问题文本所对应的不同答案文本进行二分类以获取所述问题文本的转化成功答案集和转化失败答案集;
21.计算所述转化成功答案集和转化失败答案集的数据量比值以作为客群转化率指标;
22.基于所述客群占比指标和所述客群转化率指标评估所述初始问答数据集以获取所述问题价值评分集。
23.如此,根据预设的问题价值指标实现对电话营销中出现的问题进行量化评估从而获取问题价值评分集,有利于后续过程根据所述问题价值评分集筛选出更为有效的问题,从而提升营销效果。
24.在一些实施例中,所述问题价值评分集满足关系式:
[0025][0026]
其中,pi为所述问题价值评分集中第i个问题文本的价值评分,mi为第i个问题文本对应的所述客群占比指标,n
+i
为第i个问题文本对应的所述转化成功答案集中的数据量,n-i
为第i个问题文本对应的所述转化失败答案集中的数据量,ni为第i个问题文本对应的所述客群转化率指标,ni=max(n
+i
,n-i
)/min((n
+i
,n-i
)。
[0027]
如此,可以根据所述客群占比指标和所述客群转化率指标对电话营销中出现的每一个问题进行量化,更为准确的获得每一个问题所对应的价值评分。
[0028]
在一些实施例中,所述基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集包括:
[0029]
依据自定义阈值选择算法计算所述问题价值评分集以获取问题价值评分阈值;
[0030]
基于所述问题价值评分阈值筛选所述初始问答数据集以获取所述优选问题数据集。
[0031]
如此,通过自定义阈值选择算法可以获取更为准确合适的阈值对所述初始问答数据集进行筛选,从而提升获得的优选问题数据集的准确性。
[0032]
在一些实施例中,所述将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集包括:
[0033]
按照所述问题价值评分由大到小的顺序对所述优选问题数据集进行排序以获取优选问题排序集;
[0034]
将所述优选问题排序集中的语音沟通文本依次作为ai客服与客户进行交互的提问模板以获取实时沟通语音;
[0035]
基于所述智能语音管理平台解析所述实时沟通语音以获取沟通文本向量集;
[0036]
将所述沟通文本向量集输入预设的分类模型中以获取所述客户意向分类集。
[0037]
如此,可以在客服和客户进行沟通的过程中实时获取用户的意愿信息,进而对具有高意愿强度的客户进行正确筛选,实现高效率的精准营销。
[0038]
在一些实施例中,所述客户意向分类集包括高价值客户集和低价值客户集,所述基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程包括:
[0039]
基于所述客户意向分类集选择后续沟通模式以获取后续沟通数据集;
[0040]
基于所述后续沟通数据集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0041]
如此,可以根据每一次客服与客户之间的沟通数据实时更新所述初始问答数据集,对客服需要提问的问题进行动态评估,保证问题具有高价值,从而持续提升电话营销的效果。
[0042]
本技术实施例还提供一种基于人工智能的ai客服交互装置,所述装置包括:
[0043]
构建单元,用于在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集;
[0044]
评估单元,用于依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集;
[0045]
筛选单元,用于基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集;
[0046]
获取单元,用于将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集;
[0047]
更新单元,用于基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0048]
本技术实施例还提供一种电子设备,所述电子设备包括:
[0049]
存储器,存储至少一个指令;
[0050]
处理器,执行所述存储器中存储的指令以实现所述的基于人工智能的ai客服交互方法。
[0051]
本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现所述的基于人工智能的ai客服交互方法。
附图说明
[0052]
图1是本技术所涉及的基于人工智能的ai客服交互方法的较佳实施例的流程图。
[0053]
图2是本技术所涉及的在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集的较佳实施例的流程图。
[0054]
图3是本技术所涉及的依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集的较佳实施例的流程图。
[0055]
图4是本技术所涉及的将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集的较佳实施例的流程图。
[0056]
图5是本技术所涉及的基于人工智能的ai客服交互装置的较佳实施例的功能模块图。
[0057]
图6是本技术所涉及的基于人工智能的ai客服交互方法的较佳实施例的电子设备的结构示意图。
具体实施方式
[0058]
为了能够更清楚地理解本技术的目的、特征和优点,下面结合附图和具体实施例对本技术进行详细描述。需要说明的是,在不冲突的情况下,本技术的实施例及实施例中的特征可以相互结合。在下面的描述中阐述了很多具体细节以便于充分理解本技术,所述描述的实施例仅是本技术一部分实施例,而不是全部的实施例。
[0059]
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本技术的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0060]
除非另有定义,本文所使用的所有的技术和科学术语与属于本技术的技术领域的技术人员通常理解的含义相同。本文中在本技术的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本技术。本文所使用的术语“和/或”包括一个或多个相关的所列项目的任意的和所有的组合。
[0061]
本技术实施例提供一种基于人工智能的ai客服交互方法,可应用于一个或者多个电子设备中,电子设备是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字处理器(digital signal processor,dsp)、嵌入式设备等。
[0062]
电子设备可以是任何一种可与客户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant,pda)、游戏机、交互式网络电视(internet protocol television,iptv)、智能式穿戴式设备等。
[0063]
电子设备还可以包括网络设备和/或客户设备。其中,所述网络设备包括,但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(cloud computing)的由大量主机或网络服务器构成的云。
[0064]
电子设备所处的网络包括但不限于互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network,vpn)等。
[0065]
如图1所示,是本技术基于人工智能的ai客服交互方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
[0066]
s10,在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集。
[0067]
请参见图2,在一个可选的实施例中,所述在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集包括:
[0068]
s101,依据智能语音管理平台解析通话语音获取语音沟通文本,所述语音沟通文本包括问题文本和答案文本。
[0069]
在一个可选的实施例中,所述智能语音管理平台可使用enjoy talk的ai智能语音呼叫中心系统,通过ip-pbx将语音以网络rtp传输协议调用asr(automatic speech recognition)语音识别引擎进行解析,解析完成得到识别文本之后,通过tcp协议将识别文本回传ai智能语音管理平台进行分类存储从而作为所述语音沟通文本。
[0070]
该可选的实施例中,ip-pbx是一种基于ip的公司电话系统,该系统可以使所有通信畅通无阻,建立能够连接分布在全球各地办公地点和客服的统一话音和数据网络;本方案的asr电话语音识别模型通过网络连接,从公共网络资源中搜索可用的语音识别服务来将通话语音解析为语音沟通文本,将语音沟通文本回传到智能语音管理平台进行分类存储;通过借用外部可用资源的方式,不需要建立自身的语音识别系统,可以节省智能语音管理平台的构建成本。
[0071]
s102,基于所述问题文本对所述答案文本进行分类以获取初始分类数据集。
[0072]
该可选的实施例中,由于ai客服在与大量客户进行沟通的过程中,所询问的每一个问题都对应着不同客户的不同答案,因此将语音沟通文本回传到智能语音管理平台进行分类存储的具体过程为:基于所述问题文本对所述答案文本进行分类,即将每一个问题文本及其对应的不同答案数据归为一个类别,并将分类后的所有类别所包含的数据作为所述初始分类数据集。
[0073]
s103,依据数据降维算法对所述初始分类数据集进行降维以获取所述初始问答数据集。
[0074]
该可选的实施例中,由于ai客服在与大量客户进行沟通的过程中会对应产生大量的语音沟通文本,因此对得到的所述初始分类数据集进行降维处理,以减少每个问题文本所对应的答案文本的数量。其中,降维处理指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中,从而减少原始数据中包含的冗余信息以及噪音信息,提高原始数据的准确度并降低数据量。
[0075]
该可选的实施例中,所述数据降维算法可使用pca(principal component analysis)主成分分析法。pca的主要思想是将r维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有r维特征的基础上重新构造出来的k维特征。
[0076]
该可选的实施例中,pca的工作过程为从原始的空间中顺序的找一组相互正交的坐标轴,新的坐标轴的选择与所述初始分类数据集中的数据本身是密切相关的。其中,第一个新坐标轴选择是初始分类数据集中所有数据的方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大,第三个轴是与第1、2个轴正交的平面中方差最大的。以此类推,可以得到r个这样的坐标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎为0。于是,我们可以忽略余下的坐标轴,只保留前面k个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。
[0077]
示例性的,问题文本a虽然对应着10000个不同的答案文本数据,但是这10000个答案文本数据存在很多相同或相似的部分,而有一些答案文本数据本身是无意义的噪声或者不具备统计意义,因此通过pca降维处理,依据方差选取其中种类最大的前10种答案文本数据类别,其余的进行舍去,最终前10种答案文本数据类别所包含的答案文本数据共有9600
个。
[0078]
如此,可以将沟通过程中客户针对同一问题的回答归于一类,便于后续过程在此基础上根据回答对相应的问题进行评估,同时通过数据降维可以有效降低大量沟通数据的存储空间,提升沟通数据的处理效率。
[0079]
s11,依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集。
[0080]
该可选的实施例中,所述问题价值指标包括客群占比指标和客群转化率指标,所述客群占比指标用于表征同一问题文本的不同答案文本所对应的客户群体的差异程度,所述客群转化率指标用于表述同一问题文本的不同答案文本所对应的客户群体最终转化为有效客户的差异程度。
[0081]
请参见图3,在一个可选的实施例中,所述依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集包括:
[0082]
s111,依据文本相似度算法计算所述初始问答数据集中同一问题文本所对应的不同答案文本之间的文本相似度以获取答案语义度。
[0083]
该可选的实施例中,所述文本相似度算法可使用向量空间模型(vsm)算法,vsm将所述答案文本形式化为空间中的一个点,通过向量的形式给出,把对答案文本的处理简化为向量空间中向量的运算,降低了对所述答案文本进行相似度计算的复杂性。
[0084]
该可选的实施例中,针对同一问题文本的不同答案文本,依据vsm算法分别计算每一个答案文本与其余每一个答案文本之间对应向量的相似度作为文本相似度,并对每一个答案文本所获得的文本相似度进行均值计算,将每一个文本答案获得的文本相似度的平均值作为答案语义度。
[0085]
s112,计算所述答案语义度的方差以作为客群占比指标。
[0086]
该可选的实施例中,同一问题文本所对应的不同答案文本之间的差别越小越好,说明相应的问题文本能够较为稳定地获得对应的答案文本,因此本方案中对同一问题文本对应的所有答案文本的答案语义度进行方差计算,并将获得的方差结果作为所述问题文本的客群占比指标m。
[0087]
s113,对所述初始问答数据集中同一问题文本所对应的不同答案文本进行二分类以获取所述问题文本的转化成功答案集和转化失败答案集。
[0088]
该可选的实施例中,统计历史数据中客服与客户每一次进行沟通后的结果,若沟通后客户成功购买客服通过电话销售的产品,则说明客户转化成功,若沟通后客户未购买客服通过电话销售的产品,则说明客户未转化成功。
[0089]
该可选的实施例中,根据历史数据中客服与客户每一次进行沟通后的结果对所述初始问答数据集中同一问题文本所对应的不同答案文本进行二分类,其中,若客户转化成功,则将该客户对应的答案文本归于所述转化成功答案集,若客户未转化成功,则将该客户对应的答案文本归于所述转化失败答案集,其中每一个问题文本都对应一个转化成功答案集和一个转化失败答案集。
[0090]
s114,计算所述转化成功答案集和转化失败答案集的数据量比值以作为客群转化率指标。
[0091]
该可选的实施例中,设n
+
为所述转化成功答案集中的数据量,n-为所述转化失败答案集中的数据量,则计算n
+
和n-中较大值与较小值之间的比值,并将此比值作为所述客群转
化率指标n,即n=max(n
+
,n-)/min((n
+
,n-),其中n》1,n越大说明所述转化成功答案集和所述转化失败答案集之间的数据量差异越大。
[0092]
s115,基于所述客群占比指标和所述客群转化率指标评估所述初始问答数据集以获取所述问题价值评分集。
[0093]
该可选的实施例中,所述问题价值评分集满足关系式:
[0094][0095]
其中,pi为所述问题价值评分集中第i个问题文本的价值评分,mi为第i个问题文本对应的所述客群占比指标,n
+i
为第i个问题文本对应的所述转化成功答案集中的数据量,n-i
为第i个问题文本对应的所述转化失败答案集中的数据量,ni为第i个问题文本对应的所述客群转化率指标,ni=max(n
+i
,n-i
)/min((n
+i
,n-i
)。
[0096]
该可选实施例中,计算所述初始问答数据集中每一个问题文本的价值评分,并将所有的问题文本的价值评分作为所述问题价值评分集。
[0097]
如此,根据预设的问题价值指标实现对电话营销中出现的问题进行量化评估从而获取问题价值评分集,有利于后续过程根据所述问题价值评分集筛选出更为有效的问题,从而提升营销效果。
[0098]
s12,基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集。
[0099]
在一个可选的实施例中,所述基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集包括:
[0100]
s121,依据自定义阈值选择算法计算所述问题价值评分集以获取问题价值评分阈值。
[0101]
该可选的实施例中,所述自定义阈值选择算法计算所述问题价值评分集以获取问题价值评分阈值的过程为:
[0102]
首先计算所述问题价值评分集中所有问题文本的价值评分的平均值m,然后在所述问题价值评分集中任选一个价值评分t,则t可以将所述问题价值评分集分为两部分,设这两部分分别为a和b;
[0103]
分别计算a和b两部分所对应的价值评分的平均值,记为ma和mb,其中a部分所包括的问题文本的价值评分数量占所述问题价值评分集中价值评分总数量的比值记为pa,b部分所包括的问题文本的价值评分数量占所述问题价值评分集中价值评分总数量的比值记为pb;
[0104]
示例性的,现共有100个问题价值评分,对应的平均值m为60,任选一个价值评分t=55,其中在这100个问题价值评分中大于55的问题价值评分有30个,作为a部分,不大于55的问题价值评分有70个,作为b部分,a部分的30个问题价值评分的均值ma为70,b部分70个问题价值评分的均值mb为50,则pa=30/100=3/10,pb=70/100=7/10。
[0105]
则可根据关系式icv=pa*(ma-m)2+pb*(mb-m)2对t值进行遍历,计算在t取何值时类间方差icv的值最大,则此时所对应的t值即为所述问题价值评分阈值。
[0106]
s122,基于所述问题价值评分阈值筛选所述初始问答数据集以获取所述优选问题数据集。
[0107]
在一个可选的实施例中,若所述初始问答数据集中的问题文本所对应的价值评分
大于所述问题价值评分阈值,则将该问题文本作为优选问题,最终将所有的优选问题作为所述优选问题数据集。
[0108]
如此,通过自定义阈值选择算法可以获取更为准确合适的阈值对所述初始问答数据集进行筛选,从而提升获得的优选问题数据集的准确性。
[0109]
s13,将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集。
[0110]
请参见图4,在一个可选的实施例中,所述将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集包括:
[0111]
s131,按照所述问题价值评分由大到小的顺序对所述优选问题数据集进行排序以获取优选问题排序集。
[0112]
s132,将所述优选问题排序集中的语音沟通文本依次作为ai客服与客户进行交互的提问模板以获取实时沟通语音。
[0113]
s133,基于所述智能语音管理平台解析所述实时沟通语音以获取沟通文本向量集。
[0114]
该可选的实施例中,通过asr语音识别引擎对所述实时沟通语音进行解析,从而获得对应的字向量和词向量,将字向量和词向量按照所述实时沟通语音的发生时间顺序进行拼接,组成字词组合向量,并将所有的字词组合向量作为所述沟通文本向量集。
[0115]
s134,将所述沟通文本向量集输入预设的分类模型中以获取所述客户意向分类集。
[0116]
在一个可选的实施例中,将所述沟通文本向量集作为输入数据输入到预设的分类模型中,在不丢失词特征的基础上,降低由分词错误对意向识别导致的异常影响。本方案中所述分类模型可以为长短期记忆(lstm)模型,在lstm模型中每一个隐藏层状态中都融合了整个句子的信息,因此不仅将最后一个隐藏层状态作为模型输出向量进行分类,还能综合利用每个隐藏层状态的输出,对每个单词进行分类,得到每个单词的意向分类结果,并最终通过投票确定整个句子的意向分类,从而获知每一次沟通时客户的意向分类,本方案中将客服与所有客户进行电话沟通时所获得的客户意向分类作为所述客户意向分类集,所述客户意向分类集包括高价值客户集和低价值客户集。
[0117]
如此,可以在客服和客户进行沟通的过程中实时获取用户的意愿信息,进而对具有高意愿强度的客户进行正确筛选,实现高效率的精准营销。
[0118]
s14,基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0119]
在一个可选的实施例中,所述基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程包括:
[0120]
s141,基于所述客户意向分类集选择后续沟通模式以获取后续沟通数据集。
[0121]
该可选的实施例中,针对所述客户意向分类集中的不同客户意向类别选择不同的后续沟通模式进行沟通。其中,对于高价值客户集中的客户,可以由所述智能语音管理平台自动发送营销短信来告知客户,并由人工客服进行二次的高效精准电话营销跟进;对于低价值客户集中的客户,则根据预设周期再次进行呼叫以进行电话销售工作,所述预设周期
可以为一个月。
[0122]
该可选的实施例中,将根据不同后续沟通模式所产生的语音内容通过asr语音识别引擎解析为文本数据以构建所述后续沟通数据集。
[0123]
s142,基于所述后续沟通数据集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0124]
在一个可选的实施例中,根据所述后续沟通数据集中各问题文本所对应的不同答案文本对所述交互模板进行补充,从而可以实现对所述初始问题数据集的动态更新,保证后续评分筛选的准确性,使ai客服根据更新后的问答数据集进行精准营销,进一步提升营销效果。
[0125]
如此,可以根据每一次客服与客户之间的沟通数据实时更新所述初始问答数据集,对客服需要提问的问题进行动态评估,保证问题具有高价值,从而持续提升电话营销的效果。
[0126]
请参见图5,图5是本技术基于人工智能的ai客服交互装置的较佳实施例的功能模块图。基于人工智能的ai客服交互装置11包括构建单元110、评估单元111、筛选单元112、获取单元113、更新单元114。本技术所称的模块/单元是指一种能够被处理器13所执行,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
[0127]
在一个可选的实施例中,构建单元110用于在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集。
[0128]
在一个可选的实施例中,所述在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集包括:
[0129]
依据智能语音管理平台解析通话语音获取语音沟通文本,所述语音沟通文本包括问题文本和答案文本;
[0130]
基于所述问题文本对所述答案文本进行分类以获取初始分类数据集;
[0131]
依据数据降维算法对所述初始分类数据集进行降维以获取所述初始问答数据集。
[0132]
在一个可选的实施例中,所述智能语音管理平台可使用enjoy talk的ai智能语音呼叫中心系统,通过ip-pbx将语音以网络rtp传输协议调用asr(automatic speech recognition)语音识别引擎进行解析,解析完成得到识别文本之后,通过tcp协议将识别文本回传ai智能语音管理平台进行分类存储从而作为所述语音沟通文本。
[0133]
该可选的实施例中,ip-pbx是一种基于ip的公司电话系统,该系统可以使所有通信畅通无阻,建立能够连接分布在全球各地办公地点和客服的统一话音和数据网络;本方案的asr电话语音识别模型通过网络连接,从公共网络资源中搜索可用的语音识别服务来将通话语音解析为语音沟通文本,将语音沟通文本回传到智能语音管理平台进行分类存储;通过借用外部可用资源的方式,不需要建立自身的语音识别系统,可以节省智能语音管理平台的构建成本。
[0134]
该可选的实施例中,由于ai客服在与大量客户进行沟通的过程中,所询问的每一个问题都对应着不同客户的不同答案,因此将语音沟通文本回传到智能语音管理平台进行分类存储的具体过程为:基于所述问题文本对所述答案文本进行分类,即将每一个问题文本及其对应的不同答案数据归为一个类别,并将分类后的所有类别所包含的数据作为所述
初始分类数据集。
[0135]
该可选的实施例中,由于ai客服在与大量客户进行沟通的过程中会对应产生大量的语音沟通文本,因此对得到的所述初始分类数据集进行降维处理,以减少每个问题文本所对应的答案文本的数量。其中,降维处理指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中,从而减少原始数据中包含的冗余信息以及噪音信息,提高原始数据的准确度并降低数据量。
[0136]
该可选的实施例中,所述数据降维算法可使用pca(principal component analysis)主成分分析法。pca的主要思想是将r维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有r维特征的基础上重新构造出来的k维特征。
[0137]
该可选的实施例中,pca的工作过程为从原始的空间中顺序的找一组相互正交的坐标轴,新的坐标轴的选择与所述初始分类数据集中的数据本身是密切相关的。其中,第一个新坐标轴选择是初始分类数据集中所有数据的方差最大的方向,第二个新坐标轴选取是与第一个坐标轴正交的平面中使得方差最大,第三个轴是与第1、2个轴正交的平面中方差最大的。以此类推,可以得到r个这样的坐标轴。通过这种方式获得的新的坐标轴,我们发现,大部分方差都包含在前面k个坐标轴中,后面的坐标轴所含的方差几乎为0。于是,我们可以忽略余下的坐标轴,只保留前面k个含有绝大部分方差的坐标轴。事实上,这相当于只保留包含绝大部分方差的维度特征,而忽略包含方差几乎为0的特征维度,实现对数据特征的降维处理。
[0138]
示例性的,问题文本a虽然对应着10000个不同的答案文本数据,但是这10000个答案文本数据存在很多相同或相似的部分,而有一些答案文本数据本身是无意义的噪声或者不具备统计意义,因此通过pca降维处理,依据方差选取其中种类最大的前10种答案文本数据类别,其余的进行舍去,最终前10种答案文本数据类别所包含的答案文本数据共有9600个。
[0139]
在一个可选的实施例中,评估单元111用于依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集。
[0140]
在一个可选的实施例中,所述问题价值指标包括客群占比指标和客群转化率指标,所述依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集包括:
[0141]
依据文本相似度算法计算所述初始问答数据集中同一问题文本所对应的不同答案文本之间的文本相似度以获取答案语义度;
[0142]
计算所述答案语义度的方差以作为客群占比指标;
[0143]
对所述初始问答数据集中同一问题文本所对应的不同答案文本进行二分类以获取所述问题文本的转化成功答案集和转化失败答案集;
[0144]
计算所述转化成功答案集和转化失败答案集的数据量比值以作为客群转化率指标;
[0145]
基于所述客群占比指标和所述客群转化率指标评估所述初始问答数据集以获取所述问题价值评分集。
[0146]
该可选的实施例中,所述问题价值指标包括客群占比指标和客群转化率指标,所述客群占比指标用于表征同一问题文本的不同答案文本所对应的客户群体的差异程度,所述客群转化率指标用于表述同一问题文本的不同答案文本所对应的客户群体最终转化为
有效客户的差异程度。
[0147]
该可选的实施例中,所述文本相似度算法可使用向量空间模型(vsm)算法,vsm将所述答案文本形式化为空间中的一个点,通过向量的形式给出,把对答案文本的处理简化为向量空间中向量的运算,降低了对所述答案文本进行相似度计算的复杂性。
[0148]
该可选的实施例中,针对同一问题文本的不同答案文本,依据vsm算法分别计算每一个答案文本与其余每一个答案文本之间对应向量的相似度作为文本相似度,并对每一个答案文本所获得的文本相似度进行均值计算,将每一个文本答案获得的文本相似度的平均值作为答案语义度。
[0149]
该可选的实施例中,同一问题文本所对应的不同答案文本之间的差别越小越好,说明相应的问题文本能够较为稳定地获得对应的答案文本,因此本方案中对同一问题文本对应的所有答案文本的答案语义度进行方差计算,并将获得的方差结果作为所述问题文本的客群占比指标m。
[0150]
该可选的实施例中,统计历史数据中客服与客户每一次进行沟通后的结果,若沟通后客户成功购买客服通过电话销售的产品,则说明客户转化成功,若沟通后客户未购买客服通过电话销售的产品,则说明客户未转化成功。
[0151]
该可选的实施例中,根据历史数据中客服与客户每一次进行沟通后的结果对所述初始问答数据集中同一问题文本所对应的不同答案文本进行二分类,其中,若客户转化成功,则将该客户对应的答案文本归于所述转化成功答案集,若客户未转化成功,则将该客户对应的答案文本归于所述转化失败答案集,其中每一个问题文本都对应一个转化成功答案集和一个转化失败答案集。
[0152]
该可选的实施例中,设n
+
为所述转化成功答案集中的数据量,n-为所述转化失败答案集中的数据量,则计算n
+
和n-中较大值与较小值之间的比值,并将此比值作为所述客群转化率指标n,即n=max(n
+
,n-)/min((n
+
,n-)。
[0153]
集以获取所述问题价值评分集。
[0154]
该可选的实施例中,所述问题价值评分集满足关系式:
[0155][0156]
其中,pi为所述问题价值评分集中第i个问题文本的价值评分,mi为第i个问题文本对应的所述客群占比指标,n
+i
为第i个问题文本对应的所述转化成功答案集中的数据量,n-i
为第i个问题文本对应的所述转化失败答案集中的数据量,ni为第i个问题文本对应的所述客群转化率指标,ni=max(n
+i
,n-i
)/min((n
+i
,n-i
)。
[0157]
该可选实施例中,计算所述初始问答数据集中每一个问题文本的价值评分,并将所有的问题文本的价值评分作为所述问题价值评分集。
[0158]
在一个可选的实施例中,筛选单元112用于基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集。
[0159]
在一个可选的实施例中,所述基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集包括:
[0160]
依据自定义阈值选择算法计算所述问题价值评分集以获取问题价值评分阈值;
[0161]
基于所述问题价值评分阈值筛选所述初始问答数据集以获取所述优选问题数据
集。
[0162]
该可选的实施例中,所述自定义阈值选择算法计算所述问题价值评分集以获取问题价值评分阈值的过程为:
[0163]
首先计算所述问题价值评分集中所有问题文本的价值评分的平均值m,然后在所述问题价值评分集中任选一个价值评分t,则t可以将所述问题价值评分集分为两部分,设这两部分分别为a和b;
[0164]
分别计算a和b两部分所对应的价值评分的平均值,记为ma和mb,其中a部分所包括的问题文本的价值评分数量占所述问题价值评分集中价值评分总数量的比值记为pa,b部分所包括的问题文本的价值评分数量占所述问题价值评分集中价值评分总数量的比值记为pb;
[0165]
示例性的,现共有100个问题价值评分,对应的平均值m为60,任选一个价值评分t=55,其中在这100个问题价值评分中大于55的问题价值评分有30个,作为a部分,不大于55的问题价值评分有70个,作为b部分,a部分的30个问题价值评分的均值ma为70,b部分70个问题价值评分的均值mb为50,则pa=30/100=3/10,pb=70/100=7/10。
[0166]
则可根据关系式icv=pa*(ma-m)2+pb*(mb-m)2对t值进行遍历,计算在t取何值时类间方差icv的值最大,则此时所对应的t值即为所述问题价值评分阈值。
[0167]
在一个可选的实施例中,若所述初始问答数据集中的问题文本所对应的价值评分大于所述问题价值评分阈值,则将该问题文本作为优选问题,最终将所有的优选问题作为所述优选问题数据集。
[0168]
在一个可选的实施例中,获取单元113用于将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集。
[0169]
在一个可选的实施例中,所述将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集包括:
[0170]
按照所述问题价值评分由大到小的顺序对所述优选问题数据集进行排序以获取优选问题排序集;
[0171]
将所述优选问题排序集中的语音沟通文本依次作为ai客服与客户进行交互的提问模板以获取实时沟通语音;
[0172]
基于所述智能语音管理平台解析所述实时沟通语音以获取沟通文本向量集;
[0173]
将所述沟通文本向量集输入预设的分类模型中以获取所述客户意向分类集。
[0174]
该可选的实施例中,通过asr语音识别引擎对所述实时沟通语音进行解析,从而获得对应的字向量和词向量,将字向量和词向量按照所述实时沟通语音的发生时间顺序进行拼接,组成字词组合向量,并将所有的字词组合向量作为所述沟通文本向量集。
[0175]
在一个可选的实施例中,将所述沟通文本向量集作为输入数据输入到预设的分类模型中,在不丢失词特征的基础上,降低由分词错误对意向识别导致的异常影响。本方案中所述分类模型可以为长短期记忆(lstm)模型,在lstm模型中每一个隐藏层状态中都融合了整个句子的信息,因此不仅将最后一个隐藏层状态作为模型输出向量进行分类,还能综合利用每个隐藏层状态的输出,对每个单词进行分类,得到每个单词的意向分类结果,并最终
通过投票确定整个句子的意向分类,从而获知每一次沟通时客户的意向分类,本方案中将客服与所有客户进行电话沟通时所获得的客户意向分类作为所述客户意向分类集,所述客户意向分类集包括高价值客户集和低价值客户集。
[0176]
在一个可选的实施例中,更新单元114用于基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0177]
在一个可选的实施例中,所述客户意向分类集包括高价值客户集和低价值客户集,所述基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程包括:
[0178]
基于所述客户意向分类集选择后续沟通模式以获取后续沟通数据集;
[0179]
基于所述后续沟通数据集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0180]
该可选的实施例中,针对所述客户意向分类集中的不同客户意向类别选择不同的后续沟通模式进行沟通。其中,对于高价值客户集中的客户,可以由所述智能语音管理平台自动发送营销短信来告知客户,并由人工客服进行二次的高效精准电话营销跟进;对于低价值客户集中的客户,则根据预设周期再次进行呼叫以进行电话销售工作,所述预设周期可以为一个月。
[0181]
该可选的实施例中,将根据不同后续沟通模式所产生的语音内容通过asr语音识别引擎解析为文本数据以构建所述后续沟通数据集。
[0182]
在一个可选的实施例中,根据所述后续沟通数据集中各问题文本所对应的不同答案文本对所述交互模板进行补充,从而可以实现对所述初始问题数据集的动态更新,保证后续评分筛选的准确性,使ai客服根据更新后的问答数据集进行精准营销,进一步提升营销效果。
[0183]
由以上技术方案可以看出,本技术能够通过预设的问题价值指标对电话营销中出现的问题进行量化评估以获取问题价值评分集,然后根据自定义阈值算法计算出相应的阈值来对电话营销中出现的问题进行筛选,从而可以保留高价值问题进行电话营销,有效提升了电话营销的营销效果和沟通效率。
[0184]
请参见图6,是本技术实施例提供的一种电子设备的结构示意图。电子设备1包括存储器12和处理器13。存储器12用于存储计算机可读指令,处理器13用执行所述储器中存储的计算机可读指令以实现上述任一实施例所述的基于人工智能的ai客服交互方法。
[0185]
在一个可选的实施例中,电子设备1还包括总线、存储在所述存储器12中并可在所述处理器13上运行的计算机程序,例如基于人工智能的ai客服交互程序。
[0186]
图6仅示出了具有存储器12和处理器13的电子设备1,本领域技术人员可以理解的是,图6示出的结构并不构成对电子设备1的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
[0187]
结合图1,电子设备1中的所述存储器12存储多个计算机可读指令以实现一种基于人工智能的ai客服交互方法,所述处理器13可执行所述多个指令从而实现:
[0188]
在预设的智能语音管理平台数据库中调取语音沟通文本以构建初始问答数据集;
[0189]
依据预设的问题价值指标评估所述初始问答数据集以获取问题价值评分集;
[0190]
基于所述问题价值评分集筛选所述初始问答数据集以获取优选问题数据集;
[0191]
将所述优选问题数据集中的语音沟通文本作为ai客服与客户进行交互的提问模板,并根据ai客服与客户的交互结果获取客户意向分类集;
[0192]
基于所述客户意向分类集对所述提问模板进行更新以优化ai客服与客户的交互过程。
[0193]
具体地,所述处理器13对上述指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
[0194]
本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,电子设备1可以是总线型结构,也可以是星形结构,电子设备1还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置,例如电子设备1还可以包括输入输出设备、网络接入设备等。
[0195]
需要说明的是,电子设备1仅为举例,其他现有的或今后可能出现的电子产品如可适应于本技术,也应包含在本技术的保护范围以内,并以引用方式包含于此。
[0196]
其中,存储器12至少包括一种类型的可读存储介质,所述可读存储介质可以是非易失性的,也可以是易失性的。所述可读存储介质包括闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。存储器12在一些实施例中可以是电子设备1的内部存储单元,例如该电子设备1的移动硬盘。存储器12在另一些实施例中也可以是电子设备1的外部存储设备,例如电子设备1上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。存储器12不仅可以用于存储安装于电子设备1的应用软件及各类数据,例如基于人工智能的ai客服交互程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
[0197]
处理器13在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。处理器13是电子设备1的控制核心(control unit),利用各种接口和线路连接整个电子设备1的各个部件,通过运行或执行存储在所述存储器12内的程序或者模块(例如执行基于人工智能的ai客服交互程序等),以及调用存储在所述存储器12内的数据,以执行电子设备1的各种功能和处理数据。
[0198]
所述处理器13执行所述电子设备1的操作系统以及安装的各类应用程序。所述处理器13执行所述应用程序以实现上述各个基于人工智能的ai客服交互方法实施例中的步骤,例如图1至图4所示的步骤。
[0199]
示例性的,所述计算机程序可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本技术。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该指令段用于描述所述计算机程序在电子设备1中的执行过程。例如,所述计算机程序可以被分割成构建单元110、评估单元111、筛选单元112、获取单元113、更新单元114。
[0200]
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、计算机设备,或者网络设备等)或处理器(processor)执行本技术各个实施例所述的基于人工智能的ai客服交互方法的部分。
[0201]
电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指示相关的硬件设备来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。
[0202]
其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存储器及其他存储器等。
[0203]
进一步地,计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
[0204]
本技术所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
[0205]
总线可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。为便于表示,在图6中仅用一根箭头表示,但并不表示仅有一根总线或一种类型的总线。所述总线被设置为实现所述存储器12以及至少一个处理器13等之间的连接通信。
[0206]
本技术实施例还提供一种计算机可读存储介质(图未示),计算机可读存储介质中存储有计算机可读指令,计算机可读指令被电子设备中的处理器执行以实现上述任一实施例所述的基于人工智能的ai客服交互方法。
[0207]
在本技术所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0208]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0209]
另外,在本技术各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
[0210]
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。说明书陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
[0211]
最后应说明的是,以上实施例仅用以说明本技术的技术方案而非限制,尽管参照
较佳实施例对本技术进行了详细说明,本领域的普通技术人员应当理解,可以对本技术的技术方案进行修改或等同替换,而不脱离本技术技术方案的精神和范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1