一种语音交互方法、装置以及相关设备与流程

文档序号:18643034发布日期:2019-09-11 23:47阅读:155来源:国知局
一种语音交互方法、装置以及相关设备与流程

本公开涉及人工智能和语音交互领域,尤其涉及一种语音交互方法和装置、相关设备以及存储介质。



背景技术:

随着人工智能的迅猛发展,语音交互已经逐渐用到了各行各业中,如智能导航系统、智能客服系统、以及机器人领域等等。在传统的人工催收客服系统中,催收的效率会受到催收人员的情绪,状态等个人因素的影响,通过语音交互技术构建智能催收系统可以解决人工客服个人因素导致的催收不成功。但是在智能催收客服系统中,在对客户语音解析的过程中,不能准确地解析出客户语音的正确含义,语音解析的准确率有待提高。



技术实现要素:

本公开实施例提供一种语音交互技术。

第一方面,公开了一种语音交互方法,包括:

建立客户的用户画像,根据所述用户画像确定所述客户的分类;

基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;

将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;

利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

在一种可能的实现方式中,所述建立客户的用户画像,根据所述用户画像确定所述客户的分类,包括:

获取客户数据并对所述客户数据进行分析,根据分析结果建立每个客户的用户画像;

根据所述用户画像确定所述客户的分类。

在一种可能的实现方式中,所述基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话,包括:

根据客户的分类,制定跟客户进行语音通话的时间以及频率的催收策略,按照所述催收策略与客户进行语音通话。

在一种可能的实现方式中,所述将所述语音通话时接收到的客户语音转换为文本信息后生成词向量,包括:

根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;

基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。

在一种可能的实现方式中,所述利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果,包括:

构建长短时记忆网络,在长短时记忆网络中引入注意力机制;

利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。

在一种可能的实现方式中,所述利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果之后,包括:

根据所述客户语音的解析结果给出对话应答文本。

在一种可能的实现方式中,所述根据所述客户语音的解析结果给出对话应答文本,包括:

将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的对话类型标签进行匹配,基于匹配结果输出对话应答文本;其中,所述对话管理模型中的每一种类型的对话设置对话类型标签。

在一种可能的实现方式中,所述将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的对话类型标签进行匹配,基于匹配结果输出对话应答文本;其中,所述对话管理模型中的每一种类型的对话设置对话类型标签,包括:

将所述解析结果输入到对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,得到所述解析结果与每个所述设置标签的匹配概率;

选择匹配概率大的设置标签下的对话模式来输出对话应答文本。

在一种可能的实现方式中,根据所述客户的分类,选择对话应答文本。

在一种可能的实现方式中,标记所述对话管理模型对话的结果,并将所述对话以及结果保存,其中,所述对话的结果包括催收成功和催收失败、以及待还款、延迟还款。

在一种可能的实现方式中,根据所述对话管理模型标记对话的结果,调整所述催收策略。

第二方面,公开了一种语音交互装置,包括:

建立单元,用于建立客户的用户画像,根据所述用户画像确定所述客户的分类;

制定单元,用于基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;

转换单元,用于将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;

解析单元,利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

可选地,所述建立单元,还用于:

获取客户数据并对所述客户数据进行分析,根据分析结果建立每个客户的用户画像;

根据所述用户画像确定所述客户的分类。

可选地,所述制定单元,还用于:

根据客户的分类,制定跟客户进行语音通话的时间以及频率的催收策略,按照所述催收策略与客户进行语音通话。

可选地,所述转换单元,还用于:

根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;

基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。

可选地,所述解析单元,还用于:

构建长短时记忆网络,在长短时记忆网络中引入注意力机制;

利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。

可选地,所述装置,还用于:

根据所述客户语音的解析结果给出对话应答文本。

可选地,所述装置,还用于:

将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的对话类型标签进行匹配,基于匹配结果输出对话应答文本;其中,所述对话管理模型中的每一种类型的对话设置对话类型标签。

可选地,所述装置,还用于:

将所述解析结果输入到对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,得到所述解析结果与每个所述设置标签的匹配概率;

选择匹配概率大的设置标签下的对话模式来输出对话应答文本。

可选地,所述装置,还用于:

根据所述客户的分类,选择对话应答文本。

可选地,所述装置,还用于:

标记所述对话管理模型对话的结果,并将所述对话以及结果保存,其中,所述对话的结果包括催收成功和催收失败、以及待还款、延迟还款。

第三方面,公开了一种语音交互设备,包括处理器和存储器,其中,所述存储器用于存储计算机程序代码,所述处理器被配置用于调用所述计算机程序代码,执行如上述第一方面或第一方面的任意可能的实现方式中的方法。

第四方面,公开了一种计算机可读存储介质,所述计算机存储介质存储有计算机可读指令,所述指令被处理器调用时,所述处理器执行如上述第一方面或第一方面的任意可能的实现方式中的方法。

在本公开实施例中,可以建立客户的用户画像,根据所述用户画像确定所述客户的分类;基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。这样可以针对每个客户群体制定催收策略,通过客户的用户画像了解客户的说话习惯、以及进行催收的合适时间段,从而使催收能够更顺利,更高效。根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。根据每一个客户的说话习惯来进行分词,能够更准确的分词。构建长短时记忆网络,在长短时记忆网络中引入注意力机制;利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。利用注意力机制增强对关键词的关注度,减弱不重要词的关注度,从而提高语义解析准确率,利用加入了双向长短时记忆单元的神经网络来进行语义解析避免了需要人工设计特征,提高了语义解析的效率。

附图说明

为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。

其中:

图1是本公开实施例应用的语音交互系统架构示意图;

图2是本公开实施例提供的语音交互系统示意图;

图3是本公开实施例提供的语音交互方法的流程示意图;

图4是本公开实施例提供的基于at-blstm的语音交互的流程示意图;

图5是本公开实施例提供的语音交互装置的结构示意图;

图6是本公开实施例提供的语音交互设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。

还应当理解,在此本公开说明书中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本公开。

还应当进一步理解,在本公开说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。

具体实现中,本公开实施例中描述的技术方案可由手机、台式电脑、膝上计算机、可穿戴设备等具备语音处理功能的终端设备或服务器或系统实现,此处不作限定。为了便于理解,下文将语音交互方法的执行主体称为语音交互装置。

本公开实施例提供一种语音交互方法,包括:建立客户的用户画像,根据所述用户画像确定所述客户的分类;基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

本公开实施例还提供相应的语音交互装置、计算机可读存储介质和计算机程序产品。以下分别进行详细描述。

下面对本公开实施例适用的语音交互系统架构进行描述。参阅图1,图1是本公开实施例提供的技术方案的应用系统示例的架构示意图。如图1所示,语音交互系统可以包括一个或多个服务器以及多个终端设备,其中:

服务器与终端设备可以通过互联网进行通信。具体地,终端设备设置有语音采集器(如麦克风、麦克风阵列等等),终端设备通过语音采集器采集语音,并向服务器发送采集到的语音,或者也可以对语音进行进一步处理,例如特征提取等,并将处理结果发送至服务器。服务器接收到终端设备发送的语音或者语音的处理结果之后,可以基于接收到的信息进行语音交互,并将语音交互结果或基于语音交互结果得到的进一步处理结果或操作指令发送到终端设备。

服务器可以包括但不限于后台服务器、组件服务器、语音交互系统服务器或语音交互软件服务器等,服务器将语音交互结果发送到终端。终端设备可以安装并运行有相关的客户端(client)(例如语音交互客户端等)。客户端(client)是指与服务器相对应并为用户提供本地服务的程序。这里,该本地服务可包括但不限于:采集语音,提供数据采集界面、语音处理结果显示界面、语音交互结果显示界面等等。

具体的,客户端可包括:本地运行的应用程序、运行于网络浏览器上的功能(又称为webapp)等。对于客户端,服务器上需要运行有相应的服务器端程序来提供相应的语音处理、语音特征提取、语音交互、基于语音交互的智能催收等一种或多种功能。

本公开实施例中的终端设备可以包括但不限于任何一种基于智能操作系统的电子产品,其可与用户通过键盘、虚拟键盘、触摸板、触摸屏以及声控设备等输入设备来进行人机交互,诸如智能手机、平板电脑、个人电脑等。其中,智能操作系统包括但不限于任何通过向移动设备提供各种移动应用来丰富设备功能的操作系统,诸如安卓(android)、iostm、windowsphone等。

需要说明的是,本公开实施例应用的语音交互系统的架构不限于图1所示的例子。

下面结合图2对本公开实施例提供的语音交互系统进行描述,图2中示出的语音交互系统包括:数据分析模块、通话模块、语音交互模块、对话管理模块;其中,

数据分析模块,用于获取客户数据并对所述客户数据进行分析,根据分析结果建立每个客户的用户画像,从而对客户进行分类和制定催收策略;

通话模块,用于根据所述催收策略与客户进行语音通话;

语音交互模块,用于利用语音交互技术解析与客户进行语音通话时接收到的客户语音,得到客户语音的解析结果;

对话管理模块,用于根据客户语音的解析结果给出对话应答文本。

数据分析模块根据指定的催收策略来触发通话模块按照催收策略与客户进行语音通话;拨号模块与客户通信连接后,便由语音交互模块与客户进行语音交互,并解析接收到客户语音的含义;解析之后把解析结果传送给对话管理模块来给出对话应答文本与应答客户的语音。

数据分析模块还可以将建立每个客户的用户画像传送来给对话管理模块,从而可以根据客户的用户画像知悉的客户个人信息来选择对话模式,从而可以确定更加准确的对话应答文本。对话管理模块也会将对话结果传送给数据分析模块,数据分析模块根据对话结果来调整制定的催收策略。

下面将结合图3对本公开实施例提供的语音交互方法进行描述。

s101、建立客户的用户画像,根据所述用户画像确定所述客户的分类。

具体地,建立客户关于客户详细信息的用户画像,如描述客户的年龄、性格、职业、收入、贷款原因、方便语音通信的时间、还款日期等等信息的用户画像,然后根据每个客户用户画像,选取某一些用户画像中的代表信息作为划分标准,将所有用户画像中具有这些代表信息的客户分为一类。

可选地,获取客户数据并对所述客户数据进行分析,根据分析结果建立每个客户的用户画像;根据所述用户画像确定所述客户的分类。通过客户贷款时所填的资料或者其他途径(如利用网络爬虫爬取客户上网资料)对客户的了解来建立客户的用户画像,客户的用户画像用来描述客户的年龄、性格、职业、收入、贷款原因、方便语音通信的时间、还款日期等等信息,通过用户画像中的年龄、性格、职业、收入、方便语音通信的时间、还款日期等等信息中的一项或其组合来对客户进行分类。例如,将相同年龄和相同性格的客户分为一类,或者将相同职业和相同性格的客户分为一类,或者将相同年龄、相同收入、相同贷款原因的客户分为一类,等等,此处不做限定。

s102、基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话。

具体地,根据客户的分类,来制定催收策略,举例来说,如果客户的分类是属于互联网行业,25岁等,那么根据职业和年龄分析出这个客户的生活习惯应该是晚上更容易或是有时间进行语音通话。那么制定的催收策略中就是选择晚上的时间段来与该客户进行语音通话,并按照制定的催收策略来与客户进行语音通话。例如,催收策略是从xx月xx日开始与a客户进行语音通话,a客户方便通话时间段为17:00-19:00之间,那么通话系统就设置为在xx月xx日的17:00-19:00呼叫a客户,与a客户进行语音通话。

在一种可能的实现方式中,所述基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话,包括:根据客户的分类,制定跟客户进行语音通话的时间以及频率的催收策略,按照所述催收策略与客户进行语音通话。根据催收策略来对客户进行催收能够提高催收成功率。

s103、将所述语音通话时接收到的客户语音转换为文本信息后生成词向量。

具体地,当获取到对话语句之后,先将对话语句从语音信息转换为文本信息,然后利用分词算法将文本信息分成n个词语后再解析,如将“我爱中国”按照分词算法可以分成“我”、“爱”、“中国”或者“我爱”、“中国”等词,按照分词算法的不同,同一个文本分词的结果不同,此处不做限定。目前有三大主流分词算法:基于字符串匹配的分词算法、基于理解的分词算法和基于统计的分词算法。最后将分成的每一个词语都转换成词向量的形式,从而每个文本对话语句也可以表示为一个多维矩阵。

在一种可能的实现方式中,所述将所述客户语音转换为文本信息后生成词向量,包括:根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。词典中包含客户群体的特定词语,可以将催收对话中文本信息更准确的进行分词。所述词典可以是根据大量催收场景种的对话构建的词典,也可以是利用科大讯飞、百度等等公司开放的词典中加入催收场景中的出现频率较高的词语等等,此处不做限定。举例来说,所划分的这个群体喜欢将大方的人称为“局气”的人,那么“局气”这个词加入到词典能够更准确的来将这个客户群体的语音对话划分为词语,并用词向量表示。

在一种可能的实现方式中,所述基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量,包括:将所述文本信息与所述词典中的词语进行相似度计算,根据相似度计算结果对所述客户语音转换后的文本信息进行分词后生成词向量。这样能够更准确的进行分词。

在一种可能的实现方式中,所述将所述文本信息与所述词典中的词语进行相似度计算,根据相似度计算结果对所述客户语音转换后的文本信息进行分词后生成词向量,包括:将所述文本信息与所述词典中的词语进行相似度计算,得到n个大于相似度阈值的相似度值;根据n个大于相似度阈值的相似度值对应的词语,将所述文本信息分成n个词语。一般地,计算出来的相似度值的范围为0-1,相似度值越靠近1,说明两个词的就越相似。相似度阈值可以0.8、0.9、0.95等等任何一个靠近1的值,当文本信息的若干个相邻的文字与词典中的某一个词语的相似度值大于相似度阈值,那么就将这若干个相邻的文字划分为一个词语。设置相似度阈值可以使得划分的词语更为准确,从而使得语义解析更为准确。

在一种可能的实现方式中,所述将所述文本信息与所述词典中的词语进行相似度计算,得到n个大于相似度阈值的相似度值;根据n个大于相似度阈值的相似度值对应的词语,将所述文本信息分成n个词语,包括:若文本中的文字a与前面相邻的字组成的词语以及与后面相邻的字组成的词跟词典中的词的相似度值均大于相似阈值,选择相似度值大的词语组合作为分词结果。这样可以避免文本信息中的某个字和前后相邻的文字均能组成词语而导致分词不准确。

s104、利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

利用所述长短时记忆网络解析所述词向量,得到解析结果。传统的神经网络只能单向输入序列数据(如词向量),既无法用到未来的信息;加入长短时记忆单元的神经网络在处理当前时刻数据时可以利用到整个序列上下文信息,并且可以传统的rnn循环神经网络层数过多时导致参数训练梯度消失的问题。

在一种可能的实现方式中,所述利用所述长短时记忆网络来解析所述词向量,得到解析结果,包括:构建长短时记忆网络,在长短时记忆网络中引入注意力机制;利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。利用注意力机制计算注意力概率,注意力概率可以突出特定的单词对于整个句子的重要程度,引入注意力机制考虑了更多的上下文语义关联。

在一些实施例中,如图4示出本公开实施例提供的基于at-blstm的语音交互的流程示意图,将所述文本信息转化为词向量,所述词向量包括文本信息向量和实体特征向量;将所述词向量输入到构建的引入注意力机制的双向长短时记忆单元神经网络at-blstm中,其中所述at-blstm包括双向长短时记忆单元blstm部分、注意力机制,池化层、特征融合、特征分类等部分。blstm能够充分利用整个文本序列的信息,包括各个词之间的相互关系信息,并将该种信息用于对每个词的处理当中去。利用注意力机制计算注意力概率,注意力概率可以突出特定的单词对于整个句子的重要程度,引入注意力机制考虑了更多的上下文语义关联。

在一种可能的实现方式中,所述利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果之后,包括:将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的对话类型标签进行匹配,基于匹配结果输出对话应答文本;其中,所述对话管理模型中的每一种类型的对话设置对话类型标签。

可选地,所述将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,基于匹配结果输出对话应答文本,包括:将所述解析结果输入到对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,得到所述解析结果与每个所述设置标签的匹配概率;选择匹配概率大的设置标签下的对话模式来输出对话应答文本。在对话管理系统中可以将催收的对话设置标签,这样可以更好地进行债务催收对话。

可选地,根据所述客户的分类,选择对话应答文本。这样可以根据客户的性格等选择更合适的对话模式。

可选地,标记所述对话管理模型对话的结果,并将所述对话以及结果保存,其中,所述对话的结果包括催收成功和催收失败、以及待还款、延迟还款。保存对话的结果,便于更准备的对客户进行下一次催收。

可选地,根据所述对话管理模型标记对话的结果,调整所述催收策略。便于更灵活地制定更适合客户的催收策略,提高催收成功率。

在本公开实施例中,可以建立客户的用户画像,根据所述用户画像确定所述客户的分类;基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。这样可以针对每个客户群体制定催收策略,通过客户的用户画像了解客户的说话习惯、以及进行催收的合适时间段,从而使催收能够更顺利,更高效。根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。根据每一个客户的说话习惯来进行分词,能够更准确的分词。构建长短时记忆网络,在长短时记忆网络中引入注意力机制;利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。利用注意力机制增强对关键词的关注度,减弱不重要词的关注度,从而提高语义解析准确率,利用加入了双向长短时记忆单元的神经网络来进行语义解析避免了需要人工设计特征,提高了语义解析的效率。

为了便于更好地实施本公开实施例的上述方案,本公开还对应提供了一种语音交互装置,下面结合附图来进行详细说明:

如图5示出的本公开实施例提供的语音交互装置的结构示意图,语音交互装置可以包括:建立单元101、制定单元102和解析单元103,其中,

建立单元101,用于建立客户的用户画像,根据所述用户画像确定所述客户的分类;

制定单元102,用于基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;

转换单元103,用于将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;

解析单元104,用于利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

可选地,所述建立单元101,还用于:

获取客户数据并对所述客户数据进行分析,根据分析结果建立每个客户的用户画像;

根据所述用户画像确定所述客户的分类。

可选地,所述制定单元102,还用于:

根据客户的分类,制定跟客户进行语音通话的时间以及频率的催收策略,按照所述催收策略与客户进行语音通话。

可选地,所述转换单元103,还用于:

根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;

基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。

可选地,所述解析单元104,还用于:

构建长短时记忆网络,在长短时记忆网络中引入注意力机制;

利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。

可选地,所述装置,还用于:

根据所述客户语音的解析结果给出对话应答文本。

可选地,所述装置,还用于:

将所述解析结果输入到构建好的对话管理模型中与所述对话管理模型中的对话类型标签进行匹配,基于匹配结果输出对话应答文本;其中,所述对话管理模型中的每一种类型的对话设置对话类型标签。

可选地,所述装置,还用于:

将所述解析结果输入到对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,得到所述解析结果与每个所述设置标签的匹配概率;

选择匹配概率大的设置标签下的对话模式来输出对话应答文本。

可选地,所述装置,还用于:

根据所述客户的分类,选择对话应答文本。

可选地,所述装置,还用于:

标记所述对话管理模型对话的结果,并将所述对话以及结果保存,其中,所述对话的结果包括催收成功和催收失败、以及待还款、延迟还款。

在本公开实施例中,可以建立客户的用户画像,根据所述用户画像确定所述客户的分类;基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。这样可以针对每个客户群体制定催收策略,通过客户的用户画像了解客户的说话习惯、以及进行催收的合适时间段,从而使催收能够更顺利,更高效。根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。根据每一个客户的说话习惯来进行分词,能够更准确的分词。构建长短时记忆网络,在长短时记忆网络中引入注意力机制;利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。利用注意力机制增强对关键词的关注度,减弱不重要词的关注度,从而提高语义解析准确率,利用加入了双向长短时记忆单元的神经网络来进行语义解析避免了需要人工设计特征,提高了语义解析的效率。

需要说明的是,本公开实施例中的语音交互装置10为上述图1至图4实施例中的语音交互装置,该语音交互装置10中各单元的功能可对应参考上述各方法实施例中图1至图4实施例的具体实现方式,这里不再赘述。

为了便于更好地实施本公开实施例的上述方案,本公开还对应提供了一种语音交互设备,下面结合附图来进行详细说明:

如图6示出的本公开实施例提供的语音交互设备的结构示意图,语音交互设备110可以包括处理器1101、输入单元1102、输出单元1103、存储器1104和通信单元1105、总线1106,处理器1101、输入单元1102、输出单元1103、存储器1104和通信单元1105可以通过总线1106相互连接。存储器1104可以是高速ram存储器,也可以是非易失性的存储器(non-volatilememory),例如至少一个磁盘存储器。存储器1104可选的还可以是至少一个位于远离前述处理器1101的存储系统。存储器1104用于存储应用程序代码,可以包括操作系统、网络通信模块、用户接口模块以及语音交互程序,通信单元1105用于与外部单元进行信息交互;处理器1101被配置用于调用所述程序代码,执行以下步骤:

处理器1101建立客户的用户画像,根据所述用户画像确定所述客户的分类;

处理器1101基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;

处理器1101将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;

处理器1101利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。

处理器1101根据客户的分类,制定跟客户进行语音通话的时间以及频率的催收策略,按照所述催收策略与客户进行语音通话;

处理器1101根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;

处理器1101基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量;

处理器1101构建长短时记忆网络,在长短时记忆网络中引入注意力机制;

处理器1101利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。

处理器1101建立对话管理模型,所述对话管理模型中将每一种类型的对话设置标签;

处理器1101将所述解析结果输入到对话管理模型中与所述对话管理模型中的所述设置标签进行匹配,基于匹配结果输出对话应答文本。

在本公开实施例中,可以建立客户的用户画像,根据所述用户画像确定所述客户的分类;基于所述客户的分类,制定催收策略,按照所述催收策略与客户进行语音通话;将所述语音通话时接收到的客户语音转换为文本信息后生成词向量;利用所述长短时记忆网络解析所述词向量,得到所述客户语音的解析结果。这样可以针对每个客户群体制定催收策略,通过客户的用户画像了解客户的说话习惯、以及进行催收的合适时间段,从而使催收能够更顺利,更高效。根据所述客户的分类确定对应的客户群体的词典,其中,客户的不同分类对应不同客户群体的词典,每一个客户群体的词典中包含所述客户群体的特定词语;基于确定的所述客户群体的词典,对所述客户语音转换后的文本信息进行分词后生成词向量。根据每一个客户的说话习惯来进行分词,能够更准确的分词。构建长短时记忆网络,在长短时记忆网络中引入注意力机制;利用训练后的所述长短时记忆网络解析所述词向量,得到解析结果,其中,所述长短时记忆网络的训练集包含催收场景对话构成的语料库。利用注意力机制增强对关键词的关注度,减弱不重要词的关注度,从而提高语义解析准确率,利用加入了双向长短时记忆单元的神经网络来进行语义解析避免了需要人工设计特征,提高了语义解析的效率。

需要说明的是,本公开实施例中的语音交互设备110为上述图1至图4实施例中的语音交互设备,具体可对应参考上述各方法实施例中图1至图4实施例的具体实现方式,这里不再赘述。

本发明实施例还提供一种计算机可读存储介质,其中,该计算机可读存储介质可存储有程序,该程序执行时包括上述方法实施例中记载的任意一种的部分或全部步骤。

本发明实施例还提供一种计算机程序,该计算机程序包括指令,当该计算机程序被计算机执行时,使得计算机可以执行任意一种语音交互方法的部分或全部步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为u盘、磁碟、光盘、只读存储记忆体(read-onlymemory,rom)或随机存储记忆体(randomaccessmemory,ram)等。

本公开可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、静态随机存取存储器(sram)、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理装置,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理装置中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理装置中的计算机可读存储介质中。

用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。

这里参照根据本公开实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本公开的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。以上所揭露的仅为本公开较佳实施例而已,当然不能以此来限定本公开之权利范围,因此依本公开权利要求所作的等同变化,仍属本公开所涵盖的范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1