一种外呼应答方法、装置、设备及介质与流程

文档序号：21621658发布日期：2020-07-29 02:27阅读：377来源：国知局

本发明实施例涉及通信技术领域，尤其涉及一种外呼应答方法、装置、设备及介质。

背景技术：

随着通信技术的迅速发展，外呼服务被广泛应用于各个领域：在教育培训行业，利用外呼可将相关课程信息迅速有效地传播给客户；在金融行业，外呼可用于电话催收、还款提醒、银行业务外呼等场景。传统外呼系统需要通过人工坐席进行外呼，往往需要大量的人力成本，且外呼效率不稳定。

技术实现要素：

本发明实施例提供了一种外呼应答方法、装置、设备及介质，以实现自动完成外呼流程，提高外呼效率。

第一方面，本发明实施例提供了一种外呼应答方法，包括：

当外呼应答指令被触发时，当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；

对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；

根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

第二方面，本发明实施例还提供了一种外呼应答装置，包括：

待应答语音获取模块，用于当外呼应答指令被触发时，当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；

目标意图确定模块，用于对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；

外呼应答模块，用于根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

第三方面，本发明实施例还提供了一种计算机设备，设备包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序；

当一个或多个程序被一个或多个处理器执行，使得一个或多个处理器实现如本发明任意实施例所提供的外呼应答方法。

第四方面，本发明实施例还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现如本发明任意实施例所提供的外呼应答方法。

本发明实施例通过当外呼应答指令被触发时，当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答，实现了自动完成外呼流程，提高了外呼效率。

附图说明

图1是本发明实施例一所提供的一种外呼方法的流程图；

图2是本发明实施例二所提供的一种外呼流程示意图；

图3是本发明实施例三所提供的一种外呼装置的结构示意图；

图4是本发明实施例四所提供的一种计算机设备的结构示意图。

具体实施方式

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是，此处所描述的具体实施例仅仅用于解释本发明，而非对本发明的限定。另外还需要说明的是，为了便于描述，附图中仅示出了与本发明相关的部分而非全部结构。

实施例一

图1是本发明实施例一所提供的一种外呼方法的流程图。本实施例可适用于对进行外呼时的情形。该方法可以由外呼装置执行，该外呼装置可以采用软件和/或硬件的方式实现，例如，该外呼装置可配置于计算机设备中。如图1所示，所述方法包括：

s110、当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据。

在本实施例中，外呼应答指令可以通过用户输入的语音信息触发。可选的，在外呼通话过程中，用户输入语音信息即可触发外呼应答指令，且用户输入语音信息为外呼应答指令对应的待应答语音数据。示例性的，当外呼通话为“系统：请问是用户a吗？用户：是”时，用户输入的语音信息“是”即触发了外呼应答指令，并将其作为待应答语音数据。

s120、对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图。

在本实施例中，获取待应答语音数据后，识别出待应答语音数据对应的用户意图作为目标意图。可选的，识别出待应答语音数据对应的用户意图可以为，对待应答语音数据进行文本转换，得到待应答语音数据对应的文本信息，对文本信息进行语义理解，根据语义理解结果确定待应答语音数据对应的目标意图。

在本发明的一种实施方式中，所述对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图，包括：对所述待应答语音数据进行文本转换，得到所述待应答语音数据对应的文本信息；将所述文本信息输入至预先训练好的意图识别模型中，获得所述意图识别模型输出的所述目标意图。可选的，对待应答语音数据进行文本转换的方式再次不做限定，只要能实现将待应答语音数据转换为文本信息即可，在获得待应答语音数据对应的文本信息后，通过预先训练的意图识别模型进行意图识别。在本实施例中，可以根据外呼目的构建不同的外呼流程，并针对不同的外呼流程，使用不同的训练样本训练相应的意图识别模型。也就是说，可以根据当前外呼通话对应的流程标识获取意图识别模型。针对不同的外呼流程，训练相应的意图识别模型，使得意图识别模型的识别结果更加与外呼流程更加贴合，使得意图识别结果更加准确。

s130、根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

在本实施例中，确定用户的目标意图后，根据目标意图以及当前外呼流程确定待应答语音数据的目标应答策略。可选的，外呼流程可以包括多个步骤，可以根据预先设定的流程应答逻辑以及待应答语音数据对应的步骤确定目标意图对应的目标应答策略。

在本发明的一种实施方式中，所述根据所述目标应答策略进行应答，包括：获取所述目标应答策略中包含的至少一个应答子内容以及所述应答子内容对应的内容类型；根据所述应答子内容以及所述应答子内容对应的内容类型生成目标应答语音信息，并将所述目标应答语音信息进行播放。可选的，可以预先定义多个应答子内容，通过多个应答字内容拼接构成应答内容，以提高应答子内容的可复用性。针对每个应答子内容，可以设置其对应的内容类型，用于标识该应答字内容的存储方式。示例性的，若应答子内容以音频方式进行存储，可以将其内容类型设置为语音类型，若应答子内容以文本方式进行存储，可以将其内容类型设置为文本类型。在本实施例中，确定目标应答策略后，获取目标应答策略中包含的应答子内容标识，根据应答子内容标识获取应答子内容以及应答子内容对应的内容类型。

在上述方案的基础上，所述根据所述应答子内容以及所述应答子内容对应的内容类型生成目标应答语音信息，包括：针对每个所述应答子内容，根据所述应答子内容对应的内容类型生成所述应答子内容对应的子应答语音信息，将各所述子应答语音信息合并生成目标应答语音信息进行播放。在本实施例中，当应答子内容对应的内容类型不同时，生成应答子内容对应的子应答语音信息方式也不同。获取目标应答策略中包含的获取应答子内容以及应答子内容对应的内容类型后，针对每个应答子内容，根据该应答子内容对应的内容类型生成该应答子内容对应的子应答语音信息，将各子应答语音信息进行拼接得到目标应答语音信息，并将目标应答语音信息进行播放，完成对待应答语音数据的应答。示例性的，假设目标应答策略中包含应答子内容1“您好”，以及应答子内容2“如果您暂时不方便接听，稍后我们会再次致电，请保持通讯畅通”，则针对应答子内容1生成相应的子应答语音信息1“您好”，和针对应答子内容2生成相应的子应答语音信息2“如果您暂时不方便接听，稍后我们会再次致电，请保持通讯畅通”后，将子应答语音信息1和子应答语音信息2进行拼接，得到目标应答语音信息“您好，如果您暂时不方便接听，稍后我们会再次致电，请保持通讯畅通”，并将其进行播放。

在本发明的一种实施方式中，所述内容类型包括语音类型，所述根据所述应答子内容对应的内容类型生成所述应答子内容对应的子应答语音信息，包括：调用设定路径获取所述应答子内容对应的语音信息，将所述语音信息作为所述应答子内容对应的子应答语音信息。可选的，应答子内容对应的内容类型包括语音类型，表示该应答子内容以音频形式进行存储。可以理解的是，当应答子内容对应的内容类型为语音类型时，直接调用应答子内容对应的路径获取预先存储的语音信息即可，并将获得的语音信息作为该应答子内容对应的子应答语音信息。

在本发明的一种实施方式中，所述内容类型包括文本类型，所述根据所述应答子内容对应的内容类型生成所述应答子内容对应的子应答语音信息，包括：获取所述应答子内容对应的文本信息，对所述文本信息进行语音合成，得到所述文本信息对应的语音信息，将所述语音信息作为所述应答子内容对应的子应答语音信息。可选的，应答子内容对应的内容类型还可以包括文本类型，表示该应答子内容以文本形式进行存储。当应答子内容对应的内容类型为文本类型时，需要对文本形式的应答子内容进行语音合成，将语音合成得到的语音信息作为该应答子内容对应的子应答语音信息。

在上述方案的基础上，所述方法还包括：获取用户的未应答时间，当所述未应答时间大于设定的超时阈值时，生成超时响应信息，将所述超时响应信息进行输出。可选的，在进行外呼通话时，可以在应答节点在用户侧时，实时检测用户的未应答时间，当用户的未应答时间超过预先设定的超时阈值时，根据设定的超时策略生成超时响应信息，并将超时响应信息进行播放，以提示用户进行应答。其中，超时响应信息可以为重复待用户应答的应答问题，或提示用户进行应答，或进入其他应答环节等信息。通过超时策略在用户长时间未应答时生成超时响应信息并输出，保证了外呼通话的时效性，提高了外呼效率。

实施例二

本实施例在上述实施例的基础上，提供了一种优选实施例。本实施例所提供的外呼应答方法可以由外呼系统执行。可选的，外呼系统包括语音识别、流程引擎、语义理解、话术引擎、语音合成五个模块。其中，语音识别可以为任意通用语音识别技术。

流程引擎可以完整定义整个外呼流程。在本实施例中，流程引擎包含流程、环节、步骤的概念。可以理解的是，流程引擎中可以创建多个流程。一个流程即代表一个智能外呼策略，外呼内容根据策略的内容来进行。一个流程包含多个环节，一个环节(section)包含多个步骤(step)，一个步骤即为一轮或者多轮客户与外呼系统之间的交互。并考虑到外呼电话的时效性，对流程设置超时机制。示例性的，可以使用xml文件来定义流程。其中，可以将process定义为流程，包含type属性，其值为流程的业务类型，使用流程id定义流程唯一标识，使用name定义流程的名称；并定义流程的timeout属性，即整个流程的全局超时信息。例如，客户一定时间未说话时，算作一次超时，并使用count属性定义超时次数；使用step-ref属性定义超时时候跳到的步骤。在环节的定义中，使用section属性定义节环节，section的start属性为每一通对话开始环节。其id属性为某一流程中环节的唯一标识。name属性为环节的名称。timeout属性为这个环节的特有的超时信息。该属性为可选，如果不定义，则使用全局超时信息，若定义则覆盖全局超时信息。在步骤的定义中，使用step定义步骤，其start属性为开始环节中的起始步骤，其id属性为该环节中的唯一标识来，name为其名称，driver属性为该步骤的驱动类型，directdriver为直接驱动，value为其直接跳到的步骤的值；enginedriver为通过引擎进行驱动。此时需要定义enginestack属性。enginestack为语义理解引擎的描述。里面包含一到多个engine属性，其值为分类器的id。

语义理解引擎由多个机器学习模型和深度学习模型组合而成。本实施例中，通过自主设计的语义理解策略，理解客户语句中表达的意图。其中，语义理解引擎由多个模型组构成。针对流程引擎中的不同的环节，可以设定不同的模型组，且每一个模型组中包含多个机器学习或深度学习模型。需要说明的是，用于语义理解的机器学习模型或深度学习模型必须为文本分类模型。

话术引擎通过预先设计的一套话术存储结构和话术组装策略进行话术存储。考虑到目前文本转语音技术不够成熟，和真人的发生还存在着一定的差距，在本实施例中，可以在话术引擎定义话术段，由多个话术段组成一个完整的话术。且对话术段定义多个类型，如“文本”、“录音”等。语音合成引擎会根据不同类型，来选择合成语音的方式。可以理解的是，定义多个话术段可以提高话术段的复用性。示例性的，话术引擎可以定义为：callscripts为某一场景下的完整的话术信息，type取值为场景名称，流程引擎中定义的话术信息取值为这个type。其中，call-scripts包含多个call-script。id为call-script中某一场景话术中的唯一标示；name为名称。type为该话术默认类型。话术内容定义在话术段中，为segments。一个segments包含多个segment，每个segment为一段话术，当话术的属性为text属性时，segment为其文本内容。

图2是本发明实施例二所提供的一种外呼流程示意图，如图2所示，当外呼通话进行时，语音数据接入本系统，首先通过语音识别模块，将语音信息转换为文本信息；然后根据当前流程引擎，获取到当前流程的处理逻辑，调用对应的语义理解引擎；再返回到流程引擎中，确定下一步的流程，同时输出到话术引擎中，组装对应话术；最后通过语音合成引擎，合成应答给客户的语音。

本发明实施例中采用了灵活配置的方法对外呼流程、话术存储等进行了配置，通过流程引擎中设计的外呼流程确定外呼逻辑，通过语义理解引擎对客户的语音信息进行语义理解，并在确定用户意图后通过话术引擎中预先存储的话术存储结构和方法、以及话术组装策略合成语音信息进行响应，构建了一个具有很强识别能力的智能外呼系统，提高了外呼的工作效率。

实施例三

图3是本发明实施例三所提供的一种外呼应答装置的结构示意图。该外呼装置可以采用软件和/或硬件的方式实现，例如该外呼装置可以配置于计算机设备中。如图3所示，所述装置包括待应答语音获取模块310、目标意图确定模块320和外呼应答模块330，其中：

待应答语音获取模块310，用于当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；

目标意图确定模块320，用于对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；

外呼应答模块330，用于根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

本发明实施例通过待应答语音获取模块当外呼应答指令被触发时，当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；目标意图确定模块对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；外呼应答模块根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答，实现了自动完成外呼流程，提高了外呼效率。

可选的，在上述方案的基础上，所述外呼应答模块330具体用于：

获取所述目标应答策略中包含的至少一个应答子内容以及所述应答子内容对应的内容类型；

根据所述应答子内容以及所述应答子内容对应的内容类型生成目标应答语音信息，并将所述目标应答语音信息进行播放。

可选的，在上述方案的基础上，所述外呼应答模块330具体用于：

针对每个所述应答子内容，根据所述应答子内容对应的内容类型生成所述应答子内容对应的子应答语音信息，将各所述子应答语音信息合并生成目标应答语音信息进行播放。

可选的，在上述方案的基础上，所述内容类型包括语音类型，所述外呼应答模块330具体用于：

调用设定路径获取所述应答子内容对应的语音信息，将所述语音信息作为所述应答子内容对应的子应答语音信息。

可选的，在上述方案的基础上，所述内容类型包括文本类型，所述外呼应答模块330具体用于：

获取所述应答子内容对应的文本信息，对所述文本信息进行语音合成，得到所述文本信息对应的语音信息，将所述语音信息作为所述应答子内容对应的子应答语音信息。

可选的，在上述方案的基础上，所述目标意图确定模块320具体用于：

对所述待应答语音数据进行文本转换，得到所述待应答语音数据对应的文本信息；

将所述文本信息输入至预先训练好的意图识别模型中，获得所述意图识别模型输出的所述目标意图。

可选的，在上述方案的基础上，所述装置还包括超时应答模块，用于：

获取用户的未应答时间，当所述未应答时间大于设定的超时阈值时，生成超时响应信息，将所述超时响应信息进行输出。

本发明实施例所提供的外呼应答装置可执行本发明任意实施例所提供的外呼应答方法，具备执行方法相应的功能模块和有益效果。

实施例四

图4是本发明实施例四所提供的一种计算机设备的结构示意图。图4示出了适于用来实现本发明实施方式的示例性计算机设备412的框图。图4显示的计算机设备412仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图4所示，计算机设备412以通用计算设备的形式表现。计算机设备412的组件可以包括但不限于：一个或者多个处理器416，系统存储器428，连接不同系统组件(包括系统存储器428和处理器416)的总线418。

总线418表示几类总线结构中的一种或多种，包括存储器总线或者存储器控制器，外围总线，图形加速端口，处理器416或者使用多种总线结构中的任意总线结构的局域总线。举例来说，这些体系结构包括但不限于工业标准体系结构(isa)总线，微通道体系结构(mac)总线，增强型isa总线、视频电子标准协会(vesa)局域总线以及外围组件互连(pci)总线。

计算机设备412典型地包括多种计算机系统可读介质。这些介质可以是任何能够被计算机设备412访问的可用介质，包括易失性和非易失性介质，可移动的和不可移动的介质。

系统存储器428可以包括易失性存储器形式的计算机系统可读介质，例如随机存取存储器(ram)430和/或高速缓存存储器432。计算机设备412可以进一步包括其它可移动/不可移动的、易失性/非易失性计算机系统存储介质。仅作为举例，存储装置434可以用于读写不可移动的、非易失性磁介质(图4未显示，通常称为“硬盘驱动器”)。尽管图4中未示出，可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱动器，以及对可移动非易失性光盘(例如cd-rom，dvd-rom或者其它光介质)读写的光盘驱动器。在这些情况下，每个驱动器可以通过一个或者多个数据介质接口与总线418相连。存储器428可以包括至少一个程序产品，该程序产品具有一组(例如至少一个)程序模块，这些程序模块被配置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块442的程序/实用工具440，可以存储在例如存储器428中，这样的程序模块442包括但不限于操作系统、一个或者多个应用程序、其它程序模块以及程序数据，这些示例中的每一个或某种组合中可能包括网络环境的实现。程序模块442通常执行本发明所描述的实施例中的功能和/或方法。

计算机设备412也可以与一个或多个外部设备414(例如键盘、指向设备、显示器424等)通信，还可与一个或者多个使得用户能与该计算机设备412交互的设备通信，和/或与使得该计算机设备412能与一个或多个其它计算设备进行通信的任何设备(例如网卡，调制解调器等等)通信。这种通信可以通过输入/输出(i/o)接口422进行。并且，计算机设备412还可以通过网络适配器420与一个或者多个网络(例如局域网(lan)，广域网(wan)和/或公共网络，例如因特网)通信。如图所示，网络适配器420通过总线418与计算机设备412的其它模块通信。应当明白，尽管图中未示出，可以结合计算机设备412使用其它硬件和/或软件模块，包括但不限于：微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、raid系统、磁带驱动器以及数据备份存储系统等。

处理器416通过运行存储在系统存储器428中的程序，从而执行各种功能应用以及数据处理，例如实现本发明实施例所提供的外呼应答方法，该方法包括：

当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；

对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；

根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

当然，本领域技术人员可以理解，处理器还可以实现本发明任意实施例所提供的外呼应答方法的技术方案。

实施例五

本发明实施例五还提供了一种计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现本发明实施例所提供的外呼应答方法，该方法包括：

当外呼应答指令被触发时，获取所述外呼应答指令对应的待应答语音数据；

对所述待应答语音数据进行语义理解，获得所述待应答语音数据对应的目标意图；

根据所述目标意图确定所述待应答语音数据对应的目标应答策略，根据所述目标应答策略进行应答。

当然，本发明实施例所提供的一种计算机可读存储介质，其上存储的计算机程序不限于如上所述的方法操作，还可以执行本发明任意实施例所提供的外呼应答方法的相关操作。

本发明实施例的计算机存储介质，可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。

计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。

计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括——但不限于无线、电线、光缆、rf等等，或者上述的任意合适的组合。

可以以一种或多种程序设计语言或其组合来编写用于执行本发明操作的计算机程序代码，所述程序设计语言包括面向对象的程序设计语言—诸如java、smalltalk、c++，还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中，远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机，或者，可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

注意，上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解，本发明不限于这里所述的特定实施例，对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此，虽然通过以上实施例对本发明进行了较为详细的说明，但是本发明不仅仅限于以上实施例，在不脱离本发明构思的情况下，还可以包括更多其他等效实施例，而本发明的范围由所附的权利要求范围决定。

当前第1页1 2

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张晨
技术所有人：中国建设银行股份有限公司;建信金融科技有限责任公司
我是此专利的发明人

网友询问留言留言:0条

还没有人留言评论。精彩留言会获得点赞！

文明留言，给您点赞！