基于自动外呼系统的语音处理方法、装置和计算机设备与流程

文档序号：17089425发布日期：2019-03-13 23:16阅读：220来源：国知局

本申请涉及语音识别领域，具体涉及一种基于自动外呼系统的语音处理方法、装置和计算机设备。

背景技术：

语音识别技术，是指让机器通过识别和理解，将语音信号转换为相应的文本或命令的技术，也就是说，要让机器听懂人类的语音。近年来，语音识别技术发展非常迅速，识别能力得到了很大的提高。随着移动互联网的兴起，语音识别技术也逐渐进入了应用市场，成为了移动应用除了文字输入之外的另一个入口。外呼系统是呼叫中心常规业务，由坐席主动拨叫用户号码，与用户对话，以完成营销、调查等特定任务。自动外呼系统是指采用计算机替代坐席，用计算机拨叫用户号码并与用户对话，通过语音识别技术来完成特定任务的一种应用系统。

在自动外呼系统中，计算机在与用户对话时，对于不同的任务会向用户提出不同的问题，并通过调用语音识别引擎来对用户关于问题的回答语音进行语音识别，来完成对于用户的营销、调查等特定任务。现有技术中，对于不同的任务，自动外呼系统都是整体调用一个语音识别引擎来对用户的回答语音进行语音识别，由于该语音识别引擎内包含有与所有的任务相关的内容，当对该语音识别引擎进行调用时，会出现加载时间长，且不容易维护的问题。另外，对于不同的任务，都采用相同的语音识别引擎来进行语音识别，缺乏针对性，识别准确率不高。

技术实现要素：

本申请的主要目的为提供一种基于自动外呼系统的语音处理方法、装置和计算机设备，旨在现有对该语音识别引擎进行调用时，会出现加载时间长，且不容易维护，缺乏针对性，识别准确率不高的技术问题。

本申请提出一种基于自动外呼系统的语音处理方法，包括：

获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；

判断与所述终端是否呼通；

若是，调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块，其中所述语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，所述音频问题集包含一个或多个音频文件，一个音频文件对应一个问题；

对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果，在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。

优选地，所述根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务的步骤之前，包括：

获取所有业务的信息数据，其中所述信息数据包括业务性质；

根据所述业务性质，将具有相同或相似的业务性质的业务标记为同一种业务类型；

根据所述业务类型的数量，将所述语音识别引擎设置为对应数量的语音识别引擎模块，其中所述语音识别引擎模块内设置有与所述业务类型对应的语言模型。

优选地，所述调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤之前，包括：

接收管理人员输入的与各所述业务类型对应的音频问题集，并保存至音频数据库；

根据所述音频问题集，采集与所述音频问题集相对应的回答文字；

将所述回答文字输入到对应的语言识别引擎模块的语言模型内。

优选地，所述从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤，包括：

从预设的多种语法路径中选取出与所述第一业务类型对应的第一语法路径，其中所述语法路径与所述业务类型一一对应；

通过所述第一语法路径从所述语音识别引擎中调用出与所述第一业务类型对应的所述第一语音识别引擎模块。

优选地，所述在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕的步骤之后，包括：

接收由所述第一语音识别引擎模块发送的对于应答语音集的识别结果，其中所述应答语音集包括所述用户对于所述音频问题集中所有的问题反馈的对应的所有的应答语音；

提取所述识别结果的目标关键词；

将所述目标关键词与预设关键词集内的关键词进行匹配，并根据匹配情况得出外呼结果；

根据所述外呼结果对所述自动外呼任务进行标记和备注。

优选地，所述调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤之后，包括：

在对所述音频问题集的问题进行播放的过程中，判断是否监听到所述用户发出的打断语音；

若是，停止播放所述音频问题集，并将当前通话转移到人工坐席进行处理。

在播放完所述音频问题集中的一个问题音频后，判断是否在指定时间内接收到所述第一语音识别引擎反馈的识别结果，其中所述识别结果为第一语音识别引擎在接收到所述用户对于所述问题音频的应答语音后，对所述问题音频的应答语音进行识别后得出的结果；

若否，将当前通话转移到人工坐席进行处理。

本申请还提供了基于自动外呼系统的语音处理装置，应用于自动外呼系统，包括：

第一获取模块，用于获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

执行模块，用于根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；

第一判断模块，用于判断与所述终端是否呼通；

调用模块，用于若是，调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块，其中所述语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，所述音频问题集包含一个或多个音频文件，一个音频文件对应一个问题；

播放模块，用于对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果，在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。

本申请还提供一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器执行所述计算机程序时实现上述任一项所述方法的步骤。

本申请还提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现上述任一项所述的方法的步骤。

本申请中提供的基于自动外呼系统的语音处理方法、装置和计算机设备，具有以下有益效果：

本申请中提供的基于自动外呼系统的语音处理方法、装置、计算机设备和存储介质，获取用户的数据信息；根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；判断与所述终端是否呼通；若是，调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块；对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果，在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。本申请通过调用对应的语音识别引擎模块来对用户对于音频问题集所反馈的应答语音进行识别，能快速高效地对用户对于音频问题集所反馈的应答语音的内容进行识别，提高了对用户的应答语音的识别准确率，也有利于准确了解用户对于本次自动外呼任务所作出的反馈。

附图说明

图1是本申请一实施例的基于自动外呼系统的语音处理方法的流程示意图；

图2是本申请一实施例的基于自动外呼系统的语音处理方法的流程示意图；

图3是本申请一实施例的基于自动外呼系统的语音处理方法的流程示意图；

图4是本申请一实施例的基于自动外呼系统的语音处理装置的结构示意图；

图5是本申请一实施例的计算机设备的结构示意图。

本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

参照图1，本申请一实施例中提供了基于自动外呼系统的语音处理方法，包括以下步骤：

s1：获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

s2：根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的移动终端发起呼叫的自动外呼任务；

s3：判断与所述终端是否呼通；

s4：若是，调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块，其中所述语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，所述音频问题集包含一个或多个音频文件，一个音频文件对应一个问题；

s5：对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果，在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。

如上述步骤s1和s2所述，本实施例的执行主体为自动外呼系统，自动外呼系统是指采用计算机替代坐席，用计算机拨叫用户号码并与用户对话，通过语音识别技术来完成特定任务的一种应用系统。上述的用户为自动外呼系统需要执行自动外呼任务的指定用户，举例地，该指定用户可为成功办理了某种业务的用户，需要进一步进行回访，来咨询该指定用户对于办理的业务的满意度；或者该指定用户为可能有意愿办理某些业务的潜在用户，通过对这些潜在用户执行自动外呼任务，来向该潜在用户推荐办理相关的业务。自动外呼系统可通过访问外呼数据库，来获取用户的数据信息。其中，外呼数据库里记录有该用户的数据信息，该数据信息包括电话号码及业务数据。进一步地，根据该业务数据可确定出与该用户相关的第一业务类型，其中，该业务数据包括用户的个人信息以及用户办理过的业务的相关信息，个人信息可包括个人年龄、收入、经济情况等信息，根据用户的个人信息可对应推荐办理相关的业务；另外，用户办理过的业务的相关信息可包括用户成功办理了某某业务或者用户取消办理了某某业务，根据用户办理过的业务的相关信息可对应进行业务回访，来了解用户的需求与意见。举例地，上述第一业务类型可包括回访业务、销售业务、催费催缴业务等等，在获取了该用户的电话号码后，便可向与该电话号码对应的终端发起呼叫的自动外呼任务。

如上述步骤s3和s4所述，在与用户的终端呼通成功后，自动外呼系统会调用出与第一业务类型对应的音频问题集和第一语音识别引擎模块，以便后续进行与用户的交互。其中，对于不同的业务类型，管理人员会预先设置好与各种业务类型相对应的各种问题集，并对该各种问题集进行录音得到对应的各种音频问题集，之后将各该音频问题集输入至自动外呼系统，由自动外呼系统保存至音频数据库中。其中，音频问题集的音频文件的数量根据实际情况确定，可包含一个或多个音频文件，且一个音频文件对应一个问题。举例地，假如业务类型为回访类型，则回访业务的对应的音频问题集的内容可设置为：“请问投保人是否为xxx”、“被保险人为xxx、年龄xxx、地址为xxx，以上信息是否正确”、“请问您是否已认真阅读保单的条款，并且充分了解这款保险产品”、“您是否了解这款保险产品的交费年限、交费金额、保障年限、犹豫期、中途退保损失等详细信息”、“您对这款保险产品是否满意”、“您对本公司的工作有何意见或建议”等。另外，第一语音识别引擎模块是从语音识别引擎中调用出的，语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，该语音识别引擎模块的数量与业务类型的数量相同，对每一种业务类型配置一个语音识别引擎模块，且语音识别引擎模块内包含有与业务类型相关的语言模型。在本实施例，当与该用户的电话号码对应的终端成功呼通后，则会向上述音频数据库调用出与该第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与该第一业务类型对应的第一语音识别引擎模块，来实现后续与用户关于该第一业务类型的信息交互。

如上述步骤s5所述，自动外呼系统在调用出与第一业务类型对应的音频问题集后，由于音频问题集中包含有按一定顺序排列的一个或多个音频文件，且一个音频文件对于一个问题，便会按该顺序依次向用户播放该音频问题集中的每一个问题，在播放完一个问题后，接收用户返回的对于该一个问题的第一应答语音，并通过调用出的第一语音识别引擎模块对用户返回的第一应答语音进行识别，识别完成之后便会播放下一个问题，播完结束后，再接收用户对于该下一个问题的第二应答语音，再通过调用出的第一语音识别引擎模块对用户返回的第二应答语音进行识别，依此循环，直至将音频问题集中所有的问题播放完毕，并且对接收到的用户对于该所有的问题返回的所有的应答语音进行识别。自动外呼系统会将语音识别引擎设置为对应数量的多个语音识别引擎模块，即每一种业务类型会对应设置有一个语音识别引擎模块，且每一个语音识别引擎模块内还对应设置有一个语言模型，以便通过语音识别引擎模块内的语言模型来对用户对于音频问题集中的问题所反馈的应答语音进行识别。在本实施例，在接收到用户对于音频问题集中的第一问题反馈的第一应答语音后，自动外呼系统会通过调用出的与第一业务类型对应的第一语音识别引擎模块内第一语言模型来对该第一应答语音进行识别，并通过该第一语言模型来实现对该第一应答语音识别。相比于整体调用一个语音识别引擎来识别所有的业务的语音，本实施例通过将语音识别引擎设置为与业务类型对应的多个的语音识别引擎模块，并调用对应的语音识别引擎模块来对用户对于音频问题集所反馈的应答语音进行识别，能快速高效地对用户对于音频问题集所反馈的应答语音的内容进行识别，提高了对用户的应答语音的识别准确率，也有利于准确了解用户对于本次自动外呼任务所作出的反馈。

参照图2，进一步地，本申请一实施例中，上述步骤s2之前，包括：

s200：获取所有业务的信息数据，其中所述信息数据包括业务性质；

s201：根据所述业务性质，将具有相同或相似的业务性质的业务标记为同一种业务类型；

s202：根据所述业务类型的数量，将所述语音识别引擎设置为对应数量的语音识别引擎模块，其中所述语音识别引擎模块内设置有与所述业务类型对应的语言模型。

如上述步骤s200和s201所述，上述信息数据包括各种业务的业务性质，在获取了所有的业务的业务性质后，将一些将具有相同或相似的业务性质的业务标记归类为同一种业务类型，举例地，在获取了所有的业务的业务数据后，得出当前共有7种业务，包括新契约回访、离司业务员保单回访、失效保单回访、给付业务回访、意外险销售、车险销售、分红险销售等业务等，由于新契约回访、离司业务员保单回访、失效保单回访和给付业务回访的业务性质都属于回访性质的业务，则可将新契约回访、离司业务员保单回访、失效保单回访、给付业务回访标记为同一种业务类型，即回访类型；而意外险销售、车险销售、分红险销售都属于销售性质的业务，则将意外险销售、车险销售、分红险销售等业务标记为销售类型，这样便将全部的7种业务标记为了两种业务类型，回访类型和销售类型。在另一个实施例中，上述信息数据还可包括业务名称，通过对所有业务的业务名称进行关键词提取，并将具有相同的关键词的多种业务标记为同一种业务类型，举例地，当前有意外险销售、车险销售、新契约回访、给付业务回访四种业务，对这四种业务提取出关键词并进行分析，由于意外险销售、车险销售具有相同的关键词“销售”，则可将意外险销售、车险销售标记为销售类型；由于新契约回访、给付业务回访具有相同的关键词“回访”，则可将新契约回访、给付业务回访标记为回访类型。

如上述步骤s202所述，现有技术中，当语音识别引擎在进行识别工作时，如果从一个领域切换到另一个领域，会导致语音识别引擎的性能急剧下降，且一些术语和新词可能总会无法正常识别，而为了支持多个领域的识别，通常会使用一个语言模型来同时建模多个领域的词语的分布信息，这样会使得该语言模型的概率分别比较平均，即该语音识别引擎的识别性能通常也比较平均，且该语音识别引擎比较庞大，整体调用该语音识别引擎时加载速度会很慢且非常耗费时间和资源。故本实施例中，根据该业务类型的数量，将语音识别引擎设置为对应数量的语音识别引擎模块，即为每一种业务类型配置一个语音识别引擎模块，且语音识别引擎模块内包含有与业务类型相关的语言模型。通过调用专门的语音识别模块来对相应的业务类型进行识别，同一个业务类型的业务可以使用同一个语音识别引擎模块，而不需要为每一个业务配置一个语音识别引擎模块，提高了每种语音识别引擎模块的资源使用率，也提高了语音识别的准确率。

进一步地，本申请一实施例中，上述步骤s4之前，包括：

s400：接收管理人员输入的与各所述业务类型对应的音频问题集，并保存至音频数据库；

s401：根据所述音频问题集，采集与所述音频问题集相对应的回答文字；

s402：将所述回答文字输入到对应的语言识别引擎模块的语言模型内。

本实施例中，在根据获取得到的业务数据对所有的业务确定了对应的业务类型之后，对于不同的业务类型，管理人员会预先设置好与各种业务类型相对应的各种问题集，并对该各种问题集进行录音得到对应的各种音频问题集，之后将各该音频问题集输入至自动外呼系统中，由自动外呼系统保存至音频数据库中，以便后续与用户交互时进行调用。当与用户的终端的通话接通之后，便可以直接从该音频数据库中调用该音频问题集，来向用户的终端进行播放。举例地，对于业务类型为回访类型，则回访类型对应的音频问题集的内容可设置为：“请问投保人是否为xxx”、“被保险人为xxx、年龄xxx、地址为xxx，以上信息是否有误”、“您是否已认真阅读保单的条款，并充分了解这款保险产品”、“您是否了解这款保险产品交费年限、交费金额、保障年限、犹豫期、中途退保损失等详细信息”、“您对送单的时效是否满意”、“您对业务人员的服务是否满意”、“您对本公司的工作有何意见或建议”等。另外，上述采集与所述音频问题集相对应的回答文字的方式具体包括：采集管理人员对于音频问题集中每一个问题所列举出的多种文字形式的回答，或者将音频问题集上传至网络，并对网络用户对于音频问题集中每一个问题的所反馈的回答文字进行采集并存储。对于每个音频问题集中的每一个问题，通过采集与音频问题集中每一个问题对应的多种回答文字，并将该多种回答文字输入到对应的语音识别引擎的语言模型内进行训练，以实现该语言模型能同时建模与音频问题集对应的多种回答文字，使得对应的语音识别引擎的语言模型能在与用户的终端通话接通之后，能准确地对用户对于音频问题集中的问题所反馈的应答语音进行识别，并输出与该应答语音对应的转写文本。

进一步地，本申请一实施例中，上述步骤s4，包括：

s410：从预设的多种语法路径中选取出与所述第一业务类型对应的第一语法路径，其中所述语法路径与所述业务类型一一对应；

s411：通过所述第一语法路径从所述语音识别引擎中调用出与所述第一业务类型对应的所述第一语音识别引擎模块。

本实施例中，在根据获取得到的业务数据对所有的业务确定出对应的业务类型之后，根据不同的业务类型，分别配置好对应的多个语法路径，对于不同业务类型中不同的逻辑，通过配置不同的语法路径来从语音识别引擎中调用对应的语音识别引擎模块内的语言模型，进而实现准确的语音识别。举例地，当第一业务类型为回访类型，对应设置有用于回访类型的回访语音识别引擎，以及用于回访类型的回访语法路径，且回访语音识别引擎内包含有与回访类型对应的回访语言模型，通过从多个语法路径中选取出回访语法路径，并通过该回访语法路径来调用出回访语音识别引擎模块内的回访语言模型，以实现后续的对用户关于音频问题集所反馈的应答语音的精确识别，达到个性化精准识别的效果。另外，当第一业务类型为销售类型，对应设置有用于销售类型的销售语音识别引擎，且销售语音识别引擎内包含有与销售类型对应的销售语言模型，通过从多个语法路径中选取出销售语法路径，并通过该销售语法路径调用出销售语音识别引擎模块内的销售语言模型，以实现后续的对用户的应答语音集所反馈的应答语音的精确识别。在本实施例，在选取出与该第一业务类型对应的第一语法路径后，便可通过该第一语法路径调用与该第一业务类型对应的该第一语音识别引擎模块内的第一语言模型，来实现后续对用户关于音频问题集所反馈的应答语音进行识别。对于不同的业务类型，调用对应的语言模型来进行对用户反馈的应答语音的识别，快速准确，且容易维护，而不需要所有的业务类型都共用同一个语音识别引擎内的同一个语言模型，提高了语音识别的速度与精度。

进一步地，本申请一实施例中，上述步骤s5之后，包括：

s500：接收由所述第一语音识别引擎模块发送的对于应答语音集的识别结果，其中所述应答语音集包括所述用户对于所述音频问题集中所有的问题反馈的对应的所有的应答语音；

s501：提取所述识别结果的目标关键词；

s502：将所述目标关键词与预设关键词集内的关键词进行匹配，并根据匹配情况得出外呼结果；

s503：根据所述外呼结果对所述自动外呼任务进行标记和备注。

本实施例中，在第一语音识别引擎模块完成对所述应答语音集的识别后，会向自动外呼系统返回识别结果。其中，自动外呼系统会预先设置一个数据库，且在该数据库中设置有预设关键词集，该预设关键词集与上述的业务类型相对应，举例地，回访类型的预设关键词集可为“满意”、“很满意”、“不满意”、“非常不满意”等，销售类型的预设关键词集可为“有意愿”、“无意愿”、“感兴趣”、“不感兴趣”等；在接收到第一语音识别引擎模块返回的识别结果后，通过提取该识别结果中的目标关键词，并将该目标关键词与该预设关键词集进行匹配，之后根据匹配情况来得出本次自动外呼任务的外呼结果。举例地，假如当前业务类型是回访类型，且与用户的应答语音集相对应的识别结果中存在与预设关键词集中的关键词相匹配的目标关键词“非常不满意”，则外呼结果为用户对已办理的业务觉得不满意。之后，还需要根据外呼结果对自动外呼任务进行标记和备注，举例地，在自动外呼任务已完成后，如果外呼结果为用户对已办理的业务觉得满意，则可为本次的自动外呼任务进行用户认可已办理的业务的标记和备注；如果外呼结果为用户对已办理的业务觉得不满意，则可将该用户以及该自动外呼任务进行二次外呼的标记和备注，后续需要进一步与该用户进行沟通，其中沟通方式可为人工处理的方式。

参照图3，进一步地，本申请一实施例中，上述步骤s4之后，包括：

s420：在对所述音频问题集的问题进行播放的过程中，判断是否监听到所述用户发出的打断语音；

s421：若是，停止播放所述音频问题集，并将当前通话转移到人工坐席进行处理。

本实施例中，在对所述音频问题集的问题进行播放的过程中，如果监听到用户发出的打断语音，即如果在播放音频问题集的某一个问题的过程中，如果当前该某一个问题的内容还没有播放完毕，但此时监听到了用户的语音，则判定用户发出了打断语音，打断语音的内容可为用户对该某一个问题产生的疑问，或者是用户想具体了解该某一个问题在播放过程中提到的某些内容，那么自动外呼系统此时会立刻停止播放该音频问题集，并将当前通话转移到人工坐席进行处理，通过人工坐席来完成对用户的打断语音的处理，并进一步由人工完成对没有播放完的音频问题集的处理，提高了用户的使用体验性。

进一步地，本申请一实施例中，上述步骤s4之后，包括：

s430：在播放完所述音频问题集中的一个问题音频后，判断是否在指定时间内接收到所述第一语音识别引擎反馈的识别结果，其中所述识别结果为第一语音识别引擎在接收到所述用户对于所述问题音频的应答语音后，对所述问题音频的应答语音进行识别后得出的结果；

s431：若否，将当前通话转移到人工坐席进行处理。

本实施例中，设置一个指定时间，该指定时间指代的是语音识别引擎模块对用户关于音频问题集中的一个问题音频所反馈的对应的应答语音进行识别并的得出识别结果所需要的识别时间。在本实施例，在播放完所述音频问题集中的音频问题后，通过判断在指定时间内接收到所述第一语音识别引擎反馈的识别结果该指定时间可设置为2分钟，如果在2分钟内没有收到第一语音识别引擎模块在接收到所述用户对于音频问题的应答语音后，并对音频问题的应答语音进行识别后得出的识别结果，则证明此时第一语音识别引擎模块无法对用户的应答语音集进行识别，即第一语音识别引擎模块可能出现了故障，为了避免后续与用户的通话不顺畅，此时会将当前通话转接到人工坐席，以便通过人工处理的方法与用户完成后续的交流，来保证用户的使用体验。

参照图4，本申请一实施例中还提供了一种基于自动外呼系统的语音处理装置，应用于自动外呼系统，包括：

第一获取模块1，用于获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

确定模块2，用于根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；

第一判断模块3，用于判断与所述终端是否呼通；

调用模块4，用于若是，调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块，其中所述语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，所述音频问题集包含一个或多个音频文件，一个音频文件对应一个问题；

播放模块5，用于对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果，在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。

在上述第一获取模块和确定模块中，自动外呼系统是指采用计算机替代坐席，用计算机拨叫用户号码并与用户对话，通过语音识别技术来完成特定任务的一种应用系统。上述的用户为自动外呼系统需要执行自动外呼任务的指定用户，举例地，该指定用户可为成功办理了某种业务的用户，需要进一步进行回访，来咨询该指定用户对于办理的业务的满意度；或者该指定用户为可能有意愿办理某些业务的潜在用户，通过对这些潜在用户执行自动外呼任务，来向该潜在用户推荐办理相关的业务。自动外呼系统可通过访问外呼数据库，来获取用户的数据信息。其中，外呼数据库里记录有该用户的数据信息，该数据信息包括电话号码及业务数据。进一步地，根据该业务数据可确定出与该用户相关的第一业务类型，其中，该业务数据包括用户的个人信息以及用户办理过的业务的相关信息，个人信息可包括个人年龄、收入、经济情况等信息，根据用户的个人信息可对应推荐办理相关的业务；另外，用户办理过的业务的相关信息可包括用户成功办理了某某业务或者用户取消办理了某某业务，根据用户办理过的业务的相关信息可对应进行业务回访，来了解用户的需求与意见。举例地，上述第一业务类型可包括回访业务、销售业务、催费催缴业务等等，在获取了该用户的电话号码后，便可向与该电话号码对应的终端发起呼叫的自动外呼任务。

在上述第一判断模块和调用模块中，自在与用户的终端呼通成功后，自动外呼系统会调用出与第一业务类型对应的音频问题集和第一语音识别引擎模块，以便后续进行与用户的交互。其中，对于不同的业务类型，管理人员会预先设置好与各种业务类型相对应的各种问题集，并对该各种问题集进行录音得到对应的各种音频问题集，之后将各该音频问题集输入至自动外呼系统，由自动外呼系统保存至音频数据库中。其中，音频问题集的音频文件的数量根据实际情况确定，可包含一个或多个音频文件，且一个音频文件对应一个问题。举例地，假如业务类型为回访类型，则回访业务的对应的音频问题集的内容可设置为：“请问投保人是否为xxx”、“被保险人为xxx、年龄xxx、地址为xxx，以上信息是否正确”、“请问您是否已认真阅读保单的条款，并且充分了解这款保险产品”、“您是否了解这款保险产品的交费年限、交费金额、保障年限、犹豫期、中途退保损失等详细信息”、“您对这款保险产品是否满意”、“您对本公司的工作有何意见或建议”等。另外，第一语音识别引擎模块是从语音识别引擎中调用出的，语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，该语音识别引擎模块的数量与业务类型的数量相同，对每一种业务类型配置一个语音识别引擎模块，且语音识别引擎模块内包含有与业务类型相关的语言模型。在本实施例，当与该用户的电话号码对应的终端成功呼通后，则会向上述音频数据库调用出与该第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与该第一业务类型对应的第一语音识别引擎模块，来实现后续与用户关于该第一业务类型的信息交互。

在上述播放模块中，自动外呼系统在调用出与第一业务类型对应的音频问题集后，由于音频问题集中包含有按一定顺序排列的一个或多个音频文件，且一个音频文件对于一个问题，便会按该顺序依次向用户播放该音频问题集中的每一个问题，在播放完一个问题后，接收用户返回的对于该一个问题的第一应答语音，并通过调用出的第一语音识别引擎模块对用户返回的第一应答语音进行识别，识别完成之后便会播放下一个问题，播完结束后，再接收用户对于该下一个问题的第二应答语音，再通过调用出的第一语音识别引擎模块对用户返回的第二应答语音进行识别，依此循环，直至将音频问题集中所有的问题播放完毕，并且对接收到的用户对于该所有的问题返回的所有的应答语音进行识别。自动外呼系统会将语音识别引擎设置为对应数量的多个语音识别引擎模块，即每一种业务类型会对应设置有一个语音识别引擎模块，且每一个语音识别引擎模块内还对应设置有一个语言模型，以便通过语音识别引擎模块内的语言模型来对用户对于音频问题集中的问题所反馈的应答语音进行识别。在本实施例，在接收到用户对于音频问题集中的第一问题反馈的第一应答语音后，自动外呼系统会通过调用出的与第一业务类型对应的第一语音识别引擎模块内第一语言模型来对该第一应答语音进行识别，并通过该第一语言模型来实现对该第一应答语音识别。相比于整体调用一个语音识别引擎来识别所有的业务的语音，本实施例通过将语音识别引擎设置为与业务类型对应的多个的语音识别引擎模块，并调用对应的语音识别引擎模块来对用户对于音频问题集所反馈的应答语音进行识别，能快速高效地对用户对于音频问题集所反馈的应答语音的内容进行识别，提高了用户的应答语音的识别准确率，也有利于准确了解用户对于本次自动外呼任务所作出的反馈。

进一步地，本申请一实施例中，上述基于自动外呼系统的语音处理装置，还包括：

第二获取模块，用于获取所有业务的信息数据，其中所述信息数据包括业务名称；

标记模块，用于根据所述业务性质，将具有相同或相似的业务性质的业务标记为同一种业务类型；设置模块，用于根据所述业务类型的数量，将所述语音识别引擎设置为对应数量的语音识别引擎模块，其中所述语音识别引擎模块内设置有与所述业务类型对应的语言模型。

本实施例中，上述信息数据包括各种业务的业务性质，在获取了所有的业务的业务性质后，将一些将具有相同或相似的业务性质的业务标记归类为同一种业务类型，举例地，在获取了所有的业务的业务数据后，得出当前共有7种业务，包括新契约回访、离司业务员保单回访、失效保单回访、给付业务回访、意外险销售、车险销售、分红险销售等业务等，由于新契约回访、离司业务员保单回访、失效保单回访和给付业务回访的业务性质都属于回访性质的业务，则可将新契约回访、离司业务员保单回访、失效保单回访、给付业务回访标记为同一种业务类型，即回访类型；而意外险销售、车险销售、分红险销售都属于销售性质的业务，则将意外险销售、车险销售、分红险销售等业务标记为销售类型，这样便将全部的7种业务标记为了两种业务类型，回访类型和销售类型。在另一个实施例中，上述信息数据还可包括业务名称，通过对所有业务的业务名称进行关键词提取，并将具有相同的关键词的多种业务标记为同一种业务类型，举例地，当前有意外险销售、车险销售、新契约回访、给付业务回访四种业务，对这四种业务提取出关键词并进行分析，由于意外险销售、车险销售具有相同的关键词“销售”，则可将意外险销售、车险销售标记为销售类型；由于新契约回访、给付业务回访具有相同的关键词“回访”，则可将新契约回访、给付业务回访标记为回访类型。在上述设置模块中，现有技术中，当语音识别引擎在进行识别工作时，如果从一个领域切换到另一个领域，会导致语音识别引擎的性能急剧下降，且一些术语和新词可能总会无法正常识别，而为了支持多个领域的识别，通常会使用一个语言模型来同时建模多个领域的词语的分布信息，这样会使得该语言模型的概率分别比较平均，即该语音识别引擎的识别性能通常也比较平均，且该语音识别引擎比较庞大，整体调用该语音识别引擎时加载速度会很慢且非常耗费时间和资源。故本实施例中，根据该业务类型的数量，将语音识别引擎设置为对应数量的语音识别引擎模块，即为每一种业务类型配置一个语音识别引擎模块，且语音识别引擎模块内包含有与业务类型相关的语言模型。通过调用专门的语音识别模块来对相应的业务类型进行识别，同一个业务类型的业务可以使用同一个语音识别引擎模块，而不需要为每一个业务配置一个语音识别引擎模块，提高了每种语音识别引擎模块的资源使用率，也提高了语音识别的准确率。

进一步地，本申请一实施例中，上述基于自动外呼系统的语音处理装置，还包括：

第一接收模块，用于接收管理人员输入的与各所述业务类型对应的音频问题集，并保存至音频数据库；

采集模块，用于根据所述音频问题集，采集与所述音频问题集相对应的回答文字；

输入模块，用于将所述回答文字输入到对应的语言识别引擎模块的语言模型内。

进一步地，本申请一实施例中，上述调用模块，包括：

选取单元，用于从预设的多种语法路径中选取出与所述第一业务类型对应的第一语法路径，其中所述语法路径与所述业务类型一一对应；

调用单元，用于通过所述第一语法路径从所述语音识别引擎中调用出与所述第一业务类型对应的所述第一语音识别引擎模块。

进一步地，本申请一实施例中，上述基于自动外呼系统的语音处理装置，还包括：

第二接收模块，用于接收由所述第一语音识别引擎模块发送的对于应答语音集的识别结果，其中所述应答语音集包括所述用户对于所述音频问题集中所有的问题反馈的对应的所有的应答语音；

提取模块，用于提取所述识别结果的目标关键词；

匹配模块，用于将所述目标关键词与预设关键词集内的关键词进行匹配，并根据匹配情况得出外呼结果；

备注模块，用于根据所述外呼结果对所述自动外呼任务进行标记和备注。

进一步地，本申请一实施例中，上述基于自动外呼系统的语音处理装置，还包括：

第二判断模块，用于在对所述音频问题集的问题进行播放的过程中，判断是否监听到所述用户发出的打断语音；

停止模块，用于若是，停止播放所述音频问题集，并将当前通话转移到人工坐席进行处理。

进一步地，本申请一实施例中，上述基于自动外呼系统的语音处理装置，还包括：

第三判断模块，用于在播放完所述音频问题集中的一个音频问题后，判断是否在指定时间内接收到所述第一语音识别引擎反馈的识别结果，其中所述识别结果为第一语音识别引擎在接收到所述用户对于所述音频问题的应答语音后，对所述音频问题的应答语音进行识别后得出的结果；

转移模块，用于若否，将当前通话转移到人工坐席进行处理。

本实施例中，设置一个指定时间，该指定时间指代的是语音识别引擎模块对用户关于音频问题集中的一个音频问题所反馈的对应的应答语音进行识别并的得出识别结果所需要的识别时间。在本实施例，在播放完所述音频问题集中的音频问题后，通过判断在指定时间内接收到所述第一语音识别引擎反馈的识别结果该指定时间可设置为2分钟，如果在2分钟内没有收到第一语音识别引擎模块在接收到所述用户对于音频问题的应答语音后，并对音频问题的应答语音进行识别后得出的识别结果，则证明此时第一语音识别引擎模块无法对用户的应答语音集进行识别，即第一语音识别引擎模块可能出现了故障，为了避免后续与用户的通话不顺畅，此时会将当前通话转接到人工坐席，以便通过人工处理的方法与用户完成后续的交流，来保证用户的使用体验。

参照图5，本申请实施例中还提供一种计算机设备，该计算机设备可以是服务器，其内部结构可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中，该计算机设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储用户的数据信息以及业务类型等数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于自动外呼系统的语音处理方法。

上述处理器执行上述基于自动外呼系统的语音处理方法的步骤，包括：

获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；

判断与所述终端是否呼通；

若是，用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块，其中所述语音识别引擎包括对应不同业务类型的多个语音识别引擎模块，所述音频问题集包含一个或多个音频文件，一个音频文件对应一个问题；

对所述音频问题集中的问题进行播放，每当播放完所述音频问题集中的第一问题后，接收所述用户反馈的与所述第一问题对应的第一应答语音，并通过所述第一语音识别引擎模块对所述第一应答语音进行识别，以得到第一识别结果；在接收到所述第一识别结果后，播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕。

在一实施例中，上述根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务的步骤之前，包括：

获取所有业务的信息数据，其中所述信息数据包括业务性质；

根据所述业务性质，将具有相同或相似的业务性质的业务标记为同一种业务类型；

在一实施例中，上述调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤之前，包括：

接收管理人员输入的与各所述业务类型对应的音频问题集，并保存至音频数据库；

根据所述音频问题集，采集与所述音频问题集相对应的回答文字；

将所述回答文字输入到对应的语言识别引擎模块的语言模型内。

在一实施例中，上述从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤，包括：

从预设的多种语法路径中选取出与所述第一业务类型对应的第一语法路径，其中所述语法路径与所述业务类型一一对应；

通过所述第一语法路径从所述语音识别引擎中调用出与所述第一业务类型对应的所述第一语音识别引擎模块。

在一实施例中，上述在接收到所述第一识别结果后播放所述音频问题集中的第二问题，依此循环，直至将所述音频问题集中所有的问题播放完毕的步骤之后，包括：

提取所述识别结果的目标关键词；

将所述目标关键词与预设关键词集内的关键词进行匹配，并根据匹配情况得出外呼结果；

根据所述外呼结果对所述自动外呼任务进行标记和备注。

在一实施例中，上述调用与所述第一业务类型对应的音频问题集，以及从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤之后，包括：

在对所述音频问题集的问题进行播放的过程中，判断是否监听到所述用户发出的打断语音；

若是，停止播放所述音频问题集，并将当前通话转移到人工坐席进行处理。

若否，将当前通话转移到人工坐席进行处理。

本领域技术人员可以理解，图5中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定。

本申请一实施例还提供一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时实现一种基于自动外呼系统的语音处理方法，具体为：

获取用户的数据信息，其中，所述数据信息包括电话号码及业务数据；

根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；

判断与所述终端是否呼通；

获取所有业务的信息数据，其中所述信息数据包括业务性质；

根据所述业务性质，将具有相同或相似的业务性质的业务标记为同一种业务类型；

接收管理人员输入的与各所述业务类型对应的音频问题集，并保存至音频数据库；

根据所述音频问题集，采集与所述音频问题集相对应的回答文字；

将所述回答文字输入到对应的语言识别引擎模块的语言模型内。

在一实施例中，上述从语音识别引擎中调用出与所述第一业务类型对应的第一语音识别引擎模块的步骤，包括：

从预设的多种语法路径中选取出与所述第一业务类型对应的第一语法路径，其中所述语法路径与所述业务类型一一对应；

通过所述第一语法路径从所述语音识别引擎中调用出与所述第一业务类型对应的所述第一语音识别引擎模块。

提取所述识别结果的目标关键词；

将所述目标关键词与预设关键词集内的关键词进行匹配，并根据匹配情况得出外呼结果；

根据所述外呼结果对所述自动外呼任务进行标记和备注。

在对所述音频问题集的问题进行播放的过程中，判断是否监听到所述用户发出的打断语音；

若是，停止播放所述音频问题集，并将当前通话转移到人工坐席进行处理。

若否，将当前通话转移到人工坐席进行处理。

综上所述，本申请中提供的基于自动外呼系统的语音处理方法、装置和计算机设备，获取用户的数据信息；根据所述业务数据确定与所述用户相关联的第一业务类型，并执行向与所述电话号码对应的终端发起呼叫的自动外呼任务；判断与所述终端是否呼通；若是，播放与所述第一业务类型对应的音频问题集；接收所述用户对于所述音频问题集反馈的应答语音集，并调用与所述第一业务类型对应的第一语音识别引擎模块对所述应答语音集进行识别。本申请通过将语音识别引擎设置为与业务类型对应的多个的语音识别引擎模块，并调用对应的语音识别引擎模块来对用户对于音频问题集所反馈的应答语音进行识别，能快速高效地对用户对于音频问题集所反馈的应答语音的内容进行识别，提高了对用户的应答语音的识别准确率，也有利于准确了解用户对于本次自动外呼任务所作出的反馈。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，所述的计算机程序可存储与一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用，均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限，ram通过多种形式可得，诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双速据率sdram(ssrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。

需要说明的是，在本文中，术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素，而且还包括没有明确列出的其它要素，或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。

以上所述仅为本申请的优选实施例，并非因此限制本申请的专利范围，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，均同理包括在本申请的专利保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：张垒;邹芳;李晋;占敏敏;张裕生
技术所有人：平安科技（深圳）有限公司
我是此专利的发明人

上一篇：一种应用程序的生成方法及设备与流程
上一篇：一种RGO@Au复合纳米材料的合成方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。