一种呼叫中心系统及其语音交互方法、装置和设备与流程

文档序号：15878592发布日期：2018-11-09 17:27阅读：181来源：国知局

本申请涉及智能通信技术领域，特别涉及一种呼叫中心系统及其语音交互方法、装置、设备及计算机可读存储介质。

背景技术

呼叫中心系统是一种利用计算机通信技术、以呼叫通话的方式为用户提供服务的综合信息服务系统。

呼叫中心系统的呼叫模式有呼入和外呼两种，呼入模式即接听用户发起的呼叫，以便对用户的电话垂询进行服务响应；外呼模式即主动向用户发起呼叫，以便与用户进行相关业务信息沟通。由于许多话务内容实际上是将同样的内容简单复述给不同的用户，因此随着呼叫和各类服务应答的增多，交互式语音应答(interactivevoiceresponse，ivr)技术应运而生，它可以将一些客户常见问题的应答处理由“机器话务员”代替人工坐席来实现，从而解放人力，并提高服务效率。

但是，现有技术中的交互式语音应答过程中，“机器话务员”的应答语音过于生硬呆板，以至于用户立刻便能分辨出当前是机器应答而非人工应答，极大地降低了用户体验。

可见，采用何种语音交互方法，以便令机器应答语音具有真人语音的音色和音调，以增强应答时的语言亲和力进而提高用户体验，是本领域技术人员所亟待解决的技术问题。

技术实现要素：

本申请的目的在于提供一种呼叫中心系统及其语音交互方法、装置、设备及计算机可读存储介质，以便有效增强机器应答时的语言亲和力，进而提高用户体验。

为解决上述技术问题，本申请提供一种语音交互方法，包括：

在通话对象与所述呼叫中心系统间的通话线路信号接通后，确定第一人工坐席；

从预先存储的tts真人语音库集中查找所述第一人工坐席的tts真人语音库；

在接收到所述通话对象的语音信号后，调用语音识别模块对所述语音信号进行语音识别，以获取所述通话对象的通话内容；

调用预设的语音应答规则算法，确定与所述通话内容对应的应答脚本文件；

调用所述第一人工坐席的tts真人语音库，将所述应答脚本文件的内容语音回复所述通话对象。

可选地，还包括：

在所述调用语音识别模块对所述语音信号进行语音识别失败后，调用所述第一人工坐席的tts真人语音库，向所述通话对象语音请求再次获取所述语音信号。

可选地，所述确定第一人工坐席包括：

将当前在线且在线时长最短的人工坐席确定为所述第一人工坐席。

可选地，还包括：

在所述调用预设的语音应答规则算法，确定与所述通话内容对应的应答脚本文件失败后，将所述通话线路信号转接至所述第一人工坐席，以便由所述第一人工坐席继续语音应答所述通话对象。

可选地，在所述将所述通话线路信号转接至所述第一人工坐席，以便由所述第一人工坐席继续语音应答所述通话对象之后，还包括：

根据所述第一人工坐席的应答内容更新所述预设的语音应答规则算法。

可选地，所述调用语音识别模块对所述语音信号进行语音识别，以获取所述通话对象的通话内容包括：

利用所述语音识别模块中的语音检测单元获取所述语音信号所表述的文本内容；

对所述文本内容进行分词分析、实词识别分析和句法分析，以便获取所述文本内容的语意信息。

本申请还提供了一种语音交互装置，应用于呼叫中心系统中的互动式语音应答设备，包括：

确定模块：用于在通话对象与所述呼叫中心系统间的通话线路信号接通后，确定第一人工坐席；

查找模块：用于从预先存储的tts真人语音库集中查找所述第一人工坐席的tts真人语音库；

接听模块：用于在接收到所述通话对象的语音信号后，调用语音识别模块对所述语音信号进行语音识别，以获取所述通话对象的通话内容；

处理模块：用于调用预设的语音应答规则算法，确定与所述通话内容对应的应答脚本文件；

回复模块：用于调用所述第一人工坐席的tts真人语音库，将所述应答脚本文件的内容语音回复所述通话对象。

本申请还提供了一种语音交互设备，包括：

存储器：用于存储计算机程序；

处理器：用于执行所述计算机程序以实现如上所述的任一种语音交互方法的步骤。

本申请还提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有计算机程序，所述计算机程序被处理器执行时用以实现如上所述的任一种语音交互方法的步骤。

本申请还提供了一种呼叫中心系统，包括如上所述的语音交互设备。

本申请所提供的语音交互方法包括：在通话对象与所述呼叫中心系统间的通话线路信号接通后，确定第一人工坐席；从预先存储的tts真人语音库集中查找所述第一人工坐席的tts真人语音库；在接收到所述通话对象的语音信号后，调用语音识别模块对所述语音信号进行语音识别，以获取所述通话对象的通话内容；调用预设的语音应答规则算法，确定与所述通话内容对应的应答脚本文件；调用所述第一人工坐席的tts真人语音库，将所述应答脚本文件的内容语音回复所述通话对象。

可见，相比于现有技术，本申请所提供的语音交互方法中，通过语音识别技术获取通话对象的通话内容，并利用tts真人语音库将对应的应答脚本文件合成语音后回复给通话对象，从而可代替人工完成与通话对象间的语音交互过程。由于tts真人语音库的使用，本申请得到的合成语音具备了真人语音的音色语调等，有效提升了语言亲和力，甚至令通话对象以为是人工坐席的应答，极大地提高了用户体验。本申请所提供的呼叫中心系统及其语音交互装置、设备及计算机可读存储介质可以实现上述语音交互方法，同样具有上述有益效果。

附图说明

为了更清楚地说明现有技术和本申请实施例中的技术方案，下面将对现有技术和本申请实施例描述中需要使用的附图作简要的介绍。当然，下面有关本申请实施例的附图描述的仅仅是本申请中的一部分实施例，对于本领域普通技术人员来说，在不付出创造性劳动的前提下，还可以根据提供的附图获得其他的附图，所获得的其他附图也属于本申请的保护范围。

图1为本申请所提供的一种语音交互方法的流程图；

图2为本申请所提供的一种语音交互装置的结构框图。

具体实施方式

本申请的核心在于提供一种呼叫中心系统及其语音交互方法、装置、设备及计算机可读存储介质，以便有效增强机器应答时的语言亲和力，进而提高用户体验。

为了对本申请实施例中的技术方案进行更加清楚、完整地描述，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行介绍。显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

为了令作为“机器话务员”的互动式语音应答设备具有和真人语音类似的音色声调，本申请所提供的语音交互方法中，具体使用了来自人工坐席的tts(texttospeech，文本转语音)真人语音库，并令互动式语音应答设备通过tts真人语音库来合成亲和力较强、较为接近真人的语音与用户进行语音互动，以有效增强用户体验。

请参考图1，图1为本申请所提供的一种语音交互方法的流程图，应用于呼叫中心系统中的互动式语音应答设备，主要包括以下步骤：

步骤1：在通话对象与呼叫中心系统间的通话线路信号接通后，确定第一人工坐席。

步骤2：从预先存储的tts真人语音库集中查找第一人工坐席的tts真人语音库。

具体地，本申请所提供的语音交互方法中，预先建立并存储有tts真人语音库集，其中包括来自各位人工坐席的tts真人语音库。当通话对象与呼叫中心系统间的通话拨通后，便可以先挑选出一个人工坐席，即所说的第一人工坐席，然后便可以查找该第一人工坐席的tts真人语音库，以便利用该第一人工坐席的tts真人语音库来合成语音与通话对象进行应答，即“模仿”第一人工坐席与通话对象进行语音互动。需要说明的是，这里所说的第一人工坐席可以为任何一个人工坐席，而非特指某一个固定的人工坐席。

本申请中的tts真人语音库采用的tts技术是一种同时结合了语言学、心理学和计算机学的技术，它可以将文字智能地转化为自然语音流，转换时间短至可以以秒计算。通过采用tts真人语音库来合成语音，可以令输出的语音音律流畅，听起来亲切自然，接近真人语音，而无机器语音的呆板、冷漠和生涩感。

步骤3：在接收到通话对象的语音信号后，调用语音识别模块对语音信号进行语音识别，以获取通话对象的通话内容。

具体地，语音识别(automaticspeechrecognition，asr)技术是一个多学科交叉的领域，它与声学、语音学、语言学、信息论和计算机学等众多学科紧密相连。在与通话对象进行语音交互过程中，需要从通话的语音信号中获取其传达的内容信息，因此可调用语音识别模块对通话对象的通话内容进行语音识别。

步骤4：调用预设的语音应答规则算法，确定与通话内容对应的应答脚本文件。

具体地，当获取到通话对象的通话内容之后，便可以确定出对应的应答脚本文件。应答脚本文件是预先准备好的各种话术脚本，无论是在外呼模式中向通话对象进行产品推广，还是在呼入模式中为通话对象提供咨询等服务时，呼叫中心处的话术内容都是有一定章程和规范模板的，因此，可预先设计好用户可能会询问或者回答的内容，制定出对应的规范应答文本，并设计语音应答规则算法，以便确定用户通话内容与应答脚本文件之间的对应关系。

至于应答脚本文件的具体内容，本领域技术人员可以根据实际业务情况自行设定，本申请对此并不进行限定。此外，如前所述，本申请所提供的语音交互方法既可用于呼叫中心系统的外呼模式，也可以用于呼入模式；并且，所说的外呼模式具体还可以为自动外呼模式，即无需人工呼叫而由呼叫中心系统主动拨打通话对象号码的呼叫模式。

步骤5：调用第一人工坐席的tts真人语音库，将应答脚本文件的内容语音回复通话对象。

当确定了需要向通话对象应答的应答脚本文件之后，便可以利用已经查找确定的第一人工坐席的tts真人语音库向通话对象进行语音回复。由于调用了第一人工坐席的tts真人语音库，因此，此时对于另一端的通话对象来说，其听到的声音和第一人工坐席的声音十分接近，在无法感知人声和机器合成语音间的差别时，通话对象甚至一般会自然而然地认为此时应答的是人工坐席。

可见，本申请实施例所提供的语音交互方法中，通过语音识别技术获取通话对象的通话内容，并利用tts真人语音库将对应的应答脚本文件合成语音后回复给通话对象，从而可代替人工完成与通话对象间的语音交互过程。由于tts真人语音库的使用，本申请得到的合成语音具备了真人语音的音色语调等，有效提升了语言亲和力，甚至令通话对象以为是人工坐席的应答，极大地提高了用户体验。

本申请所提供的语音交互方法，在上述实施例的基础上：

作为一种优选实施例，还包括：

在调用语音识别模块对语音信号进行语音识别失败后，调用第一人工坐席的tts真人语音库，向通话对象语音请求再次获取语音信号。

具体地，在实际通话过程中，经常会由于各种影响因素的作用而使得通话质量降低，例如，通话线路的信号不稳定，或者通话对象所处的环境嘈杂，又或者通话对象发音不清楚等等，这些无疑都增加了语音识别的难度。因此，当语音识别失败之后，可以进一步请求通话对象复述下刚才的通话内容，以便再次进行语音识别。当然，至于具体如何语音请求通话对象复述，本领域技术人员可以根据实际应用情况自行选择并设置，例如，可采用内容为“不好意思，刚才我没有听清楚，能麻烦您复述一遍么”等的应答脚本，本申请实施例对此并不进行限定。

作为一种优选实施例，确定第一人工坐席包括：

将当前在线且在线时长最短的人工坐席确定为第一人工坐席。

具体地，呼叫中心一般均有大量的人工坐席轮班，因此，当从中选择出一个作为所说的第一人工坐席时，具体可以选择当前时刻在线工作的人工坐席，以便时刻准备由该人工坐席进行人工应答。并且，推荐但不限于选择在线时长最短的人工坐席，以便合理均衡各个人工坐席的语音在机器应答中的出现频率，给通话对象营造出由真实人工坐席应答的交互体验。

当然，本领域技术人员还可以采用其他标准选择出第一人工坐席，本申请实施例对此并不进行限定。

作为一种优选实施例，还包括：

在调用预设的语音应答规则算法，确定与通话内容对应的应答脚本文件失败后，将通话线路信号转接至第一人工坐席，以便由第一人工坐席继续语音应答通话对象。

具体地，由于实际问题的复杂性和多样性，最初所预先所设置的应答脚本文件很可能是不够完善的，因此可能无法解决通话对象所提出的某些服务要求或问题，所以，本申请所提供的语音交互方法在适当的时候还可再转由人工坐席提供专业准确的服务。具体地，当当前语音应答规则算法无法匹配出与通话对象的通话内容对应的应答脚本文件时，可将通话线路转接至第一人工坐席，进而由第一人工坐席为通话对象提供人工服务。由于转接前的机器应答采用的是第一人工坐席的tts真人语音库，因此本申请可以实现无感知的人机转接切换，转接前后衔接的语音差异十分微弱，以至于通话对象根本不会察觉，从而可获得良好的语音交互体验。

作为一种优选实施例，在将通话线路信号转接至第一人工坐席，以便由第一人工坐席继续语音应答通话对象之后，还包括：

根据第一人工坐席的应答内容更新预设的语音应答规则算法。

具体地，本申请所提供的语音交互方法还可以进一步通过学习来提高互动应答能力。当转由人工坐席进行人工服务之后，可以将人工坐席的应答内容作为处理规范标准来更新语音应答规则算法，以便在通话对象再次提出同一问题时，由互动式语音应答设备通过调用更新后的语音应答规则算法即可进行应答，而无需转至人工坐席。甚至，还可以由专人负责对补充录入的处理规范标准和更新后的语音应答规则算法进行审核确认等。由此通过不断地学习和补充，可不断降低人工坐席的转接概率，进一步为人工坐席留有更富余的时间处理其他一些需要人工处理的业务事项，以降低人力成本并提升整体业务效率。

作为一种优选实施例，调用语音识别模块对语音信号进行语音识别，以获取通话对象的通话内容包括：

利用语音识别模块中的语音检测单元获取语音信号所表述的文本内容；

对文本内容进行分词分析、实词识别分析和句法分析，以便获取文本内容的语意信息。

具体地，本申请所提供的语音交互方法中，在通过语音识别来获取通话对象的通话内容时，可具体结合分词分析、实词识别分析和句法分析等方法来分析通话对象的语音文本，从而识别语音文本的句意，而不仅仅只是针对于某些特定词语的识别。通过完整的语意分析，可准确获取到通话对象的表达意图，避免断章取义，进而作出对应的语音应答，有效地提高了语音交互过程中的准确率。

下面对本申请实施例所提供的语音交互装置进行介绍。

请参阅图2，图2为本申请所提供的一种语音交互装置的结构框图；应用于呼叫中心系统中的互动式语音应答设备，包括确定模块1、查找模块2、接听模块3、处理模块4和回复模块5；

确定模块1用于在通话对象与呼叫中心系统间的通话线路信号接通后，确定第一人工坐席；

查找模块2用于从预先存储的tts真人语音库集中查找第一人工坐席的tts真人语音库；

接听模块3用于在接收到通话对象的语音信号后，调用语音识别模块对语音信号进行语音识别，以获取通话对象的通话内容；

处理模块4用于调用预设的语音应答规则算法，确定与通话内容对应的应答脚本文件；

回复模块5用于调用第一人工坐席的tts真人语音库，将应答脚本文件的内容语音回复通话对象。

可见，本申请所提供的语音交互装置，通过语音识别技术获取通话对象的通话内容，并利用tts真人语音库将对应的应答脚本文件合成语音后回复给通话对象，从而可代替人工完成与通话对象间的语音交互过程。由于tts真人语音库的使用，本申请得到的合成语音具备了真人语音的音色语调等，有效提升了语言亲和力，甚至令通话对象以为是人工坐席的应答，极大地提高了用户体验。

本申请还提供了一种语音交互设备，包括：

存储器：用于存储计算机程序；

处理器：用于执行所述计算机程序以实现如上所述的任一种语音交互方法的步骤。

本申请还提供了一种呼叫中心系统，包括如上所述的语音交互设备。

本申请所提供的呼叫中心系统及其语音交互装置、设备及计算机可读存储介质的具体实施方式与上文所描述的语音交互方法可相互对应参照，这里就不再赘述。

本申请中各个实施例采用递进的方式描述，每个实施例重点说明的都是与其他实施例的不同之处，各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言，由于其与实施例公开的方法相对应，所以描述的比较简单，相关之处参见方法部分说明即可。

还需说明的是，在本申请文件中，诸如“第一”和“第二”之类的关系术语，仅仅用来将一个实体或者操作与另一个实体或者操作区分开来，而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。此外，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上对本申请所提供的技术方案进行了详细介绍。本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想。应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以对本申请进行若干改进和修饰，这些改进和修饰也落入本申请权利要求的保护范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱宇光
技术所有人：上海航动科技有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。