用于处理多个流式语音信号的方法及设备的制作方法

文档序号：2832257阅读：152来源：国知局

专利名称：用于处理多个流式语音信号的方法及设备的制作方法
技术领域：
本公开一般地涉及处理多个流式语音信号的技术，并且更具体地，涉及确定针对其的响应动作的技术。
背景技术：
联络中心(或呼叫中心)是现有技术中公知的代表特别用于应对来自客户或其他感兴趣方(以下统称为"呼叫者")的大量呼入请求、投诉、询问等的机构。尽管在联络中心中可以经由各种通道 (例如，电子邮件、短消息服务、邮寄等)接收此类通信，但是大部分常常是以语音信号的形式来接收的，例如向联络中心发出的电话呼叫。
在历史上，联络中心出于合^L (compliance)和质量(quality) 的目的已经记录了它们的呼叫者交互。合规表示关于记录呼叫供未来验证的某些法律/规章的要求，例如应该记录银行的所有在线金融交易。类似地，质量表示为了确保联络中心代理至少满足最小标准所需的那些动作。通常，联络中心随才几地记录它们的呼入呼叫中的大约3%-4% (除了代理出于合规的目的而记录100%的例外情况)。即使存储这样小百分比的呼叫也可能是昂贵的，并且识别此类存储的呼叫内的问题或难题可能就像是"大海撈针"。另外，由于对呼叫的分析是在既成事实后进行的，联络中心失去了在问题发生时，即，当客户交互正在发生时，解决问题的机会。此外，试图对已经发生并且识别出的问题作出改正将导致额外的费用，在某些情况下，破坏可能已经造成(例如，呼叫者的猜疑已经产生，失去客户忠诚度等)。
因此，提供克服现有技术的这些限制的技术是有益的。

发明内容
本公开描述了用于处理语音信号的技术，以便确定是否需要保存此类语音信号供后续分析，并且，优选地在此类语音信号仍在被接收时，部署一个或多个响应动作。如这里所述，分析流式语音信号(例如在联络中心处可能接收或类似操作的流式语音信号)以检测一个或多个自发的、预定话语的出现。优选地，预定话语构成单词和/或短语的词汇表，该单词和/或短语在它们所在的环境内具有特定的含义。例如，在潜在客户请求关于商品或服务的信息的呼叫期间，某些单词或短语可能特别重要，而在请求帮助的紧急呼叫期间，完全不同的单词或短语可能变得重要。在呼叫期间检测到一个或多个预定话语SI起对纟佥测到的话语的决定响应的重要性
(response-determinative significance )进4亍确定。基于才企测到的话语的决定响应的重要性，可以进一步确定响应动作。另外，还可以启动对应于检测到话语的呼叫的长期存储器。反之，可以从短期存储器中删除没有检测到预定话语的呼叫。通过这种方式，本发明简化了针对联络中心的存储要求，并且通过对潜在问题情况提供较短的反应时间，提供了改善呼叫者体验的机会。

本公开中描述的特征被记载在所附权利要求的特征部分。通过考虑下面结合附图的详细描述，这些特征和伴随的优势将变得明显。现在将仅作为示例并参考附图来描述一个或多个实施方式，附图中类似的参考标号代表类似的单元，并且其中
图1是根据这里所述的各种实施方式的系统的示意框图；图2是适于实施这里所述的各种实施方式的设备的示意框图；图3是示出根据这里所述的一个实施方式的识别器的实现的框
图4是示出根据这里所述的一个实施方式的处置处理器的实现的框图5是示出根据这里所述的一个实施方式的系统级处理的流程
图6是示出根据这里所述的一个实施方式的识别器所执行的处理的流程图；以及
图7是示出根据这里所述的一个实施方式的处置处理器所执行的处理的流程图。
具体实施例方式
现在参考图1,其示出了根据这里所述的各种实施方式的系统 100。具体地，系统100包括多个通信设备102,其经由中间网络106、 108来与联络中心104通信。通常，通信设备102可以包括能够以任意便利格式将语音信号通过网络106、 108传输到联络中心104的任意设备(当由用户或呼叫者操作时)。另外，通信设备102能够向联络中心104提供非语音信号，例如电子输入。例如，通信设备可以包括具有生成所谓的双音多频(DTMF)音能力的传统有线电话或移动无线设备、或也包括典型用户输入装置(例如，键盘、鼠标和光标等)的配置有麦克风的计算机、或类似设备。优选地，可以用合适的数字格式来提供由通信设备102提供的语音信号，然而应该理解，倘若在下文描述的分析之前使用合适的模数转换能力，也可以使用模拟信号。
通信网络可以包括用于在通信设备102和联络中心104之间传送语音(并且，可选地，传送数据)的任意合适网络。本公开不受网络106、 108的特定实现的限制。例如，在图l中示出了两种公知类型的网络，分组交换网络106和电路交换网络108。合适的分组交换网络的例子包括但不限于基于网际协议(IP)的网络，而电路交
换网络的例子包括但不限于公共交换电话网络(PSTN)。尽管在图中单独示出，但本领域技术人员将理解此类网络106、 108也可以根据需要或期望进行组合。此外，同样还也可以使用有线或无线网络，或它们的组合。
联络中心104优选地包括各种互联能力，如图1中以简化形式所示出的。具体地，语音网关IIO接收来自网络106、 108的信号，这些信号可以涉及如下所讨论的任意或所有的呼入语音信号和电子输入，例如DTMF音、短消息服务(SMS)消息、电子邮件、web 形式数据等。对于本领域技术人员来说，用于该目的的合适设备是公知的。与语音网关IIO通信的路由器112 (同样地，其可以使用本领域技术人员所公知的任意合适的路由器硬件和/或软件来实现)将呼入信号路由到联络中心104内的适当组件。如进一步示出的，提供一个或多个通信信道114以允许路由器112与示出的各种呼叫中心组件通信，并且进一步允许此类组件彼此通信。通信信道114可以包括任意合适的网络或网络的组合；在本优选实施方式中，使用基于网际协议(IP)族的网络。如图所示，各种联络中心组件可以在功能上分类成传统的联络中心设备116、多通道综合系统118、机构资源120和一个或多个数据库122。
传统的联络中心设备116包括一个或多个交互式语音响应(IVR) 系统130、一个或多个计算机电话集成(CTI)系统132、基于IP的专用分支交换机(IP-PBX) 134,并且可选地，包括其他传统服务器 136。如本领域所公知的，IVR系统130允许呼叫者响应于自动化提示而提供数据输入。CTI系统132集成和/或协调电话系统和计算机之间的交互，例如，显示呼叫者信息、计算机控制的拨叫、呼叫中心电话控制等。IP-PBX 134操作为PSTN和联络中心的内部数据网络之间的接口，即，其允许通过数据网络递送语音信号。本领域技
得，该制造商包括但不限于Avaya有限公司、Genesys通信实验室有
7限公司、北电网络公司以及思科系统有限公司。最后，可以提供各
种其他服务器136作为一个机构的现有数据网络的一部分。
在多通道综合系统118内，提供用于实际上是任意类型的常规通信信道的合适硬件、软件以及管理能力。例如，如图所示，提供用于语音邮件140、电话142、传真144、呼叫记录器146、电子邮件148、聊天150、 webl52、短消息服务(SMS) 154和出站拨叫 156的能力。使用这些类型的系统，实际上任意类型的通信模式可以在与联络中心i04的用户通信时使用。
如图所示，机构资源120包括实现特定的联络中心服务所需的人员(以及任意必需的支持性通信设备，例如计算机、电话等)。具体地，这包括现场代理160和远端代理162以及他们相应的监督者/管理者164。如现有技术所公知的，现场代理160在物理上与组件118共处于一个或多个集中式设施，而远程代理162位置上远离联络中心设施但可远程访问所需的组件。在下文更为详细描述的各种实施方式中，通过这里描述的技术可用于促进改善代理160、 162 对呼叫方的应对，特别是对于需要更大或更多特殊关注的那些呼叫者。
还提供一个或多个数据库122，并且使得其可以经由通信信道 114进行访问。考虑即使中型联络中心通常应对的数据量，数据库 122通常实施为所谓的"服务器场(server farm)",其包括共处于针对维护此类系统而专门设计的一个或多个设施处的多个合适的硬件和软件服务器组件。正如本领域技术人员所公知的，实际上，任意合适的服务器硬件和/或软件元件可以用于此目的。在下面更为详细描述的实施方式中，当处理流式语音信号时，可以使用短期存储器170和长期存储器172两者。更具体地，短期存储器170可以用于临时存储在联络中心104处接收到的基本上所有的流式语音信号 (以及任意关联的、可能同时接收到的数据)。当如下所述那样处理流式语音信号时，包含特定的、预定(但自发的)的话语的那些流式语音信号(呼叫)可以被移动到长期存储器172(连同任意关联
8的数据一起)供后续的合规和质量检查目的使用。
在一个实施方式中，通信信道114还将各种联络中心组件 116-122与拄截器124、识别器126和处置处理器128互连。正如本领域技术人员所知的并且如下文所详细描述的，可以使用适当编程的服务器硬件和/或软件元件来实现这些组件124-128中的每个组件。通常，拦截器124操作为从联络中心104收到的呼叫业务中抽取任何语音信号(通常具体实现为合适的网络分组)。在本优选实施方式中，才兰截器124连4妄到路由器i 12上的端口，并且才喿4乍为才兰截进入到路由器112的所有基于IP的呼叫，而不管可能应用到给定呼叫的任何加密或编码。对于拦截的每个新的呼叫，当其被捕获时，即，基本上实时地，在短期存储器170中打开一个新文件，并且将该呼叫存储在该文件中。优选地，呼叫以其从网络接收的形式来存储，例如，作为基于IP的网络分组来存储。此外，每个文件被唯一地索引或标记以便于后续的识别，如在以下情形中，其中从识别器 126接收到用以删除呼叫或将其移动到长期存储器172的指示，下文将进行更详细的描述。因为呼叫几乎总是双工通信(即，双向通话)，优选地，被存储和分析的流式语音信号包括由应对呼叫的代理所提供的任何语音响应。如这里所使用的，流式信号在本质上表示处于基本连续和自由形式的状态，与在自然口语的情形中一样，而与提示的或其他方式的人工结构的语音信号不同。另外，与呼叫一起接收的任何电子输入可以存储为呼叫的一部分，即，以接收到呼叫的网络分组形式进行存储。
识别器126实施语音识别处理，以便检测流式语音信号中自发的、预定话语的出现。如这里所^f吏用的，话语包括iJL出的单词或短语，即，由沉默或暂停所分界的口头讲话的自然单元，与语音信号的一般特征(例如，语音信号的一个或多个物理和统计特性，诸如共振峰频率、讲话能量、其改变的统计数或速率等)相对。因此，预定话语表示在给定环境下特别感兴趣的话语。例如，在呼入到客户服务热线的联络中心的现场呼叫的环境中，预定话语可以包括指示表明客户特别不快的话语。因此，例如"删除我的账号"、"糟糕"、"不足"之类的话语可以被指定为预定话语。可选地，在向紧急响应服务发起呼叫的情形中，例如"火"、"陷入"、"受伤" 等话语可以被指定为预定话语。然而，应该理解本公开不需要限于表明坏的体验或紧急情况的预定话语，并且可以基于某个其他基础 (例如客户具有好的体验)来选择。在确定是否保留语音信号供后续分析时，以及当确定如何最佳地响应于特定的呼叫者时，相比较于语音信号的物理/统计特性，这里所使用的预定话语的环境唯一性允许更高的精度性。即，与仅理解语音信号的物理/统计特性相比，理解语音信号的实际内容可以提高作出决定的准确度、可靠性和速度。此外，通过对预定话语的识别提供了适应不同环境的更大灵活性。
不管怎样，识别器126对进入的流式语音信号执行语音识别技术，以尝试检测一个或多个预定话语的出现。通常，可以使用对于本领域技术人员来说公知的并且能够实时地或接近实时地才喿作的任意合适的语音识别技术。例如，语音识别技术通常表现为两种方式，使用波形识别的技术以及使用音素识别的技术。在前者中，将要识别的具体声音波形(在本情形中代表预定话语)作为输入提供给识别器126,识别器126随后尝试将目标声音波形与进入的语音波形进行比较以识别是否匹配。在后者中，使用统计分析技术来尝试识别更小的语音部分(即音素)的出现，当合适地组合时该更小的语音部分代表了期望的预定话语。例如，所谓的隐式马尔可夫模型 (HMM)方案是可以在此使用的后一类技术的例子。本领域技术人员将进一步理解还可以使用其他技术或技术的组合而不失一般性。事实上可以预见到，当开发出改进的语音识别技术时，它们可以有利地使用在本公开的环境中。
当识别器126检测预定话语时，其也确定被检测话语的决定响应的重要性。如这里所使用的，决定响应的重要性指示在给定的环境中为什么特定的祐:测话语是重要的，以及继而将其通知涉及如何进行响应的后续判定，如果存在该后续判定的话。这是基于确定被检测话语所在的环境以及对特定的被检测话语的识别来完成的。例如，在一个实施方式中，可以根据某些环境来使用表格。即，对于给定的环境，可以提供预定话语和相关联的重要性的表格。再次参考先前的例子，可以提供一个表格用于来自指向客户服务热线的呼叫的被检测的话语。在这种情形下，在表格中每个预定话语(例如，"删除我的账号"、"糟糕，，、"不足")可以具有与其关联的决定响应的重要性(例如，分別是"请求监督员逐步升级"、"可能损失客户"、"潜在损失客户")。可替换地，可以提供一个表格用于来自指向紧急响应服务的呼叫的被检测的话语。在这种情形下，在表格中每个预定话语(例如，"火"、"陷入"、"受伤，，) 可以具有与其关联的不同的决定响应的重要性(例如，分别为"发
起火警部门联系"、"使用脚本X"、"使用脚本Y")。当然，本领域技术人员应该理解上述的例子仅仅是对实际中可能出现的无数个环境相关可能性的示例。
除了搜索预定话语的出现和它们相应的决定响应的重要性，识别器126还操作用于向拦截器124提供关于是保留还是删除临时存储的流式语音信号的指示。因此，在一个实施方式中，如果在流式语音信号期间检测到一个或多个自发的预定话语，则识别器126提供将流式语音信号从短期存储器移动到长期存储器的指示(保存指示)。另一方面，当流式语音信号停止时(即，当呼叫完成时)，识别器126可以提供应该从短期存储器中删除流式语音信号的指示 (即，删除指示)。应该理解，除了提供保存或删除短期存储器中的流式语音信号的肯定指示以外，也可以通过否定指示来实现此类操作，即，在流式语音信号停止之前还没有接收到保存指示时，则删除流式语音信号，或者在流式语音信号停止之前没有接收到删除指示时，则将流式语音信号存储在长期存储器中。不管怎样，这里所述的各种实施方式并不受保存和/或删除指示的具体形式的限制，其可以作为设计选择问题来选择。在可选的实施方式中，保留/删除确定可能没有在检测一个或多个预定话语时发生，而是仅在识别决定响应的重要性后发生。通过这种方式，当作出保留/删除确定时，可以避免模棱两可的情况。
例如，在呼叫期间检测不只一个预定话语的那些情形中，多个被检测的话语的合成串音可能导致关于决定响应的重要性的确定结果模棱两可。构建先前客户服务热线的例子，如果呼叫者说"对不起，我上次付费不足，我不想你删除我的账号"，"不足"和"删除我的帐号"的出现看起来似乎是表明呼叫者不满意并且想删除他的/她的帐号，然而单词"对不起"和"不，，应该以相反方式解释。即，该例子明显是不需要安抚方案的情况，尽管检测到指示相反情况的某些关键词。在该情况中，可能没有任何规则适用(即，上述的查找表是不确定性的)。这诸如这些的情形中，在一个实施方式中，默认应对将引起呼叫被存储供后续分析，从而可能在将来确定用于处理类似情况的新准则。
处置处理器128是识别器126和联络中心104的其他组件 116-120之间的接口。即，至少部分地基于由识别器126所提供的数据/指示，处置处理器128确定任何必要的或期望的响应动作并且与其他组件116-120 (即，响应实现组件)交互以实施响应动作。为此，处置处理器128基于由识别器126所提供的决定响应的重要性以及可选的检测到的话语自身来进行操作。另外，当确定响应动作时，处置处理器128可以基于其他电子输入(例如，IVR输入、例如呼叫者ID数据之类的关联的通信数据等)来操作，下面将进行详细描述。
现在参考图2,进一步示出了适于实施任意上述组件124-128的设备的一个实施方式。具体地，设备200包括与至少一个存储器设备204通信的一个或多个处理设备202。此外，处理设备202也与一个或多个接口 206通信。在一个实施方式中，处理设备202可以具体实现化为一个或多个如本领域所公知的微处理器、微控制器、数字信号处理器、例如图形协处理器之类的协处理器、类似设备或它们的组合。类似地，存储器设备204可以包括能够由一个或多个处理设备202读取的任意合适的介质，例如包括随机存取存储器 (RAM)和/或只读存储器(ROM )的易失性或非易失性存储器器件。存储器设备的例子包括但不限于盘驱动器、固态存储驱动器、例如磁盘或光盘之类的可移动存储介质、拇指驱动器等。在一个实施方式中，接口 206包括允许设备200与一个或多个合适的通信网络(例如网络114)进行通信的网络接口。合适的网络接口的例子包括但不限于一个或多个以太网端口。通常使用硬件、固件或软件的已知组合来实施此类接口。接口 206也可以包括适合于由人类使用的接口，例如图形用户接口、键盘、鼠标和光标装置、扬声器、麦克风等。再次，用于实施此类用户输入/输出设备的技术对于本领域技术人员来说是公知的。如图所示，存储器设备204包括一个或多个程序(或应用)208以及在执行一个或多个程序208期间使用的操作数据210。具体地，程序208包括可以由一个或多个处理设备202执行以实现这里所述功能的指令(即，软件目标代码)。以这种方式开发和部署程序的技术在现有技术中是公知的。在类似的情形中，操作数据 210包括在一个或多个处理设备202执行程序208时由程序208使用或以其他方式操作的任何数据，这些数据常常在本质上是临时数据。利用这些基础组件，处理设备200可以采用任意多种不同的形式，例如台式计算机或膝上型计算机或服务器计算机。本发明在这点上是不受限制的。此外，关于设备200依赖于对由一个或多个处理器 202执行的合适程序208的使用程度，本领域技术人员应该理解，作为设计选择问题，同样可以使用其他实现。例如，至少一部分软件实现的功能可以替代地使用已知的专用硬件技术(例如专用电路、可编程逻辑阵列等)来实现。再次，本公开在这点上是不受限制的。尽管已经在上文将拦截器124、识别器126和处置处理器128描述为单独的实体，并且可以例如使用单独的基于计算机的平台来单独地实现，但本领域技术人员将理解这些组件124-128可以组合实现。例如，在一个实施方式中，可能期望在单个的硬件/软件平台(即，一个或多个共处的服务器计算机以及关联的服务器和应用软件)中
并且还在基本上邻近路由器112(即，位于与路由器相同的局域网内) 处，实现拦截器124和识别器126。本领域技术人员将理解，这里所述的拦截器124、识别器126以及处置处理器128仅仅是说明性的并且此类组件允许用于各种实现。
现在参考图3，其进一步示出识别器126的一个特定实现。具体地，识别器126包括与重要性确定元件304通信的语音识别元件302, 并且可选地包括转换元件306。使用上文描述的语音识别技术，语音识别元件302对从网络或用于传送流式语音信号的类似装置接收到的(可选地，经由转换元件306的) 一个或多个流式语音信号进行操作。正如本领域技术人员将理解的，语音识别元件302可以基于线程操作，由此多个流式语音信号作为各个线程或进程进行单独处理，每个线程或进程具有其自身的持续更新的状态信息。此类实现通常仅仅受限于用以提供基本上实时处理能力的足够的处理资源的可用性。可替换地，可以在这些实例中提供多个语音识别元件302，其中每个语音识别元件302仅能够处理单个流式语音信号。当然，作为设计选择问题，也可以使用多个和/或单个线程语音识别元件的其他组合。不管怎样，在流式语音信号持续期间，每个流式语音信号(对应于单个呼叫和应对代理的响应)被唯一地分配给给定的线程(在多线程处理的情形下)或专用语音识别元件(在单线程处理的情形下)。
注意，提供给语音识别元件302的流式语音信号是从网络或类似的通道接收的。优选地，从网络接收到的流式语音信号以利于它们被语音识别元件立即进行分析的格式来提供，该格式即数字化表示的基带语音样本。然而，经常是这样的情形，经由网络传输的语音信号是经过处理和/或封装的以便于它们经由网络传送。为此，可以提供转换元件306来反转任意此类的处理/封装以向语音识别元件 302提供可分析的语音信号。
具体地，转换元件306包括操作为从网络分组中提取流式语音信号的提取元件308。如本领域中所公知的，通过网络传输的数据(或语音信号)通常具有所谓的"报头，，或附着到其的类似信息，以便在根据传送协议将数据从网络中的一个点路由到另一个点时，辅助网络设备。可替换地，此类封装处理也可以包括信道差错编码，如本领域(尤其在使用无线信道的情况下)所公知的，这有助于防止在传输的数据中引入由信道引入的错误。一旦在目标目的地接收到，则由提取元件308从接收到的分组中剥离此类路由信息或为了确保数据完整性而应用的差错编码信息。
在一些实例中，在进行封装以便传输之前，首先对网络内传送的数据进行加密以确保数据的安全性。为此，可以提供解密元件310 来解密任意先前加密的数据。本公开并不受使用的特定加密/解密技术的限制。类似地，在传输之前(即，在任何加密、差错编码和/或添加路由报头之前)，常常对数据进行压缩以减小要传输的数据量。在这些实例中，提供解压缩元件312以解开任何先前的压缩。再次，本公开并不受所使用的特定压缩/解压缩技术的限制。
当语音识别元件302分析给定的流式语音信号时，其根据其是否检测到任何自发的、预定的话语来向重要性确定元件304提供各种信息，如上所述。例如，语音识别元件302可以向重要性确定元件304提供对应于给定的流式语音信号的状态数据。此类状态数据可以包括针对语音信号的开始和停止指示，以及如果有的话，由语音识别元件302所识别的任何被检测的话语。在那些在已经接收到针对语音信号的开始和停止指示后，没有识别出任何被检测的话语的情况下，重要性确定元件304可以(但不必总是)向拦截器124 提供短期删除指示，以指示可以从长期存储器删除该流式语音信号。相反地，如果在接收到停止指示之前，语音识别元件302提供了一个或多个检测到的话语，则重要性确定元件304可以既向处置处理器128提供决定响应的重要性，也向拦截器124提供长期存储器指示。
现在参考图4，进一步示出处置处理器128的具体实现。具体地，提供与输入元件404、存储元件406以及输出元件408通信的响应确定元件402。响应确定元件402最少接收作为输入的一个或多个才企测到的话语的决定响应的重要性，并且可选地，接收检测到的话语本身以及对应于给定的流式语音信号的任意电子输入，如图所示。在一个实施方式中，这些输入由一个或多个输入元件404提供，该输入元件404操作为从识别器126(在决定响应的重要性和检测到的话语的情形下)或电子输入的源接收这些输入。例如，在处置处理器 128的计算机实现的实施方式中，输入元件可以包括存储器映射寄的存器、存储器控制器、中断例程或用于接收数据的其他合适机制。在处置处理器128与识别器126组合的另一个实施方式中，输入元件可简单地包括合适的存储器位置，利用这些位置，输入被存储以
供响应确定元件402进^f于后续的操作。
无论获得这些数据的方式如何，响应确定元件402至少基于检测到的话语的决定响应的重要性来确定响应动作。再次，响应动作的确定将基于正在分析的呼叫的属性以及联络中心104的配置。例如，在检测到指示紧急的任何预定话语(即，"我受伤了"、"火" 等)时，响应动作可以是与紧急服务调度员进行的会议，或如果例如呼叫者标识(或如上所指出的其他电子输入)指示呼叫者可能会因为延迟的响应特别容易受伤，例如是来自小学或老年人看护机构的呼叫，则可以采取更为紧急的动作。可选地，如果在客户服务呼叫中心的环境中，检测到与生气的客户关联的预定话语，则响应动
作可以是将呼叫转接到专家。此外，可以在确定中结合历史数据(驻留在存储器406中)。例如，当检测到某个预定话语时，呼叫者的信用分值可以用于确定应该向他/她提供什么种类的提议。再次，各种其他类型的历史信息(即，不是随呼叫同时获得的信息)可以用于该目的。
一旦确定响应动作，可以将其存储在存储器元件406中，例如作为客户历史日志或类似物的一部分，证明在过去曾经如何与特定的呼叫者进行交互。最终，输出元件408将响应动作(其事实上可
16以包括将是被实施的多个动作)作为输入，并且提供使得响应实现
元件(例如，联络中心组件116-120中的各种组件)实施响应动作所必需的消息、控制信号等作为输出。本公开不限于输出元件408出于该目的所使用的消息的特定形式，并且本领域技术人员将理解可以作为设计选择问题来构造此类消息。
现在参考图5，提供了示出系统级处理的流程图。具体地，图5 中示出的处理优选地由上文描述的拦截器124、识别器126和处置处理器128来实施。因此，在块502处开始，拦截器124基本上拦截到联络中心104的所有呼叫(即，流式语音信号)，并且将它们临时存储在短期存储器中。此后，在块504处，识别器126在呼叫被存储在短期存储器中时，即实时或接近实时(即，延迟的时间量短于呼叫自身的持续时间)地，分析该呼叫。如果一个或多个检测到的话语引起针对该呼叫的决定响应的重要性的确定(也在块504处执行)，则处理在块506和508处并行地继续。在块506处，识别器126向拦截器124提供合适的指示，用以将呼叫移动到长期存储器，优选地，一旦呼叫已经完成，就执行。同样地，在块508处，在呼叫期间或呼叫之后的任何时间，由处理处理器128基于检测到的话语的决定响应的重要性来确定响应动作。
现在参考图6，示出说明由识别器执行的处理的流程图。在块 602处开始，如上所述，进入的流式语音信号可选地被转换成可分析的形式。尽管在这里将该功能描述为识别器的一部分，本领域技术人员将理解，在向识别器提供流式语音信号之前，此类的转换可以由另一组件(例如，拦截器)来执行。不管怎样，在块604处，根据上文描述的方法来分析流式语音信号。事实上，这通常通过获取流式语音信号的小样本(例如，10到100毫秒的基带语音样本)并接着对其执行语音识别处理来完成。如果没有检测到预定话语，如
通过块606所示，则处理前进到块608处，在块608处确定是否已经到达流式语音信号的末尾。如果没有，则处理前进到块602和604 处，在块602和604处以这种方式来分析流式语音信号的其他部分。然而，如果在任何检测到的话语之前接收到语音信号的末尾，则处
理前进到块610处，在块610处提供指示用以从短期存储器中删除流式语音信号。
如果在块606处检测到一个自发的、预定的话语，则处理前进到块612处，在块612处确定检测到的话语的决定响应的重要性，如上所述。此后，分别在块614和616处，提供关于决定响应的重要性的指示，例如是用以将流式语音信号移动到长期存储器的指示。如这里所使用的，关于决定响应的重要性的指示可以单独包括决定响应的重要性，或也可以包括检测到的话语自身。
最终，并且参考图7，示出了说明由处置处理器所执行处理的流程图。具体地，在块702处开始，由处置处理器获得对应于一个或多个;f企测到的话语的至少一个决定响应的重要性。如这里所^_用的，处置处理器通过从另一实体(例如识别器)接收信息，或在可选的实施方式中直接确定信息(例如在组合识别器和处置处理器的情形中)，从而"获得，，信息。同样地，分别在块704和706处，可同样地由处置处理器获得一个或多个检测到的话语和/或电子输入。此后，在块708处，处置处理器基于先前获得的决定响应的重要性、检测到的话语和/或电子输入(如上所述)来确定响应动作。
本公开描述了一种用于实时地分析客户交互并且应用客户分析的架构和方法。通过这种方式，可以基本上实时地作出关于是否存储给定的流式语音信号供后续质量/合规分析的确定，以及在存在提供最佳可能的呼叫者体验的机会时确定最优的响应策略。至少出于这些原因，上文描述的技术代表了超出现有技术教导的进步。
尽管已经示出和描述了特定的优选实施方式，但对于本领域技术人员来说，显然可以在不脱离本发明教导的情况下作出改变和修改。例如，尽管在整个公开中使用了联络中心的例子，但应该理解这里所描述的教导同样地可以应用于期望的另一种环境，例如期望选择性地存储流式语音信号的另一环境。因此可以想到上述教导的任何和所有的修改、变形或等同都落入到上文公开的和这里所要求保护的基本原理的范围内。
18
权利要求
1.一种用于在包括至少一个处理装置的设备中处理多个流式语音信号的方法，所述方法包括持续地分析所述多个流式语音信号中的流式语音信号，以检测自发的预定话语的出现，从而提供检测到的话语；确定所述检测到的话语的决定响应的重要性；以及至少提供关于所述决定响应的重要性的指示，其中基于所述检测到的话语的决定响应的重要性确定响应动作。
2. 根据权利要求1所述的方法，其中所述检测到的话语相对于商业关系是重要的。
3. 根据权利要求1所述的方法，其中所述检测到的话语相对于紧急情况是重要的。
4. 根据权利要求1所述的方法，进一步包括响应于所述检测到的话语，提供所述流式语音信号应当存储在长期存储器中的指示。
5. 根据权利要求1所述的方法，进一步包括在分析所述流式语音信号之前，将所述流式语音信号转换成可分析的形式。
6. 根据权利要求5所述的方法，其中将所述流式语音信号转换成可分析的形式进一步包括从网络分组中提取语音数据。
7. 根据权利要求5所述的方法，其中将所述流式语音信号转换成可分析的形式进一步包括解密所述流式语音信号。
8. 根据权利要求5所述的方法，其中将所述流式语音信号转换成可分析的形式进一步包括解压缩所述流式语音信号。
9. 根据权利要求1所述的方法，其中至少提供关于所述决定响应的重要性的指示进一步包括提供所述检测到的话语及其决定响应的重要性。
10. —种用于处理多个流式语音信号的设备，包括语音识别元件，操作为检测多个流式语音信号的流式语音信号中自发的预定话语的出现，从而提供检测到的话语；以及与所述语音识别元件通信的重要性确定元件，操作为确定所述检测到的话语的决定响应的重要性，并且至少提供关于所述决定响应的重要性的指示，其中基于所述检测到的话语的决定响应的重要性确定响应动作。
11. 根据权利要求IO所述的设备，其中所述检测到的话语相对于商业关系是重要的。
12. 根据权利要求IO所述的设备，其中所述检测到的话语相对于紧急情况是重要的。
13. 根据权利要求IO所述的设备，其中所述重要性确定元件被构建为响应于所述检测到的话语，生成所述流式语音信号应当存储在长期存储器中的指示。
14. 根据权利要求IO所述的设备，进一步包括与所述语音识别元件通信的转换元件，其操作为将所述流式语音信号转换成可分析的形式。
15. 根据权利要求14所述的设备，其中所述转换元件包括网络分组提取元件。
16. 根据权利要求14所述的设备，其中所述转换元件包括解密元件。
17. 根据权利要求14所述的设备，其中所述转换元件包括解压缩元寸牛。
18. —种基本上如参考上文的详细说明书和附图所描述的用于处理多个流式语音信号的方法。
19. 一种基本上如参考上文的详细说明书和附图所描述的用于处理多个流式语音信号的设备。
全文摘要
本发明提供了用于处理多个流式语音信号的方法及设备。分析诸如在联络中心处接收的流式语音信号，以检测一个或多个自发的、预定话语的出现。优选地，该预定话语构成单词和/或短语的词汇表，该单词和/或短语在它们所在的环境内具有特定含义。在呼叫期间检测到一个或多个预定话语引起进行对检测到的话语的决定响应的重要性的确定。基于检测到的话语的决定响应的重要性，可以进一步确定响应动作。另外，也可以启动对应于检测到的话语的呼叫的长期存储器。相反，没有检测到预定话语的呼叫可以从短期存储器中删除。通过这种方式，本发明简化了对联络中心的存储要求，并且通过向潜在问题情况提供更短的反应时间，提供改善呼叫者体验的机会。
文档编号G10L15/18GK101588418SQ20091014149
公开日2009年11月25日申请日期2009年5月22日优先权日2008年5月23日
发明者B·K·詹安, T·瑞安申请人:埃森哲环球服务有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：T.瑞安;B.K.詹安
技术所有人：埃森哲环球服务有限公司
我是此专利的发明人