专利名称:自动提供文本交换服务的方法和系统的制作方法
技术领域:
本发明涉及自动语音系统的领域,更具体地,涉及使用自动语音应用 环境以自动提供基于文本的交互式服务。
背景技术:
交互式语音应答(IVR)系统通常用于通过通信网络的语音信道提供 自动客户服务。IVR系统可以使例行客户请求快速、有效和自动地进行处 理。当请求是非例行的或者当呼叫者使用IVR系统有困难时,进行从IVR 系统到客户服务代理的转换。即使当需要人工交互时,IVR系统也可以获 得必要的初步信息,诸如账户号码和呼叫原因,这可确保呼叫者被转送到 合适的人工代理,并确保人-人交互时间减少到最少。成功使用IVR系统 可以使呼叫中心最低限度地配备人员,同时以在等待队列中花费相对少的 时间来向客户提供高水平的服务。
IVR系统,尤其是具有自然语言理解(NLU)能力和/或大量上下文无 关的语法的鲁棒性系统,表示巨大的金融和冲支术投资。该投资包括用于购 买/租赁和维护IVR体系结构硬件、IVR体系结构软件和在该体系结构上 执行的语音应用的成本。额外的重要的追加成本可与维护充足数量的语音 质量信道以处理预期的呼叫量有关。另外,这些信道中的每一个都使用语 音服务器的一个可用端口,而该语音服务器具有有限数量的昂贵端口。每 个信道还使用 一定数量的在呼叫者和IVR系统之间建立语音质量信道所需 的带宽。
传统的方案不允许该昂贵的IVR体系结构净皮调整以处理其它通信信道 上的客户服务交互,诸如聊天信道或即时消息信道。相反,使用传统技术
实现聊天信道要求在单独的体系结构上进行单独的投资。也就是说, 新的成本以购买和维护聊天体系结构硬件、聊天体系结构软件和在该体系 结构上执行的聊天应用。
发明内容
一种使用自动语音应用环境的体系结构以自动提供实时的基于文本的 交互服务的解决方案。更具体地,该解决方案利用聊天机器人对象,也称
为聊天机器人(Chatbot),来执行语音应用,以动态地将从文本交换客户 机接收的文本转换成语音服务器可使用的输入,并动态地将来自语音应用 的输出转换为具有适于客户机的格式的文本。文本交换客户机可以是聊天 客户机、即时消息(IM)客户机、文本消息客户机或任何其它实时的文本 通信客户才几。
在一个实施例中,该解决方案可以使用未修改的、现货供应 (off-the-shelf )的文本交换软件,诸如SAMETIME、TRILLIAN、 YAHOO! MESSENGER等。另外,该解决方案也可以使用未修改的语音应用环境来 执行未修改的语音应用,诸如已有的仅用于语音交互的VoiceXML应用。 另外,该解决方案不需要利用专门的设备、协议或其它类型的通信制品。
本发明可根据与在此提出的素材一致的许多方面来实现。例如,本发 明的 一个方面可包括自动应答方法。该方法可接收通过实时的文本交换接 口输入的用户交互。这些与语音应用之间的用户交互可以4艮据需要动态和 自动地转换为语音服务器可使用的格式。在一个实施例中,语音服务器的 文本输入应用编程接口 (API)可用于直接接收文本输入。另外,可以从 语音服务器接收自动交互,其被动态和自动地转换为文本交换接口所接受 的格式。例如,由语音应用产生的语音标记可以被转换为纯文本。文本交 换接口可以是现货供应的未修改的接口 。语音应用可以是没有固有的文本 交换能力的基于VoiceXML的应用。
本发明的另 一个方面可以包括一种用于扩展自动语音应用环境以提供 文本交换服务的方法。该方法涉及自动语音应用环境和文本交换客户机。
自动语音应用环境可执行自动语音应答应用,其允许用户通过语音信道实 时地交互。文本交换客户机可以通过文本交换信道与另 一个文本交换设备 实时地交互。在该方法中,可以在语音应用环境和文本交换客户机之间建 立通信会话。该通信会话可包括到自动语音应用环境的服务器信道,并且 包括到文本交换客户机的文本交换信道。在通信会话期间,交互可以动态 和自动地在服务器信道和文本交换信道之间转换。
本发明的另 一个方面可包括一种用于提供文本交换服务的系统,其包
括文本交换客户机、语音应用环境和Chatbot服务器。文本交换客户机可 通过文本交换信道发送和接收实时的文本交换。语音应用环境可执行自动 语音应答应用,其允许用户通过语音信道实时地交互。Chatbot服务器可 以建立涉及文本交换客户机和自动语音应答应用的通信会话。在通信" 期间,Chatbot服务器可以动态地在文本交换客户机和语音应用环境之间 转换消息。
应当指出,本发明的多个方面可以被实现为用于控制计算设备以实现 在此描述的功能的程序,或者用于使计算设备能够执行与在此描述的步骤 对应的过程的程序。该程序可以通过在磁盘、光盘、半导体存储器和任何 其它记录媒体上存储来提供,或者也可以作为通过载波传输的数字编码的 信号提供。所描述的程序可以是单个程序或者可实现为多个子程序,其中 每一个子程序在单个计算设备内进行交互,或者通过网络空间以分布方式 交互。
在此详述的方法也可以是至少部分地由服务代理和/或由服务代理操 纵的机器执行以响应服务请求的方法。
在附图中示出了优选的实施例,然而应当理解,本发明并不限于所示 出的结构和手段。
图1是根据在此公开的本发明的一个实施例的允许文本交换接口和语 音使能应用之间的动态交互的Chatbot服务器的系统的示意图。
图2是示出根据在此公开的本发明的一个实施例的文本交换客户机、 Chatbot服务器、语音服务器和应用服务器之间的交互的处理流程图。
图3是根据在此公开的本发明的一个实施例的用于使用Chatbot服务 器和语音应用服务器提供文本交换服务的系统的示意图。
具体实施例方式
图1是根据在此公开的本发明的一个实施例的允许文本交换接口 110 和语音使能应用119之间的动态交互的Chatbot服务器114的系统100的 示意图。系统100允许文本交换客户机110和语音使能应用119之间的自 动交互。
语音使能应用119可以是VoiceXML应用,诸如用于通常配置在联系 中心的交互式语音应答系统(IVR)的应用。文本交换客户机接口 110可 以是用于任何类型的文本交换通信的接口 ,诸如使用SAMETIME、 TRILLIAN、 YAHOO!MESSENGER等的即时消息(IM)通信、聊天通 信、文本消息。
与大多数语音服务器一样,语音服务器118可以包括文本;f莫式接口 106,其通常被语音识别引擎的开发者、系统维护者和/或训练者使用。例 如, 一组私有的、受限的或标准化的(例如,MRCPv2 INTERPRET)应 用编程接口 (API)可用作接口 106。可以使这组在生产环境内通常不可用 或者不可访问的API能够创建文本输入信道,该文^r入信道与通常用在 生产环境中运行的语音服务器118建立的语音信道相比,消耗少得多的计 算资源。在大多数情况下,文本模式接口 106在生产语音服务器118内是 存在的,但处于休眠。可以使接口 106能够用于与Chatbot服务器进行基 于文本的交互。
接口 106的使用以对应用服务器108透明的方式出现,因此,对应用 119没有影响。也就是说,应用119和应用服务器108仍然不知道语音服 务器118正在通过接口 106处理文本输入,与语音输入相反。由语音服务 器118产生并发送到Chatbot服务器114的输出在任何情况下都相同。进 一步地,由应用服务器108产生并发送到Chatbot服务器114的输出亦如 此。因此,多个通信会话,其中一些是使用接口 106的基于文本的会话, 其它是基于语音的会话,可以同时由应用服务器108处理。系统110可以 无需对应用服务器108的体系结构变化、(无需对假定接口 106存在的语 音服务器118的变化)、无需改变语音使能应用119的代码而实现。这是 真的,即使应用119可能缺少对文本交换交互的显式编码支持,并且没有 所公开的发明就不能支持这样的交互。进一步地,文本交换接口 110可以 是任何现货供应的文本交换软件,其不需要进行修改以如在系统100中所 示的运行。
在系统100中,Chatbot服务器114可以取得121与其执行的语音使 能应用119相关的语音标记123。 Chatbot服务器114也可以转送来自接口 110的文本输入120,以经由接口 106发送语音服务器118可使用的文本 122。语音服务器118可以相对识别语法匹配输入,并生成用于Chatbot 服务器114的文本输出124。当Chatbot服务器执行该应用时,可以使用 该输出124。应用119处理该输出,其通常以语音标记片段的形式,诸如 VoiceXML (其还可以使用W3C语音合成标记语言或SSML ),产生响应 输出。当执行文本交换操作时,由语音服务器118执行的标准语音合成操 作可以被忽略。Chatbot服务器114可以动态地将响应输出从标记转换为 接口 110处理的文本输出126。例如,在标记标签之间包含的文本内容可 以从应用119标记中提取(即,标记标签可以省略)并包含在文本126消 息中。
与依赖语音信道的自动通信,诸如包含语音服务器118的传统使用的 通信不同,通过Chatbot服务器114的文本消息通信要求很少的硬件资源 来复制获得同时的客户请求的能力。这允许系统100使用相同的体系结构 处理更大量的请求而降低客户等待时间。另外,与语音服务器118的文本 交互和语音交互具有不同的动态。例如,使用文本交换接口 110的客户不 要求以匆忙的方式来回答问题,这允许更深思熟虑和准确的输入,从而导 致更相关的应答,这进而带来不断增加的客户满意度。
图2是示出根据在此公开的本发明的一个实施例的文本交换客户机 204、 Chatbot服务器206、语音服务器208和应用服务器209之间的交互 的处理流程图200。
语音服务器208可以包括文#入API,其通常由语音识别引擎的开 发者、系统维护者和/或训练者使用。可以使这组在生产环境中通常不可用 或者不可访问的API能够允许语音服务器208直接使用文本,这要求比处 理由服务器208通常接收的语音输入所需要的少得多的计算资源。
如所示的,客户机204可以向Chatbot服务器206发送请求210以初 始化文g式信道。Chatbot服务器206可以向语音服务器208发送信道 初始化消息212以建立^"。服务器208可以积极地响应,使信道214在 服务器206和208之间建立。然后Chatbot服务器206可与客户机204建 立所请求的文本信道216。在步骤216之后,Chatbot服务器206可以向应 用服务器209发送请求217,这使得语音使能应用被实例化。也就是说, 应用标记220可以被传送到Chatbot服务器206用于执行。
当Chatbot服务器206执行语音使能应用119时,可以产生应用开始 的提示221。服务器206可以将由应用119提供的标记转换222成用文本 提示224呈现的纯文本,该纯文本被发送到客户机204。例如,提示221 可以用标记编写并可包括
<prompt> text context </prompt> 。 转换222可以提取文本上下文(忽略标记标签)并产生文本提示224,其 仅仅包括文本上下文。客户机204可以通过文本信道响应226该提示。月良 务器206可以向语音服务器208转发响应228,它可以与响应226相同。 语音服务器208可以通过程序动作230将响应228与语音语法相匹配,从 而得到文本结果232。语音服务器208可以向Chatbot服务器206传送文 本结果232。当Chatbot服务器206执行用于执行应用119的程序逻辑243 时,使用该输出232,这使得标记被生成。Chatbot服务器206可以将包含 在所生成的标记内的文本内容转换236成发送到客户才几204的文本结果 237。交互以这种方式继续进行,直到客户机204发送请求238以结束通信 会话。Chatbot服务器206可以响应地关闭240其与语音服务器208之间 的信道。Chatbot服务器206还关闭242其与客户机204之间的文本交换 信道,此时,通信会话终止。
图3是根据在此公开的本发明的一个实施例的用于使用Chatbot服务 器320和语音应用服务器340以提供文本交换服务的系统的示意图。该系 统可包括网络360,其可通信地连接通信设备310、 Chatbot服务器320、 语音服务器330、应用服务器340和企业服务器350。
网络360可以包括任何的各种组件,有线和/或无线的,其共同允许包 含在栽波内的数字编码信息从任何可通信连接的组件传送到任何其它可通 信连接的组件。
通信设备310可以是任何将客户302连接到网络360的通信设备。例 如,设备310可以包括移动电话、有线电话、计算机、笔记本、计算板、 个人数字助理(PDA)、便携式计算设备、娱乐系统、交互式媒体设备等。 特定种类的设备310包括文本交换设备312、语音通信设备314和多模式 设备316'
文本交换设备312是能够进行实时的交互式文本交换的计算设备。这 些文本交换包括在线聊天、即时消息和文本消息。通信设备314可以是任 何能够通过网络360进行实时语音通信的设备。这包括基于VoIP的通信、 传统的电路交换通信、双向无线通信等。多模式设备316是能够参与文本 交换和语音交换的设备。 一些多模式设备316受限于一次一种模式的通信, 而其它设备能够同时进行多模式的通信。
当执行文本交换时,设备310可以使用接口 318。该接口 318可以显 示运行文本对话,并包括输入新文本的部分。接口 318可以是用于即时消 息客户机、聊天客户机和/或文本消息客户机的界面。
Chatbot服务器320可以是VoiceXML服务器或者动态地将来自设备 310的文本交换消息转换为语音服务器330可使用的消息的等同设备。使 用让语音月良务器330接收文本的文本输入API 344可以允许来自i殳备310
的文本直接被语音服务器330使用。Chatbot服务器320也可以动态地将 来自语音服务器330的输出转换为由语音应用使用的输出,然后使其在接 口 318内可呈现。
对于每个被管理的通信会话,Chatbot服务器320可以实例化Chatbot 对象324。 Chatbot对象324可以包括SIP服务器端应用程序(servlet)和 一个或者多个解释器,诸如呼叫控制扩展标记语言(CCXML)解释器、 语音扩展标记语言(VoiceXML)解释器、扩y^文本标记语言(XML) 加语音简档(X+V)解释器、语音应用语言标记(SALT)解释器、媒体 资源控制协议(MCRP)解释器、定制的标记解释器等。SIP服务器端应 用程序可将进入的SIP请求映射到适当的解释器。
由Chatbot对象324处理的通信会话可包含多个不同的通信信道,诸 如信道370和信道372。信道370可以是在Chatbot服务器320和设备310 之间建立的通信信道。信道372可以是在Chatbot服务器320和语音服务 器330之间建立的通信信道。可以看出,应用月良务器340不知ii^户302 用于与服务器320进行通信的通信模式和信道类型。专门的文4^入API 344可用于允许语音服务器330直接使用由Chatbot服务器320提供的文 本输入。
服务器320的转换引擎322可以执行任何必要的转换以将来自文本交 换设备312的输出改变为语音服务器330可使用的输入。通常,对于由语 音服务器330使用的文本,不需要大量的转换,语音服务器330通过API 344 提供对文本才莫式交互功能的访问。可以看出,在测试和开发阶段,文本模 式交互功能通常由开发者使用,但是在此,在运行时用于允许语音服务器 直接处理文本。例如,因特网工程任务组(IETF)标准媒体资源控制协议 第2版(MRCPv2 )包含称为语音识别器资源的INTERPRET的文本模式 解释功能,其允许语音服务器330直接处理文本。
应用服务器340通常产生语音标记输出,诸如VoiceXML输出,语音 ^^务器将其转换为音频输出。转换引擎322可以从语音标记中41取文本内 容,并通过信道370将所提取的文本传送到通信设备310。
应用服务器340可以是使用标准化运行平台的模块組件的应用服务 器。应用服务器340可以表示多层环境的中间件服务器。运行平台可以提 供用于开发分布式、多层、基于Web的应用的功能。运行平台还可以包括 标准的服务集、应用编程接口和协议。也就是说,运行平台可允许开发者 创建企业应用,其在多个平台之间是可扩展和可移动的。运行平台可以包 括相关技术规范的集合,这些技术规范描述所要求的程序编程接口 (API) 和遵循的策略。
在一个实施例中,运行平台可以是JAVA 2 PLATFORM ENTERPRISE EDITION (J2EE )软件平台。因此,应用服务器340可以 是J2EE应用服务器,诸如纽约Armonk的国际商用机器公司的 WEBSPHERE应用服务器、加利福尼亚San Jose的BEA系统公司的BEA WEBLOGIC应用服务器、乔治亚州亚特兰大的JBoss公司的JBOSS应用 服务器和ObjectWeb联盟的JOnAS应用服务器等。运行平台不应被认为 局限于此,其它软件平台,诸如.NET软件平台在此也可以考虑。
IVR应用342可以是允许呼叫者进行交互并从企业服务器350的数据 库接收信息的应用。访问VoiceXML服务器320 (其已经被扩展用于 Chatbot 320 )可以接受使用M音信号的用户输入、语音输入和文本输入。 IVR应用342以单个VoiceXML应用的形式向用户提^(^言息,该应用可被 任何模式使用,包括DTMF、语音和聊天。语音标记也可以被直接传送到 转换引擎322,在转换引擎322,语音标记被转换为可在接口 318中呈现的 文本。
IVR应用342可以向用户提供一系列提示,并+艮据先前建立的对话菜 单接收和处理提示响应。语音处理操作,诸如文本-语音变换操作、语音-文本变换操作、呼叫者识别操作和语音授权操作,可由位于远程的语音服 务器330提供。没有Chatbot服务器320的介入,IVR应用342将不能与 文本交换设备312进行交互,因为IVR应用342没有用于处理文本交换输 入/输出的本地编码。
本发明可以用硬件、软件或者硬件和软件的结合实现。本发明可以以
集中方式在一个计算机系统中实现,或者以不同的元件散布在几个互连的 计算机系统中的分布方式实现。任何类型的用于实现在此描述的方法的计 算机系统或者其它装置是合适的。硬件和软件的典型组合可以是具有计算 机程序的通用计算机系统,其中当计算机程序被加载和执行时,其控制该 计算机系统,以使其执行描述的方法。
本发明还可以内嵌在计算机程序产品中,该计算机程序产品包括能够 实现在此描述的方法的所有特征,并且当其被加载到计算机系统时能够实 现这些方法。本文中的计算机程序是指以任何语言、代码或符号的指令集
的任何表达,其能够使具有信息处理能力的系统直接或在a)转换为另一 种语言、代码或符号;b)采用不同的物质形式再现的任意一个或者两者之 后实现特定的功能。
权利要求
1.一种自动应答方法,包括接收通过实时文本交换接口输入的用户交互;执行未修改的语音使能应用;动态和自动地将与所述应用的所述用户交互转换为语音服务器可使用的格式;动态和自动地将来自所述语音服务器的输出转换为语音使能用应用可直接使用的输出;以及将来自所述语音使能应用的输出转换为可在所述文本交换接口中呈现的格式。
2. 如权利要求1所述的方法,其中,所述方法在生产环境中执行, 并且所述语音服务器包括用于处理文本输入的应用编程接口 (API)。
3. 如权利要求1所述的方法,其中,所述语音服务器使用文本输入 API,其允许所述语音服务器直接使用文本输入,并且语音标记的转换提 取在所述文本交换接口中直接呈现的文本内容。
4. 如权利要求3所述的方法,其中,所述文本交换接口是即时消息 接口、聊天接口和文本消息接口中的至少一个。
5. 如权利要求1所述的方法,其中,所述语音服务器被配置为同时 处理多个通信会话,所述会话包括至少一个涉及所述文本交换接口的会话和至少一个涉及使用语音接口的人的会话。
6. 如权利要求1所述的方法,其中,所述语音应用是用语音标记语 言编写的单模式应用,并且由所述文本交换接口发送和接收的交互是基于文本的交互。
7. 如权利要求1所述的方法,其中,所述语音应用是基于VoiceXML 的应用。
8. 如权利要求1所述的方法,其中,所述文本交换接口是现货供应 的未修改的接口 ,并且所述语音应用是没有固有的文本交换能力的标准语音使能应用。
9. 如权利要求1所述的方法,其中,权利要求1的所述步骤是由至 少一个机器根据至少一个具有可由所述至少一个机器执行的多个代码部分 的计算机程序自动执行的步骤。
10. 如权利要求l所述的方法,其中,权利要求1的所述步骤由服务 代理和由所述服务代理管理的计算设备中的至少一个执行,执行所述步骤 以响应服务请求。
11. 一种用于扩展自动语音应用环境以提供文本交换服务的方法,包括识別自动语音应用环境,其被配置为执行用于允许用户通过语音信道 实时交互的自动语音应答应用;识别文本交换客户机,其被配置为通过文本交换信道与另 一个文本交 换i殳备实时交互;在所述语音应用环境和所述文本交换客户机之间建立通信^",其中 所述通信会话包括到所述自动语音应用环境的服务器信道,并且所述通信 会话包括到所述文本交换客户机的文本交换信道;以及在所述通信会话期间,动态和自动地在所述服务器信道和所述文本交 换信道之间转换交互。
12. 如权利要求ll所述的方法,其中,至少一个所述自动语音应答应 用是基于VoiceXML的应用,其中在所述语音应用环境中包括的语音服务 器的文本输入API用于接受基于文本的输入。
13. 如4又利要求11所述的方法,还包括自动将包含从所述服务器信道接收的文本内容的语音标记转换为包括 所述文本内容的文本消息,所述文本消息通过所述文本交换信道传送。
14. 如权利要求ll所述的方法,其中,所述文本交换接口是即时消息 接口、聊天接口和文本消息接口中的至少一个。
15. 如权利要求11所述的方法,其中,所述文本交换接口是现货供应 的未修改的接口 ,并且所述语音应用环境包括至少一个没有固有的文本交换能力的标准语音使能应用。
16. 如权利要求11所迷的方法,其中,权利要求11的所述步骤是由 至少一个机器才艮据至少一个具有可由所述至少一个机器执行的多个代码部 分的计算枳4呈序自动执行的步骤。
17. —种用于提供文本交换服务的系统,包括文本交换客户机,其被配置为通过文本交换信道发送和接收实时文本 交换;语音应用环境,其被配置为执行用于允许用户通过语音信道实时交互 的自动语音应答应用;以及Chatbot服务器,其被配置为建立涉及所述文本交换客户机和所述自 动语音应答应用的通信会话,其中,在所述通信会话期间,所述Chatbot 服务器以对所述文本交换客户机和所述自动语音应答应用透明的方式动态 地在所述文本交换客户机和所述语音应答应用之间转换消息。
18. 如权利要求17所述的系统,其中,所述语音应用环境包括用于处 理文本输入的应用编程接口 (API),其中所述Chatbot服务器进行传送。
19. 如权利要求17所述的系统,其中,所述语音应用环境支持多个同 时执行的使用所述自动语音应答应用的通信会话,其中至少一个所述同时 执行的通信会话是与所述文本交换客户机的文本交换通信,并且至少 一个通信会话。
20.如权利要求17所述的系统,其中,所述文本交换接口是现货供应 的未修改的接口 ,并且所述自动语音应答应用是没有固有的文本交换能力 的基于VoiceXML的应用。
全文摘要
本解决方案包括自动应答方法。该方法可接收通过实时文本交换接口输入的用户交互。这些与语音应用之间的用户交互可根据需要被动态和自动地转换为语音服务器可使用的格式。语音服务器的文本输入API可用于允许语音服务器直接接收文本输入。另外,自动交互可从语音服务器接收,其可以动态和自动地转换为文本交换接口可接收的格式。文本交换接口可以是现货供应的未修改的接口。语音应用可以是没有固有的文本交换能力的基于VoiceXML的应用。
文档编号H04L12/58GK101207584SQ20071018663
公开日2008年6月25日 申请日期2007年11月14日 优先权日2006年12月19日
发明者B·D·曼达利亚, V·S·莫尔, W·L·努斯比克尔, 帕尔马 W·V·达 申请人:国际商业机器公司