语音识别增强的呼叫者识别的制作方法

文档序号：2821679阅读：320来源：国知局

专利名称：语音识别增强的呼叫者识别的制作方法
技术领域：
本发明涉及确定身份电话呼叫者的处理，更特别地，本发明涉及在情况现有的呼叫者ID不足以完成识别或不可用时应用语音识别技术收集电话呼叫者的身份。
背景技术：
目前，个人接收相对大量的语音消息是很普通的。例如，对个人来说可能在周末接收到几十个新的语音消息。另外，个人可能维护二十、三十或更多个在语音消息系统上保存的消息。随着语音消息数量的增加，有效地收听消息并对其排序的能力下降了。
语音消息通常没有任何呼叫者身份的可靠指示。在现有技术中已存在呼叫者识别系统，但是仅限于识别进入的电话号码，如果该电话号码和某个人关联，则电话号码可能匹配可能的呼叫者。这样的系统仅追踪电话而不是说话者。因此，对语音消息和呼叫路由系统的这些呼叫者设备系统好处是很有限的。
没有合理的可靠呼叫者识别信息，很难产生有用的语音信息总结列表来支持语音消息系统的用户有效地浏览新的或保存的消息的集合。作为结果，多数语音消息系统并不包括有效地收听消息和/或对其排序的可靠方法。例如，多数当前的语音消息系统向用户提供最小限度有用的语音总结，如“你有三个新消息和三个保存的消息”。这样的总结通常并不包括和任何呼叫细节相关的任何信息。
缺乏和语音消息关联的信息通常使得查看和组织它们更加耗时。例如，和多数电子邮件消息相比，不能仅基于消息内容、紧急程度或来源的间接指示排除语音消息。另外，通常不能基于消息内容、紧接程度或来源的间接指示将保存的语音消息存储或组织在目录中。
目前收听语音消息并对其排序需要投入大量时间，因为系统用户必须收听每个消息才能简单地抽取基本信息，如呼叫者的身份和/或电话呼叫的紧急程度或主题。对语音应用，通常不能实现规则来自动地预组织消息。例如，事实上不可能实现规则来删除语音消息，或保存语音消息到预定的目录，基于特殊的呼叫者身份和/或电话呼叫的主题或紧急程度。没有呼叫者身份的一致表示，也很难基于呼叫接收者的偏好和优先级智能地路由电话呼叫。

发明内容
本发明的实施例涉及收集电话呼叫者身份的处理。在一个实施例中，对每个可能的呼叫接收者创建个人化的上下文无关语法(CFG)，并将其配置为使用语音识别支持进入的呼叫者的识别。每个CFG都包括高概率呼叫者的指示并相应地修改每个CFG中的概率权重。当接收者接收呼叫时，关联语音识别应用来应用相关的CFG以至少支持初步的呼叫者识别。根据另一个实施例，呼叫者确认识别。根据一个实施例，如果可能的话，使用标准的呼叫者ID功能，至少帮助呼叫识别处理。根据另一个实施例，使用语音识别增强的呼叫者识别来提供智能的呼叫路由功能。

图1为一个说明性的计算环境的框图；图2为语音消息和呼叫路由系统的示意图；图3为CFG的内容的示意方框表示；图4为流程图，展示和实现包含语音识别的呼叫者识别系统关联的步骤；及图5为流程图，展示和实现智能电话路由功能关联的步骤。
具体实施例方式
I.例子操作环境本发明的各方面涉及在现有的呼叫者ID不足以完成识别或不可用时应用语音识别技术收集呼叫者的身份。本发明的实施例可以和呼叫路由系统一起实现，在其中识别呼叫者并相应地路由呼叫。实施例也可以和语音消息系统一起实现，在其中识别留消息的人并相应地排序或路由消息。实施例也可以和呼叫路由同语音消息系统的组合一起实现。应注意，本发明不限于呼叫路由和语音消息系统。这些只是可以实现本发明实施例的系统的两个例子。在详细说明本发明的实施例之前，将对在其中可以实现实施例和它们关联的系统例子的计算环境进行说明。
图1展示适合的计算环境100的例子，在其中可以实现本发明实施例和它们关联的系统。计算系统环境100只是适合的计算环境的例子，且并不造成对本发明的使用范围或功能的任何限制。也不应将计算环境100解释为具有对任何一个所展示的组件或其组合的任何依存关系或需求。
本发明可以工作在大量其他通用或专用计算系统环境或配置中。适合于使用本发明的众所周知的计算系统和/或配置的例子包括，但不仅限于，个人计算机、服务器计算机、手持或膝上设备、多处理器系统、基于微处理器的系统、机顶盒、可编程消费者电子设备、网络PC、小型机、大型机、电话系统、包括任何上述的系统或设备的分布式计算环境等等。
可以在计算机可执行指令(如由计算机执行的程序模块)的一般上下文中对本发明进行说明。通常，程序模块包括执行特殊任务或实现特殊抽象数据类型的例程、程序、对象、组件、数据结构等等。本发明设计为实现在分布式计算环境中，在其中任务由通过通讯网络连接的远程处理设备来执行。在分布式的计算环境中，程序模块位于本地和远程计算机存储媒体中，包括存储器存储设备。下面借助

由程序和模块执行的任务。那些熟悉技术的人可以将说明和附图作为处理器可执行指令实现，所述指令可以写在任何形式的计算机可读媒体上。
参考图1，示出了实现本发明的示范系统，它包括形为计算机100的通用计算设备。计算机110的组件包括(但不仅限于)，处理单元120、系统存储器130，及连接包括系统存储器的各种系统组件到处理单元120的系统总线121。系统总线121可以为几种类型的总线结构中的任何一种，包括存储器总线或存储器控制器、外围设备总线，及使用多种总线结构中的任何一种的本地总线。作为例子，而非限制，这样的结构包括工业标准结构(ISA)总线、微通道结构(MCA)总线、增强的ISA(EISA)总线、视频电子标准协会(VESA)本地总线和亦称为夹楼总线的周边元件互连(PCI)总线。
计算机110通常包括各种计算机可读媒体。计算机可读媒体可以为可以由计算机110访问的任何可用的媒体并包括易失和非易失媒体、可移动和不可移动媒体。作为例子，而非限制，计算机可读媒体可以包括计算机存储媒体和通讯媒体。计算机存储媒体包括以存储如计算机可读指令、数据结构、程序模块或其他数据这样的信息任何方法或技术实现的易失和非易失、可移动和不可移动媒体。计算机存储媒体包括，但不仅限于，RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、盒式磁带、磁带、磁盘存储或其他磁存储设备，或可以用于存储所需信息且可以由计算机110访问的任何其他媒体。
通讯媒体通常包含计算机可读指令、数据结构、程序模块或调制的数据信号如载波或其他传输机制中的其他数据，并包括任何信息发送媒体。术语“调制的数据信号”指设置或更改它的一个或多个特性以在信号中编码信息的信号。作为例子，而非限制，通讯媒体包括有线媒体，如有线网络或直接有线连接，及无线媒体，如声音、射频、红外线和其他无线媒体。上述媒体的任何组合也应包括在计算机可读媒体的范围之内。
系统存储130包括形式为易失和/或非易失存储器的计算机存储媒体，如只读存储器(ROM)131和随机访问存储器(RAM)132。包含基本的例程以帮助在个人计算机110的元件之间如在启动过程中传输信息的基本输入/输出系统133(BIOS)存储在ROM 131中。RAM 132通常包含可由处理单元120立即访问和/或当前正在操作的数据和/或程序模块。作为例子，而非限制，图1展示操作系统134、应用程序135、其他程序模块136和程序数据137。
计算机110也可以包括其他可移动/不可移动、易失/非易失计算机存储媒体。仅作为例子，图1展示了读写不可移动、非易失磁媒体的硬盘驱动器141、读写可移动、非易失磁盘152的磁盘驱动器151，及读写如CD-ROM或其他光学媒体这样的可移动、非易失光盘156的光盘驱动器155。可以用在例子操作环境中的其他可移动/不可移动、易失/非易失计算机存储媒体包括，但不仅限于，盒式磁带、闪存卡、数字多用途盘、数字视频带、固态RAM、固态ROM等等。硬盘驱动器141通常通过不可移动存储器接口，如接口140，连接到系统总线121，而磁盘驱动器151和光盘驱动器155通常通过可移动存储器接口，如接口150，连接到系统总线121。
上面说明并在图1中展示的驱动器及与它们关联的计算机可读媒体对个人计算机110提供计算机可执行指令、数据结构、程序模块或其他数据的非易失存储。例如，在图1中，硬盘驱动器141被展示为存储操作系统144、应用程序145、其他程序模块146和程序数据147。注意这些组件可以和操作系统134、应用程序135、其他程序模块136及程序数据137相同或不同。在此对操作系统144、应用程序145、其他程序模块146和程序数据147给出不同的编号以展示它们至少是不同的拷贝。
用户可以通过如键盘162、麦克风163和定点设备161这样的输入设备输入命令和信息到个人计算机110中。定点设备可以包括鼠标、轨迹球或触摸垫。其他输入设备(未标出)包括操纵杆、游戏垫、圆盘式卫星电视天线、扫描仪或类似设备。这些和其他输入设备通常通过连接到系统总线的用户输入接口160连接到处理单元120，但也可以通过其他接口和总线结构，如并行口、游戏口，或通用串行总线(USB)来连接。显示设备191或其他显示设备也通过接口，如视频适配器190与系统总线121连接。除显示器外，个人计算机通常包括其他外围输出设备，如扬声器197和打印机196，它们可以通过外围输出设备接口195连接。
个人计算机110可以使用到一个或多个远程计算机180的逻辑连接在连网环境中运行。远程计算机180可以是个人计算机、服务器、客户机、路由器、网络PC、对等设备或其他普通网络节点，且通常包括多个或所有上述相对于个人计算机110说明的元件图1中所示逻辑连接包括局域网(LAN)171和广域网(WAN)173。这样的连网环境在办公室范围或企业范围的计算机网络、企业内部互联网和因特网中是很常见的。
当用在LAN连网环境中时，个人计算机110通过网络接口或适配器170与局域网171相连。当用在WAN连环境中时，个人计算机110通常包括调制解调器172或其他在广域网173，如因特网，上建立通讯的方法。调制解调器172，可以为内置的或外置的，通过用户输入接口160或其他适当的机制连接到系统总线121。在连网环境中，相对于计算机110说明的程序模块，或其部分，可以存储在远程存储器存储设备中。作为例子，而非限制，图1展示远程应用程序185存储在远程计算机180上。应理解，所示的网络连接是说明性的且可以使用在计算机之间建立通讯连接的其他方法。
应注意，本发明可以在如参考图1所说明的计算机系统中实现。然而，本发明可以实现在服务器、专门用于消息处理的计算机，或分布式系统中。在分布式系统中，本发明的不同部分在分布式计算系统的不同部分上面执行。
II.语音消息和呼叫路由系统图2，根据本发明的一个方面，是语音消息管理系统204的方框图。系统204是在参考图1所述的一个计算环境内演示性地实现的。呼叫202被路由到系统204中。呼叫202是指向特定接收者210的演示性呼叫。每个接收者210都和语音消息关联系统204有关联。例如，向每个接收者210分配和系统204关联的“邮箱”，邮箱是新的和/或保存的语音消息的集合的数据存储。
消息系统204使用语音消息子系统214来帮助呼叫者对他们的预期呼叫接收者创建语音消息。例如，和呼叫202关联的呼叫者能够和语音消息子系统214交互，以产生到特殊的预期呼叫接收者210的消息。语音消息子系统使用消息管理组件216来接收和管理消息。新的消息保存在数据存储位置218，而先前查看过但没有被删除的消息保存在数据存储位置220。应注意，新的和保存的消息可以被保存到同一数据存储位置而不偏离本发明的范围。作为演示，呼叫接收者210能够和语音消息子系统214交互，以查看他或她的新消息和保存的消息，及根据他或她的意图删除或保存消息。
对每个单独的呼叫202，系统204使用识别子系统206来识别呼叫者。子系统206包括语音识别组件222用来联合多个CFG 212执行语音识别。CFG212包括每个呼叫接收者210的个人化CFG。作为演示，每个CFG是一组节点和指针，解码算法遍历它们来帮助使用语音识别收集和呼叫202关联的呼叫者的身份的处理。根据本发明的一个方面，将给定的CFG对特殊的接收者210进行个人化，在此对其进行加权以偏向该接收者的一组高概率的呼叫者。将引用图3更详细地说明CFG 212的内容的本质。
根据一个实施例，呼叫系统204的呼叫者和子系统206交互，并且，给定将引用图4说明的预定情况集合，被要求说出他或她的名字。获取并存储(即，用语音识别组件222或CFG 212存储)呼叫者名字的完整单词发音模型(即，声音模型)。为了克服和普通的单词到声音规则关联的低效，存储的单词模型根据每个呼叫者如何说出他或她的名字提供准确的发音信息。通过应用适当的CFG(即，CFG关联和适当的呼叫接收者)并比较存储的单词模型和对未识别的呼叫者产生的单词模型，语音识别组件222使用存储的单词模型来确定重复的呼叫者的身份。作为演示，每个所述单词模型是因素的序列或单个语音单元而不偏离本发明的范围。
识别子系统226也包括呼叫者ID组件224。作为演示，组件224和已知的呼叫者识别系统一致，其中呼叫基于与其关联的来源电话号码和呼叫者关联。根据一个实施例，当呼叫者ID信息可用时，识别子系统206将其作为该呼叫者的身份的坚强性但非假定的指示来使用。例如，即使呼叫者ID信息可用，识别子系统206仍将要求呼叫者确认其身份。
根据一个实施例，在其中呼叫者ID和呼叫202关联的情况下，智能地使用和呼叫者ID信息相关的上下文信息来更新CFG框架中的概率。识别子系统206可以配置为使用补充信息来帮助进行上下文假设。
例如，可以向识别子系统206提供对期望在多个特定会议室中参加会议的个人的列表的访问。当进入的呼叫包括和来自其中一个所列会议室的呼叫来源一致的传统呼叫者ID信息时，识别子系统206被配置为调整相关的呼叫接收者的CFG，以使得对安排在该特定会议室中参加会议的呼叫者增加概率权重。在另一个例子中，向识别子系统206提供对特定建筑中的房间和员工的列表的访问。当进入的呼叫指示呼叫来源来自所列的会议室时，调整相关呼叫接收者的CFG，以使得增加对工作在该会议室所处的建筑中的呼叫者的概率权重。
根据本发明的一个方面，以预先组织的方案使用CFG 212、呼叫者ID组件224和语音识别组件222来识别呼叫者。下面参考附图4说明如何系统化地应用这些组件的细节。
根据一个实施例，一旦收集到呼叫者的身份并将其和语音消息关联，消息管理组件216将相应地对该消息进行排序和分类。例如，当呼叫接收者210和语音子系统214交互以查看新的或保存的消息时，作为演示，向它们提供基于呼叫者的提示选项，如“你有三个新消息来自你的妻子，两个新消息来自你的老板，三个旧消息来自Roy Williams...收听来自你妻子的消息请按1，收听来自你的老板的消息请按2，收听来自Roy Williams的消息请按3。”这对只有很少提示的选项，如“你有五个新消息和三个旧消息，收听旧消息请按1，收听新消息请按2”，是一种改进。根据一个实施例，基于主题和/或紧急程度而不是呼叫者的身份进行排序，或基于主题和/或紧急程度和呼叫者身份一起排序。作为演示，假设主题和/或紧急程度是基于各呼叫者的身份的，且由呼叫接收者基于他或她的偏好进行选择或编程。
可以使用身份信息(即，包括呼叫者身份及基于假设的主题和/或紧急程度的信息)来向呼叫接收者210提供智能的呼叫路由选项，如智能的呼叫屏蔽和/或呼叫转移。下面将参考图5更详细地说明这样的呼叫路由应用。智能呼叫管理子系统226是可选组件，作为演示，和识别子系统206及语音消息子系统214交互以提供智能的呼叫路由应用。
III.CFG 212图3是CFG 212的示意性方框图表示。作为演示，对特定的呼叫接收者210个人化每个单独的CFG。联合语音识别组件222使用特定的CFG来识别呼叫者取决于呼叫202指向哪个呼叫接收者。
识别子系统206支持可以使用语音识别可靠地收集和呼叫者身份相关的详细信息。语音识由组件222执行，这是很可靠的，因为它包括1)创建重复呼叫者名字的完整单词发音模型，和2)上下文敏感的个人化语音识别语法(即，CFG 212)。进一步来说，在它可用时使用传统的呼叫者ID信息，如由组件224收集的那样，至少能对语音识别身份处理提供概率更加准确的CFG。如下面参考图4进行的说明，可以实现确认处理来确保更高的可靠性。
作为演示，对特殊的接收者210个人化给定的CFG，其中它被配置为偏向该呼叫接收者的一组高概率的呼叫者。根据一个实施例，如方框302内所示，和CFG关联的算法进行加权以偏向(即，对语言模型概率加权来造成偏向)由关联的呼叫接收者维护的频繁呼叫者列表上的呼叫者的识别。根据另一个实施例，算法进行加权以偏向列在由关联的呼叫接收者维护的联系人列表上(即，列在地址簿中)的呼叫者的识别。根据另一个实施例，算法进行加权以偏向包括在识别子系统206可以访问的同事列表中的呼叫者的识别。根据另一个实施例，使用和呼叫来源的位置相关的上下文假设(即，基于传统的呼叫者ID信息)来加权CFG概率。这些因素中的所有或任何一个，及其他因素，都可以作为个人化呼叫接收者的CFG以提高正确识别的可能性的基础来使用。在图3内，虽然方框302是仅对一个CFG展示的，应理解其他CFG也具有类似配置。
方框302亦表明，CFG也可以可选地作为支持呼叫者ID组件224或语音识别组件222的数据的存储位置来使用。例如，声音模型可以存储在CFG 212内并由语音识别组件222使用。信息汇编，如同事列表、会议室列表、频繁呼叫者列表、与会人员列表、建筑房间列表、构建员工列表和其他信息可以存储在CFG 212内，并由识别子系统206的任何组件在呼叫者识别处理期间使用。任何数据都可以替换地存储在独立于CFG 212的位置而不偏离本发明的范围。
IV.实现语音识别增强的呼叫者识别的处理根据本发明的一个方面，识别子系统206以预定的组织方案使用CFG 212、呼叫者ID组件224和语音识别组件222来识别呼叫者。图4为流程图，展示和预定的组织方案关联的步骤。
作为演示，图4的处理在语音消息管理系统204处理呼叫202时开始。如方框402所示，第一步是使用呼叫者ID组件224来确定仅基于传统的呼叫者ID信息是否可以得出任何识别结论。换句话说，确定对应于呼叫202的电话号码是否和已识别的个人关联。如果呼叫者ID信息足以做出对呼叫者身份的合理的基于经验的猜测，那么处理直接转到名字确认处理，在图4中用方框408标出。
方框408表示这样的步骤，其中识别子系统206从呼叫者获取对该呼叫者是谁的确认。步骤408对识别子系统206做出的基于经验的身份猜测进行确认或否决。例如，向呼叫者询问简单的问题，如“你是Nick Collision吗？”如果确认不成功，那么，根据方框406，和呼叫者进行问答会话以收集来自该呼叫者的口语样本(即，呼叫者口头说出的名字)，并使用语音识别组件222和CFG 212基于口语样本识别呼叫者。
特别地，收集来自呼叫者的口语样本之后，由语音识别组件222将该样本和存储在相关呼叫接收者的CFG中的语言模型进行比较。使用此语音识别处理对呼叫者的身份做出另一个基于经验的猜测。然后由呼叫者在步骤408确认或否决这个基于语音识别的基于经验的猜测。如果该确认被否决，则重复问答会话。作为演示，系统配置为基于存储的语音样本至少进行预定次数的不同的身份猜测。然而，根据一个实施例，在预定次数的不成功尝试之后，系统将放弃对呼叫者的识别。在这样的情况下，仍将存储呼叫者的语音样本，用于以后的语音识别，以备后来知道呼叫者的身份。根据一个实施例，识别系统206支持用户通过电话键盘输入身份。
如果成功确认基于语音识别的基于经验的猜测，那么执行步骤410。在步骤410，存储声音数据以便由语音识别组件222在以后使用。根据一个实施例，语音识别组件222对每个呼叫者保存预定数量或不限数量的语音样本。维护多个语音样本使得识别组件222能够在识别处理期间做出更准确的比较(即，可以用多个样本和目标比较以得到更高的精度)。
接着存储声音数据，根据方框412，更新频繁呼叫者列表。作为演示，和呼叫202所指向的接收者210关联的CFG进行加权，以有助于识别频繁呼叫者的列表。在识别呼叫者成功和确认之后，根据方框412，修改呼叫者的列表，将从已确认的呼叫者接收的呼叫数加1。当更新频繁呼叫者的列表时，也应对加权的CFG做出相应更新。可以在收到命令时、每次呼叫时或定期(即，每天、每周、每月等等)对CFG实现这样的更新。应注意，根据本发明的一个实施例，可以修改任何CFG偏好信息源(即，频繁呼叫者、来自联系人列表和同事列表的名字，等等)，在定期或收到请求时使用修改的信息来更新一个或多个CFG。
应注意，如果单独基于呼叫者ID信息就成功确认了呼叫者的身份，那么下一个步骤为步骤412，因为没有可用的语音数据而可以跳过步骤410。
回到方框402，在一些情况下，接收到的呼叫者ID信息不足以确认呼叫者但足以给出一些上下文的线索，这可以用来加权接收者的CFG以有助于正确识别(参见上述的“会议室”例子)。根据方框404，根据上下文呼叫者ID信息调整CFG权重。在调整之后，根据方框406，在和呼叫者的问答会话期间获得声音样本。如在流程图和上面说明中所示，重复余下的识别处理，包括确认步骤408。
进一步引用方框402，在一些情况下，可能完全没有可用的呼叫者ID信息。在这样的情况下，立即执行步骤406的问答会话且如在流程图和上面说明中所示重复此处理。
V.智能呼叫路由根据本发明的特定实施例，在呼叫者仍然在线时收集并确认呼叫者的身份。相应地，收集并确认的呼叫者身份可以用于呼叫路由应用，例如但不仅限于，呼叫屏蔽和呼叫转移。作为演示，呼叫路由应用可以使用智能呼叫管理子系统226来实现(图2)，那是一个可选的组件。
图5是流程图，根据本发明的一个方面展示智能呼叫屏蔽。作为演示，处理在呼叫进入系统时开始。第一个步骤，如方框502所示，是系统221确定是否开启了智能屏蔽功能。如果未开启，则路由所有呼叫到它们预期的接收者(方框510)。如果开启了该功能，则根据方框504，由子系统206确定呼叫者的身份。作为演示，虽然不是必须的，使用参考附图4所述的处理来确认该身份。
根据方框506，比较确认的呼叫者身份和系统设置来确定呼叫者是否得以通过而到达预期的接收者210。如果允许他们通过，那么根据方框510连接呼叫。如果不允许，那么，根据方框508，将呼叫者转移至语音消息子系统214以进行留言。
根据本发明的另一个方面，呼叫转移的工作类似于上述的呼叫屏蔽。主要的区别是，呼叫转移不是将身份信息用作路由呼叫到接收者或语音消息系统的基础，而是将身份信息用作路由呼叫到一个位置或另一个位置(即，到一个电话号码或另一个电话号码)的基础。
总而言之，本发明的实施例涉及使用语音识别在语音消息和呼叫路由系统中收集呼叫者信息，尤其是在传统的呼叫者ID不足以完成识别或不可用的情况下。根据本发明的一个方面，语音识别支持的呼叫者识别是联合下面的系统组件实现的1.个人化的CFG对每个可能的呼叫接收者使用。CFG偏向一组高概率的呼叫者。所偏向的呼叫者属于通过得到较高的语言模型权重而得到优于余下的普通名字的偏好的一组名字。例如，可以偏向对某接收者的频繁呼叫者，偏向来自他/她的联系人列表中的名字，或偏向在同一部门工作的人，等等。
2.完整单词(声音)模型属于每个重复呼叫者的名字发音，是通过从以前的呼叫中得到的记录产生的。此单词模型提供每个呼叫者如何说出他/她的名字的准确发音信息来克服普通的字母到声音规则的低效。
3.传统的呼叫者ID信息用在确认处理中。当适合的时候，如果呼叫者ID信息可用，则可以根据基于框架的概率来智能地使用它，以直接带领呼叫者进入确认处理。
4.用上下文对概率CFG加权。甚至在传统的呼叫者ID不是呼叫者身份的可信指示的情况下，仍将在基于概率的系统内提供有用的上下文信息。
5.智能的呼叫屏蔽和呼叫转移服务亦由系统提供。系统可以扩展作为智能的呼叫屏蔽和/或转移应用来使用。
虽然参考首选实施例对本发明进行了说明，熟悉技术的人应承认，可以做出在形式和细节上的改变而不偏离本发明的精神和范围。
权利要求
1.一种计算机实现的方法，用于确定和进入电话呼叫关联的电话呼叫者的身份，所述进入电话呼叫指向特定的可能呼叫接收者，其特征在于，所述方法包括对多个可能的呼叫接收者创建并存储个人化的语音识别语法，包括所述特定的可能呼叫接收者；获取来自电话呼叫者的语音样本；及至少部分基于和所述特定的可能呼叫接收者关联的个人化的语音识别语法，选择电话呼叫者的身份。
2.如权利要求1所述的方法，其特征在于，所述对多个可能的呼叫接收者存储个人化的语音识别语法包括存储加权以对每个可能的呼叫接收者偏向识别一组高概率呼叫者的语音识别语法。
3.如权利要求2所述的方法，其特征在于，所述存储加权的语音识别语法包括存储有加权的语言模型概率的语音识别语法。
4.如权利要求2所述的方法，其特征在于，所述存储偏向一组高概率呼叫者的语音识别语法包括存储加权以偏向识别至少一个频繁呼叫者的语音识别语法。
5.如权利要求2所述的方法，其特征在于，所述存储偏向一组高概率呼叫者的语音识别语法包括对特定的可能呼叫接收者存储加权以偏向识别列在联系人列表中的至少一个呼叫者的语音识别语法，所述联系人列表由所述特定的可能呼叫接收者维护。
6.如权利要求2所述的方法，其特征在于，所述存储偏向一组高概率呼叫者的语音识别语法包括对特定的可能呼叫接收者存储加权以偏向识别所述特定的可能呼叫接收者的至少一个同事的语音识别语法。
7.如权利要求2所述的方法，其特征在于，所述存储偏向一组高概率呼叫者的语音识别语法包括存储加权以偏向识别和电话呼叫发起地点关联的至少一个可能的呼叫者的语音识别语法。
8.如权利要求7所述的方法，其特征在于，所述存储加权以偏向识别和电话呼叫发起地点关联的至少一个可能的呼叫者的语音识别语法包括存储语音识别语法，所述语音识别语法进行加权以偏向识别至少一个可能的呼叫者，所述呼叫者关联于在和该电话呼叫关联的呼叫者ID信息中指示的位置。
9.如权利要求1所述的方法，其特征在于，进一步包括和所述电话呼叫者来确认身份交互。
10.如权利要求1所述的方法，其特征在于，所述方法进一步包括接收来自电话呼叫者发至特定的可能呼叫接收者的语音消息；及至少部分基于电话呼叫者的身份存储所述语音消息和其他语音消息。
11.如权利要求1所述的方法，其特征在于，所述方法进一步包括基于电话呼叫者的身份路由电话呼叫。
12.如权利要求11所述的方法，其特征在于，所述路由电话呼叫包括路由至少一个和预定身份关联的呼叫到语音消息系统。
13.如权利要求11所述的方法，其特征在于，所述路由电话呼叫包括路由至少一个和预定身份关联的呼叫到替换的呼叫转移号码。
14.如权利要求1所述的方法，其特征在于，进一步包括对多个可能的呼叫者创建并存储多个完整单词名字发音模型。
15.一种配置为帮助识别发起到电话呼叫接收者的呼叫的电话呼叫者的识别子系统，其特征在于，所述子系统包括语音识别语法，所述语音识别语法配置为支持通过比较从电话呼叫者获取的语音样本和在语音识别语法中定义的声音模型表示的语言模型序列来识别电话呼叫者；完整单词声音样本包括由原先的呼叫者说出他们的名字产生并配置为帮助识别电话呼叫者的声音信号；及用来对语音识别语法和完整单词声音样本应用语音样本来识别电话呼叫者的语音识别组件。
16.计算机实现的基于发起电话呼叫的电话呼叫者的身份使用语音识别路由电话呼叫的方法，其特征在于，包括存储多个声音名字发音模型，它们的每个都直接通过已识别的呼叫者得到，并且每个都和已识别的呼叫者关联；接收来自电话呼叫者的语音样本；比较语音样本和多个语音名字发音模型，以使得向电话呼叫者赋予身份；及基于电话呼叫者的身份路由电话呼叫者。
17.如权利要求16所述的方法，其特征在于，所述路由电话呼叫包括直接路由电话呼叫到预期的呼叫接收者。
18.计算机实现的确定电话呼叫者的身份以用于呼叫和消息处理的方法，其特征在于，所述方法包括存储多个声音名字发音模型，它们的每个都直接通过已识别的呼叫者得到，并且每个都和已识别的呼叫者关联；接收来自电话呼叫者的语音样本；及比较语音样本和多个语音名字发音模型，以使得向电话呼叫者赋予身份。
19.如权利要求18所述的方法，其特征在于，所述方法进一步包括接收来自电话呼叫者的语音消息；及至少部分基于电话呼叫者的身份对该语音消息和其他语音消息排序。
全文摘要
揭示收集电话呼叫者身份的处理。在一个实施例中，对每个可能的呼叫接收者创建个人化的上下文无关语法(CFG)，并将其配置为使用语音识别支持进入呼叫者的识别。每个CFG都包括高概率呼叫者的指示并相应地修改每个CFG中的概率权重。当接收者接收呼叫时，关联语音识别应用来应用相关的CFG以至少支持初步的呼叫者识别。根据另一个实施例，呼叫者确认识别。根据一个实施例，如果可能的话，使用标准的呼叫者ID功能，至少帮助呼叫识别处理。根据另一个实施例，使用语音识别增强的呼叫者识别来提供智能的呼叫路由功能。
文档编号G10L17/00GK1581294SQ200410056729
公开日2005年2月16日申请日期2004年8月11日优先权日2003年8月11日
发明者朱云正, D·G·欧拉森申请人:微软公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱云正;Ｄ.Ｇ.欧拉森
技术所有人：微软公司
我是此专利的发明人