导航应用的方法和系统的制作方法

文档序号:2820194阅读:311来源:国知局
专利名称:导航应用的方法和系统的制作方法
技术领域
本发明通常涉及通过通信系统接入应用,尤其涉及在应用之间进行导航。
背景技术
本部分目的是向读者介绍可能与本发明各个方面相关的各方面技术,下面对此进行描述和/或声明。该讨论相信有助于向读者提供背景信息以便更好地理解本发明的各个方面。因此,应该明白,这些叙述应该以此观点来阅读,而不应该仅作为对现有技术的事实陈述。
在过去的几十年里,包括有线和无线通信系统的通信系统已经稳步地得以发展。这种发展的一个例子在于蜂窝电话系统的持续采用和不断增长的普及趋势。可以预料到,潜在蜂窝业务用户的有限数量已经导致在各种蜂窝业务提供商之间为保护和增加它们的用户基础而产生竞争。
响应于这种用户的竞争,蜂窝业务提供商已经将他们所提供的业务从基本的电话业务扩展到包括接入到宽范围的其它应用。例如,可以向用户提供语音邮件和会议呼叫应用。类似地,用户还可以使用诸如行程安排、新闻、体育、天气、和金融应用等内容驱动应用。这些应用典型地允许用户接入个人或第三方的内容,例如,预约、新闻轶事、体育得分、天气预报、和股票价格。此外,这些可用应用的全部或部分可以是基于位置或在它们操作中使用位置信息来增加使用的方便性。应该理解到,访问诸如电话或接入号码列表、音频或视频应用菜单这些应用的技术可以由业务提供商提供以在可用的应用之间进行导航。

发明内容
下面阐述与原始要求的本发明的范围相当的一些方面。应该明白,这些方面仅仅显示来向读者提供对本发明可能采用的某些形式的简单说明,并且这些方面目的不在于限制本发明的范围。事实上,本发明可以包括下面所没有阐述的多个方面。
根据本发明的一个方面,提供了一种信号处理器。该信号处理器可以配置来接收基于合成语法选择的令牌。该令牌相应于多个应用中的一个的入口点。该信号处理器也可以配置来在该入口点接入各个应用。
根据本发明的另一个方面,提供了一种通信系统。该通信系统包括电话服务器,其配置来接收与音频命令相关的调制信号,并分析该调制信号以识别合成语法的成分。该电话服务器还可以配置来选择相应于该成分的令牌。所述通信系统还包括浏览器模块,其配置来获取所述令牌,并基于该令牌接入多个应用中的一个应用的入口点。
根据本发明的再一个方面,提供一种接入应用的方法。该方法包括处理信号来识别作为合成语法成分的音频代码的操作。此外,该方法还包括基于所述合成语法的成分接入多个应用中的一个应用的入口点的操作。
根据本发明的又一个方面,提供了一种有形的计算机可读介质。该介质包括存储在该计算机可读介质上的编程指令,其用来处理信号以识别作为合成语法成分的音频代码。该介质还包括存储在计算机可读介质上用来基于所述合成语法的成分接入多个应用中的一个应用的接入点的编程指令。
根据本发明的另一个方面,提供了一种制造有形计算机介质的方法。该方法包括在计算机可读介质上存储用来识别作为合成语法成分的音频代码的编程指令的操作。该方法还包括在计算机可读介质上存储用来基于所述合成语法的成分接入多个应用中的一个应用的入口点的操作。
根据本发明的一个附加方面,提供一种制造电话系统的方法。该方法包括提供至少一个信号处理设备的操作,该设备被编程来识别作为合成语法成分的音频代码。此外,所述信号处理设备还可以被编程来基于所述合成语法的成分接入多个应用中的一个应用的入口点。


通过阅读下面的详细描述和参考附图,本发明的优点将变得更明显,其中图1显示了根据本发明配置用来接入两个或多个应用的通信系统的典型实施例;图2显示了根据本发明的典型语法视图;和图3显示了描述根据本发明在两个典型应用之间导航的流程图。
具体实施例方式
下面将描述本发明的一个或多个具体实施例。为了提供对这些实施例的简明描述,在说明书中并没有描述所有实际实现的特征。应该理解到,在任何这些实际实现方式中的开发中,如在任何工程或设计项目中那样,必须作出多种具体实现的决定来实现开发者的具体目标,例如,符合系统相关和商业相关的约束,这可能需要从一种实现方式变换到另一种实现方式。而且,应该理解到,这种开发努力可能是复杂和耗时的,但是对于享有本公开益处的本领域普通技术人员来说,却是设计、制作、和制造所必须进行的例程。
随着在蜂窝电话产业中客户竞争的加剧,业务提供商已经通过提供附加业务来进行响应,例如,接入到包括语音邮件、新闻和天气应用的多种应用。这些应用可以从单个点接入,例如拨号音或语音邮箱。为了进一步改善各种应用的可接入性和方便性,可以使用各种以话音为中心的接口,以允许用户使用语音命令或响应与应用进行交互。然而,由于在应用之间缺少公共用户接口,所以会降低以话音为中心接口的优点。
尤其是,由业务提供商提供的各种应用可以由多个第三方经销商构建和/或支持。第三方经销商可能积极相互进行竞争或者可能简单地没有意识到或不关心其它应用。不管怎样,第三方经销商提供的应用典型地是孤立的,其中每个应用包含一个单独的用户接口。
因此,希望在应用之间导航的用户必须典型地完成与第一应用的交互并退出第一应用。接着,该用户启动第二应用,完成与第二应用的交互,并在启动第三应用之前退出第二应用,等等。
而且,用户典型地必须通过应用的各种层或脚本导航来找到它们所寻求的功能或内容。例如,为了接入城市的天气预报,用户不得不从第一应用中退出,启动天气应用,响应于指定城市的提示,响应于描述所需信息的提示,即,明天的天气预报,并接着在返回到第一应用之前退出天气应用。从而,用户遭受比所希望的更加频繁地退出和启动应用和重复地通过每个应用的初始层导航到达所需功能或内容的烦恼。因此,不但需要向用户提供多种独立的应用,而且需要提供允许用户更容易在应用之间进行导航和/或从应用更容易接入特定数据的接口。
在此所公开的技术提供了一种用于多种独立应用的统一接口。具体来说,所公开的技术提供使用音频代码或信号(例如所说的单词或短语或DTMF音)的公共列表或词汇表来允许集体而不是单个地导航各种应用,所述音频代码或信号通常等同于支持捆绑应用的可接受响应。尤其是,统一接口允许用户在应用之间自由移动或直接从应用接入内容,而无需在初始菜单和选项的迷宫内来回移动。此外,该技术还自动产生应用来提供业务(此后称作主菜单),该业务提供了对一组捆绑应用的描述并接入到所述捆绑应用。
在以VoiceXML编写的应用上下文中,每个应用具有相关的语法,其至少包括与包括该应用的文档相关的各种语法。在诸如VoiceXML的编程语言上下文中,语法可以被认为是与该语法相关的相应结构的可允许响应或输入列表,即,文档或应用。换句话说,应用文档可以接受在其相关的文档语法中定义作为那些响应的输入。因此,在VoiceXML或类似编程语言上下文中,本技术可以通过建立根或系统级语法来实现,该语法包括每个应用的可允许输入,该应用包括可以从相应的根或系统级接入的主菜单。
虽然所描述的根语法为支持的应用提供了全局词汇表或导航语法,但是在实际中,可能需要基于当前的环境来补充这种根语法,例如,当用户正接入应用时。例如,可以依赖于这些环境来使用合成语法,这些环境可以只包括根语法(例如当前没有接入应用时,即,处于主菜单时)或可以包括根语法和当前所接入应用的应用语法。合成语法可以作为单个语法来实现,即,包括根语法和当前所接入应用的应用语法的单个语法。可选地,合成语法可以作为两个分离的语法来实现,即,根语法和当前应用语法,其可以被同时接入和/或功能性地被作为单个语法来对待。在根语法和当前应用语法之间存在差异或副本的情况下,可以使用优先级规则,例如,优先考虑在公共或重复命令情况下的当前应用。合成语法在保持接入到根语法的同时给应用语法提供了连续性,从而容易接入到其它应用和主菜单。
而且,本领域普通技术人员也应该理解到,业务提供商可以向用户提供不同应用包或绑定。如上所述,不同根语法和主菜单应用从而可以与每个应用绑定相关。各种根语法和主菜单应用的产生和更新可以在基于处理器的系统上执行,例如配置来查询各个应用服务器的统一接口服务器。以这种方式,统一接口服务器可以通过查询合适的应用服务器来构建合适的根语法和/或主菜单。
虽然在VoiceXML上下文中使用根语法是本技术的一种可能实现,但是本领域技术人员应该理解到,其它实现方式也是可以的。事实上,本技术通常包含了词汇表的使用,该词汇表包括所接受的多种应用的音频代码,并使用该词汇表在各种应用之间和之内进行导航。以这种方式,本技术提供了在其它独立应用之间容易快速地进行导航。
现在转向附图,首先参考图1,提供了一个通信系统的例子,由参考标记10指示。所描述的通信系统10包括支持在多方之间电话通信的元件并可接入由各方提供或支持的应用。例如,通信系统10包括无线设备的无线支持,例如一个或多个蜂窝电话12、PDA设备、和其它能够进行音频通信的设备。诸如蜂窝电话12的无线设备可以将诸如话音和/或DTMF音的音频信号转换成可以作为电磁信号经空中接口发射的初始调制信号。该信号被诸如蜂窝塔16和相关天线18的基站收发信台所接收。蜂窝塔16转发包括初始调制信号或初始调制信号的放大或其它处理版本的调制信号到移动交换中心(MSC)20。
移动交换中心20是服务无线系统的交换机。它执行交换呼叫到合适目的地和维持连接的功能。事实上,移动交换中心20的主要功能是在移动电话和诸如其它移动电话或陆线电话的其它电话之间提供语音通路连接。典型移动交换中心20包括控制交换功能、呼叫处理、信道分配、数据接口、跟踪、寻呼、呼叫切换、计费、和用户数据库的多个设备。
作为其操作的一部分,移动交换中心20可以传输包括转发的调制信号或转发的调制信号的放大或其它处理版本的调制信号到由业务提供商维护的电话服务器22。调制信号可以通过诸如光纤光缆或铜线的物理线路或通过无线传输从移动交换中心20传输到电话服务器22。例如,调制信号可以使用T1电话标准在T1线路上进行传输。
调制音频信号还可以从连接到陆线电话26或其它电话设备的公共交换电话网(PSTN)24发送到电话服务器22。类似地,调制音频信号可以来源于连接到诸如因特网的网络并使用例如语音IP(VOIP)的合适通信协议的计算机28。
一旦电话服务器22接收到调制音频信号,就可以基于接收信号是否表示拨打电话呼叫的尝试或接入可用应用的请求执行不同的操作。例如,调制信号可以包括音频代码,例如单词、短语和/或DTMF音,其可以识别为接入应用或应用菜单的尝试。音频代码的识别可以由使用各种统计模型技术的模式识别例程来完成,例如HiddenMarkov Models(HMM)或神经网络。
如果识别出所接收的调制信号表示接入应用的尝试,就产生一个或多个被发送到浏览器模块30的合适令牌,并最终被发送到应用服务器,例如应用服务器32、34、36中的其中一个。响应于该令牌或多个令牌,各个应用传输数据文件到浏览器模块30以便随后传输到发起设备,例如蜂窝电话12、陆线电话26、或计算机28。数据文件的格式相应于请求的数据。例如,语音邮件应用通过传输响应于请求语音邮件的音频文件给用户来响应于一个令牌或令牌组合。类似地,诸如文本消息或电子邮件的应用通过传输相应于一个或多个文本消息的数据文件进行响应。其它诸如网页接入或相册应用的应用通过传输相应于多媒体或视频文件的数据文件进行响应。换句话说,可以基于应用、请求的数据、和发起设备的特点将合适的数据文件返给用户。然后,如果需要的话,用户可以从应用请求附加的信息。
可以基于普通词汇表确定发送到浏览器模块30的一个或多个令牌,例如在VoiceXML实现方式中的合成语法,其相关所识别模式到相应的一个或多个令牌。所识别模式可以相应于一个或多个DTMF音、一个或多个说出的单词(例如“删除”或“温度”)、或说出的短语(例如“今晚将结冰吗?”)。而且,不只一个识别模式相应于相同的令牌。例如,所识别的单词“删除”、“擦除”和“移除”的模式都可以调用相同的令牌,从而从接入的应用中调用相同的响应。
通常,浏览器模块30接收所述一个或多个令牌并基于所接收的一个或多个令牌在应用服务器32、34、36上指导和控制与各自应用的交互操作。例如,浏览器模块30可以接收与应用数据查询相关的一个或多个令牌,例如相应于请求股票价格的令牌。如果其它的应用当前处于活动状态,那么浏览器模块30可以通过例如发送合适的令牌来正确地退出活动的应用,并提供这些令牌到金融应用,这些对用户来说是不可见的。与金融应用相关的特定文档或例程通过这些令牌直接接入来得出包含所需数据的数据文件。可选地,浏览器模块30可以导航初始文档或菜单来找到相关的文档或例程,从这些文档或例程中可以得出所需的数据,这些对用户来说也是不可见的。
浏览器模块30可以继续将用于金融应用的后续令牌指向金融应用,例如用于附加的股票报价。一旦浏览器模块30接收到相应于不同应用的令牌,浏览器模块就可以正确地退出金融应用并为所请求数据启动与所请求的应用的交互操作。即使某些音频代码由不只一种应用(例如所说的单词“删除”或“下一个”)所共用,但在处理字符串中的附加令牌(例如“删除”和“电子邮件”或“下一个”,“语音”,和“邮件”)可以被浏览器模块30使用来确定正在被寻址的应用。而且,浏览器30会考虑令牌(例如“下一个”)在当前所接入的例如语音邮件应用的应用的上下文中是否有意义,以确定是否继续与应用进行通信。例如,在VoiceXML应用上下文中,如果令牌“下一个”是当前应用的应用语法的一部分,浏览器30将该令牌寻址到当前应用。以这种方式,与应用的通信可以维持到明确地寻址到一个新的应用,例如通过不是处于当前应用的应用语法中的令牌。
如上所述,传输到浏览器模块的一个或多个令牌可以通过参考公共词汇表来确定,该词汇表典型地置于电话服务器22上,并使所识别的模式等同于合适的令牌。如上面所讨论的,这种公共词汇表的一个例子可以是在以VoiceXML编写的应用中所使用的合成语法。所述公共词汇表可以部分或整体地通过统一接口服务器37或基于处理器的系统来产生,服务器或系统可以与浏览器模块30进行通信来协调产生和更新整个系统10内的根语法和/或主菜单应用。
合成语法提供了用来将相应于所说单词、所说的短语、或DTMF音的识别模式等同于语义解释,即,在此所描述的本技术中所使用的令牌。本领域普通技术人员应该理解到,语义解释可以是简单的值(例如串)、完全组属性值对(例如日、月、年)、或嵌套的对象。以这种方式,合成语法提供了一种通过至少一个支持的应用将识别的单词、短语或语音转换成所期望输入的机制。响应于今牌,应用、或应用的文档可以提供一个所需的输出,例如,下一个语音邮件消息、股票报价、体育得分等等。
作为例子,并参考图2,提供了根语法40的图形表示及其相关应用和文档语法的关系。如图2所描述的那样,根语法40可以与多个应用和自动产生的主菜单应用相关,每一个应用具有各自的应用语法48、50、52、53。每个应用语法依次包含包括该应用的文档的各自文档语法。例如,第一应用语法48至少包括第一应用的文档的语法,即,文档(1a)语法54和文档(1b)语法56,如图2描述的那样。类似地,第二应用语法50至少包括文档(2a)语法58,和第三应用语法52至少包括文档(3a)语法60、文档(3b)语法62、和文档(3c)语法64。此外,主菜单应用语法53包括与帮助相关的文档语法,例如文档(4a)语法66,和与指南相关的文档语法,例如,文档(4b)语法68。
在实际中,浏览器模块30可以产生根语法40。例如,浏览器模块30可以查询各自的应用来得出各自的应用语法48、50、52,从这些语法中可以产生根语法40。浏览器30依次公布根语法40到其可以对该语法进行查询的平台,例如统一接口服务器37。可选地,业务提供者可以检查应用语法48、50、52来确定根语法的成分并将它们递交给浏览器模块30以公布于根语法40中。此外,应用提供者自己也可以递交他们认为将应用在根语法40中公布的语法成分。
如上所述,本技术的根语法40可以包括各自的应用语法48、50、52。因此,作为根语法40成分的单词、短语、或语音可以被用来选择相应于各自应用和由根语法40参考文档的一个或多个令牌。所述一个或多个令牌字符串可以依次被用来直接接入应用的合适层或文档。此外,如上所述,根语法可以接入通过绑定应用组建立的主菜单应用。
尽管VoiceXML是一种可以用来实现以话音为中心的应用的语言,但是也可以使用其他标准化语言和/或专用语言。在以话音为中心的应用识别具有相应令牌的单词、短语或语音,也就是处理语法的程度上,是可以应用本技术的。尤其是,本技术对于在多个应用之间导航是有用的,这种情况下,每个应用拥有多个入口点,即,可以直接通过一个或多个合适的令牌接入的层、文档或子例程。
现在参考图3,提供了使用本技术在用户和两个应用之间交互的例子。如图3所描述的,多个应用70,例如上面所描述的语音邮件应用72和天气应用74对用户是可用的。在VoiceXML实现方式中,可以使用根语法40,来允许用户在应用70中自由浏览。例如,用户起初希望通过说“我能干什么”来得到在绑定中可用的业务列表,从而从主菜单得到帮助指南。
可选地,用户可能希望旁路主菜单和应用初始菜单。例如,用户可以口头陈述“Miami,下周五的天气”来从天气应用74的播放天气文档76中得到相应的数据。由于用户的描述包含作为播放天气文档74的文档语法成分的单词,所以可以旁路诸如在判决块78的引出城市的干预步骤。
在检查了天气之后,用户可能希望检查在语音邮件应用72中的第二排队消息。用户可以口头陈述“下一个消息”来接入下一个消息文档82,从而引出在他的语音邮件队列中的第二消息。
如在这些例子中阐述的那样,用户的描述提供了足够的信息,即,产生了必需的令牌,来直接接入应用入口点,例如在VoiceXML应用情况下的文档,其或许不能通常地以此方式来接入。当在此使用时,与应用相关的术语入口点通常指的是文档、子例程、层或其他编程结构,它们可以使用例如令牌或其他语义解释的合适输入接入来引出所需的响应,例如数据文件。此外,如在前面的例子中所阐述的那样,例如在电话服务器22中的合成语法40(如果可以应用的话,由根语法和当前所接入应用的应用语法构成)的实现方式允许浏览器模块30在应用之间和在应用文档之间导航,而不会迫使用户自觉地退出应用或线性地导航干预应用层,即,文档。
关于本技术的实现方式,电话服务器22和浏览器模块30任何一个或两者都可以基于能够实现一些或全部在此所描述的技术的单个信号处理单元,例如,通过软件、硬件、及其任何合适的组合。例如,电话服务器22和/或浏览器模块30可以是通用设备,例如具有编程来执行这些技术的合适软件的通用计算机或服务器。可选地,电话服务器22和/或浏览器模块30可以使用专用处理器、硬件和/或软件来完成这些技术。这些专用处理器和硬件的例子包括数字信号处理器、RISC处理器、或专用集成电路,其可以是专门适用于执行本技术的。而且,如果需要的话,浏览器模块30和电话服务器22的功能可以组合在单个基于处理器的系统上。在一种实现方式中,电话服务器22和浏览器模块30可以配置在电话联合体内的单独的通用计算机上,例如ANYPATH电话联合体。
虽然本发明允许有各种修改和替换形式,但是作为例子在附图中显示了具体实施例并在此具体进行了描述。然而,应该明白,本发明目的不在于限制于所公开的特定形式。相反,本发明覆盖落入由下面所附的权利要求书所限定的本发明的精神和范围内的所有修改、等同物和替代。
权利要求
1.一种配置用来接收基于合成语法选择的令牌的信号处理器,其中所述令牌相应于多个应用中的一个应用的入口点,并被配置来在所述入口点接入各自的应用。
2.如权利要求1所述的信号处理器,其中所述信号处理器配置来退出以前的应用而无需从用户接收退出指令。
3.如权利要求1所述的信号处理器,其中所述信号处理器配置来从相应于所述入口点的各自应用的级别中接收响应的数据文件,并配置来将该数据文件传输到电话服务器。
4.如权利要求1所述的信号处理器,包括配置来接收与音频命令相关的调制信号、分析该调制信号以识别根语法的成分、选择相应于该成分的令牌,并将该令牌传输给信号处理器的电话服务器。
5.一种通信系统,包括配置来接收与音频命令相关的调制信号、分析该调制信号以识别合成语法的成分、选择相应于该成分的令牌的电话服务器;和配置来获得所述令牌并基于所述令牌接入多个应用中的一个应用的入口点的浏览器模块。
6.如权利要求5所述的通信系统,包括多个应用服务器,其中每个应用服务器配置来执行所述多个应用中的至少一个,其中每个应用包括可以通过相应令牌接入的至少一个入口点。
7.如权利要求5所述的通信系统,包括配置来传输所述调制信号到所述电话服务器的移动交换中心。
8.一种接入应用的方法,该方法包括以下操作处理信号以识别作为合成语法成分的音频代码;和基于所述合成语法的成分接入所述多个应用中的一个的入口点。
9.如权利要求8所述的方法,包括操作发送数据文件给用户,其中所述数据文件是响应于接入所述入口点产生的。
10.如权利要求8所述的方法,其中接入所述入口点包括传输指示符到在处理的信号中识别出所述音频代码的各自应用。
全文摘要
本发明涉及导航应用的方法和系统。提供了一种在通信网络中便于在以话音为中心的应用之间导航的根语法。所述根语法可以由所支持应用的应用语法构造。在识别处理期间,根语法可以与当前应用的动态语法组合来产生合成语法。作为合成语法一部分识别的音频通信可以被用来服务当前应用以在应用之间导航,和/或直接接入应用的不同部分或文档,而无需通过干预层进行导航。尤其是,从用户的角度来看,与使用更长的导航处理相反,可以直接接入由根语法参考的其他应用或文档。
文档编号G10L15/18GK1658635SQ20051000938
公开日2005年8月24日 申请日期2005年2月18日 优先权日2004年2月20日
发明者丹尼尔·S·斯图普斯, 杰弗瑞·韦伯 申请人:朗迅科技公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1