用于能够使用语音的工作环境的训练/指导系统的制作方法

文档序号:7736655阅读:387来源:国知局
专利名称:用于能够使用语音的工作环境的训练/指导系统的制作方法
用于能够使用语音的工作环境的训练/指导系统相关申请本申请涉及并要求于2008年11月14日提交的、标题为“TRAINING/COACHING SYSTEM FOR A VOICE-ENABLED ENVIRONMENT” 的美国临时专利申请序号 No. 61/114,820 的益处,该申请通过引用并入本文。本发明通常涉及在能够使用语音的工作环境中使用说话或语音技术来协助完成各项任务,并且更具体地涉及允许语音辅助系统的一个用户来训练或指导系统的另一用户的方法。
背景技术
在各种不同的环境中使用为语音识别形式的语言或语音技术来协助完成各种工作或任务。例如,这种能够使用语音的工作环境包括语音指导的工作环境和语音辅助的工作环境。在典型的能够使用语音的工作环境中,工作人员佩戴具有语音或语言功能的移动计算机。移动计算机佩戴于用户身体上或者以另外方式携带,例如围绕腰部携带。头戴式耳机例如使用电缆或可能以无线方式连接到移动计算机。在另一实施例中,移动计算机会直接实现在头戴式耳机中。头戴式耳机包括用于播放语音指令或提示以及其它声音的一个或多个扬声器,上述语音指令或提示以及其它声音由移动计算机产生或合成以指导或辅助用户的工作,以及验证用户的说出的语言。头戴式耳机还具有麦克风,用于记录用户的语音, 例如语音命令和其它声音,以使用用户语音和语音识别来处理由用户说出的命令以及允许数据的输入和其它系统反馈。就像他们从管理人员或指导人员获取指导或从阅读工作指令或待处理事情列表获取指导那样,当用户从中央系统和其移动计算机获取特定指导时,这种能够使用语音的工作环境的一个实例通常指的是语音指导的工作。例如,Talkmam 系统提供了这样一种语音指导的工作系统,该系统可从也位于Pittsburgh,PA的Vocollect公司获得。移动计算机和/或可佩戴式计算机允许佩戴或使用上述的用户在工作地点中保持移动性,同时给用户提供必要的指导或指令和所需的计算功能以及数据处理功能。这种移动计算机通常提供到更大更集中化的计算机系统的无线通信链路,其指导用户在该系统内的工作活动并且处理任何用户语音输入(例如收集的数据)以便协助完成工作。整个集成的系统可使用运行各种程序(例如用于在其日常任务中指导若干移动计算机和其用户的程序)的中央系统。用户根据他们从中央系统接收到的语音指令和信息经由移动计算机来执行手动操作用于及输入数据。通过头戴式耳机以及移动计算机的语音识别和文本-语音功能,工作人员能够接收关于其任务的语音指令或问题,以接收关于其任务的信息,从而例如询问和回答问题、报告其任务的进展、以及报告各种工作状况。这种能够使用语音的工作环境的另一实例指的是语音辅助工作。这种工作环境在需要灵活性以及不需要特定任务指导的状况下涉及。在语音辅助的工作环境中,当用户需要时他们会与系统进行选择性的语音对话。这种语音辅助系统设计成用于提供各种提示、指令和信息,就像选择性地接受用户和其语音指令的指导那样,而不像语音指导的工作系统那样以设定顺序连续发出指令。AccuNurse 系统提供了这样一种语音辅助系统,该系统可从本申请的受让人 Pittsburgh,PA 的 Vocollect Healthcare Systems 公司(VHS)获得。在语音系统中的主要挑战之一集中在对新用户的训练上。作为语音系统一部分的语音用户接口(VUI)要求用户知晓说什么以及何时说。训练员或指导员或其它管理人员面临的一个难题是当训练员或指导员在不能听到用户所听到的内容或者不知晓用户正在何地进行语音对话时,告诉用户关于接口该做什么是非常困难的。对于对现有用户正在进行的训练/指导中以及当新用户加入组织以及需要学习如何使用系统或者在现有系统中实现一个新功能时面临同样的问题。已经使用硬件方案来克服该挑战。例如,训练员或指导员可将单独的一个硬件 (例如小的扬声器)连接到用户使用的移动设备或个性化的头戴式耳机上,以听到用户正在听到的内容。虽然这些硬件方案成功地完成该任务,但是它们使用麻烦并且需要与正在接受帮助、训练或指导的用户进行直接(并且是强迫性的)交互。因此仍需要一种其中训练员或指导员可更有效地指导另一用户的语音系统。还需要指导员或训练员知晓传送到正在接受指导的用户时的语音提示,或者需要知晓进行语音对话的用户身处何地,这样可便于更好地进行训练,而不需要在用户的计算机上存在额外的冒犯性的专用于指导的硬件,或者不会给用户带来不便利之处。

发明内容
公开了一种语音辅助系统,在其指导下将语音提示传送到第一用户的语音辅助设备,该语音提示也被无线传送到第二用户的语音辅助设备,这样当语音提示被传送到第一用户时,第二用户可听到语音提示。当指导模式被系统中的设备激活时,一个设备(指导设备)建立到另一设备(接受指导的设备)的连接以从接受指导的设备接收系统提示,从而听到正在接受指导的人员将听到的内容。指导设备的正常的语音的工作功能中止,而指导设备播放从其它设备接收的作为语音的系统提示。接受指导的设备包括指导支持模块,其配置用于当指导模式被激活时在不用另外改变接受指导设备的功能的情况下将系统提示发送到进行指导的设备。在一个实施例中, 可使用本发明的能够使用语音的设备来指导另一用户或者接受用户的指导。


并入并且构成该说明书一部分的附图示出了本发明的实施例,并且与下文给出的详细说明一起来解释说明本发明。图1是遵循本发明原理的语音辅助系统的分布式实现的框图;图2是遵循本发明原理的图1所示语音辅助系统的语音辅助的一个实施例的侧透视图;图3是根据本发明以指导关系交互的两个语音辅助的示意图;图4是遵循本发明原理的由图1所示语音辅助系统执行的示例指导例程。
具体实施例方式描述了一种训练或指导系统,其中一个用户在语音环境中正确使用能够使用语音的设备45对另一用户进行指导。进行指导的用户和接受指导的用户都具有与语音工作系统相关联的能够使用语音的设备45。一个设备例如通过使用传送到设备的语音命令或其它输入(例如按钮或手动输入)选择性地设定在进行指导的模式下。作为进行指导模式的一部分,指导设备形成与所选的接受指导设备的连接。在建立连接之后,接受指导的设备监视该连接并且将其系统提示发送到所连接的和激活的指导设备。在每一方使用没有附加硬件的他自己或她自己的设备的情况下,本发明允许指导员或进行指导的用户(指导设备)听到与接受指导的用户(接受指导的设备)相同的系统提示和音调。在接受指导的设备处不需要单独的收听工具或打扰性的处置。现在参照附图,其中在几幅附图中用相同的数字表示相同的部件,如图1中所示, 本发明可以具体体现在合适的能够使用语音的工作环境中。虽然在此论述了适用于护理患者应用的语音辅助工作环境,但是应该理解本发明可用于多数的任意能够使用语音的工作环境,包括语音指导的工作环境。图1示出了为以分布式计算机系统形式的语音系统5,其具有与至少一个设备10 相关联的计算动作以及与线下公司和/或在线公司客户IT部门15(例如线下Vocollect Healthcare Systems, Inc. D印artment)相关联的动作。系统用户物理上位于设备10处, 但是另一方面,用于语音系统5的集中式支持和管理能力可由线下部门和/或由在线公司客户IT部门15提供,上述部门通过合适的网络70 (例如广域网(WAN))耦合到设备10。位于每一设备10处的工位20可与以能够使用语音的设备45的形式的一个或多个便携计算机连接。能够使用语音的设备45执行工作计划,并且通过使用语音给用户或工作人员提供语音工作接口(VUI)以及与用户的语音对话。与至少一个工作计划相关联的信息可从工位20经由局域网(LAN) 30传送(例如, 以数字形式)(例如使用网络接口)到语音事物管理器35。每一设备10可具有至少一个语音事物管理器35,以储存和管理患者以及患者护理人员的工作计划和设备配置信息。具体地,语音事物管理器35实际上可具有和/或包括与工位20相连的如上所述的任意网络设备、设备或计算机。语音事物管理器35可类似于某些实施例中的服务器计算机。语音事物管理器35还可包括用于储存数据的至少一个数据库。数据还可通过网络30从语音事物管理器;35传送到工位20。语音事物管理器35中的与至少一个护理计划相关联的信息和数据可经由无线网络40(例如,WLAN)从语音事物管理器35 (例如,使用网络接口)(例如,以数字形式)传送到至少一个能够使用语音的设备45。数据还可从能够使用语音的设备45传送到语音事物管理器35,例如以储存在语音事物管理器35处或储存在工位20处以及用于附加处理。能够使用语音的设备45可包括若干独立的部分或部件。在图2所示的实施例中, 头戴式耳机部分55 (具有麦克风、耳塞以及扬声器)通过使用连接部分60与设备部分55 连接。在某些实施例中,连接部分60可为电缆或可为无线链接。设备55可为便携式或佩戴式计算机设备。在另一实施例(未示出)中,能够使用语音的设备45的所有必要组件可单独被包含于头戴式耳机部分50内。也就是,设备45的功能可完全在头戴式耳机部分50 中执行。
能够使用语音的设备45 (或头戴式耳机50)还包括合适的处理和存储硬件和软件以存储和使用从语音事物管理器35接收的数据。通过使用某些语音命令和系统提示来使用能够使用语音的设备45保持与用户的语音对话。能够使用语音的设备45可为佩戴式计算机和/或个人数字助理(PDA),在某些实施例中其包括WLAN功能。具体的,能够使用语音的设备45可为客户端,以及更具体的为 "thick client”,其允许在实际的能够使用语音的设备45上(而不是远程的)进行语音识别和语音合成。能够使用语音的设备的一个合适实施例在于2009年8月6日提交的美国专利申请No. 12/536,696中提出,其标题为‘‘Voice Assistant System”,通过引用将该申请并入本文中。根据语音工作的原理,在设备10处的每一用户可具有他们所佩戴或携带的他们自己的能够使用语音的设备45。用户可在系统5上记录,并且数据可从语音事物管理器35 传送到能够使用语音的设备45。数据可包括用于能够使用语音的工作环境中的当天用户工作计划的各种元素。工作计划和信息以及与其相关联的数据可使用语音对话中的语音来获取和使用,如在此还描述的那样。对于在此公开的实例而言,数据可与一个或多个患者的护理计划相关联,并且作为在用户和系统5之间进行的语音对话的基础。但是,应该意识到本发明可使用许多不同的语音系统和环境。能够使用语音的设备45可支持实时寻呼。例如,多个设备45可经由无线网络40 彼此通信以直接发送寻呼。可替代的,寻呼可首先发送到语音事物管理器35,然后寻呼可被中继到最终目的地。通过能够使用语音的设备45提供的语音对话可以有关于各种命令,并且可以包括要求用户向设备说出至少一个输入命令,其中设备响应于该命令并且提供数据或询问问题。语音对话可基于能够使用语音的设备45 (图1)中的数据,在一个实施例中包括各种患者护理计划。如由本领域的普通技术人员所理解到的那样,这种语音对话可使用包括语音识别和从文本转变成语音(TTS)的语音用户接口(VUI)执行。语音对话可通过VUI以各种不同的方式执行,并且本申请并不限于特定的语音对话或其进展。如上所示,在语音指导工作环境中,语音对话可包括到工作人员或用户的恒定方向的数据流,该数据流由用户在合适连音处输入的语音命令或语音数据组成。这通常以连续的往返的语音对话来执行,以对处于工作环境中的用户进行指导。在语音辅助环境中, 语音对话较少受到干扰,并且可由用户选择进行连接。通常,用户将说出例如请求信息或工作任务的语音命令,语音系统作为响应,将指令、数据或其它合成的语音输出到用户。在此, 将使用其以在语音对话中使用的用户口头讲话或语音通常被称为语音命令或语言命令。在 VUI中,语音命令通过语音识别技术以将语音命令转变为系统命令,所述系统命令例如可以是采用全部语音系统中使用的形式的文本或数据。可替代的,系统可提供其自身数据或文本(在此将被称为系统提示)并将其返回给用户。这种系统提示为通过系统进行处理的数据形式,然后可通过VUI的文本-语音功能转变为可理解的语音,从而形成在此称之为语音提示的可由用户发出和被用户听到的语音提示。也就是说,语音对话涉及从用户到设备的语音命令以及从设备到用户的语音提示。在本发明中,从接受指导的设备引导或路由到指导设备的提示在此通常被称为系统提示。根据本发明的原理,提示可以是任意合适的数据形式以允许将要合成的数据转换为语音,以及可由指导员或训练员听到或收听。因此,在此使用的为了对语音对话进行分类的术语并不对本发明构成限制。语音对话将取决于用户的特定语音命令以及能够使用语音的设备45所需的数据或者由设备45提供的信息。如可意识到的那样,在所公开的实例中,语音对话可采取各种不同的形式,以在实例中将关于住院医生定制的计划或护理计划的信息提供给用户,或者为他们的护理计划获取关于根据住院医生定制的信息和数据。本发明并不限于任意给定语音对话的特定问题或格式。本发明涉及帮助用户学习如何通过语音对话进行交流,以及还涉及尝试协助对用户进行指导或训练的另一方。能够使用语音的设备还可用于向用户提供协助与设备45交互的可听音调。可听音调提供关于各种信息或事件的可听指示,而不直接打扰进行语音对话的用户。例如,“all clear”的音调可在语音对话中没有激活的寻呼或通知的情况下提供,以及“呼入”的音调可在用户具有一个或多个要听的激活寻呼的情况下提供。呼入可来自于另一用户,以及可包括类似于传统语音信箱的记录语音消息。但是,寻呼在不需要使用的公共地址系统(即,PA 系统)中是无声寻呼,从而导致较少干扰。本领域的那些技术人员将意识到还可支持其它的音调,并且在执行语音对话中一些变化是遵循本发明的原理的。如此前注意到的那样,可用于执行本发明的示例性语音辅助系统的附加特征和变型在美国专利申请No. 61,114,920中公开,其转让给与本申请相同的受让人,该申请通过引用并入本文,就像在此将其全部公开一样,并且也被公开在可从受让人获得的 AccNurse 系统。图3示出了本发明的一个示例性实施例,其中一个能够使用语音的设备100(指导设备)和其用户可进入指导模式以便听到根据对使用另一能够使用语音的设备200(接受指导的设备)的用户进行的指导或训练的另一能够使用语音的设备200。在该实施例中,能够使用语音的设备100、200通常配置用于相似的或是相同的。因此,对于训练而言不需要额外的或特殊的硬件或软件设置。实际上,指导模式可通过与上述程序对称的程序以相反的方向(设备200能听见设备100)配置。在此,为了论述目的,进行指导的用户将被称为 “用户A”或“指导员”,以及接受指导的用户则被称为“用户B”或“接受指导的用户”。进行指导的用户(用户A)(对另一用户(用户B)进行指导)的能够使用语音的设备100包括与接受指导的用户进行语音对话的语音用户接口(VUI)llO。语音用户接口 110通过语音识别技术将进行指导的用户的说出的音调或说出的命令转变成系统数据或系统命令,并且通过从文本-语音技术将系统数据或系统提示转变成语音提示。之后,语音提示通过头戴式耳机为用户播放。在一个实施例中,在用户的头戴式耳机中具有与播放和接收语音对话中的语音相关联的扬声器和麦克风,在图2中用部分50示出。在一个实施例中,VUI 110除了语音命令之外,还处理手动输入,例如与如图2中所示的设备的部分55上的一个或多个按钮56相关联的按钮命令。图3中的用户框130提供指示输入/输出数据流是语音(SPK,MIC)还是手动(按钮)。VUI 110还发送和接收来自于数据库115的数据和提示,该数据库115起到作为本地存储介质的作用,该数据库115用于存储与能够使用语音的设备100和该设备100的语音对话相关的信息。为了启动指导模式,可以使用几个选项。在一个实施例中,与能够使用语音的设备100相关联的进行指导的用户130发出说出的语音命令,例如“Coach[用户名]”。对于所示的实例,用户可以说出“Coach用户B”。作为处理该命令的一部分,VUI 110在数据库115中检查可用用户名的列表,上述用户名可以是同一组用户名,该同一组用户名可以由其它用户-用户命令(例如使用能够使用语音的设备的寻呼)使用。在可替代的实施例中,也可通过说出命令“进行指导”来访问用户名列表,然后使用一个或多个按钮56来在数据库 115中浏览可用用户的列表。在另一可替代的实施例中,可以仅仅通过按压按钮来启动指导。例如,可以用一个或多个按钮56来访问列表,其中可以使用按钮56从列表中选择“进行指导”选项。然后,可以使用按钮来浏览可用的用户列表,并且选择用户。可替代的,一旦手动选择了指导模式,之后用户可以使用语音来选择用户进行指导。如果识别出的用户名实际上是尝试启动指导的用户,则VUI 110对语音对话作出回应“不允许你指导你自己”并且返回到主菜单,终止指导模式。在一些情况下,在设备100上可以不立即更新可用用户的列表。可能需要花费一些时间(例如,5分钟)才能在数据库115的列表中显示新用户或不希望的用户,并且可以准备指导。设备100需要检索来自语音事物管理器服务器35的更新后的列表。假定由说出的“指导”命令识别出有效用户名,在设备100的指导模式模块120上运行ActivateO方法112。在一个实施例中,使用合适的LUA脚本来实现指导模式模块 120。应该理解,如图3所示的实现方式是各种能够使用语音的设备的示例性或代表性功能。因此,附图并不是可以用于实现本发明的设备的各种硬件和软件组件的精确表示。因此,根据本发明的原理,设备100、200将使用合适处理的硬件和软件以执行设备的功能。这样,本发明并不限于特定的硬件和软件配置,以及没有必要阐明图3中的各种框和组件,并且并不限于特定的硬件或软件组件。本领域的普通技术人员将理解本发明的功能可以在具有合适处理器以及合适硬件和软件组件的便携式计算机设备中以各种不同的方式实现。指导模式模块120将查找表请求(workerinfo. get())发送到语音事物管理器35 以获取与要被接受指导的用户(用户B)的有效用户名相关联的局域网IP地址。如果没有返回局域网地址,则向用户130播放错误消息,并且终止指导模式。如果服务器35返回网络IP地址,指导模式模块120开启到接受指导用户(用户B)的能够使用语音的设备200 的直接套接字连接150或者经由无线网络40建立该直接套接字连接150。如果不能建立直接套接字连接,则向用户130播放错误消息,并且终止指导模式。当尝试进行连接以及建立连接时,能够使用语音的设备100将状态提示提供给进行指导的用户(用户A)。在一个实施例中,如图3中所示的用户130以5秒的间隔听到来自VUI 110的说出的语音提示,直到建立套接字连接或者程序超时为止。如果在5秒内成功地建立连接,则播放消息“指导[用户名]。已连接。按压STOP按钮以退出指导会话”。 如果建立连接超过5秒,那么5秒之后设备100将产生状态提示“指导[用户名]。正在连接,请等待”。每经过另外5秒后,听到状态提示“请等待”。当从此之后建立了连接时,播放另一状态提示“已连接。按压STOP按钮以退出指导会话”。如果在一组时段(例如15 秒)之后还没建立连接,则通过VUIllO播放错误消息并且终止指导模式。在一个实施例中,不管缺少连接的原因,都播放通用错误消息“此时不能进行连接”。错误信息随后总是返回到VUI 110的主菜单,并且有合适的主菜单提示或有对VUI合适的音调。在建立连接期间,能够使用语音的设备100的VUI 110继续处理来自相关用户130
10的语音命令和手动输入。在一个实施例中,如果用户130按压能够使用语音的设备100的 STOP或CANCEL按钮,或者给出终止语音的命令(例如说出语音命令“取消”),则VUI 110 运行指导模式模块120的DeactivateO方法114,并且使用语音消息“退出进行指导的会话”来终止指导,随后返回到播放合适的系统提示或音调的主VUI菜单。之后,用户130可以以合适的方式使用其能够使用语音的设备100以进行语音工作。一旦建立套接字连接150并且通过指导模式模块120运行指导模式,指导设备100 上的VUI 110继续监视数据库115以及监视手动输入或按钮。在一个实施例中,当指导模式处于激活状态时,在设备100中语音识别功能通常停用,但是VUI 110执行程序循环,以等待从手动输入的信号,例如用于停用指导模式的设备100的CANCEL或STOP按钮。在指导设备(其尝试对指导用户的话语执行语音识别)没有语音识别功能的情况下,这允许进行指导的用户向接受指导的用户说话,并且命令接受指导的用户如何进行语音对话以及讨论给出什么的响应以及应该说什么。因此,进行指导的用户可以与接受指导的用户自由地说话(例如指令),而指导设备并不试图对指导用户的语音执行语音识别。然而,在进行指导的模式下,VUI 110还可以禁用设备100的其它功能,以便不打扰用户A(用户130),此时用户A对用户B (用户230)进行指导并且收听用户B。例如,指导设备100可配置用于不播放与寻呼或者提示相关的发送到作为语音系统一部分的进行指导的用户A的可听音调。关于寻呼或提示是针对指导用户A还是他们(用户230)正在收听以可听音调形式的系统提示的音调可能混淆用户A。相反,当指导模式被停用时,VUI 110处理寻呼和提示,以及为用户A(用户130)播放合适的音调。在可替代的实施例中,某些受限的语音识别功能可以继续以指导模式操作,以通过使用语音命令例如“取消”而不需要手动输入来允许进行指导的用户退出指导模式。然后,在该场景中的语音识别功能仅仅可以识别出用于取消目的有限的词汇。作为能够使用语音的设备200的操作的一部分,能够使用语音的设备200包括合适的指导支持模块220,其中每当VUI 210处理提示以便随后将提示传送给用户230时,该指导支持模块220接收通知212。该指导支持模块220处理系统提示的每一个通知,以及例如通过提供用于等待新套接字连接的受阻线程,来处理通过无线网络而与指导系统100的连接150的建立。指导支持模块220通过包括对该指导支持模块维护的启动的套接字连接的数目的限制(例如10个),来提供有限数目的连接。如果是这样,则指导支持模块220可以配置用于一旦达到最大数量就拒绝激活任何额外的套接字连接,如上详述的,这将会导致额外单元连接失败。每当指导支持模块220通过设备200的VUI 210来接收系统提示通知212时,该指导支持模块查看以确定是否存在已经建立的任何活动套接字连接,该连接指示存在进行指导的用户或正在收听的用户。如果存在一个或多个进行指导的用户,模块220将关于系统提示的信息发送到每一个连接的指导设备,例如设备100,如图3所示。如果不存在建立的连接,则模块220放弃系统提示。当指导设备100的指导模式模块120通过套接字连接150从接受指导的设备200 的指导支持模块220接收系统提示的通知时,指导模式模块120将系统提示传送到本地数据库115。以软件循环方式来监视数据库115的指导VUI 110处理新的系统提示,在适当的时候将系统提示转变为语音提示或音调,并且向进行指导的用户130播放该语音提示或音调。这样,进行指导的用户130听到系统提示,该系统提示也由接受指导的设备200播放以及由接受指导的用户230(用户B)听到。这样,进行指导的用户A知晓用户B正在听到的内容。这有利于更好地训练,并最小程度地打扰用户B。指导模式模块120继续监视套接字连接150以确认其是开启的。可以用几种方式来中止指导模式。如果套接字连接150例如因为网络故障或设备200的停用而断开连接, 则指导模式模块120将断开连接的状态传送到数据库115。当VUI 110查询数据库并且处理该状态变化时,它将终止指导模式并返回到主菜单。VUI 110向用户A播放“丢失连接。 退出指导会话”。随后,VUI 110将会退出指导模式并且返回其正常操作。如果指导设备100例如因为断开连接或置于睡眠状态而被停用,则也终止指导模式,以使得当用户130接下来激活设备100时,它将处于主菜单并且不处于指导模式。在指导模式期间,在一个可能的实施例中,指导设备100的VUI 110不从用户130 接收语音命令,而是继续接收手动输入,例如来自用户130的按钮输入。也就是说,VUI 110 的语音识别功能可以被禁用。VUI 110响应于音量调节,可以通过使用按钮56来继续调节扬声器的音量。如果用户130按压合适的STOP或CANCEL按钮,VUI 110在指导模式模块 120上运行DeactivateO方法114,该方法停用套接字连接150并且使用消息“退出指导会话”来终止指导模式。然后,VUI 110返回到能够使用语音的设备100的主VUI菜单并且之后可提供语音识别和语音对话。通过套接字连接150在指导支持模块220和指导模式模块120之间传送的数据或提示不是音频或声音数据,而取而代之的是文本或其等价物。一旦接收到提示,由指导设备 100的本地VUI 110将系统提示转变成用户130可听的语音,从而降低无线网络的负载。在一个实施例中,与接受指导的设备200相关联的其它声音(例如由接受指导的用户230说出的预记录的寻呼或者命令)不由指导设备100传送或播放。如上所述,根据本发明的一个特征,在一个实施例中,接受指导的设备200的操作几乎完全都没有受到所接受指导的改变。也就是说,由本发明提供的指导功能没有打扰正在接受指导的用户。每当VUI 210向用户230发出系统提示时,该系统提示的通知也自动发送到指导支持模块220,其中如果在合适的情况下,如上述指出的那样,该指导支持模块还将系统提示发送到其它单元。但是,接受指导的用户230(用户B)没有接收到关于他们听到的系统提示是否被发送的通知,并且也没有直接的或明显的方式来告知接受指导的设备200是在接受指导还是处于收听状态。指导过程并不影响以其常规方式使用接受指导的设备200以进行各种语音工作任务的接受指导用户的能力。在本发明的一个实施例中,如果能够使用语音的设备目前没有接受其自身的指导,则能够使用语音的设备将仅仅进入指导模式。如果设备的指导支持模块包括任意活动的套接字连接(也就是说,其正在被指导并且用作接受指导的设备),则向该设备的用户播放错误消息,并且取而代之的是该设备返回到主菜单,终止指导模式,并且播放通用错误消息“此时不能进行连接”。由于该错误消息是通用的且不是特定的,因此能够使用语音的设备的用户可能仍不知晓他是否正在接受指导,因此不能变为指导其自身,并且不能将用户的设备置入指导模式。在某些训练情况下,本发明提供的接受指导的用户对于指导模式不可见是希望的。在另一实施例中,用户可被告知用户的语音辅助通过具有接受指导的VUI 210而正在接受指导,VUI 210包括一些附加的输出,例如特定的提示或音调、在音频信道中的背景噪声、或者该设备正在接受指导的可视化指示符。在训练情况下,指导的使用的可见性或可知性是期望的。在一个实施例中,目前正以指导模式运行的设备(原始指导设备)随后可使用已建立的合适的连接来联系一个或多个附加的指导设备。这样,进行指导的用户可轮流接受其它进行指导用户的指导。在这种情况下,由原始指导设备的指导模式模块接收以及为原始指导用户播放的提示还可以被原始指导设备的指导支持模块进一步中继,以及中继到其它附加指导设备的附加指导模式模块。指导模式的该“分层”使用可以成功地允许附加的用户听到由原始指导设备中继的提示,并且在需要多个用户指导或训练其它用户的情况下、 或在需要超过如上所述的对指导连接的建立限制(例如,10个套接字)的情况下是有用的。 因此,指导员可通过直接连接到接受指导的用户或者通过连接(经由指导会话)到另一指导员(其连接到接受指导的用户)而听到提示和接受指导的用户的部分对话。图4示出使用指导模式的一个实例。在该实例中,用户A是进行指导的用户,以及他们的设备配置用于指导或收听用户B(接受指导的用户)的设备。框300指代由用户A 听到的系统提示,而框310指代当用户B工作和执行各项任务时用户B的提示和正在进行的语音对话。虽然针对收听给予另一用户的提示的一个用户来使用上述术语“进行指导”和“接受指导”,但是应该理解,设备可在指导过程期间反向使用,其中接受指导的人收听作为训练过程的一部分的指导提示。该特征还可用于指导程序之外的应用中,并且期望没有这种使用限制。本发明提供优于现有技术的训练工具的许多益处。指导员或训练员可启动指导会话而不必打扰正在接受指导的用户,因为不需要将任何东西连接到接受指导的用户的设备上。指导员或训练员不需要定位、组装和佩戴任意种类的收听工具,并且可在数秒的时间使用已经用作能够使用语音的工作环境一部分的设备来启动指导会话。指导员能够教导和增强使用移动设备和个性化头戴式耳机的最佳实践,因为指导员正在使用与用户相同的设备,其中用户使用该设备通过语音系统的VUI进行导航。由于通过无线网络进行连接,指导员甚至不需要与他们指导的用户处于相同位置,而是可以远程连接和收听,上述在基于扬声器的训练工具中是不可能的。虽然上述的实施例使用了在同一局域网上的两种相同的能够使用语音的设备,但是指导功能也可远程执行,以及使用不同的设备执行,并且可在如上所述的设备之间直接通信,或者可通过服务器或其它媒介通信。上述实施例意欲是说明性的,并且不限制本发明的范围。
权利要求
1.一种用于能够使用语音的工作环境的设备,包括网络接口,其可操作用于与无线网络进行通信;语音用户接口,其可操作用于在接收系统提示时,将所述系统提示转变成以对用户的语音提示的形式的语音;以及在接收来自所述用户的语音命令时,使用语音识别技术将所述语音命令转变成系统命令;以及指导支持模块,其配置为通过建立所述设备到所述无线网络中的至少另一设备的连接来选择性地被激活,并且可操作用于当接收到所述系统提示时将所述系统提示转发到已连接的另一设备。
2.根据权利要求1所述的设备,其中所述指导支持模块配置用于服务到其它设备的有限数目的连接以转发所述系统提示。
3.根据权利要求1所述的设备,其中所述指导支持模块还可操作用于在接收系统提示时,在转发所述系统提示之前确定是否已经建立了到另一设备的连接。
4.根据权利要求1所述的设备,其中所述连接是通过所述无线网络到所述至少另一设备的套接字连接。
5.根据权利要求1所述的设备,其中建立所述设备到至少另一设备的连接是通过所述无线网络由所述至少另一设备发起的。
6.一种用于能够使用语音的工作环境的设备,包括语音用户接口,其可操作用于在接收系统提示时,将所述系统提示转变成以对用户的语音提示的形式的语音;以及在接收来自所述用户的语音命令时,使用语音识别技术将所述语音命令转变成系统命令;以及该设备具有指导模式,并且可操作用于当所述指导模式被激活时通过无线网络建立到至少另一设备的连接以及用于接收来自所述至少另一设备的系统提示。
7.根据权利要求6所述的设备,其中所述语音用户接口可操作用于将来自所述至少另一设备的接收的系统提示转变成作为对所述用户的语音提示的语音。
8.根据权利要求6所述的设备,其中当所述指导模式被激活时,所述语音用户接口对语音命令选择性地停用所述语音识别技术。
9.根据权利要求6所述的设备,其中当所述指导模式被激活时,所述语音用户接口仅仅将从所述至少另一设备接收的系统提示转变成以语音提示的形式的语音。
10.根据权利要求6所述的设备,其中通过从所述用户到所述语音用户接口的语音命令来激活所述指导模式。
11.根据权利要求6所述的设备,还包括手动输入组件,其中通过来自所述用户的手动输入激活所述指导模式。
12.根据权利要求6所述的设备,还包括指导模块,其可操作用于当所述指导模式被激活时建立到所述至少另一设备的连接。
13.根据权利要求12所述的设备,其中所述指导模块可操作用于获得通过连接无线网络来建立所述连接的信息。
14.根据权利要求6所述的设备,其中所述设备还可操作用于当所述指导模式被停用时终止到所述至少另一设备的连接。
15.根据权利要求6所述的设备,还包括手动输入组件,通过来自所述用户的语音命令或手动输入的至少之一来停用所述指导模式。
16.根据权利要求6所述的设备,其中所述连接是通过所述无线网络到所述至少另一设备的套接字连接。
17.一种语音工作系统,包括无线网络;至少两个能够使用语音的设备,第一设备和第二设备配置用于通过所述无线网络进行通信,所述至少两个设备中的每一个包括语音用户接口,其可操作用于在接收系统提示时,将所述提示转变成以对用户的语音提示的形式的语音;以及在接收来自所述用户的语音命令时,使用语音识别技术将所述语音命令转变成系统命令;所述第一设备可操作用于选择性地被激活成指导模式,以及用于通过所述无线网络建立与所述第二设备的连接,以接收来自所述第二设备的系统提示;所述第二设备可操作用于检测与所述第一设备的连接,以及在检测到连接时,当所述系统提示被所述第二设备的语音用户接口接收到时将所述系统提示转发到已连接的第一设备。
18.根据权利要求17所述的系统,其中所述第二设备配置用于检测与多个设备的连接,并且将系统提示转发给多个已连接的设备。
19.根据权利要求17所述的系统,其中所述连接是通过所述无线网络的套接字连接。
20.根据权利要求17所述的系统,其中所述第一设备可操作用于将从所述至少另一设备接收的系统提示转变成作为对所述用户的语音提示的语音。
21.根据权利要求17所述的系统,其中当所述指导模式被激活时,所述第一设备对语音命令选择性地停用所述第一设备的所述语音识别技术。
22.根据权利要求17所述的系统,其中当所述指导模式被激活时,所述第一设备仅仅将从所述第二设备接收的系统提示转变成以语音提示的形式的语音。
23.根据权利要求17所述的系统,其中通过从所述用户到所述语音用户接口的语音命令来激活所述第一设备的所述指导模式。
24.根据权利要求17所述的系统,其中所述第一设备包括手动输入组件,其中通过来自所述用户的到所述第一设备的手动输入来激活所述指导模式。
25.根据权利要求17所述的系统,其中所述第一设备包括指导模块,所述指导模块可操作用于当所述指导模式被激活时建立到所述第二设备的连接。
26.根据权利要求25所述的系统,其中所述指导模块可操作用于获得通过连接所述无线网络来建立所述连接的信息。
27.根据权利要求17所述的系统,其中所述第一设备还可操作用于当所述指导模式被停用时终止到所述第二设备的连接。
28.根据权利要求17所述的系统,其中所述第一设备包括手动输入组件,通过来自所述用户的语音命令或到所述第一设备的手动输入的至少之一来将所述指导模式停用。
29.根据权利要求17所述的系统,其中所述连接是通过所述无线网络到所述第二设备的套接字连接。
30.一种用于在能够使用语音的工作环境中训练用户的方法,包括通过无线网络在至少两个能够使用语音的设备,第一设备和第二设备,之间建立通信, 所述至少两个设备中的每一个可操作用于在接收系统提示时,将所述提示转变成语音,以及在接收来自所述用户的语音命令时,使用语音识别技术转变所述语音命令;选择性地将所述第一设备激活成指导模式,以及通过所述无线网络建立与所述第二设备的指导连接;在所述第二设备处,检测与所述第一设备的连接;如果检测到所述连接,当所述系统提示由所述第二设备接收时,将所述第二设备的所述系统提示转发到已连接的第一设备;在所述第一设备处,接收来自所述第二设备的系统提示,以及在所述第一设备处将所述系统提示转变成语音。
31.根据权利要求30所述的方法,还包括在所述第二设备处,检测与多个设备的连接以及将系统提示转发到多个已连接的设备。
32.根据权利要求30所述的方法,还包括在所述第一设备处将从所述第二设备接收的系统提示转变成作为对所述用户的语音提示的语音。
33.根据权利要求30所述的方法,还包括当所述指导模式被激活时,选择性地停用所述第一设备的所述语音识别技术。
34.根据权利要求30所述的方法,还包括当所述指导模式被激活时,在所述第一设备处仅仅将从所述第二设备接收的系统提示转变成语音。
35.根据权利要求30所述的方法,还包括通过来自所述用户的语音命令将所述指导模式激活。
36.根据权利要求30所述的方法,还包括通过来自所述用户的到所述第一设备的手动输入来激活所述指导模式。
37.根据权利要求30所述的方法,还包括当所述指导模式被停用时终止到所述第二设备的连接。
38.根据权利要求30所述的方法,还包括通过来自所述用户的语音命令或到所述第一设备的手动输入的至少之一来停用所述指导模式。
全文摘要
语音工作系统包括无线网络和配置用于通过无线网络进行通信的至少两个能够使用语音的设备100、200。上述设备操作用于将系统提示转变成语音以及使用语音识别将语音命令转变成系统命令。第一设备100可由用户130选择性地被激活成指导模式,以通过无线网络40建立与第二设备200和另一用户230的连接。一旦以指导模式连接,进行指导的用户130接收来自接受指导的用户230和第二设备200的系统提示。之后进行指导的用户的第一设备100将那些接收到的提示提供给进行指导的用户130。
文档编号H04M1/247GK102177541SQ200980138554
公开日2011年9月7日 申请日期2009年11月13日 优先权日2008年11月14日
发明者J·R·洛根, M·B·梅洛特, M·劳赫尔里, R·A·贝茨 申请人:沃科莱特保健系统公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1