控制语音控制的操作的装置和方法

文档序号:7602048阅读:198来源:国知局
专利名称:控制语音控制的操作的装置和方法
技术领域
本发明涉及一种电子设备,该电子设备包括响应语音命令控制该设备的操作的语音识别装置。
此外,本发明还涉及控制语音控制的操作的方法,包括响应语音命令控制电子设备的操作的步骤。
移动电话的发展和普及应用以及结合在语音识别技术领域中的发展提供了带有许多语音控制的功能的移动电话。
在不同的环境中(例如在汽车中、在具有嘈杂交通的街道上等)普遍应用移动电话推动了语音识别技术朝很高噪声容许度的语音识别技术发展,尽管具有不同的口音和不同的音调的人发出命令,这种语音识别技术仍然能够识别例如字或数字的形式的命令。
美国专利US 4,644,107公开了一种提供语音控制拨号的语音控制的电话。可以一个数字-数字地说出要拨号的号码并自动地进行拨号,或者说出名字电话自动地拨存储在命令表中对应于所说出的名字的号码。
美国专利US 5,007,081公开了一种语言启动的电话。该语言启动的电话存储了多个口语字(spoken word)、电话号码和与每个字相关的字母数字字。电话根据与所存储的口语字相匹配的输入口语字自动地拨电话号码。此外,显示与口语字相匹配的电话号码和字母文字。
在电话中广泛的使用接近传感器,例如用于启动各种功能。
美国专利US 5,224,151公开了一种在耳机扬声器电话中使用的并包括内置在该耳机中控制在耳机模式和扬声器电话模式之间的切换的红外线范围检测单元的接近传感器。
美国专利US 5,337,353公开了一种电容式接近传感器,包括被一绝缘层隔开的防护电极(guard electrode)和传感器电极。例如用于控制在耳机模式和扬声器电话模式之间的切换.
美国专利US 5,712,911公开了一种基于在预定的接近区域内的使用者存在或不存在来响应呼入以启动扬声器电话的电话系统。该系统包括当使用者在预定的接近区内时自动地启动扬声器电话来与呼叫者建立通信的接近单元和控制单元。
美国专利US 3,109,893公开了一种接近操作的电话,在这种接近操作的电话中,当用户将他的手经过传感器附近时使用接近开关接通电话以建立与呼叫者的通信,当用户再次将他的手经过该传感器附近时切断电话以终止与呼叫者的通信。
欧洲专利申请EP541439公开了一种听觉通信装置,用于当讲话者出现在预定的接近区内时利用接近检测器来启动麦克风。由此降低了周围噪声的影响。
因此,启动语音控制的功能的语音识别装置和接近传感器都是十分公知的技术特征。
以前,认为语音识别技术对周围噪声非常灵敏,仅接受非常精确的命令发音。然而,随着在本领域中的最新的发展,解决了这些问题。但事实上,这又产生了新的问题,这种问题在于这种最新的语音识别装置对接近语音识别装置的但不是对语音识别装置的命令的口语字有反应。因此,这样不可能在每次都能够启动语音识别装置而不产生不希望的结果。应该注意的是语音识别的目的之一是避免使用要求多少有点复杂的手工操作的按键、键盘以及类似的装置。通常这种语音识别装置作为由中央处理单元(CPU)所执行的程序被嵌入。因此,当语音识别装置不断地工作于对表示任何周围的声音的采样进行处理时,CPU、模拟数字转换器等要消耗大量的电池能量。
本发明的一个目的是避免无意地启动在电设备中的语音控制的功能。本发明的进一步目的是保存电池工作能量。
当在本说明书开始的一段中所述的电子设备包括用于提供指示物体是否在该设备附近的控制信号的接近传感器,以及包括用于响应于该控制信号对该设备的语音控制的操作进行控制的控制装置时可以实现这些目的。
因此,该语音识别装置仅在希望通过语音命令启动功能时才被启动;这些是根据物体是否处于电子设备的附近来确定的。例如通过在该设备附近移动手。这样,如果需要的话可以完全避免按键,因为通过运动和语音命令就可以启动该设备。这一点对于例如驾驶员来说非常重要,因为他们仅需要例如将他们的手移动到靠近该设备而不需要找到并压下特定的按键以启动语音识别装置。因此,可以获得一种用于启动语音识别装置的简单得多并且更少分散注意力的程序。
从属权利要求2-7将显示根据本发明的设备的有利的实施例。
此外,本发明还涉及一种如在权利要求8中所述的检测接近的方法。从属权利要求9-13将显示根据本发明的方法的有利的实施例。
下文结合优选的实施例并参考附图将更加充分地解释本发明,在附图中附

图1所示为根据本发明的装置的一种实施例。
附图2所示为根据本发明的方法的一种实施例的流程图。
附图3所示为根据本发明的方法的另一实施例的流程图。
附图4所示为本发明的优选实施例,该实施例可以包含电设备并使用根据本发明的方法。
附图1所示为根据本发明的装置的一种实施例。在此所示为具有语音识别装置102和接近传感器103的电设备101。通过任何公知的技术语音识别装置102可以识别在声音流中一种或多种口语命令105。将表示所识别的命令的语音命令信号106输送到控制装置107。此外输送到控制装置107的是来自接近传感器103的控制信号108,当接近传感器103检测到例如手出现在预定的接近区中时产生控制信号108。
接近传感器103例如可以是电容式、电感式或红外式的传感器。该传感器可以检测物体例如手或脸是否出现在该设备的附近。
来自控制装置107的输出被输入到设备控制装置109中,该装置109响应于口语命令对电设备101的器件进行控制。这种口语命令例如可以是“拨号”、“存储”、“得到”等,或者是说出的数字、名字或字母。
在一种实施例中,控制装置107例如可以是具有作为输入的语音命令信号106和作为控制开关的信号的控制信号108的简单开关,因此,当控制信号108例如是高电平(“1”)时,从该开关中输出语音命令信号106,而当控制信号108例如是低电平(“0”)时该开关不输出任何东西。
因此,需要在电设备101的预定接近区内移动例如手并在那儿保持以便能够启动语音识别。因此,避免了电设备101随便的识别并响应周围声音和噪声的问题,例如由错误的和/或非有意的命令启动的问题。
然而,在某些情况下,当需要语音识别时在所有的时候中都必需将物体保持在接近区内可能并不是一个好的主意。因此在本发明的优选实施例中,控制装置107可以更加智能,提供一种控制语音识别装置102的更加灵活的方法而不需要将物体保持在接近区中。该控制装置可以以一种锁存器实施,物体每次在接近区内运动都可以使该锁存器从接通到切断状态或从切断到接通状态切换。
在另一实施例中,在接近区内的物体的运动可以启动语音识别装置102,这个单元保持激活直到发出了某种终止信号。例如从最后接收到命令的预定的时间周期之后或经过预定的时间周期之后由定时器电路提供这种终止信号,由此在该设备的附近仅需要一次运动。另一终止信号例如可以基于特定的口语命令字比如停止、结束等提供。
在优选的实施例中,电设备101进一步包括提供语言信号的通信的电路104。在这种方式中,通过口语命令以非常简单的方式可以操作移动或固定电话。这在驾驶机车或在需要集中注意力的其它的环境中尤其有益,因为单独通过语言就可以操作电话的控制,因此驾驶员能够集中精力开车。通过简单的挥手可以启动语音识别装置,由此确保了仅记录专门作为命令的语言,因此例如在与乘客的谈话中的字并不能导致通话。这同样可以应用到例如在参加会议的人们附近的固定电话中。
在一种优选实施例中,语音识别装置102包括中央处理单元或专用集成电路(ASCI)。可以将控制信号输送到这种电路中作为中断信号。由此,当没有检测到接近时处理器可以处理除了语音识别以外的其它的任务或处于低电池消耗模式(所谓睡眠模式)。
本发明的其它应用例如可以应用在电梯中,在电梯中乘客仅说出楼层的数字或部门的名字,然后就将乘客送到那里。这里,还比较有利的是,电梯并不会仅仅是因为乘客在谈话中提到了命令字而改变目的地。
附图2所示为根据本发明的一种实施例的流程图。在步骤201中,初始化该方法。在步骤202中执行接近传感器是否检测到在预定的接近区中的存在的测试。如果是,在步骤S203中提供表示物体在接近区中的控制信号。如果不是,该方法返回并再次执行测试(在预定的时间间隔之后)。
在步骤204中,执行是否接收一个或多个语音命令的测试。如果是这种情况,则处理该命令以便识别并在步骤205中执行。如果测试结果为“否”,则该方法返回到该流程图的开始并再次执行在步骤202中的测试。
在步骤204中可为接收语音命令指定预定的时间限制。这个时间限制可以是来自被启动的接近传感器或来自被接收的上个口语字。可替换的是,使用者可以给定一个或多个命令字以表明不再考虑字。
如果这种方法应用在例如移动电话中,可以实现一种很容易的操作电话的方式,由于通过使用者的语音可以操作并控制它。使用者仅需要在预定的接近区内移动一个物体以启动在电话中的语音识别装置,由此指示后面的字作为命令。
附图3所示为根据本发明的方法的另一实施例。在步骤301中初始化该方法。在步骤302中执行接近传感器是否检测到在预定的接近区中的存在的测试。如果是这种情况,给出表示物体在接近的控制信号,该方法进行到步骤303中。如果不是这样,该方法循环返回并再次执行测试(在合适的时间间隔之后)。作为该控制信号的结果在步骤303中语音识别被启动。在步骤304中,接收、识别并执行语音命令,如果有的话。在已经完成了这之后,在步骤305中执行物体是否在接近区内的另一测试。如果测试是“否”,该方法循环返回到步骤304并准备接收附加的命令。如果测试是“是”,语音识别被禁止,该方法循环返回到步骤302,必需在该接近区内再次出现物体才能重新启动。这就给出了一种指示任何声音不被认为是命令的简单方法。此外,语音识别装置进入睡眠模式以便保存功率直到需要它们时。例如,由于在该方法的设备附近的挥手,根据实际的状态,将语音识别状态从启动改变到禁止或从禁止改变到启动,所以可以将这种操作模式描述为“切换”模式。这就得到了一种“接通”和“切断”语音识别的非常简单的方法。
附图4所示为本发明的一种优选实施例,这种优选实施例包含电设备和/或应用根据本发明的方法。所示为具有显示装置404、键盘405、天线402、麦克风406和扬声器403的移动电话401。天线402、麦克风406和扬声器403都连接到提供语言信号通信的电路104,如附图1所示。麦克风进一步也连接到在附图1中所示的语音识别装置102。例如在手在预定的接近区内移过电话时,接近传感器(未示)检测到电场或磁场的变化。接近传感器启动语音识别装置,而该设备准备接收操作电话的语音命令。另一次挥手将禁止语音识别装置,该语音识别装置可以进入睡眠模式以降低功率。这就得到了一种确保包含无意的命令字中的语言不能启动电话中的命令的简单的方法,如前文所述。
在另一实施例中,只要某人希望使用该语音识别就需要手接触电话,或者仅需要第一次挥手,利用定时器在预定的时间周期之后,例如启动之后或在最后接收到的语音命令之后,关闭语音识别装置。
在优选实施例中,有利的是具有“免提”模式和“非免提”模式。在“免提”模式中应用上文的仅仅挥手启动语音识别装置的思想;而在“非免提”的模式中它要求接近的持续以便启动语音识别装置。
权利要求
1.一种便携式通信设备,包括语音识别装置(102),其响应于语音命令(105)对设备(101)的操作进行控制;其特征在于该设备(101)包括接近传感器(103),用于提供指示物体是否在该设备(101)的附近的控制信号(108);以及控制装置(107),响应于该控制信号(108),对该设备的语音控制的操作进行控制。
2.根据权利要求1所述的便携式通信设备,其特征在于所述控制装置(107)包括用于对设备(101)的语音控制的操作进行启动/禁止的装置。
3.根据权利要求1-2所述的便携式通信设备,其特征在于设备进一步包括处理语音信号的装置,这个装置具有处理语音信号的第一模式和第二模式,以及接收该控制信号以在第一和第二模式之间改变。
4.根据权利要求3所述的便携式通信设备,其特征在于第二模式是具有相对低的功率消耗的模式。
5.根据权利要求1-4所述的便携式通信设备,其特征在于设备(101)进一步包括用于提供语言信号通信的电路(104)。
6.根据权利要求1-5所述的便携式通信设备,其特征在于设备(101)是便携式的。
7.根据前述任一权利要求所述的便携式通信设备,其特征在于设备(101)是移动电话。
8.一种对语音控制的操作进行控制的方法,包括响应于语音命令对电设备的操作进行控制的步骤;其特征在于该方法进一步包括如下的步骤提供指示物体是否在该设备的附近的控制信号;以及响应于该控制信号对该设备的语音控制的操作进行控制。
9.根据权利要求8所述的方法,其特征在于通过控制信号启动并通过禁止信号终止语音控制的操作的控制。
10.根据权利要求9所述的方法,其特征在于该终止信号是该控制信号。
11.根据权利要求8-9所述的方法,其特征在于该方法进一步包括改变具有处理语音信号的第一模式和第二模式的装置的模式的步骤。
12.根据权利要求11所述的方法,其特征在于该第二模式是具有相对低的功率消耗的模式。
全文摘要
一种电子设备,例如移动电话,包括响应于语音命令(105)对设备(101)的操作进行控制的语音识别装置(102),其中设备(101)包括指示物体是否在该设备(101)的附近的控制信号(108)的接近传感器(103),例如电容式、电感式或红外式的传感器,以及响应于该控制信号(108)对该设备的语音控制的操作进行控制的控制装置(107)。
文档编号H04M1/27GK1369165SQ0081148
公开日2002年9月11日 申请日期2000年6月2日 优先权日1999年6月7日
发明者N·克里斯滕松 申请人:艾利森电话股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1