通过语音识别操作数据记录的方法和通信设备的制作方法

文档序号:7758864阅读:296来源:国知局
专利名称:通过语音识别操作数据记录的方法和通信设备的制作方法
技术领域
本发明涉及一种移动通信设备,并且特别涉及一种包括用于操作它的功能性的改进的语音识别的移动通信设备。
移动电话提供的在不同的位置操作并且自由移动的便利是导致移动电话在人群中充分扩展并且被普遍接受的原因之一。同时,移动电话提供给用户的应用和设备功能的数量随着产品更新迅速增加。在移动电话中被实现的硬件性能以及用户对更方便地操作移动电话的需求的不断增加,导致应用和设备功能数量不断增加。
与移动电话操作结合的一个有利的特征分别是语音或声音识别。所述语音识别考虑到现代移动电话存储多达数百个被存储在被实现的电话号簿中的电话号码的情况。所述语音识别有效地改进了一个想要的电话号码的选择。特别地,越来越多的头戴式送受话器的接受也建议它本身并且更喜欢使用语音识别。因为移动电话通常被装在夹克或者裤子口袋中,而已经连接一个头戴式送受话器的移动电话通过语音识别建立电话呼叫使用户不必从口袋里掏出移动电话,所以头戴式送受话器的使用还使移动电话的操作更容易。
通常,被包括在电话号簿中的有限的电话号码的选择与已经被用户在某一训练模式内预先输入的被记录的话音标记相关联。对应于某一被记录的话音标记的用户的声音输入导致相关的电话号码拨号,以便建立与该电话号码的通信链路。
在有噪声的环境中,特别在例如停在繁忙的公路上的服务区的机动车辆内的有噪声的环境中、在例如人流密集的步行区域中的喧闹和有噪声的街道上,或者在说话者的声音受到诸如普通感冒的疾病影响的情况下,语音识别算法的性能受到限制。在这种性能限制情况中,另一种支持语音识别的有利的操作方法有特别的重要性。
本发明的目的是提供一种操作语音识别可选择的移动通信设备的数据记录的方法和移动通信设备。
本发明的概念有几个优点被提供给具有语音识别性能的移动通信设备的用户。在移动通信设备对用户的声音输入的语音识别失败的情况下,本发明的概念提供一种快速、可靠并且容易使用的方法来手动激活那些通常由语音识别激活的想要的功能。其中一个重要的方面是快速和容易的手动接入以便提供一种支持方法来接入用语音识别可操作的功能。用户容易地浏览已经被分配语音标记的电话号簿条目的列表并且选择一个条目来拨相应的电话号码。手动选择意味着在没有监控的情况下,用户可以容易地操作少数键和开关。
而且,由于移动通信设备的存储容量并且由于普通用户只能记住有限数量的话音标记,例如大约10个话音标记,所以,通常用于语音识别的话音标记数量受到限制。因此,语音识别被用于重要的和/或经常被使用的要被拨号的电话号簿条目。电话号簿条目的手动选择保证到这些重要的和经常被使用的电话号码的快速接入。
此外,语音识别不应该被限于电话号簿条目的接入,而且还应该允许操作某些设备功能和/或设备应用功能。类似地,话音标记分别被分配给设备功能和/或设备应用功能或者被分配给控制所述设备功能和/或设备应用功能的指令。
通过具有在所附的独立权利要求书中要求的特征的一种方法、一种计算机程序和一种移动通信设备,本发明的目的被达到。本发明另外的实施方案是相应的从属权利要求的主题。
根据本发明的一个实施方案,提供了一种操作移动通信设备的数据记录的方法。所述数据记录是语音输入和识别可选择的,即所述数据记录是语音识别可记得起来的,并且导致一个在移动通信设备上预先被定义的操作。最初,第一个用户输入被接收。所述数据记录的列表根据第一个用户输入被显示给用户。接着,第二个用户输入被接收。第二个用户输入识别被显示的数据记录之一。最后,一个与被识别的数据记录有关的指令被发送到在所述移动通信设备上被执行的应用之一。这些应用控制所述移动通信设备的功能,此外,被发送的指令指示所述接收应用相应地操作。
根据本发明的一个实施方案,初始用户输入被接收。初始用户输入指示移动通信设备操作一个语音识别应用以便为一个声音输入作准备,该声音输入将被所述语音识别应用分析用于识别相应的数据记录。
根据本发明的一个实施方案,至少一个话音标记被联合到所述数据记录的每一个以便通过所述语音识别来识别。
根据本发明的一个实施方案,至少一个名称被联合到所述数据记录的每一个。所述名称将被显示给用户用于选择所述数据记录之根据本发明的一个实施方案,所述数据记录被区分成第一组数据记录和第二组数据记录。第一组数据记录包括电话号簿条目,其中每个条目包括至少一个名称和一个电话号码。第二组数据记录包括设备功能和设备应用功能。第二组数据记录的每一个包括一个导致相应的设备功能和设备应用功能操作的指令和一个它的名称。
根据本发明的一个实施方案,第一个用户输入具有两个可能的值,第一个输入值和第二个输入值。在所述第一个用户输入值等于所述第一个输入值的情况下,第一组数据记录的列表被显示给用户。在所述第一个用户输入等于所述第二个输入值的情况下,第二组数据记录的列表被显示给用户。
根据本发明的一个实施方案,第一组数据记录的数据记录以预定的顺序被排列。此外,第一组数据记录列表的显示包括至少一个第一组的数据记录的显示。在接收用户浏览输入时,相对于现在被显示的一个数据记录的第一组数据记录的至少一个随后的或者至少一个之前的数据记录被显示。所述浏览输入有两个浏览输入值,第一个浏览值和第二个浏览值。第一个浏览值的接收导致所述随后的数据记录的显示,而第二个浏览值的接收导致所述之前的数据记录的显示。
根据本发明的一个实施方案,第二组数据记录的数据记录以预定的顺序被排列。此外,第二组数据记录列表的显示包括至少一个第一组的数据记录的显示。在接收用户浏览输入时,相对于现在被显示的一个数据记录的第二组数据记录的至少一个随后的或者至少一个之前的数据记录被显示。所述浏览输入有两个浏览输入值,第一个浏览值和第二个浏览值。第一个浏览输入值的接收导致所述随后的数据记录的显示,而第二个浏览输入值的接收导致所述之前的数据记录的显示。
根据本发明的一个实施方案,提供了一种操作语音识别可选择的移动通信设备的数据记录的软件工具。所述软件工具包括当所述软件工具在一个计算机程序中被实现和/或被执行时用于实现上述方法操作的程序部分。
根据本发明的一个实施方案,提供了一种操作语音识别可选择的移动通信设备的数据记录的计算机程序。所述计算机程序包括当所述程序在一个处理设备、一台计算机、一个处理设备或者网络设备上被执行时用于实现上述方法操作的程序代码部分。
根据本发明的一个实施方案,提供了一种计算机程序产品,它包括被存储在计算机可读媒体上的程序代码部分,用于当所述程序产品在一个处理设备、一台计算机、或者一个网络设备上被执行时实现上述方法。
根据本发明的一个实施方案,提供了一种操作语音识别可选择的移动通信设备的数据记录的移动通信设备。所述移动通信设备包括多个在其上可执行的应用,并且所述数据记录的每一个已经被分配了至少一个话音标记。所述话音标记被用于语音识别。另外,所述移动通信设备还包括一个用于通过麦克风识别声音输入的语音识别部件。优选地,所述语音识别部件是一个语音识别应用,该语音识别应用被包括在所述移动通信设备上可执行的多个应用中。通过比较所述声音输入和被分配的话音标记,所述语音识别允许选择所述数据记录列表的一个数据记录。
第一个致动器允许用户激活所述语音识别部件,也就是指示所述移动通信设备准备接收一个要被所述语音识别部件处理的声音输入。第二个致动器是用所述语音识别部件可操作的。第二个致动器允许用户在被耦合到移动通信设备的显示器上启动数据记录列表的显示。有利地,所述数据记录列表的至少一个数据记录在显示器上被显示给用户。此外,第三个致动器允许用户选择被显示的数据记录列表的一个数据记录,其中,所述数据记录的选择导致被包括在被选择的数据记录中的指令的传输和一个根据所述被发送的指令要被操作的相应的应用。
根据本发明的一个实施方案,数据记录的每一个包括至少一个名称和一个指令。优选地,所述名称是允许用户识别所述数据记录并且适合于显示的文本或者符号名称。
根据本发明的一个实施方案,所述数据记录被分成第一组数据记录和第二组数据记录。所述第一组数据记录包括专用于一个拨电话号码的拨号应用的信息。优选地,第一组数据记录包括与话音标记相关联的电话号簿条目。第二组数据记录包括专用于另外的应用以便根据被包括在第二组数据记录的数据记录中的指令控制另外的应用的信息。而且,用所述语音识别部件可操作的第二个致动器使用户能够启动第一组数据记录列表或者第二组数据记录列表的显示。
根据本发明的一个实施方案,第一个输入信号导致以预定的顺序被排列的第一组数据记录列表的至少一个数据记录的显示。第二个致动器也是用所述语音识别部件可操作的,以便产生第一个浏览信号或者第二个浏览信号。所述第一个浏览信号导致相对于现在被显示的至少一个数据记录的第一组数据记录的至少一个随后的数据记录的显示。所述第二个浏览信号导致相对于现在被显示的至少一个数据记录的第一组数据记录的至少一个之前的数据记录的显示。
根据本发明的一个实施方案,第二个输入信号导致以预定的顺序被排列的第二组数据记录列表的至少一个数据记录的显示。第二个致动器也是用所述语音识别部件可操作的,以便产生第一个浏览信号或者第二个浏览信号。所述第一个浏览信号导致相对于现在被显示的至少一个数据记录的第二组数据记录的至少一个随后的数据记录的显示。所述第二个浏览信号导致相对于现在被显示的至少一个数据记录的第二组数据记录的至少一个之前的数据记录的显示。
根据本发明的一个实施方案,第二个致动器是一种多重开关部件,能够根据用户的操作而产生至少两个不同的信号。
通过优选实施方案并且参考附图将更详细地描述本发明,其中

图1根据本发明的一个实施方案显示一个表示操作顺序的流程图;图2a根据本发明的一个实施方案显示一个表示被包括在图1中被描述的操作顺序中的第一个操作子序列的流程图;图2b根据本发明的一个实施方案显示一个表示被包括在图1中被描述的操作顺序中的第二个操作子序列的流程图;图3根据本发明的一个实施方案显示一个表示被呈现给操作一个移动通信设备的用户的显示顺序的流程图;图4根据本发明的一个实施方案显示一个表示适合于操作上述操作的移动通信设备的部件的框图。
下面的描述涉及根据本发明的实施方案的移动通信设备和方法。图中所示的相同或相等部分用相同的参考数字指示。
下列图1结合图2a和图2b关于本发明并且根据本发明的概念来说明在一个移动通信设备中被实现并且被执行的典型的操作顺序。
参考图1,其中描述了在第一个透视图中的典型的操作顺序。
在第一个操作S100中,所述移动通信设备被接通。
在操作S101中,移动通信设备分别在备用或空闲模式中被操作。在所述空闲模式中,移动通信设备至少能够通过蜂窝通信网络用天线接收输入信号并且能够接收用户通过移动通信设备的键盘或小键盘输入的用户输入。
优选地,被输入的用户输入专用于所述移动通信设备的用户界面,以便控制或操作移动通信设备的设备应用和设备功能。而且,被输入的用户输入被解释为一个指示激活在所述移动通信设备上可执行的某一应用的指令。
在操作S103中,某一被输入的用户输入分别导致语音或声音识别的激活。通过专用激活键的操作或者通过选择移动通信设备的用户界面的某一项目,相应的用户输入被优选地产生。所述专用激活键可以被外部连接到所述移动通信设备,诸如在头戴式送受话器的电缆中或者在例如机动车辆的免提设备的外部键控制台中被实现。
在操作S104中,所述语音识别被激活并且为用户的声音输入作准备。所述语音识别接收优选地通过在移动通信设备中被实现或者被外部连接到移动通信设备的麦克风,例如头戴式送受话器的麦克风或在机动车辆的仪表板中被实现的免提设备的麦克风被记录的声音输入。
在操作S105中,一个声音输入被识别和记录。这个声音输入优选地被与一组被存储的话音标记比较。按照惯例,用于语音识别的话音标记必须在语音识别以前优选地以某一训练模式被用户输入。话音标记的输入和训练给用户提供了把用户选择的任意语音短语定义为话音标记的可能性。而且,按照惯例,所述话音标记被分配给在移动通信设备中被实现的电话号簿中的电话号码条目。
在用户输入的声音输入对应预先被存储的话音标记之一的情况下,已经被分配了相应的话音标记的电话号码被发送到要被拨号的拨号应用,以便建立到被拨号的对方电话的电话通信。
而且,根据本发明的概念,所述语音识别不仅仅被用于支持移动通信设备的电话号码拨号操作,而且还被用于操作另外的设备功能或者控制在移动通信设备上被执行的设备应用。类似于话音标记和被选择的电话号簿条目的联系,话音标记被分配给控制设备功能的指令。所述指令和被分配的话音标记优选地被用户输入定义。要被语音识别控制的与话音标记相关联的设备功能和设备应用应该在类似于电话号簿的列表中被合乎逻辑地组织,并且这些设备功能和设备应用组在下面将被称为功能目录。
根据本发明的一个实施方案,下列操作S110和S111是典型的备份操作。优选地,操作S110和S111是用参考操作S104被描述的语音识别模式可操作的。操作S110和S111通过用户输入分别被激活,例如通过功能键,也就是通过专用于经由所述移动通信设备的用户界面来浏览或导航的导航键的操作分别被激活。这里,用户操作第一个导航键 导致继续进行在图1中被涉及的操作的操作S111,而用户操作第二个导航键 *导致继续进行在图1中被涉及的操作的操作S110,*见图1。
而且,操作S110和S111也可以在操作S101的移动通信设备的备用或空闲模式中被分别激活(S102)。操作S110或操作S111的激活是用所述移动通信设备的用户界面的相应的菜单项目可操作的。
在操作S110中,电话号簿条目或联系(contact)的列表分别被显示给移动通信界面的用户。被显示的条目涉及被包括在嵌入在移动通信设备中的全部电话号簿中的电话号簿条目组,它们是用语音识别可选择的。用户能够通过用户输入选择被显示的电话号簿条目之一,用于指示发送一个与被选择的条目相关联的电话号码到拨号应用,以便建立经由被拨号的对方电话的电话通信。
在操作S111中,设备功能和设备应用功能的列表被显示给移动通信界面的用户。被显示的设备功能和设备应用功能涉及要被语音识别控制的设备功能或设备应用,并且因此涉及上面被描述的功能目录。用户能够通过用户输入选择被显示的功能目录条目之一,用于指示发送一个相应的指令到控制被选择的设备功能的应用或者到根据该指令要被控制的被选择的设备应用。
参考下面将被描述的图2a和图2b,操作S110和S111被更详细地描述。
在操作S106中,控制要被控制的设备功能或应用的应用接收被选择的指令。
在操作S106分别在操作S105或者操作S110后被执行的情况下,拨号应用被寻址,根据被选择的电话号簿条目的电话号码的拨号被启动并且通信被建立。优选地,所述通信的完成导致被描述的操作顺序返回到操作S101,也就是分别返回到移动通信设备的备用或者空闲模式。
在操作S106在操作S111后被执行的情况下,通过与被选择的设备功能或设备应用功能相关联的指令被寻址的应用接收所述指令,并且移动通信设备的控制被切换到被寻址的应用。优选地,由所述指令引起的所述过程的完成最终导致操作顺序返回到操作S101。
参考图2a和图2b,其中分别更详细地表示操作S110和操作S111。被表示的典型的图2a和图2b的操作顺序只在少数细节中不同。
根据本发明的一个实施方案,图2a描述被包括在图1中被描述的操作顺序中的第一个操作子序列。
在操作S120中,用于提供移动通信界面的设备功能和设备应用功能目录并且用于选择要被执行的项目列表的操作被启动。有利地,所述列表包括并且被限于被列出的项目,这些项目能够被参考图1所示的操作S105被描述的语音识别可替代地选择和激活。所述列表代表包括要被语音识别启动的设备功能和设备应用功能的上述功能目录。下列操作是和在图1中被描绘和被描述的操作S111共同被完成的操作。
在操作S121中,所述列表、所述列表项目或者功能目录条目分别被准备显示。所述条目适合于被显示给用户。优选地,所述条目包括要被显示的文本名称或符号名称以及要被控制的设备功能和设备应用功能的说明。更优选地,所述名称唯一地和/或以一种易于理解的方式命名相应的设备功能和设备应用功能。所述名称可以类似于或者等于移动通信设备的用户界面项目的名称,选择它导致类似的或相同的结果。有利地,被显示的名称或条目唯一地与要被控制的所述设备功能和设备应用功能相关联。
在操作S122中,涉及功能目录条目的第一个名称或者第一个名称组在被耦合到所述移动通信设备的显示器上分别被显示给用户。可显示给用户的名称数量取决于显示器的设计,也就是依据可显示的文本行数。被显示的名称之一现在被选择。
在操作S123中,移动通信设备用户使用导航键 和 浏览列表。所述功能目录条目以及与所述条目相关联的名称以预先确定的顺序被排列。所述导航键之一的操作指示选择一个相对于现在被选择的一个功能目录名称随后的或者之前的名称。有利地,随后的或者之前的名称的选择包括最近被选择的名称的显示。而且,所述选择包括被显示的名称组的滚动、要被显示的名称组新的排列等等。
操作S122和S123被重复直到用户想要的某一名称现在被选择。
在操作S124中,一个用户输入导致与现在被选择的名称相关联的设备功能或设备应用功能将分别被操作。更准确地,所述用户输入指示分别发送与现在被选择的名称相关联的指令到相应被寻址的控制所述设备功能的应用或者到相应被寻址的设备应用,以便根据所述指令操作。所述操作序列的操作被返回到在图1中被描述的操作序列的操作S111或者操作S106。
根据本发明的一个实施方案,图2b描述被包括在图1中被描述的操作序列中的第二个操作子序列。
在操作S130中,用于提供移动通信界面的联系列表和用于选择一个要被拨号的联系者的操作被启动。有利地,所述联系列表包括并且被限于能够通过参考图1所示的操作S105被描述的语音识别可替代地被选择和激活的联系者。下列操作是和在图1中被描绘和描述的操作S110共同被完成的操作。
在操作S131中,所述列表和所述联系分别被准备显示。所述联系适合于被显示给用户。优选地,所述联系包括要被显示的文本名称或符号名称以及所述联系的说明,更优选地,所述名称是预先被用户定义的电话号簿条目。
在操作S132中,第一个联系或第一个联系组在被耦合到移动通信设备的显示器上分别被显示给用户。可显示给用户的联系数量取决于显示器的设计,也就是依据可显示的文本行数。被显示的联系之一现在被选择。
在操作S133中,移动通信设备用户使用导航键 和 浏览联系列表。所述联系以预先确定的顺序被排列。所述导航键之一的操作指示选择相对于现在被选择的一个联系随后的或者之前的联系。有利地,随后的或者之前的名称的选择包括最近被选择的联系的显示。而且,所述选择包括被显示的联系组的滚动、被显示的联系组新的排列等等。
操作S132和S133被重复直到用户想要的某一联系现在被选择。
在操作S134中,一个用户输入导致与现在被选择的联系相关联的电话号码将被拨号。更准确地,所述用户输入指示发送一个与现在被选择的联系相关联的指令到拨号应用以便建立一个电话通信。所述操作序列的操作被返回到在图1中被描述的操作序列的操作S110或者操作S106。
应当指出,可操作来导航联系列表和设备功能以及设备应用功能列表的导航键也是用关于操作S104在图1中被涉及的手动选择操作的启动可操作的。
通过在图3中的说明,在图1中和图2a中以及图2b中被涉及的操作序列被详述。图3根据本发明的一个实施方案表示在移动通信设备中被实现的或者被外部连接到移动通信设备的显示器的典型的屏幕内容。将参考图1以及图2a和图2b以便完成上述操作序列。
在操作S200中,在备用或者空闲模式中的移动通信设备的典型的屏幕内容被描述。被描述的屏幕内容涉及图1中所示的操作S101。
在操作S201中,在语音识别模式中的移动通信设备的典型的屏幕内容被描述。被描述的屏幕内容涉及图1中所示的操作S102。文本术语“现在说”指示用户移动通信设备准备接收一个要被分析的声音输入并且和被存储的话音标记进行比较用于声音识别。如分别在图1中所示的操作S110和S111中被描述的,顶端显示行分别指示联系或设备功能和设备应用的可替代的手动选择。
这里,顶端行的左侧部分告诉用户导航键 允许通过用户输入选择一个被包括在设备功能和设备应用列表中的,也就是被包括在上述功能目录中的与一个话音标记相关联的要被控制的设备功能或设备应用,而顶端行的右侧部分告诉用户导航键 允许通过用户输入选择一个被包括在联系列表中的与一个话音标记相关联的要被拨号的联系。为了强调相应的列表条目的激活与语音识别的区别,所述用户输入选择在下面将被称为手动输入。
在操作S220中,在设备功能和设备应用的手动选择模式中的移动通信设备的第一个典型的屏幕内容被描绘。与话音标记相关联的设备功能和设备应用列表的第一个项目被显示。被称为“错过的呼叫”的典型的设备功能或设备应用告诉用户这个项目的选择导致遗漏的电话呼叫的再呼叫。术语“错过的呼叫”分别代表设备功能或设备应用的上述名称中典型的一个名称。
在操作S221中,在设备功能和设备应用的手动选择模式中的移动通信设备的第二个典型的屏幕内容被描绘。被称为“简档设置”的典型的设备功能或设备应用告诉用户这个项目的选择导致所述简档设置菜单的再呼叫,它允许用户调整移动通信设备来选择预先被定义的简档设置。术语“简档设置”分别代表另一个典型的设备功能或设备应用的名称。
在操作S225中,在设备功能和设备应用的手动选择模式中的移动通信设备的另一个典型的屏幕内容被描绘。被称为“无线电断开!”的典型的设备功能或设备应用告诉用户这个项目的选择导致被实现或者被耦合到所述移动通信设备的无线电断开。术语“无线电断开!”分别代表另一个典型的设备功能或设备应用的名称。
操作S220、S221和S225表示要被控制的典型的设备功能和设备应用。在S220、S221和S225中的屏幕内容的序列根据在图2a中被表示的操作S122到S123被操作并且关于它们被描述。顶端行告诉用户导航功能被分别分配给导航键 和 屏幕内容的中间文本行告诉用户如何浏览涉及要被控制的设备功能和设备应用的项目。
在操作S210中,在联系的手动选择模式中的移动通信设备的一个典型的屏幕内容被描绘。被称为“家”的典型的联系告诉用户这个项目的选择导致家的电话号码的拨号。
在操作S211中,在联系的手动选择模式中的移动通信设备的一个典型的屏幕内容被描绘。被称为“办公室”的典型的联系告诉用户这个项目的选择导致办公室电话号码的拨号。
在操作S215中,在联系的手动选择模式中的移动通信设备的一个典型的屏幕内容被描绘。被称为“业务闪断(traffic flash)”的典型的联系告诉用户这个项目的选择导致业务闪断服务电话号码的拨号。
操作S210、S211和S215表示典型的要被拨号的电话号簿条目。在S210、S211和S215中的屏幕内容的序列根据在图2b中被表示的操作S132到S133被操作并且关于它们被描述。顶端行告诉用户导航功能分别被分配给导航键 和 屏幕内容的中间文本行告诉用户如何浏览要被拨号的电话号簿条目。
应当指出,分别通过操作S122和S123或者操作S132和S133被描述的浏览操作,可以通过用于操作相应的列表即功能目录和电话号簿的条目的另外的操作被扩展。根据用户输入,相应的列表条目可以被取消。另外,通过用户输入,附加的条目可以被分别添加到相应的列表或目录。有利地,根据用户输入,与某一列表条目相关联的话音标记可以被复制以便告诉用户被忘记的话音标记。更有利地,用户可用被允许再记录一个话音标记,例如记录一个更容易被记住的声音短语。
图4根据本发明的一个实施方案表示在移动通信设备中被实现的或者被耦合到所述移动通信设备的用于操作上述操作序列的部件。被表示的部件在移动通信设备内部被实现或者被外部耦合到它。被描绘的部件包括一个键控制器210、一个中央处理单元200、一个音频单元220、一个控制显示器240的显示器驱动器230、一个被连接到天线285的收发信机单元(RX/TX)280、以及一个应用存储器250、一个数据存储装置260和一个话音数据存储装置270。
处理单元200执行被包括在应用存储器250中的移动通信设备的应用。优选地,根据本发明的一个实施方案,应用存储器250的应用包括至少一个语音识别应用和一个包括用于完成上述方法的指令的应用。
数据存储装置260包括优选地用多个数据记录组成的电话号簿,每个数据记录分别包括一个名称或电话号簿条目,以及一个电话号码。数据存储装置260还包括以多个数据记录组成的功能目录,每个数据记录包括一个名称和一个用于根据上面被描述的方法控制设备功能或者设备应用的指令。
话音数据存储装置270存储与一个电话号簿条目的选择相关联并且与一个功能目录条目的选择相关联的话音标记。所述话音标记在语音识别期间被用于识别用户的声音输入。声音输入可识别并且可选择的电话号簿条目的选择和功能目录条目的选择的数据记录包括至少一个到相应的话音标记的链路。优选地,通过定义应用的特殊的话音标记,所述话音标记被输入和训练。更优选地,所述话音标记是被特别编码的声音输入。
因为共同的存储器允许存储数据和声音数据,所以不必区分数据存储装置260和话音数据存储装置270。它们之间的区别可以被理解为描述的简化,不应该被理解为本发明的限制。
音频单元220提供到扬声器、耳机和麦克风或者包括耳机和麦克风的头戴式送受话器的连通性,用于复制音频信号并且用于记录音频信号。因此,音频单元220集成了至少一个放大器、一个模数转换器(ADC)和一个数模转换器(DAC)。模数转换器(ADC)执行把被麦克风检测的声音信号转换成代表模拟信号的数字编码数据序列,数模转换器(DAC)通过把所述序列转换成模拟音频信号来执行数字编码数据序列的复制。所述音频单元还提供了到诸如在头戴式送受话器中或者在例如在机动车辆中要被安装的免提设备中被使用的外部麦克风和外部扬声器的连接性。图4表示包括被可分拆地和外部地连接到移动通信设备的麦克风和耳机的头戴式送受话器120。有利地,头戴式送受话器120已经实现了一个包括一个多重开关或者多个开关的开关控制台,用于遥控设备功能的选择。
另外,图4中描绘了不同导航键的选择。被描绘的导航键的每一个允许用户输入至少三个不同的信号。
第一个描绘100将表示可操作到不同方向以便产生与某些功能相关联的开关信号的操纵杆开关。用符号 指示的操纵杆向上的操作导致一个涉及如图1中所示的操作S101和S103中被描述的语音识别模式的激活的用户输入。左右方向符号,即符号 和 涉及上述导航键功能。也就是,左右方向的操作导致一个分别涉及操作S110和S111的手动选择模式的选择以及浏览相应的目录,即电话号簿或功能目录的用户输入。
第二个描绘101将表示一个包括至少三个单独的开关的多重开关。所述单独的开关的每一个再次与所述语音识别的激活(用符号 指示)或者与所述选择和浏览功能(用符号 和 指示)相关联。
第三个描绘102将表示一个具有至少三个不同的开关位置的多重翻转或拨动开关。所述开关位置的每一个再次与所述语音识别的激活(用符号 指示)或者与所述选择和浏览功能(用符号 和 指示)相关联。
第四个描绘103将表示一个轮形开关和一个附加的单独键。优选地,所述开关和键被集成在一个共同的开关控制台中。具有印刷符号 的键的操作导致一个涉及语音识别模式激活的用户输入。轮形开关转动到第一个方向或者第二个方向分别导致涉及选择手动选择模式和浏览相应的目录的用户输入。轮形开关转动到第一个方向对应于在第一个位置的导航键,例如由符号 指示的导航键的操作,而轮形开关转动到第二个方向对应于在第二个位置的导航键,例如由符号 指示的导航键的操作。
用户操作现在的键和开关之一产生的信号被发送到键控制器来产生相应的要被发送到相应的期待一个用户输入应用的逻辑信号。
共同的状态信息、用户界面、应用特定的界面和涉及另外的应用的信息通过显示器驱动器230和显示器240被显示给用户。显示器驱动器230包括用于在显示器上产生图形、文本、数字和符号的适当的装置。特别,所述显示器能够根据上述方法显示屏幕内容以及更特别地能够显示在图3中被描绘的屏幕内容。典型的,对应于图3中所示的屏幕内容S200的屏幕内容110被表示。
应该理解,即使本发明的各种实施方案的大量特征和优点以及本发明的各种实施方案的结构和功能的细节在之前的说明书中已经被陈述,但是这个公开只是说明性的,在细节中可以进行改变,特别地,与在本发明的原则到由附加的权利要求书中被表示的术语的概括地意义所指示的全部扩展内的部件结构和排列有关的改变可以被进行。例如,在不违背本发明的范围和精神的情况下,特定的部件可以根据用于处理语音识别可选择的移动通信设备的数据记录的特定应用而改变,同时基本上保持相同的功能性。
另外,尽管已经按照在电路框和流程图中的实现来说明了本发明,但是本领域的技术人员将认识到本发明可以在任何硬件、软件或者混合系统中被实现。
权利要求
1.一种用于操作通过语音输入和识别可选择的移动通信设备的数据记录的方法,特征为-接收第一个用户输入;-根据所述第一个用户输入显示所述数据记录的列表;-接收识别所述数据记录的一个数据记录的第二个用户输入;以及-将一个被包括在所述被识别的数据记录中的指令发送到在所述移动通信设备上可执行的多个应用中的至少一个应用。
2.根据权利要求1中所述的方法,特征为-接收导致所述移动通信设备准备接收一个声音输入以便在其上执行所述语音识别的一个初始用户输入。
3.根据任何一个上述权利要求中所述的方法,其特征在于,至少一个话音标记被分配给所述数据记录的至少一个,所述话音标记被用于语音识别。
4.根据任何一个上述权利要求中所述的方法,其特征在于,至少一个名称被分配给所述数据记录的每一个,所述名称是可显示的。
5.根据任何一个上述权利要求中所述的方法,其特征在于,所述数据记录包括第一组数据记录和第二组数据记录,其中,所述第一组数据记录的每一个包括至少一个指令,专用于一个拨号应用,该拨号应用用于拨叫被包括在所述指令中的电话号码,并且其中,所述第二组数据记录的每一个包括至少一个指令,专用于控制根据所述指令在所述移动通信设备上被执行的另外的应用的功能。
6.根据权利要求5中所述的方法,其特征在于,所述第一个用户输入能够表示出第一个输入值和第二个输入值,并且根据所述第一个用户输入的所述数据记录列表的所述显示包括-在所述第一个用户输入表示出所述第一个输入值的情况下,显示所述第一组数据记录的列表;以及-在所述第一个用户输入表示出所述第二个输入值的情况下,显示所述第二组数据记录的列表。
7.根据权利要求6中所述的方法,其特征在于,以预定的顺序被排列的所述第一组数据记录的所述列表的所述显示包括-显示所述第一组数据记录的所述列表的至少一个数据记录;-接收一个能够表示出第一个浏览值和第二个浏览值的浏览输入;-在所述浏览输入对应所述第一个浏览值的情况下,显示所述至少一个被显示的数据记录之后的至少一个数据记录;以及-在所述浏览输入对应所述第二个浏览值的情况下,显示所述至少一个被显示的数据记录之前的至少一个数据记录。
8.根据权利要求6中所述的方法,其特征在于,以预定的顺序被排列的所述第二组数据记录的所述列表的所述显示包括-显示所述第二组数据记录的所述列表的至少一个数据记录;-接收一个能够表示出第一个浏览值和第二个浏览值的浏览输入;-在所述浏览输入对应所述第一个浏览值的情况下,显示所述至少一个被显示的数据记录之后的至少一个数据记录;以及-在所述浏览输入对应所述第二个浏览值的情况下,显示所述至少一个被显示的数据记录之前的至少一个数据记录。
9.一种用于操作通过语音识别可选择的移动通信设备的数据记录的软件工具,包括程序代码装置,用于当所述程序在一个处理设备、一台计算机和/或一个移动通信设备上运行时完成权利要求1到8任何一个的步骤。
10.一种包括被存储在计算机可读媒体上的程序代码装置的计算机程序,用于当所述程序产品在一个处理设备、一台计算机和/或一个移动通信设备上运行时完成权利要求1到8任何一个的、用于操作通过语音识别可选择的移动通信设备的数据记录的方法。
11.一种包括被存储在计算机可读媒体上的程序代码装置的计算机程序产品,用于当所述程序产品在一个处理设备、一台计算机和/或一个移动通信设备上运行时完成权利要求1到8任何一个的、用于操作通过语音识别可选择的移动通信设备的数据记录的方法。
12.一种操作通过语音输入和识别可选择的移动通信设备的数据记录的移动通信设备,包括-多个在所述移动通信设备上可执行的应用;-所述数据记录的至少一个数据记录,该至少一个数据记录已经被分配了至少一个话音标记用于语音识别;-用于识别经麦克风的声音输入、导致根据所述声音输入来选择所述数据记录之一的语音识别部件;-用于激活所述语音识别部件的第一个致动器;-用所述语音识别部件可操作的、导致在一个显示器上显示所述数据记录列表的第二个致动器;以及-用于选择所述被显示的列表的一个数据记录并且用于发送一个被包括在所述被选择的数据记录中的指令到多个根据所述指令被操作的应用中的至少一个的第三个致动器。
13.根据权利要求12中所述的移动通信设备,包括-所述数据记录组的每个包括至少一个名称,所述名称被用于显示。
14.根据权利要求12中所述的移动通信设备,包括-所述数据记录包括第一组数据记录和第二组数据记录;所述第一组数据记录被专用于一个拨号应用,该拨号应用用于拨叫电话号码并且所述第二组数据记录专用于根据所述指令来控制另外的应用;以及-用所述语音识别部件可操作所述第二个致动器,以产生第一个输入信号和第二个输入信号;-所述第一个输入信号导致所述第一组数据记录列表的显示;以及-所述第二个输入信号导致所述第二组数据记录列表的显示。
15.根据权利要求13中所述的移动通信设备,其中,所述第一个输入信号导致所述第一组数据记录的所述列表的至少一个数据记录的显示,所述第一组数据记录以预定的顺序被排列,其中-用所述语音识别部件可操作的所述第二个致动器产生第一个浏览信号和第二个浏览信号;在所述第一组数据记录的所述至少一个数据记录的所述显示已经被启动的情况下-所述第一个浏览信号导致在所述显示器上所述第一组数据记录的至少一个随后的数据记录的显示;以及-所述第二个浏览信号导致在所述显示器上所述第一组数据记录的至少一个之前的数据记录的显示。
16.根据权利要求13中所述的移动通信设备,其中,所述第二个输入信号导致所述的第二组数据记录的所述列表的至少一个数据记录的显示,所述第二组数据记录以预定的顺序被排列,还包括-用所述语音识别部件可操作的所述第二个致动器产生第一个浏览信号和第二个浏览信号;在所述第二组数据记录的所述至少一个数据记录的所述显示已经被启动的情况下-所述第一个浏览信号导致在所述显示器上所述第二组数据记录的至少一个随后的数据记录的显示;以及-所述第二个浏览信号导致在所述显示器上所述第二组数据记录的至少一个之前的数据记录的显示。
17.根据权利要求12到15任何一个中所述的移动通信设备,其中,所述第二个致动器是一个根据用户输入能够产生至少两个不同的信号的多重开关部件。
全文摘要
本发明涉及一种具有用于通过声音输入选择和激活设备功能的语音识别的移动通信设备。特别地,本发明涉及一种备份方法,在语音识别失败的情况下被用于提供一种有利的方法用于以一种容易和快速的方法操作开关和键来选择和激活用语音识别可操作的设备功能。所述设备功能,即特别地电话号码拨号,在数据记录中被构成。在接收一个用户输入时,所述数据记录的目录被显示给用户。在接收另一个用户输入时,被显示的数据记录的列表之一被识别并且一个指令被发送到在所述移动通信设备上被执行的几个应用中的至少一个。所述指令命令所述接收应用根据被发送的指令进行操作以便导致所述移动通信设备的相应的设备功能。典型的,所述指令可以包括一个要被拨号的电话号码,所述指令被发送到拨号应用,根据接收的电话号码导致一个电话通信链路的建立。
文档编号H04M1/247GK1633799SQ02829246
公开日2005年6月29日 申请日期2002年7月2日 优先权日2002年7月2日
发明者J·延斯, K·弗勒泽, A·芬克-安劳夫 申请人:诺基亚有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1