输入文本的方法

文档序号：6444038阅读：290来源：国知局

专利名称：输入文本的方法
技术领域：
本发明一般涉及向设备输入文本的方法，尤其涉及向设备的字符输入辅助的已声化文本输入。
背景技术：
诸如移动电话和个人数字助理(PDA)等小型计算设备正在被越来越频繁地使用。这些设备的计算能力允许它们被用于访问和浏览因特网并储存联系人信息、审阅并编辑文本文档、以及执行其它任务。另外，用移动设备发送和接收文本消息也变得越来越普及。例如，移动电话的短消息服务(SMS)已成为文本消息通信路标上的巨大成功，近来引入的增强消息通信服务(EMS)-SMS的应用层扩展-被期望提供到未来的多媒体消息通信服务(MMS)的平滑过渡。作为结果，这些设备提供了许多需要文本输入的应用。不幸的是，移动设备上的这一文本输入会是笨重的，因为它们缺乏标准的全尺寸键盘。
当前，有两种常见的方式以使用大多数移动电话上的数字小键盘实现文本输入-多次按键(multiple-tap)方法和单次按键(single-tap)方法。采用多次按键方法，用户按压数字键多次以输入期望的字母，因为大多数数字键被映射到字母表的三个或四个字母。例如，“2”键通常被映射到字母“A”、“B”和“C”。如果用于按压“2”键一次，则输入字母“A”。如果用户按压“2”键两次，则输入字母“B”，如果用户按压“2”键三次，则输入字母“C”。单词的连续字母输入之间的暂停有时候是必需的，使得设备知道何时将光标前进到下一字母输入位置。例如，为输入单词“cab”，用户按压“2”键三次以输入字母“C”、暂停、按压“2”键一次以输入字母“A”、再次暂停、按压“2”键两次以输入字母“B”。数字小键盘上也存在其它按键，如井号(“#”)和星号(“*”)键等其它按键，它们通常被映射到输入符号，或在大写和小写字母之间切换。
尽管多次按键方法是有用的，因为用户能够仅使用数字键来输入任何单词，然而对于快速和直观文本输入，它是不利的。诸如“cab”等单词仅需要在标准键盘上三次按键(对每一字母一次)，使用多次按键方法却需要在数字键上六次按键。与使用标准键盘相比，用多次按键方法使用数字键来实现文本输入意味着用户即使对于短消息也要按压许多按键。此外，会频繁出现错误。例如，如果用户想要输入字母B，但是在第一次和第二次按键之间暂停了太长，则作为替代会输入两个字母A。在这一情况下，设备将暂停解释为用户完成了当前的字母输入-一个“A”，而前进到下一字母输入位置-也输入“A”。
另一种使用数字键输入文本的方法是单次按键字典方法，如“T9”，它由名为Tegic的公司推广。在单次按键方法中，用于按压与期望字母相关联的数字键一次，即使该数字键被映射到三个或四个不同的字母。当用户输入用于单词的数字序列时，设备基于该数字序列试图辨别用户想要输入的单词。每一数字序列被映射到对应于该序列的常见单词。例如，数字序列“43556”可能对应于第一个字母为“G”、“H”或“I”的任一五字母单词，因为“4”键通常被映射到这三个字母。类似地，序列可能对应于第二个字母为“D”、“E”或“F”、第三和第四个字母选自字母“J”、“K”和“L”、并且第五个字母为“M”、“N”或“O”的任一五字母单词，因为“3”、“5”和“6”键通常被映射到这些相应的字母。然而，由于对应于数字序列“43556”的最常见的五字母单词为单词“hello”，因此单次按键方法在用户连续地按压“4”、“3”、“5”、“5”和“6”键以输入该数字序列时将总是输入这一单词。
单次按键方法比多次按键方法更有利，但是却产生了新的缺点。有利的是，单次按键方法以高概率确保了用户仅需要按压与期望单词中的字母数量相同次数。例如，多次按键方法需要用户按压“2”键六次以输入单词“cab”。相反，单次按键方法可能只需要用户按压“2”键三次以输入这一单词，假定数字序列“222”被映射到单词“cab”。因此，对于使用数字键的文本输入，单次按键方法比多次按键方法更按键有效。它几乎与使用对每一字母具有单个键的标准键盘一样按键有效。
单次按键方法也是不利的，因为被映射到给定数字序列的单词可能不是用户期望通过输入该序列来输入的单词。例如，数字键序列“7333”对应于单词“seed”和“reed”。由于仅一个单词被映射到每一数字序列，当用户键入数字键序列“7333”时，可能输入单词“seed”，而用户可能想要输入单词“reed”。单次按键方法主要在对给定的数字键序列只有一个唯一的单词的情况下是有用的，或者如果对给定序列存在若干单词，则当用户希望输入与该序列相关联的最常见单词时是有用的。当由单次按键方法映射的单词不是预期的单词时，文本输入可还原到多次按键方法或纠错模式。预期单词的最终文本输入可能比用户以多次按键方法开始需要更多次按键。
在常规键盘的使用之外输入文本的另一种方法是通过使用语音识别系统。在这一系统中，用户将文本条目已声化，它由计算设备通过麦克风捕获并数字化。向数字化的捕获语音的样值应用频谱分析，并对每一样值生成特征矢量或码字。然后可以对照诸如隐马尔可夫(Markov)模型等统计模型来计算输出概率，该模型稍后用于执行维特比(Viterbi)解码过程或相似类型的处理技术。搜索表示语音单元的声学模型以确定由该特征矢量或码字所表示的可能的音素，并且因此确定从系统用户所接收的话语。搜索已声化候选单词的词典，以确定最可能表示该特征矢量或码字的单词。另外，可使用语言模型来提高由语音识别系统所产生的单词的准确度。语言模型一般运行以通过将候选单词局限于最可能基于前面的单词的那些单词，来提高语音识别系统的准确度。一旦标识了捕获的已声化文本条目的单词，它们被作为文本输入到计算系统中。
语音识别系统需要相当大的处理能力，以处理已声化的文本条目并产生合理的准确结果。尽管未来的移动设备可能能够实现这一语音识别系统，然而现有的移动计算设备缺乏必要的处理能力来以有用的方式实现这一功能。另外，移动计算设备通常缺乏大词汇量连续语音识别所需的存储器容量。因此，移动计算设备依赖于上述使用有限键盘的文本输入方法。
不断地需要向包括移动计算设备的设备输入文本的改进的方法。

发明内容
本发明一般涉及向设备输入文本的方法。在本方法中，提供指示文本条目的第一个字符的第一字符输入。下一步，捕获文本条目的发声。然后基于第一字符输入和该发声的分析对该发声的第一单词标识可能的候选单词。最后，向用户显示可能的候选单词。

图1是可使用本发明的示例性计算装置的简化框图。
图2是可使用本发明的移动电话的示意图。
图3所示是依照本发明的实施例用于向设备输入文本的方法的流程图。
图4是可用于实现本发明的方法的示例性系统的框图。
图5所示是依照本发明的实施例用于向设备输入文本的方法的流程图。
图6所示是依照本发明的实施例用于向设备输入文本的方法的流程图。
具体实施例方式
本发明一般涉及用于向计算设备输入文本的方法。尽管本发明的方法可在包括常规全尺寸键盘的计算设备中实现，然而当结合缺乏这一键盘的移动计算设备使用时，它是最有用的。
图1是可在其中实现本发明的示例性计算装置100的框图。装置100可以是移动计算设备，如移动电话、个人数字助理(PDA)、移动存储系统(如，MP3播放器)、远程控制以及缺乏常规全尺寸键盘的其它移动计算设备。装置100仅为本发明的合适的计算环境的一个示例，并非暗示对本发明的使用范围或功能的任何局限。另外，也不应当将装置100解释为对图1所示的任一组件或其组合具有依赖或需求。
装置100可包括控制器或处理器102、计算机或机器可读存储器104、显示屏106、麦克风108以及字符输入设备110。存储器104是可由处理器102访问的机器可读存储器。存储器104可包括易失和非易失存储器存储技术，并可被配置成从装置100移除或固定在其中。例如，存储器104可包括但不限于，RAM、ROM、EEPROM、闪存或其它存储器存储设备。
存储器104被配置成储存诸如程序模块等可由处理器102执行以实现本发明的方法的指令。一般而言，程序模块包括例程、程序、对象、组件、数据结构等等，执行特定的任务或实现特定的抽象数据类型。本发明也可在分布式计算环境中实现，其中，任务由通过通信网络连接的远程处理设备执行。在分布式计算环境中，程序模块可位于本地和远程存储器存储设备中。
处理器102被配置成依照常规计算设备操作在显示屏106上显示文本和图像。显示屏106可以是任一合适的显示屏。对于移动计算设备，显示屏106通常是小型、平板显示屏，如也可为触敏的液晶显示屏(LCD)。可选地，显示屏106可以是较大的显示器，如阴极射线管(CRT)显示器或其它类型的较大的显示器，如大平板显示器。
设备100的麦克风108可由用户用于输入发声。发声较佳地由模-数转换器112转换成数字形式。如后文更详细地讨论的，设备100可处理数字化的发声以提取包含在该发声内的可能的候选单词。这通常通过使用处理器102处理数字化发声执行语音识别或包含在存储器104内的语言处理模块来完成。
字符输入设备110由用户用于输入字母数字字符、符号、空格等等，作为到设备100的文本输入。另外，字符输入设备110可用于作出选择、移动光标、滚动页面、导航选项和菜单、以及执行其它功能。尽管字符输入设备110可以是常规键盘，然而本发明对具有一般较小、有较少按键的有限字符输入设备110，以及涉及常规全尺寸键盘的有限功能的计算设备100最有用。使用这一有限字符输入设备110输入字符是较慢且笨重的。
有限字符输入设备110可采用许多不同的形式。通常由PDA使用的某些有限字符输入设备110由诸如显示屏106等触敏显示屏形成。一个这样的字符输入设备110通过在触敏显示屏106上显示微型键盘形成。用户可通过用输入笔以类似于常规键盘的方式接触显示的字母来选择期望的字符用于文本输入。另一这样的字符输入设备110允许用户在显示屏106上书写字符，或通过使用输入笔指定其每一个都映射到可应用到触敏显示屏106的特定笔划序列的输入字符。一旦用户使用输入设备110的任一形式提供了文本条目，该文本条目被提供到显示屏106。
诸如移动电话等移动计算设备使用数字小键盘形式的有限字符输入设备110。图2是移动电话114形式的设备100的简化图，它包括数字小键盘116、显示屏106和麦克风108。移动电话114也可包括扬声器118、天线120以及收发器(未示出)和其它组件形式的通信电路，它们与本发明不相关。
数字小键盘116包括若干数字键122和其它按键。一般而言，数字小键盘116可与标准键盘区别，因为它不对每一字符具有唯一的按键。作为结果，数字小键盘116是有限字符输入设备110。小键盘116具有以下数字键“1”键122A、“2”键122B、“3”键122C、“4”键122D、“5”键122E、“6”键122F、“7”键122G、“8”键122H、“9”键122I和“0”键122J。数字小键盘116也具有星号(*)键122K和井号(#)键122L。数字小键盘116也可具有除图2所示的那些按键以外的特殊键，或具有少于图2所示的按键。数字小键盘116的按键122可以是真实的、物理按键或显示在显示屏106上的虚拟的、软按键，其中，显示屏106是触敏屏幕。
数字小键盘116的所有数字键122，除“1”键122A和“0”键122J之外，都对应于字母表的三个或四个字母。“2”键122B对应于字母“A”、“B”和“C”。“3”键122C对应于字母“D”、“E”和“F”。“4”键122D对应于字母“G”、“H”和“I”。“5”键122E对应于字母“J”、“K”和“L”。“6”键122F对应于字母“M”、“N”和“O”。“7”键122G对应于字母“P”、“Q”、“R”和“S”。“8”键122H对应于字母“T”、“U”和“V”。最后，“9”键122I对应于字母“W”、“X”、“Y”和“Z”。标点符号字符和符号可包括在未使用按键，如“1”键122A上，或与字母一起包括在其它数字键122上。另外，每一数字键122可用于输入被标签在其上的数字或符号。
诸如移动电话等现有技术的移动计算设备使用多次按键和单次按键方法以向设备100输入文本。某些方法是笨重且低效的，不仅是因为需要对文本的每一字符使用按键122提供至少一个输入。另外，单次按键方法通常无法识别用户试图输入的单词。例如，为输入单词“hello”，用户连续按压“4”键122D、“3”键122C、“5”键122E两次和“6”键122F。由于输入的数字序列“43556”可对应于不同于单词“hello”的其它单词，因此期望的单词是不明确的。另外，由设备使用的词典包含匹配特定数字序列的单词，它可能不包含期望由用户输入的单词。这通常导致词汇外(OOV)错误，这一般需要用户将设备的输入模式从单次按键模式改变到多次按键模式，并从头开始重新输入期望的文本条目。其结果是，用户可能被强迫执行比包含在单词中的字母数明显更多的数字键按压。
本发明操作以与现有技术的方法相比，显著地减少向设备100输入期望文本所需的按键次数。这通过将语音识别与用户输入相组合来实现。其结果是一种简单、有效且准确的文本输入系统。
图3所示是依照本发明的各种实施例的方法的步骤的流程图。图4是可用于实现设备100上的本方法的实施例的示例性系统128的框图。系统128的组件一般对应于如包含在图1的存储器104内并可由处理器102执行以实现本发明的各个步骤的程序模块和指令。
当设备100被设为文本输入模式时，在步骤132，由用户提供第一字符输入130。第一字符输入130指示期望由用户输入的文本条目的第一个字符。例如，当期望的文本条目是“BERRY”时，用户提供指示字母“B”的第一字符输入130。
第一字符输入130可以是由用户使用如数字小键盘116(图2)、触敏显示屏、常规键盘、另一类型的输入设备110(图1)、或其它装置上的多次按键方法直接输入的文本条目的实际的第一个字符。本发明的这一实施例的一个缺点是如上文所解释的，诸如数字小键盘116等有限字符输入设备110会强迫用户按压键122多次以输入期望的字符。
第一字符输入130也可由用户依照单次按键方法来输入。由此，对于数字小键盘116，用户只需按压对应于期望字符的键122一次。由此，为输入“B”，用户只需按压“2”键122B一次。依照本发明的这一实施例，第一字符输入130表示“B”，也表示“A”和“C”。
在方法的步骤134，捕获文本条目的发声136。这通常通过用户向麦克风108说出文本条目来实现，依照常规的语音识别方法，它由A/D转换器122数字化，并储存在存储器104中，或由处理器102处理。较佳地，发声功能136在用户提供第一字符输入130之后被捕获。
发声136的捕获可被触发，来以许多不同的方式开始。较佳地，由设备100例如在显示屏106上提供指示符以向用户通知文本条目的发声应当开始。依照本发明的一个实施例，捕获步骤134响应于用户在方法的步骤132提供第一字符输入130而开始。因此，对于单次按键输入方法，当在设备100的文本输入模式时，按压对应于文本条目的第一个字符的数字键将开始捕获步骤134。依照本发明的另一实施例，捕获步骤134以压下并按住字符输入设备110的按键开始。这对于仅按压单个按键来指定第一字符输入130的单次按键方法尤其有用，但可以连同多次按键和其它文本条目输入方法来实现。设备100也可包括用于触发捕获步骤132的专用硬按键或软按键。
依照本发明的另一实施例，捕获步骤134可被配置成弥补用户在检测到按键或其它发声捕获触发事件之前过早地说话的情况。解决这一问题的一种方法是当设备100以文本输入模式操作时，由用户在存储器104中连续地缓存几百毫秒的任何发声。缓存的发声可用于捕获在触发事件之前开始的文本条目的“错误起始”发声，它可作为在捕获步骤134中提供给语音识别器142(图4)的发声输入136的一部分包括在内。
捕获步骤134可通过时间的预定周期的超时或通过释放被按住以开始已声化的文本条目的按钮或按键来终止。可选地，捕获步骤132可在系统检测到文本条目的发声的终止之后终止。当捕获步骤132终止时，设备100较佳地如通过终止在捕获步骤132开始时所提供的指示符来向用户提供这一通知。
依照本发明的一个实施例，用户提供的文本条目必需被隔离或为单个单词增量。因此，文本条目的发声136对应于单个或隔离的文本条目单词。通过选择第一字符输入并说出或发声单个文本条目单词的来输入文本的过程在单次按键方法用于输入第一字符输入130时在某一程度上是自然的。另外，单个单词文本输入在移动计算设备的环境中具有其优点。特别地，需要较少的存储器来临时储存捕获的发声136。另外，需要较少的计算能力来分析发声136，并可得到更准确的语音识别结果，这将在后文讨论。
依照本发明的另一实施例，文本条目由用户以多个单词的形式提供。由于移动计算设备的一般有限的存储器容量和处理能力，对文本条目的长度较佳地加以限制。因此，较佳地仅允许用户输入短词组或句子。依照本发明的一个实施例，向用户通知捕获步骤的开始和结束的指示符可以是计时器的形式(即，向下计时计时器)，或延伸以指示已过去的时间以及捕获步骤1134的结束的条的显示。对于文本条目的第一个单词和发声的对应的第一个单词，本发明的单个单词和多个单词文本条目实施例最初都以基本上相同的方式操作。
在方法的步骤138，基于第一字符输入130和发声136的分析对文本条目的发声的第一个单词标识可能的候选单词140。一般而言，本方法操作以通过排除无法匹配第一字符输入130所陈述的准则的单词，对文本条目的第一个单词(多个单词文本条目模式)或文本条目单词(单个或隔离文本条目模式)缩小了可能候选单词列表。例如，当单次按键第一字符输入130对应于多个字符“ABC”时，例如，可能候选单词列表可被剪断至仅以“A”、“B”或“C”开始的单词。其结果是，设备100的系统128不仅可产生更准确的结果，还可比如果分析发声功能136的所有可能候选单词所能达到的更快地产生结果。这对于缺乏由实现语音识别系统的其它计算系统所使用的处理能力的移动计算设备100尤其是有益的。
发声136的分析一般由语音识别器142(图4)执行。语音识别器142一般在发声136的数字样值上执行频谱分析以根据最可能对应于文本条目的发声136的已声化候选单词的词典或列表146来标识可能的候选单词144的列表。较佳地，由语音识别器142产生的可能候选单词列表144依照其匹配发声136的似然性来分级。
语音识别器142也可包括可提高语音识别器142的准确度的语言模型148。语言模型148操作以指定词汇中哪些单词序列是可能的，或一般而言，提供关于各种单词序列的似然性的信息。语言模型的示例是1词(1-gram)、2词(2-gram)和N词(N-gram)语言模型。1词语言模型仅考虑个别单词的概率，而2词语言模型考虑文本条目中的前一单词对文本条目的当前已声化单词是什么有影响。类似地，3词、4词和N词语言模型在确定与发声136的匹配时考虑期望文本条目之前的紧靠的两个、三个或N-1个单词。由于移动计算化设备100中一般缺乏处理能力，可能必须将语言模型148限于1或2词语言模型。
标识步骤138一般由预测器模块150执行。依照本发明的一个实施例，预测器模块150接收可能候选单词列表144和字符输入130。预测器模块148基于第一字符输入130从可能候选单词列表144标识可能的候选单词140。预测器150较佳地选择可能候选单词列表144中将字符输入130作为其第一字母的最高等级单词作为可能的候选单词140。
依照本发明的另一实施例，标识步骤138通过首先使用第一字符输入130缩小语音识别器142的已声化候选单词词典或列表146来执行，如图4的虚线152所示的。其结果是，通过排除不以由第一字符输入130标识的一个或多个字符开始的所有已声化候选单词，已声化候选单词146的列表被缩减至经缩小的已声化候选单词列表154。经缩小的已声化候选单词列表154被进一步缩小，以基于语音识别器142的分析形成用于发声136的第一个单词的可能候选单词列表144。其结果是，提供给预测器150的可能候选单词列表144的每一个都以由字符输入130所标识的一个或多个字符开始。预测器150然后标识可能候选单词140，它较佳地为可能候选单词列表144中最高等级的候选者。
标识步骤138的另一实施例包括在第一字符输入130上执行单次按键分析。一般而言，预测器150使用第一字符输入130以将输入单次候选者词典或列表156缩小至仅具有对应于第一字符输入130的第一个字符的那些单词。以这一方式，输入候选单词列表156被缩减至用于发声136的第一个单词的经缩小的输入候选单词列表158。预测器150然后将响应于语音识别器142的发声136分析而产生的已声化候选单词列表144与经缩小的输入候选单词列表158相比较。预测器150然后将既在有声化已声化单词候选者候选单词列表中又在经缩小的输入候选单词列表中的可能候选单词140标识为候选单词。较佳地，预测器150选择候选单词140作为可能候选单词列表144中具有经缩小的输入候选单词列表158中的匹配的具有最高等级的单词。
在方法的最后的步骤160，例如，在设备100的显示屏106上向用户显示可能候选单词140。可选地，可向用户显示满足标识步骤138的多个可能候选单词。可能单词的显示可被解释为向设备100输入的可能候选单词，即使它尚未被用户接受。
用户然后可接受显示的可能单词140以完成单词的文本输入，或可拒绝该单词。一般而言，响应于用户选择，可能候选单词140被接受并作为文本条目被输入到设备100。依照本发明的一个实施例，用户通过按压设备100上的硬按键或软按键来输入所显示的可能候选单词140。依照本发明的一个实施例，用户选择较佳地通过按压不对应于字母数字字符的数字小键盘的按键122之一，如星号键122K或井号键122L来执行。然而，应当理解，可使用作出选择的许多常规方法来输入显示的可能候选单词。
当用户以每次一个单词输入文本，且显示的可能单词被用户接受并被输入时，该方法可依照图5的流程图继续。在步骤162，用户提供指示第二个文本的第一个字符的第二字符输入。第二字符输入可依照上文对提供第一字符输入130所解释的过程来提供。下一步，在步骤164，以上述关于步骤134(图3)所描述的方式捕获第二个文本条目的发声。然后在步骤166，基于第二字符输入和第二个文本条目的发声的分析，对第二个文本条目的发声标识可能候选单词。这一步骤基本上以上述关于图3的方法的步骤138所描述的方式执行。最后，在步骤168显示第二个文本条目的发声的可能候选单词。用户然后如上所述地具有选择或拒绝所显示的可能候选单词的任选项。
语音识别器150的语言模型146可考虑文本条目中先前的单词，以标识用户试图输入的当前单词。因此，对第二个文本条目的发声标识可能候选单词的步骤还可基于先前输入的可能候选单词140。
当用户以多个单词格式输入文本时，所显示的可能单词被用户接受，并且发声136的单词未被全部标识，方法可依照图6的流程图继续。在方法的步骤170，提供指示图3的方法的步骤134中所捕获的发声136的第二个单词的第一个字母的第二字符输入。如上所述，第二字符输入可依照上文对提供第一字符输入130所解释的过程来提供。下一步，在步骤172，基于对发声136的分析和第二字符输入标识发声136的第二个单词的可能候选单词。然后在步骤174向用户显示可能候选单词以接受或拒绝。如果用户接受该可能候选单词，则方法返回到步骤170并重复，直到标识了发声136的单词。如上所述，标识发声的第二个单词的可能候选单词的步骤172还可使用语音识别器150的适当的语言模型146基于先前输入的可能候选单词140。
如上所述，用户也可通过合适的输入具有拒绝所显示的可能候选单词140的机会。依照本发明的一个实施例，由设备100提供按键，使得当该键被按下时，导致所显示的可能候选单词140的拒绝。这一按键可以是设备100的软按键或硬按键。例如，当星号键122K被用于接受显示的可能候选单词140时，井号键122L可用于拒绝所显示的可能候选单词。也可使用拒绝所显示的可能候选单词的许多其它方法。
依照本发明的一个实施例，在用户拒绝可能候选单词之后，依照其等级向用户显示匹配标识步骤138(图3)的准则的一个或多个备选可能候选单词。例如，当要输入的期望单词是“BURY”时，系统128显示的可能单词140可以是“BERRY”。在用户拒绝显示的可能单词之后，系统128可显示最可能的备选单词，如期望单词“BURY”以及“BARRY”。然后向用户提供在所显示的备选可能候选单词之间选择的选项。
依照本发明的另一实施例，所显示的可能候选单词140的拒绝响应于用户提供指示期望文本条目的发声136的第一个单词的第二个字符的第二字符输入而出现。第二字符输入的输入可以上文对第一字符输入130所描述的方式来作出。设备100的系统128查找满足步骤138(图3)所实现的方法，且具有对应于第一和第二字符输入的第一个和第二个字符的一个或多个备选可能候选单词。备选的可能候选单词然后可向用户显示以用于选择或拒绝。这一过程可通过继续输入文本条目的第三个和随后的字符来重复。
在所显示的备选可能单词仍无法匹配用户期望的文本条目单词的情况下，设备100的文本输入模式可被切换到多次按键模式，以允许用户直接向设备100输入期望的单词。
尽管参考具体实施例描述了本发明，然而本领域的技术人员将认识到，可在不脱离本发明的精神和范围的情况下在形式和细节上作出改变。
同样，尽管本发明的大多数讨论是以诸如英语等字母语言为中心的，然而本领域的技术人员将认识到，本发明所列出的原理也适用于诸如东亚语言等其输入法不基于字母的其它语言。
权利要求
1.一种向设备输入文本的方法，其特征在于，它包括a)提供指示文本条目单词的第一个字符的第一字符输入；b)捕获所述文本条目单词的发声；c)基于所述第一字符输入和对所述发声的分析标识所述发声的可能候选单词；以及d)显示所述可能候选单词。
2.如权利要求1所述的方法，其特征在于，所述捕获步骤b)响应于所述提供步骤a)而开始。
3.如权利要求1所述的方法，其特征在于，所述捕获步骤b)在所述提供步骤a)之前开始。
4.如权利要求1所述的方法，其特征在于，所述捕获步骤b)在一预定时间段之后结束。
5.如权利要求1所述的方法，其特征在于，所述捕获步骤b)在检测到所述发声的结束之后结束。
6.如权利要求1所述的方法，其特征在于，所述提供步骤a)包括按压一对应于多个字符的按键。
7.如权利要求1所述的方法，其特征在于所述提供步骤a)包括压下并按住一按键；以及所述捕获步骤b)响应于所述提供步骤a)而开始。
8.如权利要求7所述的方法，其特征在于，所述捕获步骤b)在一预定时间段后结束。
9.如权利要求7所述的方法，其特征在于，所述捕获步骤在所述按键被释放时结束。
10.如权利要求1所述的方法，其特征在于，所述标识步骤c)包括基于对所述发声的分析产生一可能候选单词列表；以及基于所述第一字符输入从所述发声的可能候选单词列表标识所述可能候选单词。
11.如权利要求10所述的方法，其特征在于，它包括响应于用户输入，拒绝所述可能候选单词；以及显示一来自所述可能候选单词的备选可能候选单词。
12.如权利要求1所述的方法，其特征在于，所述标识步骤c)包括使用所述第一字符输入缩小一已声化候选单词列表，以形成一经缩小的已声化候选单词列表；基于对所述发声的分析，将所述经缩小的已声化单词列表缩小至一用于所述发声的可能候选单词列表；以及从所述可能候选单词列表标识所述可能候选单词。
13.如权利要求12所述的方法，其特征在于，它包括响应于用户输入，拒绝所述可能候选单词；以及显示一来自所述可能候选单词列表的备选可能候选单词。
14.如权利要求1所述的方法，其特征在于，所述标识步骤c)包括分析所述发声以产生一已声化候选单词列表；使用所述第一字符输入缩小一输入候选单词列表，以形成一用于所述发声的经缩小的输入候选单词列表；将所述已声化候选单词列表与所述经缩小的输入候选单词列表相比较；以及将既在所述已声化单词候选者候选单词列表中又在所述经缩小的输入候选单词列表中的可能候选单词标识为候选单词。
15.如权利要求14所述的方法，其特征在于，它包括响应于用户输入拒绝所述可能候选单词；以及显示一既在所述已声化单词候选者候选单词列表中又在所述经缩小的输入候选单词列表中的备选可能候选单词。
16.如权利要求1所述的方法，其特征在于，它包括提供指示所述文本条目单词的第二个字符的第二字符输入，其中，在步骤c)中标识的所述可能候选单词基于所述第一和第二字符输入以及对所述发声的分析。
17.如权利要求1所述的方法，其特征在于，它包括响应于用户选择，输入所述可能候选单词。
18.如权利要求17所述的方法，其特征在于，它包括提供指示所述第二文本条目单词的第一个字符的第二字符输入；捕获所述第二文本条目单词的发声；基于所述第二字符输入和对所述第二文本条目单词的发声的分析，标识用于所述第二文本条目单词的发声的可能候选单词；以及显示用于所述第二文本条目单词的发声的可能候选单词。
19.如权利要求18所述的方法，其特征在于，标识用于所述第二文本条目单词的发声的可能候选单词的所述步骤还基于所输入的可能候选单词。
20.一种向设备输入文本的方法，其特征在于，它包括a)提供指示一文本条目的第一个字符的第一字符输入；b)捕获所述文本条目的发声；c)基于所述第一字符输入和对所述发声的分析，标识用于所述发声的第一个单词的可能候选单词；以及d)显示所述可能候选单词。
21.如权利要求20所述的方法，其特征在于，所述文本条目由单个单词构成。
22.如权利要求20所述的方法，其特征在于，所述文本条目包括多个单词。
23.如权利要求20所述的方法，其特征在于，所述捕获步骤b)响应于所述提供步骤a)而开始。
24.如权利要求23所述的方法，其特征在于，所述捕获步骤b)在一预定时间段之后结束。
25.如权利要求20所述的方法，其特征在于，所述提供步骤a)包括按压一对应于多个字符的按键。
26.如权利要求20所述的方法，其特征在于所述提供步骤a)包括压下并按住一按键；以及所述捕获步骤b)响应于所述提供步骤a)而开始。
27.如权利要求26所述的方法，其特征在于，所述捕获步骤b)在一预定时间段之后结束。
28.如权利要求26所述的方法，其特征在于，所述捕获步骤b)在所述按键被释放时结束。
29.如权利要求20所述的方法，其特征在于，所述标识步骤c)包括基于对所述发声的分析产生一可能候选单词列表；以及基于所述第一字符输入从用于所述发声的第一个单词的可能候选单词列表中标识所述可能候选单词。
30.如权利要求29所述的方法，其特征在于，它包括响应于用户输入，拒绝所述可能候选单词；以及显示一来自所述可能候选单词列表的备选可能候选单词。
31.如权利要求20所述的方法，其特征在于，所述标识步骤c)包括使用所述第一字符输入缩小一已声化候选单词列表，以形成一经缩小的已声化候选单词列表；基于对所述发声的分析，缩小所述经缩小的已声化候选单词列表，以形成一用于所述发声的第一个单词的可能候选单词列表；以及从所述可能候选单词列表中标识所述可能候选单词。
32.如权利要求31所述的方法，其特征在于，它包括响应于用户输入，拒绝所述可能候选单词；以及显示一来自所述可能候选单词列表的备选可能候选单词。
33.如权利要求20所述的方法，其特征在于，所述标识步骤c)包括分析所述发声以产生一已声化候选单词列表；使用所述第一字符输入缩小一输入候选单词列表，以形成一用于所述发声的第一个单词的经缩小的输入候选单词列表；将所述已声化候选单词列表与所述经缩小的输入候选单词列表相比较；以及将既在所述已声化单词候选者候选单词列表中又在所述经缩小的输入候选单词列表中的可能候选单词标识为候选单词。
34.如权利要求33所述的方法，其特征在于，它包括响应于用户输入，拒绝所述可能候选单词；以及显示一既在所述有声化已声化单词候选者候选单词列表中又在所述经缩小的输入候选单词列表中的备选可能候选单词。
35.如权利要求20所述的方法，其特征在于，它包括提供指示所述文本条目的第二个字符的第二字符输入，其中，步骤c)中标识的所述可能候选单词基于所述第一和第二字符输入、及对所述发声的分析。
36.如权利要求20所述的方法，其特征在于，它包括响应于用户选择，输入所述可能候选单词。
37.如权利要求36所述的方法，其特征在于，它包括提供指示第二文本条目的第一个字符的第二字符输入；捕获所述第二文本条目的发声；基于所述第二字符输入和对所述第二文本条目的发声的分析，标识用于所述第二文本条目的发声的可能候选单词；以及显示用于所述第二文本条目的发声的可能候选单词。
38.如权利要求37所述的方法，其特征在于，标识用于所述第二文本条目的发声的可能候选单词的所述步骤还基于所输入的可能候选单词。
39.如权利要求36所述的方法，其特征在于，它包括提供指示所述发声的第二个单词的第一个字符的第二字符输入；基于所述第二字符输入和对所述发声的分析，标识用于所述发声的第二个单词的可能候选单词；以及显示用于所述发声的第二个单词的可能候选单词。
40.如权利要求39所述的方法，其特征在于，标识用于所述发声的第二个单词的可能候选单词的所述步骤还基于所输入的可能候选单词。
全文摘要
在向设备输入文本的方法中，提供指示文本条目的第一个字符的第一字符输入。下一步，捕获该文本条目的发声。然后基于该第一字符输入和对该发声的分析，对该发声的第一个单词标识可能候选单词。最后，向用户显示该可能候选单词。
文档编号G06F3/16GK1637702SQ20041010077
公开日2005年7月13日申请日期2004年11月30日优先权日2003年12月30日
发明者A·阿塞罗, 王冠三, M·V·马哈间, 黄学东申请人:微软公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：A.阿塞罗;王冠三;M.V.马哈间;黄学东
技术所有人：微软公司
我是此专利的发明人

上一篇：使用干涉成像原理的光学鼠标成像装置的制作方法
上一篇：目标检测的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。