一种在移动设备中控制文字输入的方法及其装置的制作方法

文档序号：7967508阅读：182来源：国知局

专利名称：一种在移动设备中控制文字输入的方法及其装置的制作方法
技术领域：
本发明涉及一种文字输入的方法，尤其是应用于移动设备中的文字输入的方法以及相应的装置。
背景技术：
当前，各种移动设备越来越多地进入人们的日常生活中，例如移动电
话、掌上电脑、个人数字助理(PDA)等，由于这些移动设备都具有比较强大的功能，也不同程度上地涉及到在这些设备上进行文字输入的问题，其中又以移动电话的文字输入问题更为突出。特别是在亚洲等国家，广大的年轻用户非常喜欢通过移动电话发送短消息的方式来进行沟通，这就需要输入大量的文字信息，从而使得文字输入的问题更加突出。
可以理解的是，由于移动设备不同于我们所使用的台式计算机、笔记本计算机等设备，在移动设备中按键的数量受限，所以当用户在移动设备上输入文字信息时，往往需要比台式计算机、笔记本计算机等设备上按动更多的次数来选择所需要输入的文字信息。例如，在最普通的情况下，为了输入英文字母I，首先需要按一次按键[4],出现"h",然后再按动该按键直到第三次按动，才出现I;类似地，需要按动按一次[6]按键出现"m", 再按一次该按键才出现n,依此类推，输入一个单词"international"的过程中用户按动了 2次[2]按键、2次[3]按键、6次[4]按键、3次[5]按键、9 次[6]按键、3次[7]按键、2次[8]按键，共27次击键。因此，这样的输入的效率是相对低的，尤其对于年纪相对大的人是一种不小的挑战，而且更加明显的是，也不能适应快速输入的需要。
为了提高在移动设备上输入文字的便捷性，各厂商已经纷纷提供了很多解决方案，例如提供多种多样的输入法以便输入汉字信息，针对英文输入、数字输入、其他字符输入分别提供不同的输入方式以提高效率等等，例如，申请号为"200310123264.8"、发明名称为"移动终端装置的输入
方法及其输入才莫块"的中国专利申请。又例如，为了4吏得用户避免通过手工输入文字信息，也有技术方案提出通过语音输入的方法来完成文字输
入，例如申请号为"CN200380101122.X"、发明名称为"一种便携式数字移动通讯设备及其语音控制方法和系统"的中国专利申请。甚至在具体的应用上，为了用户更方便地通过移动电话发送短消息，还在移动手机中设置了很多预先设置好的消息(例如部分常用的问候语)，供用户直接调取并发送等等。但总体而言，在这些解决方案中，部分解决方案并不便捷，例如上述的输入英文字母时需要在某个数字键上按多次的方法；或者部分解决方案虽然便捷，但却需要额外的硬件辅助，从而增加了每台手机的生产成本，例如增加手写屏来提供便捷的输入方式；又或者占用了较多的硬件资源，例如所述的语音输入的方法，其对所有的语音进行识别，一方面其语音数据库占用较多的存储空间，另一方面其训练语音识别的过程比较繁杂。
为此，非常有必要解决在移动设备上进行文字输入的问题。

发明内容
为了解决在移动设备上进行文字输入的问题，本发明提供了一种在移动设备上控制文字输入的方法以及相应的装置。
根据本发明的一方面，提供了一种在移动设备中控制文字输入的方法，包括如下步骤a.接收输入的语音信息；b.对接收的所述语音信息进行识别；c.显示被识别的语音信息对应的文字信息，并将该文字信息作为对所述移动设备的输入信息进行处理；其中，所述文字信息为西文字母、阿拉伯数字以及特殊符号中的任一种或任多种。
所述西文字母至少包括汉语拼音字母、英文字母、法文字母、德文字母、西班牙文字母、俄文字母。类似地，本领域的技术人员可以理解，
韩文字母、日文字母尽管不属于西文字母.，但仍然可以借助本发明按照西文字母同样的方式被输入。
上述方法还包括步骤接收对所述文字信息的确认操作。所述步骤c包括判断是否可以识别所述语音信息；若无法识别所述语音信息，则进行出错处理，若可以识别所述语音信息，则显示被识别的
语音信息对应的文字信息，并将该文字信息作为对所述移动设备的输入信息进行处理。
所述出错处理可以为如下方式的任一种通过语音提示用户该语音信
息错误，等待用户重新输入该语音信息；或者通过语音提示用户该语音信息错误，直接处理下一个语音信息；或者不进行任何处理，直接处理下一
个语音信息。
上述方法，其特征在于，通过反复执行所述步骤a c或步骤a d,每次输入一个西文字母的方式完成对一个英文单词或者对应于一个汉字的汉语拼音任一种内容的输入过程。
根据本发明的另一个方面，提供了一种在移动设备中控制文字输入的装置，包括语音接收模块，用于接收输入的语音信息；语音识别模块，用于对所述语音信息进行识别，并将识别后的语音信息转换为对应的文字信息后输出；语音数据库，用于存储语音信息以及每个语音信息对应的文字信息；其中，所述文字信息为西文字母.阿拉伯数字以及特殊符号中的任一种或任多种。
所述语音识别模块通过反复执行每次输出一个西文字母的方式完成对一个英文单词或者对应于一个汉字的汉语拼音的输入过程。
所述语音识别模块判断是否可以识别所述语音信息，若无法识别所述语音信息，则进行出错处理；若可以识别所述语音信息，则将识别后的语音信息转换为对应的文字信息后输出。
上述装置还包括输入转接模块，用于接收语音识别模块输出的文字信息，并将该文字信息作为对所述移动设备的输入信息进行处理，并使其显示在所述移动设备上。
所述输入转接模块将所述被识别的语音信息对应的文字信息输入至所述移动设备的输入装置中。
上述装置还包括语音训练程序，用于对语音识别模块进行训练使其可以正确地识另i j所输入的语音。
所述语音训练程序可以运行于与所述控制文字输入的装置相连接的外部设备上。当然，所述语音训练程序也可以内置于与所述控制文字输入的装置中。
根据本发明的又一个方面，提供了一种具备新型文字输入功能的移动设备，该移动设备包括上述的装置。该移动设备可以为移动电话、个人数字助理以及掌上电脑中的任一种。
本发明提供了一种新型的移动设备输入方法。这种方法的优点至少包
括1)不需要在输入时去按过多按键，就可以进行比较方便的输入。2) 回避了语音识别中的难点问题(比如平舌音与翘舌音，前鼻音与后鼻音等)。3)语音识别系统的语音数据库可以做的非常小，避免了手机容量小而不能把计算机中复杂的几百兆的语音数据库不能简单移植到存储容量小的手机中的困难问题。4)由于语音数据库小，针对单个用户的语音训练量也可以很小，并易于达到很高的识别准确率。

图1是根据本发明的第一实施例的通过语音输入文字信息的流程图；图2是根据本发明的第一实施例对语音信息进行识别过程的流程图；图3是根据本发明的第二实施例的在移动设备中用于控制文字输入的装置的结构示意图4是根据本发明的第二实施例的语音训练程序的工作示意图。
具体实施例方式
参考图1,其描述了根据本发明而实现的第一实施例的通过语音输入文字信息的流程图。当用户开始输入文字信息时，用户通过语音说出自己希望输入的文字信息，例如英文字母a，此时，开始执行步骤501,移动设备内的控制文字输入的装置接收用户输入的语音信息，然后，进入步骤 502,该控制文字输入的装置对所接收的所述语音信息进行识别，再进入步骤503,该控制文字输入的装置再判断是否可以识别该语音信息，若无法识别该语音信息，则执行步骤504,即进行出错处理，若可以识别该语音信息，则执行步骤505，即将所识别出的该语音信息对应的文字信息输出给所述移动设备的输入装置，然后进入步骤506,所述移动设备的输入装置将该文字信息作为输入信息在屏幕上显示该文字信息，此时，再进入步骤507,用户可以决定是否更正该文字信息，若决定不更正该文字信息，
则重复上述步骤，即接收下一个语音信息，若决定更正该文字信息，则执行步骤508,即进行更正处理，然后再重复上述步骤，即接收下一个语音信息。
本领域的技术人员可以理解，在上述步骤503中，实际上完成了一个语音识别的过程，即对所输入的语音信息进行识另"以确定对应的文字信息。由于这并不是本发明的重点，所以本申请文件中并没有过多地阐述如何识别一个语音信息。但本领域的技术人员可以结合现有技术对此予以实现。例如，至少可以参考申请号为"CN200380101122.X"或申请号为 "00806017.7"的中国专利申请。
本领域的技术人员可以理解，当所述的语音识别模块无法根据接收到的语音信息辨别对应的文字信息时，则进行出错处理，即执行步骤504。根据不同的设计需求，可以执行不同的出错处理。例如，在本发明的第一实施例中，直接通过语音信息提示用户"不能识别！"，并继续处理下一个语音信息，而在本发明的第三实施例中，则不对用户进行任何提示，也不再处理下一个语音信息，而是等待用户重新通过语音输入该文字信息。在本发明的范围内并通过现有技术的启示本领域的技术人员可以提供多种出错处理的方式。
本领域的技术人员可以理解，上述移动设备的输入装置为该移动设备本来就具有的输入装置。下文中结合图3将作更多的说明。但也可以理解的是，在本发明的第四实施例中，在步骤505中，上述被识别的文字信息直接被该移动设备的CPU所处理，同时直接将其显示在显示屏幕上，这样的处理方式与所述第一实施例相比，更加直接，不需要借助移动设备中的现有模块来完成本发明内容，但却浪费了原有模块的功能。具体的对于第四实施例的实现，本领域的技术人员可以参考现有移动设备中的输入装置的功能和实现方式予以实现。
本领域的技术人员可以理解，上述步骤508中对显示出的文字信息进行更正的处理可以通过很多方式予以实现，例如在本发明的第一实施例中，直接通过移动设备键盘上的删除键将其删除，而在本发明的第四实施例中，则仍然采用语音输入的方式输入"删除"语音信息，则语音识别模块在识别该语音信息后，将其转换为相应的删除键的键码并由该移动设备
的CPU进行处理/人而完成删除操作。
本领域的^支术人员可以理解，上述过程可以发生在^艮多场合。最常见的是，当用户通过移动电话编辑短消息时，则用户通过茱单进入短消息编辑的界面，然后用户开始按照上述流程通过语音输入文字信息。此时，上述移动设备中的输入装置即为该移动设备中的短消息编辑装置，本领域的技术人员可以理解，通过其可以将通过本发明输入的文字信息显示在移动设备的屏幕上。而在另一些场合下，例如在PDA的通讯录中输入新的联系人，上述输入过程同样发生。
参考图2,其描述了本发明的第一实施例对语音信息进行识别从而输入文字信息的具体过程。同样，在步骤502中，移动设备内的控制文字输入的装置对所接收的所述语音信息进行识别，根据本实施例的预先设置，所识别出来的对应的文字信息可能为数字，例如阿拉伯数字"0 9",即步骤5021,进而执行步骤505、 506等，从而使文字信息显示在屏幕上；也可能是西文字母，例如英文字母"A Z:，，即步骤5022,不断地输入多个英文字母进而组成一个完整的英文单词显示在屏幕上；也可能是特殊符号，例如"，"、'7"等符号，即步骤5023。
进一步地，本领域的技术人员可以理解，上述西文字母可以是多种语言的字母，例如最常见的英文字母，即上述所阐述的，又例如可以是法文字母、德文字母、西班牙文字母、俄文字母等。在本实施例中，为了减少语音数据库的容量，也为了降低语音训练的复杂度，西文字母以英文字母为主，并将可以用英文字母表示的其他西文字母用英文字母来代替，例如大部分汉语拼音字母使用英文字母来表示，即通过多个英文字母的组合形成一个完整的拼音，该拼音通过该移动设备中的原有的汉字输入系统形成一系列可能的汉字供用户选择，用户可以再次通过语音来选择，例如输入 "tian"(英文字母T、 I、 A、 N)后对应地出现"1天2田3填……，，，则用户可以通过语音输入"2"来选择"田，，字，从而完成对一个汉字的输入。本领域的技术人员可以理解，在这种情况下，如果需要输入汉字拼音中的"ZH"或"CH" 、 "SH"，则需要分别输入两个英文字母才能完成。但对于拼音字母英文字母无法表示，此时，在本实施例中，没有对此进行特殊的处理，而是借助目前的移动设备中所通常采用的处理方
式，即采用"V"来表示拼音字母"ii'，。本领域的技术人员可以理解，
在本实施例的一个变化例中，也可以采用对拼音字母"ii，，单独进行表示的方法，在这种情况下，一方面需要在显示字库中增加拼音字母, 另一方面，也需要在语音数据库中增加拼音字母的语音对照信息，从而使得其可以被识别。
又例如使用英文字母来代替德文字母，同样可以表示大部分德文字母，但对于、"P" 、等特殊的字母则同样无4表示。在这
种情况下，则在本实施例的一个变化例中，同样采用对大部分德文字母采用英文字母表示，对少部分英文字母无法表示的特殊字母则单独进行表示的方式予以处玉里。
进一步地，本领域的才支术人员也可以理解，对于英文以外的其他西文字母，在本实施例的其他变化例中，采用分别对不同语种的西文字母分别处理的方式，例如对汉语拼音字母、德文字母、法文字母等都分别建立显示字库、语音数据库，从而可以根据不同的语音识别不同的西文字母。例如，在一个变化例中，在输入之前，首先通过菜单切换至所需要的语种，然后就可以输入所需要的语种对应的西文字母；而在另一个变化例中，则用户直4妾进4亍i吾音输入，系统自动识别所对应的西文字母。
进一步地，本领域的技术人员还可以理解，尽管上述实施例都局限于西文字母为例，但本发明内容同样可以适用于韩文字母、日文字母等非西文字母，对此，本领域的技术人员可以参考现有技术并结合本发明内容予以实现。
再参考图2，在上述所阐述的关于汉语拼音的输入中，当输入完毕汉语拼音，而需要用户对对应的汉字进行选择时，采用了通过语音输入"2" 的方式来选择第2个汉字，但本领域的技术人员可以理解，也可以通过语音信息的输入来输入"向下"的指令来完成"向下"翻页的功能，类似地，也可以输入其他功能键信息，例如可以是"确认"等功能键。此时，需要在相应的语音数据库中建立这些功能键的语音信息以及其所对应的移动设备内进行输入处理的装置所能识别的识别符(码)，例如"确认"所对应的识别才寻。
本领域的技术人员可以理解，在其他实施例中，上述输入的过程可以
与现有的输入方式相结合。例如，在本发明的第四实施例中，需要输入空格或其他功能键时，仍然通过键盘来输入，又例如，在上述本发明的第四实施例中，对汉字的最后的选择，也通过4建盘来完成。
参考图3,其描述了本发明的第二实施例所提供的在移动设备中控制文字信息输入的装置的结构示意图。参考图3，其中，移动设备3包括本发明提供的控制文字信息输入的装置31以及该移动设备3中原有的输入装置32。其中，装置31包括语音接收模块311,用于接收输入的语音信息，以及语音识别才莫块312,用于对所述语音信息进行识别，并将识别后的语音信息转换为对应的文字信息后输出至所述输入模块322。其中，所述移动设备3中原有的输入装置32包括输入模块322，用于控制通过键盘输入信息，以及显示装置321,用于将输入模块322输入的信息显示在屏幕上。本领域的技术人员可以理解，所述输入装置32还包括显示字库等装置，以便所输入的信息可以在显示装置321上予以显示，但这不属于本发明重点阐述的部分，所以不赘述，本领域的技术人员可以参考现有技术予以理解。
参考图3，本领域的技术人员可以理解，在本实施例中，如果移动设备3原本不支持语音输入的功能，则为了实现本发明的目的，还至少应包括一个语音数据库(图中未示出)，其中用于存储语音信息以及每个语音信息对应的文字信息。
参考图3，在本实施例中，为了筒化本发明的复杂度，也为了借用现有移动设备上的输入装置，所以本发明提供的控制文字输入的装置31与移动设备3上原有的输入装置32相配合使用。例如，在需要输入文字信息时，首先用户通过现有方式切换至输入界面，例如通讯簿的输入界面或者短消息编辑界面或者记事本输入界面，然后开始语音输入，完成一次语音输入后，则上述语音识别模块312将所述语音信息对应的文字信息发送给所述输入装置32,所述输入装置32继续处理并使得该文字信息予以显示。
再参考图3,在本实施例的其他变化例中，所述装置31只包括语音接收模块311以及语音识别才莫块312,此时，语音识别才莫块312所识别出的文字信息将直接被移动设备3的处理器或者移动设备3的其他处理程序
或处理才莫块所处理，并进而显示在屏幕上。本领i或的^支术人员可以理解，在这种情况下，则可以不借助移动设备3中现有的输入装置。
再参考图3,在本实施例的一个变化例中，上述控制文字信息输入的
装置31除了包括语音接收模块311、语音识别模块312以外，还包括输入转接模块313 (图中未示出)，用于接收语音识别模块312输出的文字信息，并将该文字信息输出至所述输入模块322。本领域技术人员理解，该输入转接模块313的设置使得语音识别模块312的功能相对简单，语音识别模块312只需要对语音进行识别，其所输出的文字信息将由输入转接模块313进一步处理，例如将其发送给所述输入装置32，所述输入装置 32继续处理并使得该文字信息予以显示。
再参考图3,在本实施例的其他变化例中，如果所述移动设备3本身已经具备语音接收模块311、语音识别模块312,此时，则可以借用这些模块，同时，根据本发明上述的内容对语音数据库进行精简，从而也可以实现本发明的目的。
参考图4，其描述了根据本发明的第二实施例的语音训练程序的工作示意图。其中，所述语音识别模块312与语音训练程序22相连接，通过语音训练程序22来训练其识别语音与文字信息对应关系的准确度。经过训练后的语音信息将存储在上述语音数据库内，并在进行语音输入的过程用于识别相对应的文字信息。关于如何进行语音训练以及如何实现语音训练，本领域的技术人员可以参考现有技术予以实现，在此不赘述。
在本实施例中，所述语音训练程序22并不位于所述移动设备3上，而是置于另一个设备2中，例如一台计算机。这样的设置，可以减小移动设备3的复杂度，从而使得移动设备可以更精筒。但本领域的技术人员可以理解，上述语音训练程序22也可以置于所述移动设备3上或者直接内置于上述的控制文字输入的装置内，这并不影响本发明的实质内容。
结合上述内容，在通过汉语拼音输入一个汉字时，我们采用的是仅仅依次去读出所要输入的中文单字的汉语发音中的各个拼音字母。每当读好一个拼音字母时，语音识别系统识别出这个拼音字母，并显示在屏幕上，由于是直接识别各个拼音字母正确，所以，其它移动设备曾使用的把通过键盘输入的各个数字键所代表的拼音字母进行组合，并猜测出可能的拼音
组合的过程都不再需要了。在语音输入的it禾呈中，如果有意外的识别4晉i吴，或者是读错了，则可以按某个键去取消刚才某个拼音字母的输入。在读完此中文单字的所有拼音字母时，可以按某个键去表示完成了此中文单字的
所有拼音字母的输入，这时，移动设备可以显示出此拼音所能对应的各个候选中文单字，让用户去按键选出适当的字进行输入。
由于以上三种方法总共只需识别出数量相对少的数字(例如10个阿
拉伯数字)及数量相对少的西文字母(例如26个英文字母，其还可作为
拼音字母)，所以，语音识别系统的语音数据库就可以做得很小，且可以针对每个地方的移动设备的用户对于这些数字和字母中的其方言读音与标准的普通话读音不同的一些进行定制训练，并存在移动设备中，以便于以后取出来进行比较识别。
与这种方法相比较，其它的语音识别系统的识别量将大大超出这个数量，定制训练也会给用户增添很多的麻烦，所以，用户往往不愿意进行定制训练。或者是由于方言或各人声腺条件的不同，造成经常性的识别不准问题。
尽管本发明已经以如上所述的优选实施例予以说明，但可以明白地了解的是，任何对该领域熟悉的技术人员，根据本发明的设计思想、具体发明内容以及实施例的启示，应该可以各种改动和调整，而通过这些改动和调整所得到的新的内容应被本发明内容所涵盖。
权利要求
1.一种在移动设备中控制文字输入的方法，包括如下步骤a.接收输入的语音信息；b.对接收的所述语音信息进行识别；c.显示被识别的语音信息对应的文字信息，并将该文字信息作为对所述移动设备的输入信息进行处理；其中，所述文字信息为如下的任一种或任多种-西文字母；-阿拉伯数字；以及-特殊符号。
2. 如权利要求1所述的方法，还包括步骤d. 接收对所述文字信息的确认操作。
3. 如权利要求1或2所述的方法，其特征在于，所述步骤c包括i. 判断是否可以识别所述语音信息；ii. 若无法识别所述语音信息，则进行出错处理；iii. 若可以识别所述语音信息，则显示被识别的语音信息对应的文字信息，并将该文字信息作为对所述移动设备的输入信息进行处理。
4. 如权利要求1至3种任一项所述的方法，其特征在于，通过反复执行所述步骤a c或步骤a d,每次输入一个西文字母的方式完成对如下任一种内容的输入过程- 一个英文单词；以及- 对应于一个汉字的汉语拼音。
5. —种在移动设备中控制文字输入的装置，包括 -语音接收模块，用于接收输入的语音信息；-语音识别模块，用于对所述语音信息进行识别，并将识别后的语音信息转换为对应的文字信息后输出；-语音数据库，用于存储语音信息以及每个语音信息对应的文字信息其中，所述文字信息为如下的任一种或任多种- 西文字母；- 阿拉伯数字；以及 -特殊符号。
6. 如权利要求5所述的装置，其特征在于，所述语音识别模块通过反复执行每次输出一个西文字母的方式完成对如下任一种内容的输入过程- 一个英文单词；以及- 对应于一个汉字的汉语4并音。
7. 如权利要求5~6中任一项所述的装置，其特征在于，还包括-语音训练程序，用于对语音识别模块进行训练使其可以正确地识别所输入的语音。
8. 如权利要求7所述的装置，其特征在于，所述语音训练程序运行于与所述控制文字输入的装置相连接的外部设备上。
9. 一种具备新型文字输入功能的移动设备，其特征在于，包括如权利要求5 8中任一项所述的装置。
10. 如权利要求9所述移动设备，其特征在于，其为如下设备中的任一种- 移动电话；- 个人数字助理；以及 -掌上电脑。
全文摘要
一种在移动设备中控制文字输入的方法，包括接收语音信息的步骤、对接收的语音信息进行识别的步骤、显示该语音信息对应的文字信息的步骤，其中，所述文字信息为西文字母、阿拉伯数字以及特殊符号中的任一种或任多种。上述方法，通过反复执行所述上述步骤完成对英文单词和对应于一个汉字的汉语拼音的输入过程。本发明还提供了一种在移动设备中控制文字输入的装置，包括语音接收模块、语音识别模块、语音数据库。同时，本发明还提供了使用上述装置的移动设备，该移动设备可以是移动电话、个人数字助理、掌上电脑等。本发明可以有效地减少语音数据库的容量，并降低语音识别的训练过程的复杂度，可以方便地应用于各种移动设备，具有很强的实用性。
文档编号H04M1/27GK101170757SQ20061011760
公开日2008年4月30日申请日期2006年10月26日优先权日2006年10月26日
发明者亮杨, 蔡世光申请人:英华达(上海)电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：蔡世光;杨亮
技术所有人：英华达(上海)电子有限公司
我是此专利的发明人

上一篇：无线传感器网络三层体系构架的制作方法
上一篇：立体视觉系统的场景深度恢复和三维重建方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。