一种语音协助字符输入的方法及系统的制作方法

文档序号：6339860阅读：198来源：国知局

专利名称：一种语音协助字符输入的方法及系统的制作方法
技术领域：
本发明涉及计算机、软件技术领域。
背景技术：
计算机和电子信息技术的发展给人类带来了越来越多的电子设备和通信工具，而这些电子设备和通信工具中附带的软件设备，例如Office软件、输入法软件等等，又给人们的生活和工作带来了很大的便利。其中人们对其应用最多的就是对文字的编辑了，比如，撰写文章或者发送信息等等，这些都离不开对输入法的应用。而常用的输入法有智能输入法、五笔输入法、搜狗拼音输入法、微软输入法、QQ拼音输入法等等。利用输入法完成文字的输入操作时，用户首先要输入该文字对应的字符串，然后在所产生的候选词列表中选择所需要的文字。对于在候选词列表中选择用户所需的字符的过程有以下两种情况如果该字符位于候选词列表第一页上时，用户只需按与该字符对应的数字序号来进行选择；如果该字符不在候选词列表中的第一页时，用户则需要按“ + ”或“_”来进行翻页查找，然后再输入该字符对应的数字序号来完成字符的输入。这种方法降低了用户文字输入的速度，特别是所需要输入的文字不在候选词列表中的第一页时，用户还要在完成翻页操作后对其进行选择。鉴于上述的输入法应用中的不足，本发明提供了一种语音协助字符输入的方法，利用该方法用户只需要语音输入字符对应的标识就完成了文字的输入。

发明内容
本发明的目的在于，提供一种借助于语音输入的方式来协助用户完成字符输入的方法和系统，利用本发明，用户通过语音输入标识，就能够在候选词列表中做出选择。一种语音协助字符输入的方法，该方法包括以下步骤步骤1，接收用户通过文字输入界面输入的字符串信息；步骤2，生成候选词列表，在候选词列表中每个候选词对应一个标识；步骤3，采集语音信息；步骤4，识别与标识相关联的语音信息；步骤5，调取与语音信息中的标识相对应的候选词进行输出。进一步，本发明所述的一种语音协助字符输入的方法还具有如下技术特征在步骤1或者步骤3之前，需要开启语音输入。语音输入的开启方式为设置快捷键、或者在输入界面设置语音开启按钮、或者在输入字符串时直接触发语音输入。所述的标识为数字、字母、拼音、文字中的至少其一或其组合。所述的语音信息包括候选词对应的标识，以及包括翻页指令在内的输入界面控制指令。针对于所述的步骤4，识别与标识相关联的语音信息时，还包括有如下步骤
XI，在显示有输入法界面且包括有的候选词列表的情况下，采集用户的语音信息；X2，将不包含有候选词标识的语音信息清除。针对于所述的步骤4，只有独立成段的包含有标识发音的语音信息，方采集为有效的用以确定候选词的标识信息。所述的判定发音内容是否标识信息的有效发音内容时，包括有如下判定步骤，Y1，在显示有输入法界面且包括有的候选词列表的情况下，采集用户的语音信息；Y2，判定发音内容是否包括有标识内容的发音；Y3，在具有标识内容发音的情况下，判断该发音时间段的前后间隔是否达到阈值要求；Y4，在达到阈值要求的情况下，判断为有效发音内容。一种语音协助字符输入的系统，其特征在于，该系统包括文字输入界面，它是用以输入字符串并且显示该字符串所匹配的候选词的操作面板；候选词生成模块，它用以生成与上述的文字输入界面上显示的字符串相对应的候选词列表的模块结构；标识模块，它与上述的候选词生成模块相连接，是对上述候选词列表中的候选词进行标注的模块结构；语音采集模块，它是用以接收用户所输入的语音信息的模块结构；语音识别模块，与上述的语音采集模块相关联，是识别与标识内容以及输入界面控制指令相关联的语音信息的模块结构；输出模块，它是用以调取与上述语音识别模块中识别出的标识内容相对应的候选词，并将其进行输出的模块结构。

图1-1是本发明的一种实施例的示意图，描述的是文字输入界面的形式。图1-2是本发明的一种实施例的示意图，描述的是用户利用语音协助输入文字的实现方式。图1-3是本发明的一种实施例的示意图，描述的是语音输入的开启方式为输入字符串时自动触发的实现方式。图1-4是本发明的另一种实施例的示意图，与图1-1相对应，描述的是在需要翻页操作时的语音协助输入文字的实现方式。图2是本发明所述方法的流程图。图3是本发明所述系统的结构示意图。
具体实施例方式针对于本发明主要功能的描述人们在利用输入法输入文字时，往往会遇到这样的情况比如，当输入的文字在候选词列表中的第一页时，用户直接按数字键完成文字输入操作；当输入的文字不在候选词列表中的第一页时，用户往往需要按“ + ”或者“_”键来进行翻页的查找，然后再输入该文字对应的数字标识。此时用户就需要有一种比较快捷的方法来完成翻页查找的功能，以此来代替按动翻页按键的操作以及选择字符的操作。本发明的作用，就是用语音协助的方法来代替手动选择候选词的操作。下面举例来进行描述参照图1-1、图1-2、图1-3和图1_4所示，描述了本发明的一种实施例。以拼音输入法来输入汉字为例，可以有如下形式的实施例。如图1所示，这里展示的是文字输入界面100的实现形式。它包括字符串输入区110、候选词列表区120、翻页按键130和语音开关按键140。除了语音开关按键140之外，其他三个部分组成的文字输入界面的结构形式在常用的输入法中是非常普遍的。其中的字符串输入区110是输入文字对应的拼音字符串的区域；候选词列表区120是用于显示与输入的拼音字符串相匹配的候选词的区域，在此候选词列表中的每个候选词都有一个标识与之相对应。下面以利用本发明对“是”字进行输入的实施方式为例，进行说明。如图1-2所示，用户所需要在字符串输入区110中输入“是”这个字对应的字符串，即“shi”。当然这只是针对于本实施例而言的，在具体的应用过程中，输入与一个词组或者一段话相对应的拼音字符串也是可以的。在常用的输入法中，都是用数字标识来区分每个候选词的，当然所述的标
识还可以采用其它的形式，这个是不作限定的，比如可以采用英文字母，如“A、B、C......”；
或者采用文字，如“甲、乙、丙、丁......”，或者采用拼音，如“ 、δ、 ......”，或者采用上述
标识的组合，如“？1、？2、？3......”。在本实施例中，在候选词列表中显示出“Α.是B.事
c.时D. Se.使”。为了完成文字的输入操作，还需要对候选词列表区120上显示出的字符进行选择，用户按动语音开关按键140后，进行语音输入所需要的字符在候选词列表区120 中对应的标识即可。在本实施例中，用户语音输入的文字“是”在候选词列表区120对应的标识“A”即可完成文字的输入。需要说明的是，语音输入的开启方式是不作任何限定的。语音输入的开启方式可以设置为按动快捷键的方式，比如设置快捷键“Ctrl+A”来开启语音输入。也可以在文字输入界面100上设置语音开关按键，当用户选择候选词时打开此按键，即可完成语音输入，这种方式在图1-2所示的实施例中已有说明。还有一种语音开启的方式，就是在系统中设置字符串输入触发的方式开启，也就是说只要输入字符串，这个语音输入就已经打开，当文字输入完毕后自动关闭。下面通过一个实施例对这种语音输入的开启方式进行说明。如图1-3所示，在本实施例中，用户需要输入“王”这个文字，当用户在字符串输入区110输入“wang”时，就会在字符串输区110显示出“语音已开启”的指示，然后就可以在候选词列表区120显示出与“wang”这个字符串对应的候选词，用户只需语音输入“5”，就能够在文档中显示出“王”这个字了，当用户完成“王” 这个字的输入后，语音输入自动关闭。这种语音输入开启的方式可以自动触发和自动停止，同时在进行字符输入时用户还可以与他人进行语言交流，而不会误认为是进行字符输入的操作。以上所述的是对于用户输入的文字位于候选词列表区120中第一页的情形，下面通过实施例说明一下字符不在候选词列表的第一页中是如何实现文字输入的。
如图1-4所示，展示的是需要进行翻页操作时的语音协助字符输入的实现方式。在本实施例中，用户需要输入“主使”这一个词组时，与图1-2描述的方式类似，首先要在字符串输入区110输入“zhushi”，根据输入的字符串生成候选词列表，此列表在候选词列表区120显示出来，对于本实施例在候选词列表120上显示出“1.注视 2.注释 3.主食 4.诸事5.主事”，在候选词列表中的第一页上没有出现“主使”这个词组，这时就需要翻页查看，常规的方法是利用“ + ”、“-”按键，翻页后再做选择。而根据本发明所述的方法中，只需要语音输入“下一页”，系统识别出这个指令后，显示下一页的候选词列表，在本实例中就会显示出“1.主使2.柱式3.柱石4.竹石5.猪食”，然后用户再输入语音信息“1” 后，就完成“主使”这个词组的输入了。结合着前面的描述，下面对本发明所实现的方法作进一步的描述。步骤1，接收用户通过文字输入界面输入的字符串信息。该步骤需要在文字输入界面中进行，所述的字符串信息，作为举例，为文字的拼音字符串。所述的字符串可以单个文字对应的字符串，或者是一个词组对应的字符串，还可以是一段文字对应的字符串。在图1-2的所示的实施例中，输入的“shi”是单个文字对应的字符串，而在图1-4中所示的实施例中，输入的“zhushi”是词组对应的字符串。在具体的应用过程中根据用户的需要来输入文字对应的字符串即可。另外，对于采用笔画进行输入的情况下来，各输入的笔画就是相应的字符串了。当然，对于不同的语言文字形式，有着不同的字符串表达方式。步骤2，生成候选词列表，在候选词列表中每个候选词对应一个标识。在该步骤中产生的候选词列表是根据上一个步骤中输入的字符串生成的，与此字符串形成的相同读音的候选词都排列在该候选词列表中。其中所述的标识的形式是多种多
样的，可以是数字，比如常规输入法中的“1、2、3......”或者“I、II、III......”；可以是字
母，比如采用英文字母，如“A、B、C......”，大小写都可以；可以是文字序号，如“甲、乙、丙、
丁......”，或者“一、二、三......”；可以是拼音，如“ 、δ、e......”，可以是上述标识中
某两个的组合，如“F1、F2、F3......，，。步骤3，采集语音信息。所述的语音信息包括候选词对应的标识和包括翻页指令在内的输入界面控制指令。这里所述的标识与上面描述的相同，而翻页指令是针对于所需字符不在候选词列表第一页显示的情况。这种情况下，用户除了要输入标识信息外，还需要语音输入“下一页”“上一页”、“确定”、“取消”等文字界面控制指令。步骤4，识别与标识相关联的语音信息。该步骤是对用户所输入的语音信息进行筛选识别的过程。这里所筛选的语音信息不仅仅是标识内容，而且还包括翻页指令等输入界面控制指令。如果用户在输入文字的同时还与其他人进行语言交流，那么这个识别过程就显得尤为重要。通过该步骤能够将不包含有候选词标识的语音信息清除。此外，针对于所述的步骤4，只有独立成段的包含有标识发音的语音信息，方可认为是有效的用以确定候选词的标识信息。判断此有效标识信息的步骤为Y1，在显示有输入法界面且包括有的候选词列表的情况下，采集用户的语音信息；Υ2，判定发音内容是否包括有标识内容的发音；Υ3，在具有标识内容发音的情况下，判断该发音时间段的前后间隔是否达到阈值要求；Y4，在达到阈值要求的情况下，判断为有效发音内容。步骤5，调取与语音信息中的标识相对应的候选词进行输出。该步骤是根据上述步骤中输入的标识信息，选择候选词列表中与之对应的候选词，并将其输出的过程。前面描述的为本发明中的方法，还包括与之对应的本发明所述的系统，该系统的描述如下一种语音协助字符输入的系统200，该系统包括文字输入界面210，它是用以输入字符串并且显示该字符串所匹配的候选词的操作面板；候选词生成模块220，它用以生成与上述的文字输入界面210上显示的字符串相对应的候选词列表的模块结构；标识模块230，它与上述的候选词生成模块220相连接，是对上述候选词列表中的候选词进行标注的模块结构；语音采集模块M0，它是用以接收用户所输入的语音信息的模块结构；语音识别模块250，与上述的语音采集模块240相关联，是识别与标识内容以及翻页指令相关联的语音信息的模块结构；输出模块沈0，它是用以调取与上述语音识别模块250中识别出的标识内容相对应的候选词，并将其进行输出的模块结构。以上是对本发明的描述而非限定，基于本发明思想的其它实施方式，均在本发明的保护范围之中。
权利要求
1.一种语音协助字符输入的方法，其特征在于，该方法包括以下步骤步骤1，接收用户通过文字输入界面输入的字符串信息；步骤2，生成候选词列表，在候选词列表中每个候选词对应一个标识；步骤3，采集语音信息；步骤4，识别与标识相关联的语音信息；步骤5，调取与语音信息中的标识相对应的候选词进行输出。
2.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于在步骤1或步骤3之前，需开启语音输入。
3.根据权利要求2所述的一种语音协助字符输入的方法，其特征在于语音输入的开启方式为设置快捷键，或者在输入界面设置语音开启按钮，或者在输入字符串时直接触发语音输入。
4.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于所述的标识为数字、字母、拼音、文字中的至少其一或其组合。
5.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于所述的语音信息包括候选词对应的标识，以及包括翻页指令在内的输入界面控制指令。
6.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于针对于所述的步骤4，识别与标识相关联的语音信息时，还包括有如下步骤，XI，在显示有输入法界面且包括有的候选词列表的情况下，采集用户的语音信息； X2，将不包含有候选词标识的语音信息清除。
7.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于针对于所述的步骤4，只有独立成段的包含有标识发音的语音信息，方采集为有效的用以确定候选词的标识fe息。
8.根据权利要求1所述的一种语音协助字符输入的方法，其特征在于所述的判定发音内容是否标识信息的有效发音内容时，包括有如下判定步骤，Yl，在显示有输入法界面且包括有的候选词列表的情况下，采集用户的语音信息； Y2，判定发音内容是否包括有标识内容的发音；Y3，在具有标识内容发音的情况下，判断该发音时间段的前后间隔是否达到阈值要求；Y4，在达到阈值要求的情况下，判断为有效发音内容。
9.一种语音协助字符输入的系统，其特征在于，该系统包括文字输入界面，它是用以输入字符串并且显示该字符串所匹配的候选词的操作面板；候选词生成模块，它用以生成与上述的文字输入界面上显示的字符串相对应的候选词列表的模块结构；标识模块，它与上述的候选词生成模块相连接，是对上述候选词列表中的候选词进行标注的模块结构；语音采集模块，它是用以接收用户所输入的语音信息的模块结构；语音识别模块，与上述的语音采集模块相关联，是识别与标识内容以及输入界面控制指令相关联的语音信息的模块结构；输出模块，它是用以调取与上述语音识别模块中识别出的标识内容相对应的候选词，并将其进行输出的模块结构。
全文摘要
本发明提供了一种语音协助字符输入的方法及系统，属于计算机技术领域。该方法包括如下步骤步骤1，接收用户通过文字输入界面输入的字符串信息；步骤2，生成候选词列表，在候选词列表中每个候选词对应一个标识；步骤3，采集语音信息；步骤4，识别与标识相关联的语音信息；步骤5，调取与语音信息中的标识相对应的候选词进行输出。本发明所述的系统由文字输入界面、候选词生成模块、标识模块、语音采集模块、语音识别模块和输出模块组成。利用该系统，在用户输入字符串后的选择候选词的操作都有输入的语音信息来替代，减少了操作麻烦，能够借助于语音方便快捷地完成字符的输入操作。
文档编号G06F3/048GK102541252SQ20101060533
公开日2012年7月4日申请日期2010年12月26日优先权日2010年12月26日
发明者马宇尘申请人:上海量明科技发展有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马宇尘
技术所有人：上海量明科技发展有限公司
我是此专利的发明人

上一篇：一种复杂端面圆管的逆向建模方法
上一篇：一种实现字符混合输入的方法及系统的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。