带标识码输入的语音输入法的制作方法

文档序号：6399715阅读：228来源：国知局

专利名称：带标识码输入的语音输入法的制作方法
技术领域：
本发明涉及输入法领域，具体涉及一种混合语音输入法。
背景技术：
文字输入作为我们与电脑、手机等设备的交互方式，输入速度的快慢影响了我们办公等效率的高低。键盘及手机虚拟键盘的字符是英语字符，这对于非英语的输入造成了一定阻碍。输入法发展至今，汉语通过键盘输入已发展出拼音、全拼、五笔等多种输入法，并有联想输入功能，以及通过音频输入的语音输入法及通过笔迹辩认的手写输入法。但以上几种输入法都存在不足，拼音及全拼输入法由于汉语的一音多字情况，需要输入拼音字符后再对多个候选汉字进行选择，词组及整句的拼音输入由于语言习惯的不同也需要对候选字进行选择；五笔及区域码输入虽准确性高但需要大量记忆工作，熟练使用的人并不多，而且五笔对于整句的输入支持性不高；手写输入比较慢，而且各人的手写习惯不同，对于手写字的识别正确率也不高；语音输入速度快，但依然存在识别正确率不高的情况。便随着智能手机的普及，如何才能实现在无实体键盘支持的智能手机上进行快速输入，虚拟键盘的打字输入速度明显不及实体键盘的速度快，而手写输入依然存在着速度慢、识别率不高的问题，语音输入也受困于识别率。而且现阶段的混合输入法并未将各种输入法之间进行优化，而是将输入字符的各种组合进行罗列，用户还得对候选字词进行选择，输入效率并没有提升。

发明内容
针对上述缺陷，本发明提供一种带标识码输入的以汉语为主的语音输入法及其他基于相同原理的输入法。在确保输入速度的基础上大大提升识别的准确率。而且此输入法是在已有语音、手写等输入法的基础上进行提升，使用者只需记住简单的输入规则后，不需要另外进行学习，既熟悉并掌握此输入法，提升输入的速度。语音输入识别的过程一般如图1所示，可以大体归结为采样、预处理、特征提取、识别及后处理环节，基本流程都是在特征提取后，在识别环节与语音库进行对比通过算法得到识别结果。本输入法在识别环节中或者之后加入通过标识码对识别结果进行筛选的过程，再输出最佳方案及备选方案。本发明是通过以下技术方案实现的:带标识码输入的语音输入法是通过以语音输入法等输入法作为主输入方式(简称主输入)，以基于另一种输入法(如五笔、笔画等)进行简化后作为辅助输入方式(简称辅输入)，进行输入时主输入和辅输入同时进行，主输入和辅输入之间允许有一定时间差。输入完毕后，系统对主输入的语音进行识别，如需必要对辅输入的标识码进行识别，对主输入的识别结果通过标识码进行筛选，如需必要对筛选结果进行处理后，将最终处理结果显示到屏幕。

图1为语音识别的基本流程示意2为本发明一种实施例的结构示意图图3为本发明一种实施例的结构示意图图4为本发明一种实施例的结构示意图图5为本发明一种实施例的结构不意图
具体实施例方式本发明可以通过以下几种实施方案进行实施:
实施方案I，参照图2,此实施方案是以汉语语音输入方式为主输入,对于主输入输入信息的分析处理方法在除后处理环节以外的环节与单独使用语音输入方式输入的分析处理方法相同，不同之处是在后处理环节加入了通过辅输入标识码对识别结果进行筛选的步骤；以汉语笔画手写输入方式为辅输入，因为辅输入仅作为标识码使用，而不单独拿出来作为判断输入信息的依据，所以在输入时不需要将一个字的每一笔都进行手写输入，而只需要将输入信息的每一个字的第一笔依次手写输入即可(为提高准确率，可以要求输入每一个字的前N笔，其中N为大于O的自然数。)，辅输入的输入内容为点，横，竖，撇，捺，横折，竖折，撇折，横折弯钩，竖折勾等几种，对辅输入的手写输入信息进行识别仅需识别出各单独笔画(如果要求的是输入前N笔，则需要各识别N个笔画)，比手写汉字输入的识别容易，准确率高。在进行主输入语音输入的同时，辅输入同步进行输入，主输入和辅输入的开始输入时间点允许有时间差，主输入和辅输入的结束输入时间点允许有时间差，但是如果时间点间隔时间太长会影响输入的效率。输入时，可以以一句话为处理间隔，或者以词为处理间隔，或者以单个字为处理间隔，处理间隔为用户输入一次信息到系统显示该输入信息的过程。辅输入的手写笔画输入可以是在手写区域内从左到右、或从右到左、或从上到下、或从下到上并允许换行输入的方式进行输入，系统判断前后输入之间的距离来区分各标识码，或允许在手写区域内任何位置进行输入而系统对前后输入的时间间隔或是否离开屏幕等标识或动作来区分各标识码，也可以给定多个手写框让用户依次输入各标识码等多种方式来区分前后输入的标识码。

主输入和辅输入都完成后，系统对主输入语音信息进行识别，对辅输入的手写输入进行识别，并对主输入的识别结果在后处理环节通过辅输入的识别结果进行筛选。最后将筛选后的结果显示到屏幕。以输入“试泳装”为例说明此方案如下:通过主输入输入“试泳装”语音信息的同时，通过辅输入在触摸屏上依次写下这几个字的第一笔画，依次为“点、点、点”。对主输入的语音进行特征提取及识别等过程，对辅输入的笔画输入进行识别，识别结果为“点、点、点”。没有辅输入的情况下，识别及输出的结果可能如下:“最优结果是试用装，候选结果依次为式泳装、试泳装、适用状……”，还需要要用户对以上候选结果进行选择，而通过在对语音识别后的环节用辅输入识别出的标识码对语音识别结果进行筛选，只有“试泳装”选项符合“点、点、点”的情况，则将“试泳装”作为最优结果给出，其余符合识别码的结果作为备选结果给出。在用标识码对识别结果进行筛选时，可以根据需要采取以下两种方案:只允许符合标识码的识别结果作为最优结果和候选结果；不符合标识码的识别结果不可以作为最优结果，但可以作为候选结果。
由于用户的手写习惯不同，比如“入”字，有人先写撇，也有人先写捺，在对此类字进行筛选时，可以设置为标识码为撇或者捺的时候，“入”字都符合条件，其他类似情况同此例。由于对于辅输入的输入信息识别时会出现误差，比如输入捺过短时，可以被识别为点或者捺，则首笔画为点或者捺的进行筛选时都符合条件，其他类似情况同此例。实施方案2，参照图3，此实施方案为与实施方案I类似，未详细说明部分请参照实施方案I。以汉语语音输入方式为主输入；以给定汉语笔画进行选择为辅输入，辅输入包含以下方式但不限于以下方式:将汉语笔画对应到键盘上的部分键位上，允许用户通过按键进行依次输入，如点、横、竖、撇、捺、横折等分别对应1、2、3、4、5、6等各数字键或对应其他键；将汉语笔画对应到虚拟键盘上的部分键位上，允许用户通过触屏进行选择；将汉语笔画作为虚拟键布局在屏幕上，允许用户通过触屏点击或鼠标点选或鼠标滑过等方式进行选择。为方便用户，可以将多个形状相似或类型相同的笔画整合在一个键位或虚拟键位(简称键)上，例如将横折和横折钩整合在一个键上，或将横折和竖折整合在一个键上，或将点和捺整合在一个键上，或将横撇和横整合在一个键上等。也可以要求用户输入前N笔。在进行主输入语音输入的同时，辅输入同步进行选择输入或者键入，主输入和辅输入的开始输入时间点允许有时间差，主输入和辅输入的结束输入时间点允许有时间差。主输入和辅输入都完成后，系统对主输入语音信息进行识别。对主输入的识别结果用辅输入的标识码进行筛选。最后将筛选后的结果显示到屏幕。举例说明此方案如下:通过主输入输入“试泳装”语音信息的同时，通过辅输入键入“点、点、点”所在的键位(比如1、1、I)，或点选屏幕上“点”对映的虚拟键等。没有辅输入，识别及输出的结果可能如下:“最优结果是试用装，候选结果依次为式泳装、试泳装、适用状……”，还需要用户对以上候选结果进行选择，而通过在识别后的后处理环节用辅输入的标识码对识别结果进行筛选，只有“试泳装”选项符合“点、点、点”的情况，则将“试泳装”作为最优结果给出，其余符合识别码的结果作为备选结果给出。在用标识码对识别结果进行筛选时，可以根据需要采取以下两种方案:只允许符合标识码的识别结果作为最优结果和候选结果；不符合标识码的识别结果不可以作为最优结果，但可以作为候选结果。由于用户的手写习惯不同，比如“入”字，有人先写撇，也有人先写捺，在对此类字进行筛选时，可以设置为标识码为撇或者捺的时候，“入”字都符合条件。其他类似情况同此例。实施方案3，参照图3，此实施方案为与实施方案I类似，未详细说明部分请参照实施方案I。以汉语语音输入方式为主输入；以给定汉语字形结构选择为辅输入，辅输入包含以下方式但不限于以下方式:将汉语字形结构对应到键盘上的部分键位上，允许用户通过按键进行依次选择，如独体字、左右结构、上下结构、左中右结构、上中下结构、内外结构等分别对应1、2、3、4、5、6等各数字键或对应其他键；将汉语字形结构对应到虚拟键盘上的部分键位上，允许用户通过触屏进行选择；将字形结构作为虚拟键布局在屏幕上，允许用户通过触屏点击或鼠标点选或鼠标滑过等方式进行选择。为方便用户，可以将多个相似的字形结构整合在一个键位或虚拟键位(简称键)上，例如将左右结构和左中右结构整合在一个键上，或将独体字和内外结构整合在一个键上等。在进行主输入语音输入的同时，辅输入同步进行输入，主输入和辅输入的开始输入时间点允许有时间差，主输入和辅输入的结束输入时间点允许有时间差。主输入和辅输入都完成后，系统对主输入语音信息进行识别。对主输入的识别结果用辅输入的标识码进行筛选。最后将筛选后的结果显示到屏幕。举例说明此方案如下:通过主输入输入“试泳装”语音信息的同时，通过辅输入键入“左右结构、左右结构、上下结构”所在的键位(比如2、2、3)，或点选屏幕上各字形结构对映的虚拟键等。没有辅输入，识别及输出的结果可能如下:“最优结果是试用装，候选结果依次为式泳装、试泳装、适用状……”，还需要用户对以上候选结果进行选择，而通过在识别后的后处理环节用辅输入的标识码对识别结果进行筛选，只有“试泳装”选项符合“左右结构、左右结构、左右结构”的情况，则将“试泳装”作为最优结果给出，其余符合识别码的结果作为备选结果给出。在用标识码对识别结果进行筛选时，可以根据需要采取以下两种方案:只允许符合标识码的识别结果作为最优结果和候选结果；不符合标识码的识别结果不可以作为最优结果，但可以作为候选结果。实施方案4，参照图3，此实施方案为与实施方案I类似，未详细说明部分请参照实施方案I。以汉语语音输入方式为主输入；以给定汉语偏旁、字根或五笔等输入法为辅输入，使用偏旁、字根或五笔等输入法在键盘上的布局或在虚拟键盘上的布局。在进行主输入语音输入的同时，辅输入同步进行输入，主输入和辅输入的开始输入时间点允许有时间差，主输入和辅输入的结束输入时间点允许有时间差。主输入和辅输入都完成后，系统对主输入语音信息进行识别。对主输入的识别结果用辅输入的标识码进行筛选。最后将筛选后的结果显示到屏幕。举例说明此方案如下:通过主输入输入“试泳装”语音信息的同时，通过辅输入键入这三个字对应的偏旁、字根或五笔等输入法的第一个键(可以为前N个键，N为大于零的整数)作为标识码。主输入识别结果可能如下:“试用装、式泳装、试泳装、适用状……”，用辅输入的标识码对识别结果进行筛选，将结果输出。在用标识码对识别结果进行筛选时，可以根据需要采取以下两种方案:只允许符合标识码的识别结果作为最优结果和候选结果；不符合标识码的识别结果不可以作为最优结果，但可以作为候选结果。实施方案5，此实施方案是以汉语手写输入方式为主输入；以汉语语音输入方式为辅输入。在进行主输入手写输入的同时，辅输入语音同步进行输入，主输入和辅输入的开始输入时间点允许有时间差，主输入和辅输入的结束输入时间点允许有时间差，但是如果时间点间隔时间太长会影响输入的效率。输入时，可以以一句话为处理间隔，或者以词为处理间隔，或者以单个字为处理间隔，处理间隔为用户输入一次信息到系统显示该输入信息的过程。主输入和辅输入都完成后，系统对主输入手写信息进行识别，对辅输入的语音信息进行识别，并对主输入的识别结果的读音过辅输入的识别结果进行对比筛选。并将筛选结果给出O实施方案6,参照图4,此实施方案是以汉语语音输入方式为主输入；以汉语笔画手写输入方式为辅输入，因为辅输入仅作为标识码使用，而不单独拿出来作为判断输入信息的依据，所以在输入时不需要将一个字的每一笔都进行手写输入，而只需要将输入信息的每一个字的第一笔依次手写输入即可(为提高准确率，可以要求输入每一个字的前N笔，其中N为大于O的自然数。)，辅输入的输入内容为点，横，竖，撇，捺，横折，竖折，撇折，横折弯钩，竖折勾等几种，对辅输入的手写输入信息进行识别仅需识别出各单独笔画(如果要求的是输入前N笔，则需要各识别N个笔画)，比手写汉字输入的识别容易，准确率高。举例说明此方案如下:通过主输入输入“使用混合输入法适用于触摸屏设备”语音信息的同时，通过辅输入在触摸屏上依次写下这几个字的第一笔画，依次为“撇、撇、点、撇、横、捺、点、撇、撇、横、撇、横、横折、点、撇”，主输入和辅输入完成后系统对主输入语音信息进行识别，过程如下但不限于以下顺序:a，对辅输入的笔画进行分析，判断依次为“撇、撇、点、撇、横、捺、点、撇、撇、横、撇、横、横折、点、撇”;b，对主输入的语音信息进行分析后，判断输入信息为 “shi yong hun he shu ru fa shi yong yu chu mo ping she bei，，的拼音组合；c，查找备选字，如“shi”的备选字为“市、是、时、使、士、式、事、十、始、示、适”等多个同音字，而可以通过对音调的判断进一步缩小备选字的范围，鉴于各地方言的原因可以将“Si”等相近发音纳入备选字范围；d，通过辅输入法输入的信息对备选字进行筛选，书写时第一笔为撇的保留如下“使”等，在此步骤中可以根据不同人的书写习惯不同，将“始”保留；e，对于主输入法输入的信息依次进行c，d步骤，筛选备选字，以此为例，剩下的备选字依次为“使、始”、“用、佣”、“混、浑、阍”、“和、何、合、盒、禾”、“输、述、梳、抒”、“入”、“法”、“适、氏、饰”、“用、佣”、“于、瑜”、“处、触、僖”、“摸、茉”、“屏”、“设、社、涉”、“备、倍、钡”;f，对剩下的备选字就组词习惯、搭配习惯与词库进行对比判断，将最终的最优搭配方案“使用混合输入法适用于触摸屏设备”输出到屏幕，如果有备选搭配方案，搭配方案按照组词、搭配等习惯排列输出到屏幕以备选择。在用标识码对识别结果进行筛选时，可以根据需要采取以下两种方案:只允许符合标识码的识别结果作为最优结果和候选结果；不符合标识码的识别结果不可以作为最优结果，但可以作为候选结果。由于用户的手写习惯不同，比如“入”字，有人先写撇，也有人先写捺，在对此类字进行筛选时，可以设置为标识码为撇或者捺的时候，“入”字都符合条件，其他类似情况同此例。由于对于辅输入的输入信息识别时会出现误差，比如输入捺过短时，可以被识别为点或者捺，则首笔画为点或者捺的进行筛选时都符合条件，其他类似情况同此例。实施方案7,参照图5,此实施方案是以汉语语音输入方式为主输入；以对候选汉语笔画进行选择为辅输入，辅输入的使用方式是通过将笔画与键盘部分键对映或在屏幕上出示包含笔画信息的虚拟键的方式进行的，与实施方案2中辅输入的实施方式相同。举例说明此方案如下:通过主输入输入“使用混合输入法适用于触摸屏设备”语音信息的同时，通过辅输入键入或者选择各字第一笔画对应的键或虚拟键等，依次为“撇、撇、点、撇、横、捺、点、撇、撇、横、撇、横、横折、点、撇”，主输入和辅输入完成后系统对主输入语音信息进行识别，过程如下但不限于以下顺序:a，对主输入的语音信息进行分析后，判断输入信息为 “shi yong hun he shu ru fa shi yong yu chu mo ping she bei，，的组合；b,查找备选字，如“shi”的备选字为“市、是、时、使、士、式、事、十、始、示、适”等多个同音字，而可以通过对音调的判断进一步缩小备选字的范围，鉴于各地方言的原因可以将“Si”等相近发音纳入备选字范围；c，通过辅输入法输入的信息对备选字进行筛选，书写时第一笔为撇的保留如下“使”等，在此步骤中可以根据不同人的书写习惯不同，将“始”保留；d，对于主输入法输入的信息依次进行b，c步骤，筛选备选字，以此为例，剩下的备选字依次为“使、始”、“用、佣”、“混、浑、阍”、“和、何、合、盒、禾”、“输、述、梳、抒”、“入”、“法”、“适、氏、饰”、“用、佣”、“于、瑜”、“处、触、僖”、“摸、茉”、“屏”、“设、社、涉”、“备、倍、钡”;e，对剩下的备选字就组
词习惯、搭配习惯与词库进行对比判断，将最终的最优搭配方案“使用混合输入法适用于触摸屏设备”输出到屏幕，如果有备选搭配方案，搭配方案按照组词、搭配等习惯排列输出到屏幕以备选择。实施方案8,参照图5,此实施方案是以汉语语音输入方式为主输入；以对候选汉语字形结构进行选择为辅输入，辅输入的使用方式是通过将字形结构与键盘部分键对映或在屏幕上出示包含字形结构的虚拟键的方式进行的，与实施方案3中辅输入的实施方式相同，辅输入输入方式不再说明。举例说明此方案如下:通过主输入输入“使用混合输入法适用于触摸屏设备”语音信息的同时，通过辅输入键入或者选择各字字形结构对映的键或虚拟键，依次为“左右、独体、左右、上中下(上下)、左右、独体、左右、半包围、独体、独体、左右、左右、半包围、左右、上下”，主输入和辅输入完成后系统对主输入语音信息进行识别，过程如下但不限于以下顺序:a,对主输入的语音信息进行分析后,判断输入信息为“shi yong hun he shu ru fa shiyong yu chu mo ping she bei”的组合；b,查找备选字,如“shi”的备选字为“市、是、时、使、士、式、事、十、始、示、适”等多个同音字，而可以通过对音调的判断进一步缩小备选字的范围，鉴于各地方言的原因可以将“Si”等相近发音纳入备选字范围；c，通过辅输入法输入的信息对备选字进行筛选，是左右结构的保留如下“使、时、始”等；d，对于主输入法输入的信息依次进行b，c步骤，筛选备选字；e，对剩下的备选字就组词习惯、搭配习惯与词库进行对比判断，将最终的最优搭配方案“使用混合输入法适用于触摸屏设备”输出到屏幕，如果有备选搭配方案，搭配方案按照组词、搭配等习惯排列输出到屏幕以备选择。在以上各方案进行实施时，有以下说明:
a，进行识别时所用到的语音库、手写库等可以保存在互联网上或者在用户所使用的设备上；
b，用户的词库等可以具备用户输入用词习惯统计功能；
C，输出时可以有联想功能，通过用户的词库结合用户输入用词习惯给出候选词；
山各种中文语音输入法的流程大致相同或稍有差异，各流程的命名方式可能不同，但前5种实施方案均为在对主输入的语音信息进行识别处理后，再对其通过标识码进行筛选，这几种方案的语音库比较庞大，可以采取将语音库放到网络上通过网络传输输入语音或者语音特征进行识别后，再返回用户使用设备的方式，因此对于通过辅输入的标示符对识别信息进行筛选时，可以在网络上进行筛选将筛选结果返回用户使用设备，或者识别结果返回用户使用设备后再进行筛选；
e,实施方案6、7、8的实施方式与现有语音输入法的识别方式略有不同，实施方案6、7、8可以对输入语音信息就单个字的读音为单位进行识别筛选，在筛选后再对各读音下符合筛选条件的字之间搭配通过词库进行对比识别，输出最优搭配方案和备选搭配方案，所需要的语音库比前5个实施方案小，更便于将语音库放在用户设备上进行识别，也可以通过网络如前5个实施方案一样进行识别；
f，本发明的实施方案中仅对汉语部分的实施进行说明，而英语字母及阿拉伯数字的输入虽然语音输入时需同时进行辨识，由于字符数量少、输入笔画简单，大多可以在3画以内完成或以连笔方式实现，在实施时输入英文字母及阿拉伯数字的标识码时可以直接手写英文字母及阿拉伯数字，或在实体键盘上直接键入，或在虚拟键盘上单独列出其区域的方式进行操作，在通过标识码进行筛选时，直接将标识码所代表的英文字母及阿拉伯数字作为最优方案或最优方案的组成部分输出，在此不进行其实施方案的详细说明；
g，如果用户在使用移动设备进行主输入并因某些情况无法进行辅输入时，系统则可单独通过主输入的输入法对输入信息进行识别，而不通过辅输入的标识码进行筛选，这种情况下对输入的识别率相比有辅输入输入的情况下会降低。
权利要求
1.一种带标识码输入的语音输入法，其特征在于，以汉语语音输入法作为主输入方式，以非语音输入方式作为辅输入方式，两种输入方式共同进行的混合输入法。
2.根据权利要求1所述的一种带标识码输入的语音输入法，其特征在于，在对主输入的语音进行识别，通过辅输入输入的标识码对主输入的识别结果进行筛选。
3.根据权利要求2所述的一种带标识码输入的语音输入法，其特征在于，不符合筛选条件的结果可以保留。
4.根据权利要求2所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以为笔画输入。
5.根据权利要求3所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以为笔画输入。
6.根据权利要求5所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以为笔画手写输入，在对辅输入的输入信息进行识别后的笔画信息作为标识码。
7.根据权利要求4所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以为对给定笔画对应的虚拟键进行选择的方式。
8.根据权利要求2所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以为汉字字形结构。
9.根据权利要求8所述的一种带标识码输入的语音输入法，其特征在于，辅输入可以是对给定汉字字形结构对应的虚拟键进行选择的方式。
10.一种带标识码输入的语音输入法，其特征在于，以手写输入作为主输入方式，以语音输入方式作为辅输入方式，通过将对主输入识别后的信息的读音与辅输入输入的语音进行对比来对主输入识别结果进行筛选。
全文摘要
针对现有语音输入法的识别率不高的问题，发明带标识码输入的语音输入法，此输入法是通过以语音输入法等输入法作为主输入方式(简称主输入)，以基于另一种输入法(如五笔、笔画等)进行简化后作为辅助输入方式(简称辅输入)，进行输入时主输入和辅输入同时进行，主输入和辅输入之间允许有一定时间差。输入完毕后，系统对主输入的语音进行识别，如需必要对辅输入的标识码进行识别，对主输入的识别结果通过标识码进行筛选，如需必要对筛选结果进行处理后，将最终处理结果显示到屏幕。
文档编号G06F3/16GK103218199SQ20131005924
公开日2013年7月24日申请日期2013年2月26日优先权日2013年2月26日
发明者马骏申请人:马骏

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：马骏
技术所有人：马骏
我是此专利的发明人

上一篇：在电子设备的日历中提供视频链接的方法及系统的制作方法
上一篇：一种中断事件处理方法和处理设备的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。