语音输入结合新首识别的汉字一键输入法及其键盘的制作方法

文档序号:6566978阅读:403来源:国知局
专利名称:语音输入结合新首识别的汉字一键输入法及其键盘的制作方法
技术领域
本发明涉及一种语音输入结合部首识别的汉字一键输入法及其键盘。
目前使用的键盘编码输入汉字的方法大致可分为三大类音码、形码、音形结合码,其中形码是根据汉字的字形和笔画特征来编码;音码是根据汉字的读音特征尤其是其汉语拼音的拼写特征来编码输入;音形结合码是综合了汉字的笔画特征和读音特征的编码和输入方法。另外还有一种通过声音输入设备输入语音再由计算机根据上下文的文义模糊判断的汉字输入法。键盘输入法不可避免地存在记忆量大和重码率高、输入效率低之间难以调和的矛盾;语音输入法虽然不需要记忆字根,操作简单,重码的判断也由计算机根据上下文的文义模糊判断,但语音输入的错误率较高,并且要改正文本中的错别字也比较麻烦。申请号为9710897.4的中国专利申请公开了一种名称为“基于读音的汉字输入方法”的汉字输入法,该输入法抽取并编码汉字的读音、首部及尾部的笔画组合,读音直接以拼音首字母编码,首部及尾部笔画组合由其组成字元或字元字所对应的字母编码。这种汉字输入法虽然结合了汉字的读音和笔画特征,但汉字的读音特征仍然需要用键盘输入,仍存在编码量大、工作量大的缺陷。
本发明的目的是提供一种记忆量小、操作方便、错误率低的语音输入结合部首识别的汉字一键输入法及其键盘。
为达到上述目的,本发明采用的技术方案如下本发明所述的一种语音输入结合部首识别的汉字一键输入法是根据汉字的字根特征和读音特征输入汉字的一种汉字输入法,通过键盘输入汉字的字根特征,所述的汉字的读音特征是通过声音输入设备输入的音频信号。
作为对本发明的语音输入结合部首识别的汉字一键输入法的进一步的改进,所述读音特征是汉语拼音所能表示的汉字的发音。
作为对本发明的语音输入结合部首识别的汉字一键输入法的更进一步的改进,所述字根特征是标准汉字偏旁部首。
作为对本发明的语音输入结合部首识别的汉字一键输入法的更进一步的改进,当输入的音频信号不足以区分不同的汉字的读音特征时,可以通过键盘输入表示其发音的符号。
作为对本发明的语音输入结合部首识别的汉字一键输入法的更进一步的改进,从每一种读音特征的汉字中选出1-2个汉字,不论其字根特征如何,通过一特别键输入代表其字根特征的代码。
本发明所述的语音输入结合部首识别的汉字一键输入法的键盘是将标准汉字的偏旁部首按照如下规则将其分布在键盘的字母的键位上1)当不同的偏旁部首所涉及的汉字中无同音字时,将其设置在同一键位上。2)当不同的偏旁部首所涉及的汉字中有2-3个同音字且偏旁部首的形状相近似时,可以将其设置在同一键位上。
作为对本发明所述的语音输入结合部首识别的汉字一键输入法的键盘的进一步改进,可以将标准汉字的偏旁部首如下分布在26个键位上Q一丶二W乙(乛、乚、
)十、工丨、丿、卜、()、 厂、广E匚、冂、凵R亻、人(入)、八(丷)刂、刀(ク)、力 勹、儿、几T亠、冫Y讠(言)冖、宀、 卩、阝、
U厶、又(
)、廴、辶 I扌士、土 艹O寸、廾、大、尢、弋P口、囗小()、忄() 山、巾、彐(
)A彳、彡、爿(丬)S氵饣(食)、门(門)尸、户、己(已)、弓、子(孑)、D女F纟、巛、幺马(馬)、鸟(鳥) 王G木H戈、比、瓦、止、攴韦(犬)、歹、车(車) 日(曰)J贝、见(見)K气、攵、片、斤、爪(爫)、父牛(牜、 )、毛、手 月( )L欠、风、殳、方、文Z斗、灬、心水、火 礻(示)、衤(衣)X聿(肀、 )、毋(母) C龙、业、目、田、皿、罒石 钅(金)V矢、禾、白、瓜、用、艮( ) B虫疒、立、穴、皮、矛、疋( ) 页、缶、竹()N其它6划 M8划及8划以上所有7划作为对本发明的语音输入结合部首识别的汉字一键输入法的键盘的进一步改进,该键盘上设置有汉字字根的键位是单键帽三态按键,即一个键帽下有两个轻触开关,使用时可以通过按压键帽的不同部位,使两个轻触开关处于或同时闭合或分别闭合的三种状态。
采用上述技术方案后,本发明所述的语音输入结合部首识别的汉字一键输入法及其键盘根据汉字的读音特征和字根特征输入汉字,其中读音特征是通过声音输入设备输入的音频信号,由于汉字都是单音节字,而汉字的读音具有多样性,输入了读音特征后只要再输入少量的字根特征就可以确定相应的汉字,记忆量小、操作方便、错误率低。
下面结合附图
和实施例进一步说明本发明。
附图是本发明所述的语音输入结合部首识别的汉字一键输入法的键盘的一个实施例的字根分布示意图。
本发明所述的语音输入结合部首识别的汉字一键输入法是根据汉字的字根特征和读音特征输入汉字的一种汉字输入法,通过键盘输入汉字的字根特征,所述的汉字的读音特征是通过声音输入设备输入的音频信号。在本实施例中代表读音的汉字的集合是根据汉语拼音所表示的不同汉字的发音将汉字划分成的不同的汉字的集合。根据商务印书馆1980年印刷发行的修订第5版《新华字典》中记载,若不考虑其读音的音调,可以通过汉语拼音表示的汉字的不同读音共有417种,即任何一个汉字的读音都可以归纳为这417种读音中的一种,现有的声音的接收设备完全可以区分这417种不同的音频信号,计算机根据接收到的音频信号就可以确定需要输入的汉字是属于417个汉字集合中的哪一个;若需要区分不同的音调,则存在1668种读音,现有的计算机技术也完全可以准确区分,但考虑到操作者在实际使用时的情况,本实施例中对读音的音调不作考虑,仅区分417种不同的读音。
本实施例中代表字根的汉字的集合是根据标准汉字偏旁部首将汉字划分成的不同的汉字的集合。同样根据商务印书馆1980年印刷发行的修订第5版《新华字典》中记载的汉字的偏旁部首共有213种,但常用的偏旁部首是5划以下的,6划及6划以上的偏旁部首多为不常用或繁体字的偏旁部首,5划以下的偏旁部首共有138个,根据汉字笔画的多少将这138个偏旁部首安排在与26个英文字母对应的26个键位上,每一键位上可以安排2组偏旁部首,当不同的偏旁部首所涉及的汉字中无同音字时,将其设置在同一键位上,当不同的偏旁部首所涉及的汉字中仅有2-3个同音字且偏旁部首的形状相近似时,可以将其设置在同一键位上。这样26个键位一共可以安排52组。在读音不相同的前提下,可以按照上述规则将不同的偏旁部首安排在同一组,而且为了便于记忆尽可能将形状相近似的偏旁部首安排在一起,例如“匚”、“冂”、“凵”虽然是不同的偏旁部首,但它们所包含的汉字及其读音为区(qu)、匹(pi)、巨(ju)、叵(po)、匝(za)、匜(yi)、医(yi)、匡(kuang)、匠(jiang)、匣(xia)、匦(gui)、匼(ke)、匿(ni)、匪(fei)、匮(kui)、匾(bian)、赜(ze)、有(mao)、冈(gang)、内(nei)、丹(dan)、册(ce)、冉(ran)、再(zai)、同(tong)、网(wang)、肉(rou)、冏(jiong)、罔(wang)、凶(xiong)、击(ji)、凸(tu)、出(chu)、凹(ao)、凼(dang)、画(hua)、函(han)、幽(you)、凿(zao)、凿(zuo),通过分析可见上述不同偏旁部首的汉字不存在相同读音的情况(虽然“匜(yi)”和“医(yi)”读音相同,但它们是属于相同的偏旁部首,是不可避免的重码,网(wang)和罔(wang)的情况相同),不会因为将“匚”、“冂”、“凵”安排在一起而使重码率升高或无法识别,同时又由于它们的形状相近,便于记忆,又都是三划的偏旁部首,所以可以将它们划分在同一组;使用频率高的偏旁部首单独作为一组,按照上述规则无法归到其它组的6划的偏旁部首单独作为一组,所有7划的偏旁部首单独作为一组,8划及8划以上的偏旁部首使用频率极低,可以共同构成一组。这样可以将全部213种偏旁部首分成如下的52组1一丶二2丨、丿、卜、()、3乙(乛、乚、
)十、工4厂、广5匚、冂、凵6刂、刀(ク)、力7亻、人(入)、八(丷)8勹、儿、几9亠、冫10冖、宀、11讠(言)12卩、 阝、
13厶、又(
)、廴、辶、14士、土15扌16艹17寸、廾、大、尢、弋18小()、忄()19口、囗20山、巾、彐(
)21彳、彡、爿(丬)22饣(食)、门(門)23氵24尸、户、己(已)、弓、子(孑)、25女26马(馬)、鸟(鳥)27纟、巛、幺28王29木30韦(犬)、歹、车(車)31戈、比、瓦、止、攴32日(曰)33贝、见(見)34牛(牜、 )、毛、手35气、攵、片、斤、爪(爫)、父36月 37欠、风、殳、方、文38水、火39斗、灬、心40礻(示)、衤(衣)41聿(肀、 )、毋(母)42石43龙、业、目、田、皿、罒44钅(金)45矢、禾、白、瓜、用、艮(
)46疒、立、穴、皮、矛、疋(
)47虫48页、缶、竹()49其它6划50所有7划518划及8划以上52最低频字上述52组两两一组如下设置在键盘上的字母键上Q第1组 W第3组第2组 第4组E第5组 R第7组第6组 第8组T第9组 Y第11组第10组 第12组U第13组 I第15组第14组 第16组O第17组 P第19组第18组 第20组A第21组 S第23组第22组 第24组D第25组 F第27组第26组 第28组G第29组H第31组第30组 第32组J第33组K第35组第34组 第36组L第37组Z第39组第38组 第40组X第41组C第43组第42组 第44组V第45组B第47组第46组 第48组N第49组M第51组第50组 第52组如附图所示,本发明所述的语音输入结合部首识别的汉字一键输入法的键盘,其26个英文字母键的键位上设置有51组偏旁部首和一组最低频字,每一组的第一个偏旁部首代表全组,第52组最低频字代表了每一种读音中使用频率最低的1-2个生僻字,当然,根据不同的实施例也可以将其定义为每一种读音中使用频率最高的1-2个常用字。因为每一个键位上设置有两组偏旁部首,为了方便地在英文字母和汉字的偏旁部首以及汉字的偏旁部首的不同组之间的切换,可以将上述26个键位设计成单键帽的三态按键,即在一个键帽的下面实际安装了两个左右排列的轻触开关,当按下键帽左部时,其中的一个开关闭合,键入的是上位的一组偏旁部首;按下键帽的右部时,另一个开关闭合,键入的是下位的一组偏旁部首;按下键帽的中间时两个开关同时闭合,键入的是英文字母;这样就可以实现一键三态,用硬件的方式区分需要键入的是英文字母还是汉字的偏旁部首,是哪一组偏旁部首。当然也可以采用普通键盘的按键,此时在同一键位上的两组偏旁部首就合并成一组,用键盘上的切换键在偏旁部首和英文字母之间切换,这时重码率会略有提高。
通过声音输入设备输入汉字的读音后可以得到该汉字的读音特征,通过键盘输入该汉字的偏旁部首即可以得到该汉字的字根特征,将读音特征与字根特征结合,找到既符合读音特征又符合字根特征的汉字,得到的即是需要输入的汉字。由于汉字所特有的音形相结合的特点,得到的汉字一般没有重码,个别出现重码时重码的数量也仅2-3个汉字,只要用翻页键选择即可。如在商务印书馆1980年印刷发行的修订第5版《新华字典》中读音为“mao”的汉字共有31个,其中偏旁部首相同的只有3组,即“茅”与“茂”、“茆”,“锚”与“铆”,“冒”与“昴”,第一组中的“茆”是“茅”的异体字,可以作为一个字处理,而“茂”字的使用频率高于“茅”,可以安排先出现“茂”字,按下翻页键后出现“茅”字;同理,“锚”与“铆”先出现“锚”,“冒”与“昴”先出现“冒”。再看读音为“hu”的汉字共有53个,其中偏旁部首为“氵”的有“湖”、“沪”、“滹”、“浒”、“淴”,看似重码多达5个,实际上“滹”、“浒”、“淴”三个汉字的使用频率极低,尤其是“滹”和“淴”,前者是一不常用的河流的名称,后者用于方言,其使用频率几乎为零,可以将“滹”和“淴”作为读音为“hu”的汉字中的最低频字安排在第52组;常用的只有“湖”、“沪”,而“沪”又专用于地名,最常用的只有“湖”,可以安排先出现“湖”字,按下翻页键后出现“沪”字,极少数情况下需要再按翻页键出现“浒”;至于最低频字“滹”和“淴”的输入则只要在输入其读音的同时按第52组所在的键位(“M”的下位)即可。
综上所述,在大多数同音字中根本没有相同偏旁部首的字,只要将汉字的偏旁部首进行适当的优化组合,使同一组偏旁部首中所涉及的汉字尽可能没有同音字,配合语音输入汉字的读音特征完全可以实现一键输入,个别出现的重码现象可以采用上述方法用翻页键查找。
例如需要输入“持(chi)”字,操作者只要念“chi”同时按下键盘的“I”键的左位键(扌)即可,计算机接收到音频信号后与汉字的读音特征比较,读音特征为“chi”的汉字有“吃”、“尺”、“迟”、“池”、“翅”、“痴”、“赤”、“齿”、“耻”、“持”、“斥”、“弛”、“驰”、“侈”、“炽”、“傺”、“墀”、“茌”、“叱”、“哧”、“啻”、“嗤”、“彳”、“饬”、“媸”、“眵”、“鸱”、“瘛”、“褫”、“蚩”、“螭”、“笞”、“篪”、“豉”“踟”、“魑”、“匙”、 “坻”,而偏旁部首为“扌”的只有“持”,即需要输入的汉字。
同样,当输入的读音特征为“pi”,字根特征为第5组偏旁部首(“E”的左位)时,符合条件的汉字只有“匹”。
为了弥补操作者发音不准造成的困难,在使用声音输入设备输入读音的基础上还可以使用键盘输入汉语拼音等表示读音的符号作为补充。例如在有些操作者方言较重时,可能会分不清“wang”和“huang”、“lu”和“liu”,此时可以通过键盘输入汉语拼音表示读音,字根特征仍然按照上述规则通过键盘输入。
使用标准的汉字偏旁部首作为字根特征的优点是可以减少记忆量,不需要操作者记忆特殊的拆分汉字的规则和特殊的字根。
当然,为了提高使用的效率,还可以根据使用的频率和集合中的汉字的多少对读音和偏旁部首进行优化组合,以进一步减少记忆量,提高输入的效率。例如可以利用五笔字形的字根或其他汉字输入法的优化字根,当然也可以在上述实施例的基础上进一步压缩,减少偏旁部首的个数,或调整其组合,达到降低重码减少输入的键次的目的。
权利要求
1.一种语音输入结合部首识别的汉字一键输入法,是根据汉字的字根特征和读音特征输入汉字的一种汉字输入法,通过键盘输入汉字的字根特征,其特征在于所述的汉字的读音特征是通过声音输入设备输入的音频信号。
2.根据权利要求1所述的语音输入结合部首识别的汉字一键输入法,其特征在于所述读音特征是汉语拼音所能表示的汉字的发音。
3.根据权利要求1所述的语音输入结合部首识别的汉字一键输入法,其特征在于所述字根特征是标准汉字偏旁部首。
4.根据权利要求1所述的语音输入结合部首识别的汉字一键输入法,其特征在于当输入的音频信号不足以区分不同的汉字的读音特征时,可以通过键盘输入表示其发音的符号。
5.根据权利要求1所述的语音输入结合部首识别的汉字一键输入法,其特征在于从每一种读音特征的汉字中选出1-2个汉字,不论其字根特征如何,通过一特别键输入代表其字根特征的代码。
6.语音输入结合部首识别的汉字一键输入法的键盘,其特征在于将标准汉字的偏旁部首按照如下规则将其分布在键盘的字母的键位上,1)当不同的偏旁部首所涉及的汉字中无同音字时,将其设置在同一键位上,2)当不同的偏旁部首所涉及的汉字中有2-3个同音字且偏旁部首的形状相近似时,可以将其设置在同一键位上。
7.根据权利要求6所述的语音输入结合部首识别的汉字一键输入法的键盘,其特征在于将标准汉字的偏旁部首如下分布在26个键位上Q;一丶二W乙(乛、乚、 )十、工丨、丿、卜、()、 厂、广E匚、冂、凵R亻、人(入)、八(丷)刂、刀(ク)、力 勹、儿、几T亠、冫Y讠(言)冖、宀、 卩、阝、 U厶、又( )、廴、辶 I扌、士、土 艹、O寸、廾、大、尢、弋 P口、囗小()、忄() 山、巾、彐( )A彳、彡、爿(丬)S氵饣(食)、门(門)尸、户、己(已)、弓、 、子(孑)、D女F纟、巛、幺马(馬)、鸟(鳥) 王G木H戈、比、瓦、止、攴韦(犬)、歹、车(車) 日(曰)J贝、见(見)K气、攵、片、斤、爪(爫)、父牛(牜、 )、毛、手 月( )L欠、风、殳、方、文Z斗、灬、心水、火礻(示)、衤(衣)X聿(肀、
)、毋(母) C龙、业、目、田、皿、罒石钅(金)V矢、禾、白、瓜、用、艮(
)B虫疒、立、穴、疋(
)、皮、矛页、缶、竹()N其它6划 M8划以上所有7划
8.根据权利要求6所述的语音输入结合部首识别的汉字一键输入法的键盘,其特征在于该键盘上设置有汉字的字根的键位是单键帽三态按键,即一个键帽下有两个轻触开关。
全文摘要
本发明公开了一种语音输入结合部首识别的汉字一键输入法及其键盘,它是根据汉字的字根特征和读音特征输入汉字的一种汉字输入法,通过键盘输入汉字的字根特征,通过声音输入设备输入作为读音特征的音频信号。本汉字输入法及其键盘结合了语音输入和键盘输入的优点,操作方便、记忆量小、重码少、正确率高。
文档编号G06F3/023GK1277375SQ0011122
公开日2000年12月20日 申请日期2000年7月19日 优先权日2000年7月19日
发明者孙万勋 申请人:孙万勋
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1