新音形编码汉字输入法的制作方法

文档序号:6358373阅读:229来源:国知局
专利名称:新音形编码汉字输入法的制作方法
技术领域
本发明属于汉字编码输入法,特别涉及一种适用于移动通信设备小键盘的音形编码汉字输入法。
背景技术
近几年来,汉字的输入技术层出不穷,五花八门,一般可将其分为以音为主、以形为主和音形结合三大类。这些输入法,各有各的特点及应用的范围。众多的汉字输入法中,能获得广泛应用并不多,特别是适用于移动通信设备的数字键盘或单独用标准键盘的数字小键盘输入汉字的就更少。本人在中国专利ZL200710030925. 0中提出一种音形编码汉字输入法,其特征在于按照先取汉字首拼音I个音码,后按笔顺次序取该汉字的前3形码及末I形码,音码形码加在一起对汉字进行编码;当汉字形码不足4码时,有几码就取几码;音码形码分别用数字代表,分别对应键盘数字键,然后击键输入汉字;
音码,即汉字首拼音字母代码ab、C、def、gh、jkl、mno、pqr、st、wxy分别用I至9作为其代码,即I代表a或b,2代表c,依此类推,9代表w或X或y,z用0作为其代码;形码,即汉字的笔画代码将汉字的所有笔画按特征分为8类,并分别用I至8作为其代码,即用I代表“横”(一),用2代表“竖”(丨),用3代表“撇” (J ),用4代表“点”(、),用5代表“捺”(\),用6代表“横折”,泛指所有起笔为横而随后又折弯的,不论其向什么方向折弯,以及怎么折弯,都归入“横折”这一类,如I、、、巧、乙、I等,用7代表“竖折”,泛指所有起笔为竖而随后又折弯的,不论其向什么方向折弯,以及怎么折弯,都归入“竖折”这一类,如J、L山、L等,用8代表所有其它笔画,如人“撇折”、〈“撇点”、“提”、“斜钩”、“弯钩”、“卧钩”等。本发明形码也指汉字的高频部件代码,即将构成汉字的高频部件“?、*、#、木”分别用5、6、7、8作为其代码,将构成汉字的高频部件“ 口”及“日、目、田”用9作为其代码;在汉字取形码时,若有上述部件,则用部件代码,否则,仍用笔画代码。上述发明具有易学易用、见字识码、重码率低、无论常用字和偏僻字都能轻松输入,结合计算机智能界面软件的实现,可显著减少击键次数,从而比其它输入法快几倍高效输入等诸多优点。然而,考虑到目前大多数人仍习惯用拼音输入法,尽管拼音输入法存在重码率高、击键次数多、拼音不准及许多偏僻字读音困难无法输入等缺点,但它对常用字想音打字、取码自然的优点,正适合对输入速度要求不高的大多数人群。发明人在深入研究和实践基础上发现,原来在电脑大键盘上的双拼输入法之所以不能取代全拼输入法,与其需要记忆韵母与其相应代码的对应关系有关。而现在智能手机可以实现将韵母与软键盘的对应关系动态刻画在软键盘面板上,既直观又可以让用户不必记忆韵母相对应的代码,从而达到零难度上手!因此,发明人在统计分析基础上,发明改进了一种既发挥上述音形编码输入法和双拼输入法高效输入优点,又能适合更广泛拼音用户群体的新音形编码汉字输入法。

发明内容
本发明的目的是提供一种易学、易用、重码率更少又能适合更广泛用户群体的汉字输入法,该汉字输入法特别适用于移动通信设备的数字键盘及标准键盘的数字小键盘输入汉字。本发明是这样实现的一种新音形编码汉字输入法,其特征在于按照先取汉字两个音码,分别为汉字首拼音和韵母代码,后按笔顺次序取该汉字的前3形码,音码形码加在一起对汉字进行编码;当汉字形码不足3码时,有几码就取几码。为叙述方便,音码形码分别用数字代表,分别对应键盘数字键,然后击键输入汉字。音码分为两部分,首先是汉字首拼音字母代码ab、C、def、gh、jkl、mno、pqr、st、wxy分别用数字I至9作为其代码,即I代表a或b,2代表c,依此类推,9代表w或x或y,z用0作为其代码;接着是韵母代码,分别为1代表i,2代表a、ao或ai,3代表e、er或ei,
4代表 ia、ian、iao 或 iang, 5 代表 an 或 ang, 6 代表 en 或 eng, 7 代表 ie、in、ing、iong 或iu, 8 代表 U、ii, 9 代表 ua、uan、uang、ui、un 或 ue, 0 代表 O、ou、ong 或 uoD形码将汉字的所有笔画按特征分为8类,并分别用数字I至8作为其代码,即用I代表“横”(一),用2代表“竖”(丨),用3代表“撇” (J ),用4代表“点”(、),用5代表“捺”(\),用6代表“横折”,泛指所有起笔为横而随后又折弯的,不论其向什么方向折弯,以及怎么折弯,都归入“横折”这一类,如I、、、乙、I等,用7代表“竖折”,泛指所有起笔为竖而随后又折弯的,不论其向什么方向折弯,以及怎么折弯,都归入“竖折”这一类,如J、匕山、L等,用8代表所有其它笔画,如人“撇折”、< “撇点”、“提”、“斜钩”、“弯钩”、“卧钩”等。本发明所述的新音形编码汉字输入法,其中形码也指汉字的高频部件代码,即将构成汉字的高频部件、*、子、木”分别用数字5、6、7、8作为其代码,将构成汉字的高频部件“口”及“日、目、田”用数字9作为其代码;在汉字取形码时,若有上述部件,则用部件代码,否则,仍用笔画代码。本发明输入法可用于汉语词组,对每个词组仍取音形共5码代表之,其取码规则如下
(1)对2字词组,先取首字前两码,后取末字前三码,即先取首字两音码,后取末字两音码及首形码;
(2)对3字词组,先取首字首码,后取第二、三字前两码,即先取首字的首拼音码,次取次字两音码,后取末字两音码;
(3)对4字词组,依次取各字首码,即首拼音音码,及末字第二码即韵母代码,
(4)对5字及以上的多字词组,依次取前4字及末字的首码,即前4字及末字的首拼音码。
本发明所述的新音形编码汉字输入法,对于不懂读音无法取音码或取某一形码有困难的汉字,该代码用数字键盘上的“ * ”键代替,其余代码仍按次序输入。本发明新音形编码汉字输入法,其中韵母组合是按照其发音特点和汉字韵母频率分布组合而来的,其数字代码则是根据其键盘物理布局和韵母的音形特点等因素综合考虑设计出来的。它将很多用户难以区分的韵母及介音组合放置在同一个按键上,极大地解决了很多用户拼音拼不准的问题,真正做到了好记好用。本发明采用音形结合的输入方法,具有输入速度快、易学、易用、重码率更少的特点。该输入法还采用字词合一输入技术,可进一步减少击键次数和切换次数,提高输入速率2至5倍,达到比联想输入法快I至4倍,比手写笔输入法快I至5倍且更易学易用又更方便,比语句输入法更实用、快速的效果。
具体实施方 式本发明按照汉字先取首拼音和韵母共两个音码,后按笔顺次序取该汉字的前3形码,音码形码加在一起对汉字进行编码;当汉字形码不足3码时,有几码就取几码;音码形码分别用数字代表,分别对应键盘数字I 一 9及0键,然后击键输入汉字;
本发明在首拼音取码方面自动解决了读音不准的困难,不必区分z、Zh, C、Ch, S、Sh等让人头痛的问题,即声母z、zh等首拼音相同,用同一键标识而不必区分。在首拼音标识方面,由于其与目前手机数字键盘上的英文字母标识大多数相同,且次序一致,只有三个用的最多的z、c、s作了适当调整z用0即“zero”的首字母标识、c单独用2标识而将原ab调整到I标识、s转移到用8标识。这样,在方便记忆的同时,却带来了降低重码率的好处。在韵母取码方面,通过分析韵母发音规律和对GB2312-80字库及其一级字库、前128,256,512,1000和2000高频字/常用字的韵母分布详细统计,将韵母(含介音)32种(不区分u/il)组合,根据常使用的频率均匀分成10类,分布在10个数字按键之上,使得各键上韵母方便记忆。按发音特点,本输入法将an与ang、en与eng、in与ing分别分布在同一按键位置上,用户便可不再纠结于判断汉字的前鼻音后鼻音;将以ia开头的韵母放到4键上,将以a开头的韵母放到2键上,将以e开头的韵母放到3键上,将u与U放在8键上,这些开头的字母与在传统T9手机键盘上的位置相同;将与数字0外形相似的字母O开头的韵母安排在0键上,将同音且形似的韵母i安排在I键上,极大地方便了用户对代码的记忆。用户只需要知道某个按键上对应的是哪个字母开头的韵母就可以了,而不必再细细记忆某个韵母到底在哪个按键上。这些设计有效地克服了传统拼音输入法的不足,极大提高了输入效率。目前本输入法可以在当下最流行的智能手机系统平台Android上,实现屏幕软键盘面板上动态显示各个代码的首拼音、韵母及笔画和高频部件,用户不再需要主动记忆各个按键分布便可以直观使用。真正做到了易学易用,零难度上手!
从上面的介绍可以看出,本汉字输入法,符合人们的拼读及书写习惯,即输入汉字时,想到其读音,所以先取音码,然后联想到其书写,所以取形码。本汉字输入法在输入汉字过程中,只用到“I” “9”以及“0”十个数字键,且很少会出现模棱两可的歧义读音及笔画和部件;其次,在取码过程中,对笔画的分类反应速度快,且按笔顺次序取码反应速度也快;本编码方案的附加规则少,容易学,容易记;还有,有了“容错码”,用户不必再为书写习惯和拼音不标准而发愁了!而使用“模糊”查找功能,不再有难字!最后,本编码方案的重码率很低,尤其在加入了少数几个高频部件以后,完全符合高效输入的要求。目前手机上拼音输入法的使用比较广泛,拼音输入法虽然比较容易上手,但是它是以发音为基础进行编码的。目前很多用户特别是南方的和年龄比较大的用户拼音都拼不准,勉强能发音,又很难区分平舌音与翘舌音、前鼻音与后鼻音,这样使用传统的拼音输入法对他们来说就 非常不方便。另外,因为汉字是按字形来构造的,而拼音是按发音来编码而且无法区分音调,这样就会造成拼音输入法的重码率比较高,输入同样的拼音对应的汉字会相当多,常常需要翻页导致输入效率不高。而笔画输入法虽然重码率低,但是要求用户记住汉字的笔画顺序,用户体验不好。本发明极好地解决了以上各种不足,拼音方面易记易用,帮助用户解决拼音拼不准的问题;形码取汉字容易记忆的前三笔画,方便自然,有效地降低了重码率,让翻页不再频繁,充分集成拼音和笔画输入法的优点。目前使用拼音输入法的用户人数最多,本输入法切合这些用户的使用习惯,加入简单的笔画输入有效地降低了输入的重码率,提高了输入效率,特别适用于拼音拼不准的南方和大龄用户。
实施例其首拼音是q代码为7、韵母是in代码为7、前3笔画是“撇”(j)、“横”(一)、“横”(一),那么整个编码是77311。其首拼音是d代码为3、韵母是ing代码为7、前3笔画是“点”、“横折”、“横”,所以整个编码是37461。2632711981259128。大学这是2字词组,按取码规则应取首字的前2代码d、a及后字的前3代码X、ue、“点”(、),共5码组成,所以整个词的编码是32994。前2代码mi是98,用高效编码,前3笔画或部件分别为“木”代码是8,“一”代码是1,“ I ”代码是2,合起来编码是98812;若用简易编码,前3笔画分别为“一”,“[”,“ J ”,所以简易编码是98123。计算机编码是58951。23181;受行草书影响,容错码是23182或23171。标准11484;容错11474。
权利要求
1.一种新音形编码汉字输入法,其特征在于按照先取汉字两个音码,分别为汉字首拼音和韵母代码,后按笔顺次序取该汉字的前3形码,音码形码加在一起对汉字进行编码;当汉字形码不足3码时,有几码就取几码;音码、形码分别用数字代表,并对应键盘数字键,然后击键输入汉字; 音码分为两部分,其中汉字首拼音字母ab、C、def、gh、jkl、mno、pqr、st、wxy、z分别用数字I至9、0作为其代码,即I代表a或b,2代表c,依此类推,z用0作为其代码;韵母代码分别为1代表i,2代表a、ao或ai, 3代表e、er或ei, 4代表ia、ian、iao或iang,5代表an或ang, 6代表en或eng, 7代表ie、in、ing、iong或iu, 8代表u或ii, 9代表ua、uan> uang> ui、uri 或 ue, 0 代表 O、ou、ong 或 uo ; 形码将汉字的所有笔画按特征分为8类,并分别用数字I至8作为其代码,即用I代表“横”(一),用2代表“竖”([),用3代表“撇” (J ),用4代表“点”(、),用5代表“捺”(乂),用6代表“横折”(I、、、3、乙等),泛指所有起笔为横而随后又折弯的笔画,用7代表“竖折”(J、L山、L等),泛指所有起笔为竖而随后又折弯的笔画,用8代表所有其它笔画,如“撇折”(ZJ、“撇点”(<)、“提”、“斜钩”、“弯钩”、“卧钩”等。
2.根据权利要求I所述的音形编码汉字输入法,其特征在于形码也指汉字的高频部件代码,即将构成汉字的高频部件“?”、“木”分别用数字5、6、7、8作为其代码,将“ 口 ”、“日”、“目”、“田”用数字9作为其代码;在汉字取形码时,若有上述部件,则用部件代码,否则,仍用笔画代码。
3.根据权利要求I或2所述的音形编码汉字输入法,其特征在于本输入法输入汉语词组时,对每个词组仍取音形共5码代表之,其编码规则如下 (1)对2字词组,先取首字前两码,后取末字前三码,即先取首字两音码,后取末字两音码及首形码; (2)对3字词组,先取首字首码,后取第二、三字前两码,即先取首字的首拼音代码,次取次字两音码,后取末字两音码; (3)对4字词组,依次取各字首码,即首拼音代码,及末字第二码即韵母代码, (4)对5字及以上的多字词组,依次取前4字及末字的首码,即前4字及末字的首拼音码。
4.根据权利要求3所述的音形编码汉字输入法,其特征在于对于不懂读音无法取音码或取某一形码有困难的汉字,该代码用数字键盘上的“ * ”键代替,其余代码仍按次序输入。
全文摘要
本发明涉及一种适用于移动信息设备小键盘的新音形编码汉字输入法。按照先取汉字两个音码,分别为汉字首拼音和韵母代码,后按笔顺次序取该汉字的前3形码,音码形码加在一起对汉字进行编码;还增加了“容错码”,提供了“模糊”输入功能。本输入法还可用于词组及短语的输入。本发明具有输入速度快、易学、易用、直观、高效和重码率更少的特点,其单字输入速率比其它输入法可提高一倍以上;而采用字词合一输入,可进一步提高输入速率2至5倍,具有广泛的应用前景。
文档编号G06F3/023GK102622098SQ201210018390
公开日2012年8月1日 申请日期2012年1月20日 优先权日2012年1月20日
发明者余威, 陈钦梧 申请人:汕头大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1