六元平拆式小键盘输入方法

文档序号:6368359阅读:214来源:国知局
专利名称:六元平拆式小键盘输入方法
技术领域
本发明属于汉字的计算机输入领域,解决的是在手机、手持式电子设备或其它小键盘设备上输入汉字的方法。
背景技术
现在在手机、PDA等小键盘设备上使用的输入法除拼音外,通常都采用按自然笔顺取的笔画输入,而没有任何拆分,虽然这种输入方式基本不用学习就可以输入,但由于不拆分,输入的按键编码不能有效地离散重码,重码率高,按键的效率大大降低,从而大大影响了输入速度。
字根编码无疑是最为直观、快速的输入方法。但是,字根编码的字根拆分难一直是其无法解决的问题,而且,字根编码的码元大都有几十个至几百个,根本无法定义到只有10个键的小键盘上。
但是,怎么在只有10个键左右的小键盘上输入字根呢?手机汉字输入需要的是没有学习难度的、上手就能用的方法,编码方案过于复杂的输入法要对手机用户进行普及有一定的难度。
而且,如何对汉字有效地进行拆分,又不给用户增加学习的难度,一直以来,都是学术界研究的一个重要课题。
为此,本人在继92年发明阴阳码,提出将汉字“一分为二”的拆分方法并获得专利之后,又经过近10年的研究、改进和对汉字结构的剖析,重新提出一种平行拆分汉字的新方法,该方法简单且自然,并能有效地拆分汉字,十分适合用于手机、PDA等汉字输入法学习难度不能太高的领域。
同时,由于该方法只用了六个字根,因此可以很方便地定义到手机、电话、计算机的数字小键盘等设备上去。

发明内容
本发明的目的,就是在手机和计算机的数字小键盘上实现这么一个字根数极少,编码拆分又极其简便易行的输入法。
那么,本编码如何拆分汉字呢?就是采用“平行拆分”的方法。这种方法是经过对汉字结构的深入研究,是一种基于汉字结构的一种拆分方法,而不是基于字根的一种拆分方法。
什么是“平行拆分”呢?假设我们要用一把刀按字形分界线将一个汉字切成几块,我们可以切一刀,也可以切两刀、三刀、四刀,但必须保证每一刀之间的切口线是平行的,否则就只能切一刀。对于没有明确形体分界线的字,就不作切分。
如“明”分为“日、月”切分一次“呆”分为“口、木”切分一次“草”分为“艹、日、十” 切分两次“衔”分为“彳、钅、于” 切分两次“蔓”分为“艹、日、皿、又” 切分三次必须保证每一次的切分线之间是平行的。
再如“保”字,当我们只切一刀时,“亻//呆”,没问题,如果再切一刀,即把右边的“呆”字切成“口木”,这第二刀就和第一刀形成直角,这是不正确的,因此“保”字只能切一刀即“亻//呆”,即

“[1]”和“[2]+[3]”之间的切分线与“[2]”和“[3]”之间的切分线形成了交叉,因此,第二次切分就不能成立。
如“药”,正确的分法是“艹、约”,虽然“约”还可以进一步分成“纟”和“勺”,但该拆分将与第一刀形成交叉,故此只能保留第一次切分,即

“[1]”和“[2]+[3]”之间的切分线与“[2]”和“[3]”之间的切分线形成了交叉,因此,第二次切分就不能成立。
再如“确”,正确的分法是“石、角”,虽然“石”和“角”从字形上都可以进一步拆分,但都将与第一刀形成交叉,故此只能作一次切分。
须注意的是,对于“庆、连、区、凶”等半包围的字,它们的切分线是曲线,“国、因”等全包围的字,它们的切分线是圆圈。
无论全包围的字还是半包围的字,它们不可能与其它的切分线形成平行线,因此,通常全包围结构和半包围结构就只能是里外分成两个结构,不可能分成三个结构。
如“圆”字,“囗”和“员”的切分线为圆圈,而要将“员”分成“口贝”的话,是一条直线,两次切分的切分线不形成平行线,故只能作第一次的切分——“囗”和“员”。
再如“链”,如果分成“钅车辶”,第一刀和第二刀没有形成平行,因此只能有一种分法“钅//连”。
(对于“宀冖”组成的如“宝、军”等字因通常归为上下结构,所以视同它们的结构分界线为直线。)一刀、两刀、三刀、四刀,只要每一刀之间是平行的,就可以一直切分下去,切分几刀都可以。如“衷、瓣”分为上中下、左中右3块,“烹、滩”分为上中中下、左中中右4块,“熹”可分为5块。要掌握的原则就是,如果切的那一刀的切分线与其它切分线的不平行,就不能进行该切分。这样就完全消除了汉字切分的歧义性。
总的来说,平行拆分就是将汉字按其字形,平行地将其各个部分切分开,对于有两个以上切分口的,应使切分线相互间平行,否则不能作该切分,如各切分线间产生交叉或不平行则切分不成立,只能保留不产生交叉的拆分。
那么,“平行切分”法和传统的按汉字结构拆字有何区别呢?1、传统的汉字结构粗分的话只有上下、左右、全包围、半包围结构,如果再分细一点,容易演变成拆字根了。而“平行切分”法只要符合切分条件就可以无限制的拆分,有很多汉字可以拆到三、四个以上的结构。拆分原则比较好掌握、界线明确。
2、传统的结构细分的话,又太复杂。如三个结构的字的分法就较复杂,如上左右、下左右、左上下、右上下、里上下、里左右、上中下、左中右等等,有时比较难划分明确的界线,往往需要根据定义好的字根来划分结构。比如“确”字,是分成左右结构“石//角”,还是分成左右上下结构“石//用”,要确定是哪种分法,就必须得确定“角”字以及“”、“用”是否是字根,还要看具体的拆分规则是不是“取大优先”。通常不同的编码,分法都不相同。
但“平行切分”法就比较简单,根本不用管你谁是不是字根,直接按字形看是否可以平行切分即可。“据”字明显只能切一刀,故一分为二,多简单!真正地脱离字根的约束。
3、“平行切分”法是完全按照字形进行切分的,而传统“汉字结构”的划分需考虑按字形意义拆分,“平行拆分”则不需要。请看以下例字鹏、啊、滩、蔓、幕等等按传统“汉字结构”的观点,他们该是什么结构?左右?上下?还是左中右?上中下?按“形声造字”的观点,是一分为二,但要是不认识该字的人呢?或是不懂“形声造字”原理的人呢?用“平行切分”法就无须考虑这么多,直接“平行切分”就行了。
总之,“平行切分”法简化了对汉字结构的划分,消除了汉字切分的歧义性。
举例如下例字首结构次结构三结构四结构岁山夕标木示国囗玉连车辶森木林街彳圭亍蔑艹罒盗次皿蛰执虫新亲斤摊扌又亻主薏艹立日心甍艹罒冖瓦我们对拆分出的结构各部分按笔顺写到的顺序依次称为首结构、次结构、三结构、四结构……等等,最后一个结构也叫末结构。
对于字形上没有明显分界线的独体字,就不进行拆分,整体进行编码。
本编码的输入规则独体字的输入规则是,输入该字的前5笔笔画,每个笔画一个键。
合体字的输入规则是,最大码长为6个键,用上述的平行拆分法将该字分为几个结构后,然后取首结构的一二笔笔画(2键)、再取次结构的一二笔笔画(2键)、最后取末结构的三四笔笔画(2键),每个笔画一个键。对于二结构字,取首结构一二笔画,再取次结构前四笔画。
考虑到若按首尾取笔画可进一步降低重码率,可在软件中设置一个“按笔顺输入/按首尾输入”切换开关,设置在“按笔顺输入”时,独体字按笔顺输入前5笔笔画、合体字的二结构字取首结构前2笔画和次结构前4笔画,二结构以上字按笔顺取首、次、末结构各前2笔画;设置在“按首尾输入”时,独体字取前4末1笔画、合体字的二结构字取首结构前2笔画和次结构前3末1笔画,二结构以上字按笔顺取首、次、末结构各前2笔画。用户可以根据需要选择使用哪一规则输入。
笔画的分类是将汉字的笔画按标准分法分成横竖撇点折5大类,分类标准同GB/T18031。
另外,考虑到纯笔画输入只用了5个按键,不能充分利用手机上的按键,所以本发明通过计算机根据本编码的特点、以降低重码率为目的反覆地计算,优选出6个常用的偏旁部首,作为优先于笔画的码元。这6个部首码元是“钅木日月扌口”。按规则取笔画过程中,如遇到这6个偏旁部首,就直接输入这些部首码元的代码。
将这些部首从笔画键中单独提出来,由于这些部首的使用频率非常的高,有利于进一步降低重码率、提高输入速度和利于形成按键的条件反射。
这6个部首码元在每个字的首键出现的较多,在每个字的第一个键之后,可将这6个部首码元当做选择键,用于直接选择屏幕上提示的汉字上屏。
在手机上,“钅木日月扌口”分别定义在“123456”键上;在计算机数字键盘上,“钅木日月扌口”分别定义在“789456”键上。
笔画键和部首码元在手机或电话按键上的定位见下表

在计算机的数字小键盘上的定位见下表

将部首定义到笔画键的上方,是为了使这6个部首的一目了然,容易记忆;更重要的是,在这6个部首不使用时,是当选择键使用的,放在笔画上方,就方便用户按键选择。
在手机上,“横”、“竖”、“撇”、“点”、“折”分别定位在“8”“0”“7”“9”“#”键上,5个笔画在几何空间上构成一个准“十”字,“横竖撇点”在笔顺和空间上共同构成一个“木”字,便于记忆;在计算机上,“横”、“竖”、“撇”、“点”、“折”分别定位在“2”“0”“1”“3”“.”键上,排列规律与上面相同。
把使用频率最高的“横”放在中心,有利于提高输入速度;而且这种安排计算机数字小键盘上和手机上的笔画键位相同,我们只要找到“横”所在键位,就可以直接“摸”到其它笔画对应的按键,十分方便用户在手机和计算机上同时使用。
当然,也可以采用国标GB/T18031中规定的、传统的“12345”代表“横”、“竖”、“撇”、“点”、“折”,其它键作为部首选择键的办法。这可用软件的键位映射、重定义功能来实现,可由用户自由选择。
如在手机上“12345”代表“横”、“竖”、“撇”、“点”、“折”,“6789*0”代表“钅木日月扌口”;在计算机数字键盘上“12345”代表“横”、“竖”、“撇”、“点”、“折”,“6789.0”代表“钅木日月扌口”。
特例有些字如“弋(式贰)、匚(医区)”,其首二笔画是“横折”,但在写整个汉字时,首结构只写了一笔画,就跳到次结构去写了,如果严格按照本规则先输入首结构二笔画,再输入次结构的笔画,就与整字的笔顺不同、与国家语委的整字书写规范相悖。对于这种特例,只有以国家的写字规范为准,输入时,首结构我们就只输入首笔画,然后输入一个 (部首键“囗”)来表示首结构己输入,然后再跳到次结构取笔画,这样就不会与整字的书写笔顺相冲突。
对于单笔画的汉字,如“乙”、“一”,同样参照此法输入。
默认字输入过程中,每按一个键,屏幕上都会出现一个与已输入按键相符的高频默认字,该默认字可以按手机上的 建直接输入,计算机键盘上可用 键输入。
词组二字词输入取每个字前3键;三字词每个字输入前2键;三字以上词取前“2末1”三个字的每个字各前2键。
联想 每输入一个字或词之后,屏幕上都会出现一组以该字或词联想的字或词,这些联想字或词可以用光标键进行选择。也可以先输入联想字或词的第一键,然后再按[Yes]键或按屏幕上的提示用部首键输入联想字。因为部首键通常很少出现在一个字的第二键之后。
补码对于输入按键不满6键的单字,如果产生重码,可以补输该字拼音的第一个字母,字母对应的数字按键就使用现在手机上标注的通用字母位置,在国标GB18031-2000中也有详细的规定。
键位由于手机键盘和计算机键盘的数字键位不同,用户交叉使用会有不适感,所以可以通过软件的方法来重定义各个键在键盘中的具体位置,用户可以根据自己的习惯进行修改。
输入实例以手机输入为例,“王”为独体字,输入该字前5笔笔画。
“架”为合体字,上下结构,平行拆分成“加//木”二结构进行输入。
“明”为合体字,左右结构,平行拆分成“日//月”二结构进行输入。“蔑”为合体字,上中下结构,平行拆分成“艹罒 ”三结构进行输入。
例字 首结构 次结构 三结构 四结构编码 手机按键王王 一一丨一 8808架加木 乙丿// #72明日月 // 34衔彳钅 亍 丿丿// //一一 77188甍艹罒 冖 瓦 一丨//丨乙//一乙800#8#街彳圭 亍 丿丿//一丨//一一778088蔑艹罒 一丨//丨乙//一丿 800#87盗次皿丶一//丨乙丨丨 980#00薏艹立 日 心 一丨//丶一//丶乙80989#每输入一个键,屏幕上都显示几个符合已输入编码的字词显示在待选行上,显示这些字词的原则是先显示那些下一个键仍然需要输入部首码元的字,并仍然显示在部首码元对应的按键位置上;剩余的空位,才可用来显示高频字或其它可能输入完6个键仍然会重码的字;在已输入完5个键后,对于输完最后一个键不会重码的字,可以不显示在提示行上,输入者若要输入,直接输入该字最后一键,该字会直接上屏;显示的原则是优先显示使用频率高的汉字。
按规则输入汉字过程中,如果屏幕提示有所需的汉字,可采用屏幕提示的按键直接上屏。如果屏幕没有所需字,仍旧按规则输入该字的后面按键。或者,如果不知道后面的按键是什么,也可以直接用翻页键查找。
输入过程中,每按一个键,都会有一个编码已结束的汉字或符合已输入编码的高频字在默认区,这个字可以按“确定键”(电话中的“Yes”键)直接上屏,就和其它输入法的空格键一样。
独体字在笔画输入完时,通常会出现在默认区,或提前出现在选择区,如输完笔画还找不到,可用翻页键查找。
声形方式 依托以上的形码形式,对于使用手机拼音比较熟的用户,可以使用本编码的声形方式。即,在本编码形码前面加输入拼音首字母,构成声形码方式进行输入独体字 拼音首字母+该字前5笔笔画合体字 拼音首字母+首结构首2笔+次结构首2笔+末结构首笔(或该字末笔画)合体字只有两个结构时,合体字的输入规则是拼音首字母+首结构首2笔+次结构首3笔(或次结构首2笔画+该字末笔画)词组的输入二字词取每个字各前3键三字词或三字以上词取前二字和最后一字各前2键拼音字母键位的安排就采用国标GB18031规定的、现行手机上标注的英文字母的键位。计算机数字键上的字母键定位可采用与手机相同的定位,也可让用户通过软件根据习惯自行定义。
如“蔑”字,拆成拼音首字母[M]+首结构“艹”+次结构“罒”+末结构 ===→[M][一丨][丨乙][一]===→[6][8]
[#][8]5键输入方式在只用单字输入、不用词组输入时,本编码只需用5个键的码长就可以有效地分离重码。因此,系统中可设置一“5键输入”的开关,限定输入的最大码长为5键。发生重码时,根据屏幕的提示用选择键进行选择,如果直接输入下一个字,则系统认为是默选排在最前面的默认字。
此时,词组输入被关闭,输入词组可通过联想来输入,即在输入每个字后,屏幕上就会出现一个与该字相关的联想字,使用者只需根据屏幕的提示进行选择,就可以输入联想词组。
对于声形输入方式,每个字的第一键只用到了8个键,仍然有4个键(
[1][*][#])未用来编码,可以用来输入联想字或选择重码。
应用范围本发明可以用在各种只有很少按键,却需要汉字输入的设备上。原则上,本发明在只有5个按键的键盘上也可以输入,但由于如果只有5个按键,就没有部首键,偏旁部首就无法单独输入,有点影响本发明的效果。所以输入的键盘应该至少有11个键,效果才会比较好,因为除去5个笔画键,至少还有6个键作为部首码元键。
本发明的优点一个汉字输入法的主要技术指标就是易学性和输入速度,这两个技术指标是相对矛盾的,往往是易学的打不快,打快的就不易学,而本发明由于所采用的技术手段,使得二个指标都很高。
1、易学性本编码有效地解决了字根编码拆分难的问题,所有合体字都简单地使用平行拆分原则进行拆分,十分简洁和显而易见。
只有6个部首,都标注在键盘上,不用背记。
2、重码少由于采用了平行拆分的方法,可以有效地取到每个字的特征笔画,大大降低了重码率。
优选的6个部首,是经过计算机仔细统计、反复测算优化后,同时根据各部首与笔画的相容性等特点,精选出来的,进一步降低了重码率。
3、速度快除了重码少使得输入速度快之外,由于本发明的特点,只有第一个键都用到了11个按键,第二键、第三键以后部首键已经很少用来编码,这6个部首键就可以用来直接输入待选的汉字,从而可以使大量的高频汉字仅需输入2-3个编码,就可以根据屏幕的提示直接上屏了,连确定键都不用按。这样就大大提高了输入速度。也就是说,每输入一笔画,屏幕上都会出现3-6个简码,可以直接用部首键输入,几乎所有的常用字都可以用2-4个键输入。而这些,都得益于本发明的部首键的特点。
总而言之,①本发明只采用了6个部首码元,并且都标注在键盘上,无须任何记忆;②本编码使用的平行拆分法简单明了,非但解决了字根编码拆分难的问题,又保留了字根编码的优点;③采用平行拆分的方法,可以有效地取到每个字的特征笔画,大大降低了重码率;④平行拆分的方法解决了笔画输入不容易形成条件反射的问题,大大提高了输入速度;⑤部首键同时兼作选择上屏键,可以提前中断编码、快速输入单字或联想字词。
权利要求
1.一种六字元汉字编码在小键盘上输入的方法,应用于不少于11键的小键盘设备,其特征在于(1)将汉字基本笔画按国家标准笔画分法分为横、竖、撇、点、折5类,分别定义到每个按键上;(2)精选了“钅木日月扌口”6个部首码元,作为比笔画优先的编码码元;(3)字形拆分方法将合体字用平行拆分的方法拆成若干份,再进行编码,所谓平行拆分,就是将汉字按其字形,平行地将其各个部分切分开,对于有两个以上切分口的,应使切分线相互间平行,否则不能作该切分,如各切分线间产生交叉或不平行则切分不成立,只能保留不产生交叉的拆分;平行拆分后,对拆分出的结构各部分按笔顺写到的顺序依次称为首结构、次结构、三结构、四结构等,最后一个结构也叫末结构;对于字形上没有明显分界线的字,为独体字,不进行拆分;(4)单字的输入规则独体字的输入规则是,输入该字的前5笔笔画,每个笔画一个键;合体字的输入规则是,用上述的平行拆分法将该字分为几个结构后,然后取首结构的一二笔笔画(2键)、再取次结构的一二笔笔画(2键)、最后取末结构的三四笔笔画(2键),每个笔画一个键,用键盘上对应的笔画键进行输入;对于二结构字,取首结构一二笔画和次结构前四笔画输入;单字的最大码长为6键;(5)在按规则取笔画的过程中,如果遇到指定的部首码元,则直接输入该部首的代码;
2.权利要求1所述的汉字输入法,其特征还在于,按键和部首在手机上的键位安排如下部首键在手机键盘上,“钅木日月扌口”分别定义在“123456”键上;在计算机数字键盘上,“钅木日月扌口”分别定义在“789456”键上;笔画键在手机键盘上,“横”、“竖”、“撇”、“点”、“折”分别定位在“8”“0”“7”“9”“#”数字键上;在计算机数字小键盘上,笔画键“横”、“竖”、“撇”、“点”、“折”分别定位在“2”“0”“1”“3”“.”键上;五个笔画在几何空间上构成一个准“十”字,“横竖撇点”在笔顺和空间上共同构成一个“木”字;
3.权利要求1所述的汉字输入法,其特征还在于,也可以采用传统的、国标推荐的“12345”键代表“横”、“竖”、“撇”、“点”、“折”,“6789*0”键代表“钅木日月扌口”的办法;可用软件的键位映射、重定义功能来实现;用户也可以使用软件根据自己的习惯来重定义各个键在键盘中的具体位置。
4.权利要求1所述的汉字输入法,其特征还在于,对于输入按键不满最大码长的单字,如产生重码,可补输该字拼音的第一个字母,字母对应的按键使用现在手机上通用的标注。
5.权利要求1所述的汉字输入法,其特征还在于,词组按以下方法输入二字词取每个字前3键输入;三字词每个字输入前2键;三字以上词取前“2末1”三个字的每个字各前2键;联想按以下方法输入每输入一个字或词之后,屏幕上都会出现一组以该字或词联想的字或词,这些联想字或词可以用屏幕上提示的选择键进行选择输入;或先输入该联想字的首键再根据屏幕上提示的选择键输入;
6.权利要求1所述的汉字输入法,其特征还在于,在软件中设置一个“按笔顺输入/按首尾输入”切换开关,设置在“按笔顺输入”时,独体字按笔顺输入前5笔笔画、合体字的二结构字取首结构前2笔画和次结构前4笔画,二结构以上字按笔顺取首、次、末结构各前2笔画;设置在“按首尾输入”时,独体字取前4末1笔画、合体字的二结构字取首结构前2笔画和次结构前3末1笔画,二结构以上字按笔顺取首、次、末结构各前2笔画。
7.权利要求1所述的汉字输入法,其特征还在于,依托以上的形码形式,形码前面加输入拼音首字母,构成声形码方式进行输入独体字 拼音首字母+该字前5笔笔画合体字 拼音首字母+首结构首2笔+次结构首2笔+末结构首笔(或该字末笔画)合体字只有两个结构时,合体字的输入规则是拼音首字母+首结构首2笔+次结构首3笔(或次结构首2笔画+该字末笔画)词组的输入二字词取每个字各前3键三字词或三字以上词取前二字和最后一字各前2键拼音字母键位的采用国标GB18031规定的、现行手机上标注的英文字母的键位,计算机数字键上的字母键定位可采用与手机相同的定位,也可让用户通过软件根据习惯自行定义。
8.如权利要求1、权利要求9所述的汉字输入法,其特征还在于,可以限定最大码长为5键,即不输入上述编码的最后一键,发生重码时,用屏幕上提示的选择键进行选择,选择默认字或没有重码时,可直接输入下一个字,不影响正常的输入。
全文摘要
一种六字元汉字编码在小键盘上输入的方法,应用于不少于11键的小键盘设备,可在手机或其它小键盘数字设备上输入汉字。本发明用平行拆分的方法拆分合体字,解决了字根编码拆分有歧义的问题;运用计算机根据本编码特点编程优化后精选了6个部首,用来辅助平行拆分法和笔画输入。本发明拆分极其简单、有效,容易形成输入的条件反射,利于输入速度的大幅提高。本编码只有笔画编码的学习难度,却能达到字根编码的效果。
文档编号G06F3/023GK1501227SQ0214837
公开日2004年6月2日 申请日期2002年11月12日 优先权日2002年11月12日
发明者陈劲松 申请人:陈劲松
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1