中文数字音码、形码与音形互转输入方法及键盘的制作方法

文档序号:6342948阅读:582来源:国知局
专利名称:中文数字音码、形码与音形互转输入方法及键盘的制作方法
技术领域
本发明属于数字键盘的中文输入方法,可应用于需要中文输入的各种硬件上,如手机、PDA、电脑等。本发明的技术方案是面向汉字输入的不同使用者在不同的硬件环境下使用的,为达到易用与快捷,本发明包括音码,即普通话拼音输入,形码,即部首笔划输入,以及同一汉字或词组、短语可由拼音输入转为部首笔划输入,或由部首笔划输入转为拼音输入,即音形码或形音码。
在数字键盘形码方面,目前有纵横码、九方、笔顺码等输入方法,由于不符合汉字书写笔顺、难学不易用,没有在手机等硬件上得到广泛应用,最为流行的仍是摩托罗拉、T9、字能三种流派。此三派的共同点是,每一个数字键代表着一类笔划,完全按书写笔顺输入,直至要选的字出现在屏幕上;但由于没有规定每字最长应输入几码,造成每按一键就得看要输入的字是否出现,极耗视力,加之每字的平均击键数多,相当多的常用字平均每字击键数超过十下,输入效率低下。
数字音形码有二笔数码,中国专利申请号01131449,规定每字的最高码长为六,与不规定码长的上述三大流派相比,显然是一大进步,但每字究竟在第几码出现,仍然无规可循,只能靠眼睛挑选;其次,把汉字分为独体字与合体字,增加使用者辩认与分拆的难度;最后,使用者必须掌握汉字的正确笔划与笔顺,并能分别“独体字”与“合体字”,才能输入汉字,仅知道字的读音与部分笔划笔顺是不够的。
无论是音码、形码,还是音形码,都各有优缺点。音码只需知道字的读音,就能输入,但重码太高,输入太慢;形码输入快,但必须知道字是怎样写的;音形码既要知道字的读音,还要懂得怎样写,输入相对最为不便,但是,以数字接键形码输入汉字时,对大字库编码,必须增加码长,否则重码太高,但增加码长则会给常用字的输入带来不便,在这种情况下,增加拼音输入,或在拼音输入中增添形码输入,均可减少重码。抛开各种具体的输入方法,就形码与音码而言,各自有对方无法取代的优势,不存在着谁取代谁的问题。
本发明的汉字输入系统,是采用0到9十个数字为按键,具有最佳的通用性,一般需要文字处理的硬件都有十个数字按键的设置、或有触摸屏可设定十个数字,如手机、PDA、掌上电脑、PC机、收银机、固定电话机、机顶盒等。汉字具有音与形的特性,在输入方法上有拼音输入与部首笔画输入。有些人不太熟悉汉字的笔画和笔顺,习惯用拼音输入;有些人普通话说得不够标准,用拼音输入不太流畅;不少人会碰到有的字只知道读音,而不知道或一时想不起是怎样写的,有的字可能只知道怎么写而不知怎么读。有的人把输入速度放在第一位,而有的则非常在乎易用,希望最好不用学就能用。小学语文教育则重视汉字的规范,最为反对违反汉字传统规范的书写方法和输入方法。针对上述各种情况,本发明的技术方案为将纯形码、纯音码和音形互转的输入方法集成融合起来,进行汉字单字、词组和短语的输入;在易学易用、合乎汉字规范的前提下,将重码率和平均每字的击键数减到最低,形码中将汉字部首与笔画归为十类对应十个数字,单字按书写笔顺,最多取四码输入,任何字只要输入两码就能靠屏幕输入,而词组、短语则是在输入其首个单字全码后才对以后各个单字取码输入;拼音输入按数字键的英文字母设定,词组输入取每字音节的头两个或三个字母,都是击键三次;在单字或词组、短语输入过程中,随时可进行音形输入方法切换,解决有些字只知书写方法或读音的问题;对有些高重码的单字,输入全码后,再切换增加另一种输入方法的输入,最为有效地解决高重码问题。
四、具有实施方式关于数字键位的设定数字1,代表笔画横类,包括横与横提。
数字2,代表笔画竖类,包括竖与竖钩;拼音字母a、b、c。
数字3,代表笔画撇类;拼音字母d、e、f。
数字4,代表笔画点类,包括点和挎;拼音字母g、h、i。
数字5,代表笔画折类;拼音字母j、k、l。
数字6,代表“交”类,即横竖相交,形如“十”,所含部件与笔画组合如下扌艹 十廿 丰;拼音字母m、n、o。
数字7,代表“围”类,除了国字框“口”部首外,共有九个成字部首日目且耳田由里罒皿;拼音字母p、q、r、s。
数字8,代表人物类,共有人亻彳父母子女饣食忄心讠言;拼音字母t、u、v(ü等同v)。
数字9,代表五行类,包括金钅木水火土氵冫灬;拼音字母w、x、y、z。
数字0,代表方空口和动物类部首,包括口虫龙(豸鼠)鸟马牜 羊 犭鱼。
a.形码本发明是申请人对其在先专利申请“中文数字输法”(申请号01102231.0)的改进发明。原申请存在以下问题需要改进第一,按第一键后出现的显示框内十个选项中,有不少选项所含内容过多,在手机等显示屏幕小的硬件上难以实施。
第二,第三与第四码的取码同第一码不一样,增加记忆负担,相应增添使用难度;首笔是无部首的单笔画需要取两码,不但无助于减少重码,而且令到输入不够顺畅,如输入“一”字,要按击数字10后,才能上字。
第三,缺形类特征不够明显,有些部首不易辩认;而且所包含的这类部件数量过多,如上述按击第一键后,选项所含部件过多,难以在小屏幕上显示。
第四,只极限于单字,没有词组的输入,不利于提高输入速度,因在汉字的使用中,词组、特别是两字词的出现频率很高。
本发明采取以下改进方法第一,按击第一键后,屏幕出现的十个选项各只含一个部首或单字,适应显示屏幕小的硬件。
第二,除了第二码按屏幕选项,对号入座输入其序号外,如果选项没有所需的部首,则第二码与第一、三、四码取码完全一样,按其所在部首或笔画类别对应的数字输入,简化输入规则。
第三,取消缺形类,代之的是“围”形类部首,数量刚好十个,除国字框部首外,其它九个都是成字部首日目且耳田由里罒皿,特征突出,易于辩认记忆。
第四,为方便使用,增加容错码。包括两种情况,(1)由于第一码后出现的十个选项各只能含一个部首或单字,无法容纳数量多的动物类部首,故将构字量相对不多的部首“龙豸鼠”放在同一个选项里,仅显示“龙”字,含有“豸鼠”部首的汉字不论以部首输入,还是当为不是部首的笔画输入,一样可以打出字来。其次,有个别字,如“美”字,有不少人出惯按笔画输入,而不是取部首“”,两种方法都可以打出字来。(2)与第一种情况不同,由于不少人书写某些汉字不符合笔顺规范,不增加容错码,则无法打出字来,如“门”、“丬”,正确的笔顺是“点、竖、折”与“冫竖”,但不少人写为“竖、点、折”与“竖冫”,两种情况都能输入所需汉字。第五,删去五类部首中不属于本类的部首或笔画组合,令到各类部首不但数量少,且特征更为鲜明。
第六,将五类笔画、五类部首的共同特征以图案或其它方式印刻或显示在数字按键上,提醒使用者数字代表关类别所含的内容。由于此输入法是以十个数字代表十类部首和笔画、按类输入,当按击第一键后,如果显示的十个选项没有所要的部首或单字,则根据第二笔所属部首或其本身类别取码,此时,数字按键上的标志有助于第二键的取码更为直观,保证了取码内容的完整性与直观性,即如果第二码无法在屏幕十个选项中找到相应部首或笔画,则在键盘的数字按键上找到。
第七,增加词组输入的方法。词组输入是基于首个单字取全码后,再对其后单字取码而形成的,因此,词组取码是从单字取码中派生出来的,不形成两个输入规则完全不一样的体系,只有要掌握单字的输入方法,就能进行词组输入。词组输入与单字输入相比,平均每字的击键数大大减少。
单字输入规则五类部首优先取码,凡是属于五类部首的,即上述数字6-0所包括的部首,应输入其所属部首对应的数字;否则,按笔画种类对应的数字输入。每字最多取四码,不足四码,自然结束。
第一码如果字的第一笔所在部首属于上述五类部首,输入该部首所属类别对应的数字;如第一笔所在部首不属于五类部首,不管该笔画是否构成(不属于五类部首)部首,只需输入该笔画类别所对应的数字。本身只有一个笔画的一码字,如“一、乙”,按击第一键后即按上字键上字。
第二码如果屏幕出现的十个选项中有所需的单字或部首,则只需对号入座输入对应的序号;如没有显示要输入的部首,则根据该字第二笔所属的类别输入,如第二笔所在部首属于五类部首的,输入该类部首对应的数字,否则输入第二笔本身所属笔画类别对应的数字。输入第二码后,可以不继续输入第三和第四码,按翻屏键,即能找到所需单字。实际上,第二码不能对号入座输入的,必定是第一码、即首笔为五类笔画之一,而第二码、即第二笔所在的部首是构字量不多的非常用部首,或根本就不含有部首;第一码为五类部首的,即对应6至0五个数字,则不存在第二码不能对号入座的情况。
第三码紧接第二码取码后的笔画,如该笔画所在的部首属于五类部首,与上述完全一样,输入所属部首类别对应的数字,否则,输入该笔画本身所属笔画种类对应的数字。与第二码相同,可以不输入第四码,按翻屏键就能找到要输入的字。
第四码根据字的最后一笔取码,如果最后一笔所在部首属于五类部首,输入所在部首种类对应的数字;如最后一笔不含在五类部首里,则直接取最后一笔所属笔画类别对应的数字。第四码有三种情况(1)如第三码输入后,字的所有笔画已输入完毕,则不存在第四码;(2)如果第三码输入后,只剩下最后一笔或剩下的部首刚好属于五类部首的,则只需输入其所属类别对应的数字;(3)如果第三码输入后,剩下的笔画或部首一次取码无法取完,则按上述做法,根据最后一笔取码,第三码与第四码之间没有取码的部分省略掉。
有了输入两键后可直接翻屏找字的技术方案,任何字只需输入两码,也可在第三码后,按翻屏键就能查找到所要的字,无需输入四码,令到输入单字更为方便友好,对有些笔画较难辨认或记不清怎样写的字,可不必输入全部四码,当然,输入四码要比只输入两码或三码后再翻屏找字快得多。
按第一码,屏幕出现的十个选项如下数字11一2西3在4歹5车6王7雨8大9酉0石数字21上2黑34骨5凹6山7止8贝9非0巾数字31的2白3自4夕5九6我7舟89禾0月数字41为2立3米4穴5方6宀7广8疒9礻0衤数字51乙2了3皮4又5贯6尸7阝8纟9出0弓数字61扌2艹3廿4 5士6十7其8主9丰0耒数字71口2田3里4罒5皿6由7日8目9且0耳数字81人2彳3亻4父5母6子7女8讠9忄0饣数字91钅2木3水4火5土6走7赤8耂9氵0 冫数字01龙2鸟3马4牛5羊6犭7鱼8虫90口单字编码举例输入“我”字,第一笔是撇,不在五类部首里,故第一码取撇类对应的数字3,按键后,就可见到“我”字在选项6,可直接选字;如输入全部四码,即3654,“我”仍会再次出现。
输入“湖”字,第一笔为点,但在氵的部首里,氵属于五行类的部首,根据凡属五类部首的应取部首的输入规则,第一码不能取点类4,而应该取五行类对应的数字9;当输入第一码后,即可看到氵在序号为9的选项里,故第二码取9;紧接着的笔画是横,但与其后的笔画组合为五类部首里的横竖相交类部件,所以第三码取6;剩下的笔画非一码所能取完,故取最后一笔所在的类别,第四码取1,虽然最后一笔横在部首“月”里,但“月”不属于五类部首,当为笔画处理。
输入“腾”字,第一笔为撇,故第一码输入3;“月”出现在序号为0的选项里,所以第二码取0;跟着是点,第三码取4;最后的一笔在属于动物类的部首“马”里,第四码取0。
输入“亘”字,第一码取横类对应的数字1,屏幕显示的十个选项没有所需部首,第二笔竖在属于“围”类的部首“曰”里,第二码取7;第三码为横类1。
词组输入词组输入无论所含字数多少,第一个字应输入全码,如首字是一码、两码或三码,输入全部码数后,切换为词组输入状态;如第一个字是四码字,则输入四码后,自然进入词组输入状态。
词组输入分为两字词组与两字以上的多字词组(1)两字词组的输入规则第一字全码+第二字首码+第二字最后一码。
输入“当代”,先取首字“当”的全码2351+第二字的首码亻8+第二字的最后一码丶4,整个词组的全码是235184。输入“唯一”,全码是00811,因第二字只有一码,自然结束。输入“一次”,首字“一”只有一码,所以输入数字1后,切换为词组输入状态,才取第二字的第一和最后一码,全码是1(切换为词组输入状态)98。
(2)多字词组的输入规则第一字全码+第二字首码+第三字首码切换为多字词组词组输入状态+此后每个字的首码。
输入“北京市”,输入全码是211544,与两字词组“北京”同码,切换为多字词组输入后,屏幕即转变为显示三字词组。
输入“中华人民共和国”,第一字“中”为三码字,全码是002,不足四码,切换为词组输入状态,输入第二个字的首码亻8,输入第三字首码“人”8,再切换为多字词组输入状态,输入此后每字的首码。全码是002(切换为词组输入)88(切换为多字词组输入)5637。
实际输入无须输入全码,如没有重码即提前显字或上字。
b.音码如上述的键位设置,按数字键2-8,即有两行显示,一行显示该数字键上所含字母开头的音节中使用频率最高的单字,每个单字各带有序号,长按或快速双击对应的数字键即可上字;另一行显示该数字键所含字母,这些字母也各带有序号,按击序号对应的数字就能选取。数字8含有t、u、v三个字母,但汉字拼音音节没有以u或v开头的,所以第一键输入数字键8只代表t;此外,音节中以c、s、z开头的,包含相当数量的音节是以ch、sh、zh开头,不少普通话不够标准的南方人分辨不了音节是否带有s,本发明为了输入更为快速,同时照顾到上述人士,凡以c、s、z开头的音节,各有三个选择1为其本身,2带有s,3为模糊音,即分不清是否带有s,以?表示。
按第一键后,屏幕显示的字母选择数字21a 2b 3c 4ch 5c?数字31d 2e 3f数字41g 2h数字51j 2k 3l数字61m 2n 3o数字71p 2q 3r 4s 5sh 6s?数字81t数字91w 2x 3y 4z 5zh 6z?拼音单字输入与普通拼音输入一样,只要输入整个音节,就能输入音节所包括的汉字。
拼音词组输入分为两字词组与两字以上的多字词组
(1)两字词组输入第一个字击键三次,除以ch、sh、zh开头的音节取三个字母外,其余为两个字母;此后,取第二个字音节的全部字母。
如输入“英雄”,拼音为yingxiong,第一个字的开头字母为y,输入9,屏幕即出现上述第一键输入后的字母选项,对号入座输入3,第二个字母为i,输入4,完成第一个字的输入,此时,回归到第二个字“雄”的全拼节输入,即同单字输入,xiong的首个字母x,故输入9,根据屏幕显示输入2,即输入x,输入4(i所在的数字键),输入6(o所在的数字键),ong即一起出现,表示该音节已输入完毕,因以o开头的ong,在音节xiong中是唯一的。实际上,只输入9349,“英雄”即出现在屏幕上可直接上字,无需输入其余字母。
(2)多字词组每个字的取码同两字词组的第一个字完全一样,但输入第二个汉字后,必须切换为多字词组输入状态。
如输入“中国人民”,中zhong,取zho,输入956;国guo,取gu,输入416;此后应切换为多字词组输入状态,人ren,取re,输入733;民ming,取mi,输入614。同样,多数情况下,无需输入完所有字的三键,所要词组即出现在屏幕上,可输入。
c.音形互转在汉字单字输入中,由拼音输入转为部首笔画输入,或由部首笔画输入转为拼音输入,可弥补单纯拼音或部首笔画输入的不足。
当使用大字库进行文字处理时,即使重码较低的部首笔画输入也存在重码字可能过多的问题,如在输入单字全码后仍有大量重码字,此时切换为拼音输入,随拼音音节字母的增加,形音结合,可最大程度地减少重码字;同样,拼音输入时,碰到重码字过多时,切换为部首笔画输入,可大量减少重码字。其次,输入汉字时有可能会碰到,只知道某些字的不确定发音,如有些普通话不好的人,分不清音节结尾是on还是ong,且只知道字的开头部首笔画,如“麟”字,知道字是以广字头开头的,但分辨不了其后的笔画和笔顺,虽然采用翻屏的方法可以查找到这些字,但费时费力,如果通过音形之间的切换输入,将字的形与音信息综合起来,则可以毋须靠屏查字消耗视力,快速地输入这些字。
汉字单字输入中,无论是拼音输入还是部首笔画输入、已输入多少按键,都可以随时切换成另一种输入方法。
例如,输入“麟”字,先输入“丶”或“广”,切换为拼音输入,再输入lin或li,屏幕即显示“麟”字;或者,先输入lin或li,切换为部首笔画输入后,输入“丶”或“广”,“麟”字即出现。再如,输入“瀵”字,虽输入四码9944,仍不见此字,切换为拼音输入,输入拼音音节字母后即能看到该字。又如,输入ji,要输入的字“畸”没有出现,且知道该音节含有大量同音字,此时,只需切换成部首笔画输入,输入字的开头部首“田”,“畸”即出现。
在词组输入中,可能碰到某些字不知其准确发音或如何书写,这时只要切换成另一种输入方法就可解决,且词组每个字的取码方法与原本在部首笔画输入或拼音输入中完全一样。
如输入“草菅人命”,开始用拼音输入,但碰到“菅”字不知其正确发音,这时可切换为部首笔画输入,“菅”的第一码是部首草字头,属于横竖相交类,故取码6,问题就解决了。
再如以部首笔画输入“以貌取人”,不知道“貌”字怎样取码,可切换为拼音输入,输入字母ma就行了。
为适应汉字词组的不断变化与使用者对词组和句子的特别需求,只要将需要的词组或句子存入自编,软件即自动给予编码并存在码表里,与原有的一样,按同样的输入方法可以输出,彻底保障词组、句子都能顺畅地输入。如将“国家专利局文献”存入自编里,之后不管是以部首笔画输入还是以拼音输入,或者任意切换这两种输入方法,都可输入这个自编词组。
权利要求
1.一种采用0到9十个数字对汉字输入进行编码,而形成的数字音码、形码和音形码,其特征在于可单独以部首笔画输入或者拼音输入汉字单字或词组、短语,也可以在输入过程中随时切换为另一种输入方法;在单字输入全码后存在重码时,可切换成另一种输入方法输入同一单字,利用音、形提供的更丰富信息,减少重码;适应汉字词组、短语的不断演变,可自编词组、句子,其输出规则与原有的一样;将数字键代表的拼音字母、笔画种类直接标志在数字键上,将按键代表的部首笔画类别以图像等标志,增加其直观性,方便使用,数字键位的设定数字1,代表笔画横类,包括横与横提;数字2,代表笔画竖类,包括竖与竖钩;拼音字母a、b、c;数字3,代表笔画撇类;拼音字母d、e、f;数字4,代表笔画点类,包括点和挎;拼音字母g、h、I;数字5,代表笔画折类;拼音字母j、k、l;数字6,代表“交”类,即横竖相交,形如“十”,所含部件与笔画组合如下扌艹 十廿 丰;拼音字母m、n、o;数字7,代表“围”类,除了国字框“口”部首外,共有九个成字部首日目且耳田由里罒皿;拼音字母p、q、r、s;数字8,代表人物类,共有人亻彳父母子女饣食忄心讠言;拼音字母t、u、v(ü等同v);数字9,代表五行类,包括金钅木水火土氵冫灬;拼音字母w、x、y、z;数字0,代表方空口和动物类部首,包括口虫龙(豸鼠)鸟马牜 羊 犭鱼;a.部首笔画输入单字输入规则五类部首优先取码,凡是属于五类部首的,即数字6-0所包括的部首,应输入其所属部首对应的数字;否则,按笔画种类对应的数字输入;每字最多取四码,不足四码,自然结束第一码如果字的第一笔所在部首属于上述五类部首,输入该部首所属类别对应的数字;如第一笔所在部首不属于五类部首,不管该笔画是否构成(不属于五类部首)部首,只需输入该笔画类别所对应的数字。本身只有一个笔画的一码字,如“一、乙”,按击第一键后即按上字键上字;第二码如果屏幕出现的十个选项中有所需的单字或部首,则只需对号入座输入对应的序号;如没有显示要输入的部首,则根据该字第二笔所属的类别输入,如第二笔所在部首属于五类部首的,输入该类部首对应的数字,否则输入第二笔本身所属笔画类别对应的数字;输入第二码后,可以不继续输入第三和第四码,按翻屏键,即能找到所需单字;第三码紧接第二码取码后的笔画,如该笔画所在的部首属于五类部首,与上述完全一样,输入所属部首类别对应的数字,否则,输入该笔画本身所属笔画种类对应的数字。与第二码相同,可以不输入第四码,按翻屏键就能找到要输入的字;第四码根据字的最后一笔取码,如果最后一笔所在部首属于五类部首,输入所在部首种类对应的数字;如最后一笔不含在五类部首里,则直接取最后一笔所属笔画类别对应的数字;按第一码,屏幕出现的十个选项如下数字11一2西3在4歹5车6王7雨8大9酉0石数字21上2黑34骨5凹6山7止8贝9非0巾数字31的2白3自4夕5九6我7舟89禾0月数字41为2立3米4穴5方6宀7广8疒9礻0衤数字51乙2了3皮4又5贯6尸7阝8纟9出0弓数字61扌2艹3廿4 5士6十7其8主9丰0耒数字71口2田3里4 罒5 皿6由7日8目9且0耳数字81人2彳3亻4父5母6子7女8 讠9忄0饣数字91钅2木3水4火5土6走7赤8耂9 氵0冫数字01龙2鸟3马4牛5羊6犭7鱼8虫90口词组输入(1)两字词组的输入规则第一字全码+第二字首码+第二字最后一码;(2)多字词组的输入规则第一字全码+第二字首码+第三字首码+此后每个字的首码;b.拼音输入单字输入规则与普通拼音输入一样,只要按数字键的字母标志和屏幕显示,输入整个音节,就能输入音节所包括的汉字,按第一键后,屏幕显示的字母选择数字21a 2b 3c 4ch 5c?数字31d 2e 3f数字41g 2h数字51j 2k 3l数字61m 2n 3o数字71p 2q 3r 4s 5sh 6s?数字81t数字91w 2x 3y 4z 5zh 6z?凡以c、s、z开头的音节,备有模糊音选项,即分不清是否带有s,以?表示;词组输入分为两字词组与两字以上的多字词组,两字词组输入第一个字击键三次,除以ch、sh、zh开头的音节取三个字母外,其余为两个字母;此后,取第二个字音节的全部字母;多字词组每个字的取码同两字词组的第一个字完全一样;c.音形互转汉字单字输入中,无论是拼音输入还是部首笔画输入、已输入多少按键,都可以随时切换成另一种输入方法;在词组输入中,对某些字不知其准确发音或如何书写,可切换成另一种输入方法解决,词组每个字的取码方法与原本在部首笔画输入或拼音输入中完全一样。
2.根据权利要求1所述词组、短语输入方法,为适应汉字词组的不断变化与使用者对词组和句子的特别需求,只要将需要的词组或句子存入自编,软件可自动给予编码并存在码表里,编码规则与原有的词组、短语一样,以音码、形码或音形码不同输入方法都可输入所要自编词组、短语。
全文摘要
一种以0至9十个数字为汉字编码的输入方法,包括数字拼音输入、部首笔画输入,及输入过程中两种方法随时可切换。部首笔画输入方法将部首中最具象形表意的归为五类与五类笔画分别对应十个数字,每字按笔顺及其类别最多取四码,词组短语的首字取码与单字相同,其余各字取两码或一码;拼音词组输入除末字可取全音节外,其余各字按键三次,取两至三个字母;不完全知道汉字如何书写或其读音,仍可输入单字、词组和短语,适合不同使用者的需要和习惯,可在手机、PDA、电脑等通用,具有规范易用,重码低、平均每字击键数少的特点。
文档编号G06F3/023GK1464368SQ02115369
公开日2003年12月31日 申请日期2002年6月13日 优先权日2002年6月13日
发明者汤步青 申请人:汤步青
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1