音数形汉字输入方法

文档序号:6331793阅读:950来源:国知局
专利名称:音数形汉字输入方法
技术领域
本发明是涉及一种计算机中文信息处理技术领域中用的“音数形汉字输入方法”。
背景技术
汉字输入计算机有两大输入法被人们广泛使用,一个是以拼音为代表的“音码”输入法,一个是以五笔字型为代表的“形码”输入法。普遍认为“形码”输入速度快,难学、易忘;“音码”输入法虽然易学,但输入速度慢,并且同音字多。网络上充斥的别字,大多是“音码”输入法造成的。由于人们的年龄、职业不同,文化水平的差异,两种输入法的使用者各有所长,各有所短。那么,能否利用二者之长处,再进行创新而研制一种新的汉字输入方法而摈弃二者的缺陷呢?三、发明内容大家知道,中国文字(汉字)的读音,是由汉字的声母和韵母拼出来的。通过研究发现,汉语拼音字母有很多规律性的内容,完全可以利用汉字的声母、阿拉伯数字和汉字拆分后字元的声母相结合,而新生一种很自然的汉字输入方法。因此,本发明之目的就是提供一种由拼音、数字、字形相组合的汉字输入方法,即“音数形汉字输入方法”,可有效解决计算机汉字输入难、记忆难和同音字多的问题,其解决的技术方案是用汉字的声母作首码(用大写表示,与次码有所区别),再用汉字拆分后字元(也有人称“字根”、“字素”、“部件”)的声母或者阿拉伯数字或者i、u、v作次码,次码由三码(第二、三、四码,用小写表示)组成,次码不足三码的字元,用阿拉伯数字6补齐编码,次码超过三码的字元,取前两个字元和最后一个字元的声母或者数字或者i、u、v作次码编码,多余的舍弃,首码和次码与键盘上的字母键、数字键相对应,输入时,直接敲击键盘上相应的字母键或者数字键或者其它符号键。
其编码方法是用汉字的声母作为首码编码,再用组成这个汉字字元的声母或者阿拉伯数字或者i、u、v作次码编码,次码超过三码的字元,取前两个和最后一个字元的声母或者数字或者i、u、v作次码编码,多余的字元舍弃,若次码不足三码,用6作次码补齐四码。
汉字字元的发音与阿拉伯数字同音或者谐音,用阿拉伯数字作次码。
一笔的汉字字元,用“i”作次码;方方块块的字元,用“u”作次码;汉字拆分后没有标准读音的字元,一律用“v”作次码。
不能拆分的穿插交插的独体汉字,用自身拼音编码,不足四码用6补齐,多余的汉语拼音字母舍弃;能拆分的独体汉字,可用拼音编码,也可用拆分后字元的声母或者数字或者I、u、v作次码编码。
三个字以上的词,取词的第一个字的声母作首码编码,再取前三个字的声母作次码编码,第四个字及后面的字一律舍弃。
本输入方法设置了“生字查询办法”,把一些冷僻字、易混淆字按照汉语拼音字母顺序排列,供查询生字使用。
部分汉字偏旁,按照《汉字偏旁名称表》规定的读音作次码编码。
本发明方法独特,对键盘不需作任何改动和处理,直接敲击键盘上相应的字母键或者数字键或者其它符号键,不需要机械性的死记硬背口诀和码键,易学、易记、易用、规范、通用,操作简单,本发明对中文信息处理技术具有创造性的贡献。
具体实施例方式
以下结合具体情况对本发明的具体实施方式
作详细说明。
根据技术方案要求,本发明是用汉字的声母A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z作为汉字编码的首码(第一码),汉字拆分后字元的声母a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z或者阿拉伯数字0、1、2、3、4、5、7、8、9或者汉语拼音字母i、u、v作为次码,次码由三码(第二、三、四码)组成,次码不足三码的,用阿拉伯数字“6”补齐编码,次码超过三码,次码取前两个字元和最后一个字元编码,多余的舍弃,首码和次码与计算机键盘上的字母键、数字键相对应,输入时,直接敲击键盘上相应的字母键或者数字键或者其它符号键。
汉字拆分后编码的字元,发音与阿拉伯数字0、1、2、3、4、5、7、8、9同音或者谐音的,用阿拉伯数字作次码。为了兼顾“三”与“山”和“四”与“石”不分的人们打字,凡是发“shan”“shi”音的,统一用“3”“4”编码,输入时,直接敲击键盘上相应的字母键或者数字键或者其它符号键;一笔的汉字字元丿、 、亅、乛、 、、乚、 用“i”作次码编码,方方块块的字元囗、凵、ㄇ、 匚、 彐、彐、 冂、 勹、 凹、凸、 卍用“u”作次码编码,汉字拆分后不是标准读音的字元,如ナ、丂、 、、 廴、 巜、巛、 屮、廾、 丬、亇、、尢、彡、攵、 彑、 冘、爫、 、 爿、氺、、 肀、 疋、 疒、、 镸、 ……一律用“v”作次码编码,输入时,直接敲击键盘上相应的字母键或者数字键或者其它符号键;不能拆分的穿插交插的独体汉字,用自身拼音编码,不足四码用6补齐,多余汉语拼音字母舍弃;能拆分的独体汉字,可以用拼音编码,还可以用汉字拆分后字元的声母或者阿拉伯数字或者i、u、v作次码编码,输入时,直接敲击键盘上相应的字母键或者数字键或者其它符号键;三个字以上的词,取词的第一个字的声母作首码编码,再取前三个字的声母作次码编码,第四个字及后面的字一律舍弃,直接敲击键盘上相应的字母键或者数字键或者其它符号键;汉字音码输入计算机的前提每一个汉字必须认识,否则,无法输入。本输入方法设置了“生字查询办法”,把一些冷僻字、易混淆字按照汉语拼音字母顺序排列,供查询生字使用,直接敲击键盘上相应的字母键或者数字键或者其它符号键,其方法是不认识的汉字先击A键,再输入已认识的字元,然后击空格键;刂(d)、亻(r)、讠(y)、忄(x)、辶(z)、扌(s)、犭(q)、钅(j)、饥(s)、宀(冖)(b)、艹(c)、牛(n)、(z)、(s)、 (y)、雨(y)、西(x)、足(z)、车(c)、土(t)、王(w)、火(h)、木(m)、禾(h)、米(m)、辛(x)、丰(f)这些汉字字元,按照《汉字偏旁名称表》规定的读音作次码编码,直接敲击键盘上相应的字母键或者数字键或者其它符号键。
具体实施例方式
分述如下一、常规汉字编码用汉字的声母作为首码编码,再用组成这个汉字字元的声母或者阿拉伯数字或者i、u、v作次码编码。
例字厚。
首码厚;次码厂、日、子;编码Hcrz。
这是最常用的编码。
例字明。
首码明;次码日、月;编码Mry6。
次码不足三码用阿拉伯数字“6”补齐。
例字疆。
首码疆;次码弓、土(一、田、一、田)一;编码Jgt1。
次码超过三码的汉字,不管有几个字元组成,次码只取前二个字元和最后一个字元的声母或者数字或者i、u、v作次码编码,其它字元一律舍弃。
例字辍。
首码辍;次码车、双、双;编码Ccss。
把“辍”字拆成“又、又、又、又”行不行?不行!遇到这一类字,只要能拆成三码,就满足了编码的需求,把“辍”字的右半部分拆成“又、又、又、又”既不科学又浪费时间,编码时还要舍弃多余的两个“又”字,所以,并不是拆字拆的越多越好。
例字羔。
首码羔;次码丷、王、灬;编码G2w4。
把“”拆出一个标准读音的“王”字来,也符合次码三码编码的要求。
例字孩。
首码孩;次码孑、亥;编码Hjh6。
把一个标准读音的“亥”字,拆成“亠、 ”,使人从心理上不能接受,为了保持汉字的优美,宁可把一个汉字拆分出一个标准读音的字元,也不能把一个标准读音的字元拆分成两个或者两个以上的字元,这即是“音数形汉字输入方法”的编码规则,它符合GF3001-1997《信息处理用GB13000.1字符集 汉字部件规范》的要求。编码明确后,只需敲击相应的按键,所需汉字自动给出。
由于各入的汉字书写习惯、理解能力和思维方式各异,同一个汉字,不同的人编码,其结果就有所不同。于是,本输入方法提供了多种编码方法,供输入汉字编码使用,免得为一个字元怎样编码反复思考而影响打字速度。
例字王。
首码王;次码一、土/干、一或者一、十、一/ 一;编码W1t6/Wg16/或者W141/Wv16。
这个字元就不能用“g”编码,因为它不是一个标准读音的字元,只要不是标准读音的字元,就用“v”取代编码。
以下各部分编码的输入方法均同上。
二、数字编码方法凡是与“0(○)、1(一)、2(二)、3(三、山)、4(四、石)、5(五)、7(七)、8(八)、9(九)”同音或者谐音的字元,用阿拉伯数字作次码编码,这样可减少许多重码机率。
○亠用0编码。
一丨丶衤礻用1编码。
二 冫丷阝卩用2编码。
三氵用3编码。
四灬纟用4编码。
1、阿拉伯数字“0”编码举例例字○。
首码○;次码○;编码L066。
例字捌。
首码捌;次码扌、另、刂;编码Bs0d。
2、阿拉伯数字“1”编码举例例字依。
首码依;次码亻、衣;编码Yr16。
3、阿拉伯数字“2”编码举例例字阮。
首码阮;次码阝、二、儿;编码R222。
4、阿拉伯数字“3”码编举例例字沅。
首码沅;次码氵、一、兀或者氵、二、儿;编码Y315/Y322。
5、阿拉伯数字“4”编码举例
例字罢。
首码罢;次码罒、土、厶;编码B4t4。
6、阿拉伯数字“5”编码举例例字语。
首码语;次码讠、五、口;编码Yy5k。
7、阿拉伯数字“7”编码举例例字华。
首码华;次码化、十或者亻、七、十;编码Hh46/Hr74。
8、阿拉伯数字“8”编码举例例字爸。
首码爸;次码父、巴或者八、乂、巴;编码Bf86/B818。
9、阿拉伯数字“9”编码举例例字玖。
首码玖;次码王、久;编码Jw96。
10、为了兼顾“石”与“四”和“山”与“三”不分的人们打字,“石”和“山”统一用“4”和“3”编码。
例字岩。
首码岩;次码山、石;
编码Y346。
普通话标准的人们,“岩”字仍然可以这样编码岩-Yss6。
三、i、u、v编码方法1、i码丿、 、亅、乛、 、、乚、 这些一笔的汉字字元,全部用“i”作次码编码,“i是一根扁,一笔字元全承担”。
例字儿。
首码儿;次码丿、乚;编码Eii6。
2、u码囗、凵、ㄇ、 匚、 彐、 冂、 勹、 凹、凸、 卍这些方方块块的字元用“u”作次码编码,它们与U相象,“u是一个筐,方方块块往里装”。
例字画。
首码画次码一、田、凵;编码H1tu。
虽然i和u只有两个,但在所有的字元里面却占有相当的比例,所承担编码的任务之重!3、v码ナ、丂、 、、 廴、 巜、巛、 屮、廾、 丬、亇、、尢、彡、攵、 彑、 冘、爫、 、 爿、氺、、 肀、 疋、 疒、 、 镸、飠、 ……这一类字元因技术原因还有一部分没有标准读音的字元(也叫“字根”、“字素”、“部件”)没有打出来,故省略。凡是出自GF 3001-1997《信息处理用GB 13000.1字符集 汉字部件规范》不是标准读音的字元,一律用“v”作次码编码。
例字傣。
首码傣;次码亻、 氺;编码Drvv。
第四码为什么不用“水”字的“S”而用“v”编码?因为,“氺”不是汉字“水”字的书写标准(已设定的偏旁部首除外),强按“水”字读,容易误导人们“水-氺”不分,准确地说,“氺”不是一个标准汉字,只是汉字的一个组成部分(字元)。所以,“音数形汉字输入方法”设定凡是拆分后不是标准读音的字元,一律用“v”编码。“是字取字,非字v代”。
i与v编码的区别i是一笔汉字字元,v编码是二笔以上的汉字字元。
i、u、v被挤出汉语拼音字母声母之列,加上0、1、2、3、4、5、7、8、9九个阿拉伯数字,比形码输入法几乎多出一半码键,给汉字输入计算机减少重码创造了天赐良机。由此可见,一个字母或者数字,对计算机中文信息处理起的作用是多么大啊!四、穿插交插的独体汉字编码方法1、不能拆分的穿插交插的独体汉字用自身拼音编码,不足四码用6补齐,多余的汉语拼音字母舍弃。
巴ba 编码Ba66秉bing编码Bing长chang 编码Chan才cai; 编码Cai6寸cun 编码Cun6垂chui编码Chui车che 编码Che6东dong编码Dong耳er 编码Er66甫fu 编码Fu66戈ge 编码Ge66乎hu 编码Hu66孑jie 编码Jie6孓jue 编码Jue6臼iiu 编码Jiu6柬jian编码Jian夹jia 编码Jia6甲jia 编码Jia6戋jian编码Jian及ji 编码Ji66力li 编码Li66来lai 编码Lai6乜mie 编码Mie6末mo 编码Mo66母mu 编码Mu66乃nai 编码Nai6女nü编码Nü66人ren 编码Ren6入ru 编码Ru66书shu 编码Shu6申shen编码Shen身shen编码Shen
束shu编码Shu6未wei编码Wei6毋wu 编码Wu66又you编码You6曳ye 编码Ye66由you编码You6弋yi 编码Yi66豸zhi编码Zhi62、能拆分的独体汉字,可用汉语拼音编码,也可用拆分后字元的声母或者数字或者i、u、v作次码编码。例七qi一、乚 编码Qi66/Q1i6 十shi一、丨 编码Shi6/S116巾jin冂、丨编码Jin6/Ju16 丸wan 丿、 丶编码Wan6/Wii1九jiu丿、 编码Jiu6/Jii6 出chu 凵、丨、凵编码Chu6/Culu中zhong口、丨 编码Zhon/Zk16 串chuan口、口、丨 编码Chua/Ckk1也ye乜、丨 编码Ye66/Ym16 本ben木、一编码Bm16大da一、人 编码Da66/D1r6 夫fu二、人 编码F2r6木mu十、八 编码Mu66/M486 子zi了、一 编码ZL16两liang一、冂、从 编码Lian/L1uc 丰feng三、丨 编码Feng/F316卅sa川、一 编码Sa66/Sc16 电dian曰、乚 编码Dian/Dyi6(Dri6)丹dan 丶、一 编码Dan6/Du11册ce 一编码Ce66/Cuu1冉ran冂、土编码Ran6/Rut6世shi廿、 编码Shi6/Sni6央yang 大 编码Yang/Yud6农nong冖、编码Nong/Nvv6丈zhang一、乂 编码Zhan/Z116史shi 口、 编码Shi6/Sk16吏li一、口、 编码Li66/L1k1 事shi一、口、肀 编码Shi6/S1kv夷yi一、弓、人 编码Yi66/Y1gr 弗fu 弓、 编码Fu66/Fgv6曲qü曰、 编码Qu66/Qy26(Qr26) 革ge廿、 编码Ge66/Gnv6更geng一、曰、 编码Geng/G1y1(G1r1)五、三个字以上词编码方法三个字以上的词,先取词的第一个字的声母作首码编码,然后取前三个字的声母作次码编码,第四个字及后面的字一律舍弃。
例词中华人民共和国/黄河水利委员会——编码Zzhr/Hhhs。
例词国务院总理/中央委员会——编码Ggwy/Zzyw。
例词国泰民安/实事求是——编码Ggtm/Sssq。
例词计算机/河南省;编码Jjsj/Hhns。
本输入方法没有设置两个字的词,因两个字的词太多,用挑选词的时间,汉字早已打出来了。
六、生字查询方法汉字音码输入计算机的前提每一个汉字必须认识,否则,无法输入,查字典除外。
本输入方法设置了“生字查询办法”,把一些冷僻字、易混淆字依照汉语拼音字母顺序排列供查询生字使用。
遇到不认识的汉字先击“A”键,再输入已认识部分的字元,然后击空格键,不认识的汉字就显示在屏幕上供编码选用。
例如不认识“卤、囟、卣”。其查询方法为先敲A键→输入“口”字→按空格键→卤lǔ(Lvu1)、囟xìn(Xiu1)、卣yǒu(Yvuu)这一类带有拼音和编码的汉字跃上屏幕供打字选用。
例如不认识“殳、矍、亟”。其查询方法为先敲A键→输入“又”字→按空格键→殳shū(Sjy6)、矍jué(Jmmy)、亟jí(JLk1)等字就出来了。“殳”字可输入“几”;“矍”字可输入“目、人”;“亟”字还可输入“口、了、一”等字都可打出相应的“生字”供选用。
不认识的汉字怎么查询?先敲A键,再取汉字的首笔笔画,用1表示“横”,用2表示“竖”,用3表示“撇”,用4表示“捺”,用5表示“折”,然后按空格键,不认识的汉字就显示出来。
例字不认识“臼”字。其查询方法为先敲A键→输入此字第一笔“3(撇)”→按空格键→臼jiu等字就出来了,并附有编码供选用。
例字不认识“艮”字。其查询方法为先敲A键→输入此字第一笔“5(折)”→按空格键→艮gen等字就出来了,并附有编码供选用。
七、部分偏旁标准读音本输入方法选定的刂(d)、亻(r)、讠(y)、忄(x)、辶(z)、艹(c)、扌(s)、犭(q)、钅(j)、宀(冖)(b)、饥(s)、雨(y)、西(x)、车(c)、足(z)、土(t)、王(w)、火(h)、木(m)、禾(h)、米(m)、辛(x)、丰(f)、牛(n)、(s)、 (y)这些汉字字元,按照《汉字偏旁名称表》规定的读音作次码编码。
以上七种汉字输入编码方法,用二十三个汉语拼音字母A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z作汉字编码的“姓氏”,再用汉字拆分后字元的声母a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z或者0、1、2、3、4、5、7、8、9或者i、u、v作“名字”,如同百家姓一样,不同的汉字,有不同的姓名,想同名同姓(重码)都很难。构成了完整的“拼音、数字、字形”三合一的汉字输入方法。
这种编码方法,易学——不须死记硬背,拿起就会,放下不忘;易用——重码率极低,输入速度更快;规范——符合国家汉字部件规范;通用——不管天南海北,普通话标准不标准,只要会拼音,认识阿拉伯数字就会打字。解决了“形码”输入法背口诀和“音码”输入法大量同音字的难题,是音码和形码的完美组合。
这种编码方法,使拆分后的字元没有打乱汉字的书写结构,更便于汉字的认识和书写,适合大、中、小学校的学生和文化水平较低的人们操作计算机,这对提高中华民族识字水平和文化水平,推动计算机的普及,将会起到更大的促进作用。
这种编码方法,力求用最少的时间(相对)和精力来达到最大的输入效果,有巨大的推广应用价值。
为了便于公众学习和掌握该编码方法,正在编写教材,供计算机爱好者学习参考;也可制作成光盘、软件供安装于计算机;还可建立网站供用户下载使用。音数形汉字输入方法——使中文信息处理技术又向前迈出了一大步。
权利要求
1.一种音数形汉字输入方法,其特征在于,是用汉字的声母A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z,作为汉字编码的首码,汉字拆分后字元的声母a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z和阿拉伯数字0、1、2、3、4、5、7、8、9及汉语拼音字母i、u、v作次码,次码由三码组成,次码不足三码的,用阿拉伯数字“6”补齐编码,次码超过三码的,次码取前两个字元和最后一个字元编码,多余的舍弃,首码和次码与计算机键盘上的字母键、数字键相对应,输入时,直接敲击键盘上相应的键;汉字拆分后编码的字元,发音与阿拉伯数字0、1、2、3、4、5、7、8、9同音或者谐音的,用阿拉伯数字作次码,凡是发“shan”“shi”音的汉字及字元,用“3”“4”作次码编码,输入时,直接敲击键盘上相应的数字键;一笔的汉字字元丿、 、亅、乛、、、乚、 用“i”作次码编码;方方块块的字元囗、凵、ㄇ、 匚、 彐、、 冂、 勹、、 凹、凸、卐、卍用“u”作次码编码;汉字拆分后不是标准读音的字元ナ、丂、 、マ 丩、廴、 ス、 巜、巛、 屮、廾、丌、丬、亇、、尢、彡、攵、 乇、彑 耂、冘、爫、旡、、 爿、氺、 禸、肀、弔、 疋、歺、疒、癶、 虍、 镸、 用“v”作次码编码,输入时,直接敲击键盘上相应的键;不能拆分的穿插交插的独体汉字,用自身拼音编码,不足四码用6补齐,多余字母舍弃;能拆分的汉字用拼音编码,或用汉字拆分后字元的声母或者阿拉伯数字或者i、u、v作次码编码,输入时,直接敲击键盘上相应的键;三个字以上的词,取词的第一个字的声母作首码编码,再取前三个字的声母作次码编码,第四个字及其后面的字一律舍弃,直接敲击键盘上相应的键;不认识的汉字先击A键,再输入已认识的字元,然后击空格键;刂、亻、讠、忄、辶、扌、犭、钅、饥、宀、艹、牜、、、 雨、西、足、车、土、王、辛、丰汉字字元,按照《汉字偏旁名称表》规定的读音作次码编码,直接敲击键盘上相应的键。
全文摘要
本发明是一种音数形汉字输入方法,可有效解决计算机汉字输入难、记忆难和同音字多的问题,该方法是用汉字的声母A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z作首码,拆分后字元的声母a、b、c、d、e、f、g、h、j、k、l、m、n、o、p、q、r、s、t、w、x、y、z或阿拉伯数字0、1、2、3、4、5、7、8、9或汉语拼音字母i、u、v作次码,次码由三码组成,次码不足三码用6补齐编码,超过三码取前两个字元和最后一个字元编码,多余的舍弃,首码和次码与键盘上的字母键、数字键相对应,输入时击相应键,其方法简单,易学,易用,速度快,是音码和形码的完美组合,易普及推广应用,对中文信息处理技术具有创造性的贡献。
文档编号G06F3/023GK1588285SQ200410060468
公开日2005年3月2日 申请日期2004年8月18日 优先权日2004年8月18日
发明者袁长宝 申请人:袁长宝
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1