数码汉字输入法的制作方法

文档序号:6330376阅读:451来源:国知局
专利名称:数码汉字输入法的制作方法
数码汉字输入法是一种计算机汉字输入方法,同时可用于汉字检索。
公知的汉字输入法,多靠拆字根,或用拼音。拆字根法字根多达百余个,分类时又有概念限定交叉的现象,难记难学,常令初学者临难而止。拆字根时又常破坏汉字结构,尤为文字学专家所责难,斥之为汉字编码中的“精神污染”。拼音输入重码太多,最怕遇到不认识的字;而且中国是方言大国,口音重的人用不了拼音。上述两类方法又都用英文键盘,因英文、汉语拼音读音差异,使用不便,更不用说那些不懂英文的人了。从理论上讲,汉字是世界上公认的历史最悠久、发展最完善的文字之一,无须依靠其它文字,拄着拐棍进入计算机世界。
已知的数字编码不多见,在探索汉字数字化方面瑕瑜互见。如“笔顺码汉字输入法”,好学易记是其优点。但六位码明显太长;且重码字多,如8171有21个字,8174有51个字。其编码取前三码和后三码,取后三码属倒插笔,与笔顺相忤。其数字7有 字形,如打“或”字,第一码取 但按笔顺,“或”字第一笔之后应写“口”,取 又属倒插笔。“戈”字旁字极多,这样编码自然不便。闻名于世的四角号码,开数字编码之先河。但其重码率高,不得不用“附号”补救之。另外按左上、右上、左下、右下的顺序取角,对上下结构字方便,对左右结构字却不方便;但左右结构字远多于上下结构字,其取角顺序似可商榷。另汉字形体经数千年发展,形态丰富多采,说“方块”是总其大观;但一律以“四角”视之,也未见精当。如“一、中、飞、丫、人、凸、奉、希”之类,一律按四角取角,恐有不便之处。
数码汉字输入法借鉴前人和当代的有益经验,设计了一套简明好记的笔形组合和数字编码规则,目的是提供一种简便好学的方法。只要认识汉字、有小学文化程度,不论其年龄大小,是否会英文,从事何种职业,都能轻松学会电脑打字,籍此以推动计算机普及。
数码汉字输入法的目的是这样实现的规定8种单笔画和18个常用部首,分成10组与数字小键盘10个数字对应,按“数码汉字输入法编码规则”编码,同时敲击键盘数字,即可输入GB汉字编码字符集相应的汉字。
试分述如下一、笔形与数字的对应关系1、第一类笔形“一”和“大”对应数字1;“丨’和“木”对应数字2;“丿”和“儿”对应数字3;“丶”和“土”对应数字4;“丶”和“小”对应数字5;“∠(折)”和“口”对应数字6;“ (左向勾)”和“日”对应数字7; (右向勾)”和“人”对应数字8;“冂”和“十”对应数字9;“厂”和“月”对应数字0。
2、第二类笔形“疒、辶、匚”对应数字4;“气、门、口(大口框)”对应数字0。a.“一”含 如“刁、北、或、冷、海”之类的左下角笔形。b.“ (折)”含左向勾和右向勾之外的所有折笔。如“发、廷、对、登”之类的左上角笔形,“幺、击、亡、去”之类的左下角笔形,“买、字、欠、久”之类的右上角笔形。c.“ (左向勾)”含所有位处下方、笔势顺时针方向的勾(注意笔形 如“买”字,位处上方,不属此类;归入折笔)。如“寸、刀、习、船、乃、马、弗、怼”之类字中的左向勾。d.“(右向勾)”含所有逆时针的右向勾。 如“乙、匕、飞、成、钱、以、尤、心”之类字中的右向勾。e.“大”含 如“买、头”之类。f.“木”含 如“树、根”之类。g.“儿”含“ ”,如“尴、辉、兢、流、秃”之类字中形似的笔形。h.“土”含“士”,如“吉、壬、任、均”之类。(注意“土”由三笔写成, 不作“土”。如“切、铁”之类,其左下角笔形不作“土”。)i.“小”含“ “少、雀、尝、常”的上方笔形,“录、隶”之类的下方笔形,“刺、敕”之类左下角笔形,“杀、东、乐、杂”之类下方的笔形。j.“日”含“曰”,如“最、量、昌、曼”之类。k.“人”含 如“丛、舒、命、全”之类,前两字的左上角和后两字的上方的笔形;“信、任”之类左方的笔形;“钢、铁”之类左上角的笔形;“签、笔”之类左上角和右上角的笔形。1.“十”含 以及某笔形的一段在它角与“一”组成的“十”。如“段、斗、轮”之类字中的 “打”的左上角,“屯”的上方,“韩”的右上角的笔形。
二.笔形关系以数码汉字输入法所规定的笔形为根据,提出“一形独体”、“突出居中”、“内含居中”、“同角相交”、“同角相接”、“同角相离”六类笔形关系。试举例如下a.一形独体型其特点为一种笔形构成一个独立的字,如“一、大、木、儿、人、乙、十、厂、月、门”之类。
b.居中突出型其特点为一种笔形在上、下、左、右方,居中突出于其它笔形。有三种情况a.居中突出,两侧无其它笔形。如“宁、重、中,云”之类,上方依次有“丶、丿、丨、一”突前;“丁、个、希、中”之类,下方依次有“口、丨、丨、丨”突出;“情、喑、晾、巾”之类,左方依次有“丶、口、日、丨”突出;“讣、办、扣、和”之类,右方依次有“丶、丶、口、口”突前。b.居中突出,一侧另有笔形。如“牛、生、朱、失”之类,左上角各有“丿”的笔形。c.居中突出,两侧各有笔形,如“炎、岗、业、兆、非、央、坐、脊”之类。
c.内含居中型其特点为一种笔形居中但不突出,两侧有笔形。如“义、舆、卅、街”之类,上方依次有“丶、∠、十、土”内含居中;“氐、苷、官、笊”之类,下方依次有“丶、一、一、丨”内含居中。
d.同角相交型其特点为两种笔形在同一角互相交叉。如“替、邦”之类的左上角,“丸、孔”之类的左下角,“妆、姊”之类的右上角,“斥、伟”之类的右下角。
e.同角相接型其特点为两种笔形在同一角互相连接。如“欤、彪”之类的左上角,“衷、狗”之类的左下角,“俊、修”之类的右上角,“筇、拆”之类的右下角。
f.同角相离型其特点为两种笔形在同一角平行存在。如“频、划”之类的左上角,“刻、赤”之类的左下角,“伏、试”之类的右上角,“想、榕”之类的右下角。
三、编码规则1.编码总则十八字总则“中间突出优先,中间之后两边,近角笔形优先。”(具体体现详见“取码方法”和“取码顺序”)2.取码顺序按以下规则依次取码a.任一汉字(除b所规定的偏旁字之外),都依左上角、左下角、右上角、右下角顺序取码。
b.数字4所对应的“疒、匚、辶”偏旁字和数字0所对应的“气、门、口(大口框)”偏旁字,取码顺序分两步笔一步,所列偏旁对应数字取为第1码;第二步,所余笔形再重新按取码顺序(a)取足3码,不足3码者自然结束。如“病”,第1码取“疒”(4);所余笔形为“丙”,“丙”再依次取1、9。“氖”,第1码取“气”(0);所余笔形为“乃”,再依次取7、3。“逖”,第1码取“辶”(4),;所余笔形为“狄”,再依次取3、7、3。
3.取码方法
(1)数角共有一种笔形的只取一码。如“乙(6)、本(2)、太(1)、乜(87)、与(711)”。又如“买、卫、奇、亘”,上方两角依次取6、7、1、1;“蓼、尴、垄、之”,下方两角依次取3、3、4、4”;“展、弗、低、刚”,左方两角依次取3、3、8、9;“仍、拽、拂、拇”,右方两角依次取7、8、2、7。
(2)“亠”(衣字头)居中时,取码为5、1左上角为5,右上角为1。如“齐、夜、亢、雍”之类,左上角取5,右上角取1。笔形“亠”只在一角,则不属此类,如“刻、孰、氓、就”之类。
(3)居中的笔形,分四种情况取码a.上下或者左右没有其它笔形的,视为占有两角,同一方的两角只取一码。如“永、党、中、肃、云、千、字、兵”之类,上方两角只取一码,依次为5、5、2、2、1、3、5、3;“冬、丫、字、希、宁、甲、拿、蓼”之类,下方两角只取一码,依次为5、2、7、2、7、2、7、3;“临、叫、快、帐”之类,左方两角只取一码,依次为2、6、5、2;“讣、和、办、卧”之类,右方两角只取一码,依次为5、6、5、5。此类情况中,特别注意相交居中的笔形,如“中、肃、拿、希”之类。
b.两种笔形交叉居中突出,在左取左、在右取右、在上取上、在下取下。如“希、叠”之类,上方有交叉居中笔形,左上角依次取5、5,右上角依次取3、6;“受、妥”之类,下方有交叉居中笔形,左下角依次取6、3,右下角依次取4、6;“欢、难”之类,左方有交叉居中笔形,左方两角取6[参见取码方法(5)之a]。
c.一侧近角处有其它笔形的,居中的笔形只作为另一角的取码依据。如“牛、先、朱、失”之类,左上角有笔形,上方两角依次取39、34、39、33;“书、必、上、者”之类,右上角有笔形,上方两角依次取25、53、21、43;“孑、君、著、矛”之类,左下角有笔形,下方两角依次取17、36、37、37、;“孓、乍、节、韦”之类,右下角有笔形,下方两角依次取74、21、27、27。
d.两侧近角处都有笔形的,不取中间取两侧。如“炎、岗、业、兆、央、非、坐、脊”之类,上方两角依次取两侧的笔形53、62、53、53、26、11、88、53;“廿、苷、氐、家、承、官、非、永”之类,下方两角左右依次取99、99、88、34、64、26、11、64。[注意如“廿、苷、官、菅”下方均为“一”居中,应取两边的笔形。但如“倌、馆”之类,右下角“一”不为居中;按“同角相接,在下取下”的原则,右下则应取1。参见取角方法(5)之b。](4)一种笔形的一部分,与其它笔形在另一角相交,可组成另一笔形。如“打”,左上角取9、左下角取7;“求”,左上角取9、下方两角取5;“失”,右上角取3、下方两角取1;“在”,左上角取3、左下角8;“钝”,右上角取9、右下角取8;“电”,上方两角取2、右下角取8。但两种笔形同在一角,则不属此例。如“势”左上角应取7,“冉”左下角应取9,“撵”右上角应取3,“鳞”右下角应取2。
(5)同一角有两种笔形,上方两角优先取在上的笔形,下方两角优先取在下的笔形;如上下不明,取在外的笔形。下面试分相交、相接、相离三种类型举例a.相交左上角取在上笔形举例替(3)邦(3)郁(3)弗(3)驾(3)鸠(3)狼(3)教(4)左上角取在外笔形举例发(6)刈(5)弑(5)刹(5)郗(5)左下角取在下笔形举例丸(3)芤(7)廷(6)那(3)必(3)葬(3)郗(2)邦(3)左下角取在外笔形举例茄(3)劝(6)刈(3)效(3)始(3)皴(6)翅(6)劐(6)右上角取在上笔形举例妆(6)姊(2)杖(3)骁(8)妓(9)他(2)曲(2)揍(3)右上角取在外笔形举例华(3)佬(3)稀(3)驳(3)弩(6)淆(3)化(3)缀(6)右下角取在下笔形举例斥(2)伟(2)缔(2)姆(7)蛾(8)氓(8)绋(2)姊(2)右下角取在外笔形源例级(4)线(8)镂(6)拢(8)发(4)授(4)戒(8)伤(7)b.相接左上角取在上笔形举例欤(7)彪(2)刿(2)咎(3)登(6)芈(2)欧(1)颖(8)左上角取在外笔形举例奘(6)熨(3)愍(8)鬓(2)巽(8)郜(3)犋(3)汆(3)左下角取在下笔形举例衰(8)群(6)狗(7)昴(3)菱(6)翩(9)社(2)都(7)左下角取在外笔形举例颁(3)歉(3)邪(3)邶(1)剔(3)毅(3)射(3)鼐(3)右上角取在上笔形举例俊(6)修(3)移(3)缱(2)欺(3)抱(3)拈(2)咎(2)右上角取在外笔形举例指(3)能(3)骅(3)屿(1)赀(3)骥(3)排(1)飞(3)右下角取在下笔形举例筇(2)扑(2)赤(7)茚(2)屣(8)诈(2)倌(1)馆(1)右下角取在外笔形举例拙(2)搔(5)诼(4)咏(4)谦(4)稼(4)私(1)窟(2)c.相离左上角取在上笔形举例频(2)划(8)羽(7)戳(6)农(3)鹤(3)鸩(3)鼬(3)
左上角取在外笔形举例郯(5)豢(5)叛(5)将(5)浆(5)师(2)州(5)券(5)左下角取在下笔形举例刻(8)郡(6)郝(3)虢(7)剞(7)郧(8)郗(2)郇(7)左下角取在外笔形举例翁(1)验(1)宏(3)郄(3)邸(8)邬(1)戕(3)惹(5)右上角取在上笔形举例倪(3)睨(3)揣(2)沁(5)汾(4)侻(3)右上角取在外笔形举例泼(5)诚(5)仪(3)揪(3)腴(6)球(5)矬(8)泌(3)右下角取在下笔形举例想(8)榕(6)环(2)咯(6)格(6)苏(7)赫(7)侦(8)右下角取在外笔形举例抓(4)辗(4)胀(4)低(8)掭(5)猿(4)恭(5)限(4)(6)空角取“0”码。空角有两个特点一是有明显的空角空间,二是另一角近角处无其它适当笔形可取。如、“笋”(8380)、“护”(9750)、“犷”(3750)、“七”(908)、“胪”(020)、屯(908)、钆(8808)、屯(908)、……有三种情况不作空角处理a.由本输入法规定笔形构成的独体字,不作空角。如“人、厂、儿、几、小”之类。b.笔形居中,左右或上下无其它笔形(参见“取码方法”(3)之a)。c.空角空间不明显,另一角近角处有笔形可取,应尽量再取码。如“鸟、鸣”之类,右上角各取7、7;“苛、芍、夺”之类,左下角依次取6、5、5;如“茸、葺”之类,左下角各取1。
(7)三个“十”组成的编码(999)简作“99”(即有了两个“十”时,如剩下只有一个“十”,就不再取了)。如“草、萃、革、苹”之类。
权利要求
l、一种汉字输入方法,设立10组笔形与数字键盘10个数字相对应,其特征是“一、大”与1对应,“丨、木”与2对应,“丿、儿”与3对应,“\、土”与4对应,“丶、小”与5对应,“∠(折)、口”与6对应,“勺(左向勾)、日”与7对应,“ (右向勾)、人”与8对应,“冂、十”与9对应,“厂、月”与0对应;另外,“疒、辶、匚”与4对应,“气、门、口(大口框)”与0对应。
2.根据权利要求1所述的汉字输入法,其取码顺序特征是a.数字4所对应的“疒、辶、匚”偏旁字和数字0所对应的“气、门、口”偏旁字,所列笔形取为第1码,所余字形再按左上、左下、右上、右下顺序取足3码,不足3码者自然结束;如“病”字则取419,如“国”则取014,如“氧”则取0593b.GB汉字编码字符集其余字,均按左上、左下、右上、右下顺序取码,如“行”则取为3817,如“中”则取为2。
3.根据权利要求1所述的汉字输入方法,依据所设立的26种笔形,提出六种笔形组合关系,其特征为a.“一形独体型”,其特点为一种笔形构成一个独体字,如“一、大、十、月”之类;b.“居中突出型”,其特征为在上下、左右四方,有笔形居中突出,两侧或有笔形、或无笔形,如“中、字、希、情、办、讣”之类;c.“内含居中型”,其特征为笔形居中但不突出,两侧有笔形,如“廿、苷、氐、官、卅、世”之类;d.“同角相交型”,其特征为两种笔形在同一角相交,如“弑、效、他、放”,左上、左下、右上、右下依次有相交笔形;e.“同角相接型”,其特征为两种笔形在同一角相连接但不交叉,如“巽、剃、能、诼”,其左上、左下、右上、右下依次有笔形相接f.“同角相离型”,其特征为两种笔形在同一角并存,但不相交、相接,如“郯、刻、优、苏”,其左上、左下、右上、右下依次有相离笔形。
4.根据权利要求1、3所述的汉字输入方法,六种笔形取码方法其特征为a.“一形独体”只取1码,如“一、大、口、乙”之类;b.居中笔形分四种情况取码(a).上下、左右四方只有一种笔形居中突出[“亠(衣字头)”除外],同一方两角只取一码,如“云、幅、令、办”之类,依次是左上、右上取为1,左上、左下取为2,左下、右下为5,右上、右下为5;(b).两种笔形交叉居中突出的,在左取左、在右取右、在上取上、在下取下,如“希”则左上取5、右上取3,如“艰”则左上取6、左下取6(c).一种笔形居中突出而一侧近角有笔形,居中突出的笔形只作另一角的取码依据,如“求”则左上角取9、右上角取5,如“牛”则左上取3、右上取9;(d).居中笔形两侧近角各有笔形的,不取中间取两侧,如“坐”则左上、右上各取8,如“廿”则左下、右下各取9;c.同角相交、同角相接、同角相离型,在上取上、在下取下,上下不明则取外,如“登”则左上取上为6,如“俊”右上取上为6,如“榕”右下取下为4,如“发”则左上角取外为6,如“能”则右上取外为3,如“限”右下取外为4。
全文摘要
一种数码汉字输入方法。它设立8种单笔画和18个常用部首,分成10组与小键盘10个数字相对应。数字4所对应的“疒、辶、匚”和0所对应的“气、门、□”偏旁字,取码顺序分两步:一、所列偏旁取为第1码;二、所余笔形,再按左上、左下、右上、右下依次取足3码。GB汉字编码字符集其余各字,均按左上、左下、右上、右下顺序取码。同时,依据26种笔形规定“一形独体、居中突出、内含居中、同角相交、同角相接、同角相离”六种笔形组合,规定了相应的取码方法。重码率为千分之0.0022。
文档编号G06F3/023GK1281173SQ00100098
公开日2001年1月24日 申请日期2000年1月10日 优先权日2000年1月10日
发明者熊海龙 申请人:熊海龙
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1