汉字编码方法及其所用键盘的制作方法

文档序号:6417335阅读:347来源:国知局
专利名称:汉字编码方法及其所用键盘的制作方法
技术领域
本发明涉及到汉字信息处理技术,具体地说是一种汉字的编码方法及其所用的键盘。
汉字的编码方法多种多样,最早的整字编码法将一个汉字作为一个键,输入时无需编码,但因其键数太多,寻找困难,输入汉字的速度较慢,已基本被淘汰。目前较多采用的编码方法有以拼音为基础的编码法、五笔字形为代表的形符编码法等,尤以形符编码法居多。拼音编码法对于大多数咬字不准的南方人来讲较麻烦,同音字又太多,而且遇到不认识的汉字时一时也无法输入,输入速度相对较慢。形符编码法将汉字按一定的规则拆为字根(或称字元),输入时按汉字的结构输入其构成字根的代码组合,这其中五笔字形因其易记忆、输入速度较快、重码较少而广为流行。但在输入汉字时,五笔字形须将汉字拆分为四部分(四个字根),比较麻烦;五笔字形输入时有时须用识别码,要考虑汉字的笔划和结构,处理过程较复杂;五笔字形需记忆的简码字较多,在5000个以上(如不记就需看屏),而且词组编码的系统性较差。在使用键位方面,五笔字形要用到26个字母键、空格键及数字键(重码时需用),键盘的上下使用范围较宽,不便于输入时的指法控制。
本发明的目的在于提出一种能简化汉字拆分过程、缩短汉字编码码长、减略对大量简码字的“查、看、记”并能使汉语词组编码系统化的汉字编码方法及其所用键盘。
为达到上述目的,本发明的汉字编码方法如下选择汉字中一部分笔划、笔划组合及偏旁部首作为组成汉字的基本单位即字根,每个字根被赋予一个字母-正码,相同字母的字根被归并入一组,每个汉字按其构成的笔划或部首被赋予由一个或几个字母组成的代码;同时对每个字根还用数序或类似方法给予编码-补码,使每个汉字字根都具有“形”-正码和“数”-补码的双重编码;编码时,一个汉字最多只能被拆分为三部分,即最多只具有三个字母组成的正码组合,当某些汉字的编码不足三正码,或三正码后出现重码及进行词组编码时,正码尾后需加补码或补码序组。
上述汉字编码方法中,为减少拆分汉字的复杂性,使拆字方法更为简单直观,挑选了如下的笔划或部首作为字根,并按下述方法归并“王、一、五、工、天、于、吏、 被归并入一组;“廾、二、亍、甘、亏、韦、专、卅、 被并入一组;“木、三、屯、七、未、末、耒、世、 ”被并入一组;“尸、革、弓、其、巴、巳、已、己、 ”被归并入一组;“阝、了、耳、予、又、廴、 被归并入一组;“才、丁、匚、乙、戋、彐、弋、肀、 被归并入一组;“土、十、西、士、酉、古、走”被归并入一组;“石、厂、歹、大、车、东、犬、戊、兀、丆、ナ”被归并入一组;“门、雨、也、力、马、甫、习、 、ク”被归并入一组;“讠、方、文、一、礻、言、衤、之、辶、 被归并入一组;“口、凸、凹、口(口为上口)、︱、员”被归并入一组;“日、虫、甲、田、中、日(日为上日)、由、 被归并入一组;“目、皿、止、齿、足、口、早、黑、刂、 被归并入一组;“巾、山、骨、见、贝、凵、 被归并入一组;“忄、小、水、虎、卜、比、、 被归并入一组;“广、八、户、鹿、广、麻、唐、丶、、冫”被归并入一组;“火、羊、并、米、”被归并入一组;“氵、六、心、辛、立、灬、巛”被归并入一组;“宀、冖、角、冂、饣、欠、穴”被归并入一组;“鱼、犭、殳、九、几、丿、各、夂”被归并入一组;“钅、入、今、彳、人、 被归并入一组;“禾、牛、气、彡、片、舌、千、矢、攵 被归并入一组;“纟、斤、乌、兵、舟、乒、卯、幺、 被归并入一组;“竹、厶、采、女、爰、豸、 被归并入一组;“月、勺、乃、及、自、匕、身、鼻、勹、 被归并入一组;“亻、隹、血、臼、白、鬼、奥、鼠、 被归并入一组。
上述汉字编码方法中,按各组字根的顺序,每组字根分别用字母“Q”、“W”、“E”、“R”、“T”、“Y”、“U”、“I”、“O”、“P”、“A”、“S”、“D”、“F”、“G”、“H”、“J”、“K”、“L”、“Z”、“X”、“C”、“V”、“B”、“N”、“M”作为其正码。
上述汉字编码方法中,所述补码为数序补码,共有4个,分别为0、1、2和3。
一种用于实现上述汉字编码方法的键盘,至少包括26个字母键及其它一些数字键或符号键,其键位与标准英文键盘相同,它用字母键作正码键,将上述同一字母表示的字根归入一个字母键,所有的字根被归并入26个字母键上;用其它一些数字键或符号键作补码键表示补码序列。
上述键盘中,按照所述汉字编码方法,各字母对应的字根被归入键盘上相同字母的字母键上,并用“<”、“>”、“ ”和“”四键作补码键,分别表示0、1、2和3。
本发明对汉字字根进行了“形”(正码,用字母表示)和“数”(补码,用数序或类似序列表示)的双重编码,一个汉字最多只能被拆分为三部(三个字母组成的编码,即正码组合)。采用了上述汉字编码方法后,大部分汉字只需用三个正码即可输入,与五笔字形的四码相比较缩短了汉字的码长;它的字根分类可基本按照横、竖、点、撇的规则排列(见附

图1),如第一排字母(从“Q”到“O”键)都是以横起笔的,并在附图1的第三栏中用符号给每个字根命名(如“横”、“双横”、“三横”、……),使字根分类实现了符号化,更为简洁、有序、明确;在使用键位方面,现有输入法一般要用到26个字母键、空格键和数字键,而本编码方法输入汉字时可只需要用到26个字母键和四个符号键共30个键位,缩小了键盘的上下使用范围,便于输入时的指法控制;在编码个数方面,五笔字型为254约40万个,而本发明补码码长可以不限,因而编码个数也可以无限;本编码方法中可容纳26×4=104个二键简码字,为五笔字形26个简码字的4倍。同时,本编码方法只需将汉字拆分为三部分,比五笔字形少分一部,明显减少了拆分汉字的复杂性,拆字方法更为简单、直观、规范,且操作时无需补击空格键,击键数比五笔字型少;本发明用数序(或类似序列如甲乙丙丁、ABCDE等)补码代替识别码,有以下优点1,不需要考虑太多的汉字结构;2,操作程序简单得多。识别码的操作程序为判别尾笔--(记忆编号)--判别字型(记忆编号)--归纳(组合编号)--击键(在15个键中选择),而补码的操作程序为判别字根(记忆编号)--击键(在4个键中选择)。五笔字形需记忆的简码字为5000个以上,而通过对GB-2312-80国标字集的汉字编码试验可得出,本发明需记忆的简码字104个,四键重码字约为250个,加上字根及字根编号,实现盲打的记忆量约为800个汉字单位。另外,本发明在词组编码上具有系统性,编码容易,易记易学,这一点通过下面的具体编码方法就可不难看出。
下面结合编码实例及附图对本发明作进一步详细说明。
图1是本发明的字根命名图;图2是本发明的基本字根编码图;图3是本发明键盘上主要键位的示意图。
图1中,每个字母对应有4栏,第一栏为字母,第二栏为字根命名,第三栏为字根命名记号,第四栏为特殊形态的字根。四个符号键也对应有四栏,第一栏为符号“<”、“>”、“?”和“”,其括号中的数字表示其补码,第二栏的“四、多、2、3”是对词组补码的编号,第四栏的 是尾码栏,尾码只能作汉字的第三部编码,如“恒”-“忄、一、旦”-“GQ1”(第三部可取“旦”的尾码1),而“亘”的编码为“QSQ”(取“一”、“日”、“一”的正码组合)。图2中共有6列,第一列为字母,第二列至第五列为字根,其中,第一栏对应的是字根的补码编号。每个字根下标的数字有两位,第一位是补码编号,第二位是顺序号。通常情况下,需补码时汉字编码一般只需补一位数补码编号。第六列为备注,其中说明了字头“口”、“日”的补码方法。此图也同时代表了全体字根的编码,字母表示所在行所有字根共同的正码,每个字根对应的补码编号和顺序号代表该字根的补码,如“Q”键的“王、一、五、工、天”这五个字根的编码分别为“Q00、Q01、Q10、Q20、Q21”。特殊字根无需编码,需要时可作“0”补码。此图中,我们把第二列左边的字根称为主基根,第二列右边的字根称为副基根。
本发明的汉字编码规则和方法如下一、汉字的编码方法。
1、字根字(单根字)是由一字母加两位数的补码合成的。附图2已全部给出了此类字的编码。两位数补码的三键字允许有26×4×4=416个。
2、两根字的编码规则和方法①、两基根补0。如“弄”-“王、廾”(均为主基根)-“QW0”,而“开”-“一、廾”-“QW01”(与“弄”重码,补“一”的全码“01”)。
②、一基根补另一根补码。如“邛”-“工、阝”(“阝”为基根)-“QT2”。
③、无基根补前一根补码。如“攻”-“工、攵”(均非基根)-“QC2”。
3、多根字的编码规则和方法①、一般的取码规则是取“一、二、尾”码。例如“品”-“口、口、口”-“AAA”“璎”-“王、贝、女”-“QFB”“壤”-“土、亠、 -“UPX”“警”-“艹、勹、言”-“WNP”②、几种特殊的取码规则A,叠部作一部。如“叠”-“又、冖、且”(三“又”取一部)-“TLD”。
B,中去“冖、宀、穴”。例如“蓉”-“艹、人、口”-“WXA”;“爱”- ナ、又”-“BIT”;而“受”-“ 冖、又”-“BLT”(只有三部不去“冖”)。
C,注意取尾码 “旦”、 例如“域”-“土、弋、一”-“UY1”;“提”-“扌、日、”-“YS2”。D,如无尾码,中部、尾部的一笔根让上部或下部的多笔根。如“孪”-“亠、刂、了”(尾部不取“一”)-“PM3”;“寅”-“宀、由、八”-“LSH”(二部不取“一”根);“抵”-“扌、 七”-“YVY”(尾部不取“丶”根)。注意,本规则中,除竖钩(“亅”、 外的拆笔均不作一笔,偏旁之首不作中部。E,象“微”、“嬴”这样中部或下部含有子三根(即含有三根的子根)的,去掉尾部取三码。如“微”-“彳、山、几”-“XFZ”(去“攵”取码);“嬴”-“亠、 女”-“PFB”(去“凡”取码)。4、重码字补码的规则和方法。(1)、主基根在字首的字。
①、三根不补。如“清”-“氵、、月”-“KEN”。
②、有叠根补0。如“潸”-“氵、木、月”-“KEN0”③、四根字补1。如“漯”-“氵、田、小”-“KSG1”④、四根以上补0。如“瀑”-“氵、日、水”-“KSG0”。(2)、副基根在字首的字。
①、三根补0。如“远”-“二、儿、辶”-“WIP0”(副基根在首,三根补0);而“蓬”-“艹、夂、辶”-“WIP1”(主基根在首,四根补1)②、多根字补码同主基根在首的多根字补码规则相同。如“旖”-“方、、丁”-“PCY1”(四根补1)。(3)、字首不为基根的字,补首字根补码。如“站”-“立、 口”-“KGA2”;“辚”-“车、米、 -“IJQ2”。(4)、一些特殊的补码规则(只适用于主基根在字首的汉字)。
①、拆内字补码,四根字的左内补0、右内补1、中内补3。这里的“内字”是指该汉字包含有全包围在另一个字根内、或三面包围在另一个字根内或在另一个字根左下部的字根,如“因、匡、可、内、式”的二部字根都为内,而含有在另一字根右下的字根如“仄、庆、良”的二部字根不称为“内字”。如“试”-“讠、弋、工”-“PYQ0”(左内补0);“诓”-“讠、匚、王”-“PYQ1”(右内补1);“呐”-“口、冂、人”-“ALX3”(中内补3);而“呙”-“口、冂、人”-“ALX3”(三根字上口补3);“揠”-“扌、匚、女”-“YYB0”(四字根以上补0)。
②、多一点“丶”补0。如“莸”-“艹、犭、尢”-“WZI0”;而“获”-“艹、犭、犬”-“WZI”(主基根在首,三根不补)。
③、异构字补2。这里的“异构字”是指含有三字根以上、且第二部含有两并列子根结构的字,如“蓝”、“桦”等汉字。编码方法如“蓝”-“艹、刂、皿”-“WDD2”。
④、横位口补0。这里我们把处于并列位置上的“口”根,如“洳”、“茹”等字的“口”根称作“横位口”。如“茹”-“廿、女、口”-“WBA0”,而“苔”一“艹、女、口”-“WBA”(非横位口,主基根在首,三字根不补)。5、补充说明。
(1)、特殊字根无需编号,需要时可作“0”补码。如“氏”-“VY0”。
(2)、为了保证一级汉字始终在屏幕上始终排在二级汉字的前面,我们还以采用“一级汉字简码方式”来编码,方法是①,在一级汉字与二级汉字都需要补码的情况下,一级汉字不补码。
如“辚”-“IJQ2”,而“磷”-“IJQ”(不补码);②,当一级汉字需补码,二级汉字不需补码时,一级汉字不补,二级汉字补0。如“幕”-“WSF”(不补码),而“蒉”-“WSF0”(二级汉字补0)。
(3)、在输入汉字时如遇重码,机器可响铃提示加击补码;无法区分的重码,可用重音提示,看屏选择补码。二、汉字的拆分规则说明。
(1)、一般规则①、多字根不拆交和内,自然拆分。这里的“内”与前述“内字”的含义相同,“交”是指有笔划贯穿整个字根的,如“束”、“朿”等。拆字方法如“整”-“束、攵、止”-“QCD”;“蠢”- 石、虫”-“QIS”。
②、水平直观拆分。如“柬”-“一、口、人”-“QDX”;“建”-“彐、二、廴”-“YWT”;“求”-“一、水、丶”-“QGH”。
③、两笔定一部。即当一下拆分不出来时,将两笔划定为一部首。
如“印”-“ -、卩”-“VQO”;“龙”-“ ナ、匕、丶”-“INH”;“殷”-“ 彐、殳”一“VYZ”。
④、当汉字拆分不足三部时,字根“马”、“立”、“穴”、“鬼”可进一步作如下拆分“马”一 -”,“立”-“六、-”,“穴”-“宀、八”,“鬼”- 厶”。如“音”-“六、-,日”-“KQS”。
(2)、应注意的几类字根的分部规则。
④、关于“冫”、 的分部规则。
A,两根以上作一部。如“壮”-“冫、︱、土”-“HAV”。
B,少于三根分二部。如“为”-“丶、力、丶”-“HOH”;“斗”-“丶、丶、十”-“HHV”;“冬”-“夂、丶、丶”-“ZHH”。
②、关于“手”、“毛”二字的分部规则。“手”-“、十”-“CY0”;“掰”-“、八、十”-“CHY”;“毛”-“、七”-“CE0”;“麾”-“麻、、七”-“HCE”。
③,关于“申、电”二字的分部规则。“申”-“田、丨”-“SA1”;“审”-“宀、田、丨”-“LSA”;“电”-“田、”-“SF1”。
三、简码字的取码规则说明。
因为每个字根都有四个补码,所以每个字母键都可配置四个二键简码字。例如,Q键的“王”、“一”、“五”、“工”四个字根就可以定义为简码字,分别编成“Q1”、“Q2”、“Q3”、“Q0”。也可以用相关联的字意来取简码字。例如,W键的简码字可为“二”、“四”、“六”、“八”,E键的简码字可为“三”、“五”、“七”、“九”等等。
四、词组的编码方法。
词组的编码一般都要加补码。其编码方法可以有多种,下面举出几种加以说明。
(1)、分类式,它按词组字数补码。
①,两字词组补2,前字取两码,后字取一首码。如“中国”-“中、中、口”-“SSD2”。
②,三字词组补3,每字各取一首码。如“北京市”-“冫、亠、亠”-“WPP3”。
③,四字词组补0,取一、二、尾字的首码。如“中国政府”-“中、口、广”-“SDH0”。
④,多字词组补1,取一、二、尾字首码。如“电子计算机技术”-“田、了、木”-“STE1”。
(2)、会意式,用一个词的正码记多个词组。如SSD(中国)、SSD0(中央)、SSD1(中心)、SSD2(中间)、SSD3(其中);又如UWC(十进制)、UWC0(二进制)、UWC1(八进制)、UWC2(十六进制)。
本方法系统性强,容易记忆,可以用于学习词库和专业词库的编码。
(3)、组合式。例如,若将中华人民共和国的编码定为SMD,则可将中华的编码定为SMD0,人民的编码定为SMD1,共和国的编码定为SMD2。本方法可以编制自定义词组。
(4)、复数式。如LBL(定义字修饰)、LBL00-03(上下划线)、LBL10-13(字体)……。本方法可用于专用词组的编码。
本发明的编码方法排列紧凑有序,字集可采用如下分配方案(1),高频字集,26×4(形×数)=104个;(2),字根字集,26×4×4(形×数×数)=416个;(3),两根字集,26×26×4(形×形×数)=2704个;(4)国标字非重码字集+一级词库,26×26×26(形×形×形)=17576个;(5)国标字重码字集+常用繁体字集+二级词库+自定义词,26×26×26×4(形×形×形×数)=70304个;(6),异体字、罕见字集+古汉字集+特殊词组,26×26×26×4×4(形×形×形×数×数)=281216个。
图3所示的是现有标准英文键盘中的主要键位,包括26个字母键和“<”、“>”、“?”和“”四个符号键,其它键位的安排与现有键盘相同。它是按照上述汉字编码方法,并根据图1和图2的字根归类方法,将所有的基本字根归并入26个字母键上,并按照“横、竖、撇、点”几种笔划将起始笔划相同的字根安排在键盘的同一行上,便于记忆。四个符号键作为补码键,分别代表“0”、“1”、“2”、“3”四个补码,其键位就在字母键旁,输入补码时便于指法控制,提高了输入速度。
权利要求
1.汉字编码方法,选择汉字中一部分笔划、笔划组合及偏旁部首作为组成汉字的基本单位即字根,每个字根被赋予一个字母-正码,相同字母的字根被归并入一组,每个汉字按其构成的笔划或部首被赋予由一个或几个字母组成的代码,其特征在于,它同时对每个字根还用数序或类似方法给予编码-补码,使每个汉字字根都具有“形”-正码和“数”-补码的双重编码;编码时,一个汉字最多只能被拆分为三部分,即最多具有三个字母的正码组合,当某些汉字的编码不足三正码,或三正码后出现重码及进行词组编码时,正码尾后需加补码或补码序组。
2.如权利要求1所述的汉字编码方法,其特征在于,它挑选了如下的笔划或部首作为字根,并按下述方法归并“王、一、五、工、天、于、吏、 被归并入一组;“廾、二、亍、甘、亏、韦、专、卅、 被并入一组;“木、三、屯、七、未、末、耒、世、 ”被并入一组;“尸、革、弓、其、巴、巳、已、己、 ”被归并入一组;“阝、了、耳、予、又、廴、 ㄋ”被归并入一组;“才、丁、匚、乙、戋、彐、弋、 被归并入一组;“土、十、西、士、酉、古、走”被归并入一组;“石、厂、歹、大、车、东、犬、戊、兀、丆、ナ”被归并入一组;“门、雨、也、力、马、甫、习、 被归并入一组;“讠、方、文、亠、礻、言、衤、之、辶、 被归并入一组;“口、凸、凹、口(口为上口)、︱、员”被归并入一组;“日、虫、甲、田、中、日(日为上日)、由、 被归并入一组;“目、皿、止、齿、足、口、早、黑、刂、 被归并入一组;“巾、山、骨、见、贝、凵、 被归并入一组;“忄、小、水、虎、卜、比、、ッ、ツ”被归并入一组;“疒、八、户、鹿、广、麻、唐、丶、 冫、被归并入一组;“火、羊、并、米、丷,”被归并入一组;“氵、六、心、辛、立、灬、巛”被归并入一组;“宀、冖、角、冂、饣、欠、穴”被归并入一组;“鱼、犭、殳、九、几、丿、各、夂”被归并入一组;“钅、入、今、彳、人、 被归并入一组;“禾、牛、气、彡、片、舌、千、矢、攵、 被归并入一组;“纟、斤、乌、兵、舟、乒、卯、幺、 被归并入一组;“竹、厶、采、女、 被归并入一组;“月、勺、乃、及、自、匕、身、鼻、勹、 被归并入一组;“亻、隹、血、臼、白、鬼、奥、鼠、 ”被归并入一组。
3.如权利要求2所述的汉字编码方法,其特征在于,各组字根按上述顺序分别用字母“Q”、“W”、“E”、“R”、“T”、“Y”、“U”、“I”、“O”、“P”、“A”、 “S”、“D”、“F”、“G”、“H”、“J”、“K”、“L”、“Z”、“X”、“C”、“V”、“B”、“N”、“M”作为其正码。
4.如权利要求1、2或3所述的汉字编码方法,其特征在于,所述补码为数序补码,共有4个,分别为0、1、2和3。
5.如权利要求1、2或3所述的汉字编码方法,其特征在于,汉字编码的方法主要有(1)、字根字(单根字)是由一字母加两位数补码合成的;(2)、两根字的编码规则和方法有①两基根补0;②一基根补另一根补码;③无基根补前一根补码;(3)、多根字的编码规则和方法有①一般的取码规则是取“一、二、尾”码;②叠部作一部;③中去“冖、宀、穴”;④注意取尾码 “旦”和“ ”;⑤如无尾码,中部、尾部的一笔根让上部或下部的多笔根;⑥中部或下部含有了三根的,去掉尾部取三码;(4)、重码字补码的规则和方法有①主基根在字首的字A、三根不补;B、有叠根补0;C、四根字补1;D、四根以上补0;②副基根在字首的字A、三根补0;B、多根字补码同主基根在首的多根字补码规则相同;③、字首不为基根的字,补首字根补码;(5)、只适用于主基根在字首的汉字的一些特殊的补码规则①拆内字补码,四根字的左内补0、右内补1、中内补3;②多一点“丶”补0;③异构字补2;④横位口补0。
6.如权利要求1、2或3所述的汉字编码方法,其特征在于,汉字的主要拆分规则有①、多字根不拆交和内,自然拆分;②、水平直观拆分;③、两笔定一部;④、汉字拆分不足三部时,字根“马”可拆分为 和“一”,“立”可拆分为“六”和“一”,“穴”可拆分为“宀”和“八”,“鬼”可拆分为 和“厶”。
7.如权利要求1、2或3所述的汉字编码方法,其特征在于,词组的编码采用分类式编码法,它按词组字数补码①,两字词组补2,前字取两码,后字取一首码;②,三字词组补3,每字各取一首码;③,四字词组补O,取一、二、尾字的首码;④,多字词组补1,取一、二、尾字首码。
8.一种用于实现如权利要求1所述的汉字编码方法的键盘,至少包括26个字母键及其它一些数字键或符号键,其键位与标准英文键盘相同,它用字母键作正码键,将上述同一字母表示的字根归入一个字母键,所有的字根被归并入26个字母键上,其特征在于,它用其它一些数字键或符号键作补码键表示补码序列。
9.如权利要求8所述的用于实现汉字编码方法的键盘,其特征在于,“王、一、五、工、天、于、吏、 被归入“Q”键;“廾、二、亍、甘、亏、韦、专、卅、 被归入“W”键;“木、三、屯、七、未、末、耒、世、 被归入“E”键;“尸、革、弓、其、巴、巳、已、己、 被归入“R”键;“阝、了、耳、予、又、廴、 被归入“T”键;“才、丁、匚、乙、戋、彐、弋、肀、 被归入“Y”键;“土、十、西、士、酉、古、走”被归入“U”键;“石、厂、歹、大、车、东、犬、戊、兀、丆、ナ”被归入“I”键;“门、雨、也、力、马、甫、习、 被归入“O”键;“讠、方、文、亠、礻、言、衤、之、辶、 ”被归入“P”键;“口、凸、凹、口(口为上口)、丨、员”被归入“A”键;“日、虫、甲、田、中、日(日为上日)、由、 被归入“S”,键;“目、皿、止、齿、足、口、早、黑、刂、 被归入“D”键;“巾、山、骨、见、贝、凵、 被归入“F”键;“忄、小、水、虎、卜、比、、 被归入“G”键;“疒、八、户、鹿、广、麻、唐、丶、 、冫”被归入“H”键;“火、羊、并、米、丷”被归入“J”键;“氵、六、心、辛、立、灬、巛”被归入“K”键;”宀、冖、角、冂、饣、欠、穴”被归入“L”键;“鱼、犭、殳、九、几、丿、各、夂”被归入“Z”键;“钅、入、今、彳、人、 被归入“X”键;“禾、牛、气、彡、片、舌、千、矢、攵、 被归入“C”键;“纟、斤、乌、兵、舟、乒、卯、幺、 被归入“V”键;“竹、厶、采、女、 被归入“B”键;“月、勺、乃、及、自、匕、身、鼻、勹、 被归入“N”键;“亻、隹、血、臼,白、鬼、奥、鼠、 被归入“M”键;并用“<”、“>”、“ ”和“”四键作补码键,分别表示0、1、2和3。
全文摘要
本发明公开了一种汉字编码方法及其所用键盘,它选择汉字中一部分笔划、笔划组合及偏旁部首作为基本组成单位即字根,每个汉字字根都具有“形”-正码和“数”-补码的双重编码,一个汉字最多只能被拆分为三部分,当编码不足三正码,或三正码后出现重码及进行词组编码时,正码尾后需加补码或补码序组。这种编码方法简化了汉字拆分过程,缩短了汉字编码码长,使汉语词组编码系统化,可广泛应用于各类汉字信息处理技术和设备中。
文档编号G06F3/023GK1286423SQ9912413
公开日2001年3月7日 申请日期1999年11月24日 优先权日1999年11月24日
发明者樊启伍 申请人:樊启伍
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1