中文字母字编码法的制作方法

文档序号:6416805阅读:380来源:国知局
专利名称:中文字母字编码法的制作方法
中文字母字编码法是周海筹、唐秀昌先生发明的汉字输入代码编码技术,是专为尖端码国际通用汉字输入法能兼容其它汉字输入系统和视窗而采用的编码方法。周海筹、唐秀昌先生根据中国汉字大部份是由形旁、声旁组成形声字以及大部份汉字都是由形旁、声旁这一汉字的结构规律,在极其艰苦的环境条件下,在庞大的汉字中,成功地提取了650个具有与英文字母相同组字功能特性和组字功能的形旁、声旁、部首、独体字、笔画字、字部件、合成笔画和笔画,并把这些组字单元统一命名为“中文字母字”。将78个在汉字中使用频度最高,组字效果最好的中文字母字经过科学组合、搭配,分成26组,每组三个组字单元,然后分别安排在电脑输入键盘与26个英文字母一一对应的键位上。把其余的中文字母字组成三个与英文字母一样的单字节字库,存储于电脑内存中。这样,汉字的输入形式、排列方式、数据格式、单字节中文字母字字库的生成等,与英文字母的输入形式、排列方式、数据格式、字库生成完全一致,电脑的汉字输入第一次与英文电脑接轨,解决了东方文字与西方文字电脑输入的统一,同时也就解决了中文用户望而却步的用户界面的汉化问题,也使得真正的汉字电脑的诞生成为可能。(关于“中文字母字”的组字技术,将有专门的发明申请资料)中文字母字编码法是严格按照中国汉字的书写顺序和形旁声旁组成形声字的汉字结构和规律进行取码编码的。
(一)键名字母字和笔画的编码。
根据中文字母字的组字原理,电脑键盘上的26组(78个)键名字母字,每一组字母字只有一个输入代码,即它们所处键盘键位的英文字母,就是它们的输入代码。如“门”、“月”和“冂”这组键名字母字的输入代码都是英文字母“A”;键名字母字“土”、“士”和“冫”,输入代码也都是英文字母“R”。在尖端码输入状态下键入英文字母“A”,击键一下,显示键名字母字“月”(“A”键位的右下角);击键三下显示该键位的第二个键名字母字“门”(“A”键位的左下角);击键四下显示该键位的部件“冂”(在“A”键位的正中央)。又如英文字母“C”相对应的三个键名中文字母字“
”和“扌”以及“乚”,它们的输入代码同样也是它们所处键位的英文字母“C”,击C键一下,显示该键位右下角的键名字母字“
”,击C键三下显示该键位左下角的键名字母字“扌”,击C键四下显示该键位中央的“乚”,其余以此类推。运用电脑键盘上的26组键名字母字的英文字母代码进行编码,可以组合和输入所有的中国汉字。
(二)键盘以外的汉字的编码。
根据“26组部循环组字”的原理,我们对电脑键位上的78个键名字母字只编单码。对于键盘键位以外的近600个存储于电脑内存中的其它字母字,也给予编码。这样,除了电脑键盘上的26组(78个)单码中文字母字以外,这78个键名字母字之间,可以碰撞产生出648个两码字。另外,通过键盘键位上的组字笔画,又可以调出所有存储于电脑三个单字节字库的中文字母字参与组字,并还原出成千上万个汉字,供用户选用。为了使这种组字方法能兼容目前市场上流行的众多的双字节的中文系统和视窗,我们还对键盘以外的成千上万个汉字也进行了编码。对于键盘以外的这些汉字的编码,首先要确定您所要输入的汉字是属于怎么样结构类型的汉字。如果是键名字母字,就用该字母字所在键位上的英文字母作为该字母字的代码。如果不是键名字母字,则必须分清该字的结构类型。尖端码取码的主要依据是按照汉字的左右型、上下型、上中下型、左中右型和杂合型五种结构类型以及每种类型汉字的笔画顺序取码的。
1、左右型结构的汉字的编码。在对左右型汉字取码时,如左右两边都是键名字母字,则分别取左右两个键名字母字在键位上的各自代码。如“明”字,是左右型结构,左边是键名字母字“日”,右边是键名字母字“月”,我们只需取“日”的代码“Q”和“月”的代码“A”,组成“明”字的代码“QA”。如果左边一个是键名字母字,而右边不是键名字母字,取码时先取左边键名字母字的代码(取其在键位上相对应的英文字母作为代码)单码,然后取右边的第一笔和第二笔代码。例如“汉”字,取左边的“氵”(F)和右边“又”字的第一笔“フ”和第二笔“”组成“汉”字的代码“FXD”即可。对键名字母字以外的左右型汉字进行编码,一般取左边的第一笔和第二笔,再取右边的第一笔或第二笔进行编码。例如“状”字,属左右型结构的非键名字母字汉字,则取“状”字左边“丬”的第一笔“ ”(R)和第二笔“丨”(H),然后再取右边“犬”字的第一笔“大”(Y)和第二笔“丶”(F)进行编码即可,“状”字的编码是“RHYF”。又如“教”字,属左右型结构,只取左边第一笔“土”(R),第二笔“丿”(J),再取右边的第一笔“”(O),“教”字的编码是“RJO”,如输入第三个码时“教”字已经出现,就不必取第四码了。再如“程”字,是左右型结构,编码时取左边的键名字母字“禾”(P)和右边两个键名字母字“口”(L)和“王”(J),“程”的编码为“PLJ”,输入这个代码后,“程”字就出现在屏幕上了。再如“缩”字,也是左右型结构,编码时取左边的键名字母字“纟”(B),再按笔顺取右边“宿”字的第一笔“宀”(K)和第二笔“亻”(W),“缩”字的编码就是“BKW”,输入这个代码后“缩”字就出现在屏幕上了。左右型结构的汉字,左边大部分是形旁,右边大部分是声旁或杂合独体字,而使用频度较高的形旁已被选入键名字母字,因此,在对各种类型汉字取码时,出现在左边的形旁大都是键名字母字,所以,左边的键名字母字取码时一般只取其在键位上的英文字母单码。在对左右型汉字的编码时,如果该字右边是独体字,则按该字的书写顺序取其第一笔和第二笔,加上左边的形旁(键名字母字)取一码共三码,当输入三码后大多汉字已经出现,就不必取第四码了。
2、上下型结构的汉字的编码。上下型结构的汉字的取码方法是取上部的第一笔和第二笔,再取下部的第一笔和第二笔进行编码即可。如“字”、“花”、“型”等字,都是上下型结构,如果上部是键名字母字,则取单码。如“字”字,取键名字母字(笔画)“宀”(K),再取下部独体字“子”的首笔“乛”(X),因此,“字”字的编码是“KX”;再如“花”字的编码,只取上部的键名字母字“艹”(V),再取下部“化”字的第一笔“亻”(W)和第二笔“丿”(J),“花”的编码是“VWJ”;又如“型”字的编码,只取上部“刑”字的第一笔“二”(键名笔画)和第二笔“丿”(键名笔画),上部取够两笔后跳过上部“刑”字的其它笔画,直接取“型”字下部的“土”。因此,上下型结构的“型”字的编码是“PJR”,输入这个代码,“型”字就出现在屏幕上了。上下型结构的汉字的编码,只要记住上取两码下取两码(遇上键名字母字取一码),编起码来就不难了。
3、左中右型结构的汉字的编码。左中右型结构的字的取码是由左到右,按左边取两码,中间取两码(如遇键名字母字则取一码)。如“徽”字,取左边的键名字母字“彳”(W),再取中间的第一笔,即中间上部的键名字母字“山”(H)和中部的第二笔“一”(G),由于“徽”字的中部已取够两码,因此必须跳过中间下部的“糸”字,直接取右边的首笔“”(O),我们把“徽”字左边的键名笔画“彳”(W)”、中间的两笔“山”(H)和“一”(G),然后加上右边的首笔“”(O)的代码连在一起,编为“WHGO”,这组代码就是“徽”字的代码。输入这个代码,“徽”字就出现了。又如对“辨”字编码,该字是左中右结构,左边部分不是键名字母字,因此,必须按笔顺取左边上部的键名字母字“立”(I)和左边下部的笔画“ナ”(Y),再取中间的“丶”(F),因此,“辨”字的编码是“IYF”。又如“嘲”字,编码时只需取“嘲”字的左边键名字母字“口”(L),再取中间的两笔,即中间上部的“十”(T)和“日”(Q),因此,“嘲”的编码是“LTQ”。再如蜥、衡、班、鞭、徼、暾、瞅、衢、储、蜘都是左中右型结构的汉字,它们的取码方法分别是班(王、丶、丿)JFJ;蜥(虫、木、
、丅)YDUT;衡(彳、、田)WSX;鞭(革、亻、一)VWG;徼、(彳、丿、日、)WJQO;暾(日、亠、口、)QILO;瞅(目、禾、火)UPE;衢(彳、目、目)WUU;储(亻、讠、土)WUR。
4、上中下型结构汉字的编码。上中下型结构汉字的编码方法与左中右型汉字的编码相同。即取上部的第一笔和第二笔,再取中部的第一笔或第二笔。如果上部的起笔是键名字母字,只取上部的单笔(单码),然后取中部的第一笔和第二笔进行编码。如“算”字,只取上部“”(键名字母字)的一码(O),再取中间“目”(U)字(键名字母字),因此,“算”字只取两码。再如“蘩、蘖、舅、曼、簟、萼、箩、藁、薷”等字,都属于上中下型结构的汉字,它们的取码方法分别是蘩(艹、、)VOB;蘖(艹、丿、丨、木)VJHD;舅(丿、丨、田)JHX;曼(曰、
、)QFX;簟(、一、冂、日)OGAQ;萼(艹、口、口、二)VLLP;箩(、
ク)OFS;藁(艹、亠、口、木)VILD;薷(艹、一、冖、丆)VGKY。
5、杂合型结构汉字的编码。杂合型结构的汉字取码方法是按汉字的笔画顺序取码的。在取码中如遇到键名字母字,只取单码,如遇其它独体或杂合型汉字,则按汉字的笔画顺序取码。如“进”字,属杂合型字,为了编码需要,我们规定凡“辶”和“廴”作偏旁的字,“辶”、“廴”均作首笔处理。因此,“进”字的第二笔是“二”,“进”字的编码是“NP”。又如“载”字,也属杂合型汉字,只要按笔顺取码即可。先取首笔“土”(R),然后按顺序取“车”(O)字(属键名字母字),“载”的编码是“RO”,输入这个代码,“载”就出现了。在对杂合型的字取码时,只要按照笔画顺序取码,遇有键名字母字的取单码,正象“载”字的第一笔“土”和第二笔“车”只取两个单码一样。还有很多杂合型的字,如“乘”(丿、十、

(三)词组(词条)的编码和输入本编码方法同时适用于词组(词条)的编码和输入。它们的编码方法是1、两个字组成的词组的编码。两个字的词组编码是取第一个字的首笔和第二笔,再取第二个字的首笔和第二笔共四笔进行编码即可。“阻挠”二字,取“阻”字的第一笔“阝”(T)和第二笔“冂”(A),再取“挠”字的首笔“扌”(C)和第二笔“一”(G),组成“阻挠”二字词组的代码是“TACG”;再如“祖国”二字,取“祖”字的第一笔“礻”(S)和第二笔“冂”(A),然后取第二个字“国”字的首笔“冂”(A)和第二笔“王”(J),组成“祖国”这个两个字的词组的代码“SAAJ”。其它依次类推。
2、三个字组成的词组的编码。三个字组成的词组的编码方法是取第一个字和第二个字的首笔以及第三个字的首笔和第二笔共四笔进行编码即可。如“实用性”这三个字组成的词组,取码时只取“实”字的首笔“宀”(K)和“用”字的首笔“冂”(A),再取第三个字“性”字的第一笔“忄”(H)和第二笔“”(O),因此,“实用性”这个词组的编码是“KAHO”。再如“董事长”这个三个字组成的词组的编码,我们取这个词组的第一个字“董”字的首笔“艹”(V),再取这个词组的第二个字<p>对这些化合物,如a-0,可采用市售产品,但a-2和a-3采用下述方法合成
B作为Wittig-Horner反应的另一个起始物甲氧基苯甲醛,采用b-2、b-3和b-4,所有这些都是市售的产品。
C通过Wittig-Horner反应获得下述的甲氧基芪
(样品号.8)(样品号.10) (样品号.12)也不需要再输入第四个码了。因为采用中文字母字编码方法对国标“GB2312-80”一、二级字符集的6763个汉字的编码中,两码字就达到了648个,三码以下的汉字达5000个,只有1763个汉字取四码。因此,中文字母字编码法所编的代码,大部分常用字只取三码就可以了。
在编码过程中,由于采用26组循环组字的原理编码,所编的码量大部分是中文字母字,所输入的是以键名中文字母字为主体,能与存储于电脑单字节字库中的中文字母字组合、搭配后,又能还原成千上万个汉字的也是中文字母字起了关键的作用,因此,我们把这种编码方法称之为“中文字母字编码法”。
尖端码国际通用汉字输入法就是使用这种方法编码,成功地解决东方文字的电脑输入与国际电脑输入的统一问题。同时,还可以直接访问和利用大五码字库、联合码字库丰富的汉字字源,解决目前电脑所使用的国标GB-2312(80)字库字源不足的局限。用上述这种方法编码的“尖端码国际通用汉字输入法”,成为一种能同时适用于中文简繁体、英文、日本文、韩国文和联合码(UNICODE)输入和文字处理的,能兼容其它系统的国际通用汉字输入法。
中文字母字编码法可广泛应用于电脑的文字输入编码,也可以制作电脑软、硬件安装于电脑中作为电脑信息输入和其它电子设备的中文输入。
附图和摘要


说明书附图和摘要附图,都是26组中文字母字在电脑键盘上与52个英文字母相对应关系的分布图。中文字母字编码法就是运用52个英文字母与26组(78个)中文字母字在键位上的对应关系,采用26组中文字母字循环组字的原理,对汉字的左右型、上下型、左中右型、上中下型和独体(杂合)型等五种汉字分别编码的。
权利要求
1.中文字母字编码法是专为《尖端单字节汉字电脑》输入系统而设计的编码技术。其原理是运用汉字形声字的结构规律,采取中文字母字循环组字方式。由于采用的输入形式、排列方式、数据格式、字库生成与单字节英文电脑相同,解决了电脑用户界面的汉化问题。
2.中文字母字编码法严格按照中国汉字的书写顺序和形旁声旁组成形声字的汉字结构和规律,把汉字分为左右、上下、左中右、上中下和独体(杂合)五种类型进行编码的。其笔画顺序与现行教科书一致。
3.运用中文字母字编码法所生成的中文字母字输入法,解决了东西方文字电脑输入的统一问题。并可直接访问大五码字库、联合码字库,解决了电脑汉字字源不足问题。
4.中文字母字编码法适用于中文简繁体、英文、日文、韩文等国文字的编码和输入。
全文摘要
该编码法是遵循汉字形声字的结构和规律,对安排在电脑键盘上的78个和600个存储于单字节字库中的字母字,按照汉字的书写顺序和五种结构进行编码,键盘上的字母字取单码,其余字母字只取一码或两码。在单字节系统上运行时采用只对字母字编码即可组合调用所有汉字。为了兼容于其它中文系统,也同时对所有汉字进行编码。此法广泛应用于文字输入编码,又可制成软、硬件中作为信息输入和传递以及其它电子设备的中文输入。
文档编号G06F3/023GK1274107SQ9911428
公开日2000年11月22日 申请日期1999年6月28日 优先权日1999年6月28日
发明者周海筹, 唐秀昌 申请人:张彦红
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1