汉字信息拼码的制作方法

文档序号:111804阅读:524来源:国知局
专利名称:汉字信息拼码的制作方法
要增进人们之间通过信息设备(包括打字机、电脑、电报打字机、电动排版机等)的信息交换效率,输入的媒介最好是一种能直接读懂的且符号不多的字母或拼码,例如像罗马字母。但汉字有好几万字,不容易输入。汉字的输入须要经过一种拼码,这种拼码不但要能直接读懂,不必经译码手续,而且必须正确不误的代表每个及所有的汉字,而且符号不多,能纳入双手可以操作的像英文电脑大小的键盘。
通过这种拼码,英文用的信息技术可以大众化地用于汉文。过去的各种汉字译码只解决了一部分问题。
本发明的主要目的是用少数的拼码符号来正确不误地代表每一个及所有的汉字,以便输入各种信息的设备。这种拼码可以直接读出,了解,表达意义,完全像一种文字。拼码包括发音符号及形旁符号。发音符号包括现通行的拼音(罗马字)符号,及以前用的注音符号。形旁符号是用来分别同音字的,每个汉字通常一个形旁,最多两个,依笔顺关系附在发音符号串的前后。
本发明的另一目的是提供一套拼码原则,并整理出一套实用的形旁符号。这些形旁是由部首推演出来的。很多仍像原来的部首,可以容易地辨认。请参见表1。
表1a
<p>表1b形码 拼音缩写 包括的部首气 QI火 H 赤黑光
Z 足
辶走廴疋彳
爪癶止舛王 YU 玉王月 UE 肉骨夕
ME 門户罒 SF 囗(西)(
)田 TN 里疒 CU皮 P 革
MN 皿匚工
缶臼
鼎瓜鬲凵目 MU
石 SR
SK禾 HE 耒香
立 LI 辛米 MI纟 SI 糸(幺)
ZO 舟
CG 虫

I 衣(
)
贝 B 貝讠 Y 訁车 CH 車
YO 酉鹵钅 J 金
IU 雨页 YE 頁身首面自(鼻)(
)饣 SW 食马 MA 馬
U 魚
乌 N
佳本发明的另一目的在于提供一种输入汉字的键盘及连用的汉字信息设备。信息设备的输入可以用各种方式,如声音输入,但键盘仍然是最通用的。键盘上有本发明的拼码符号及空格键,来分开各汉字间的拼码。请参见表2。信息设备附有存贮器,其中存有每个汉字及所有汉字字形和其拼码。如此可以有选择地把汉字本身及其拼码显示或打印出来。
本发明的其他目的,优点及细节可以根据下文得到更清楚的理解。
以下是
及实施例。
图1甲及乙列出各形旁符号及其拼音缩写和包括的部首。
图2列出冂
(m ù)的同音字译成本发明的拼码,包括注音连形旁,拼音连形旁及拼音连形旁的拼音缩写。
图3本发明的拼码键盘之一。
图4甲利用本发明的注音符号拼码一文实例。
图4乙利用本发明的拼音符号拼码一文实例。
图5本发明的代表性的信息设备图。
下面是本发明的详细情况及应用。
本发明可把汉字拼码化,以便用于信息设备。本发明的拼码把汉字译成可以直接读出的形、音符号。因为这些拼码代表汉字的完全发音及所属的形旁,所以叫形音拼码。该形音拼码可以完全不误地再译回原来的汉字。
图5代表可用与本发明的一种信息设备。键盘30打入的信号由电线44传到显示器46,另一电线48连接键盘30与打印机50,可以命其打印形音拼码,如要汉字原文,可按“字”键38。拼码的文件编辑,可以直接用键盘30在显示器46作业。
拼码可以用电线52传到一个处理机54加以处理及传递。可以是有线的或无线的通讯路线56传递到一个接受器58,接受器58由电线60接到打印机50,可以打出处理过的拼码文件。这部分的信息设备,除了键盘上的符号及其布置外,与其它现有的英文设备一样。
本发明加了一个字典记忆及翻译器64,其中存有所需要的汉字的字形与拼码,按下键盘上的“字”键38,可以经电线62命令翻译器64把在显示器46上的拼码文章变成汉字原文,或把汉字原文变成拼码文章。汉字原文的信号是从存贮器64由电线66传到显示器46,信号也可以转到处理及传送器54,以便加以处理,传送及打印出汉字原文。
现回到字码,字码用的音符,最好是按照民族形式的音标,像注音符号及四声,但其它发音符号也可以,例如现在英文字母拼音方式式,这些音符是用来表达汉字的完全发音,在大部分的字典中都可以找到(也可以是方言的及少数民族的汉字发音)。本发明所举的例子是用普通话(北京话)以注音符号说明。因为汉字中有太多的同音字,单独用这些发音符号来当拼码是不能够完全正确的来代表所有的汉字。
本发明的拼码应用一组形旁符号,附加在音符的旁边,来区别不同的同音字,作为分类,如此可以正确地把每个汉字拼码化。
这一组形码是由214个字典中常用的部首演化出来的。有此形码是由部首变形而来的,但仍然可以认出。这些形码可以说是汉字边旁的浓缩,可以用来当部首。本发明现在选用图1甲及乙中的64个形旁符号当形码。
本发明还提供选择这些形旁的原则及程序在字典常用的214个部首中选出汉字最多的部首,没被选中的部首可归类到被选中的部首中。大部分被选中的部首保留原来的形式,小部分变了些形式,以更适合代表归类下来的部首群。这些部首群的归类至少符合下列一个条件(1)它们由同样的古字演变而来;(2)它们在演变过程中有过同样的意义;(3)它们是同意或同形;(4)它们有部分笔划是相同的;(5)它们可以互通,或经常被互相误用。在形码选择过程中,先选出一组形码,再探测性地把字典中所有的汉字用本发明的字码化原则(下述)译成拼码,再在已选出的这组形码中再选出及合并出一组更少的形码,再用这一组形码把汉字拼码化,一直重复到所需的形码由部首中被浓缩出来。最终目标是以最少的形码,以最高度的可认性及直接可读性,来把所有汉字拼码化。
汉字既多又复杂,到现在还没有一套完满的归类法。如果只用过于简单的原则,譬如把一个部首放在注音符号的前面,甚至采用字典中所有的214个部首也无法完全把同音字加以区别。
本发明的拼码不只是形、音码的符号的选择,而且对它们之间的相关位置也加以布置。这些拼码符号可以是单独一个符号代表一个汉字,或几个符号排列出来代表一个汉字,本发明现采用下列六个排列方式(1)一个形码排在几个或一个音码的前面;
(2)一个形码排在几个或一个音码的后面;
(3)几个或一个音码单独排列,没有形码;
(4)几个或一个音码,由一个形码带头,及另一个形码在后;
(5)一个形码;
(6)二个形码相连,没有音码。
上面是以被采用次数多少列出来的。前四个排列方式可代表95%以上的汉字。最后两个没有音码,在第五方式中的形码本身就是汉字,按照该汉字发音。在第六方式中,有两个形码符号,第二形码本身也是汉字,由它代表发音。在第四或第六方式中的两个形码,它们的符号可同可不同。
下面是汉字拼码化的原则,用他们把汉字译成上述六个排列方式拼码。
甲、形码原则一、如两个同音汉字有同样的一个形码并且其形、音码间又有同样的笔顺关系,比较少用字可再加一个形码以加区别。这个再加的形码叫作形标。例如“芃”为
忄夂乚九′,而“蓬”字为
忄夂乚′。这两个汉字同发音,也同属“
忄忄”部带头。“芃”已比“蓬”少用,所以加一个形标“九”。
二、字典内有些汉字的部首是误编的,需要修改,以代表较正确的边旁意义。新的边旁当然是由原来汉字中找出。如“暮”为冂×
己;应为“日”边,不是字典中的“
忄忄”部。
三、一部分少用的部首已收入代表同意或同形的形码,如“鼎”部已拼入“皿”码。如果不是很明显的话,最好少用这种形码代表。这种形码代表可以用作形标。例如“鼐”为ㄋㄞ
皿,及“耐”为了ㄞ
扌。
四、如果没有更好的方法选择形码,笔画多的汉字译成多一点形码,如“墼”为车丅丨纟,但“系”为丅丨纟丶。
五、如果必须在可能的几个形码中选择,则应尽量选用意义而尽少用笔顺来选择,如“翟”为ㄓㄜ
。如意义选择不明,才用第一个笔顺的形码,如“仇”为亻彳

六、每一个汉字的字码,最多有两个形码符号,一在音码前面,一在后面。
乙、音码原则一、拼码中的发音部分代表汉字的完全发音,包括声调符号。声调符号一般是加注在韵母上,但本拼码法加注在最后一个非声调符号上,以便造词用。普通话中的第一声符号在本字码是不必注明的。如加以注明则表示(1)在好几个字的词中用来作字间的界线;(2)
在形码上注明是第一声发音;(3)在词中最后一个字上(或单独字上)注明是轻声。
二、每个形码都有一固定的发音,一个汉字可能由一个或两个形码(没有音码)组成拼码。最后一个形码又用来代表发音,如“荔”为屮力。
三、破音字有不同发音,可以译成不同的拼码。不但音码不同,形码也可能不同。如“吃”为口彳或口

丙、选字码优先次序把一个汉字译成拼码时,应依照下列优先次序选择符号一、O.如果一汉字与一形码相同,应该译成该形码,如“力”为力。
一、一.如一汉字由两个形码组成,且以第二形码为发音,应译成该两个形码,且同样笔顺,如“码”为石马。
二、O.其次是选一形码与音码结合组成拼码。形码在音码的前后取决于原汉字的笔顺。如“悯”为忄ㄇ丨ㄣ或“
”为ㄇ丨ㄣ

二、一.如果由笔顺无法分别在前在后,形码应在音码之前,如“辩”为讠ㄐ丨ㄢ。
三、其次是一个形码后再加一个形码作发音符号,如“荔”为
力。
四、再其次是译成音码而不带形码。一汉字如不能很明显的辨别其部首,应归这一优先,“民”为ㄇ

五、O.最后的优先是,如前二.0.二、一、所译成的拼码仍无法分别两汉字的话,用第二形码做形标,如“谕”为讠ㄩ
,但“语”为讠

五、一.形标位置也按照原来汉字的笔顺,如“蜇”为扌ㄓㄜ

六、越是常用字越有优先选择次序,如“芋”为
,“蓣”为屮ㄩ页。
这些原则如文法原则一样,可有例外,但只在必要时又无法避免时才有例外。
拼码符号是一个个由左至右显示出来的,但其它排列也可以,如由上至下,或由右至左。
本发明现选择了图1的64个形码,其包括的部首则列在其右栏,有些在括号内的部首是用来做形标的,应少用。
要把一个汉字,如“暮”(图2.21),译成拼码,先把音码译下(图2.20)。这发音可以在字典中找出。形码最好是依照字典中该字的部首。但由于疏忽,本字破例列入“
”部。在本字内又可找到“日”,甚至“大”等部首成分。但“暮”字与“日”的关系比与“
”或“大”密切多了(其实“暮”是从日,莫声)。所以本发明选“日”为该字形码。根据笔顺原则,这形码附在音码后面,声符则加注在形码上(最后一个非声调符号),如图2.22所示。一般说,这就完成了一字的拼码化。
图2列出ㄇ义音的13个同音字与拼码。“木”字(图2.23),字码也是“木”,因它本身就是一形码。“目”字(图2.28),也是一样,译成“目”。“沐”字(图2.24)由两个形码“讠”及“木”组成(图2.26),根据音码原则乙、二,第二形码“木”代表发音,其他图2的汉字都译成一个形码及其注音符号。“牧”字(图2.25)属于“牛”部首,已拼入“犭”码,所以“牧”字译成犭ㄇ义(图2.27)。由此可看出,每个汉字都可正确地译成拼码,每一拼码可正确地代表单独一个汉字。
有些字群,像“芋”与“蓣”,同音同形码,加上音、形码的笔顺关系相同,所以“蓣”的字码加了一个形标以区别,为
,而“芋”为
。如此这两个字就译成不同的两个拼码。在整个字典中,这种形标占很少数量。
拼码由图3代表的键盘输入。键盘30有字键32,排成五个水平行及十二个垂直列,有一个空档键34,可以输入空格,也有一个高低键36,可以控制在键上高的一个符号或低的符号。另外还有一个“汉字”键38,按下时可把显示的拼码回译成汉字原形,再按下时,又显示拼码。
其他现在通用的符号如标点及数目没在图3中表示(数目可以像现在通用电脑一样摆在右边的一方格上,阿拉伯数字在低键,汉字数在高键)。这些通行的符号可放在图3中未加利用而标注“C”的键上。
下面的说明中,水平行由上往下数,垂直列由左往右数。
最常用的是声调符号,故放在右手食指控制的键上,即第八列、第二到五行的下键。其次是发音符号,放在第二到第五行,除声调符号及标点符号“C”以外的下键上。
所有上键都放有一个形码符号,最常用的四个形码放在第一行的下键上(从第七列到第十列)。
要打入一个音码,只要按下所要的键,要打入一个形码,要按下所要的键并同时加按上下键36。拼码符号的输入与译成的拼码次序一样的一个个符号打入。如此打入每个汉字,然后再按空白的档键34。在由几个汉字组成的词或人名地名中,每个汉字的拼码可以一串打入,中间不需空白,这时,声调符号就变成一个个汉字界限。
本发明的拼码加上标点,可以当一般文字使用。图4甲翻译了“西游记”的一小段故事借棒记。美猴王,孙悟空用“闭水法”到海底的水晶宫去,要向海龙王借一些武器。图4乙是以拼音代替注音符号,其中形码符号也可以用图1中的拼音缩写(罗马字大写)来代替。
本发明所选择的实用方式已经在上面作了清楚的描述,本发明不仅仅是所述的例子,其范围由下列权利要求
所概括。
权利要求
1.把一个个汉字输入信息设备内的方法包括下列的步骤1)把键盘上的拼码符号分成两组,第一组用来注明汉字的完全读音,包括声调,及第二组用来表示汉字的边旁;2)把一个汉字的发音,包括声调,用几个第一组符号加以完全注音;3)再由第二组中,选出一个符号,依照该符号在该汉字中的笔顺,加附在已选出的第一组注音符号的一边,来表示该汉字的边旁;4)在由一个第二组符号及几个第一组符号仍无法分别该汉字与其同音,同边旁及同笔顺字时,可再由第二组符号中加选一个符号作为形标,加附在第一组注音符号的另一边;以及5)把所选出的一个个符号,输入该信息设施内,打入的次序是所选的该第二组符号,所选的几个第一组中的非声调符号,所选的第二组符号,最后是该第一组中的声调符号。
2.权利要求
1的方法,另加上输入空白来分开每汉字间的拼码,及把输入的符号,依照打入的次序显示出来。
3.权利要求
1的方法中,其第一组符号是英文拼音符号,包括声调符号。
4.权利要求
1的方法中,其第一组符号是注音符号,包括四声符号。
5.权利要求
1的方法中,其第二组符号是部首。
6.权利要求
1的方法中,其第二组符号,很大部分是表1的形码。
7.权利要求
1的方法中,第二组符号,有些是由第一组符号加以特别的标明来代替。
8.权利要求
7的方法中,很大部分符号是英文字母,大写来代替一组符号,小写代替另一组符号。
9.权利要求
1的方法中,键盘上很大部分的符号如表2所示。
10.权利要求
2的方法中,再加把输入的拼码与所储存的所有汉字翻译成的拼码,加以比较,而检定出所代表的一个汉字,而把该汉字显示出来。
11.包括键盘的信息设备,能输入代表汉字的,及可以直接读懂的形、音码符号,可以输入空白格,可以依同样的符号及次序及空白输出所打入的符号,可以储存所有汉字所译成的字码,可以把输入的一个汉字的字码与储存的所有每一个汉字的字码加以比较,而检定出该字码所代表的汉字,然后把该汉字输出来。
12.权利要求
11的设备内的键盘,包括盘上的64形码符号,很大部分如表1所示。
13.权利要求
11的设备内的键盘上的形、音码符号,很大部分如表2所示。
14.可以直接输入信息设备,可以直接读懂的汉字的拼码,包括第一组符号,用于注音包括声调,及第二组符号,像部首用于边旁,每个汉字的翻译最多有二个第二组符号,但由几个第一组符号,注明该字的完全发音,像拼音文字一样一个接一个列出来,声调符号在最后一个非声调(包括第二组)符号的上面,这些第一组符号注意的前面最多只有一个第二组符号,后面也最多只有另一个第二组符号,这些第二组符号在前在后依该汉字的笔顺而定,每汉字的符号拼码可以以空白格与代表其他汉字的拼码分开,所谓空白格是比代表一汉字的符号内的间格稍大者。
15.权利要求
14的汉字拼码中,第一组符号是罗马字母,用来拼音。
16.权利要求
14的汉字拼码中,第二组符号很大部分是表1所示的形码。
17.权利要求
14的汉字拼码中,第一组符号是注意符号及四声符号。
18.权利要求
14的汉字拼码中,在由几个汉字形成的名及词中,其各汉字的拼码间没有空白格,每个汉字的四声符号是注在该字拼码中的最后一个非声调符号上,如此表示该汉字在词中其他汉字的界限。
专利摘要
本发明是用于电脑等信息设备的汉字拼码。它可以直接读懂,也可以用现行电脑一样大小的键盘输入给电脑。拼码可直接显示或打印,也可以译回汉字原文显示或打印。拼码是发音音标及汉字形旁以笔顺为原则并列而成的。汉字形旁由部首整理而出,用以分别同音字。
文档编号G06F3/023GK87103491SQ87103491
公开日1988年3月30日 申请日期1987年5月14日
发明者颜敏政 申请人:颜敏政导出引文BiBTeX, EndNote, RefMan
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1