汉字方阵编码法与排序法的制作方法

文档序号:6598329阅读:832来源:国知局
专利名称:汉字方阵编码法与排序法的制作方法
技术领域
本发明涉及汉字方阵编码与汉字方阵排序法一、汉字方阵编码法汉字的小键盘输入这个问题至今没有令人满意的答案。形码方案大多存在着传统检字法所具有的缺点即汉字定位的方法烦琐音码方案则带有汉语拼音方案的根本缺陷,即难以区分同音同调字。
本编码法以一个用数字1~9组成的方阵代表汉字,以数字0、1、2、3、4、6、7、8、9作为偏傍的位置代号;数字5作为非偏傍部分的位置代号;然后把偏傍视作函数名称,把非偏傍部分视作函数自变量,把汉字视作函数式进行编码。
本编码的优点是它既能象形码那样表达出汉字形态特征,又能象音码那样仅用几个代表声音的字母统摄住复杂的汉字结构。
以下就本编码法作详细叙述。
(一)概念与规定1、方阵下述方阵代表一个汉字147258369数字0、1、2、3、4、6、7、8、9是偏傍的位置代号,5是非偏傍部分的位置代号。
2、音点汉字的音形关系是一字一音。声音决定于字形。字形来源于一滴墨水。这个墨水点包含有声音要素。可以把包含有声音要素的墨水点称为“音点”。本编码法以拼音的首字母表示音点。两个不同质的音点重合时,一个音点将化作音圈。
3、音点与方阵的关系方阵的9个数字(1~9)是音点的位置代号。音圈的代号是0。
4、方阵的展开假设有一个方阵,它包含了9个音点,分别用a、b、c、……i表示,则有1a4d7g2b5e8h=1a2b3c4d5e6f7g8h9i3c6f9i上式即表示方阵的展开。
又假设上述方阵中,音点a内还有9个音点(a′、b′、c′、……i′),则汉字的一般展开形式为汉字=1a(1a′2b′3c′……9i′)2b3c……9i例如韶=2Y8Z=2Y(4L′6R′)8Z(4D′6K′)(音=Y,召=Z,立=L,日=R,刀=D,口=K)5、汉字笔型及其代码
1点(丶) 2横(一) 3竖(丨) 4撇(丿) 5捺(
) 6提(
) 7正勾(亅,
) 8反勾(
,乚,
) 9正折(乛) 0反折(
)6、码位的规定本编码为限长码,最多有5位。规定自左至右依次为第1码位、第2码位、第3码位、第4码位、第5码位。
7、汉字分型1)边角字分型偏傍与非偏傍部分的关系是“边”和“角”与“中心”的关系的字称为边角字。
(1)05型(6)55型举例国=0口5玉举例大=5大5大(2)15型(7)65型举例庄=1广5±举例凶=6凵5×(3)25型(8)75型举例匠=2匚5斤举例氧=7气5羊(4)35型(9)85型举例逐=3辶5豕举例
=8
5口(5)45型(10)95型举例凰=4几5皇举例少=9丿5小2)偏正字分型能明确区别出偏傍与非偏傍的字称为偏正字。
(1)25型(3)65型举例须=2彡5页举例焘=6灬5寿(2)45型(4)85型举例花=4艹5化举例形=8彡5开3)对称字分型(1)28型(46)型举例朋=2月8月举例吕=4口6口(二)编码1、函数码为边角字和偏正字编的码称为函数码。
1)函数码结构函数码由二个部分组成。第一部分称为函数名称部,占2码位,由1位函数名称(即偏傍,以其音点作为代码)和1位函数类型符组成;第二部分称为变量部,在没有缺省时占3码位,由非偏傍部分的代码组成。
(1)函数名称分为“正函数名称”与“准函数名称”两种。
正函数名称是正式列表的偏傍(见附录1、2),需要记忆。例如“亿”的偏傍。
准函数名称是没有列表的偏傍,不需记忆。例如“旧”的偏傍。
两种函数名称在名称部的位置不同。
正函数名称的位置总是在类型符的外侧,即在第1或第5码位。
准函数名称的位置总是在类型符的内侧,即在第2或第4码位。
(2)函数类型符函数类型符0、1、2、3、4、6、7、8、9用于表征边角字。函数类型符“”(冒号)和“‘”(单引号)用于表征偏正字。其中“”用于表征左右型字(例如25型和85型);“‘”用于表征上下型字(例如45型和65型)。
2)函数码演示(1)边角字编码O型。假设有一汉字“
”并设“口”的代码为K。
则其编码为KOabc又设一汉字为“
”,并设“衣”的代码为I。
则其编码为IOabc再设一汉字为“
”,并设“行”的代码为X。
则其编码为XOabc1型。假设有一汉字“
”,并设“广”的代码为G。
则其编码为Glabc2型。假设有一汉字“
”,并设“匚”的代码为J。
则其编码为J2abc3型正式。假设有一汉字“
”,并设“走”的代码为Z。
则其编码为Z3abc3准型式。假设有一汉字“
”,并设“辶”的代码为Z。
则其编码为3Zabc4型。假设有一汉字“
”,并设“几”代码为F。
则其编码为F4abc6型。假设有一汉字“
”,并设“凵”的代码为X。
则其编码为X6abc7型。假设有一汉字“
”,并设“气”的代码为Q。
则其编码为Q7abc8型。假设有一汉字“
”,并设“
”的代码为B。
则其编码为B8abc9型。假设有一汉字“
”,并设“丿”的代码为S。
则其编码为S9abc(2)偏正字编码25型正式。假设有一汉字“
”,并设“氵”的代码为S。
则其编码为Sabc25型准式。假设有一汉字“
”,并设“冫”的代码为S。
则其编码为“Sabc”45型正式。假设有一汉字“
”,并设“宀”的代码为B。
则其编码为B′abc45型准式。假设有一汉字“
”,并设“
”的代码为B。
则其编码为’Babc65型正式。假设有一汉字“
”,并设“木”的代码为M。
则其编码为abc′M65型正式。假设有一汉字“
”,并设“木”的代码为M。
则其编码为abcM′85型正式。假设有一汉字“
”,并设“刀”的代码为D。
则其编码为abcD85型准式。假设有一汉字“
”,并设“刂”的代码为D。
则其编码为abcD2、对称码为对称字编的码称为对称码,码长为4。
1)左右对称字的编码把左边的部件当作函数名称而有“X”(X设为函数名称,下同)的形式;把右边的部件当作函数名称而有“X”的形式。两者合起来就是左右对称字的编码。例如朋=YY2)上下对称字的编码把上边的部件当作函数名称而有“X′”的形式;把下边的部件当作函数名称而有“′X”的形式。两者合起来就是上下对称字的编码。例如吕=K″K3)品字形字的编码。
把对称的两部件的代码分置两端,第三个部件的代码置于中间靠左,整字的音点置于中间靠右。例如品=KKPK3、对码(见对码表-附录3)对码是用一对字的音点的正、反两种组合构成的一对编码。例如“土、士”的对码是TS(代表“土”)和ST(代表“士”)。
对码用于函数码合成的例子仕=RST对码需记忆。
4、英文码(见英文码表-附录4)部分汉字只用它们各自对应的英文单词作为编码。例如长=LONG。
英文码用于函数码合成的例子胀=YLON(变量部填入英文码的前3个字母)英文码需记忆。
5、音点的观察与利用。
有些汉字的内部隐藏着一些音点。例如“曹”当中有Q(曲);“发”当中有Y(友)和Y(又);在“既”当中有W(无)。在编码时应充分利用它们。例如槽=MCQR;泼=SFYY;概=MJGW附录140键方案函数名称表(共计41个,用于非边角字)A木B宀C艹,虫D刂E阝H火,禾(2H)I衤J钅,冖M目,米(4M),马(OM)N牜,女(4N)O口Q犭R日S山,礻(9S),石(4S)T田,土(3T)U月W王,攵X忄,穴Y雨,鱼Z1氵2竹3亻4彳6冫7扌8讠9饣0纟注1、数字与字母合成的函数名称不再携带函数记号。
2、本表的英文字母代码部分的函数名称是大体按拼音顺序排列的,有个别则不是。中文偏傍前的字母就是该偏傍的代码(数字+字母者除外)。
3、本表的数字代码部分的函数名称是大体按这些偏傍的第2笔的笔划代码的值的大小排列的,个别的则不是。
4、边角字的函数名称不列表。
边角字的函数名称在原则上利用偏傍的音点;偏傍没有音点的,利用整字的音点。
附录226键方案函数名称表A木B宀C艹,虫D刂E阝H火,禾CROPI衤J钅,冖M目,米RICE,马HOrseN牜,女LADYO口Q犭R日S山ALP,礻(仍为S),石SToneT田,土EArthU月W王,攵X忄,穴Y雨,鱼Z1、海SEa2、竿ROd3、他HE4、得GEt6、冰ICe7、打HIt8、讲SAy9、饼CAkeO、纟SIlk说明26键方案是在4.0键方案基础上通过下述各点的变动实现的1、以26键方案函数名称表取代40键方案函数名称表(英文单词只用前2个字母)2、函数记号“”改为M;“’”改为P。
3、以下列等值关系来替换编码中的数字1=Q2=W3=E4=R5=T6=Y7=U8=I9=O0=P附录3:对码表B并开(BK)币巾(BJ)丙内(BN)办力(BL)必心(BX)巴己(BS)C叉又(CY)斥斤(CJ)匆勿(CW)才寸(CA)臣巨(CN)虫中(CZ)车东(CD)D歹夕(DX)丢去(DQ)氐氏(DS)F方万(FW)乏之(FZ)弗弓(FG)G戈弋(GI)广厂(GC)瓜爪(GZ)甘廿(GN)龟电(GD)H户尸(HS)候侯(HO)I衤礻(IS)已己(IJ)J几儿(JE)甲田(JT)堇革(JG)及乃(JN)韭非(JF)角用(JY)L龙尤(LY)吏史(LS)良艮(LG)耒来(LA)令今(LJ)卵卯(LM)M面而(ME)马与(MU)母毋(MW)丏丐(MG)N鸟乌(NW)O凹凸(OT)P丕不(PB)爿片(PA)乒乓(PN)Q曲由(QY)乞乙(QI)羌无(QW)R日曰(RU)人入(RN)刃刀(RD)壬千(RQ)S少小(SX)戍戊(SW)T土士(TS)兔免(TM)太大(TD)U匀勺(US)于干(UG)W网冈(WG)攵久(WJ)X血皿(XM)县且(XQ)Y页贝(YB)永水(YS)Z主王(ZW)舟丹(ZD)子了(ZL)自目(ZM)再冉(ZR)附录4英码B半HALF
C长LONG丑UGLY刍HAY串BUNCH承PROP寸CUN出OUTD丁MEN当EQUAL斗DOUE耳EARF半FULL飞FLYG鬼GHOST个AN更MORE果FRUIT工WORKH亥HAI黑BLACKI尹LORD印PRINT义JUSTS亦ALSO以BYJ臼MOLAR见SEEN兼BOTH击BEAT介INTER夹CLIP进WELLL卤BRINE立STAND录COPY隶UNDER两LIANG末END里LIM毛HAIR木WOOD民FOLK灭GONEN女LADYP平FLAT匹MATCHQ妻WIFE丘HILL佥ALL求BEG弃CASTR肉FLESHS书BOOK丧LOSE身BODY生LIVE事THING手HAND肃GRAVE丝SILK山ALP世WORLD失LOST矢SHAFTT屯STOREU云CLOUD雨RAINW亡FLEE韦WEI卫GUARD危PERIL我OURX乡RURAL兴STARTY牙TOOTH丫FORKZ丈ZHANG争VIE专MONO卓SUPER二、汉字方阵排序法现有的汉字排序法有很多缺点。部首法的缺点是部首在汉字结构中的地位不够显著,种类也太多;笔画法的缺点是笔画容易数错,检字速度慢;四角号码法的缺点是它有记口诀的负担。
本排序法是以数字1~9组成一个方阵来代表一个汉字,用数字0、1、2、3、4、5、6、7、8、9代表偏傍的位置,用数字5兼表非偏傍部分的位置,并将汉字按05、15、25、35、45、55、65、75、85、95、00的型号顺序排列的一种汉字排序法。
本排序法的优点。
1、与部首法比较。
部首法中的“部首”是汉字的归类标志;本排序法的汉字归类标志是“型号”。
部首在汉字中的位置不确定,且种类太多;而作为汉字归类标志的“型号”只有11种。部首确定之后要数出其笔划;本排序法没有这道手续。
2、与笔画法比较。
笔画不是一个直观的标志;“型号”是一个直观的标志。
3、与四角号码法比较四角号码法完全依赖于记忆笔型代码和取码规则;本排序法没有取码规则,不必记背笔型代码。
以下详细叙述本排序法。
(一)概念与规定1、方阵下述方阵代表一个汉字147258369数字0、1、2、3、4、5、6、7、8、9是偏傍的位置代号,5兼表非偏傍部分的位置代号。
2、音点汉字的音形关系是一字一音。声音决定于字形。字形来源于一滴墨水。这个墨水点包含有声音要素。可以把包含有声音要素的墨水。点称为“音点”。两个不同质的音点重合时,一个音点将化作音圈。
3、音点与方阵的关系方阵的9个数字(1~9)是音点的位置代号。音圈的代号是表5(续)物理常数实施例序号 X Y ZnRaRbRc1Rc2R1mp
℃ 异构体(Ib-54) CH3CH36-CH3H H C6H5H CH3224-225 α(Ib-55) CH3CH36-CH3H H CH3CH3CH3>220 -(Ib-56) CH3CH36-CH3H H CH3CH3i-C3H7217-218 -(Ib-57) CH3CH36-CH3H H CH3CH3t-C4H9>220 -(Ib-58) CH3CH36-CH3H H -(CH2)5- CH3>220 -(Ib-59) CH3CH36-CH3H H -(CH2)5- i-C3H7208-210 -(Ib-60) CH3CH36-CH3H H i-C3H7H CH3193 α(Ib-61) CH3CH36-CH3H H i-C3H7H i-C3H7177-179 α(Ib-62) CH3CH36-CH3H H i-C3H7H t-C4H9>220 α(Ib-63) CH3CH36-CH3H H OCH3H CH3>220 α(Ib-64) CH3CH36-CH3H H OCH3H i-C3H7181-182 α(Ib-65) CH3CH36-CH3H H OCH3H i-C3H7187-189 β(Ib-66) Cl Cl H H H C2H5H CH3196 β(Ib-67) Cl Cl H H H C2H5H i-C3H7172 β
举例花=4艹5化举例形=8彡5开3)对称字分型(1)28型46型举例朋=2月8日举例吕=4口6口说明偏傍与非偏傍的关系可以简称为“偏”与“正”的关系。边角字是偏正倾向最强烈的字;偏正字是偏正倾向明显的字;对称字是偏正倾向很弱或没有偏正倾向的字。
6、本排序法的汉字排序步骤是(1)将全体汉字分别归入05型、15型、25型、35型、45型、55型、65型、75型、85型、95型、00型。
说明街、裹一类字的外框属于一个完整的字,应归入05型;对称字的28型归入25型、46型归入45型;独体字可以被看作“偏傍”的位置在5、非偏傍的位置也在5即偏正合一的字,应归入55型;难以分辨偏正关系的字如包、噩、乖、赢等应归入00型(不定型)。
(2)将同一大类的字按“偏正倾向最强烈→偏正倾向明显→偏正倾向很弱或无偏正倾向”的顺序排列。
(3)将第(2)步中具有相同程度偏正倾向的字按它们的偏傍的笔画数归集(相同偏傍的字依字的笔画数按笔画数由小到大的顺序排列;相同笔画数的字,依第一对不相同的笔画的笔型代码按笔型代码由小到大的顺序排列);偏傍的笔画数按由小到大的顺序排列;偏傍笔画数相同而偏傍不相同的字用点号隔开。
(4)将具有相同偏傍且数量很大的字(例如木字傍的字),根据它们的中心字(即非偏傍部分)的结构再次分型和排序,即重复步骤(1)、(2)、(3)。
权利要求
1.一种汉字方阵编码法,其特征在于所说的汉字方阵编码法是以数字1~9组成一个方阵来代表一个汉字;以数字0及方阵里的1、2、3、4、6、7、8、9代表偏傍(以其代码表示)在方阵里的位置,并将偏傍当作函数名称;以方阵中心的5代表一个汉字在排除了其偏傍后剩下部分(以其代码表示)在方阵里的位置,并将该部分当作函数自变量;把汉字看作函数式进行编码的一种汉字编码法。
2.一种汉字方阵排序法,其特征在于所说的汉字方阵排序法是以数字1~9组成一个方阵来代表一个汉字;以数字0及方阵里的1、2、3、4、5、6、7、8、9代表偏傍在方阵里的位置;以方阵中心的5兼表一个汉字在排除了其偏傍后剩下部分在方阵里的位置;将汉字按05、15、25、35、45、55、65、75、85、95、00的型号顺序排列的一种汉字排序法。
全文摘要
本发明涉及汉字编码和汉字排序。汉字方阵编码法是以数字1~9组成方阵代表汉字,用数字分别代表偏旁和非偏旁部分的位置,并将汉字看作函数式进行编码。它既能表达出汉字形态特征,又能用代表声音的字母统摄住复杂的汉字结构。汉字方阵排序法同样以数字1~9组成方阵来代表汉字,用其中的数字将汉字分型,并把汉字按05、15、25、35、45、55、65、75、85、95、00的型号顺序排列。它比现有排字法更加科学合理。
文档编号G06F3/023GK1086326SQ9211266
公开日1994年5月4日 申请日期1992年10月28日 优先权日1992年10月28日
发明者庄小兵 申请人:庄小兵
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1