新概念汉字编码的制作方法

文档序号:6406700阅读:312来源:国知局
专利名称:新概念汉字编码的制作方法
新概念汉字编码(简称新概念码)。本发明属于一种确定汉字字根以及汉字韵母在26个英文字母键上位置布局关系的汉字编码方法,适用于一切计算机及电脑打字机的汉字输入键盘,适用于一切使用汉字编码进行分类、查询的领域。
从键盘布局来说,汉字编码可以分为两类第一类是字根和字根读音相对应分布,比如字根“大、刀”和“D”对应,“宀、贝”和“B”对应;第二类是字根不与字根读音对应分布,比如五笔字形的键盘布局就是这样。一般说来,第一类比第二类要易记易学得多。但第一类同时也比第二类的重码率高得多。五笔字形属于第二类,自然码、栗氏码、五十字元法和新概念汉字编码同属于第一类。属于第一类的汉字编码还有许多。自然码、栗氏码和五十字元法虽然好学好记,但它们的重码率就比五笔字形重码率高得多。可是五笔字形字根太多又难以记忆,且编码规则也太多。因此,上述四种汉字编码往往在易记易学和重码率之间偏重一方,并没有找到一个两者兼优的平衡点。
经过严格计算,将五笔字形重码字的个数除以国标字库的全部6763个汉字,它的重码率为7.33%;将五十字元法重码字的个数除以6763个汉字,那么,它的全形码的重码率为18.04%,它的形声码(包括声形码)的重码率为10.35%。自然码和栗氏码的重码率和五十字元法属于同一量级。自然码仅是一种音形码(声韵形码)。这种汉字编码对使用者掌握拼音的要求很高,因此,在使用范围上受到很大限制。栗氏码和自然码特点类似。五十字元法虽然有形声码、全形码和音形码,但它主要还是属于以音为主的汉字编码,它的编码中目前也只有形声码较为受用户欢迎,而全形码由于重码率太高,所以用户很少使用。它的全形码和五笔字形(五笔字形是一种全形码)相比,重码率高出一个数量级,并且,它的全形码和声形码并未实现统一。因为,有许多汉字在全形码中的编码和形声码中的编码完全不一样,一类汉字就是这样。按照形声码和全形码统一的原则,两者之间只是最后一码不同,而声形码和全形码两者之间只是第一码不同,五十字元法远远没有达到这样的要求。
本发明的目的是设计一种易记易学的汉字编码,且最大限度地降低重码率,真正实现汉字编码三大类型五种编码模式的统一。
经过多年的实践探索、综合分析和归纳统计计算,本发明选用了一百二十九个汉字部件作为字根,并且将一百二十九个字根划分为基本字根和归类字根两类。基本字根是按其读音或其名称的主要读音布置在与其读音相同的声母键上;归类字根为与基本字根形状类似的字根,无论归类字根如何读音均认定该归类字根与其形状类似的某一基本字根为同一读音,即该归类字根布置在与其形状类似的某一基本字根的同一键上。
基本字根在英文键盘上的位置布置关系为A:竹中B:宀八贝C:艹寸D:氵刀大刂E:阝二儿F:囗日目方 G:广工弓亅 H:火一 I:厂车乂 J:钅几臼
K:冂 L:扌力
M:木皿 N:牛女鸟
O:口
p><p>声母和字根关系的说明如下①用A、I、U三个字母分别代表zh、ch、sh三个声母;V代表ü;O叫做“零声母”,代表没有声母的字的“声母”。如“安、饿、欧、哀”OJ、OE、OO、OL等。
②“七”是代表类似“七”和含有类似“七”结构的字根(
、匕、
),不管三七二十一均统称为“七”;按照“七”字的声母放在Q里。
③“扌”叫“拉手旁”,“ク”叫“鱼字头”,“
”叫“曲”,“丨”叫“竖”,“一”叫“横”,分别按各自(拉、鱼、曲、竖、横)的声母放在L、V、Q、U、H里。“忄”是竖“心”,放在X里。“丷”是倒“八”,放在B里。
④“”叫“折”,按“折”的声母放在A里。注意凡是向左下折笔的结构均叫做“折”,如“ㄣ、ㄋ”等。
⑤“门”叫“门框”,按“框”的声母放在K里。其中也包括上框、下框、左框和右框,即“冂、凵、匚、
”。
⑥把“丶”部归在“
”部,按“捺”的声母放在N里。
⑦把“囗、日、目”看作为方形结构,按“方”的声母放在F里。应当注意的是,其中“囗”内包含有其他字根,它和“口”是完全不同的。
⑧“口”和英文字母“O”象形,按照英文字母“O”的形态,放在O里。
此外,为了形成全形码”形声码(包括声形码)、音形码(包括形音码)的统一整体,又在原CCDOS拼音基础上,增加上25个韵母。
汉字韵母在英文键盘上的位置布局关系为A:zh aB:eiC:un vnD:uan vanE:eF:enG:engH:angI:ch iJ:anK:aoL:aiM:inN:iuO:o uoP:ieQ:ueR:ua iaS:ong iongT:ianU:sh uV:ui vW:uang iangX:iaoY:ing uaiZ:ou
韵母和字根的关系说明如下上述的韵母键盘布局中,韵母en、eng、an、ao、ang、ai、ing、ong和ü,分别与F、G、J、K、H、L、Y、S和V对应,这些是采用CCDOS的韵母方案。因为大家都很熟悉它,所以,采用它将会给用户带来很大方便。其它韵母的选取,主要是采用和新概念码的字根对应起来的方法。如Zou(辶);Xiao(小);Cun(寸);Niu(牛);uang(王);Pie(丿);Tian(田)等。
少数韵母的读音直接和英文字母的发音对应。如ia,ua(R)ui(V);uai(Y)。这种韵母键盘布局很容易记忆。
本发明提出的新概念汉字编码在选取字根时,充分利用汉字本身的各种内在联系,在实现技术指标的同时使记忆量降到最低限度;在拆字编码时,最大限度地体现判断敏感、直观、明显、连贯,减少二异性的优点,并使其符合人们的语言文字使用习惯,而达到易学的目的;在键盘布局和编码规则之间的配合上,力求达到最大限度地降低重码率,提高速度。
新概念汉字编码对于国标字库的所有6763个汉字都实现了五种编码模式的严格统一,只需将它的全形码的最后一码(包括空格)换成声母码,即为形声码,只需将形声码的最后一码调换到第一码,即为声形码;只需将全形码的后两码(包括空格)换成声母码和韵母码,即为形音码,只需将形音码的后两码调到前两码的位置,即为音形码。
新概念汉字编码不但易记易学,而且它的全形码和五笔字形的重码率属于同一量级,为7.87%;它的形声码(包括声形码)的重码率为6.83%。显然,在字根与字根读音相关联的第一类汉字编码中,它的重码率是最低的。甚至,它的形声码(包括声形码)的重码率比第二类的五笔字形还要低。可见,新概念汉字编码在易记易学、重码率之间找到一个理想平衡点。
图1、新概念汉字编码字根键盘布局图2、新概念汉字韵母键盘布局下面结合附图用实施例对本发明做进一步的描述本发明设计的新概念汉字编码选用了一百二十九个字根,这些字根包括基本字根和归类字根在26个英文键盘上的位置布局关系(见附图1)是A: 竹中 虫 
B:宀 冖 八 丷 贝C:艹 寸D: 大刀 刂氵
E: 儿阝卩二 亠冫
F: 方日 目囗
G: 弓工 广疒 亅
乚H:火 一 灬I:车 厂 丆  乂 J: 钅臼 几

K: 冂匚 凵门
L: 扌力
M:木 皿N: 牛女 鸟
丶对本实用新型


如下图1是本实用新型的结构示意2是构成控制部件的比较放大器电子原理3是电热控温管构造中(1)控制部件(2)电热及测温部件(3)电热体导线(4)温度传感器导线(5)硬质玻璃管体(6)温度传感器(7)电热体图1中的控制部件就是由图2所示的比较放大器构成,它是一个由运算放大器F007组成的恒温电路,采用电容降压,并由一个双向可控硅控制负载,这一部分元件可置于一个小型塑料合中,设有发光二极管指示工作状态。图3中的电热控温管内,温度传感器(6)与电热体(7)相互隔离绝缘安置,确保温度传感器接受的温度为被加热液体的实际温度(误差∠±0.5℃)。管内用填充物(如石膏粉、水泥或环氧树脂)塞实固定。温度传感器(6)和电热体(7)引出线分别按图导2中的
和“负载”两端。
实际应用时,将电热控温管置于盛有液体的显影盘内一侧(用夹具或胶纸稍加固定)然后将插头接220V电源就进入自动工作状态。随着照片显影操作,液体处于搅动状态促使热量的均匀扩散,从而确保显影效果。
M:inN:iuO:o uoP:ieQ:ueR:ia uaS:ong iongT:ianU:uV:v uiW:wang iangX:iaoY:ing uaiZ:ou新概念汉字编码的五种取码模式本系统共提供五种输入方案给用户,即全形码、形声码、声形码、形音码、音形码。所有编码码长不超过四码。
〖全形码〗的码序是形形形形。如“新”的编码是LIUH。
〖形声码〗的码序是形形形声。如“新”的编码是LIUX。
〖声形码〗的码序是声形形形。如“新”的编码是XLIU。
〖音形码〗的码序是声韵形形。如“新”的编码是XMLI。
〖形音码〗的码序是形形声韵。如“新”的编码是LIXM。
一、单字编码取码模式1、全形码取码模式第一条可分成左右角取字根的字,一取左上角,二取右上角,三取右下角,四取右下角字根左边紧挨着的字根,一字编为四码。

粘丷一口木BHOM得
日寸亻 PFCR福丶一田
NHTY第二条字首是一个字根盖顶的字若右下角字根左边有字根可取,则一取字首字根,二取右下角字根,三取右下角左边紧挨着的字根,往右无字根可取,则四取右下角上面的字根一字编为四码。如
薄艹寸氵冂CCDK霪一土氵丿HTDP第三条字首是一个字根盖顶的字若字底也是由一个字根构成,一取字首字根,二取字底字根,三和四取字底字根的上部字根,一字编为四码。如

口冂丨 LOKU寨宀木八一BMBH禀亠小二囗EXEF第四条字首是一个字根盖顶的字若字底也是由一个字根构成,而字底字根的上边有两个以上字根并列,则一取字首字根,二取字底字根,三取字底字根上部最右下的字根,四取第三字根左边的字根,一字编为四码。如
燕艹灬匕口CHQO褒亠
木亻 EYMR第五条字首是一个字根盖顶的字若字首字根下部分为左右结构,而左上又有字根可取,则一取字首字根,二取右下角字根,三取左下角字根,四取左下角上部的字根,一字编为四码。如
对本实用新型

如下图1是本实用新型的结构示意2是构成控制部件的比较放大器电子原理3是电热控温管构造中(1)控制部件(2)电热及测温部件(3)电热体导线(4)温度传感器导线(5)硬质玻璃管体(6)温度传感器(7)电热体图1中的控制部件就是由图2所示的比较放大器构成,它是一个由运算放大器F007组成的恒温电路,采用电容降压,并由一个双向可控硅控制负载,这一部分元件可置于一个小型塑料合中,设有发光二极管指示工作状态。图3中的电热控温管内,温度传感器(6)与电热体(7)相互隔离绝缘安置,确保温度传感器接受的温度为被加热液体的实际温度(误差∠±0.5℃)。管内用填充物(如石膏粉、水泥或环氧树脂)塞实固定。温度传感器(6)和电热体(7)引出线分别按图导2中的
和“负载”两端。
实际应用时,将电热控温管置于盛有液体的显影盘内一侧(用夹具或胶纸稍加固定)然后将插头接220V电源就进入自动工作状态。随着照片显影操作,液体处于搅动状态促使热量的均匀扩散,从而确保显影效果。
第七条两字根字的编码两字根字共有左右结构、上下结构和交叉结构三种,编码时编成三码或四码。
1、左右结构的字取完两码之后,第三码追加该字的右下角单笔字元,作为识别码,第四码固定取W。
则贝刂亅BDGW冲冫中丨EAUW2、上下结构的字取完两码之后,第三码追加该字的右下角单笔字元,作为识别码,第四码固定取C。
吉士口
TOAC主亠土一ETHC3、交叉结构的字取完两码之后,第三码固定取J,“J”也就是交叉结构的“交”字的声母,没有第四码。
九乙丿YPJ果囗木FMJ十一丨HUJ4、具有方框结构的两码字①、外围是大“囗”的两码字,则第三码追加方框内字根右下角的单笔,作为识别码。没有第四码(因为它不属于上述三种结构中的任何一种)。
田囗十丨FUU回囗口
FOA困囗木
FMN②、在左右结构和上下结构中,右边或下边具有方框结构,则第三码取方框中的字根,第四码和上面一样,如
亩亠田十ETUC阳阝日一EFHW冒曰目二FFEC2、形声码取码模式形声码取码模式只需将全形码的最后一码换为该字的声母。如“新”,先取前三个形码“
丨”,即“LIU”,然后再取声母“X”,即“LIUX”。当全形码为三码时,只需在最后加上一个本字声母,如下一丶丨(X)HNUX;先丿土儿(X)PTEX;
女一
丿(N) HQPN; 再一冂土(Z) HKTZ。
当全形码为两码时同样只需在第三码加上一个本字声母即可,如个人丨(G)RUG;只口八(A)OBA;
困囗木(K)FMK;里日土(L)FTL。
当汉字没有声母时,就在后面加上零声母“O”,如安宀女(O)BNO;恶一心一(O)HXHO。
3、声形码取码模式该取码模式和形声码取码模式只有一点不同,即只需将形声码的最后一码调到第一码的位置即可。
4、音形码取码模式音形码取码模式是将汉字的声母和韵母置于前两码的位置,后两码是汉字形码的前两码,如“得”,先取声母和韵母“DE”,然后再取全形码的前两码“丿日”,即“PF”,“得”字的音形码为DEPF。
5、形音码取码模式该取码模式和音形码取码模式只有一点不同,即只需将音形码的前两码调到第三、第四码的位置即可。
二、基本取码规则1、交叉结构横笔结构优先在取码时,若遇到汉字的左上角或右上角是两个字根相交,则先取横笔结构的字根,如
的目的,适应了广大业余摄影爱好者的消费水平。
对本实用新型

如下图1是本实用新型的结构示意2是构成控制部件的比较放大器电子原理3是电热控温管构造中(1)控制部件(2)电热及测温部件(3)电热体导线(4)温度传感器导线(5)硬质玻璃管体(6)温度传感器(7)电热体图1中的控制部件就是由图2所示的比较放大器构成,它是一个由运算放大器F007组成的恒温电路,采用电容降压,并由一个双向可控硅控制负载,这一部分元件可置于一个小型塑料合中,设有发光二极管指示工作状态。图3中的电热控温管内,温度传感器(6)与电热体(7)相互隔离绝缘安置,确保温度传感器接受的温度为被加热液体的实际温度(误差∠±0.5℃)。管内用填充物(如石膏粉、水泥或环氧树脂)塞实固定。温度传感器(6)和电热体(7)引出线分别按图导2中的
和“负载”两端。
实际应用时,将电热控温管置于盛有液体的显影盘内一侧(用夹具或胶纸稍加固定)然后将插头接220V电源就进入自动工作状态。随着照片显影操作,液体处于搅动状态促使热量的均匀扩散,从而确保显影效果。

口冂丨 LOKU寨宀木八一BMBH禀亠小二囗EXEF第四条字首是一个字根盖顶的字若字底也是由一个字根构成,而字底字根的上边有两个以上字根并列,则一取字首字根,二取字底字根,三取字底字根上部最右下的字根,四取第三字根左边的字根,一字编为四码。如
燕艹灬匕口CHQO褒亠
木亻 EYMR第五条字首是一个字根盖顶的字若字首字根下部分为左右结构,而左上又有字根可取,则一取字首字根,二取右下角字根,三取左下角字根,四取左下角上部的字根,一字编为四码。如
科学技术丿
扌木 PXLM④五字以上的词语先取前三个字的按字编码的第一个字根,再加上最后一字的按字编码的第一个字根。如中华人民共和国口亻丿囗FRRF国家标准局囗宀木尸FBMU3.声形码①双字词语依次取第一个字的声母,第一个字的首取字根,第二个字的声母和第二个字的首取字根,一词编为四码。如家庭J宀T广BJGT国家G囗J宀FGBJ③三字词语先取各字的本字声母,再加上最后一字的首取字根,一词编为四码。如国务院GWY阝GWYE计算机JSJ木JSJM系列化XLH亻XLHR③四字词语只取每字的声母码,一词编为四码。如体制改革TAGG科学技术KXJI④五字以上的词语先取前三个字的声母码,加上最后一字的声母码,中间字舍去不用,一词编为四码。如
中华人民共和国AHRG国家标准局GJBJ中国工商银行AGGH4、音形码①双字词语依次取第一个字的声母和韵母,第二个字的声母和韵母,一词编为四码。如家庭JRTYR(ia)Y(ing)国家GOJRO(uo)R(ia)②三字词语先取各字的本字声母,再加上最后一字的韵母,一词编为四码。如国务院GWYDD(uan)计算机JSJII(i)系列化XLHRR(ua)四字词和五字以上的词编码方式与声形码一样。
5、形音码形音码词的取码方式和上述类似。
到此为止,已经清楚、完整地介绍了本发明设计的新概念汉字编码。可以预料这种编码的使用必将给用户带来极大的方便,而且,能有效的节省用户在购买编码技术和汉字输入软件、资料以及培训方面的人、财、物的消耗,因为这样的编码技术具有最大的资源和信息的共享范围。
权利要求
一种确定汉字字根在26个英文字母键盘上位置布局的新概念汉字编码,其特征在于1、新概念汉字编码采用了129个字根;
2.129个字根分为基本字根和归类字根;基本字根是按基读音或其名称的主要读音布置在与其相同读音的字母键上;归类字根为与基本字根形状类似的字根,无论归类字根如何读音均认定该归类字根与其形状类似的某一基本字根为同一读音,因而归类字根布置在与其形状类似的某一基本字根的同一键上;
全文摘要
本发明提出的新概念汉字编码在选取字根时,充分利用汉字本身的各种内在联系,经过大量的综合分析和测算,选用了129个汉字部件作为字根,并且将129个字根分为基本字根和归类字根。基本字根是按其读音或其名称的主要读音与其声母键对应布阵;归类字根为与其基本字根形状类似的字根,归类字根布置在与其形状类似的某一基本字根的同一键上。其特点是易记易学,重码率低,真正实现汉字编码三大类型五种编码模式的统一。
文档编号G06F3/023GK1070494SQ92110268
公开日1993年3月31日 申请日期1992年9月15日 优先权日1992年9月15日
发明者杨庚生, 吕梁, 柯红五, 张学东 申请人:杨庚生, 吕梁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1