汉字编码及键盘的制作方法

文档序号:6411906阅读:518来源:国知局
专利名称:汉字编码及键盘的制作方法
技术领域
本发明涉及一种汉字编码及键盘。
我国是使用汉字的国家,计算机要在我国的推广和应用必须解决汉字信息处理问题。现有的汉字编码多达千余种,多以拼音、部首为基础进行编码,各有千秋、汉字是我们中华民族的文字,也是我们交流思想、传递信息的工具。汉字属于象形文字,其文字字种多,字形复杂,每字涵义独特,个性鲜明、形、音、义又缺乏联系,与西方文字有显著区别,所以处理汉字信息要比处理西文信息困难得多。
目前汉字输入计算机的方法很多,从原理上分两大类一类是通过计算机的键盘人工输入;一类是让计算机自动识别。为了在标准计算机键盘上输入汉字,就得采用汉字编码,现有的编码一般较难学,记忆量大,重码率较高,如以GB2312-80为基准的国际码,国标区位码;以发音为基础的拼音码;以字形为参考的首尾码、拼形码、五笔字形码;以音形结合为前提的声韵部表码,五十字元输入法,随着计算机的发展,汉字的输入技术也不断更新。
由于汉语拼音目前在我国已基本普及,虽一直不作为文字使用,但在一些领域中已被作为辅助文字工具普遍使用。
本发明的目的在于提供一种编码科学、易学、易记的汉字拼码方法和采用拼音的中文键盘。
实现本发明的技术方案如下一种汉字编码法(1)汉字正码由四码构成,首码是表示该字的声母,第二码表示该字的韵母,第三码表示该字的部首的读音声母,第四码表示该字部首的读音韵母;
(2)三十个标准字符即表示三十个声母又表示三十个韵母,A-a、B-ua、C-iou、D-iang、E-e、F-ao、G-ia、H-ie、J-an、K-ian、L-en、M-uo、N-uen、O-o、P-ong、Q-eng、R-ai、S-ei、T-uang、W-ou、X-ang、Y-uan、Z-in、I-i、U-u、V-v、Z-ü、C-ing、S-iao、W-uai。
(3)IUV除本音依、乌、威外还发xü需、qü区、jü居三个声母,ZCS是zh、ch、sh的化简符,W是yu于的化简符,A、O、E三个字符作声母和韵母发同样的音。
若汉字由两个部首组成的义符,则前两码同前,第三码由七大部首代表的数字1-7表示,第四码由第二个部首的声母表示,七大部首1-7依次为亻、钅、口、才、木、氵、艹。若汉字重码则用五个码表示,第五码为数字码,由1~5表示。若汉字重码,采用四码变码字,前3码同上,第四码由义符的韵母换成声母表示,或由3~5数字表示。词组编码为五码,第一码为数字是词组指数,就是词组的字数,第二至第五码分别为(1)两字词、第二第三码是词头音符和义符的两声母,第四,第五码是词尾音符;(2)三字词,第二第三码是词头音符和义符的两声母,第四码是第二字的声母,第五码是第三字的声母。(3)四字词,第二码是第一个字的音符声母,第三码是第二个字的音符声母,第四码是第三个字的音符声母,第五键码是第四字的音符声母,(4)超过四字词,第二、第三码以词组前两字声母做为前两码,第四第五码以词组后两字声母做后两码,中间字无论多少都不取码。词组的重码在词尾加数字识别码。一种计算机用键盘,其原键盘上标号和位置不变,其特征在于所述汉字编码法中、三十个标准字符和键盘上键一一对应,标准字符处在韵位时发韵母的音。英文26个字母键和F1~F12不变,其特征在于将四个标点符号键下移到空格键旁,占用Alt、Ctrl、Shift键的位置,每个功能键由汉字编码取代。


图1中文键盘。
图2代用中文键盘。
下面结合实施例详细叙述本发明。
一、标准字符能代表全部中文信息的字符是三十个,定为三十个标准字符。标准字符的名字是声母名,能对三十个韵母依次兼任,实行了一身兼两职。
标准字符ABCDEFGHJKLMNOP被兼韵母a ua iouiang e ao ia ie an ian en uo uen oong QRSTWXYZIUVZCSW eng ai ei uang ou ang uan in i u v ü ingiao uai1、标准字符A——Z是拼音索引大写;新增加的三个声母xü需,Qü区,Jü居,由标准字符IUV兼任,(IUV的本音还是韵母依、乌、威);ZCS是zh ch sh的化简符;(W於)是(yu)的化简符。
2、被兼任的韵母,是字典上33个去掉了三个(üe、üan、ün)才与三十个声母达到平衡的——声母增加了三个,就是去掉三个韵母的变化而成的xü、qü、jü。
3、AOE这三个字符作声母和作韵母发同样的音。
前面说过三十个标准字符的本音是声母音,如果把它放到韵母的位置上,它就得发韵母的音,这就叫一身兼两职。如例1、张ZX、“X”在韵位上要发韵母ang,例2 香XD(xiang)“D”在韵位上要发韵母iang的音。
“X”在声位上要发本音声母音——标准字符的音。
二、音素文字象形文字的基本成份是字音和字义(部首)组成,字义也为“字义音”写在“字音”的后面,就是中文的音素文字。根据新华字典的字数,用三十个标准字符写下的音素文字是7921个。其中四码字是7129个,五码字是792个。分别说明。
1、四码字音素文字的结构是“字音”两码加“字义”两码一共是四码,如例1张ZXGP(zhang gong),“ZX”是字音,“GP”是字义“弓”的拼音,这四个字符ZXGP就是张的音素文字。
例2香XDHE(xiang He)、“XD”是字音,“HE”是字义,禾“的拼音XDHE是香的音素文字。
2、五码字为了区别重码字,在“义符”的后面又加了一个区别号。区别号从2--5,因有2--5的重码组,2重码的最多,5重码的最少,(9组)。例说一个五重组YIYj(YiYan)议1谊2译3诣4诒5它们对应的音素文字是YIYJ、YIYJZ,YIYJ3、YIYJ4、YIYJ5。(1号字四码其余的五码),一个五重组有四个字是加号字。这四个就是五码字。
3、双义符这是四码字里的特点。如涨ZX字原有个部首“弓”,又加了个部首“氵”这两个部首的字,就是双义符字。“氵”是一个大部首,它有一个代号“6”,取“弓”的拼音“GP”声母连起来“6G”就是涨的双义符。它的音素文字“ZX6G”还是四码。有七大部首是“ 亻钅口才木氵艹”依次的代号是1-7。
4、音素文字的三种写法(1)、全写四码字的音素文字,五码字的音素文字将它的字符都写出来就全写,如;张ZXGP、译YIYJ3,就是全写。
(2)、简写四码字省略的两码义符,用字音两码表示,就是简写,如(张)ZX。五码字也是用字音如(译)YI。
(3)、缩写四字以上的词组,可以写成一字一符,如(中ZP)、国(GM)(人RL)、(民MZ),取声母是ZGRM就是此词的缩写。
三、汉字编码由于它是新华字典的规律、所以说它是象形文字的另一种写法。象形文字它是人与人对话的工具,音素文字则是人与计算机对话的工具。象形文字作为一种图象储存在机内,用音素文字作指令将汉字调出,这指令就是汉字编码。虽说音素文字还有792个五码字、对于普通的打字员来说,这第五码由机器为他记忆,还是四码。四码字的四个字符是两个音符和两个义符只说五码的。如打五码字译的编码、前四码是YIYJ、另一码是个号,在提示行的“3”打上就是译的编码YIYJ3。对专业的打字员来说,将792个五码字变为四码是为了实现盲打的速度。由其对600个2号字用近三码的方式变码将义符韵母和号都去掉,换上同一个声母。如2号字“谊”的五码是YIYJ2,去掉“J2”换上“Y”就是YIYY——这叫作重声字。还有192个字是3-5号的五码字。对这一部分的字是将韵母去掉就是四码,如译诣诒编码的义符去掉了韵母变成了YIY3、YIY4、YIY5——这叫作声号字。以上说的一个五重组分三部分是1号字为四码、2号字为重声,3-5号字为声号字。
词组的编码为五码如两字词、第一码是词指数、第二码、第三码是词头音符义符声母之和,第四、五码是词尾音符。例爱好ZAZHF,2是词指数,AZ是“爱”的音符义符的声母,HF是“好”的音符(Hao)。
三字词的前两码和两字词的相同(指数在外)都是词头的音符和义符的两声母,后两码和两字词不同,是后两个字的音符声之和。如奥运会3ADWH,AD和前面相同,WH是运会的音符声之和。
四字词的四个字符是四个字的音符声之和,如爱财如命4ACRM,(一字下声母)。
超过四个字的词组的四码,取码方式和前面的都不相同,先以词组的前两个字的音符声母为前两码、再以词组的后面两个字的音符声母作为后两码,词组中间的字不论多少都不取码。如七字词,奥林匹克运动会7ALDH,7是七个字,AL是“奥林”的两音符声母,DH是动会的两音符声母、“匹克运”三个字不取码。
四、部首音——义符部首是汉字的两大要素之一,由其对音素文字来说,音符义符各占二分之一的位置,对这么重要的问题需加倍重视。首先要严格执行字典的规律,如排列的顺序,每个部首所代表的字数,部首的名称等。但是对特别部分还是要适当调整的。如另用名,这是部首没用其常用名,而用了另一个名字、象十、尸、石等这样的部首,为了避开与其重名的六个“shi”(示食饣矢士),而叫它们的“小名”,十(加)、尸(体),石(担)。还有几个叫“小名”的也是这个道理。关于叫旧声母、韵母的名字,也是因为字典上还有它们的名字、如勹ㄈ尢纟等。
有的部首不用音符表示,而用代号表示,这是为了减少一个字符,如“木”的代号是“5”,很明显比“MU”少一个字符,这样的部首有七个——七大部首。
一个部首只取一个单音,如“宀”通常叫它“宝盖”,用双音名字表示,为减少字符只采用单音一个字“宝”来表示,音符是BF(bao)。以单音表示的还有纟阝等部首。
取部首的原则汉字以左右结构的以左为主,如明字取日作部首。上下结构的以上为主、如吉字取士作部首。内外结构的以外为主,如闽字取门作部首。
五、电脑键盘前面已说过我们有人与机器对话的工具,有了中文信息利用电脑发挥作用的使者——三十个标准字符和用标准符组成的音素文字与象形文字。我们要学习它,研究它,利用它,推广它,要使它迅速的发挥威力。这新发明的中文电脑的第一步主要的是以软件的功能多表现,其次是键盘的字符键,因为中文电脑的字符键是三十个比原先26个多了四个,这样就得借用四个标点符号键(Z;)(C>)(S),(W<)别的键子都照原样只是软件和键盘满足了中文信息的需要,我们的代用中文电脑也就第一步的发挥作用了如图1。
在利用代用中文电脑键盘的基础上发展“正式的中文电脑键盘新设的中文电脑键盘是三十个标准字符占的位置不变,将四个标点符号键位下移到空格键旁。占用由原先(Alt、ctrl、shift)三个键改的四个键位是右侧的(;,./)将外文键名翻译成中文键名,用简写的音素文字记在键子上如图2。
英文 中文ESC KPZ1控制(键)Back space TVGE退格(键)EnterHVCE回车(键)………应翻译的键名是21个。
关于BASIC语言的程序能不能翻译成中文的语句,回答是肯定的,因为BASIC语言我们称它为算法语言,其特点是用一种接近自然语言和数学语言的专用语言来表示算法语言。英文语句和我们的音素文字语句,不过多个少个字符的问题,当然还是个细心研制结合的问题。
权利要求
1.一种汉字编码法,其特征在于(1)汉字正码由四码构成,首码是表示该字的声母,第二码表示该字的韵母,第三码表示该字的部首的读音声母,第四码表示该字部首的读音韵母;(2)三十个标准字符即表示三十个声母又表示三十个韵母,A-a、B-ua、C-iou、D-iang、E-e、F-ao、G-ia、H-ie、J-an、K-ian、L-en、M-uo、N-uen、O-o、P-ong、Q-eng、R-ai、S-ei、T-uang、W-ou、X-ang、Y-uan、Z-in、I-i、U-u、V-v、Z-ü、C-ing、S-iao、W-uai。(3)IUV除本音依、乌、威外还发xü需、qü区、jü居三个声母,ZCS是zh、ch、sh的化简符,W是yu于的化简符,(4)AOE这三个字符作声母和韵母发同样的音。
2.根据权利要求1所述的汉字编码,其特征在于若汉字由两个部首组成的义符,则前两码同前,第三码由七大部首代表的数字1-7表示,第四码由第二个部首的声母表示,七大部首1-7依次为亻、钅、口、才、木、氵、卄。
3.根据权利要求1所述的汉字编码,其特征在于若汉字重码则用五个码表示,第五码为数字码,由1~5表示。
4.根据权利要求1所述的汉字编码,其特征在于若汉字重码,采用四码变码字,前3码同上,第四码由义符的韵母换成声母表示,或由3~5数字表示。
5.根据权利要求1或2所述的汉字编码,其特征在于词组编码为五码,第一码为数字是词组指数,就是词组的字数,第二至第五码分别为(1)两字词、第二第三码是词头音符和义符的两声母,第四,第五码是词尾音符;(2)三字词,第二第三码是词头音符和义符的两声母,第四码是第二字的声母,第五码是第三字的声母。(3)四字词,第二码是第一个字的音符声母,第三码是第二个字的音符声母,第四码是第三个字的音符声母,第五码是第四字的音符声母,(4)超过四字词,第二、第三码以词组前两字声母做为前两码,第四第五码以词组后两字声母做后两码,中间字无论多少都不取码。
6.根据权利要求5所述汉字编码,其特征在于;词组的重码在词尾加数字识别码。
7.一种计算机用键盘,其原键盘上标号和位置不变,其特征在于所述汉字编码法中、三十个标准字符和键盘上键一一对应,标准字符处在韵位时发韵母的音。
8.根据权利要求7所述的一种计算机用键盘,其特征在于英文26个字母键和F1~F12不变,其特征在于将四个标点符号键下移到空格键旁,占用Alt、ctrl、shift键的位置,每个功能键名由汉字编码取代。
全文摘要
一种汉字编码及键盘,其特征在于汉字正码由四码构成,首码是表示该字的声母,第二码表示该字的韵母,第三码表示该字的部首的读音声母,第四码表示该字的部首的读音韵母;采用本发明,可以更方便地输入汉字,易学、易记,重码率较低,记忆量小,输入词组方便,实用,采用中文键盘,简捷,直观,是一种编码科学,合理易于被接受的替代现有方案的汉字编码。
文档编号G06F3/023GK1165998SQ9710507
公开日1997年11月26日 申请日期1997年1月30日 优先权日1997年1月30日
发明者戴华参 申请人:戴华参
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1