汉字“中华之声”码计算机键盘输入法的制作方法

文档序号:6601608阅读:462来源:国知局
专利名称:汉字“中华之声”码计算机键盘输入法的制作方法
技术领域
本发明属于汉字文化圈中地国家、地区所使用的简体和繁体汉字的编码方法及其汉字编码信息的计算机键盘输入方法领域。
迄今为止,汉字的计算机键盘输入方法已逾七百种之多。中国大陆常用的编码方法主要有国标区位码、五笔字型码和汉语拼音码等多种编码方法及其输入法。大陆以外的国家、地区常用汉字的编码方法是使用本国、本地区汉字读音的拼音字母输入法、仓颉中文输入法等。如此之多的汉字编码方法,对于“容易学的输不快,输入快的不易学”(《计算机世界》刊名代码1-28,1994年第43期余克艰、庞宣明著《汉字信息的计算机输入与汉字文化》)这一矛盾,都没有从根本上得到解决。
国标区位码无重码,但难以记忆;五笔字型码重码率较低、输入速度较快,但汉字部首拆分的规范性差、汉字书写笔顺规范性差且操作者记忆量大(130个基本字根都需记忆),非专职操作员难于熟练掌握;拼音码(全拼、双拼等)重码率高、输入速度慢,全拼音法无记忆量,双拼音法仍有汉语拼音字母与计算机键盘键名对应转换重又再定义的记忆量(35个韵母和3个声母总计38个记忆量)。
日语当用汉字同音字“価”、“火”、“科”、“言果”、“可”、“加”、“蚊”、“香”、“
”、“日”、“花”、“家”、“货”、“歌”、“下”、“化”、“华”、“荷”、“佳”、“果”等,读音都为日语假名“か”、罗马字母标音都为“ka”;日本语汉字同音词汇“果子”、“歌词”、“仮死”、“可视、“河岸”、“华氏”、“下赐”、“下肢”、“瑕疵”等,读音都为日语假名“かし”、罗马字标音都为“kasi”。
韩国语和朝鲜语中的常用汉字同音字“家”、“佳”、“街”、“可”、“歌”、“加”、“價”、“假”、“架”、“暇”、“嘉”、“嫁”、“稼”、“贾”、“驾”等,读音都为韩、朝语字母“
”。
由上则不难看出,日韩朝三国文字中汉字和汉字词的拼音字母编码,可称之谓“全拼音编码法”,该方法类同于我国汉字的全拼音输入法。显而易见,其如此之高的重码率是绝对不可避免的。
由此可见,各种汉字编码方法可谓“尺有所长,寸有所短”。但都在易学、快速、规范这三者的相互矛盾之中徘徊。
“中华之声”码(下简称“中华码”)的汉字编码信息,取自构成书写汉字规范笔顺的第一个、第二个和该汉字收笔画的部首名称读音和该汉字的读音。中华码编码方法遵循汉字读音规范、汉字书写笔顺规范和汉字文化圈中汉字部首的通常习惯称谓命名方法。汉字应用中华码编码的计算机键盘代码是键盘键名(含26个英文字母键名和数字、符号键名等)。中国大陆实行的汉语拼音方案中的拼音字母和其对应的注音字母转换为键盘的英文字母键名,汉字便可按其读音应用英文字母编码,计算机标准键盘则转变成为汉字的汉语中华码输入键盘。同上,中国大陆以外的国家、地区则可将计算机标准键盘或文字处理机键盘,转变成为汉字的日语、韩朝语、注音字母或其他标音符号的中华码输入键盘。
本文中仅以中国大陆和台港澳地区所使用的汉语拼音字母和其对应的注音字母为例,定义其与键盘键名英文字母的转换规则
1、汉语拼音字母声母和其对应的注音字母声母bㄅ、pㄆ、mㄇ、fㄈ、dㄉ、tㄊ、nㄋ、lㄌ、g巜、kㄎ、hㄏ、jㄐ、qㄑ、xㄒ,其键盘英文字母键名代码别为b、p、m、f、d、t、n、l、g、k、h、j、q、x;
2、汉语拼音字母声母和其对应的注音字母声母zhㄓ、chㄔ、shㄕ、rㄖ、zㄗ、cㄘ、sㄙ,其键盘英文字母键名代码分别为z、c、s、r、z、c、s;
3、汉语拼音字母韵母和其对应的注音字母韵母aㄚ、oㄛ、eㄜ,其键盘英文字母键名代码分别为a、o、e;
4、汉语拼音字母韵母和其对应的注音字母韵母i丨、uㄨ、üㄩ,其键盘英文字母键名代码分别为y、w、y;
5、汉语拼音字母韵母和其对应的注音字母韵母aiㄞ、eiㄟ、oㄠ、ouㄡ、anㄢ、enㄣ、angㄤ、engㄥ、erㄦ,其键盘英文字母键名代码分别为a、e、a、o、a、e、a、e、e。
日韩朝三国和台港澳地区所使用的汉字,则可依据其标音的字母或标音符号与所使用的计算机或文字处理机键盘键名对应转换的定义规则,取其拼音字母、注音字母或标音符号所对应的键盘键名(可包括英文字母键名以外的数字、符号键等)为代码,采用中华码的编码方案,而进行键盘的汉字中华码编码输入。
中华码全码共四码,由形码(三码)和音码(一码)组成全码。汉字中华码有形音码和音形码两种编码方案(以下分别称中华形音码和中华音形码)。中华形音码由形码加音码组成,中华音形码由音码加形码组成。
构成汉字书写规范笔顺的第一个、第二个和该汉字收笔的部首名称读音音节(由拼音字母、注音字母或其他标音符号按照该汉字的读音组成)首字母的键盘键名代码,分别组成中华码的形码第1码、第2码和第3码。该汉字的读音音节首字母的键盘键名代码,作为中华码的音码。
汉字只有一个字母或标音符号标音,该汉字读音音节的首字母即为该字母或该符号。
构成汉字的汉字成字部首都是中华码成字部首,中华码成字部首名称即为该汉字,中华码成字部首组成汉字中华码的形码(第1码、第2码或第3码)为该中华码成字部首名称的汉字读音音节首字母的键盘键名代码;中华码非成字部首名称按照中华码非成字部首名称的命名规则定义,中华码非成字部首组成汉字中华码的形码(第1码、第2码或第3码)为该中华码非成字部首名称的读音音节首字母的键盘键名代码;中华码部首(成字、非成字部首)组成汉字,汉字的中华码部首拆分规则按照汉字书写规范笔顺,只取汉字的前两个中华码部首,并按照书写该汉字这两个部首的空间先后顺序,按照取成字部首优先、取大部首(中华码成字、非成字部首中相对笔画较多的部首)优先的规则组成该汉字中华码的形码第1码和第2码后,再取该汉字的收笔笔画中的大部首为该汉字中华码的形码第3码;操作者不会书写或对汉字规范笔顺不清楚的汉字,中华码的形码可用“字形模糊码键名”代替编码;汉字构件(本文指不组成汉字而又需要在文本中输出的汉字部首)和冷僻汉字(操作者不能正确读音的汉字)的中华码的音码可用“字音模糊码键名”代替编码;使用汉字的国家、地区应用拼音字母(如日文假名和韩、朝文字母)或其他标音符号(如日文中使用的罗马字母、台港澳地区使用的汉语注音字母),用于标注简体或繁体汉字的读音,若对计算机键盘键名重新定义转换为拼音字母或其他标音符号,完全可以采用汉字的汉语中华码编码方案和规则。
下面从五个方面阐述本发明内容。
一、汉字中华码编码公式
1、中华码全码共四码,由形码(3码)和音码(1码)组成。构成汉字规范笔顺的前两个中华码部首名称和该汉字收笔的中华码部首名称的读音音节首字母的键盘键名代码,分别组成形码的第1码、第2码和第3码。该汉字读音音节首字母的键盘键名代码作为音码。
中华形音码=形码(1码+2码+3码)+音码(1码);
中华音形码=音码(1码)+形码(1码+2码+3码)。
2、字形模糊的汉字其形码可用“字形模糊码键名”和其音码编码。
3、汉字构件或冷僻汉字,如“屮”、“彐”、“肀”、“丬”和“糸”、“厶”、“爻”、“丌”等,音码可用“字音模糊码键名”和其形码编码。
4、中华码简码规则部分汉字按照中华码全码排列顺序分别取前一码、前二码、前三码,加“空格键”编成该汉字对应的中华码一、二、三级简码。
二、中华码部首及其名称定义规则
1、中华码成字部首和名称汉字作为构成汉字的部首,都是中华码成字部首,其名称为该成字部首汉字。
如简体汉字“码”字,由“石”和“马”二字构成,“石”和“马”则是汉语中华码成字部首,其名称分别为“石”和“马”。
如繁体汉字“言果”字,由“言”和“果”二字构成,“言”和“果”则是汉语中华码成字部首,其名称分别为“言”和“果”。
如日文当用汉字“私”字,由“禾”和“厶”二字构成,“禾”和“厶”则是日语中华码成字部首,其名称分别为“禾”和“厶”。
如韩、朝文常用汉字“孟”字,由“子”和“皿”二字构成,“子”和“皿”则是韩、朝语中华码成字部首,其名称分别为“子”和“皿”。
2、中华码非成字部首和名称从汉字非成字部首中选择部分部首作为中华码非成字部首,其汉语名称定义参照《辞海》1979年版中汉字部首名称的称谓和国家教委、国家语委有关政令规定的称谓,其日韩朝语名称定义则按照该国语言的汉字非成字部首的名称称谓定义。
仅以汉语为例,汉字非的成字部首如(一)、(丨)、(丿)、(丶)、(乙)、(宀)、(冖)、(讠)、(艹)……选作为中华码非成字部首,其名称分别为“横”、“竖”、“撇”、“点”、“折”、“宝字盖”、“秃宝盖”、“言字旁”、“草字头”……。
三、汉字的中华码部首拆分规则
按照组成汉字规范笔画的空间先后顺序,若汉字只由两个中华码构成,分别取汉字的第一个、第二个中华码部首和第二个中华码部首的收笔笔画中的中华码部首,若汉字由两个以上中华码部首构成,只分别取汉字的前两个中华码部首和该汉字收笔笔画中的中华码部首。拆分汉字时,拆取每一个部首均按照取成字部首优先、取大部首优先的规则。
1、相对笔画较多的成字部首即成字大部首最优先组成中华码部首;
2、只有成字部首或只有非成字部首构成的汉字,取大部首优先;
3、成字部首和非成字部首构成的汉字,取成字部首优先、大部首优先;
4、非成字部首和成字部首构成的汉字,取大部首优先、成字部首优先。
以简体汉字举例说明如次
如“树”字,拆分为“权”、“寸”和“丶”,不拆分为“木”、“对”和“寸”。
如“宏”字,拆分为“宀”、“一”和“厶”,不拆分为“丶”、“冖”和“厶”。
如“宝”字,拆分为“宀”、“玉”和“丶”,不拆分为“宀”、“王”和“丶”。
如“中”字,拆分为“口”、“丨”和“丨”。
如“华”字,拆分为“化”、“十”和“丨”。
如“码”字,拆分为“石”、“马”和“一”。
四、中华码的形码编码规则
1、按照汉字的中华码部首拆分规则,分别取该汉字的第一个、第二个和该汉字收笔的中华码部首名称的读音音节首字母的键盘键名代码,组成中华码的形码。
2、汉语中的两个一笔画汉字“一”和“乙”的形码,分别定义为英文字母“hhh”和“yyy”。
3、日语中两个一笔画当用汉字“一”和“乙”的形码,分别定义为日文假名“よよよ”、“おおお”和罗马字母“yyy”和“ooo”。
4、韩、朝语中的两个一笔画常用汉字“一”和“乙”的形码,分别定义为韩、朝字母“丨丨丨”和“一一一”。
如“啊”字的第一个成字部首“口”、第二个成字部首“阿”和收笔成字部首“可”组成汉语中华码的形码“kak”;
如“中”字的第一成字部首“口”、第二个非成字部首“丨”和收笔非成字部首“丨”组成汉语中华码的形码“kss”;
如“华”字的第一个成字部首“化”、第二个成字部首“十”和收笔非成字部首“丨”组成汉语中华码的形码“hss”;
如“码”字的第一个成字部首“石”、第二个成字部首“马”和收笔非成字部首“一”组成汉语中华码的形码“smh”。如繁体汉字“國”字,由第一个非成字部首“冂”(中华码部首名称“方框”)、第二个成字部首“或”(中华码部首名称“或”)和收笔非成字部首“一”(中华码部首名称“横”)组成汉语中华码的形码“fhh”。
如日文当用汉字“国”(日语假名读音“くに”、罗马字母拼音“kuni”),由第一个非成字部首“冂” (日语假名读音“くにがまえ”、罗马字母拼音“kuchigamae”)、第二个成字部首“玉”(日语假名读音“たま”、罗马字母拼音为“tama”)和收笔的非成字部首“一”(日语假名读音“よこ”、罗马字拼音“yoko”)组成日语中华码的形码“くたよ”和“kty”。
如韩、朝文常用汉字“國”(韩、朝语字母读音“
”),由非成字部首“冂”(韩、朝语字母读音“
”)、成字部首“或”(韩、朝语字母读音“
”)和非成字部首“一”(韩、朝语字母读音“
”)组成韩、朝语字母中华码的形码“
”。
五、中华码的音码编码规则
1、我国使用的汉字,其读音暂以《新华字典》1992年重排本和《辞海》1979年版中的汉语读音为标准,取汉字汉语读音音节首字母的键盘英文字母键名代码作为音码。
2、日韩朝三国所使用的汉字以其本国标准读音为标准,按照其标音字母或符号与计算机键盘键名的对应转换定义规则,取其读音音节首字母的键盘键名代码作为音码。
如汉字简体字“国”和繁体字“國”,汉语读音为“guó”、“ㄍㄨㄛ”,其音码为英文字母“g”。
如“啊!中华”的汉语读音为“ā、zhōng、huá”和“ㄚ、ㄓㄨㄥ、ㄏㄨㄚ”,三字的音码分别为英文字母“a、z、h”。
如日文当用汉字“私”,日语假名读音“わたし”、罗马字母标音“watasi”,其日语中华码的音码为日本假名“わ”和罗马字母“W”。
如韩、朝语常用汉字“金”,韩、朝语字母读音“
”,其韩朝语中华码的音码为韩、朝语字母“
”。
六、中华码(形音码和音形码)的词码编码规则
1、汉字二字词分别取组成词的首末汉字的汉字读音音节首字母的键盘键名代码,再加上该词首末汉字的形码第一码组成中华码词码的编码。
如汉语“中华”(zhōng huá;ㄓㄨㄥ、ㄏㄨㄚ)二字词的汉语中华码的编码为英文字母“zh kh”。
如日语“日本”(日文假名读音にほん、罗马字母标音nihon)二字词日语中华码的编码为日文假名“にほにボ”或“にほにも”和罗马字母“nhnb”或“nhnm”。
2、汉字三字词分别取组成词的三个汉字的汉字读音音节首字母的键盘键名代码再加上该词末字的形码第一码组成中华码词码的编码。
如汉语“中华码”( zhōng、huá、mǎ;ㄓㄨㄥ、ㄏㄨㄚ、ㄇㄚ)三字词汉语中华码的编码为英文字母“zhms”。
如日语“日本人(日文假名读音にほんじん、罗马字母标音nihonzin)三字词日语中华码的编码为日文假名“にほじは”和罗马字母“nhzh”。
3、汉字四字词分别取组成词的四个汉字的汉字读音音节首字母的键盘键名代码组成中华码词码的编码。
如汉语“中华民族”(zhōng、huá、mín、zú;ㄓㄨㄥ、ㄏㄨㄚ、ㄇ丨ㄣ、ㄗㄨ)四字词的汉语中华码编码为英文字母“zhmz”。
如日语“日本人民”(日文假名读音にほんじんみん、罗马字母标音nihonzinmin)四字词的日语中华码的编码为日文假名“にほじみ”和罗马字母“nhzm”。
4、汉字多字词分别取组成词的前三个和该词最末一个汉字的读音音节首字母的键盘键名代码组成中华码词码的编码。
如汉语“全世界人民大团结万岁!”的汉语中华码的编码为英文字母“qsjs”。
如日语“十二月往来”(日文假名读音じゅうにがつおうらい、罗马字标音ziyuugatsuourai)的日语中华码的编码为日文假名“じにがら”和罗马字母“zngr”。
据上所述,以简体汉字的汉语中华码编码为例,易知“啊!中华码”的汉语中华码计算机键盘输入的英文字母代码编码为
一、中华形音码
(1)、以字输入“kaka kssz hssh smhm”;
(2)、以字和二字词输入“kaka zhkh smhm”;
(3)、以字和三字词输入“kaka zhms”。
二、中华音形码
(1)、以字输入“akak zkss hhss msmh”;
(2)、以字和二字词输入“akak zhkh msmh”;
(3)、以字和三字词输入“akak zhms”。
日文当用汉字同音字“価”、“火”、“科”、“言果”、“可”、“加”、“蚊”、“香”、“呙”、“日”、“花”、“家”“货”、“歌”、“下”、“化”、“华”、“荷”、“佳”、“果”等,显而易见,使用日文假名或罗马字母编码的日语中华码的形码不产生重码。
日语中汉字同音词“果子”、“歌词”、“仮死”、“可视”、“河岸”、“华氏”、“下赐”、“下肢”、“瑕疵”等,使用日文假名或罗马字母编码的日语中华码词码不产生重码。
韩、朝语中同音字“家”、“佳”、“街”、“可”、“歌”、“加”、“價”、“假”、“架”、“暇”、“嘉”、“嫁”、“稼”、“贾”、“驾”等,使用韩、朝文字母编码的韩、朝语中华码的形码亦不产生重码。
综上所述,本发明的汉字编码方法是以汉字的字形和字音这二维汉字信息进行编码,规则简单、易记。中华码汉字输入方法是汉字文化圈中的一种易学习、输入快、并符合汉字语言规范性的计算机键盘汉字输入方法。操作者只要掌握汉字和汉字词的读音方法、中华码部首名称命名方法和汉字拼音、注音字母及其他汉字标音符号与计算机和文字处理机的键盘键名对应转换方法,便可进行无记忆量的键盘汉字和汉字词输入操作,基本上解决了“容易学的输不快,输入快的不易学”这一矛盾,在汉字文化圈中实现了汉字和汉字词编码的易学、快速、规范这三者的有机结合。
权利要求
1、一种汉字编码计算机键盘输入法-“中华之声”码(含中华形音码和中华音形码两种编码方案,下统简称中华码),其特征在于编码信息取自汉字读音和汉字字形的中华码部首名称读音,本发明的特征在于组成汉字规范笔顺的前两个和该汉字收笔笔画的中华码部首名称读音音节首字母的键盘键名代码,分别组成中华码的形码第1码、第2码和第3码;汉字读音节音首字母的键盘键名代码,作为中华码的音码;
中华形音码全码由形码加音码组成,即
中华形音码(4码)=形码(3码)+音码(1码);
中华音形码全码由音码加形码组成,即
中华音形码(4码)=音码(1码)+形码(3码);
汉语拼音方案字母表中的声母拼音字母和其对应的注音字母bㄅ、pㄆ、mㄇ、fㄈ、dㄉ、tㄊ、n ㄋ、lㄌ、g巜、kㄎ、hㄏ、jㄐ、qㄑ、x ㄒ,其键盘英文字母键名代码分别为b、p、m、f、d、t、n、l、g、k、h、j、q、x;声母拼音字母和其对应的注音字母zhㄓ、c hㄔ、shㄕ、rㄖ、zㄗ、cㄘ、sㄙ,其键盘英文字母键名代码分别为z、c、s、r、z、c、s;韵母拼音字母和其对应的注音字母aㄚ、oㄛ、eㄜ,其键盘英文字母键名代码分别为a、o、e;韵母拼音字母和其对应的注音字母aiㄞ、eiㄟ、aoㄠ、ouㄡ、anㄢ、en ㄣ、angㄤ、engㄥ、erㄦ,其键盘英文字母键名代码分别为a、e、a、o、a、e、a、e、e;韵母拼音字母和其对应的注音字母i丨、uㄨ、üㄩ、ieㄝ,其键盘英文字母键名代码分别为y、w、y、y;
汉字只有一个拼音、注音字母或其他标音符号标音,该汉字的读音音节首字母即是该字母或该符号。
日韩朝三国和台港澳地区所使用的汉字,依其读音音节的首字母或符号与键盘键名对应转换为键名代码的规则,采用汉字的汉语中华码编码方案和规则,则可相应产生日文当用汉字的日语中华码、韩朝文常用汉字韩朝语的中华码和台港澳繁体汉字注音字母汉语中华码的编码方案和规则。
2、根据权利要求1所述的中华码,其特征在于构成汉字的汉字成字部首都是中华码成字部首,中华码成字部首名称为该成字部首的汉字;
3、根据权利要求1、2所述的中华码,其特征在于中华码成字部首构成汉字的形码(第1码、第2码或第3码),为该中华码成字部首名称读音音节首字母的键盘键名代码;
4、根据权利要求1所述的中华码,其特征在于中华码非成字部首构成汉字中华码的形码(第1码、第2码或第3码),为该中华码非成字部首名称(按照中华码的中日韩朝语中汉字非成字部首名称称谓的命名规则定义)读音音节首字母的键盘键名代码。
5、根据权利要求1、2、3、4所述的中华码,其特征在于由中华码部首(成字、非成字)构成汉字,其中华码部首拆分规则按照汉字书写规范笔顺的空间先后顺序,按照拆取以成字部首优先、取大部首(相对笔画较多的中华码成字、非成字部首)优先的规则组成中华码的形码第1码、第2码后,再取该汉字的收笔笔画中的中华码大部首组成中华码的形码第3码。
6、根据权利要求1、2、3、4、5所述的中华码,其特征在于“汉字字形模糊”(操作者不会书写或不能按照规范笔画顺序书写)的汉字,其中华码的形码可用“字形模糊码键名”代替编码。
7、根据权利要求1、2、3、4、5所述的中华码,其特征在于汉字构件(不构成汉字而又需要在文本中输出的部首)或冷僻汉字(操作者不能正确读音),其中华码的音码可用“字音模糊码键名”代替编码。
8、根据权利要求1、2、3、4、5所述的中华码,其特征在于分别取组成词(二字词和三字词)的汉字中华码的音码,二字词加上首末汉字中华码的形码第1码、三字词只加上该词末字的中华码的形码第1码为该词中华码编码的计算机键盘代码。
9、根据权利要求1、2、3、4、5、6所述的中华码,其特征在于分别取组成词(四字词和四字以上词)的前三个汉字和该词最未一个汉字中华码的音码为该词中华码编码的计算机键盘代码。
10、根据权利要求1、2、3、4、5、6、7、8、9所述的中华码,其特征在于使用汉字的国家、地区(日本、韩国、朝鲜、新加坡等,台湾、香港、澳门等),应用拼音字母、注音字母或其他标音符号替代汉字的汉语拼音或注音字母而用于标注简体或繁体汉字的读音,对计算机键盘或文字处理机键盘的键名(包括英文字母、数字和符号键名等)重新定义转换为本国、本地区所使用的拼音字母、注音字母或其他标音符号,而采用中华码的编码方案和规则。
全文摘要
汉字“中华之声”码计算机键盘输入法,本发明属于汉字文化圈中的国家、地区所使用的简体和繁体汉字、汉字词的编码及其计算机键盘和文字处理机键盘的输入方法领域。以汉字读音和构成该汉字部首读音信息进行编码。编码规则遵循汉字读音规范、汉字书写笔顺规范和汉字部首名称的通常习惯称谓命名方法。操作者只需掌握汉字的读音方法、中华码部首名称定义方法和汉字拼音字母、注音字母及其他汉字标音符号与计算机和文字处理机的键盘键名对应转换定义方法,即可在键盘上进行无记忆量的汉字和汉语词汇的编码输入。该方法是汉字文化圈中的一种易学习、输入快和符合汉字语言规范性的计算机、文字处理机的键盘汉字、汉字词编码输入方法。
文档编号G06F3/023GK1153339SQ95121830
公开日1997年7月2日 申请日期1995年12月30日 优先权日1995年12月30日
发明者孟来来, 孟菀桐 申请人:孟菀桐
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1