123汉字编码法及其键盘的制作方法

文档序号:6406774阅读:508来源:国知局
专利名称:123汉字编码法及其键盘的制作方法
技术领域
本发明涉及一种实用的汉字编码方法及其键盘。
现有的汉字编码方法,从编码对象来分,有音码、形码和音形组合码三大类。音码的典型代表是简拼法与马庆勇先生的“一种汉字声、韵双拼编码的方法”(CN1049921A,以下简称马码),形码的典型代表是四角号码与王永民先生的五笔字型(以下简称王码);音形组合码的典型代表是杜冰蟾小姐的“汉字全息码”(CN1043016A,以下简称杜码),与肖水清先生的“无理序号数字编码法及其键盘”。(CN1050273A,以下简称肖码)。上述各种编码方法都各具特色,但也各有缺陷。简拼法与马码具有重码率高,不完全掌握汉语拼音者不易使用等缺点;四角号码的主要缺点在于码长较大、重码率较高;“王码”是目前最为著名的一种编码方法,其优点在于重码率极低,平均码长很小,因而便于高速盲打,尤其适合于专职打字人员使用;但其最大的不足在于编码规则很复杂、规则所需的强制记忆量很大,因而难于在一般学生和职员阶层推广。“杜码”和“肖码”保留了“五笔字型”的主要长处,并使其缺点的严重程度有所下降,但总的来说,编码规则较复杂、规则所需强制记忆量较大等问题仍成为“杜码”与“肖码”广泛推广的一大障碍。可见,上述几种较为流行的编码方法,如“王码”、“杜码”、“肖码”等,都具有高效性强、易学性弱之特点。易学性弱的根本原因则在于这些编码方法都没有摆脱把部首作为编码对象的常规思路。
本发明的目的在于提供一种兼顾高效性和易学性的实用汉字编码方法及其专用键盘。本编码方法以字音的声母部分和字形的有序笔画作为编码对象,亦属于音形组合码。
本发明的具体编码方法如下一、编码元素编码原素分为声母码、双笔画码、单笔画码三种,均以英文字母表示。为了便于区别,在下文中,拼音的声母采用小写字母,编码元素采用大写字母。
二、声母码的取码规则考虑到完全掌握汉语拼音并非易事,但大致了解拼音的声母则不难做到。声母码是由字音的声母部分确定的编码元素,具体的取码规则如下1、对于有声母的汉字,若声母只有一个字母,则取该声母为该字的声母码。
例如,“人”的声母码为R,“的”的声母码为D。
事实上,这类声母包括除zh、ch、sh以外的所有声母。
根据汉语拼音方案,i行和
行韵母,前面没有声母时,在声母位置写上y,并对韵母部分作适当处理;u行韵母,前面没有声母时,在声母位置写上w,并对韵母部分作适当处理。对于这些特殊情况,本发明视同有声母情况对待。
例如“衣”的声母码为Y,“王”的声母码为W。
2、对于有声母的汉字,若该声母含有一个以上字母,则取该声母的第一个字母为该字的声母码。
例如,“之”的声母为zh,故其声母码为Z“少”的声母为sh,故其声母码为S事实上,这类声母只涉及zh、ch、sh三个。这一规则从根本上避免了许多人zh与z,sh与s,ch与c混淆不清的难题。
3、对于无声母的汉字,取字母V为该汉字的声母码。
例如,“安”、“儿”、“欧”等都无声母,故它们的声母码都为V。
取字母V为无声母字的声母码的原因有两条首先,V不是拼音字母;其次,英语单词Vacant易使人联想到声母“空缺”。
由上述规则可知,声母码共有21个。
此外,考虑到某些地区的发音习惯,本发明允许把声母码L与R混同使用,请参见容错码部分。
三、笔画码的取码规则1、汉字的基本笔画及其分类规则根据对汉字笔画的常规认识,将汉字的基本笔画分为横、竖、撇、点、折五类,分别以“一”、“丨”、“丿”、“丶”、“乛”表示。须补充说明的笔画分类规则如下A、除了基本类型的点,即从左上至右下的点(丶)以外,还有从右上至左下的点(
),如“火”、“心”、“忄”、“灬”之首笔,及“宀”之第二笔。
B、笔形带钩或带折的笔画,均归入折类如“亅”、“
”、“乚”、“”、“乙”、
等。
C、捺(丿),如“文”、“收”之末笔,均归入点类;
D、挑(
),如部首“
”、“扌”之末笔,一般归入横类,但挑与点相连时,如“冫”、“氵”、“丬”“习”中的挑,应归入点类。
E、撇,当与点(或捺)相连而且基本对称时,归入点类,例如,“小”、“少”、“羊”、“业”、“学”、“共”中的撇,均应归入点类。又如“木”、“禾”、“米”(作部首时,分别为“木”、“禾”、“米”)的例数第二笔撇,也都应归入点类。
2、笔画顺序规则根据一般的汉字书写习惯,规定如下笔画顺序规则。
A、先横后竖例如,十一→十王二→王B、先撇后捺例如,人丿→人木
→木C、从上到下例如,合人→亼→合而一→丆→而D、从左到右例如,作亻→作州
→州E、从外到里例如,月
→月向
→向
4、单笔画码的取码规则规定字母M为单笔画码,(可联想英语单词mono-stroke,意为“单笔画”)。在本发明中,单笔画码仅用于笔画数为一、三、五的字的末笔画的编码。
四、字的编码规则字的编码规则与字的笔画数有关,具体规则如下1、一笔画字编码=声母码+单笔画码例如,一→y+一→YM2、二笔画字编码=声母码+双笔画码例如,十→sh+一丨→SR力→亅+乛丿→LK3、三笔画码编码=声母码+首双笔画码+末单笔画码例如,小→x+乛丶+丶→XLM才→ch+一乛+丿→CQM4、四笔画字编码=声母码+首双笔画码+末双笔画码例如,王→w+一一+丨一→WTG
艺→y+一丨+丨乛→YRA5、五笔画字编码=声母码+首双笔画码+次双笔画码+末单笔画码例如,示→sh+一一+乛丶+丶→STLM付-f+丿丨+一乛+丶→FVQM6、六及六以上笔画字编码=声母码+首双笔画码+次双笔画码+末双笔画码例如,吉→j+一丨+一丨+乛一→JRRH项→x+一丨+一一+丿丶→XRTX治→zh+丶丶+丶乛+乛一→ZOPH群→q+乛一+一丿+一丨→QHER五、词组的编码规则词组的编码规则与词组的字数有关,具体规则如下1、二字词编码=第一字的声母码+第二字的声母码+第一字的首双笔画码+第二字的首双笔画码例外情况是,当词组中的某个字仅有一笔画时,取其单笔画码代替上式中该字的“首双笔画码”。
例如,一起→y+q+一+一丨→YQMR人民→r+m+丿丶+乛一→RMXH2、三字词编码=第一字的声母码+第二字的声母码+第三字的声母码+第一字的首双笔画码。
例外情况里,当词组的第一字仅有一笔画时,取其单笔画码代替上式中的“第一字的首双笔画码”。
例如,科学家→k+x+j+丿一→KXJB新产品→x+ch+p+丶一→XCPY3、四及四以上字的词编码=第一字的声母码+第二字的声母码+第三字的声母码+最末字的声母码例如,实事求是→sh+sh+q+sh→SSQS中国科学院→zh+g+k+y→ZGKY有志者事竟成→y+zh+zh+ch→YZZC六、简码的确定方法对于使用频率高的字,本发明专门设置了简码,以降低字的平均码长,提高使用效率。简码的确定方法如下为了便于分析,设α、β、μ、δ都代表本发明任一编码元素。
1、首缀码的定义(1)若αβμδ为某字的编码,则定义αβμδ、αβμ、αβ、α都为该编码的前缀码;
(2)若αβμ为某字的编码,则定义αβμ、αβ、α都为该编码的前缀码;
(3)若αβ为某字的编码,则定义αβ、α都为该编码的前缀码;
(4)若α为某字的编码,则定义α为该编码的前缀码。
2、简码的确定规则对于所有编码中含有同一前缀码的字,若该前缀码未成为某字的编码,则确定该前缀码为其中使用频率最高的字的简码。具体规则如下(1)对于所有编码中含有前缀码αβμ的字,若αβμ未成为某字编码,则确定αβμ为其中使用频率最高的字的简码,并称这种简码为三级简码。
例如,在所有编码中含有SOU的字中,“沙”(编码为SOUI)的使用效率最高,(其它的字如“湿”-编码为SOUY,“汕”-编码为SOUJ),且SOU未成为某字的编码,故确定SOU为“沙”的三级简码。
(2)对于所有编码中含有前缀码αβ的字,若αβ未成某字的编码,则确定αβ为其中使用频率最高的字的简码,并称这种简码为二级简码。
例如。在所有编码中含有前缀码JR的字中,“机”(编码为JROZ)的使用频率最高,(其它的字,如“教”-编码为JREX,“警”-编码为JRDH),且JR未成为某字的编码,故确定JR为“机”的二级简码。
(3)对于所有编码中含有前缀码α的字,确定α为其中使用频率最高的字的简码,并称这种简码为一级简码。
例如,在所有编码中含有前缀码D的字中,“的”(编码为DVHL)的使用频率最高,(其它的字,如“大”-编码为DEM,“到”-编码为DQYA),故确定D为“的”的一级简码。
由上述规则可知,具有一级简码的字必有二级、三级简码,具有二级简码的字必有三级简码,反之就不一定成立。
七、容错码的说明本发明考虑到有某些字或词组,其编码不易确定或容易有误,故允许存在少量的容错码,容错码的基本类型有以下两类1、声母容错码考虑到某些地区的发音习惯,本发明允许,而且仅允许两个声母码混同使用,它们是L与R。显然,声母容错码的位置在编码的第一位。
例如“人”的编码为RX,其容错码为LX“来”的编码为LWYO,其容错码为RWYO“人民”的编码为RMXH,其容错码为LMXH2、笔画容错码考虑到某些字的笔画顺序难以确定,如“义”字,《辞海》确认其首笔为撇,而《汉字正字字典》确认其首笔为点。本发明根据一般书写习惯的笔顺来确定编码的笔画码部分,但也按某种易错的笔顺来确定容错码的笔画码部分,即笔画容错码。显然,笔画容错码的位置在编码的第二至第四位。
例如义→y+丶丿+丶→YIM(编码)→y+丿丶+丶→YXM(容错码)
王→w+一一+丨一→WTG(编码)→w+一丨+一一→WRT(容错码)义务编码为YWIZ,容错码为YWXZ。
上述两类容错码组合在一起,便构成综合容错码,其数量极少。如,“轮”编码为LQRK,容错码为RQGK。可见综合容错码的容错位至少有两位,其中一位为编码的第一位,另外的容错位在编码的第二至四位。
八、重码的说明所谓重码,是指这样一种编码,它所代表的字或词组的数量超过一个。本发明允许存在极少量的重码。
例如编码YM所代表的字包括“一”和“乙”等。
编码SATT所代表的字包括“暑”、“曙”等。
本发明严格限制重码率,重码率在3%以内。
为了将本发明的汉字编码方法应用于键盘输入,本发明还设计了专用键盘,其特点是将二十五种双笔画码和一种单笔画码有规律地分配在通用的英文键盘的英文字母部分,并增设了四个专用功能键。具体键盘设计请参见说明书附图
。说明书附图仅给出通用英文键盘的一部分,在这一部分,本发明作了专门设计,共包括三十个键(即二十六个编码元素键和四个功能键)。
四个功能键为辅助键、标点键、英汉键、汉英键,分别介绍如下1、辅助键全称为辅助编码键,以“?”表示,当某个编码中的某一位难以确定或不愿确定时,可用辅助键代替,并通过屏幕菜单进行选择。若编码的连续若干位难于确定或不愿确定时,则用同样数量的辅助键代替。
例如编码WXYZ,可通过输入WXY?、W?YZ、?XYZ、??YZ、W???等来选择。
辅助键的设置至少可以解决以下两个问题(1)不会读的字的编码声母码用辅助键代替。例如“靓”不会念,可输入?TGZ。
(2)笔顺难于确定的字的编码在笔画码部分的某位或某几位用辅助键代替。如,“义”笔顺搞不清,可输入Y?M。
2、标点键全称为标点符号键,以“”表示。考虑到一般英文键盘上的标点符号种类不多,不能完全满足汉语文章对标点符号的需要,故本发明设置专用的标点键。只要按下标点键,即可得到全部汉语标点符号的屏幕菜单。
3、英汉键全称为英汉状态切换键,以“>”表示。其功能为实现从键盘输入的英文状态向本编码状态的切换。
4、汉英键全称为汉英状态切换键,以“<”表示,其功能为实现从键盘输入的本编码状态向英文状态的切换。
还应指出,键盘输入的初始状态为英文状态,此后通过英汉键和汉英键进行状态的双向切换,而且在每种状态下,数字键和其它未标有特殊符号的键都可照常使用。
下面简要地谈谈本发明的名称问题,通过上述描述可以知道一个典型的汉字(指六及六以上笔画的字),其编码为一个声母码+双笔画码×3,其抽象表达式为1+2×3,用最简捷的形式可缩写为“123”。故本发明称作“123汉字编码法及其键盘”,其中的“123”既反映本编码方法的实质性内容,又容易记忆、给人亲切感。本编码方法可以简称为“123码”。
本发明所提供的汉字编码方法在应用上具有以下特点编码规则简捷明了,强制记忆量极少,重码率低于3%,实际使用时平均码长少于2.5个。与其它各种编码方法相比,本发明更好地考虑了上述指标的综合平衡,即更好地兼顾了编码方法的高效性与易学性,因而本发明既适合于专职使用,又易于推广普及。
本发明的应用领域至少包括两个方面信息处理机器(如电子计算机、文字处理机等)的汉字输入,汉语字典及其它字典的汉字查字等。有理由相信,本发明将具有广阔的应用前景。
权利要求
1.一种汉字编码方法,以汉字的音和形的特性对字和词组进行编码,其特征在于(1)编码元素分为声母码、双笔画码和单笔画码三类,均以英文字母表示。(2)声母码的取码规则如下A、对于有声母的字(包括声母位置为y和w的字),若该声母(或声母位置)只含有一个字母,则取该声母为该字的声母码;B、对于有声母的字,若该声母含有一个以上字母,则取该声母的第一个字母为该字的声母码;C、对于无声母的字,规定字母V为该字的声母码。共有声母码21个。(3)笔画码的取码规则如下A、双笔画码由汉字的五种基本笔画-横、竖、撇、点、折两两组合,形成25种双笔画码,具体取码规则如下表
B、单笔画码的取码规则如下规定字母M为单笔画码。(4)字的编码规则如下A、一笔画字声母码+单笔画码B、二笔画字声母码+双笔画码C、三笔画字声母码+首双笔画码+末单笔画码D、四笔画字声母码+首双笔画码+末双笔画码E、五笔画字声母码+首双笔画码+次双笔画码+末单笔画码F、六及六以上笔画字声母码+首双笔画码+次双笔画码+末双笔画码(5)词组的编码规则如下A、二字词第一字的声母码+第二字的声母码+第一字的首双笔画码+第二字的首双笔画码二字词编码时,若某个字为一笔画字,则以单笔画码代替上式中的该字的“首双笔画码”。B、三字词第一字的声母码+第二字的声母码+第三字的声母码+第一字的首双笔画码三字词编码时,若第一字为一笔画字,则以单笔画码代替上式中的“第一字的首双笔画码”。C、四及四以上字的词第一字的声母码+第二字的声母码+第三字的声母码+最末字的声母码。
2.如权利要求1所述的编码方法,其特征在于字的简码的确定规则如下对于所有编码中含有同一前缀码的字,若该前缀码未成为某字的编码,则确定该前缀码为其中使用频率最高的字的简码。
3.如权利要求1所述的编码方法,其特征在于存在如下容错码(1)声母容错码允许声母码L与R混同使用。(2)笔画容错码对于少量笔画顺序较准确定的字,允许按不同于正确笔顺的某种笔顺进行编码。
4.一种适用于权利要求1所述的汉字编码方法的专用键盘,其特征在于将二十五种双笔画码和一种单笔画码有规律地分配在通用英文键盘的英文字母部分,并增设四个专用功能键。
5.如权利要求4所述的键盘,其特征在于所述的四个专用功能键分别为(1)辅助键当某个字或词组的编码的某一位难以确定或不愿确定时,可用辅助键代替。(2)标点键标点键被使用后,将出现所有汉语标点符号的选择菜单。(3)英汉键其功能为实现从键盘输入的英文状态向本编码状态的切换。(4)汉英键其功能为实现从键盘输入的本编码状态向英文状态的切换。
全文摘要
本发明涉及一种实用的汉字编码方法及其键盘。本发明以三类编码元素——声母码、双笔画码和单笔画码对字和词组进行编码,并设计了专用键盘。本发明具有规则简捷明了、强制记忆量少、平均码长较小、重码率较低等优点,因而既适合于专职使用,又易于推广普及。
文档编号G06F3/023GK1078316SQ92114330
公开日1993年11月10日 申请日期1992年12月3日 优先权日1992年12月3日
发明者费革胜 申请人:费革胜
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1