直观码汉字输入方法及键盘的制作方法

文档序号:6411896阅读:797来源:国知局
专利名称:直观码汉字输入方法及键盘的制作方法
技术领域
本发明涉及一种汉字编码方法及其键盘,特别是一种直观码汉字输入方法及其键盘。
随着信息时代的到来,计算机技术在我国日益普及和推广,中文信息处理现代化的进程不断加快,对汉字信息处理技术提出的要求越来越高。
几十年来,为了解决汉字输入计算机难的问题,海内外炎黄子孙进行了坚持不懈的努力,创造出近千种汉字输入方法,在实现四个现代化的进程中,谱写了具有划时代意义的篇章。
已取得的成果,使我们欢欣鼓舞。同时,我们也看到,汉字输入难的问题尚未得到根本上地解决易学的输入方法输入速度慢,输入速度快的又不好学,形成汉字输入的“瓶颈”问题。拼音码简单,或者不用重学(如“全拼”),或者学习难度不大(如“双拼”),但重码率太高;现行拼形码重码率低(如“王码”、“郑码”),可以实现“盲打”,但拆分规则繁杂,记忆量大,难学易忘。
今天我们提供的“直观码汉字输入法”,是在对几千个汉字从形、音、义几个角度进行全方位的分析、对比、归纳、整理的基础上,对十多种典型汉字编码方法分析研究,取长补短,设计出的新型汉字输入方案。方案的核心在于用直观象形的方法描述汉字结构。
现行以形为主的汉字编码方法,或者采用形音形转换确定键位法,或者采用划区定位确定键位法。形音形转换确定键位法,如“大众音形码”,将汉字的构件(形)先转换成音,再根据音确定输入键位。例如,“楼”字由“木”、“米”、“女”三个构件组成。它们的汉字拼音分别是MU、MI、NU。据此依次取每个构件的声母MMN作“楼”字的编码。这种方法的缺点是一、很多构件并不独立成字,所以只能靠人为定音,增加记忆量;二、录入时,大脑不断进行形音形转换判断,容易造成疲劳。
划区定位法,如“五笔字形”,将汉字的构件,根据起笔确定该构件所属区,再根据其它特征确定区中的位,区位结合判断对应键位。这种方法规律性强,经过长时间学习和训练,能够熟练掌握。但其最大缺点是,学习难度大。主要表现在初始入门记忆量大,且区位判断容易造成大脑疲劳,所以正常使用范围一般不超出专业录入人员。而一般人员往往是望而却步。“郑码”也属于划区定位形码,同时使用主辅双码制,体系严密。但同样难记易忘,而且判断难度还大于“五笔字型”。
本发明的目的是要提供一种比学拼音还容易得多,只要会写汉字就能输入汉字,命中率高,记忆量小的直观码汉字输入方法及键盘,使汉字输入成为人人都会的大众化常识,从而基本解决汉字输入的“瓶颈”问题。
本发明的目的是这样实现的该直观码汉字输入方法是采用直观形托辅以字型码几何描述的形式,用拉丁字母(A-Z)对汉字进行编码,实现用计算机键盘输入汉字及词组。直观码汉字输入方法根据汉字基本构件的形状与键盘字母形状相同或相似的关系直接确定键位,不需要任何形音形转换或划区定位的过程。取码顺序,除极个别情况,符合汉字传统书写笔顺。如日--B、卯--GP、丁--J、吆--OW、艺--HZ。直观码自始至终遵循了用同形或近形字母键描述汉字构件的原则,同时尽量保持了高频构件及一些难拆构件的完整性,避免了对汉字独立部分的过细拆分。尤其对常用传统汉字部首,一律用单码或双码表示。
直观码用固定的四个字形码对汉字构件间的位置关系进行粗略的描述,使一维编码的实际效果相当于二维编码,同时保证了字形码与同形件码重合的几率极小。
汉字编码方法具体说明如下
直观码码长为4。
(一)、基础构件
直观码选如下二十六个组字构件为基础构件。它们的共同特点是,同对应键盘字母的象形程度极高小 日 匚 目 彐
艹 丨 丁 丬  爪ABC D E F G HI J K L M冂 口 卩 又 尺 丂  凵 人 幺 乂 丫 乙NOP Q R S T UV W X Y Z示例
唱--OBB 卯--GP 盯--DJ 双--QQ
内--NV 从--VV 旧--IB 冈--NX
(二)、同键构件
直观码在确定二十六个基础构件的基础上,通过形状上的近似关系,将其余组字构件分成26类,分别与26个基础构件一起归为26个同键构件组(详见图一)A 小 忄  水
G

立B 日 曰 白 H 廾 艹 廿
丌C 匚 刀 力 冖 宀 I 丨 氵D 目 自 罒 田 由 J 丁 厂  丿E 彐 王 三 丰 也 K 丬 扌 大  兀 F
工  土 千L  乚  讠 M爪 爫 巾
竹T  十
N(n) 冂 门 几
U 凵 一 亠O口 囗 V 人 八  亻 冫P 卩 阝 尸 户
W
纟幺Q又 厶 文 女 夕X乂

R尺 艮 足 虫 贝Y 丫 入 儿 彳S丂
己 巳Z 乙 廴 辶乛
示例学 冖 子----A C Z 农冖
----C G范艹 氵
----H I P 新立 木 斤 ---G T G站立  口----G L O 基艹 三 八 土----H E V F用冂  ----N F国口 王 丶 ----O E L简 门 日--M N B册
一 ----N N U
(三)、字型码
直观码将汉字构件间位置关系确定为四种上下关系、左右关系、包围关系及交叉关系。构件之间可以是分离的,亦可以是连接的。包围关系可以是全包围,亦可以是半包围。交叉关系可以是直接交叉,亦可以是嵌套交叉。直观码分别用I、W、Y表示上下、左右及包围或交叉关系。字型码加在二件字和三件字后,满件字不加字型码。
另外,直观码将左右型三件字中■〓型字(左边一件,右边上下两件),如″按″、″彷″,定义为标准三件字,并用字型码H表示。示例
朵上下分离关系 几木----N T I
不上下连接关系 一
----U A I
组左右分离关系 纟且----W D W
生左右连接关系 丿----J E W
囚全包围分离关系 囗人----O V Y
勿半包围连接关系 勹
----C J Y
农直接交叉关系 冖
----C G Y
郑非标准三件左右关系 大阝 ----K K P W
聊非标准三件左右关系 耳
卩 ----G G P W
茄三件上下关系 艹力口 ----H C O I
喜三件上下关系 士
口 ----F R O I
搂标准三件左右关系 扌米女 ----K M Q H
杯标准三件左右关系 木一
----T U A H园三件包围关系囗二儿----O U Y Y迢三件包围关系辶刀口----Z C O Y巫三件嵌套关系工人人----F V V Y垂三件交叉关系千艹二----F H F Y
需要注意的是,直观码将包围或嵌套件与习惯笔顺无关地作为该字的首件处理,达到了包围或嵌套型字取码顺序统一。例如囤 OUMY 延 ZJHY 建 ZEFY
(四)、补足码
直观码为了使码长一致,设定了补足码(G)。补足码只出现在两件字编码中,用在第四位,即在字型码后。例如
如QOWG 鸡QSWG
(五)、独立构件字
直观码将独立构件成字分为两类对形状与键盘字母形状近似程度较高的25个字,用″件码+YYY″的模式编码。它们是小日刀目王工斤廿厂AYYY BYYY CYYY DYYY EYYY FYYY GYYY HYYY JYYY大言爪几口尸又尺己KYYY LYYY MYYY NYYY OYYY PYYY QYYY RYYY SYYY十一人幺七丫 乙TYYY UYYY VYYY WYYY XYYY YYYY ZYYY其余统一用″构件整码+Y+细分首码+细分尾码″的模式编码。如力 CYZJ牙 GYGJ女QYXU子 ZYZU
(六)、词组编码
为了提高输入效率,直观码采用了词组缩合编码方式,码长同单字码长,为四码。词组编码模式如下
二字词依次取首次两字的首次码。如
建设ZE(FY)+LN(QH)-->ZELN
祖国UD(WH)+OE(LY)-->UDOE
三字词依次取首次二字的首码和末字的首次码。如
计算机L(TWG)+M(DHI)+TN(WG)-->LMTN
电视台B(LYG)+U(RWG)+QO(IG)-->NUQO
多字词四字及四字以上的词为多字词。编码依次取首次三末字的首码。如
精益求精M(ENH)+K(VDI)+U(ALY)+M(ENH)---->MKUM
国民经济O(ELY)+P(XYH)+W(QFH)+I(QJH)---->OPWI
中国共产党O(IYG)+O(ELY)+H(VIG)+A(COY)---->OOHA
(七)、简码字
一级简码字
直观码对使用频率最高的26个单字词,设置了一级简码输入法。它们的对应码,有的是取了全码的首码,有的需联想记忆。
取了部首码的
是、地、大、说、一、人、在、这、也、到;
B F K L U V X Z E Q
根据汉字局部形状联想确定的
个、能、要、把、的、上、我、了、还、有、
A C D S G H I J M N
和、都、就、不、来、着。
O P R T W Y
二、三级简码字
直观码并未特设二、三级简码字。但因为直观码中所有汉字出现在提示行中的顺序由如下三个因素共同决定①、汉字用作单字词的频度;②、汉字用作单字词和词组成素的总频度;③、汉字在直观码方案中的编码顺序。所以击两键后出现在提示行第一位的就相当于二级简码字,击三键后出现在提示行第一位的就相当于三级简码字。
(八)、两件字细分
为了提高编码命中率,直观码对几百个两件字设置了第二种细分编码方案。其原则是
1、对典型汉字部首件不再细分。它们是
忄 日 冖 宀 目
钅 艹 氵 厂 广 扌
讠  月 口 阝 女  虫 石 木 礻 衤 亻
纟 犭 火 辶 廴
2、对一些构件按标定规则细分,将两件字改为三件字或四件字(上面指出的作典型部首的情况除外)。例如
白丿日亡丶匚且
一 壬丿士 土十一
J B L C N U J F T U

丿
八 良丶艮 寸
丶 子了一
G J J VL R T L Z U需要注意的是,词组中构件不再细分。细分规则详见图2A、B。
(九)、非字字符编码
国标二级汉字中的36个非字字符编码如下
1、单码字符II+字根码+G
如忄--IIAG 刂--IIJG 纟--IIWG
2、双码字符II+首码+尾码
如饣--IICL 肀--IIEI
--IIUI
(十)、非基本构件拆分
非基本构件的拆分请参见图4A、B。
(十一)、常用符号输入方法
为了方便用户,直观码提供在半角状态下直接输入常用符号的编码方式
最常用汉语书写符号用“联想记忆码+W”的模式确定,如
。----OW ,-----QW其它符号(包括几种常用文字)可用相应特定符号区的对应码输入。
本发明与现有汉字输入技术相比,具有以下明显优(特)点
1、采用直观形托的方法,根据汉字基本构件的形状与键盘字母形状相同或相似关系直接确定键位,不需要任何形音形转换或划区定位的过程。初学者,经过几个小时的学习,就可以不看说明书输入汉字;
2、安排在相同键位上的汉字构件之间形状上的共同点十分明显,便于联想,易记不忘;
3、尽量不破坏高频构件的完整性,降低难拆构件造成的取码难度;
4、遵循以传统汉字部首为中心的原则,常用汉字部首一律用单码或双码标定;
5、根据构件之间的相对位置,确定汉字的字型,并用固定的四个字型码表示,同时设置了一个补足码。字型码和补足码同件码重合的几率极小;
6、采取了汉字的词频字频与码序共同决定汉字显示顺序的模糊查找方式,方便了用户;
7、对几百个字设置了粗分与细分两种方案,以适合用户的不同熟练程度;
8、本发明提供的汉字输入方法,不仅简单易学,同时达到很高的命中率全形方案中国标一级汉字重码率为2.6%,而总动态重码率为万分之四。所以,在记住一、二级(等)简码字以后,用户能够达到很高的录入速度;
9、常用符号划区明确,输入方法简单,便于使用。


图1 为本发明直观码键位(基本)分布2 A、B为本发明直观码字根编码3 为本发明直观码部首编码4 A、B为本发明直观码非基本件编码图
权利要求
1、一种计算机汉字输入方法,特别是一种直观码汉字输入方法,其特征在于,①通过组成汉字的基本构件形状与键盘字母形状相同或相似关系直接确定键位,不需要进行形音形转换或划区定位;②根据构件之间的相对位置,确定汉字的上下、左右、包围(含交叉)、标准三件字型,分别用固定的四个字型码I、W、Y、H表示,采用直观形托辅以字型码几何描述的方法,用键盘字母(A--Z)对汉语字、词进行编码,实现用直观码键盘输入汉字。
2、根据权利要求1所述的汉字输入方法,其特征在于,直观码选如下二十六个与键盘字母的象形程度极高的组字构件为基础构件。小 日 匚 目 彐
艹 丨 丁 丬  爪AB C D E F G H I J K L M冂 口 卩 又 尺 丂  凵 人 幺 乂 丫 乙NO P Q R S T U V W X Y Z
3、根据权利要求1所述的汉字输入方法,其特征在于,直观码在确定二十六个基础构件的基础上,通过形状上的近似关系,将其余组字构件分别与26个基础构件一起归为如下26个同键构件组。A 小 忄 水

彡B 日 曰 白
C 匚 刀 力 冖 宀

勹 匈 九D 目 自 罒 田 由 且


回血
曲E 彐 王 三 丰

壬 手 毛 也 世F
干  工 二
土 士
千 乇 禾G
斤 立
毋 母 牙 耳 身 车

辛 钅金H 廾 艹
廿 丌 卅
止I 丨 氵J 丁
厂 广 疒

丿リ

K 丬 扌 爿 片

尢 兀 
L  匕 七  丶
卜  讠言 M 爪 瓜 爫 巾 山


心 灬  竹N 冂 门
几 月
舟O 口 囗 凸 凹P 卩

尸 户Q 又

文 攵
女 夕
父R 尺 艮 良
豆 虫
 足 贝 见 页S 丂

马 乌 鸟 己 已 巳 巴 弓
石T 丅 十
寸 木U 凵
一 亠 二 衣 示 衤礻V 人 八  丷 亻
W
纟 幺X 乂 犭

戈 戋 戊
Y 丫 入 儿 火 彳Z 乙
之 廴 辶 乛 疋
了 子

4、根据权利要求1所述的汉字输入方法,其特征在于,直观码将汉字构件间位置关系确定为四种上下关系、左右关系、包围关系及交叉关系,分别用I、W、Y表示上下.左右及包围或交叉关系。
5、根据权利要求1所述的汉字输入方法,其特征在于,直观码将左右型三件字中■〓型字(左边一件,右边上下两件),定义为标准三件字,用字型码H表示。
6、一种计算机汉字输入键盘---直观码键盘,其特征是,安排在每个键位上的代表构件形状同键盘字母形状近似程度极高,而且同键构件之间形状上的近似特点亦十分明显,输入键盘(基本)如下
全文摘要
本发明提供一种计算机汉字输入方法。该方法采用直观形托辅以字型码几何描述的形式,用拉丁字母(A-Z)对汉字进行编码。该方法通过组成汉字的基本构件形状与键盘字母(大写)形状相同或相似的关系直接确定键位,不需要任何形音形转换或划区定位的过程。该方法用几个固定的字型码对汉字构件间的位置关系进行描述,使一维编码的效果相当于二维编码,同时避免了二维交叉判断思维。该汉字输入法在易学性方面明显优越于现有输入技术,具有简单易学、一记不忘、重码率低、输入速度快等特点,具有良好的应用前景。
文档编号G06F3/023GK1194395SQ9710472
公开日1998年9月30日 申请日期1997年3月20日 优先权日1997年3月20日
发明者金浩链, 刘宝祥 申请人:四平师范学院科技开发中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1