26键输入法的制作方法

文档序号:6562920阅读:745来源:国知局
专利名称:26键输入法的制作方法
技术领域
本发明属于电脑汉字编码输入方法,也就是中文输入法。它利用 了 26个字母键输入汉字,因此称为26键输入法。
背景技术
键盘输入是目前汉字输入法中使用最广泛的输入法。可分为音 码、形码、音形码和序号码四类输入汉字。序号码难以记忆,已几乎 无人使用。利用音码输入汉字,因为简单易学,使用最为广泛。可输 入速度不快,还有个弱点,那就是不认识的汉字无法输入。为此,本 人发明了三五音码输入法,它蠲于音形码,比音码稍微复杂点,但因 为重码少,输入速度却要迅速得多,足以与任何输入法相比。缺点是 发音不准的汉字不能很快输入。形码虽然复杂难记,却能输入任何不 认识的汉字,而且往往很快。形码往往将汉字部件按象形、拼音和笔 画等方式归类编码,由于笔画是有史以来最伟大的发明之一,罔此按 第画归类的输入法要胜过按拼音和象形归类的输入法,往往较为流 行。五笔字型是其典型代表,其佈点是重码少,输入速度饩。佴该输 入法仅仅利用25个字母键输入輝宇,还无视各汉字部件的組宁频率 高低不一,硬将汉字部件按起笔分为五区五位,给组字频率捐当低的 折开头的汉字部件也分了五个位、而组字频率相当高的起笔为横、竖、 点的汉字部件也只分得了五位,此举浪费了个把键位,又造成了一定 的重码。为l^^^重码,五笔字型不得不将起笔为横的汉字部件中的净 并入到撇区中,将起笔为点的十和'£#入到折区中。这完全是不能接 受的,因为t 、十和心的实际组字频率已远远高于排在同一律上的其 它部件的组字频率之和,使得排净、+和心的键实际上应算作横区和 点区,可五笔字型硬把它归入到撇区和折区。"车、九、几"等汉字
部件的归类也不符合按区划分的规律。五笔字型将每区又按第二笔分 为横、竖、撇、捺、折五位更是有点牵强,以竖区为例,第二笔通常 是折,按理应集中安排在竖折这个区位键上,这会带来严重的重码,
因此不得不分散排列在各个键上。25个键名部件中竟有10来个部件 不符合所谓的区位排列规律,这样的规律实际上已不能算规律。还有, 86版五笔字型只用了25个键,白白浪费一个字母键,若能充分利用 26个键的话,则一、二、三级简码会更多,输入速度也会有所提高, 也就是说应该还有比五笔字型更快的汉字输入法。另外86版五笔字 型还存在着若干汉字部件不符合语言文字规范、数量过多、拆分不便 等问题。98版五笔字型虽然拆分时方便些,但汉字部件更多,技术 上实为倒退。郑码对此有所改进,充分利用了26键,部件符合规范, 按起笔分区时考虑了汉字的组字频率,较为合理,可也存在着横区多 了点、竖区少了点的缺点,更糟糕的是它将汉字分为主根、副根,除 了第一主根外,其他第二主根、包根、杂根等汉字部件均用两个字母 作为代号编码,尽管这有利于降低重码,可取码规则相当繁杂,另外 选取的汉字部件也较多,难学难记,拆分也较困难。为减少汉字部件, 目前不少输入法都通过五种基本笔画两两组合的办法,进行编码。这 种方法实际上是受五笔字型的影响,同样没有充分考虑到汉字笔画特 别是双笔画的组字频率相差悬殊的情况,排列到键盘上后同样表面显 得整齐划一,实际上各字母键冷热不均,容易产生重码,另外还存在 着不够直观,影响打字速度等问题。

发明内容
这样,目前形码输入法要么汉字部件过多或不规范、分区不合理, 要么拆分困难,不够直观、影响思维,要么没能充分利用26个键, 都没能做到较为方便快速地输入汉字。
本发明的目的是提供一种汉字部件比较规范、分区合理,拆分
简便直观的,输入汉字快速的计算机汉字输入法即26键输入法。
为达到26键输入法的目的,本发明在将汉字各种笔画按国家语 委的规定归类横、竖、撇、点、折后,又从《信息处理用GB13000.1 字符集汉字部件规范》精选了 100来个组字频率高的汉字部件,这些 精选的汉字部件还可包含若干个组字频率并不高,但属于同类的汉字 部件,通称为基本部件。将它们按起笔归类到横、竖、撇、点、折五 个区中。再根据每个区中基本部件的组字频率的高低来决定每个区包 含的键位多少,经科学测算,起笔为横、点、竖的基本部件组字频率 较高、数量也较多,各得六个键位,起笔为撇的汉字频率次之,分得 五个键位,折起笔的基本部件频率最低,仅安排三个键位。各个基本 部件在字母键上的分布见附图1,该图在标准键盘上以二列为一区, 将点区、横区、竖区、撇区、折区从左到右以两列为界依次排列,极 具规律性,是本人十余年潜心研究的结果,是本发明的最大创造性所 在。根据以两列为界的将基本部件按起笔分区排列的方法,点区占两 列字母键,得六个字母键;横区占两列字母键,得六个字母键,竖区 占两列字母键,得六个字母键,撇区虽占五个字母键,却也只得两列, 折区仅占三个字母键,却也得两列,从而达到了点、横、竖、撇、折 各区组字频率不同,所占的字母键位数也因而不同,却都占两列的巧 妙目的。这比将汉字部件五区五列排列的输入法来,无疑更有规律, 是一种巨大进步。当然,由于竖区和撇区汉字部件的组字频率相近, 也可规定作竖区占五个字母键位,撇区占六个字母键位。另外还可将 点区、横区、竖区在键盘上的位置互换。这些都是对本发明的变形, 还是以本发明所举的实施例为最佳。另外本发明将点、横、竖、撇、 折五种基本笔画分别排在Q、 E、 T、 U、 O键上,用相应的字母编码,
由于都位于上排,且仅隔一个字母键,也显得极有规律,简单易学。 接着编码,本身就是一个基本部件的汉字的编码规则是成字基
本部件的代码+首笔画代码+次笔画代码+末笔画代码,基本部件不足
三笔,按书写顺序取完所有的笔画的代码为止。
由多个基本部件组成的汉字的编码规则是按书写顺序将该汉字
拆分成基本部件,选取第一、二、三及最末一个基本部件,并用相应 的代码进行编码,不足四个基本部件时,按书写顺序选取所有部件的 代码为止。
单字取码规则都要遵循取大优先原则,即要优先按笔画数多的基 本部件编码,应保证按书写顺序每次拆分出尽可能笔画数尽可能多的 基本部件,不要把笔画多的部件拆分成笔画少的部件。根据这一规则 可引申出一条规则,那就是多笔画部件肯定比单笔画部件即五种基本 笔画优先编码。另外还要兼顾直观,避免把四边封闭的方框形如"口 "、
"西"等基本部件按书写顺序拆开编码,这条规则实际上也是取大优 先原则引申出来的。
在拆分汉字时有个非常让人头疼的情况,那就是遇到几个笔画相 交的基本部件时如何拆分,这时不同的输入法往往有多种拆分方法。 本人经过长达十余年的潜心研究,终于成功解决了这一举世难题。为 方便汉字拆分,特别规定按书写顺序与前二笔及以上的笔画相交的后 写笔画必须单独取出,按单个笔画编码,基本部件例外。例如"虫"、
"甲"、"车"等基本部件在汉字中往往不与其它笔画相交,因此从取 大优先的原则出发,不宜将"主"、"甲"、"车"等基本部件中的竖笔 单独取出编码。
有些汉字,它们包含的基本部件相同,只是基本部件的位置不同, 为区分这些汉字的编码,使其不发生重码,必须增加字型信息,用区
分码加以区分。汉字的字型可分为独体型和合体型二类,合体型约占
汉字的96%,它又可分为左右型、上下型、包围型。在本输入法中, 将独体型和包围型合并为杂合型,在编码中,左右型、上下型和杂合 型这三类字型分别用三个互不相同的标点符号如","、"."、"/"编 码。对于只有两个或三个基本部件组成的汉字,编码时可补上区分码 加以区分。方法是只有二个基本部件的汉字,需在这二个基本部件 的代码后补上其字型编码,再补上其最末个基本笔画的编码。三个基 本部件组成的汉字,仅需在这三个基本部件的代码后补上其字型编 码。本区分码比起五笔字型的识别码是一个巨大的改进,五笔字型将 末笔与字型合并用一个键表示,给记忆带来了严重的不便,影响头脑 反应,让许多人头疼不已。本输入法则将字型与笔画分开表示,并且 只有两个基本部件组成的汉字才需要补上汉字的末笔,三个基本部件 组成的汉字则只需补上字型信息,无需补上末笔画,从而大大方便了 用户操作。当然也可用拼音首字母作区分码,甚至不考虑汉字的字型 信息,不用区分码参与编码,只是那样会增加重码。
利用输入法软件,在键盘上敲击某个汉字相应的编码所在的键就 可输入该汉字。达到四码且无重码的自动上屏,不足四码的必须补上 一个空格键或用数字键选择才能上屏。


图1为26键输入法基本部件键盘排列图
具体实施例方式
下面结合优选的实施例和附图作详细说明。
本发明在编码时对汉字笔画的认识完全科学。笔画是构成楷书汉 字字形的最小连笔单位,是书写汉字时一次连续写成的一个线条。按 国家语委的规定,在只考虑汉字的运笔方向而不计其轻重长短时,即只考虑其笔形时可分为横、竖、撇、点、折五种基本笔画,其中提并 入横,竖钩并入竖,捺并入点,各种折笔都作折,也就是说其他各种 带转折的笔画都作折。国家语委称五种基本笔画为横、竖、撇、点、 折,而本人倾向于称横、竖、撇、捺、折。因为点的笔画是很短的, 不象其它笔画那样具有一定的长度,且有时运笔方向下垂,几乎与撇 相同。当然国家语委规定称点可能是因为点成字,而且组字频率高于 捺。由于是国家语委的规定,只好遵守,其实国家语委还可规定称捺 也允许。汉字部件是由几个笔画组成的具有组配汉字功能的构字单 位,汉字部件有多笔画部件和单笔画部件之分,单笔画部件在本发明 中即五种基本笔画。
接着将汉字分为合体字和独体字二类,合体字是指具有上下、左 右、里外即包围结构的汉字,它的二个部分往往具有明显的界线。独 体字是指不具有上下、左右、里外结构的汉字,它的笔画往往交叉粘 连、浑然一体。
汉字部件的定义与国家语委的规定相同,它是由几个笔画构成的 相对不变的笔画结构,组合后可构成汉字。汉字部件按《信息处理用
GB13000.1字符集汉字部件规范》规定多达六百多个,这是规定交叉 不拆的缘故。其实这样规定是不怎么合理的,本人认为当某个笔画与 前二个及不止二个笔画相交时,这个后写的笔画必须单独拆出。若这 么规定,则大量的所谓汉字部件实际上是由其它几个汉字部件拼凑组 成的,完全可以排除这些所谓的汉字部件。为减少记忆量,从《信息 处理用GB13000.1字符集汉字部件规范》中精选了 100来个组字频率 高的汉字部件,这些精选的汉字部件在本发明中称为基本部件,将它 们按起笔归类到横、竖、撇、点、折五个区。再主要根据每个区中基 本部件的组字频率的高低,适当兼顾基本部件的多寡来决定每个区中包含的键位多少,经科学测算,起笔为横、点、竖的基本部件组字频 率较高、数量也较多,各得六个键位,起笔为撇的汉字频率次之,分 得五个键位,折起笔的基本部件组字频率最低,仅安排三个键位。为 便于记忆和兼顾指法操作,并参照新华字典部首排列规律,将点区、 横区、竖区、撇区、折区以二列为界从左到右依次排列。将点区部件
分别排在标准键盘最左边两列的六个字母键位上,即排在Q、 A、 Z、 W、 S、 X上,将横区部件分别排在标准键盘中点区的右边两列六个 字母键位上,即排在E、 D、 C、 R、 F、 V上,将竖区部件分别排在 标准键盘中横区的右边两列六个字母键位上,即排在T、 G、 B、 Y、
H、 N上,将撇区部件分别排在标准键盘中竖区的右边两列的五个字 母键上,即排在U、 J、 M、 I、 K上,折区部件分别排在标准键盘最 右边的两列的三个字母键上。各个基本部件在字母键上的分布见附图
I。 具体讲,点区中的、、i、言、i 、广、文、方等部件排在Q键 上,用Q作代码立、门、广、v、々、?等部件排在A键上,用A 作代码;?、水、氺等部件排在Z键上,用Z作代码;火和,、、、等部件
排在W上,用W作代码;个、心、小、等部件排在S上,用S作代码; "、^、 1_、 4 、卑等部件排在X上,用X作代码;王、 一、雨、虫
等部件排在E上,用E作代码;土、 二、干、十等部件排在D上,
用D作代码;厂、三、大、车、石、尸、广等部件排在C上,用C 作代码;净、寸、豕等部件排在R上,用R作代码;木、西等部件 排在放F上,用F作代码;工、戈、七、*、升等部件排在V上,用 V作代码;止、/fc、虫、l等部件排在T上,用T作代码;日、甲、 IJ、 W等部件排在G上,用G作代码;田、山、A等部件排在G上,
用G作代码;目、口、小、命等部件排在Y上,用Y作代码;口等
部件排在H上,用H作代码;贝、门、四、 、皿等部件排在N上,
用N作代码禾、竹、胂、夂、久、广、〗等部件排在U上,用U作 代码;4 、人,乂等部件排在J上,用J作代码;八、,、金、多等 部件排在M上,用M作代码;月、儿、川、匕、川.、仅、"等部件排 在I上,用I作代码;勺、々、几、鸟、刍、3 、舟等部件排在K上, 用K作代码;乙、马、耳、尸、巳、了、 1S等部件排在0上,用O 作代码,乙代表所有的折笔画;女、己、刀、又等部件排在L上,用 L作代码;厶、力、U、纟、弓等部件排在L上,用L作代码;为便 于记忆和遵循习惯,个别组字频率不高的部件也被排列到键上,它们 并不一定按起笔归类,而是按同源和近形归类到组字频率高的基本部 件中。如、7含水、氺、小含、"、,含金、止含疋、U含f人卄含升、 心含小、、浙含竹等部件,事实上,这些被包含的部件是可以舍弃的,
可以不排列在键上。为减少重码,便于用区分码区分重码,往往有意 使各个键上的基本部件的末笔画不同或字型不同。另外本人在发明 时,曾考虑将三竖、两撇、两折、三折,以及左框、右框有序地排在 键上,可因这几个部件不常用,为减少记忆量,决定舍去。
汉字的编码是指用一组代码表示一个汉字,本输入法将汉字分为 两类 一类是本身就是基本部件的汉字,另一类是由若干个基本部件 组合而成的汉字。
本身就是基本部件的汉字的输入规则是该基本部件代码+首笔 代码+次笔画代码+末笔画代码,当基本部件不足3笔时,按书写顺序 取完所有的笔画的代码为止。不足四码的还要补上一个空格键。例如 "言"字,言的代码为Q;起笔为点,代码为Q;次笔为横,代码为 E;末笔为横,代码为E,言的编码就为QQEE。又如"二"字,二 的代码为D,首笔和次笔都为横,代码分别为E、 E, 二的编码就为 DEE。由于本输入法是将各基本部件按起笔排列的,所以输入规则中
也可将首笔画代码略去,或将输入规则改为基本部件代码+第二笔画 代码+第三笔画代码+末笔画代码,还可将输入规则改为该基本部件代 码+首笔代码+次笔画代码+第三笔画代码。这些都是对本发明的变 形。
由若干个基本部件组合而成的汉字的输入规则是按正确的书写 顺序将汉字拆分成若千个基本部件,用相应的代码进行编码。拆分时 要把握的原则是按书写顺序,每次都拆分出笔画数尽可能多的基本 部件,并且还要兼顾直观,不要把口等四周封闭的基本部件按书写顺 序拆开编码,各基本部件能按不相交拆分就按不相交拆分,能按离散 拆分就不要按相连拆分。相连关系有时不容易分清,规定单笔画基本 部件与多笔画基本部件组合,若即若离,没有明显间距时,视为相连, 如"自"字,视为基本部件"撇"与基本部件"目"相连。但点的下 面有横时,视为离散,如"主"字,如基本部件"点"与"王"视为 离散。特别规定当某个后写的笔画跟前二笔乃至更多的前几个笔画相 交时,该后写的笔画必须单独拆出编码,但不宜将基本部件中的竖笔 单独取出编码。汉字输入法中最头疼的是遇到相交的笔画如何拆分, 如"曹"字的上半部分,不同的输入法有不同的拆分方法,给初学者 带来了严重的不便。这条特别规定则解决了汉字输入法中长期未能解 决的难题,使"曹"字上半部分的中间的两竖必须单独拆分成两个基 本笔画编码。
超过四个基本部件组成的汉字的编码规则是取第1、第2、第3 及最末一个基本部件的代码作为该汉字的编码。如"编"字,按书写 顺序,第一、二、三及最末一个基本部件分别为纟、、、尸、卄,代
码分别为P、 Q、 O、 V,编码就为PQOV。
四个基本部件组成的汉字的编码规则是取第l、第2、第3及最
末一个基本部件的代码作为该汉字的编码。如"型"的编码,第一、
二、三及最末一个基本部件分别为横、升、IJ、 土,代码分别为E、 V、 G、 D,编码就为EVGD。
二个或三个基本部件组成的汉字按书写顺序依次取各基本部件 的代码,再补上区分码编码。区分码的编码方法是将左右型、上下型 和杂合型分别用三个互不相同的标点符号比如用","、"."和"/"表 示,只有二个基本部件的汉字,需在这二个基本部件的代码后补上其 字型编码,再补上该汉字的最末笔的编码。三个基本部件组成的汉字, 仅需在这三个基本部件的代码后补上其字型编码。需要指出将左右 型、上下型和杂合型分别用","、"."和"/"编码也是一个创新,因 为一来简单易记,二来区分码的位置不可能出现在汉字编码的第一个 位置,不影响标点符号输入。如"男"字,前二个部件为"田"、"力", 代码为B、 P,不足四码,需补上区分码是上下结构,因此用"." 编码,最末笔是撇,编码是U,这样"男"的编码为"BP.U"。又如 "轮"字,前三个部件为"车"、"人"、"匕",代码为C、 J、 I,为左 右结构,用","编码,轮的编码就为"CJI,"。
对于常用汉字若只取其完整编码前边的一个、二个、三个,再补 上空格键,就构成了一、 二、三级简码。本输入法中的一、二、三级 简码的数量都多于25键的输入法,重码率又很低,因此输入速度比 25键的输入法要快些。
为提高输入速度,目前各类输入法都提供了词语输入的功能,本 输入法也如此,规定不论词语的长短,其编码长度都为4码,并且字 词兼容。词语的编码规则是二字词,分别取每个字的完整编码的前 2码。如词语"过程"的编码,分别取"过"的前二个部件寸、1_的 代码R、 X,"程"的前二个部件未、口的代码U、 H,过程的编码就
为RXUH。三字词,分别取前二个字的完整编码的第1码,取第三个 字的完整编码的前2码。如词语"计算机"的编码,分别取计的第一 个部件i的代码Q,算的第一个部件^的代码U,机的前二个部件木、 几的代码F、 K,"计算机"的代码就为QUFK。四个字及四个以上字 的词,分别取第l、第2、第3和最后一个字的完整编码的第一码。 词组输入是提高输入速度的重要方法。要尽量利用词组输入。如"中 华人民共和国"的编码,分别取中、华、人、国的第一个部件口、 4 、 人、口的代码H、 J、 J、 Y,"中华人民共和国"的编码就为HJJY。
26键输入法的重码率比较低,为最大限度减少童码,在软件设 计中有意将发生重码的两个字中的某一个字列为二级简码,另一个字 列为三级简码,从而实际上消除重码。
为了便于使用,还设置了容错码,对一些编码容易出错的汉字, 在错误输入时也能出现所要输入的汉字。
权利要求
1、一种26键计算机汉字输入法,在将汉字各种笔画按国家语委的规定归类为横、竖、撇、点、折后,其特征是精选了100来个组字频率高的汉字部件,作为基本部件,将它们按起笔归类到横、竖、撇、点、折五个区中;再根据每个区中基本部件的组字频率的高低来决定每个区包含的键位多少,经测算,起笔为横、点、竖的基本部件各得六个键位,起笔为撇的汉字频率次之,分得五个键位,折起笔的基本部件频率最低,仅安排三个键位;按点、横、竖、撇、折的次序分区从左到右依次以每两列为界排列;点区中的丶、亠、言、讠、广、文、方等部件排在Q键上,用Q作代码;立、门、疒、丷、id="icf0001" file="A2006101469510002C1.gif" wi="4" he="3" top= "94" left = "152" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>冫等部件排在A键上,用A作代码;氵、水、id="icf0002" file="A2006101469510002C2.gif" wi="4" he="4" top= "102" left = "110" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等排在Z键上,用Z作代码;火和灬等部件排在W上,用W作代码;忄、心、id="icf0003" file="A2006101469510002C3.gif" wi="6" he="7" top= "109" left = "134" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在S上,用S作代码;冖、宀、辶、礻、衤等部件排在X上,用X作代码;王、一、雨、id="icf0004" file="A2006101469510002C4.gif" wi="5" he="4" top= "127" left = "62" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在E上,用E作代码;土、二、干、十等部件排在D上,用D作代码;厂、三、大、车、石、丆、id="icf0005" file="A2006101469510002C5.gif" wi="6" he="3" top= "136" left = "148" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>id="icf0006" file="A2006101469510002C6.gif" wi="5" he="4" top= "135" left = "158" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在C上,用C作代码;扌、寸、豕等部件排在R上,用R作代码;木、西等部件排在放F上,用F作代码;工、戈、七、艹、廾等部件排在V上,用V作代码;止、id="icf0007" file="A2006101469510002C7.gif" wi="6" he="4" top= "161" left = "102" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>虫、丨等部件排在T上,用T作代码;日、甲、刂、id="icf0008" file="A2006101469510002C8.gif" wi="3" he="5" top= "168" left = "77" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在G上,用G作代码;田、山、id="icf0009" file="A2006101469510002C9.gif" wi="5" he="4" top= "177" left = "23" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在G上,用G作代码;目、囗、小、id="icf0010" file="A2006101469510002C10.gif" wi="3" he="2" top= "178" left = "128" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>等部件排在Y上,用Y作代码;口等部件排在H上,用H作代码;贝、冂、四、罒、皿等部件排在N上,用N作代码;禾、竹、id="icf0011" file="A2006101469510002C11.gif" wi="9" he="8" top= "192" left = "116" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>攵、夂、id="icf0012" file="A2006101469510002C12.gif" wi="6" he="4" top= "195" left = "147" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>丿等部件排在U上,用U作代码;亻、人,乂,等部件排在J上,用J作代码;八、钅、金、彡等部件排在M上,用M作代码;月、儿、川、匕、id="icf0013" file="A2006101469510002C13.gif" wi="9" he="6" top= "218" left = "32" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>id="icf0014" file="A2006101469510002C14.gif" wi="7" he="7" top= "218" left = "42" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>爫等部件排在I上,用I作代码;勹、、几、鸟、id="icf0015" file="A2006101469510002C15.gif" wi="6" he="5" top= "219" left = "162" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>舟、犭等部件排在K上,用K作代码;乙、马、耳、尸、巳、了、阝等部件排在0上,用O作代码,乙代表所有的折笔画;女、己、刀、又等部件排在L上,用L作代码;厶、力、凵、纟、弓等部件排在L上,用L作代码;个别组字频率不高的部件也被排列到键上,它们并不一定按起笔归类,而是按同源和近形归类到组字频率高的基本部件中,如氵含水、id="icf0016" file="A2006101469510003C1.gif" wi="4" he="4" top= "35" left = "65" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>、小含id="icf0017" file="A2006101469510003C2.gif" wi="3" he="2" top= "35" left = "85" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>、钅含金、止含id="icf0018" file="A2006101469510003C3.gif" wi="6" he="4" top= "35" left = "124" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>刂含id="icf0019" file="A2006101469510003C4.gif" wi="4" he="5" top= "33" left = "143" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>艹含廾、心含id="icf0020" file="A2006101469510003C5.gif" wi="7" he="6" top= "42" left = "31" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>id="icf0021" file="A2006101469510003C6.gif" wi="6" he="6" top= "42" left = "39" img-content="drawing" img-format="tif" orientation="portrait" inline="no"/>含竹等部件;接着编码,本身就是一个基本部件的汉字的编码规则是基本部件的代码+首笔画代码+次笔画代码+末笔画代码;四个及超过四个基本部件组成的汉字的编码规则是取第1、第2、第3及最末一个基本部件的代码作为该汉字的编码;二个或三个基本部件组成的汉字按书写顺序依次取各基本部件的代码,还可补上区分码参与编码。
2、 根据权利要求1所述的26键计算机汉字输入法,其特征是区分码的编码方法是将左右型、上下型和杂合型这三类字型分别用三 个互不相同的标点符号比如","、"."和"/"表示,只有二个基本部 件的汉字,需在这二个基本部件的代码后补上其字型编码,再补上该汉字最末的笔画的编码;三个基本部件组成的汉字,仅需在这三个基 本部件的代码后补上该汉字字型编码。
3、 根据权利要求1所述的26键计算机汉字输入法,其特征是 单字取码规则都要遵循取大优先原则,即要优先按笔画数多的基本部 件编码,还要兼顾直观,避免把四边封闭的方框形的基本部件按书写 顺序拆开编码,特别规定按书写顺序与前二笔或更多的笔画相交的后 写笔画必须单独取出,按单个基本笔画编码,基本部件虫例外。
4、 根据权利要求1所述的26键计算机汉字输入法,其特征是 词组的编码规则为二字词,分别取每个字的完整编码的前2码;三 字词,分别取前二个字的完整编码的第1码,取第三个字的完整编码 的前2码;四字词及四个以上的多字词,分别取第l、第2、第3和 最后一个字的完整编码的第一码。
全文摘要
本发明26键输入法属于计算机汉字编码输入法,在将汉字各种笔画按国家语委的规定归类为横、竖、撇、点、折后,精选了100来个组字频率高的基本部件,将它们按起笔归类到横、竖、撇、点、折五个区中;再根据每个区中基本部件的组字频率的高低,经测算,起笔为横、点、竖基本部件各得六个键位,起笔为撇的汉字分得五个键位,折起笔的基本部件安排三个键位;按点、横、竖、撇、折的次序分区从左到右依次以每两列为界排列,再将汉字拆分成基本部件进行编码。
文档编号G06F3/023GK101192102SQ20061014695
公开日2008年6月4日 申请日期2006年11月22日 优先权日2006年11月22日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1