三五声码的制作方法

文档序号:6570070阅读:337来源:国知局
专利名称:三五声码的制作方法
技术领域
本发明属于电脑汉字编码方法。是对本发明人前一发明五三笔码的改进,因其主要特点是在五三笔码基础上补上拼音首字母,所以成为三五声码。
在“五三码及其键盘”的专利申请中,我提到当规定五三笔码码长为3码时,可补上声母以降低重码,但这样的编码虽几分钟可以学会,却仍有些重码,为进一步降低重码,还可将某些组字单元排在键上,若将汉字一分为二后再编码,则输入更直观,更能有效的降低重码。
本发明的目的是提供一种将单体字以每三笔编码,将合体字一分为二后,分别以每三笔编码,并补上组字单元,结合拼音首字母进行编码的电脑汉字编码方法三五声码。它具有简单易学,输入速度快,编码直观,便于操作等的优点。
为达到三五声码的目的,将汉字分为二类一类是单体字,一类是合体字。单体字是指笔画交连或离散对称或带点结构的汉字。即人们常说的独体字,如“大”“小”“太”等字。合体字占汉字的绝大多数,可分为左右,上下,包围三种结构。合体字通常具有或可以有一定的间隙,根据汉字的整体结构在最初产生间隙处将其一分为二,先写部分为第1部分,余下部分为第2部分。
有些字如“严”“产”“卡”等字没有明显的间隙,难以区分是单体字还是合体字,难以划分第1部分,第2部分。为此本发明人提供了“切分同向判别法”加以判别,即试着将没有明显间隙的汉字切分为二半,离切割线最近的二个笔画若同向,互为横或竖或撇或捺或折,则为合体字,否则为单体字。这样这几个字都为单体字。同样“古”“克”等字也被划为单体字。
有些字虽为包围结构,但包围部分要分开书写,如“可”等字也规定划入单体字。对插型的字如“坐”也被划入单体字。
接着编码。拼音首字母可前可后,一经选定不得改变。在实施例中规定拼音首字母在先。余下的形部三码的编码规则是对单体字只要以每三笔编码。合体字对第1部分,第2部分别以每三笔编码。第1、2部分至少各取一码。第一部分可规定只能取一码,考虑到少数合体字第1部分要比第2部分复杂,所以在实施例中规定第2部分可取2码。当第1部分取一码时,第2部分可取二码时应当取二码。
为降低重码率,最好将某些组字单元排在键上,组字单元又称组字部件,是指可以组成汉字的笔画结构。排列组字单元时要避免组字频率高的组字单元和组字频率高的某种横竖斜排列组合形式排在同一键上。组字频率一般、笔画多的组字单元也要尽可能取一码,以扩大编码空间。将优选出的组字单元按笔画或拼音或表形等方式排在键上。有些组字单元还可包含互为繁简、互相同源,音或形或义相近,主要是形体直观相似的组字单元。就像英文字母有大小手写体一样。组字单元可以多可以少,比如可以为十个常用的部首,也可以有四五十个,综合简单、低重码两方面考虑,宜与西文字母数相当。在以每三笔编码时,若遇到排列在键上的组字单元,要优先按最大的组字单元编码。若首二笔与只有二笔的组字单元相同,也要按组字单元编码。
下面结合优选的实施例详细说明。
本发明在编码时对汉字笔画的认识完全科学。根据公认的观点,楷书汉字由笔画构成,笔画为书写汉字时不间断一次连续写成的一个线条。汉字的笔画有多种,在只考虑笔画的运笔方向而不计较其轻重长短时可分为横竖撇捺折五种基本笔画。其中点作捺,提作横,但点提相连时提作点,竖钩作竖。本人通过潜心研究发现,撇捺都由上向下倾斜,故可称为斜笔画。而折根据其没折弯钩前的运笔方向可分别并入横竖斜三类笔画中,这三类笔画本发明人称之为根本笔画。它与汉字各种笔画的对应关系见图1所示。
在依次出现的三个笔画中,横竖斜的排列组合不外乎27种,可一一对应或大致一一对地排列在27个或不足27个互不相同的键上。为便于记忆,一一对应地排列在26个字母及分号键上,见图2所示。国家语委出台的拼音用键盘方案中规定了分隔符键,这样也可排在分隔符键上。横竖撇捺折就可以分别排在余下的五个标点符号上,更便于操作。考虑到目前多用英文键盘,就用五个数字键。
编码规则是对单体字以每三笔编码,当取至最后不足三码时可将剩下的笔画归类为几种笔画,用若干键上的符号表示。可用字母也可用标点符号,数字。可根据剩下的第一笔,也可根据剩下的第二笔编码。在实施例中将剩下的第一笔归类为横或竖或撇或捺或折,编码分别为1或2或3或4或5。
对合体字将其一分为二,先写部分为第1部分,后写部分为第2部分。对第1、2部分分别以每三笔编码。第1、2部分至少各有一码,最多不超过2码,总共不超过3码。
对第1部分以每三笔编码时,若不足2码,还有剩下的笔画时,将剩下的第1笔归类为横或竖或撇或捺或折,编码分别为1或2或3或4或5。若超过二码时可将余下的笔画舍去,也可改取末三笔,实施例中取末三笔,对每三笔只需按对应的字母或符号编码。
当第1部分只有一码时,第2部分的编码规则与第一部分完全相同。当第1部分有二码时,第2部分可规定取首三笔或末三笔,考虑到汉字字尾变化较大,在实施例中取末三笔。当不足三笔时,将剩下的第一笔归类为横或竖或撇或捺或折,编码分别为1或2或3或4或5。之所以规定一律取剩下的第一笔是为了便于记忆。
在对每三笔编码时若遇到排列在键上的组字单元时要优先按最大的组字单元编码。再对其后的笔画编码。若首二笔与只有二笔的组字单元相同,要按该组字单元编码。为此要掌握优化三五声码键盘排列图,见图3所示。该图的特点是以图2为基础,将某些组字单元按前述方法排在键上。下面作具体解说。
(1)目含且,亻含人,日含 ,土含士,心含,讠含言, 含 尸、己、已、巳,氵含水、 扌含手、 纟含幺,艹含廿、 火含灬,钅含金,饣含食。
(2)虫、酉、鱼、火、石、竹按首三笔排列。目、禾按末三笔排列。饣为食的简体、根据食的末三笔排列。、土、氵、古按拼音首字母排列。亻变形后形似W,日之左部,足之中部形似E,讠形似丨,口形似O, 形似P,扌形似F,王形似Z,艹形似H,钅字头形似V,大之下半部形似倒立的V,阝形似B,心开口向上,形似U,纟起笔形似L,所以排列在相应的字母键上,巾将其横倒看为横竖横,所以排在A键上,车将其横倒看为首三笔为竖斜竖,所以排在B键上,女、 逆书写顺序排列,小起笔为竖,末笔为斜兼容在H键上,疒的首二笔为斜横,兼容在U上,D形似半个月的形状,Y形似树木枝叉,所以排在相应的键上,贝旋转后与山形似,而山的三个笔画应排在G键上,所以也排在G键上。
编码实例一种电脑汉字编码方法三五声码Y1 ZNO2 DE5 NDMO HS5 ZKZ BLUHMXA FM5 FST5 SQ WA1 STA3 MXA为提高输入速度还提供了词组输入法。词组码长一律为4码,规则是双字词,每字取其前二码;如“电脑”的编码为DEND。三字词,第一、二个汉字取其前一码,最后一个汉字取其前二码,当然也可规定第一个汉字取前二码,第二、三个汉字取其前一码。四字及多字词,第一、二、三、最后一个汉字各取其前一码。如三五声码的编码是SWSM。
本发明字词兼容,无须换挡等附加操作。重码的处理方法与其他输入法相同,或字频或智能。还可用简码降低重码,二级简码取单字的前二码,三级简码取单字的前三码。“?”键为万能查询键,当某一码难以确定时,用“?”代替,再利用提示行选择。达到四码无重码的自动上屏。不足四码的均以空格键结尾。
本发明可以用于一切大、中、小、微型计算机中文信息处理系统和通讯系统,可广泛应用于中文终端、中文电传、电脑打字、计算机排版印刷及特殊设备等各个方面。可以在互联网环境下运行。可以适用于使用繁体字的港澳台地区,及日文韩文汉字输入。
不难看出,三五声码编码规则简单易学,一般人20分钟左右可学成,且不易忘记,码长最多不超过四码,重码少,拆分方便,易学好用,容量大,不认识的汉字也可输入,使得汉字输入速度与西文相比毫不逊色。需要指出,三五声码形部编码可以不依赖拼音首字母独使用。也可将拼音首字母改为声母。


图1、横竖斜三类根本笔画与汉字各种笔画的对应关系。
图2、三个笔画中横竖斜27种排列组合形式在键盘上的一种优选排列。
图3、优化三五声码键盘排列图。
图2、图3中1、2、3分别为横、竖、斜的代号。
权利要求
1.一种三五声码,其特征是将汉字的拼音首字母或声母、整体结构、组字单元集约优化在五三笔码上。
2.一种优化三五声码键盘排列图,其特征是在任意三笔中,横竖斜的排列组合不外乎27种,可以一一对应或大致一一对应地排在27个或不足27个互不相同的键上,一般一一对应排列,并将某些组字单元排在键上。
3.根据权利要求2所述的优化三五声码键盘排列图,其特征是排列组字单元时要避免组字频率高的组字单元及组字频率高的横竖斜某种排列组合形式排在同一键上。
4.根据权利要求所属的三五声码,其特征是组织频率中等、笔画数多的组字单元也要尽量取一码。
5.根据权利要求2所述的优化三五声码键盘排列图,其特征是将优选出的组织单元主要按笔画或拼音或表形等方式排在键上,有的组字单元还可以包含互为繁简、互相同源、音或形或义相近,主要是形体直观相似的组字单元排在键上。
6.根据权利要求1所述的三五声码,其特征是将汉字分为单体字、合体字,合体只又一分为二,先写部分为第1部分,后写部分为第2部分,再编码。
7.根据权利要求1所述的三五声码,其特征是编码由拼音首字母和不超过三码的形部编码组成,形部编码可以独立使用。
8.根据权利要求6或7所述的三五声码,其特征是对单体字主要以每三笔编码。
9.根据权利要求6或7所述的三五声码,其特征是合体字编码时,对第1、2部分分别以每三笔编码,第1、2部至少各有一码,最多都不得超过二码,总共不得超过三码,第1部分可规定只能取一码。
10.根据权利要求3或4或5或8或9所述的三五声码,其特征是以每三笔编码时若遇到排在键上的组字单元时,要优先按最大的组字单元编码。
全文摘要
本发明三五声码属于电脑汉字编码方法。它在五三笔码的基础上使用了一分为二合体字技术,并规定其码长最多为三码,再与拼音首字母或声母结合成四位码长的编码,还将组字部件有机地排在键上。具有10几分钟学会,重码率低,高速输入的优点。
文档编号G06F3/023GK1427323SQ0113958
公开日2003年7月2日 申请日期2001年12月18日 优先权日2001年12月18日
发明者王治阳 申请人:王治阳
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1