汉字输入码的编码方法

文档序号:6600473阅读:764来源:国知局
专利名称:汉字输入码的编码方法
技术领域
本发明涉及汉字信息处理系统,特别是汉字输入码的编码方法。
现有的汉字输入码如王永民发明的《五笔字型码》须经专门的训练才能掌握使用而且须经常操作才能保持技能。对于不经常操作的非专业人员来说,使用该码有困难。其他输入性能好(操作方便、输入速度快、重码少、可以盲打)的汉字输入码也都有非专业操作人员不易掌握的缺憾。现今计算机的使用在各个领域迅速普及,需要使用汉字输入码的人日益增多,单纯依靠少数专业人员进行操作已远远不能满足需要。因此要求汉字输入码不仅要输入性能好而且要易于掌握(不须专门训练)、易于普及(普通人都能掌握)。但是现有的汉字输入码还不能圆满地满足这样的需求。有些汉字输入码容易学会、便于普及,但输入性能欠佳,例如音数码只要有汉语拼音知识即可学会使用,但重码多,输入速度慢。
本发明的目的在于提供一种不但输入性能好(操作方便、输入速度快、重码少、可以盲打)而且容易学会(不须专门训练、只要阅读使用说明书即可自己学会使用)、容易普及(一般人都容易学会使用)的汉字输入码的编码法。
本发明的目的可以通过以下措施达到(1)限定将汉字分解成3个以下的构件而且每个构件必须仍是汉字或部首。(2)按逆序取码法则取每一构件中若干笔画为该构件字形特征(注逆序取码法则定义为将汉字笔画归纳处理后大体上按笔画在汉字中出现的频率、由低到高依次排列,规定取同一构件中笔画表示该构件的字形特征时必须按上述原则排定的次序依次优先采取,因为上述笔画排列次序大体上恰与现代汉语教科书中汉字笔画名称表所列笔画次序相反,故命名为逆序取码法则),取每个构件的读音的第1个字母为该构件的语音特征,(3)规定1个字形特征称为1个字形码并与键盘上1个指定的键对应,1个语音特征称为1个语音码并与键盘上1个指定的键对应,字形码与语音码应对应不同的键,2至6个字形码和语音码混合编成1组输入码,可以代表1个汉字或1个词、1个词组,1组输入码内字形码的次序应按其所在构件的次序排列(构件的次序按书写顺序排列),同一构件中两个以上的字形码的次序按前文所述逆序取码法则排列,同样地1组输入码内语音码的次序亦应按其所在构件的次序排列,但是一组输入码中语音码和字形码的数目允许有多种不同的组成,并且语音码与字形码的序位也允许有多种不同的排列,(4)具有相同数目的语音码和字形码并且语音码(或字形码)的序位相同的输入码的集合定义为1个层,不同类型的汉字集(如字与词)应归纳到不同的层中。层这一概念是本发明首次提出的。使用它,不但可以将容纳空间扩大许多倍而且可以将不同的汉字集比较有秩序地控制在不同的层中。其用途是多方面的可以有效地降低重码率、可以容纳规范码和非规范码(见下文),输入字和词间打时不必切换等。
前文已规定每个构件必须仍是汉字或部首并规定取构件读音的第1个字母为该构件的语音特征。若构件是现代汉字,其读音自然以国家语委颁布的标准读音为准。但若构件是部首,情形便有所不同,因为有一部分部首在现代汉语中是只有名称而无读音的,故补充规定可以参照现代汉语中部首的名称给部首以指定的读音。
规定指定部首读音应参照部首名称是因为大多数部首名称是人们熟知的,以便于记忆。但是有少数部首的名称是不为人熟知的(如厶、彡、髟)为便于记忆再补充规定可以将这类部首的读音一概指定为(O)。
鉴于有许多人读音不准确,为使用方便起见,补充规定语音码F与H兼容(意即按F键与按H键等效)、L与N兼容(意即按L键与按N键等效)。
本发明的汉字输入码包括规范码和非规范码,规范码的编制不但应遵守前述全部编码规定而且还应遵守一些附加规定如a、笔画部首不作为构件,b、凡能够分解成3构件的汉字均应分解成3构件处理,其输入码归属于相应的指定的层中,凡不能分解成3构件而能分解成2构件的汉字均应分解成2构件处理,其输入码归属于相应的指定的层中,凡不能分解的汉字均按单构件字处理,其输入码归属于相应的指定的层中,c、构件的笔画按国家语委颁布的标准正字表为准。非规范码定义为不完全遵守附加的规定(如前述a、b、c项规定)的汉字输入码。
规范码和非规范码的概念也是本发明首次提出的,其意义是什么呢?实际上以往的汉字输入码都是规范码,因为它们都是按一定的规范编制的。如果不符合规范就是错误的。只有非规范码才是本发明独具的。为什么要有非规范码呢?因为即使最基本的语文知识人们也往往没有完全正确掌握,或者由于操作者习惯或疏忽编错码,这是常见的情形。本发明引入了数倍于规范码的非规范码,将操作者容易出现的错误尽可能包容在内。这样,即使操作者编码不完全规范,只要在非规范码的范围内,仍可输入,只是重码率略高一点。
为了引入非规范码而不增加规范码的重码率,补充规定如果非规范码与规范码出现重码则保留规范码,取消非规范码。
本发明的汉字输入码可以适用于标准英文小键盘,也可以使用专门设计的键盘。语音码的键名与英文键盘上相应的英文字母键同名,字形码键名以经归纳处理后的笔划命名并在键盘上依前述规定次序排列。
本发明具有以下优点(1)容易学会、易于普及。容易学会的意思是指操作者只要具有小学毕业的文化水平,不须专门训练只要阅读使用说明书即可自行学会使用。由于本发明的编码方法所涉及到的构件、语音特征、字形特征均来自汉字和汉语拼音的基础知识,虽有一些人为的规定但所规定的内容均顺应人们所熟知的语文知识,自然容易记得;规定以构件读音的第1个字母为构件的语音特征并规定语音码F与H、L与N兼容所以并不要求操作者汉语拼音正确无误而只要求具有汉语拼音的基本知识;编码规则简单明了;引入大量非规范码,即使操作者编码不完全规范也能输入。综上所述可知本发明的编码法不但规则简明而且所须记忆的内容很少,主要是笔画的排列次序而这已按规定标明在键上了(实际上是提示)所以操作者只要读了使用说明书就可以明了编码方法,进行操作了。
因为容易学会而且对操作者文化水平要求不高自然容易普及。此外,本发明的汉字输入可以在现在普遍使用的标准英文小键盘上进行,也有利于本发明的普及推广。特别应提到的是由于本发明的内容与小学语文教学可以相容,所以本发明的普及推广工作可以容纳到小学语文教学中。这一特点如付之实施,将对我国计算机使用普及推广起到不可估量的作用。
(2)输入性能好。指操作方便、输入速度快、重码少、可以盲打,兹分别说明之由前文所述可知本发明的汉字输入码不仅容易学会而且输入方便。需要补充的是由于本发明使用了分层输入,所以在字、词、词组间打时不必切换,十分方便。至于重码少特别是在如此容易学会而又对操作者输入操作要求如此宽松的条件之下仍能做到重码率很低的根源存在于本发明的深层构思之中。首先本发明的汉字输入码从形式上看是音、形结合码但实质上包涵了汉字、汉语语音全面的信息(字形、读音、书写顺序、笔画、笔画顺序[逆序])而且巧妙自然地利用了这些信息。唯其包涵信息多故而重码率低,唯其顺乎自然故而操作者需要掌握的基本上是小学已学会的知识,所以易学易用。特别是创造了逆序取码法则优先采取在汉字中出现频率较低的笔画为构件的字形特征,排他性极强而且按此法则即使取在汉字中出现频率较高的笔画为构件的字形特征时也说明该构件中不存在出现频率较低的笔画,排他性同样很强。以上是重码率低的首要原因,其次由于本发明提出并使用了层的概念,使容纳空间扩大了许多倍,并进一步将汉字较有秩序地归纳入不同的层中也有效地降低了重码率。因重码率低故可以盲打。输入速度也许是衡量输入性能优劣最重要的指标,因为它直接反映了输入性能的一个主要方面。但实际的输入速度并不完全取决于输入每字的击键次数,操作不方便、编码易失误,重码率高都在相当大的程度上影响实际的输入速度。本发明的汉字输入法输入每字的击键次数可以与现今实际应用较广的《五笔字型码》相同即输入每字击键4次。而且前文已说明本发明的汉字输入法操作方便、容许编码不完全规范、重码率低,可以盲打,因此本发明的实际输入速度是较快的。特别要指出的是鉴于汉文中有很多词和词组,所以在实际应用中字、词、词组间打将大大加快输入速度而本发明的特点之一就是进行上述间打时不必切换,这将十分有利于加快输入速度。
(3)由于本发明的汉字输入码容纳空间大并实行分层归纳,可以容纳众多的字、词、词组包括繁体字、异体字。
附表的说明如下表1是《笔画次序表》。
表2是《汉字部首读音、语音码表》。
表3是《输入码中语音码和字形码序位表》。
本发明将结合实施例做进一步详述。
本文所述之若干编码的规定可具体化如下(1)将汉字笔画归纳处理并按逆序取码法则,指定次序如表1。
(2)参照汉字部首名称规定部首读音如表2(名称不为人熟知者规定为<O>)。
(3)规定3构件字、2构件字、单构件字及双音词、3音词、多音词输入码的语音码和字形码的序位如表3。
作了上述具体化规定之后,并按本发明编码法之其他规定即可对字、词编码。
例字1椅。
可分解为3构件木、大、可。
由表3,3构件字输入码的语音码和字形码的序位为音1形1音2音3按表1 形1为丿按表2 音1为M 音2为D 音3为K输入码为M丿DK如操作者出于习惯或疏忽将椅字分解成2构件木、奇。
由表3,2构件字输入码的语音码和字形码的序位为音1形1音2形2按表1、表2输入码为 M丿Q亅但因为分解时将本来可以分解成3构件的字分解成2构件处理不完全符合编码规定故所编的输入码为非规范码。
例字2好。
分解为2构件女、子。
按表3,2构件字输入码的语音码和字形码的序位为音1形1音2形2按表1、表2输入码为
NㄑZ亅因为前文已规定N与L兼容故输入码也可编为LㄑZ亅例字3其。
属单构件字,按表3单构件字输入码的语音码和字形码的序位为全字音形1形2形3按表1、表2输入码为Q丷丨丨例4(双音词)南京按表3,双音词输入码的语音码和字形码的序位为形1音1形2音2按表1、表2输入码为N亅G例5(3音词)拖拉机按表3,3音词输入码的语音码和字形码的序位为音1音2音3空格键(代码为凵)按表1、表2输入码为TLJ凵例6(多音词)中华人民共和国按表3多音词输入码的语音码和字形码的序位为音1音2音3音末按表1、表2输入码为ZHRG









权利要求
1.一种汉字输入码的音形混合编码法,其特征是(1)限定将汉字分解为3个以下构件而且每个构件都必须仍是汉字或部首,(2)按逆序取码法则取每一构件中若干笔画为该构件的字形特征(注逆序取码法则定义为将汉字笔画归纳处理后大体上按笔画在汉字中出现的频率、由低到高依次排列,规定取同一构件中笔画表示该构件的字型特征时必须按上述排定的次序依次优先采取),取每个构件读音的第1个字母为该构件的语音特征,(3)规定1个字形特征称为1个字形码并与键盘上1个指定的键对应、1个语音特征称为1个语音码并与键盘上1个指定的键对应,字形码与语音码使用不同的键,2至6个字形码和语音码混合编成一组输入码可以代表1个汉字或1个词或1个词组,一组输入码内字形码的次序应按其所在构件的次序排列(构件的次序按书写顺序排列),同一构件中两个以上字形码的次序则按前述逆序取码法则排列,同样地语音码的次序亦应按其所在构件的次序排列,但是一组输入码中语音码与字形码的数目允许有多种不同的组成,并且语音码与字形码的序位也允许有多种不同排列,(4)具有相同数目语音码和字形码并且语音码(或字形码)的序位相同的输入码的集合定义为层,不同类型的汉字集<如字与词>应归纳到不同的层中。
2.按权利要求1所述的汉字输入码的音形混合编码法,其特征是汉字的构件为部首时其读音应参照现代汉语中部首的名称给予指定的读音。
3.按权利要求2所述的汉字输入码的音形混合编码法,其特征是在指定部首的读音时对于一些名称不为人所熟知的部首(如厶、彡、髟)可以一概指定读<0>。
4.按权利要求1所述的汉字输入码的音形混合编码法,其特征是语音码F与H兼容(按F键与按H键等效)、L与N兼容(按L键与按N键等效)。
5.按权利要求1、2、3、4所述的汉字输入码的音形混合编码法,其特征是输入码包括规范码和非规范码,规范码的定义是不但符合前述编码规定而且还须符合一些附加的规定如a、笔画部首不作为构件,b、凡能够分解成3构件的汉字均应分解成3构件进行处理,其输入码归属于相应的指定的层中,凡不能分解成3构件而能够分解成2构件的汉字均应分解成2构件进行处理,其输入码归属于相应的指定的层中,凡不能分解的汉字均按单构件字进行处理,其输入码亦归属于相应的指定的层中,c、构件的笔画按国家语委颁布的标准正字表为准,非规范码定义为不完全符合上述a、b、c项附加规定的输入码。
6.按权利要求5所述的汉字输入码的音形混合编码法,其特征是当规范码与非规范码出现重码时,保留规范码,非规范码失效。
全文摘要
本发明提供了一种汉字输入码的编码方法,其特征是通过按特定的规范对汉字分解构件、取特征、编码等方法将汉字固有的各种信息(字形、读音、书写顺序、笔画、笔画排列次序)集中反映在音形混合输入码中。编码方法涉及到的知识基本上都是小学语文教学中已有的内容。本发明兼有输入性能好(操作方便、输入快、重码少、可以盲打)和容易学会、易于普及两方面的优点。适于专业操作人员及非专业操作人员通用。
文档编号G06F3/023GK1105463SQ9411183
公开日1995年7月19日 申请日期1994年7月15日 优先权日1994年7月15日
发明者邓仁 申请人:邓仁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1