汉字形义码元编码输入法及其键盘的制作方法

文档序号:6466074阅读:229来源:国知局

专利名称::汉字形义码元编码输入法及其键盘的制作方法
技术领域
:本发明属于拼形类计算机汉字编码输入方法,所涉及的技术,可广泛应用于中文信息处理及相关领域。
背景技术
:汉字拼形类编码输入方法很多,常见的有五笔字型、郑码、表形码等。这些编码或多或少都存在明显不足。没有解决GB2312-80字符集中的重码问题,也很难称得上易学易用,需要改进的空间巨大。
发明内容—、形义码元表及形义码元中文键盘本发明的形义码元是在对汉字拆分、拼合规律研究的基础上,通过对组成汉字的拼形符号的优选,根据拼形符号本身的形义待征、相容关系进行归并,依据拼形符号间的相互联系进行组合建立序列。共归并二十六组汉字码元(与二十六个英文字母对应),分为六个区,每区五个位(第六区可认为是二区的辅助区),与五个单笔划一起,组成本方法的汉字码元体系。码元表的六个分区为横数区、竖数区、撇皮区、点元区、折框区、辅区,依次用1、2、3、4、5、6编号。码元表的五个位按其待征序1、2、3、4、5排列,其特征序一般表现为码元的横向笔划数、码元的纵向笔划数、同类笔形数,双笔笔画代码组成的区位代码以及其它具有相同特征的序值。本发明的码元代码因为采用了区码+位码形成的区位代码表示,并与现有计算机字母键盘字母布局相结合,使得与计算机字母键盘的映射关系简单直观,见下<table>tableseeoriginaldocumentpage5</column></row><table>为了方便汉字计算机键盘输入,在设计生产计算机键盘的时候,将本发明的汉字形义码元,依据形义码元与计算机字母按键的映射关系直接刻印在计算机按键上形成专有的形义码元中文输入键盘,也可以将上述映射关系制成键贴式的产品,贴到计算机按键上形成形义码元中文输入键盘。码元表的二十六组码元均有一个与其形义相关的区位代码,该区位代号码使得杂乱无章的码元呈现有序性,见下面形义码元表。—区(横数区)<table>tableseeoriginaldocumentpage6</column></row><table>二区(竖数区)<table>tableseeoriginaldocumentpage6</column></row><table>三区(撇皮区)<table>tableseeoriginaldocumentpage6</column></row><table>四区(点元区)<table>tableseeoriginaldocumentpage6</column></row><table>五区(折框区)<table>tableseeoriginaldocumentpage6</column></row><table>六区(辅区)傳母K0,f'卞了J业卄fi.刀又鸟61(N〕下面为形义码元总表(简体),输入繁体字时需将本表简体码元转化为繁体码元。形义码元总表<table>tableseeoriginaldocumentpage7</column></row><table>简繁码元对照表<table>tableseeoriginaldocumentpage8</column></row><table>形义码元表及形义中文键盘通用于简体,繁体汉字。输入简体和繁体汉字的差别仅在于将形义码元中简体码元转化为相应的繁体码元,即可用于对繁体字的编码及键盘输入。码元表的区位方式具有显而易见的排列规律性,对标准计算机键盘有较强的适应性,利用形义码元的代码以及与英文字母之间的映射关系将形义码元做在计算机键盘键面上就构成形义码元中文键盘,附图是根据形义码元表设计的计算机汉字形义码元中文键盘按键表面的例子。为了方便使用也可制成键贴形式的产品,贴在键帽上。该键盘使形义码元有了确定的输入按键,通过按形义码元键即可完成汉字编码及计算机汉字输入。此外形义码元代码为1-6的数字组成的区位代码,可直接映射到数字小键盘,通过输入形义码元的数字代码,达到输入码元的目地,用于手机等微型设备的数字键盘输入汉字。二、形义码元汉字编码方法及汉字键盘输入(—)、几个基本概念1、笔划及笔顺笔划笔划指构成楷书汉字字形的最小笔划单位,分为横、竖、撇、捺、折五种。依次用数字1、2、3、4、5表示,是本方法中特殊的码元,做码元使用时依次表示为11、22、33、44、55。此外,竖钩做码元使用时为了与竖区别用61表示。笔顺书写汉字时笔划的先后顺序。2、码元指本方法形义码元表中的笔划结构块和五种单笔划。是构成汉字或汉字构件的元素。3、构件指本方法中一个相对独立的码元,或多个码元通过粘连、交连组合到一起,形成的一个相对独立的结构块。也可称为汉字的部件。4、构型指本方法中汉字构件间的组合关系。汉字有四种基本构型①、单型单个构件组成的汉字。用g表示②、叠型两个或两个以上构件叠合在一起形成的汉字,构件之间有水平空隙自然分隔。可用公式gl+g2或gl+g2+…gn表示。③、并型两个或两个以上构件并合在一起形成的汉字,构件之间有垂向空隙自然分隔。可用公式gllg2或gllg2卜'gn表示。、围型一个构件包围另一个或多个构件形成的汉字,其中围型构件与其包围的构件之间存在明显空隙。可公式用[gl]或[gl,g2,…gn]表示。—般来讲,三个或三个以上构件组成的汉字多为上述基本构型的组合,组合的种类很多,这里统称为复合型。这时的构件g可以是复合构件,即本身即为上述基本构型的组合,并充当基本构型中构件作用的部分。5、补码指本方法中当汉字编码不足四码时,取汉字首码元的首笔,汉字末码元的末笔,或单个码元的首笔、末笔组成的笔划码。单笔划的补码用61表示。补码有两种正码和反码。即组合笔划的方式是首末序,还是末首序。并型和围型中的左下围补码用正码,其它构型均用反码。(二)、汉字的拆分规则1、汉字拆分的两个层次①、第一层次汉字一构件;按照先上后下、先左后右、先外后内(下三围除外)的拆分顺序拆分。②、第二层次构件一码元;按照"能二不三、能松不缠、披点占先、拆夹直观"的口诀拆分。拆分汉字应遵循先把汉字拆分成构件,然后再把构件拆分成码元的次序。由于汉字中构件之间的关系相对独立,已形成自然拆分,汉字的拆分实质上是构件的拆分。2、构件拆分要点及示例①能二不三按照笔顺、一个构件如果能分解成两个码元,决不分解成三个,保证拆分的最大效益。示例正确卓一卜、早;错误卓一卜、日、十;正确缶一、山;错误缶一、十、U;正确空一穴、工;错误空一^、八、工;②能松不缠按照笔顺、一个构件如果能按照松散的码元关系拆分,决不按纠缠不清的码元关系拆分,保证拆分能直观、自然分割。示例正确亏一一、5;错误亏一二、勺;正确尤一f、L;错误尤一一、儿;正确生一j、生;错误生一、土;③披点占先一个构件如包含披点码元(如戈、弋等),则可以忽略笔顺,首先保证披点码元完整性的拆分方式进行拆分。示例正确甫一T、月;错误甫一一、月……;正确戊一戈J;错误戊一厂、L……;正确哉一十、戈、口;错误哉一土、口;拆夹直观一个构件中,若一个码元直观显现于另一个码元之中即"夹"在另一个码元之中,则可以忽略笔顺按直观的方法拆分。示例正确束一木、口;错误束一一、口、小;正确秉一禾、3;错误秉一j、一、3、小;正确夹一大、乂;错误夹一一、、《大;(三)、汉字的编码方法1、汉字单字的编码①、键名码元的编码码元+补码+31(注31为键名附加后缀码)[OO76]②、非键名码元(成字)的编码码元+补码+61(注61为成字码元附加后缀码)③、非键名码元(不成字)的编码码元+首次笔划组合码+45+45(注45为非成字码元附加后缀码)、码元"一、二、三、四、五、六、七、八、九、0"的编码码元+31+41(注31、41为数字码元附加后缀码)⑤、单型汉字(g)的编码两码元相连构成的字按顺序取码元1、2、补码。两码元相交构成的字按顺序取码元1、2、补码、61。其它取码元1、2、3、末。不足四码加补码。⑥、围型汉字([gl,g2,…gn])的编码首先拆分围型构件,然后再拆分其它构件,按拆分出的码元顺序取1、2、3、末码元编码。不足四码加补码。⑦、并型汉字(glIg2I...gn)的编码按顺序取1、(2)、(3)、末码元编码。不足四码加补码。其中(2)、(3)根据gl是否为并叠复合构件来确定gl的取码如果gl为并叠复合型,则gl取三码gl的首码、未取的并构分构件的首码,gl的尾码,否则gl最多取首尾两码;g2及…gn的取码如果n=2,则g2按正常顺序取码;如果n>2,则g2最多取首尾两码;余部…gn按正常顺序取码。⑧、叠型汉字(gl+g2+…gn)的编码按顺序取1、(2)、(3)、末码元编码。不足四码加补码。其中(2)、(3)的取码与构件中是否有并型复合构件有关。若无时按正常顺序取码,否则根据首次出现并型复合件的位置,汉字的取码做如下调整gl为并型,则取该并构各分构件的首码元(最多可取三码,即首、次、末分构件)。gi(l<i<n)为并型,则gi以上构件最多可顺序取二码,gi最多取该并构的首尾分构件的首码元各一码,若gi以上构件取足二码,gi只取首分构件的首码元一码。gn为并型,则gn以上构件最多可顺序取二码,然后从gn开始按正常顺序取码。(四)、汉字词组的编码汉字词组的编码基于汉字的编码,有两种形式1、字词混合型——字词混编在一起,字词有互相干扰现象。①、双字词字l前两码+字2前两码。②、三字词字1首码+字2首码+字3首码。③、四字及多字词字1首码+字2首码+字3首码+末字首码。2、字词分开型——字词相互独立,字词之间没有干扰。①、双字词字1前两码+字1第三码的区码+字2前两码。②、三字词字1首码+字1第二码的区码+字2首码+字3首码。③、四字及多字词字1首码+字1第二码的区码+字2首码+字3首码+末字首码。区码用数字键l2345(或67890)表示。区码的作用是把汉字词编码与字编码区分开来,同时具有控制功能,当按下数字键时,系统状态由字输入状态转入词输入状态。(五)、汉字键盘输入根据上述编码规则,将拆解汉字得到的码元映射到计算机字母键上,依照得到码元的顺序,依次按下计算机字母键,配合相关计算机程序,即可完成汉字的输入。三、汉字编码码本及检索根据形义字母表、形义码元代码以及编码方法,对国标汉字进行编码,形成形义码元编码(数字代码或字母代码),按其代码序值进行排序后,就形成了形义码元汉字检索系统的码本,其中包含以汉字编码序值排列的词汇,可以用于辞书词条检索,大型文献库检索等。附图、形义码元中文键盘按键表面设计。具体实施例方式形义字母编码法编码示例1、键名码元身一身、补码、31编码543331(xet)方一方、补码、31编码:445431(oxt)2、非键名码元示一示、补码、61编码134161(dyn)长一长、补码、61编码144361(sin)3、单笔划及偏旁J—j、61、45、45编码33614545(en卯),—,、45、45、45编码:13454545(d卯p)4、单型字下一一、卜、补码、编码ll1141(ggy)夫一二、人、补码、61编码12244161(flyn)发一厶、夂、、、补码编码55454445(zpop)'、i、1、、编码55552244(zzjo)书—i、i、1、、5、围型字困一口、木、补码、虱一飞、j、虫、补码病一广、一、门、人麽一广、木、木、厶6、叠型字昌一日、日、补码编码544242(x皿)编码55335145(zebp)编码34115124(wgbl)编码33424223(e皿k)编码535312(ccf)11'立、日、土、补码慰—'尸、寸、心、补码堂—'M,、、口、土藉—'卄、二、小、曰翁一八、厶、习、习~*-又、又、又、三攀—-木、义、木、J窝—'穴、口、门、人7、并型字对一又、寸、补码乱—J、古、L、补码髌—'门、月、乂八俞见~*-人、月、U、儿鄹—-耳、又、水J颡一又、又、木、贝微—4、山、几、义8、词组编码创新一人、B、立、木计算机一i、竹、木改革开放一己、廿、-编码55531214(zcfs)编码52155445(vaxp)编码43615212(invf)编码22134353(jdic)编码23235252(kkvv)编码62626213(誦d)编码42614261(unun)编码:14525124(svbl)编码621554(max)编码:33415535(eyzq)编码:51356223(bqmk)编码:24352232(lqjr)编码:21624332(hmir)编码:62624234(mmuw)编码:32233461(rkwn)编码24425542(luzu)编码112142(ghu)方编码41221144(yjgo)权利要求一种用于计算机中英文输入的,形义码元中文键盘其特征在于①、计算机键盘的按键表面不但刻印着英文字母、同时还刻印着本发明的形义码元。②、计算机键盘字母按键上的形义码元与英文字母的映射关系由本发明的形义码元表及码元代码与英文字母的映射关系确定,下面为形义码元总表。形义码元总表③、每个形义码元都有一个数字区位代码,并将英文字母键盘分做六个区,每区五个位,码元分区与英文字母键盘的分区映射关系见下表2.根据权利l,一种用以计算机的中文键盘键贴的特征是形义码元与英文字母的映射关系印制在贴纸上,成为键贴产品,形义码元中文键盘可由键贴贴在字母按键上构成。3.—种汉字编码键盘输入方法的特征在于①、本发明的形义码元及代码体系和映射关系,包含数字代码和英文字母代码。②、建立在笔划及笔顺、码元、构件、构型、补码等基本概念定义基础上的对汉字的认知。③、分解按先"汉字一构件"、再"构件一码元"顺序,及按照"能二不三、能松不缠、披点占先、拆夹直观"的拆分口诀将汉字拆解成码元序列。④、按以下列规则得到汉字编码独型字、闱型字的编码按拆解的码元顺序取一、二、三、末码元编码,不足四码加补码。型汉字(gl+g2+…CT)的编码按顺序取1、(2)、(3)、末码元编码。不足四码加补码。其中(2)、(3)的取码与构件中是否有并型复合构件有关。若无时按正常顺序取码,否则根据首次出现并型复合件的位置,汉字的取码做如下调整gl为并型,则取该并构各分构件的首码元(最多可取三码,即首、次、末分构件)。gi(l<i<n)为并型,则gi以上构件最多可顺序取二码,gi最多取该并构的首尾分构件的首码元各一码,若gi以上构件取足二码,gi只取首分构件的首码一码。gn为并型,则gn以上构件最多可顺序取二码,然后从gn开始按正常顺序取码。并型汉字(glk2l…gn)的编码按顺序取1、(2)、(3)、末码元编码。不足四码加补码。其中(2)、(3)根据gl是否为并叠复合构件来确定gl的取码如果gl为并叠复合型,则gl取三码gl的首码、未取的并构构件的首码,gl的尾码,否则gl最多取首尾两码。g2及…gn的取码如果n=2,则g2按正常顺序取码;如果n>2,则g2最多取首尾两码。余部…gn按正常顺序取码。、补码当汉字编码不足四码时,取汉字首码元的首笔,汉字末码元的末笔(键面成字码元则指汉字的首笔、末笔)结合汉字构型组成的区位码。单笔划的补码用61表示。补码有两种正码和反码。即组合笔划的方式是首末序,还是末首序。并型、围型中的左下围补码用正码,其它构型均用反码。⑥、汉字编码输入将根据①⑤确定的汉字码元,依照得到码元的顺序,依次按下相应的计算机字母键,配合相关计算机程序,完成汉字的输入。4.根据权利3的方法,汉字词汇的编码输入方法特征是二字词——取每个汉字编码的前两码编码,三字词——取每个汉字首码编码,四字词及多字词——取1、2、3末汉字的首码编码。5.根据权利3的方法,使汉字与汉字词汇分别处理的方法特征是在输入汉字词汇过程中,当输入汉字词第一个汉字的规定码元的字母编码后,输入表示词汇编码的数字代码(数字代码取自码元代码的区码),再输入汉字词后续字码元的字母代码。6.根据权利3的方法,汉字及辞书检索方法的特征是①、由根据权利3的方法得到得国标汉字编码,其中包含以汉字编码序值排列的汉字词汇。②、按其代码(数字代码或字母代码)序值大小排列的码表。全文摘要形义码元编码法及其键盘是一项涉及中文信息处理领域的发明。发明提出了码元、构件、构型的概念,澄清了以往的模糊观念,对汉字的结构认识上了一个层次,并把对汉字的拆分简化为对构件的拆分。该发明精选的汉字码元依形取义,依义分区按位命名,易学好记,使得该方法不但上手快,而且不易遗忘。发明可用于计算机汉字输入、辞书编纂中的汉字索引,也可用于手机等掌中设备的汉字输入。此外,可忽略的重码是本发明的重大突破,弥补了以往编码方法的不足。文档编号G06F3/023GK101714029SQ20081014152公开日2010年5月26日申请日期2008年10月7日优先权日2008年10月7日发明者张建平申请人:张建平
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1