一种汉字部件拼音化的汉字输入方法

文档序号:6482665阅读:535来源:国知局
专利名称:一种汉字部件拼音化的汉字输入方法
技术领域
本发明涉及一种基于计算机通用键盘的汉字输入方法,尤其涉及一种以形音结合 为基础的汉字输入方法。
背景技术
目前的汉字输入方法或是以字音作为编码依据,如全拼输入、双拼输入等,或是以 字形作为编码依据,如五笔输入、笔画输入等。对于以字形为编码依据例如五笔输入的输入法而言,由于汉字的造字比较复杂, 拆分出来的字根数量庞大,要将这么多的字根映射到计算机键盘上,往往一个按键上会设 置多个字根。而且,字根与键位本身的关联度不高,这两个因素叠加,造成用户记忆上的困难。对于以字音为编码依据例如全拼输入的输入法而言,由于要准确输入汉字需要先 知道这个汉字的读音,用户对于不认识的生字就无能为力了。尤其是对于一些生僻字,多用 于人们的姓名之中,例如“篪”,在不知道其发音的情况下,这个字根本无法通过字音为编码 依据的输入法进行输入。

发明内容
本发明的目的在于解决上述问题,提供了一种汉字部件拼音化的汉字输入方法, 可以在不知道欲输入汉字的发音的情况下仍然能够准确输入该汉字,而且不会大幅增加汉 字输入的码长,从而使得汉字输入变得更为高效、规范和易用。本发明的技术方案为本发明提出了一种汉字部件拼音化的汉字输入方法,包 括(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和 合成部件,合成部件是由若干个基础部件组成的;(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(1)中,如果 在汉字分解中的若干个相邻的基础部件可组合成一个合成部件且该合成部件是成字的合 成部件,则以该合成部件而不是该若干个基础部件作为该汉字部件的有序序列的组成。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(2)中,如果 汉字部件的有序序列中存在至少四个汉字部件,则选取其中的第一汉字部件、第二汉字部 件以及末尾汉字部件。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,在步骤(1)中,对汉 字的分解遵循以下的三个原则的任意一个组合(1. a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆;(l.b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依
5字形进行无理据拆分;(1. c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(2)的确定汉字 部件的读音进一步包括(2. a)对于所有的基础部件,按照各个基础部件的主形部件确定读音;或者(2. b)对于主形部件的基础部件,按照该基础部件的主形部件确定读音,对于附形 部件的基础部件,按照该基础部件的附形部件确定读音;其中主形部件和附形部件在“信息处理用GB13000. 1字符集汉字部件规范”内的 《汉字基础部件表》中定义或依国家教育部2009年3月24日发布的《现代常用字部件及部 件名称规范》予以定义。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(3)中的汉字部 件的读音的拼音编码方式包括以下三种拼音编码方式的任意一种,组成汉字的部件有序序 列的拼音编码组合是以下三种拼音编码方式的任意一种组合全拼拼音编码;元拼拼音编码基于元拼拼音编码的部件输入包括(1)如果有声母,则输入部件 的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括134、111、厂(1、111、1、§、 k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的 英文字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者从A、E、I、0、U、 V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)如果 有辅韵母,则输入部件的辅韵母,辅韵母是i、u、11,其中辅韵母i通过键入英文字母I键输 入,辅韵母u通过键入英文字母U键输入,辅韵母U通过键入英文字母V键输入;(3)输入 部件的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、 o、u、u组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵 母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母U通过键入V键输入,多字 母元韵母通过从 B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W 以及“;”键中选择 9 个键来分别输入;元拼拼音扩展编码基于元拼拼音扩展编码的部件输入包括(1)如果有声母,则 输入部件的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、 t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键 入对应的英文字母键来输入,双字母声母从A、E、I、0、U、V键中任选三个键代表三个双字母 声母,输入代表双字母声母的单个英文字母键;(2)输入部件的韵母,韵母包括单字母元韵 母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、0、u、il组成,多字母元韵母由ai、an、 ang> ao> ei、en> eng、on g、ou 会且]^,复☆韵er> ia> ie、iao> iou、ian> in、iang> ing、 iong、ua> uo、uai> uei> uan> uen> uang> iie ^Lj^,胃中,Lfi^^ril^fiJ a> e> i> o> u fflii^A 对应的英文字母键输入,单字母元韵母U通过键入V键输入,多字母元韵母ai、an、ang、a0、 ei、en、eng、ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复 合韵母 ia、in、ian g、er、ie、iao、iou、ian、ing、uen、iie 各自通过键入 Q、ff> R、T、Y、P、Z、 X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入0键来输入,复合韵母ui通过键入V键来输入,复合韵母 ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来 输入,复合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键 来输入。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,汉字部件、基础部件、 合成部件在《信息处理用GB13000. 1字符集汉字部件规范》中定义。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,对于步骤(2)中的汉 字部件的读音的确定,如果汉字部件是成字的部件,依其汉字的发音,如果汉字部件是不成 字的部件,根据预先设定的读音确定。本发明还提出了一种汉字部件拼音化的汉字输入方法,该方法包括(1)确定汉字所归属的部首;(2)确定汉字的读音以及部首的读音;(3)依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输入汉字。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(2)中确定部首 的读音,进一步包括(2. a)对于所有的部首,都以其主部首确定读音;(2.b)对于是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其 附形部首确定读音;其中主部首和附形部首在《汉字部首表》(GF0011—2009)中定义;对于汉字部首的读音的确定,如果汉字部首是成字的部首,依其汉字的发音,如果 汉字部首是不成字的部首,根据预先设定的读音确定。根据本发明的汉字部件拼音化的汉字输入方法的一实施例,步骤(3)中汉字的拼 音编码以及部首的拼音编码,进一步包括(3. a)全拼拼音编码;(3. b)元拼拼音编码基于元拼拼音编码的汉字或部首输入包括(1)如果有声 母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括 b、p、m、f、d、t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括 zh、ch、sh,其中单字 母声母通过键入对应的英文字母键来输入,双字母声母通过键入两个对应的英文字母键输 入或者从A、E、I、0、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个 英文字母键;(2)如果有辅韵母,则输入汉字或部首的辅韵母,辅韵母是i、u、il,其中辅韵母 i通过键入英文字母I键输入,辅韵母u通过键入英文字母U键输入,辅韵母U通过键入英 文字母V键输入;(3)输入汉字或部首的元韵母,元韵母由单字母元韵母和多字母元韵母组 成,其中单字母元韵母由a、e、i、o、u、ii组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、 ong、ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元 韵母u通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、 S、R、Y、W以及“;,,键中选择9个键来分别输入;(3. c)元拼拼音扩展编码基于元拼拼音扩展编码的汉字或部首输入包括(1)如 果有声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声 母包括 b、p、m、f、d、t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括 zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过从A、E、I、0、U、V键中任 选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入汉字或 部首的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、o、 u、u iij^,ai> an> ang> ao> ei、en、eng> ong、ou iij^, Mn*er> ia>
ie> iao> iou> ian> in> iang> in g、iong、ua>uo>uai>uei>uan>uen>uang>iie 会且]^,胃中,I 字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母U通过键入V键输 入,多字母元韵母 ai、an、ang、ao、ei、en、eng、ong、ou 各自通过键入 S、D、F、G、H、J、K、L、 M键中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、iie 各自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通 过键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入0键来输入,复合韵母ui 通过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通 过键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合 韵母uan通过键入表示er的键来输入。本发明对比现有技术有如下的有益效果本发明的技术方案是将汉字按照书写顺 序分解为汉字部件的有序序列,然后选取序列中的汉字部件,确定这些汉字部件的读音,通 过输入这些汉字部件的读音的拼音编码(例如全拼拼音编码、元拼拼音编码或者元拼扩展 拼音编码等)来输入汉字。对比现有技术的仅以字音为编码依据的汉字输入方法,本发明 可以输入那些不知其发音的汉字。对比现有技术的仅以字形为编码依据的汉字输入方法, 本发明无需记忆大量的字根与键位的映射关系,使得输入变得简单有效。


图1是本发明的汉字部件拼音化的汉字输入方法的第一实施例的流程图。图2是本发明的元拼拼音输入的实施例的流程图。图3是本发明的元拼拼音扩展输入的实施例的流程图。图4A和4B是本发明的元拼拼音扩展输入的实施例的键盘示意图。图5是本发明的汉字部件拼音化的汉字输入方法的第二实施例的流程图。
具体实施例方式下面结合附图和实施例对本发明做进一步的描述。在描述实施例之前,先介绍关于本发明的一些名词解释和技术背景。本发明所涉概念与术语依据《信息处理用GB13000. 1字符集汉字部件规范》 (GF3001-1997)中定义如下笔画构成楷书汉字字形的最小连笔单位,如横(一)竖(丨)撇(j )点(、) 折(1)等。笔顺汉字书写时笔画的次序和方向。汉字部件由笔画组成的具有组配汉字功能的构字单位,如“? ^、木、寺、口 ”等。成字部件和非成字部件可以独立成字的汉字部件称为成字部件,如“另、吉、可” 中的“口,,;不能独立成字的汉字部件称为非成字部件,如“疾、病、疟”中的“广”。基础部件和合成部件最小的不再拆分的汉字部件称为基础部件,处于汉字结构的最底层,如“江”中的“? ”、“工”;有两个以上基础部件组成的汉字部件称为合成部件,如 “想”中的“相”是合成部件,由“木”和“目,,的两个基础部件组合而成。部首部件和非部首部件部首部件简称部首,部首是可以成批构字的一部分汉字 部件,字典中该部首排在该批汉字的开头,作为查字的依据,如“十”、“厂”、“匚”、“卜”等。本 发明涉及的汉字部首符合国家教育部和国家语言文字工作委员会2009年1月12日联合发 布的《汉字部首表》(GF0011-2009)规范。不作为部首的汉字部件称为非部首部件,如“央”、 “七”、“廿”等。主部首有不同写法的部首中具有代表性的书写形式。附形部首附属于主部首的书写形式,有繁体(如門、馬)、变形(如lj、?)和从 属(如曰、已、夕)三种。主形部件《汉字基础部件表》(GF3001-1997)中各组第一个部件为主形部件,该 部件选自同组部件,具有代表和称说本组部件的作用。附形部件《汉字基础部件表》(GF3001-1997)各组主形部件之后所列的相关部件 为附形部件。附形部件包括与主形部件同源,仅在书写上略有差异的部件,也包括与主形部 件形体近似的部件。本发明遵循的国家标准规范有《汉语拼音方案》、《汉字部首表》(GF0011-2009)、 《信息处理用GB13000. 1字符集汉字部件规范》(GF3001-1997)、《GB13000. 1字符集汉字部 首归部规范》(GF0012-2009)、《现代常用字部件及部件名称规范》(教育部与国家语委2009 年3月24日联合发布)。汉字是由笔画部件组成的方块文字,人们常说“弓长张、文刀刘、言午许、木子李”, 更有古人诗句“此木为柴山山出,因火成烟夕夕多”等等,表明人们对部件组成汉字结构的 朴素认识。汉字结构与字形表现为汉字部件,汉字是由汉字部件有序序列组成的集合。通过对汉字部件的深入研究和数理统计分析,发现汉字部件很多本身就是汉字, 有一些是现代已不用的古字。如《汉字部首表》201个主部首、100个附形部首共301个部 首中,成字部首195个,占比65% ;《信息处理用GB13000. 1字符集汉字部件规范》560个基 础部件中成字基础部件比例超过50%;《现代常用字部件及部件名称规范》中成字主形部件 305个,占全部514个部件的59%,占该规范441组部件的69%。结论是可以通过定义非 成字基础部件的读音音节,然后按读音的汉语拼音进行拼音化编码;对成字基础部件当然 就按成字读音进行拼音化编码;任何成字的汉字部件都按成字读音进行拼音化编码。汉字部件拼咅仆,的汉字输人方法的H一实施例图1示出了本发明的汉字部件拼音化的汉字输入方法的第一实施例的流程。请参 见图1,下面是对方法流程的详细描述。步骤S10 将汉字按照书写顺序分解为汉字部件的有序序列。汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的。如果在汉字分解中的若干个基础部件可组成一个合成部件而且这个合成部件是 成字的合成部件,则以这个合成部件而不是这若干个基础部件作为这个汉字的汉字部件的 有序序列的组成。比如,对于“想”,由于基础部件“木”和“目”组成合成部件“相”,而且“相” 是成字的合成部件,则“想”的汉字部件的有序序列是(“相”、“心”),而不是(“木”、“目”、 “心”)。
对于汉字的分解,还需遵循以下三个原则的任意一种组合(a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆(可拆成笔画)。例 子如下明_拆分为“日”、“月”(相离),名-拆分为“夕”、“口”(相接),串-不可拆分为 “中”、“中”(交重),东-不可拆分为“七”、“小”(交重)。(b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依字 形进行无理据拆分。根据字源或参考字源,从汉字的部件组合中分析出的造字意图,称为结 构理据。如,“旦”的理据是像太阳(日)从地平线(一)升起,“架”的理据是从“木”、“加” 声。理据、形与源涉及汉字学的基本知识,在此不详加描述。(c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示, 例如以字符“?”表示,也可称为万用部件。步骤S12 选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音。选取是依照书写顺序来选取的,如果一个汉字的有序序列中的汉字部件少于4 个,则选取全部的汉字部件,如果汉字部件大于等于4个,则选取其中的第一个汉字部件、 第二个汉字部件以及最后一个汉字部件。对于汉字部件的读音的确定,是以这样的方式来确定的对于所有的基础部件,按 照各个基础部件的主形部件来确定读音。或者是,对于主形部件的基础部件,按照该基础部 件的主形部件确定读音;对于附形部件的基础部件,按照该基础部件的附形部件确定读音。从是不是成字的汉字部件的角度来考虑,对于成字的汉字部件,依其成字的读音, 如果不是成字的汉字部件,依《现代常用字部件及部件名称规范》及预先设定的定义确定读 音,即a、读古音。如“ ”读“mian”,“H|j“ChU0”等;b、按笔画部件读音。如“丨”读 “shu”等;c、按俗称定义部件读音。如“乡”,俗称“绞丝旁”,读“si”或定义为“js”;d、按部 位或典型例字定义部件读音。如“口”,读“围”等。对于非成字的汉字基础部件的读音的预 设,请参见说明书中的《非成字基础部件读音定义表》。《非成字基础部件读音定义表》中的 序号和组号就是“信息处理用GB13000. 1字符集汉字部件规范”内的《汉字基础部件表》中 的序号和组号。步骤S14 依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。汉字部件的读音的拼音编码方式包括以下三种拼音编码方式的任意一种(一 )全拼拼音编码,即按照《汉语拼音方案》编码逐一输入的方式。(二)元拼拼音编码,申请人在2007年8月13日申请现已获得中国专利局授予 发明专利权的、发明名称为“一种元拼拼音汉字输入方法”、申请号为“200710044815. X”的 中国发明专利已经揭示了这种元拼拼音编码。图2示出了这种基于元拼拼音编码的输入方 法的流程,请参见图2,这种汉字(在本实施例中可以是针对部件的输入)输入包括以下步 骤(1)如果有声母,则输入汉字(或部件)的声母,声母由单字母声母和双字母声母组成, 其中单字母声母包括b、p、m、f、d、t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括 zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声母通过键入两个 对应的英文字母键输入或者从A、E、I、0、U、V键中任选三个键代表三个双字母声母,输入代 表双字母声母的单个英文字母键;(2)如果有辅韵母,则输入汉字(或部件)的辅韵母,辅 韵母是i、u、il,其中辅韵母i通过键入英文字母I键输入,辅韵母u通过键入英文字母U键 输入,辅韵母u通过键入英文字母V键输入;(3)输入汉 的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、O、U、U组成,多字母元韵母由ai、an、 ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵母a、e、i、0、u通过键入对应的英文字 母键输入,单字母元韵母U通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、 K、H、J、Q、X、Z、C、S、R、Y、W以及“;”键中选择9个键来分别输入。(三)元拼拼音扩展编码,申请人提交的发明名称为“一种汉字元拼拼音扩展输入方法”的中国发明专利申请揭示了这种元拼拼音扩展编码的技术方案。图3示出了这种基 于元拼拼音扩展编码的汉字(在本实施例中可以是针对部件的输入)输入方法的流程。请 参见图3,方法包括(1)如果有声母,则输入汉字(或部件)的声母,声母由单字母声母和 双字母声母组成,其中单字母声母包括13、?、111、厂(1、111、14、1^11、」、9、1、2、(3、8、^, 双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文字母键来输入,双字母声 母通过从A、E、I、0、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个 英文字母键;(2)输入汉字(或部件)的韵母,其中韵母包括单字母元韵母、多字母元韵母 和复合韵母,单字母元韵母由a、e、i、O、U、U组成,多字母元韵母由ai、an、ang、ao、ei、en、 eng、ong、ou ,复☆韵er> ia> ie> iao> iou、ian> in、iang> ing> iong、ua> uo、uai> uei、uan、uen、uang、Ue组成,其中,单字母元韵母a、e、i、0、u通过键入对应的英文字母键 输入,单字母元韵母U通过键入V键输入,多字母元韵母ai、an、ang、ao、ei、en、eng、ong、 ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母ia、in、 iang、er、ie、iao、iou、ian、ing、uen、Ue 各自通过键入 Q、W、R、T、Y、P、Z、X、C、B、N 键中的 一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输入,复合 韵母uo通过键入O键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过键入表 示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复合韵母 uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。图4A和 4B分别示出了两种元拼拼音扩展输入的键盘设置。汉字部件拼咅化的汉字输人方法的Il二实施例图5示出了本发明的汉字部件拼音化的汉字输入方法的第二实施例的流程。请参 见图5,下面是对本实施例的方法流程的详细描述。步骤S20 确定汉字所归属的部首。步骤S22 确定汉字的读音以及部首的读音。对于部首读音的确定,遵循以下方式对于所有的部首,都以其主部首来确定读 音。或者是对是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其附形部 首确定读音。成字部首的读音编码按成字拼音确定。非成字部首依《现代常用字部件及部件名 称规范》及预先设置的定义来确定,S卩a、读古音。如“ ”读“111化11”,“1_”读“(^110”等;b、 按笔画部件读音。如“丨”读“Shu”等;C、按俗称定义部件读音。如“乡”,俗称“绞丝旁”, 读“Si”或定义为“js”;d、按部位或典型例字定义部件读音。如“ 口”,读“围”等。非成字 部首读音定义见说明书中的《非成字部首读音定义表》。《非成字部首读音定义表》中的每 一个部首前方的序号就是《汉字部首表》中的序号。步骤S24:依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输 入汉字。
汉字及汉字部首的读音的拼音编码方式包括以下三种拼音编码方式的任意一种 全拼拼音编码、元拼拼音编码、元拼拼音扩展编码。这些拼音编码均在第一实施例中详细描 述,在此不再赘述。非成字基础部件读音定义表序号组号部件例字部件拼音1部件拼音222 — 旦heng yi43 (ν) 兑ba64 (水) 亲mu105 (曰) 冒ri168 * 草cao179 \ 仁ren1810 ? 河shui san2011 (冃) 青yue2211 (夕) 炙yue2412 川、 然huo biao2613 (韦) ^jin2916 纟 红mi si3016 (糸) 紅mi si3116 (糸) 紫mi si3216 (幺) 丝mi si3517 (30 攻pu wen3617 (欠) 冬zhi dong3717 (文) 夏zhi sui4119 ( t ) 切qi bi4319 ( b ) 顷qi bi44 19 (七) 化qibi45 19 ())北qibei47 20 (之)祭you48 21 丄亩tou51 23 (出)延zhi52 23 (Ab)足zhizu55 24 ^ 提shouti57 26 争dao58 27 ^ 宝mianbao59 28 主dianzhu60 29 j 么pie62 30 (i ) 论yan63 31 “ 军mijun66 34 门 同jiongtong67 34 (jl) 周jiongtong68 34 (“) 奂jiongtong69 35 ^ 前qian71 37 厶 私si74 39 勹 包bao76 40 () 恭xingong
78 41( )肖xiao79 42^阳都fuyi82 45岛niao83 45( %)鳥niao85 46(净)补yi86 46(农)哀yi87 47;卜快xinshu88 48—隹zhui90 49()笑zhu92 511_进chuo zou96 55口国weiguo99 57Ij另ljdao100 57( j )班dao10 157( 1| )师dao102 57( [| )临dao105 59(m)罗siwang106 6每mei ren110 64乂义yicha111 65tjJ马ma112 65(弓)馬ma115 68大左zuo118 70(彳)祖shi ci121 72-τ-页ye12875( Ei )仓jie ji12975(己)改ji13175( P )顾jie ji13477(妥zhao zhua13578彡彩san shan13980广病ne bing14282( )占bu14483(羊)玲yang14583羔yang146847冰bing14784( ^ )冬bing14985(3c)尤you15187豸狗quan15288φ半ban15388(去)判ban15589(生)告niu15690U凶kan qian15993号kao ding16093(~J)可kao ding16194共gong
16396升弄gong16597欠qian dao
16698^买zhe16798( ~7 )今zhe16899彳很chi173103(食)飽shi174103(亇)饭shi177105(<]<)泰shui178105( )犀shui180106虫青qing181107产hu182108L?Lzhe183108( J-)甚zhe185109(^c)彖shi186109(豕)啄shi chu189111( ;IL)chuan huang190111(((O巡chuan guai192111( )粦《chuan guai194112(歹)开gan jian195113匚区fang xi196113(Π)Πfang xi198114(輋)書yu shu199114(举)肅yu su200114(+)肃yu su201114(圭)盡yu su202114(甯)庸yu yong204114(f)隶yu su206115(商)要xi yao207115(而)而xi ya211118(艮) 艮口gen212119彐雪ji213119(丑)录ji Iu216120)邦feng222123(戌)越wu yue223124老Iao226127屮艸cao che227127(少)逆cao che228128ψ夕牛chuan231129(戶)所hu suo233131ιχ丧sang wei234131(氏)旅Iv pai235132[旧shu gun236132(J)寧shu gun241134(县)肆zhang chang242135夕 勿 wu pie243136V令ling yong
245138^s 鹿Iu246139P 节jie247139(卩)报jie
251141(冊)扁ce bian252142典骨gu253142(ft)gu guo254143厂 反chang fan256145宜其qi266152几 风ji feng268154廿 度nian269155曲 寒gou han277163Ji 齐dao278163(JI) 渊dao279164石 至zhi283167建yin ting286168(毋) 贯wu guan289170(手) 拜shou290171> < 率Iv292172(J) 龍long293173八 登bo deng295175旦 具ju296176片 将jiang zhuang297176(爿) 诚jiang pan298177早 单dan shan304183、、‘ 学xue xiao305184^fa. 韋wei307185夹 春chun314191^a 會hui318194少步bu ta319195βσ 留Iiu320195(评)柳Iiu323196采 番bian325198Pi 學xue jiu330200| 殷yin shen332202兄 免mian334203兼 兼jian336204(东)拣jian338206司zhe340208办 亦yi341208变yi bian342209/r 临zhu344210(电)電dian347212互 彖ji zhu348213^ k-bei350215与与yu
355218m,鼠shu356219豸f勺zhi chai358221自#fu dui359222无既wu ji366228亩惠hui367229夕亥jiu368230ff^両Iiang370232T鬲geyuan371233宙婁Iou3762383假fang ju382244弔Hdiao di384246丌鼻ji bi385247月齊qidao386248广眉mei shi387249目官guan389251、久dian390252敢zhe392254肉离 Ii394256Φ争zheng395257港敝bi399260(氐)齊dao qi400261%沈yin shen403263 f假jia xia404264 H囬hui405265夬决guai jue406266里堇jin410270jj}(淵yuan411271尸倉cang415274由叟sou421278冊無wu422279糸鹵 Iu425282 ,绳meng min426283^卯mao427284苗曹cao430286举華hua431287"Ii虱zhe432288夕匆 cong435290("“1*)带sadai436290( ^ki )带sadai439292戈尧yao442294易杨yang yi445295或 jian yu446296巧乌 wu447296(号)烏 wu448297M刺 ci
449298血典dian451300-侯hou452301χ劲jing453302走捷jie456305f*农nong459308奠漢han460309匁黎Ii
463312L]丧jiu465314市囊nang470318;m憂you471319B疟nve472319( ^ )印yin nve474 320市沛fu476321宙妻qi477320|段duan478323^颐yi483325夕餐dai can489331£兜dao490332/<丞cheng491333佳卸xie493335])以yi495337臾庚geng496338伟制zhi499340^H鼎ding500341母衰shuai502342%姊zi505345來聚ju506346地戢ji509349夂夜ye512352尸发fa518357丐沔mi an519358男那na527365卯聯guan528366志$qian531368栽羲xi533370臭xie538374t甩shuai539375HI繭jian540376pj临ri548382壺hu557390某棄qi559392g弼bitian非成字部首读音定义表一画1 一heng
2 [shu2(J) shu3 jpie4 、dian5 ιzhe二画8 匚fang9(H)bu22(Ij) dao10 门jiong12(4) ren[7](厂)chang22()dao10(门)jiong13 勹bao16(/^)」 17tou18 7bing11(ν)ba19 “mi166(卞)yan20 Ukan21 Pjie175(P左)fu159(P右)yi25 厶si26yin21(a)jie三画80(孑)shou30 廿cao32 升gong34 尤you36()xiao38 口wei41 彳chi42 彡shan66(豸) quan
44^-zhi185(亇)shi45jiang77(?)shui98(个)xin48 山mi an49 1_chuo50 彐ji50("^)ji55 屮che55(少)che50(互)ji148(纟)si60 {((chuan四画123(少)Iao64(水)mu68($)che62(无)ji74 支pu98()xin[75]( )ri88(冃)yue80(产)shou79(砵)niu74(夂)pu86(幻)zhao92 殳shu95(川、)huo100(彳)shi145(肀)yu45(爿)pan五画67(夕)dai77(;>_(<) shui107 mwang176(韦)jin
115 广ne142(净)yi145(^")yu118(JB) shu118 AEshu120 八bo
六画126(而)xi126 面 xi130 严hu135(斤斤)zhu[143](羊)yang[143] ( )yang30(艸)cao148 糸mi148(糸)mi七画[83](县) zhang158(足)zu136(E3)jiu[49](楚) chuo161 采bian163 豸zhi画169 車 chao173 黾meng185(食)shi十画188 髟biao189 鬲ge173meng上述实施例是提供给本领域普通技术人员来实现或使用本发明的,本领域普通技 术人员可在不脱离本发明的发明思想的情况下,对上述实施例做出种种修改或变化,因而 本发明的保护范围并不被上述实施例所限,而应该是符合权利要求书提到的创新性特征的 最大范围。
权利要求
一种汉字部件拼音化的汉字输入方法,包括(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的;(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。
2.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(1) 中,如果在汉字分解中的若干个相邻的基础部件可组合成一个合成部件且该合成部件是成 字的合成部件,则以该合成部件而不是该若干个基础部件作为该汉字部件的有序序列的组 成。
3.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(2) 中,如果汉字部件的有序序列中存在至少四个汉字部件,则选取其中的第一汉字部件、第二 汉字部件以及末尾汉字部件。
4.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,在步骤(1) 中,对汉字的分解遵循以下的三个原则的任意一个组合(l.a)对汉字进行汉字部件的拆分时,相离、相接可拆,交重不拆;(l.b)字形符合理据时,进行有理据拆分,无法分析理据或字形与字源矛盾的,依字形 进行无理据拆分;(1. c)对于没有定义的汉字部件或者用户无法确定的汉字部件,以一特定符号表示。
5.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,步骤(2)的确 定汉字部件的读音进一步包括(2. a)对于所有的基础部件,按照各个基础部件的主形部件确定读音;或者(2. b)对于主形部件的基础部件,按照该基础部件的主形部件确定读音,对于附形部件 的基础部件,按照该基础部件的附形部件确定读音;其中主形部件和附形部件在“信息处理用GB13000. 1字符集汉字部件规范”内的《汉字 基础部件表》中定义或依国家教育部2009年3月24日发布的《现代常用字部件及部件名 称规范》予以定义。
6.根据权利要求1所述的汉字部件拼音化的汉字输入方法,其特征在于,步骤(3)中的 汉字部件的读音的拼音编码方式包括以下三种拼音编码方式的任意一种,组成汉字的部件 有序序列的拼音编码组合是以下三种拼音编码方式的任意一种组合全拼拼音编码;元拼拼音编码基于元拼拼音编码的部件输入包括(1)如果有声母,则输入部件的声 母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、1、g、k、 h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应的英文 字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者从A、E、I、0、U、V键中 任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)如果有辅 韵母,则输入部件的辅韵母,辅韵母是i、u、il,其中辅韵母i通过键入英文字母I键输入,辅 韵母u通过键入英文字母U键输入,辅韵母U通过键入英文字母V键输入;(3)输入部件的 元韵母,元韵母由单字母元韵母和多字母元韵母组成,其中单字母元韵母由a、e、i、o、u、u 组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母U通过键入V键输入,多字母元韵母 通过从 B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、W 以及“;”键中选择 9 个键来分 别输入; 元拼拼音扩展编码基于元拼拼音扩展编码的部件输入包括(1)如果有声母,则输入 部件的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、m、f、d、t、n、 1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括zh、ch、sh,其中单字母声母通过键入对应 的英文字母键来输入,双字母声母从A、E、I、0、U、V键中任选三个键代表三个双字母声母, 输入代表双字母声母的单个英文字母键;(2)输入部件的韵母,韵母包括单字母元韵母、多 字母元韵母和复合韵母,单字母元韵母由a、e、i、0、u、il组成,多字母元韵母由ai、an、ang、 ao> ei、en> eng> ong、ou 组成,复☆韵母由 er> ia> ie、iao> iou、ian> in、iang> ing、iong、 ua> uo> uai > uei > uan> uen> uang> ue iij^, a>e> i> o> u ilil^AX^W英文字母键输入,单字母元韵母U通过键入V键输入,多字母元韵母ai、an、ang、a0、ei、en、 eng. ong、ou各自通过键入S、D、F、G、H、J、K、L、M键中的一个不同的按键来输入,复合韵母 ia、in、iang、er、ie、iao、iou、ian、ing、uen、iie 各自通过键入 Q、ff> R、T、Y、P、Z、X、C、B、 N键中的一个不同的按键来输入,复合韵母iong通过键入表示多字母元韵母ong的键来输 入,复合韵母uo通过键入0键来输入,复合韵母ui通过键入V键来输入,复合韵母ua通过 键入表示复合韵母ia的键来输入,复合韵母uai通过键入表示复合韵母in的键来输入,复 合韵母uang通过键入表示iang的键来输入,复合韵母uan通过键入表示er的键来输入。
7.根据权利要求1 6所述的汉字部件拼音化的汉字输入方法,其特征在于,汉字部 件、基础部件、合成部件在《信息处理用GB13000. 1字符集汉字部件规范》中定义。
8.根据权利要求1 6所述的汉字部件拼音化的汉字输入方法,其特征在于,对于步 骤(2)中的汉字部件的读音的确定,如果汉字部件是成字的部件,依其汉字的发音,如果汉 字部件是不成字的部件,根据预先设定的读音确定。
9.一种汉字部件拼音化的汉字输入方法,该方法包括(1)确定汉字所归属的部首;(2)确定汉字的读音以及部首的读音;(3)依序输入汉字的读音的拼音编码以及部首的读音的拼音编码,从而输入汉字。
10.根据权利要求9的汉字部件拼音化的汉字输入方法,其特征在于,步骤(2)中确定 部首的读音,进一步包括(2. a)对于所有的部首,都以其主部首确定读音;(2.b)对于是主部首的部首,以其主部首确定读音,对于是附形部首的部首,以其附形 部首确定读音;其中主部首和附形部首在《汉字部首表》(GF0011—2009)中定义;对于汉字部首的读音的确定,如果汉字部首是成字的部首,依其汉字的发音,如果汉字 部首是不成字的部首,根据预先设定的读音确定。
11.根据权利要求9的汉字部件拼音化的汉字输入方法,其特征在于,步骤(3)中汉字 的拼音编码以及部首的拼音编码,进一步包括(3. a)全拼拼音编码;(3.b)元拼拼音编码基于元拼拼音编码的汉字或部首输入包括(1)如果有声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包括b、p、 m、f、d、t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括 zh、ch、sh,其中单字母声母 通过键入对应的英文字母键来输入,双字母声母通过键入两个对应的英文字母键输入或者 从A、E、I、0、U、V键中任选三个键代表三个双字母声母,输入代表双字母声母的单个英文字 母键;(2)如果有辅韵母,则输入汉字或部首的辅韵母,辅韵母是i、u、il,其中辅韵母i通过 键入英文字母I键输入,辅韵母u通过键入英文字母U键输入,辅韵母U通过键入英文字母 V键输入;(3)输入汉字或部首的元韵母,元韵母由单字母元韵母和多字母元韵母组成,其 中单字母元韵母由a、e、i、o、u、ii组成,多字母元韵母由ai、an、ang、ao、ei、en、eng、ong、 ou组成,其中,单字母元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母11 通过键入V键输入,多字母元韵母通过从B、P、M、F、D、T、N、L、G、K、H、J、Q、X、Z、C、S、R、Y、 W以及“;”键中选择9个键来分别输入;(3. c)元拼拼音扩展编码基于元拼拼音扩展编码的汉字或部首输入包括(1)如果有 声母,则输入汉字或部首的声母,声母由单字母声母和双字母声母组成,其中单字母声母包 括 b、p、m、f、d、t、n、1、g、k、h、j、q、x、z、c、s、r、y、w,双字母声母包括 zh、ch、sh,其中单 字母声母通过键入对应的英文字母键来输入,双字母声母通过从A、E、I、0、U、V键中任选三 个键代表三个双字母声母,输入代表双字母声母的单个英文字母键;(2)输入汉字或部首 的韵母,韵母包括单字母元韵母、多字母元韵母和复合韵母,单字母元韵母由a、e、i、0、u、U iij^,ai> an> an g、ao> ei、en、eng、ong、ou iij^, Mn*er> ia> ie、iao> iou> ian> in> iang> ing> iong、ua> uo> uai> uei> uan> uen> uang> iie 会且]^,胃中,L^J 元韵母a、e、i、o、u通过键入对应的英文字母键输入,单字母元韵母U通过键入V键输入, 多字母元韵母 ai、an、ang、ao、ei、en、eng、ong、ou 各自通过键入 S、D、F、G、H、J、K、L、M 键 中的一个不同的按键来输入,复合韵母ia、in、iang、er、ie、iao、iou、ian、ing、uen、iie各 自通过键入Q、W、R、T、Y、P、Z、X、C、B、N键中的一个不同的按键来输入,复合韵母iong通过 键入表示多字母元韵母ong的键来输入,复合韵母uo通过键入0键来输入,复合韵母ui通 过键入V键来输入,复合韵母ua通过键入表示复合韵母ia的键来输入,复合韵母uai通过 键入表示复合韵母in的键来输入,复合韵母uang通过键入表示iang的键来输入,复合韵 母uan通过键入表示er的键来输入。
全文摘要
本发明公开了一种汉字部件拼音化的汉字输入方法,可以在不知道欲输入汉字的发音的情况下仍然能够准确输入该汉字,而且不会大幅增加汉字输入的码长。其技术方案为方法包括(1)将汉字按照书写顺序分解为汉字部件的有序序列,汉字部件分为基础部件和合成部件,合成部件是由若干个基础部件组成的;(2)顺序选取汉字部件的有序序列中的汉字部件,并确定每个汉字部件的读音;(3)依序输入选取的汉字部件的读音的拼音编码,从而输入汉字。本发明应用于汉字的输入。
文档编号G06F3/023GK101825949SQ20091005262
公开日2010年9月8日 申请日期2009年6月5日 优先权日2009年6月5日
发明者王林 申请人:王林
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1