计算机音形汉字输入法的制作方法

文档序号:6411934阅读:201来源:国知局
专利名称:计算机音形汉字输入法的制作方法
技术领域
本发明涉及一种计算机汉字输入法。尤其与根据汉字构件的音和形编码输入计算机的方法有关。
已有的计算机音形汉字输入法,将汉字拆分成构件单元,构件可以是汉字或部首,一个汉字的构件数目为3个以下(包括3个)。由于汉字的构成有既不是汉字,又不是部首的独立完整部分,有的汉字难于拆分。
取码规则是将汉字笔画制成《笔画次序表》,共有18种笔画。笔画的种类较多。
将汉字构件取其读音的第一个字母为该构件的语音码元,而部首构件有读音的则取其读音的第1个字母为该构件的语音码元,有名称无读音的参照其名称给其指定语音码元,对于少部分名称不为人熟知的部首则规定其语音码元为特定同一字母。这样制成的《汉字部首读音、语音码表》结构复杂,码元太多,记忆和使用较难。
编码规则是汉字和词编成四码输入。单构件汉字的编码依次为字的音码,字的第一形码,字的第二形码,字的第三形码,二构件汉字的编码依次为第一构件的音码,第一构件的形码,第二构件的音码,第二构件的形码。三构件汉字的编码依次为第一构件的音码,第一构件的形码,第二构件的音码,第三构件的音码。由于编码数量较少,容易出现重码。
本发明的目的是提供一种符合汉字造字规律,符合中国人使用汉字的习惯,方法简单,便于普及,使用方便,而重码少的计算机音形汉字输入法。
本发明是这样实现的本发明以汉语拼音的首字母(音码)和汉字的笔画(形码),为基本单元,每一个基本单元被赋予一个输入键,每个汉字可由三至五个代表首字母和笔画的输入键串组成,其方法如下a.将汉字按形拆分成构件单元,其方法如下①构件基本单元必须是汉字或部首或不定构件(即不是汉字或部首的汉字中的一个独立、完整的组成部分),一个字只允许取一个不定构件,此外,凡一个字可以取现代汉字或部首为第一构件和第三构件者,其中间部份可作为一个不定构件处理,②一个汉字只能完整地分成二个或三个构件单元,汉字拆分后不能有多余的笔化,构件之间笔画不能交叉或共用一笔,也可以不拆分,为单构件字。
③一个汉字的构件拆分顺序如下能否拆成不含不定构件的三构件字,否,则能否拆成不含不定构件的二构件字,否,则能否拆成含不定构件的三构件字或含不定构件的二构件字,否,则为单构件字。
④按字的书写顺序分第一构件、第二构件,第三构件,以每个构件末笔为准排列书写顺序。
b.取码规则一、音码规则①凡构件是汉字或与现代汉字同形的部首者,取其读音的首字母为该构件的音码。
②凡构件是不与现代汉字同形的部首者,选取其中一部分常用部首,给定读音首字母,作为该构件的音码。
③凡②中未选取的不与汉字同形的部首,则一律以同一拼音字母作为该构件的音码。
④不定构件以待输入汉字读音的首字母为其音码,二、形码规则将汉字的笔画按在汉字中出现的频率不同,由低到高整理,归纳成笔画序表。
构件所有的笔画中,其在笔画序中列为最前者为该构件的第一形码,列于次前者为该构件的第二形码,依此类推,按此规则归纳的笔画序表中笔画的排列次序与汉语教科书中笔画的排列次序恰相反所以这一规则又称为逆序取码法,c.编码规则
一、单个汉字三至五码键入。
①三构件字编码依次为第一构件音码,第一构件的第一形码,第二构件音码、第三构件音码、第二、三构件的所有笔画中在笔画序表中列于最前者代表的形码。
②二构件字编码依次为第一构件音码,第一构件第一形码,第二构件音码,第二构件第一形码,第二构件第二形码。
③单构件字编码依次为字的音码、字的第一形码、字的第二形码,字的第三形码,字的第四形码,④如果一个字不足五码则输入该字的码后,按一次空格键即表示该字输入已完成。
⑤如果一个字虽有五码但不需五码即可确定,则可以输入五码也可以在输入确定该字的码后按一次空格键,完成输入。
二、一字可对应多组编码键入,有利于同形不同读音字的输入,个别有两种拆分形式的字的输入,以及不同文化水平的使用者编码可能有所不同的字的输入,三、词的输入,以四码或五码键入,①二字词的编码依次为第一字的音码,第二字的音码,第一字的第一构件音码,(单构件字用该字音码)第二字的第一构件音码(单构件字用该字音码),空格键。
②三字词的编码依次为第一字音码,第二字音码,第三字音码,空格键。
③多字词的编码依次为第一字音码,第二字音码,第三字音码,最后一字音码,N键。
本发明利用计算机英文键盘的键分别与音码和形码相对应。
本发明的笔画序表如下
本发明选取的不与汉字同形的部首给定读音首字母如下表所示
凡上表中未注明的非现代汉字部首一律以字母O表示。本发明中计算机英文键盘的键位与对应的首字母和笔画的关系如下表
本发明规定如果构件是九年制义务教育语文课本中未有的汉字,可以以字母a代替该构件读音的首字母编码。
本发明的优点如下所述(一)极易学会使用而且重码率极低。这是由于(1)码元极少而且是一般用户所熟悉的汉字读音和字形最基本的特征——首字母和笔画。
(2)编码基于最广大的构件基础上却完全不必记住构件。构件的认定也很简单明确,只要是现代汉字或部首就可以作为构件。非限定构件认定是汉字(取构件信息)编码中一个难题,这一问题近于完善的解决得力于字的拆分规则和“不定构件”的运用。特别是“不定构件”是本发明的一个有价值的创造。规定“不定构件”所在汉字的读音的首字母为“不定构件”的音码既方便用户使用又有效地减少重码。
(3)部首是组成汉字的常用的构件。非字部首的读音至今未有统一规范,一些部首读音为许多人不熟悉。本发明只规定了一些最常见的非字部首如《氵》《扌》《亻》《》等的读音。而且所规定的读音是与这些部首的通俗名称是一致的,如《氵》读《shuǐ》《扌》读shǒu《亻》读《rèn》《》读《zh ú》等,其余的非字部首的音码一律规定为《0》使用户学习和使用都不感到困难。
(4)使用笔画作为码元比使用字根作为码元容易学习掌握。但众所周知使用笔画作码元异化重码能力低。提高笔画作为码元的异化重码能力得力于本发明另一个有价值的创造——笔画序表。它直接提取构件中最有代表性笔画作为形码,有效地提高了异化重码能力。
(二)普及面广而且初中以上文化水平的用户都能够使用它不困难地输入国家标准GB2312-80所规定的6763个汉字。这是由于(1)使用本发明所涉及的语文的知识包括汉语拼音首字母、汉字笔画、常用汉字、部首都是有初等语文知识的用户已熟悉知的。
(2)汉语拼音首字母f与h、l与n、c与ch、s与sh、z与zh兼容充分考虑了部分用户地方口音及读音不准的语音缺憾。
(3)超过初中语文教本的汉字允许以《a》为音码充分照顾到部分用户的知识水平。
(4)一字对应多组编码充分兼顾了不同语文知识层次的用户编码可能产生的差异。如《栈》字本应是不含“不定构件”的二构件字。有的用户不知《戋》是一个字,按“不定构件”处理。以《栈》字音码《Z》作为《戋》的音码,仍可编码输入。如果用户连《栈》字也不认识可以《a》为《栈》的音码也可编码输入。
(三)规范性好(1)编码方法符合汉字造字规律,符合中国人使用汉字的习惯,没有生造的构件。
(2)所涉及的字集、汉语拼音字母、汉字笔画、部首都符合国家标准或国家语委的推荐使用标准。其中汉语拼音首字母、汉字笔画、部首读音都符合语文教本或语文教学参考材料。
如下是本发明的附图

图1为本发明的笔画序表。
图2为本发明的常用非汉字部首读音首字母表。
图3为本发明的计算机英文键盘的键名与笔画序表中的笔划和首字母对应表。
如下是
具体实施例方式笔画序表如图1所示。
常用非汉字部首读音首字母表如图2所示。
计算机的键盘英文键名与笔画和首字母的对应表如图3所示表2中的首字母21个,表1中的笔画16个,共37个码元,一码元对应一个键共用37个键。
(1)不含“不定构件”的三构件字输入例字“碧”拆分为“王”“白”“石”,均为汉字构件。音码为其读音首字母。形码按图(1)。
编码W1bS对应计算机键名串WHBS0(2)不含“不定构件”的二构件字输入例字“杉”拆分为
“彡”,其中
为与汉字“木”同形的部首,下表是图4的书写单元图与图1键盘图之间的键和笔划的对应关系。g-横横11,f-横竖12,d-横撇13,s-横点14,a-横折15;h-竖横21,j-竖竖22,k-竖撇23,l-竖点24,m-竖折25;t-撇横31,r-撇竖32,e-撇撇33,w-撇点34,q-撇折35;y-点横41,u-点竖42,i-点撇43,o-点点44,p-点折45;n-折横51,b-折竖52,v-折撇53,c-折点54,x-折折55。沿用当前的习惯,以上的各键设定在小写状态时才是汉字输入状态。除了好记忆的原则之外,还有使用频率的原则,将使用频率高的书写单元放在容易击键的位置。如果简单地按照笔划顺序敲书写键,重码必定会很多,有的汉字变旁已经超过八划,所以减少重码的关键是合理地安排每一次书写键。本汉字输入编码采用了优先权规则。书写键不是简单地按书写顺序键入,而是将汉字分为“字块”,按照大块、小块(孤小块和连小块)、补键三个层次设定每次输入键的优先权。孤小块是与周围的笔划完全分离的小块,如“磔”字右大块中的三小块,连小块是与周围笔划有相连之处的小块,如“磔”字石旁的“口”;减少重码的另一条措施是将某些高频部首如(口、木、扌、艹、钅)等单独设特定键。设定优先权和特定键的规定可以根据编码者的想法变化,所以优先权和特定键的规定可以有很多种。除了笔序码的编码方法外,可以在“一键等于书写两笔”的方法基础上建立许多编码法,无法穷举。</claim><claim>2、根据权利要求1所述的汉字输入编码法,其进一步的特征是“笔序码”的编码方法,在“一键等于书写两笔”的方法基础上,笔序码的优先规则为大小、孤连、远近。优先权层次为大块、孤小块、连小块、补笔,层次相同判远近。第一个层次是按书写顺序每大块书写一键,书写每大块的头两笔(某些情况下一键只表示一笔,如用与“11”对应的键书写“西、酉、甫”等字块的笔划“一”)。对于大块的规定是“宽字竖对齐,长字横对齐”。如宽字“微”根据竖对齐的规则,可以分为左中右三个大块,“微”字中的“
”作大块处理;长字“蔡”可分为上中下三个大块,
作大块处理。第二个层次是书写小块,采用“先孤后连”和“就近”的原则,先孤后连的定义是孤小块优先于连小块,如“磔”字的右大块中的(木、夕、
)<p>编码T丨丨对应计算机键名串T00HH(6)一字五码以下输入例字“一”因为该字只有两码,所以后加按空格键“ㄩ”表示该字输入完成。
编码Y—对应计算机键名串YVㄩ(ㄩ——空格键,下同)例字鑫编码j丷JJ丷对应计算机键名串J一JJ—因为输入前三码J-J之后,提示行已提示该字已被唯一地确定,所以可以继续键入其余二码,也可以不键入其余二码而按一下空格键《ㄩ》表示该字已完成输入。
(7)二字词输入例“说明”编码SMYR对应计算机键名串SMYRㄩ(8)三字词输入例“说明书”编码SMS对应计算机键名串SMSㄩ(9)多字词输入例“权利要求书”编码QLYSN-对应计算机键名串QLYSN
权利要求
1.一种计算机音形汉字输入法,其特征在于以汉语拼音的首字母(音码)和汉字的笔画(形码)为基本单元,每一个基本单元被赋予一个输入键,每个汉字可由三至五个代表首字母或笔画的输入键串组成,其方法如下a.将汉字按形拆分成构件单元,其方法如下①构件基本单元必须是汉字或部首或不定构件(即不是汉字或部首的汉字中的一个独立、完整的组成部分),一个字只允许取一个不定构件,此外,凡一个字可以取现代汉字或部首为第一构件和第三构件者,其中间部份可作为一个不定构件处理,②一个汉字只能完整地分成二个或三个构件单元,汉字拆分后不能有多余的笔画,构件之间笔画不能交叉或共用一笔,也可以不拆分,为单构件字。③一个汉字的构件拆分顺序如下能否拆成不含不定构件的三构件字,否,则能否拆成不含不定构件的二构件字,否,则能否拆成含不定构件的三构件字或含不定构件的二构件字,否,则为单构件字。④按字的书写顺序分第一构件、第二构件,第三构件,以每个构件末笔为准排列书写顺序,b.取码规则一、音码规则①凡构件是汉字或与现代汉字同形的部首者,取其读音的首字母为该构件的音码。②凡构件是不与汉字同形的部首者,选取其中一部分常用部首,给定读音首字母,作为该构件的音码。③凡②中未选取的不与汉字同形的部首,则一律以同一拼音字母作为该构件的音码。④不定构件以待输入汉字读音的首字母为其音码,二、形码规则将汉字的笔画按在汉字中出现的频率不同,由低到高整理,归纳成笔画序表。构件所有的笔画中,其在笔画序中列为最前者为该构件的第一形码,列于次前者为该构件的第二形码,依此类推,c.编码规则一、单个汉字三至五码键入。①三构件字编码依次为第一构件音码,第一构件的第一形码,第二构件音码、第三构件音码、第二、三构件的所有笔画中在笔画序表中列于最前者代表的形码。②二构件字编码依次为第一构件音码,第一构件第一形码,第二构件音码,第二构件第一形码,第二构件第二形码。③单构件字编码依次为字的音码、字的第一形码、字的第二形码,字的第三形码,字的第四形码,④如果一个字没有五码则输入该字的码后,按一次空格键即表示该字输入已完成。⑤如果一个字虽有五码但不需五码即可确定,则可以输入五码也可以在输入确定该字的码后按一次空格键,完成输入。二、一字可对应多组编码键入,有利于同形不同读音字的输入,个别有两种拆分形式的字的输入,以及不同文化水平的使用者编码可能有所不同的字的输入,三、词的输入。以四码或五码键入,①二字词的编码依次为第一字的音码,第二字的音码,第一字的第一构件音码,(单构件字用该字音码),第二字的第一构件音码(单构件字用该字音码),空格键。②三字词的编码依次为第一字音码,第二字音码,第三字音码,空格键。③多字词的编码依次为第一字音码,第二字音码,第三字音码,最后一字音码。N键
2.根据权利要求1所述的计算机音形汉字输入法,其特征在于利用计算机英文键盘的键分别与音码和形码相对应。
3.根据权利要求2所述的计算机音形汉字输入法,其特征在于所说的笔画序表如下
4.根据权利要求2或3所述的计算机音形汉字输入法,其特征在于所选取的不与汉字同形的部首给定读音首字母如下表所示
凡上表中未注明的非现代汉字部首一律以字母O表示。
5.根据权利要求4所述的计算机音形汉字输入法,其特征在于计算机英文键盘的键与对应的首字母和笔画的关系如下表
6.根据权利要求5所述的计算机音形汉字输入法,其特征在于如果待输入汉字构件是九年制义务教育语文课本中未有的汉字,可以以字母a代替该字读音的首字母编码。
全文摘要
本发明为一种计算机音形汉字输入法。以汉语拼音的首字母和汉字的笔画为基本单元,一个基本单元被赋予一个输入键,每个汉字可由三至五个代表首字母和笔画的输入键串组成,其方法是首先将汉字按形拆分成构件单元。制定笔画序表,常用部首读音字母表,根据音码规则取构件的音码。根据形码规则取构件的形码,根据编码规则将汉字用音码、形码表示,再用与音码、形码对应的计算机键盘英文键名输入计算机。
文档编号G06F3/023GK1175724SQ9710739
公开日1998年3月11日 申请日期1997年3月17日 优先权日1996年8月23日
发明者邓仁 申请人:邓仁
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1