归类码汉字输入法的制作方法

文档序号:6410742阅读:228来源:国知局
专利名称:归类码汉字输入法的制作方法
技术领域
本发明涉及电脑输入系统,是一种利用英文字母和标点符号作为汉字和词组编码的汉字输入法。
现流行的汉字输入法,比如五笔字型,其规范性较好,重码率低,但对于大多数人来说,比较不易学,键面布置的字根不易记忆,如M键(山由贝冂骨几),不仅要背诵“山由贝,下框几”,还要强化记忆,无规律可言。自然码是一种拼音+形的输入法,对于不会拼音的人就无法输入。此外,全形码输入与音+形输入方式互不兼容,需换挡操作,影响输入速度。
本发明是针对上述编码地局限性,提供一种重码率低、易拆分、输入速度快的汉字编码。
本发明的目的是按下述方案实现的
利用标准英文键盘26个字母键和4个标号键对汉字及汉语拼音进行编码。
a、将汉字的笔画定义为五种点、横、撇、竖、折,并规定捺、提、极短撇归入点,所有带转折的线段归入折;确认组成汉字的笔画之间的关系为散、连、交。
b、优选出178个组字能力强的笔画结构组成字根系统,并且规律有序地布置在标准英文键盘的26个字母键上,上、中、下三排字母键依次对应的首字根为乙上人一广文土禾业了(上排),又之门寸七石弓氵辛(中排),刀几月口日田也(下排);每个字母键代表若干个字根(如图3所示)。
c、定义“定根单元”概念,即把字根与字根以连、交形式组成的整体型的汉字结构叫做字根单元。
d、确定汉字的结构类型为四种,即上下型、左右型、半围型和整体型,分别用F、G、H、J四键代表。
e、汉字的取码采用分类取码,针对上下、左右、半围型汉字,整体型汉字和字根汉字采用不同取码方法。在拆分字根单元时遵循“能连不交、依序取大”的原则。
f、为了尽量减少重码,在字根码不足四码时,补加识别码。有两类识别码结构码和笔画码。
g、针对双拼+形的输入,不仅用26个字母键代表汉语拼音的声母与韵母,并且用标号键(,./;)分别代表汉语拼音的四声。
经过以上一系列处理后,就形成了归类码汉字输入法的完整框架,与其他编码相比,本发明具有如下优点
——字根无需背口诀强化记忆,只要掌握规律,学过就不会忘记。
——汉字拆分同五笔字型编码一样符合人们的书写习惯,而对于拆分复杂汉字和繁体汉字,字根相对后者要少,且更加简单化,更利于人们的快速拆分。
--—对于已经熟练双拼输入法的人,可以不换挡地进行双拼+形的输入,以此作为全形码输入法的辅助手段,有利于提高输入速度。
——字根和音形的键盘布置紧凑合理,有利于减轻疲劳,提高输入速度。
综上所述,本发明是全新的汉字五笔画编码技术,它突破了以往汉字编码的诸多局限性,实现了汉字输入的易学、难忘、快速、简捷。
下面结合附图和实施例对本发明作进一步说明。


图1是本发明定义的汉字五种笔画的排列图2,图3是本发明的字根在键盘的布置图4是本发明四种汉字结构的排列图5是本发明全形码的一级简码字;
图6是本发明双拼+形输入法的声、韵母及四声在键盘的布置图7是本发明双拼+形输入法的一级简码字。
本发明的主体为全形码汉字输入法,并以双拼+形汉字输入法为辅助手段。全形码的编码首先要确定汉字的基本笔画及其组合关系。我们把汉字书写过程中一笔写成的连续线段叫做笔画,本发明将汉字的笔画字义为五种点、横、撇、竖、折,并规定捺、提、极短撇归入点(极短撇是指
中的极短撇);所有带转折的线段归入折。五种汉字笔画的分类如图1所示。
五种笔画之间的组合关系有三种散、连、交。
1、散笔画与笔画之间以分散方式组合,如二、刂;
2、连笔画与笔画之间以粘连方式组合,如工、厂;
其中规定a,单点在与其它笔画组合时,它与它的前一笔算作连,如犬、天;b,诸如有、右、者、看等字的“斜撇”与其下面的笔画结构不视作连;c,(口、止)系中(
,小);革中(廿、
);角中(,用)不视作连。
3、交笔画与笔画之间以交叉的方式组合,如力、中。
五种笔画经过散、连、交一次或多次组合后形成了各种各样的笔画结构,如日、中、天、氵、钅等,本发明优选出178个组字能力强的笔画结构组成归类码的字根系统,并且规律有序地分布在键盘上。字根系统在键盘上的布置是按单笔区、二笔区,三点区和与折相关区分布排列;与折相关区又分为点折区、横折区、撇折区和竖折区。如图2、图3所示。
字根与字根之间的组合关系也是三种散、连、交。
散,如级、时、宁
连,如天、占、于;
交,如史、申,夫
我们把字根与字根之间以连、交方式组成的整体型汉字结构叫做“字根单元”,如天、占、于、史、申、夫等。
根据以上定义,所有汉字的组成形式有五种1、单独字根;2、单独字根单元;3、字根与字根以分散方式组成;4、字根与字根单元以分散方式组成;5、字根单元与字根单元以分散方式组成。按照组成汉字的字根和字根单元的空间分布关系,可将汉字划分为四种结构类型上下型、左右型,半围型、整体型。分别用F、G、H、J代表,如图4所示。
1、上下型字根和字根单元上下分布,如吴、晨、森、整;
2、左右型字根和字根单元左右分布,如任、树、给、韵;
3、半围型一部分字根或字根单元半围住另一部分字根或字根单元,如边、凶、式、同;
4,整体型字根单元和□结构,如重、占、天、国、团。
汉字的分类取码及拆分字根单元的规则
1、拆分字根单元时,遵循“能连不交、依序取大”的原则,即如果字根与字根之间能拆作连的关系,就不要拆作交的关系,同时按书写顺序取最大的字根。如未拆作(二、
)为正确,拆作(一木)为错误。
2、上下、左右、半围型汉字
a,由两个字根或字根单元组成依次取字根和字根单元的前两个字根作字根码,不足四码补识别码(识别码在后面论述)。如吴拆分为(口
丶)记作VUTF(F为识别码);理拆分为(一土里一)记作RUNR。
b,由三个字根或字根单元组成依次取字根和第一个字根单元的前两个字根作字根码,其它字根单元取首码,不足四码补识别码。如森拆分为(木木木)记作WWWF(F为识别码);乘拆分为(禾丨一七)记作IWRZ
c.由四个字根或字根单元组成依次取1-2-3-4字根或字根单元的首字根作字根码。如镊拆分为(钅耳又又)记作XUAA;戴拆分为(十田
八),记作WNOE。
d,由四个以上字根或字根单元组成,依次取1、2字根或字根单元的首字根+末2,末1的字根或字根单元的首字根作字根码。如赢拆分为(亠口贝几),记作TVBX。
3、整体型汉字
a,字根单元汉字依次取1-2-3-4字根作字根码,不足四码补识别码。如天拆分为
),记作UTJT(J、T为识别码);更拆分为(一日丿丶)记作RBET。
b,□结构汉字先取外□作首字根码,再按其内部为何种汉字结构依次取其余三码,不足四码补识别码。如国拆分为(□一土丶)记作VRUT。
4、字根汉字
a,首字根,取四个此字根作字根码。如田取作NNNN。
b,其余字根,先取此字根作首字根码,再按其自身为何种汉字结构依次取其余三码,不足四码补识别码。如由拆作(由冂土),记作NBUJ、(J为识别码)。
识别码
为了尽量减少重码,在字根码不足四码时,补加识别码很有必要,本发明定义了两类识别码。
a,结构码 把汉字的四种结构类型分别用键盘横折区的F(上下)、G(左右)、H(半围)、J(整体)表示,在字根码不足四码时,首先补加结构识别码F、G、H、J,(□结构取其外□为J)如吴记作VUTF(F为上下结构识别码)。
b,笔画码 当补加结构识别码后,仍不足四码,补加最末一笔的笔画码,即T(丶),R(一),E(丿)、W(丨),Q(乙)五笔画(□结构的末笔画取□中的末笔)如天记作UTJT(J为结构识别码,T为笔画识别码)。
简码输入
简码的使用是为熟练者便于更快速地输入汉字而准备的,都是选取经常使用的字和词组。其计有三类简码
a,一类简码,选取最经常单独使用的26个汉字,分别对应26个字母,输入方式为只需击打一次此字母键,再按空格键就可将此汉字输入。对应关系如图5所示。
b,二类简码,其计26×26=576个字和词组,选取字和词组的前两码,再加空格键就可以将字和词组输入。
c,三类简码,共计26×26×26=17576个字和词组,选取字和词组的前三码再加空格键。
词组输入
词组输入是汉字输入技术中快捷的输入手段
1、双字词,各取每个汉字的前两个字根或字根单元的首码,如前进,取作YCUS
2、三字词,前两个字取其首字根或字根单元的首码,第三个字取其前两个字根或字根单元的首码。如生产力,取作ELQQ
3、四字以上词,取1-2-3-末汉字的首字根或字根单元的首码。如艰苦奋斗取作AORY
双拼+形输入
本发明可实现不换挡双拼十形输入,这对于已熟练于双拼输入法的人在进行归类码全形码输入时,可以穿插使用双拼+形输入,并且不用换挡,也可以单独采用双拼+形的输入。声母与韵母键盘布置与super-Dos中双拼键盘基本一致,只是“ing”安置在Q键,并用(,./;)四键代表汉字拼音的四声。轻声同一声,零声母键用o键表示。声母、韵母在键盘的布置如图6所示。输入方式
a、字,取字的声+韵+形四声(形取字的首字根码),如中取作(AYV,),国取作(GOV)
b、词组,取1、2字的声+末字的形+末字的四声。如中国取作(AGV。)中华人民共和国取作(AHV)。
双拼+形的简码输入
a、一类简码,输入方式为只取字的第一码和末码(声+四声),共计可输入23×4=92个常用字(E、O、V三键上无简码字)。一类简码字的布局如图7所示。
b,二类简码。输入方式为只取字的1,2码+末码。
权利要求
1、一种利用英文字母和标点符号作为汉字和词组编码的归类码汉字输入法,其特征在于在标准英文键盘中,用26个字母键和4个标号键对汉字和汉语拼音编码;
a,将汉字的笔画定义为五种点、横、撇、竖、折,并规定捺、提、极短撇归入点,所有带转折的线段归入折;确认组成汉字的笔画之间的关系为散、连、交;
b.优选出178个组字能力强的笔画结构组成字根系统,并且规律有序地布置在标准键盘的26个字母键上,上中下三排字母键依次对应的首字根为乙上人一广文土禾业了(上排),又之门寸七石弓氵辛(中排),刀几月口日田也(下排),每个字母键代表若干个字根(如图3所示);
c,把字根与字根以连、交形式组成的整体型的汉字结构定义为“字根单元”;
d,确定汉字的结构为上下型、左右型、半围型和整体型四种类型,分别用F、G、H、J键代表;
e、取码采用分类取码,拆分字根单元时遵循“能连不交、依序取大”的原则;
f、在字根码不足四码时,补加识别码;有两类识别码,结构码和笔画码;
g、用26个字母键代表汉语拼音的声母与韵母,用标号键(,. /;)分别代表汉语拼音的四声。
2、根据权利要求1所述的汉字输入法,其特征在于字根系统在键盘上的布置是按单笔区、二笔区、三点区和与折相关区分布排列,与折相关区又分为点折区、横折区、撇折区和竖折区。
3、根据权利要求1所述的汉字输入法,其特征在于所说的分类取码是对上下、左右、半围型汉字,整体型汉字,字根汉字采用不同的取码方法。
4、根据权利要求3所述的汉字输入法,其特征在于对于上下、左右、半围型汉字
a、由两个字根或字根单元组成,依次取字根和字根单元的前两个字根作字根码,不足四码补识别码;
b、由三个字根或字根单元组成,依次取字根和第一个字根单元的前两个字根作字根码,其它字根单元取首码,不足四码补识别码;
c、由四个字根或字根单元组成,依次取1-2-3-4字根和字根单元的首字根作字根码
d、由四个以上字根或字根单元组成,依次取1、2字根或字根单元的首字根+末2、末1的字根或字根单元之间的首字根作字根码。
5、根据权利要求3所述的汉字输入法,其特征在于对于整体型汉字;
a、字根单元汉字,依次取1-2-3-4字根作字根码,不足四码补识别码;
b、□结构汉字,先取外□作首字根码,再按其内部为何种汉字结构依次取其余之码,不足四码补识别码。
6,根据权利要求3所述的汉字输入法,其特征在于对于字根汉字
a、首字根,取四个此字根作字根码;
b、其余字根,先取此字根作首字根码,再按其自身为何种汉字结构依次取其余三码,不足四码补识别码。
7、根据权利要求1所述的汉字输入法,其特征在于双拼+形的汉字输入取码为声+韵+形+四声
全文摘要
本发明是一种利用标准英文键盘26个字母键和4个标号键作为汉字和词组编码的汉字输入法。优选出178个笔画结构组成字根系统,并且规律有序地布置在标准英文键盘的26个字母键上。引进“字根单元”概念作为汉字取码依据,取码采用分类取码,拆分字根单元遵循“能连不交、依序取大”的原则。本发明主体为形码类,同时可以不换挡进行双拼+形的输入,具有重码少、易拆分、输入速度快、简码容易大的优点,实现了汉字输入的易学、难忘、快速、简捷。
文档编号G06F3/023GK1180860SQ9611951
公开日1998年5月6日 申请日期1996年10月20日 优先权日1996年10月20日
发明者张军 申请人:张军
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1