汉字笔码输入法的制作方法

文档序号:6609029阅读:300来源:国知局
专利名称:汉字笔码输入法的制作方法
技术领域
本发明涉及一种汉字输入法,更具体地涉及一种汉字笔码输入法,其按 照汉字的字形,对待输入的汉字进行拆分编码,从而输入所需汉字。
背景技术
随着计算机技术的不断发展,人们对于汉字输入法的要求越来越高。近 年来,两岸三地的汉字输入法开发者创造出了多种汉字输入法。这些汉字输 入法主要分为汉字拼音输入法、汉字字形输入法以及拼音字形混合输入法。 汉字拼音输入法是利用汉字的拼音进行编码的方法,其要求使用者掌握标准 的汉字发音,否则就无法输入相应的汉字,然而各地方言差异较大,使得某 些人士根本无法使用拼音输入法进行快速有效的输入。汉字字形输入法是根 据汉字的字形,通过对汉字进行拆分编码,并输入与所取码相对应的键以进 行汉字输入。使用范围较广的汉字字形输入法包括"仓颉,,输入法和"五笔"输入法。然而,这两种输入法存在以下缺点均比较难学,需要长期训练方能 掌握,而且容易遗忘;每个汉字需要输入4-5个码,非专业人士无法进行快 速输入;不易进行繁简体字交替输入。从而,令人遗憾的是,迄今为止尚无一种汉字输入法,能够如同输入英 文那样自然流畅,以供人们方便地使用。如果一种汉字输入法能够达到以下 条件,则其就已经接近英文输入易学不易遗忘;只需26个或更少的输入键; 贯通繁简两种中文字体;每个汉字只需三键即可输入;选字率在2%以下。发明内容针对现有技术中存在的上述问题,本发明提出了一种新颖的汉字笔码输 入法,其特征在于,将每个汉字视作由至少一个线段构成,并将所述线段归 为三种单笔码,即横笔、竖笔和斜笔,其中横笔表示汉字中的横,竖笔表示 汉字中的竖和弯钩,斜笔表示汉字中非横非竖的线段,通过至少两个单笔码 相互组合而形成多个结构笔码,所述结构笔码包括由至少两个单笔码相互连接或交叉形成的结合笔码和由至少两个单笔码相互撮合形成的撮合笔码,将 所述单笔码、结合笔码和撮合笔码按照不同的分组设定在计算机键位上,该输入法包括步骤利用所述结构笔码和单笔码对待输入汉字进行拆分,并根 据从各个汉字中拆分出的结构的数量,将汉字分为单结构形式字、双结构形 式字、多结构形式字以及无结构字,所述结构为所述汉字中由一个结构笔码 构成的组织或者由相互连接或交叉的多个结构笔码构成的组织;从该汉字中 所拆分出结构和剩余的单笔码中选取最多三个笔码;以及键入所述最多三个笔码所对应的4建,^v而输入该汉字。优选地,对所述多结构形式字进行输入的步骤包括按照从上到下、从 左到右和从外到内的顺序将该多结构形式字中的第一结构、第二结构和末结 构拆分出来;依次将所述第一结构、第二结构和末结构中的头码作为该汉字 的第一、第二和第三码;和依次键入表示所述第一、第二和第三码的结构笔 码所对应的键,从而输入该多结构形式字。优选地,对所述双结构形式字进行输入的步骤包括按照从上到下、从 左到右和从外到内的顺序确定该双结构形式字中的第一结构和第二结构;依 次将所述第一结构和第二结构的头码作为该汉字的第一和第二码,并且在该 汉字中存在剩余的笔码的情况下,依次将所述第一结构或第二结构的次码或 者该汉字中按照从上到下、从左到右和从外到内的顺序选取的剩余单笔码作 为该汉字的第三码;和依次键入表示所述第 一和第二码的结构笔码所对应的 键和/或表示所述第三码的结构笔码或单笔码所对应的键,从而输入该双结构 形式字。所述单结构形式字包括单笔单码单结构形式字和普通单结构形式字,所 述单笔单码单结构形式字由单个结构笔码和单个单笔码构成,所述普通单结构形式字为除单笔单码单结构形式字之外的其他包含单个结构的字。对所述单笔单码单结构形式字进行输入的步骤包括对该汉字中所包括 的两个笔码按照从上到下、从左到右和从外到内的顺序取码;和依次键入所 述结构笔码和单笔码所对应的键,从而输入该单笔单码单结构形式字。对所述普通单结构形式字进行输入的步骤包括将所述普通单结构形式 字的结构中的头码作为第一码,并在该汉字中存在剩余的笔码的情况下,依 次将所述结构中的次码、第二次码或者按照从上到下、从左到右和从外到内 的顺序选取的该汉字中剩余的单笔码作为该汉字的第二码和/或第三码;和依次键入表示所述第一、第二和/或第三码的结构笔码或单笔码所对应的键,从 而输入该普通单结构形式字。对于所述无结构字,则直接键入该无结构字中的笔码所对应的键即可输 入该无结构字。本发明的输入法的拆字取码方法简单,使得初学者容易学会,而且不易 遗忘。另外,本发明的输入法最多取三码即可输入一个汉字,从而可以有效 提高汉字的输入速度。此外,本发明的拆字取码方法可以有效的降低重码率, 从而可以将选择率控制在1%左右。


下面参照附图详细描述本发明,其中图1示出根据本发明原理构造出的笔码的一个示例;图2示出本发明所选取的组合的一个示例。
具体实施方式
汉字具有横平竖直、方方正正的特点。每个汉字是由笔划构成的,所述 笔划包括横、竖、撇、捺、点、提、弯钩等。传统汉字输入法通常采用这些 笔划作为基本单元,而对汉字进行拆分编码。然而,本发明根据汉字横平竖 直的特点,突破了汉字中笔划的限制,而将每个汉字看成由横、竖和斜三种 线段组成,并将这三种线段称之为单笔码,即横笔、竖笔和斜笔。横笔表示 汉字中的笔画"横,,;竖笔表示汉字中的笔画"竖,,和"弯钩";而斜笔表示汉字 中非横非竖的线段,例如撇、捺、点、提、斜钩、臥钩等。在这三个单笔码 的基础上,通过这些单笔码相互连接(即, 一个单笔码连接于另一单笔码但 并不相互横穿后者)、交叉(即,至少两个单笔码相互横穿)或者撮合(即, 各单笔码聚集在一起但不互相连接或交叉),而形成多组结构笔码。通过将 所述单笔码和结构笔码设置在相应的键位上,按照后面详述的拆字取码方法 即可对汉字进行输入。图1示出了根据本发明的笔码的示例。除了笔码中特别指明的之外,在利用本发明的笔码进行汉字拆分取码 需要考虑斜笔的倾斜方向,并且不考虑各个笔划末端的钩。在图1的示例中,本发明的笔码主要分为单笔码和结构笔码。结构笔码 包括结合笔码、撮合笔码、变换笔码和特定笔码,其中结合笔码是由多个单笔码连接或交叉而形成的笔码的统称;撮合笔码是由多个单笔码撮合而形成 的笔码;变换笔码是对基本码进行变化而得到的;特定笔码是对汉字中较常 出现的部分进行固化,而形成的一种笔码;其中单笔码、结合笔码和撮合笔 码组成基本码,其可以用于对任何汉字进行拆字编码,而变换笔码和特定笔 码主要用于减少汉字编码的重码率。下面首先对基本码进行说明。在本示例中,所有笔码被分成26组,这26组可以分别设定于计算机键 盘的26个键位上,例如,按顺序分别设定于A-Z这26个键位上,但是, 其也可以按照不同的次序设定于A-Z字母键上或者其他键位上。下文将以按 顺序设定于A-Z键位上为例进行说明。应当注意,图1的码表中的笔码应当 理解为分别代表同一类型的笔码,即部分笔划线段长短、斜向以及是否带钩, 而并非仅仅代表其自身所显示出的笔码形式。从而,以下利用文字表述出各 笔码所代表的笔码类型。第一组设定于A键上,包括撮合笔码儿、小,其中的笔码儿表示斜 笔、竖笔和横笔相撮合,而横笔和竖笔之间利用圆弧进行连接,其也用以表 示笔码几;而笔码小则表示竖笔与分别位于其两侧斜笔相撮合。笔码儿、 几是固化的笔码,其不受汉字中与其相连接或交叉的线段的影响,也不影响 其他笔码的构成,并且其可以与其他单笔码组成暗码(稍后将对暗码进行介 绍),例如,从"光"、"西,,或"凡,,字中均能拆出笔码儿,从"耀,,中能拆出笔 码几。第二组设定于B键上,其包括结合笔码X,表示两斜笔相交叉;和 撮合笔码八,表示两斜笔相撮合,该笔码八也可以表示两同向倾斜的斜 笔相撮合。第三組设定于C键上,其包括结合笔码表示横笔和向右倾斜的 斜笔交叉;和撮合笔码2、 ^、么卩,表示横笔或竖笔与位于其同一侧的两 斜笔相撮合。第四组设定于D键上,其包括结合笔码* (表示横笔与向左倾斜的 斜笔交叉)、* (表示横笔与两平行竖笔交叉);和撮合笔码匕(表示竖笔 与位于其同一侧的斜笔和横笔撮合,其中竖笔与横笔通过圓弧连接)。第五组设定于E键上,其包括结合笔码表示竖笔与斜笔交叉;和撮合笔码i、 T、丄l、,表示竖笔或横笔与斜笔相撮合。第六组设定于F键上,其包括结合笔码7、」,表示斜笔连接于横笔 或竖笔而不横穿横笔或竖笔亦非端部相连,此笔码也用以表示笔码i;和 撮合笔码二,表示两横笔相撮合。第七组设定于G键上,其包括结合笔码、表示横笔连接于斜笔而 不横穿斜笔亦非端部相连,此笔码也用以表示笔码—、—;和撮合笔码II, 表示两竖笔相撮合。第八组设定于H键上,其包括结合笔码4 、"表示竖笔连接于斜 笔而不横穿斜笔亦非端部相连,此笔码也用以表示笔码丄;和撮合笔码三, 表示三横笔相撮合。另外,竖笔下端带右钩即当作笔码丄。第九组设定于I键上,其包括结合笔码「、 l,表示横笔与竖笔端部相 连接,而竖笔在横笔左端。第十组设定于J键上,其包括结合笔码,、」、4 ,其中,、」表示横 笔与竖笔端部相连接,而竖笔在横笔右端, 一表示竖笔与一横笔和一斜笔相 交叉。第十一组设定于K键上,其包括结合笔码入、A,表示两斜笔中部或端 部相连接。第十二组设定于L键上,其包括结合笔码厂、7、 f,其表示横笔或竖 笔与斜笔端部相连接而不横穿斜笔。第十三组设定于M键上,其包括结合笔码丄(表示竖笔从上侧连接于 横笔而不横穿横笔,亦非端部相连)、卜(表示横笔从右侧连接于竖笔而不横 穿竖笔,亦非端部相连)、丰(竖笔与并排设置的三横笔交叉)、卅(横笔与 并排设置的三竖笔交叉)。第十四组设定于N键上,其包括结合笔码T (表示竖笔从下侧连接于横 笔而不横穿横笔,亦非端部相连)、H (表示横笔从左侧连接于横笔而不横穿 横笔,亦非端部相连)、丰(表示竖笔与并排设置的两横笔交叉)。第十五组设定于O键上,其包括结合笔码口,表示两横笔和两竖笔端 部相连接而形成"口 "字形。第十六组设定于P键上,其包括结合笔码P、 3,表示"口"字形笔码 中任一竖笔长出;和撮合笔码 、、《、氺,表示四个斜笔相撮合,其中 、、 《为一长三短四个斜笔相撮合,永表示四短斜笔相撮合,其中的虛线并不属于该笔码本身,而仅表示该字中的其他笔码。同样,附图中其他笔码的虚线 也不包括在相应笔码中,而仅表示该汉字中的其他笔码。第十七组设定于Q键上,其包括结合笔码u、 n,表示"口"字形笔码中 任一横笔长出。第十八组设定于R键上,其包括结合笔码尸、P,表示将"口"形笔码 中的一竖笔或横笔替换成斜笔,而该斜笔向外长出。第十九组设定于S键上,其包括撮合笔码、)、、。、、、、,表示任意三 个斜笔相撮合。第二十组设定于T键上,其包括结合笔码十,表示横笔与竖笔交叉。第二十一组设定于U键上,其包括单笔码 一,表示横笔;和撮合笔 码U表示横笔和竖笔以圓弧连接。第二十二组设定于V键上,其包括结合笔码日、P、 1,其中的笔码曰 是由"口"形笔码及其内部的一横笔而形成的"日"字形笔码,卩、1是"日" 形笔码中任一竖笔长出形成的笔码。第二十三组设定于W键上,其包括单笔码I,表示竖笔;和撮合笔 码一 (表示横笔与左端的点相撮合)、i (表示竖笔与其顶端的点相撮合)。 这两个撮合笔码不允许与汉字中的其他线段形成连接,否则不形成该撮合笔 码。第二十四组设定于X键上,其包括结合笔码又、又,表示有横笔与相 交叉的两斜笔相连接。第二十五组设定于Y键上,其包括单笔码J ,表示斜笔,在此情况下, 该笔码对于斜笔的倾斜方向、长短没有限制,从而该笔码可以表示撇、捺、 点、提、斜钩、臥钩等。第二十六组设定于Z键上,其包括结合笔码大,表示横笔与相连接的 两斜笔交叉而形成"大,,字形笔码,其*不交叉的斜笔可以是"捺"或"点"。以上利用三种单笔码形成结合笔码或撮合笔码的方式仅是示例性的,在 将汉字字形拆分成上述三个最小构字单元,即横笔、竖笔和斜笔的基础上,可以按照不同的连接、交叉或撮合的方式形成结合笔码或撮合笔码,从而这码。为了减少拆字取码中产生的重码率,可以对以上形成的基本码进行变化,而形成变换笔码,如图1中所示,变换笔码的主要变化形式包括a) 笔码在汉字中的位置不同而产生的变化,例如,Q (U),表示"口,, 字形笔码将其他笔码包含在其内部,其中的虚线表示该字的其他笔码,而并 非该笔码本身;吕(V),表示"口"形笔码位于其他笔码之上;g(R),表 示"日,,形笔码位于其他笔码之下。上述以及下文中笔码后的括号内的字母表 示该笔码所处键位。b) 取次码替代,其中又包括两种形式,即,表示该该次码的笔码不包 括在该笔码之中的形式,例如,力(J)、勺(J)(其中虚线表示的笔码不包 括在该笔码中,而成游离笔码,此两码只允许其斜笔有连接);和表示该次 码的笔码包括在该笔码中,例如,(L)、廿(M)、 #(1)。c )原码延伸,例如,A ( C )、 K ( C )、九(C )、夕(G )、 E (I )、 0 (I )、 P (1)、广(L)、 — (W)、争(M)、辛(M)、杞(T)、 "L (U)和乙(U), 其中,笔码P的内部不允许有其他笔码。d) 组合影响,例如,(X)、 ^ (X),其中的下标表示该笔码在拆 字时的编码顺序,即,该笔码只有^Uf又为首码时才成为成立,所谓首码是指 一个汉字的编码中第一码,即该二组合的头码"A,, (K)和'…"(G)分别改 取为X。如果组合,没有处于一个汉字的首码位置,则该二组合的头码复 取"A" (K)和"产"(G),次码取"5" (R)。e) 连接影响,例如,丰(R)、'六(W)、 *( W)、中(A)、 ? (R)、 d] (X)、 .& (X)、命(X)、 i ( Y)、米(Z)、 G木L2 (Z)、 土 (Z)、十(Y)、 * (Y)、大(Y)、;千(R)、;于(R)、夭(R)、 + (U)于(U)、天(U)。其中,千(Y)、 f (Y)、夭(Y)与干(U)于(U)、天(U)之间的不同之处在于,前三个 笔码上部连接于斜笔,后三个笔码上部连接于横笔,其优先于其他变换笔码。笔码+、 ^、;天表示交叉笔另有任意连接。笔码「沐L2只有在被取为首码或者第二码时才成立。汉字中,笔码土、廿、±t之下的线段允许与这些笔码的下端中部形成连接,其中笔码-士.的二横笔之间不允许存在其他笔码。 笔码中设定若干个特定笔码是为了取码方便、简化结构并减少重码字。本示例中的特定笔码包括乇(A)、示(C)、工(1)、言(1)、月(M)、 ^ (P)、上(P)、 > (P)、目(Q)、 (Q)、 ra (Q)、冋(Q)、玉(R)、万23 (R)、于(R)、 ] (u)、 [: (u)、王(w)、壬(w)、 i (w)、田(x)、4 (Y);其中,笔码工中"工"两侧的点并不是笔码本身的组成部分,而仅表示其可与其他笔码端部相连接,而且其下侧的线段允许与该笔码的下端中部形成连接;同样,]和[:侧部的点也仅表示该笔码只可以与其他笔码端部相连接,而不是笔码本身的组成部分。其中,笔码万2.3只有在取为第二码或第三码时才成立,并只允许其中横笔有连接。除了以上的特别规定之外,笔码冋、于、i 、 4 、 i、 一不允许与其所构成的汉字中的其他线段相连接,否则不形成此笔码。另外,笔码儿、 九、七、言、广、上、万、乙、田、工可以单独形成汉字,但是对这些汉字 取码时,并非取这些笔码表示,而应当对这些汉字进一步拆分取码。利用上述结构笔码和单笔码对待输入汉字进行拆分,并根据从各个汉字 中拆分出的结构的数量,将汉字分为单结构形式字、双结构形式字、多结构 形式字以及无结构字,所述结构为所述汉字中由一个结构笔码构成的组织或 者由相互连接或交叉的多个结构笔码构成的组织,其中撮合笔码也可以形成 一个结构。单结构形式字包括例如"少"字,其中包括由结构笔码小构成的一个结构;又如"云"字,其中包括由结构笔码^构成的一个结构。双结构 形式字包括例如"吕"字,包括由结构笔码口构成的两个结构;"动"字由左 右排列两个结构笔码(7"和力)构成两个结构。多结构形式字包括例如"曼" 字,其由三个结构笔码(日、四、又)构成三个结构;"漫,,字由四个结构笔 码(?、日、凹、又)构成四个结构。无结构字包括,例如,"一"、T,、"、" 以及"J "等。如果一个结构中存在多个结构笔码,它们就存在明码和暗码之分,明码 和暗码是明结构笔码和暗结构笔码的简称。所谓明码是在该结构中存在足够的线条而拆分出的结构笔码,其可以是 结合笔码、撮合笔码、变换笔码或特定笔码。所谓暗码是先取完明码后剩余 的线段(即,游离笔)与原明码中的线段交叉或连接而形成的结合笔码,或 者是游离笔与同部位或相邻的独立笔码撮合成的撮合笔码,从而暗码只包括 基本码,而不包括任何变换笔码或特定笔码。为了拆字取码方便,除汉字中撇的下端和竖笔上端连接构成笔码"P,(L) 之外,可以将汉字中的撇的下端以及提和捺的上端视为不与横笔或竖笔相连 接,例如汉字"危",可以将其中的笔码夕与厂视为相互分离而不彼此 连接。又如,汉字"北",可以将其中的单笔码/视作与笔码H相互分离, 此外,汉字中的点只与独立斜笔交叉或连接构成笔码外,其不再构成任何结构笔码。对于汉字中的组织r、么、〈, 一旦这些组织与其他笔码组码,则将它们视为一斜笔。例如,将汉字"斤"中除了竖笔之外部分视作笔码卜。对于包括"口"形的笔码,例如,口 (O)或Q (U),其本身不与其他笔码进行组码,也不影响其他笔码组码,而其"口"形内部的笔码与外部的笔码 如果相交叉,则该内部结构和外部结构可以形成组合(稍后将对组合进行说 明)。例如,汉字"惠,,,其包括结构笔码中'、 、和中。对于包括"口"形的笔码以及笔码"[:",其内部结构在取为2、 3码时当作 组合并按照逆序取码。例如,汉字"姻,,,按次序取笔码亡、大、口进行表述, 其中的笔码大和口就是按照逆序选取的笔码。稍后将对取码次序进行详细i兌明。对于通过将"口 "形码或"日"形码中的 一笔长出而形成的笔码,其中长出 的一笔不与其他笔码组码,但是如果其与其他结构相结合则当作组合。例如,汉字"局,,,取笔码尸、口和,表示;又如,汉字"卧,,,取笔码P、 l、和T 表示。汉字中的组织《、f、化其中的"C,,撮合是暗码,另夕卜,诸如汉字"来"、 "未"、"耒"中的"A"是暗码。笔码"口"、"日,,"目"和"尸"在与笔码"上,,结合时,其本身形成暗码。例 如,汉字"战",取笔码上、、和口表示;又如"卓",取笔码上、十和日表 示。本发明的取码原则在于取完结构笔码再取剩余的单笔码,每个汉字最多 取三个笔码,作为该汉字的第一码、第二码和/或第三码来表述该汉字,然后 输入表示该第 一码、第二码和/或第三码的笔码对应的键,即可输入相应汉字。 拆取交叉而成的结合笔码及撮合笔码时,均按照从上到下、从左到右和从外 到内的顺序以包含线段更多者为先。下面按照汉字的结构详细说明拆字取码 方法。1.对于由三个或更多结构构成的多结构形式字按照从左到右、从上到下、从外到内的顺序,于第一、第二结构中各取 其头码作为该汉字的第一和第二码,第三笔码于末结构(最右下方的结构) 中取其头码作为该汉字的第三码。例如,"做,,字可以拆分为三个结构,即, 4 、古、夂,对第一和第二结构{、古分别取头码为4和十,按H、 T键,对末结构夂取头码为又,按X键,从而按HTX键输入"做,,字;"新,,字可以 拆分为三个结构,即,*、于、斤,对第一和第二结构^、于分别取头码为二 和于,按E、 R键,对末结构斤取头码为、按G键,从而按ERG键输入"新,, 字。对于繁体字"歡,,,可以其拆分为五个结构,即,a、 口、 口、隹、欠, 其中第一、第二结构和末结构分别为^、 口和欠,对第一结构取头码^(D), 对第二结构取头码口 (0),对末结构取头码产(G),从而按DOG键输入 该繁体字。如果多结构汉字中的末结构是由撮合笔码构成,则采用逆撮合的方式 (即,自右至左、由下至上)选取码,以包含线段更多者为先。例如,"添" 字可以拆分为三个结构,即,';、天、I、其中的末结构由撮合笔码构成, 它采用逆撮合的方法取码卩(C),因此按SUC4建输入该汉字。2. 对于由上下、左右或者内外结构构成的双结构形式字 按照从左到右、从上到下、从外到内的顺序,于每个结构中取其头码作为该汉字的第一和第二码,第三码回头取第一结构的次码,如果第一结构中 的笔码已经取尽,则取第二结构的次码,如果两个结构均已取尽,则按照从 上到下、从左到右和从外到内的顺序取剩余的单笔码作为该汉字的第三码, 如果该汉字中也不存在其他单笔码,则利用两码即可确定相应的汉字。例如,"各,,字可以拆成两个结构,即,夂、口,对这两个结构分别取头 码又(X)和口 (0)作为该汉字的第一和第二码,第三码回头取第一结 构的次码〃(G),该次码为第一结构中剩余的笔码与已被取码的部分形成 的暗码,从而按XOG输入该汉字。又如,"胡,,字可以拆成两个结构,即,古、月,对这两个结构分别取头 码为十(T)和月(M),第三码取第一结构的次码口 (0),从而按TMO 输入该汉字。又例如,"劣,,字可以拆成两个结构,即,小、力;对这两个结构分别耳又 头码小(A)和力(J),第三码回头按照从上到下、从左到右和从外到内的 顺序取单笔码卩(Y),因此按AJY键输入该汉字。3. 对于单结构形式字,单结构形式字中包括单笔单码单结构形式字, 其由单个结构笔码和单个单笔码构成;和普通单结构形式字,其可以由单个结构笔码构成、由单个结构笔码和多个单笔码构成、由相互连接或交叉的多 个结构笔码构成、或者由相互连接或交叉的多个结构笔码和一个或多个单笔码构成。对于单笔单码单结构形式字,对于该汉字中所包括的两个笔码按照从上 到下、从左到右和从外到内的顺序取码。例如,"少,,字为由结构笔码小(A)和单笔码J (Y)构成的单笔单码 单结构形式字,对这两个笔码按照从上到下的顺序取码,从而按AY键确定 该汉字。又如,"文,,为由单笔码、(Y)和结构笔码又(X)构成的单笔单码单 结构形式字,对这两个笔码按照从上到下的顺序取码,从而按YX确定该汉 字。如果一个汉字仅拆出单个笔码或者两笔码,为了输入该汉字,可以在键 盘上设置一个确认键,当按下该单个笔码或两个笔码对应的键而确定待输入 的汉字后,按一次确认键即可输入该汉字。该确认键也用于对由单码确定的 汉字进行确认输入。对于普通单结构形式字,则是取完结构笔码后依次从上到下、从左到右 和从外到内的顺序取单笔码。例如,"卞"字,先取结构笔码T (N),然后取剩余的两单笔码、(Y) 和、(Y),从而按NYY键输入该汉字。又如,"巴,,字,先取结构笔码P (P), 然后依次取单笔码I (W)和一 (U),从而4耍PWU即可输入该汉字。又如,"为"字,先取结构笔码力(J),然后取结构暗码"(E),最后取单 笔码、(Y),从而按JEY键输入该汉字。对于无结构字,则仅需要键入该汉字的笔码所对应的键即可输入该汉 字,例如,"一,,(U)、 " " ( Y)。以上所述的头码和次码表示一个结构中取码的先后次序。在双结构形式 字或多结构形式字中,如果一个结构中存在两个或更多结构笔码,则首选的 笔码称为头码,如果需要,取完其他结构的笔码后回头从前一结构中选取的 笔码称为次码。另外,在普通单结构形式字中也可能存在头码、次码以及第 二次码。本发明对于一个结构中的头码和次码的取码次序为先取明码,取 尽明码后再取暗码。如果一个结构中存在多个明码,则按照以下优先级取明码第 一优先级明码为由单笔码交叉形成的结构笔码、包含"口 "形笔码或 "日"形笔码的基本码、前两者的变换笔码、特定笔码。例如,"子"字,先取交叉码十(T),再取笔码7 (L),从而按TL4定加确认键就可输入该汉字。 又如"秦,,字,首先取第一结构宍中的头码,即交叉码亡(C),然后取第 二结构禾中的头码,即交叉码千(Y),最后回头取第一结构中的次码, 即撮合暗码二 (F),从而按CYF输入该汉字。第二优先级明码为含有斜笔的中间连接笔码,不包括两斜笔中间连接。 例如,"表"字,先取属于第一优先级的交叉码丰(N),然后取属于第二优 先级的笔码7" (F),最后取属于第二优先级的笔码丄(H),从而按NFH 即可输入该汉字。第三优先级明码为除了上述笔码之外的其他明码,包括两斜笔中间连接。在对相同优先级的明码取码时,按照从左到右、从上到下和从外到内的 顺序进行。如果一个结构中存在多个暗码,则按照^v上到下、从左到右和从外到内 的顺序先取由最多单笔码构成的笔码,如果构成结构笔码的单笔码数量相 同,则先取结合笔码,后取撮合笔码。例如,"津"字,先取第一结构的笔码,该笔码为明码、;(s),然后取第二结构中的明码丰(M),最后取第二结构中的暗码丰(N),从而按SMN键即可输入该汉字。另外,撮合暗码允许相隔一单笔码撮合,例如对"亦"字取码时,其下部 处可以视作一斜笔卩间隔在撮合笔码小(A)中,从而可以将该部分的笔码 取为小(A),从而按FAY键即可输入"亦"字。为了进一步降低重码率,可以在以上笔码的基础上形成多种组合,每个 组合由至少一个结构笔码形成,可以分为部首组合和普通组合,其中的部首选取繁筒体汉字中较常出现的结构。图2示出了本发明所选取的组合的一个 示例。每个组合在取码过程中可以碎见作一个结构,其本身的取码与各个汉字 的取码方式相同,但是它们会影响取码次序,而并不影响笔码本身。 一个组 合中可以允许另有组合。另外,如有组合重叠时,依从上到下、从左到右和 从外到内的顺序决定组合的先后,若处于字末则要"逆组"。例如,"凉,,字中 的组合"京"中另有组合"古",故取码次序为"丄"、"小,,和"口"。又如,"兢,,字, 左边"克"顺取组合"古",右边"克"处于字末,从而逆取组合"兄,,,故对"兢,, 字取码为"十"、"儿,,和"口"。图2的组合表中的"享"字例外,其不设组合"力",故以毫进行表示。如上文所述,除了图2的组合表中示出的之外,还可以 设定"口"形笔码的内部结构和外部结构在相互交叉的情况下,视为组合。另 外,与"口"形笔码长出的笔码相连接的结构也可以视为组合。如果在拆字取码过程中考虑组合,则取码的先后次序为明码^暗码^ 独立或游离的单笔码^不在首码位的部首组合的次码^在首码位的部首组 合的次码。例如,筒体字"鲜,,,其中包括两个部首组合,即,仓、羊,该字的首码取部首组合佳中的笔码夕(G),第二码取部首组合羊中的笔码八(B) ,而第三码则取剩余的斜笔J (Y),从而按GBY 4建即可输入该简体 字。然而,对于上述简体字所对应的繁体字"鮮",其包括两个部首组合,即, 魚、羊,该繁体字的首码和第二码与上述简体字相同,然而,该繁体字的第 三码却不能在部首组合魚中选取,因为该部首组合是位于首码位的部首组 合,其取码次序排在最后,只能该其他所有笔码均以取完,即无其他笔码可 取的情况下进行选取。从而,该繁体字的第三码只能从不在首码位的部首组 合羊中选取,即选取笔码丰(N),从而,按GBN键即可输入该繁体字。又如,"釙"字,其包括部首组合 和一个结构1、,该汉字的首码和第 二码分别取笔码尸(X)和I、 (E),其第三码没有别的笔码可取,只能取部 首组合 中的次码玉(R),从而按XER键即可输入该汉字。又如,"轨,,, 其包括部首组合^ 和一个结构九,该汉字的首码和第二码分别取笔码车(C) 和九(C),其第三码没有别的笔码可取,只能取部首组合辛中的 次码对(J),从而按CCJ^t即可输入该汉字。本发明也可以利用数字键进行汉字输入。以附图l所示的笔码为例,将 各组笔码分别利用两位数字键来表示,例如第一组笔码用01表示,第二组 用02表示,依次类推,第十组笔码用IO表示,第二十六组用26表示。从 而,通过按6次数字键、或者,按4次或2次数字键和1次确认键就可以输 入一个汉字。以前面所举的"做,,字为例,需按082024六个数字键就可以输 入该汉字。上述编码中的首位O可以去除,从而仅需输入82024即可输入该 汉字。以上利用两位数字键表示一组笔码仅是示例性的,可以利用任何数字键 或者数字键的组合来表示一组笔码。本发明也可以将所述笔码按照不同组别而设置在不同的字母键和数字键,以进行字母数字混合编码。同样,所述笔 码也可以设置在其他非字母或数字的键位上。由于本发明的各组笔码可以设置在键盘的任意键位上,从而本发明的输 入法也可以作为密码来使用。当通信双方知il^建盘上键位所表示的笔码组别 时,接收方就可以根据对方发出的笔码编码来还原信息。本发明的输入法在三种基本单笔码的基础上形成多组基本码,并且在基 本码的基础上进行变化而形成变形码,从而本发明的笔码规律性强,不容易 忘记。只需熟记基本码加上认识变形码就可以对任何汉字进行编码输入。本发明输入法的拆字取码规则简单明了 ,不会出现编码重叠交叉的问 题,初学者易学易用,而无需进行长时间的训练。本发明的输入法最多需要三键即可输入一个汉字,从而,其输入速度快、 操作方便,使得利用计算机写作、编辑更加容易。另外,可以对中文中的常 用成语和固定短语进行压缩编码,只需键入成语或短语中每个汉字的第 一码 就可以输入整个成语或短语,这就进一步提高了汉字输入速度。本发明可以根据重码汉字的使用频率,对这些汉字进行排列,从而在键 入最多三个键后,使用频率最高的汉字将得以输入,而无需选字。如果希望 输入该组重码汉字中使用频率较低的汉字,则仅需按确认键就可以按照使用 频率从高到低的顺序对相关汉字进行选择。由于在常用字中每一组编码中重 码汉字的数量不超过三个,从而在需要选字的情况下,仅需要按一到两次确认键即可输入相应汉字。从而,使用本发明的方法进行汉字输入,在7000 个常用繁简体字中由5700个无需进行选字,从而可将选字率控制在1°/。左右。按照本发明的输入法可以按照相同的拆字取码方法对简体和繁体进行 输入,而无需任何形式繁筒体转化,从而实现了贯通繁筒体的效果。尽管参照优选的实施例描述了本发明,但本发明并不限于此,本领域的 普通技术人员在不脱离本发明的精神和范围的前提下,可以对本发明进行各 种改进和变形。
权利要求
1.一种汉字笔码输入法,其特征在于,将每个汉字视作由至少一个线段构成,并将所述线段归为三种单笔码,即横笔、竖笔和斜笔,其中横笔表示汉字中的横,竖笔表示汉字中的竖和弯钩,斜笔表示汉字中非横非竖的线段,通过至少两个单笔码相互组合而形成多个结构笔码,所述结构笔码包括由至少两个单笔码相互连接或交叉形成的结合笔码和由至少两个单笔码相互撮合形成的撮合笔码,将所述单笔码、结合笔码和撮合笔码按照不同的分组设定在计算机键位上,该输入法包括步骤利用所述结构笔码和单笔码对待输入汉字进行拆分,并根据从各个汉字中拆分出的结构的数量,将汉字分为单结构形式字、双结构形式字、多结构形式字以及无结构字,所述结构为所述汉字中由一个结构笔码构成的组织或者由相互连接或交叉的多个结构笔码构成的组织;从该汉字中所拆分出结构和剩余的单笔码中选取最多三个笔码;以及键入所述最多三个笔码所对应的键,从而输入该汉字。
2. 如权利要求1所述的汉字笔码输入法,其特征在于, 对所述多结构形式字进行输入的步骤包括按照从上到下、从左到右和从外到内的顺序将该多结构形式字中的第一 结构、第二结构和末结构拆分出来,依次将所述第一结构、第二结构和末结构中的头码作为该汉字的第一、 第二和第三码,和依次键入表示所述第一、第二和第三码的结构笔码所对应的键,从而输 入该多结构形式字;对所述双结构形式字进行输入的步骤包括按照从上到下、从左到右和从外到内的顺序确定该双结构形式字中的第 一结构和第二结构,依次将所述第一结构和第二结构的头码作为该汉字的第一和第二码,并 且在该汉字中存在剩余的笔码的情况下,依次将所述第一结构或第二结构的 次码或者该汉字中按照从上到下、从左到右和从外到内的顺序选取的剩余单 笔码作为该汉字的第三码,和依次键入表示所述第 一和第二码的结构笔码所对应的键和/或表示所述第三码的结构笔码或单笔码所对应的键,^v而输入该双结构形式字;所述单结构形式字包括单笔单码单结构形式字和普通单结构形式字,所 述单笔单码单结构形式字由单个结构笔码和单个单笔码构成,所述普通单结构形式字为除单笔单码单结构形式字之外的其他包含单个结构的字,对所述单笔单码单结构形式字进行输入的步骤包括 对该汉字中所包括的两个笔码按照从上到下、从左到右和从外到内的顺 序取码,和依次键入所述结构笔码和单笔码所对应的键,从而输入该单笔单码单结 构形式字;对所述普通单结构形式字进行输入的步骤包括将所述普通单结构形式字的结构中的头码作为第 一码,并在该汉字中存 在剩余的笔码的情况下,依次将所述结构中的次码、第二次码或者按照从上 到下、从左到右和从外到内的顺序选取的该汉字中剩余的单笔码作为该汉字 的第二码和/或第三码,和依次键入表示所述第一、第二和/或第三码的结构笔码或单笔码所对应 的键,从而输入该普通单结构形式字;以及对于所述无结构字,则直接键入该无结构字中的笔码所对应的键即可输 入该无结构字。
3.如权利要求2所述的汉字笔码输入法,其特征在于,所述单笔码、 结合笔码和撮合笔码的具体形式及分组如下单笔码 结合笔码 撮合笔码1儿小2X八3亡^ 「、 -14女匕5、 ; J6厂二7II8丄二9厂L10~1」对<formula>formula see original document page 4</formula>
4.如权利要求3所述的汉字笔码输入法,其特征在于,所述结构笔码 还包括变换笔码和特定笔码,以降低在对汉字进行拆分编码时出现的重码 率,所述变换笔码是对所述基本码进行变形而形成的,所述特定笔码是对汉 字中的一些结构固化而形成的,所述的变换笔码和特定笔码的具体形式及所 对应的分组如下<formula>formula see original document page 4</formula>其中,各个组别的变换笔码和特定笔码与相同组别的的键位上。
5. 如权利要求3或4所述的汉字笔码输入法,其特征在于,将所述各 组笔码设置于计算机键盘的字母键、数字键、其他非字母数字键、或者这些 键位的混合上。
6. 如权利要求4所述的汉字笔码输入法,其特征在于,从由相互连接 或交叉的多个结构笔码组成的结构中取头码和次码的取码次序为先取明 码,取尽明码后再耳又暗码,其中,所述明码是在该结构中存在足够的线条而拆分出的结构笔码;所 述暗码是先取完明码后剩余的线段与原明码中的线段交叉或连接而形成的 结合笔码,或者是游离的单笔码与同部位或相邻的独立单笔码撮合成的撮合 笔码。
7. 如权利要求6所述的汉字笔码输入法,其特征在于,按照以下优先 级对一个结构中所包括的多个明码进行取码第一优先级明码为由单笔码交叉形成的结构笔码、包含"口"形或"曰,, 形的结合笔码以及前两者的变换笔码或特定笔码;第二优先级明码为含有斜笔的中间连接结构笔码; 第三优先级明码为除了上述笔码之外的其他明码, 相同优先级的明码按照从上到下、从左到右和从外到内的顺序选取。
8. 如权利要求6所述的汉字笔码输入法,其特征在于,按照以下次序 对一个结构中包括的多个暗码进行取码按照从上到下、从左到右和从外到内的顺序先取由数量最多的单笔码构 成的结构笔码,如果构成所述结构笔码的单笔码数量相同,则先取结合笔码, 后取撮合笔码。
9.如权利要求6所述的汉字笔码输入法,其特征在于,将汉字中常用的 部首设定为部首组合,而将汉字中常见的结构设定为普通组合,在拆字取码 过程中考虑部首组合时,所述取码次序为明码、暗码、独立或游离的单笔 码、不在首码位的部首组合的次码、在首码为的部首组合的次码。
全文摘要
本发明提供一种汉字笔码输入法,其中将汉字视作由至少一线段构成,并将所述线段归为三种单笔码,即横笔、竖笔和斜笔,横笔表示汉字中的横,竖笔表示汉字中的竖和弯钩,斜笔表示汉字中非横非竖线段,通过至少两单笔码组合形成多个结构笔码,结构笔码包括由至少两单笔码相互连接或交叉形成的结合笔码和由至少两单笔码相互撮合形成的撮合笔码,将单笔码、结合笔码和撮合笔码按照不同分组设定于计算机键位,该输入法包括利用所述结构笔码和单笔码将待输入汉字进行拆分;从所拆分出结构和剩余的单笔码中选取最多三个笔码;及键入所述笔码所对应的键,输入该汉字。
文档编号G06F3/023GK101303623SQ200710102878
公开日2008年11月12日 申请日期2007年5月11日 优先权日2007年5月11日
发明者陈新伟 申请人:陈新伟
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1