归一中文编码方法及其输入键盘的制作方法

文档序号:6330548阅读:269来源:国知局
专利名称:归一中文编码方法及其输入键盘的制作方法
归 一 中文编码方法及其输入键盘
本发明涉及一种计算机汉字输入方法,具体是一种汉字结构笔顺数字和部首偏旁混合编 码方法及其键盘。
汉字计算机输入法发展到今天,方法巳逾数百种。虽然种类繁多,但目前尚无一种能为 全民大众所接受的简单、易学易记、易于普及的方法,它仍然存在着输入速度快的就难学难 记难拆分的弊端,如五笔字形;容易学的就重码率高,输入速度就慢,如拼音码。因此,现 行的方法都很难普及推广,汉字计算机输入法至今仍是一个未能很好破解的难题。
本发明的目的,在于提供一种易学易记、符合汉字规律、见字即能出码,结构拆分及笔 顺原则规范化,重码率低的归一中文编码方法及其键盘,较好地破解了汉字计算机输入法的难题。
本发明的技术方案如下
本发明的归一中文编码方法及其键盘,发明内容包括
1、 利用含数字键、字母键和功能键的标准键盘,以字母键代表汉字的偏旁部首及其引申 义字和代表汉字断开的第一部分笔画数目0、 一、 二、三、四、五、六、七、八、九数目字, 它们统称为键面字根,同时还代表用阿拉伯数字l、 2、 3、 4、 5分别表示汉字的横、竖、撇、 点、折按笔顺组成的双码。每个汉字输入时,最多取四个码元,其中如果断开的第一部分是 键面字根,则作为该字的首码,第二部分最多取三个码元;如果第一部分不是键面字根,则 第一部分需取两个码元,取所述第一部分的笔划数目字作首码,第一部分前面是键面字根则 取键面字根,否则取第一部分的前面两个笔划组成的双码作为第二个码元,此时,该字的第 二部分最多取二个码元。
2、 进行汉字输入时,将汉字字形分为五类。
U)包围结构凡字中两笔以上的笔划被其它笔划两面以上包围,且被围笔划不与包围 的笔划紧密粘连的结构。取包围部分作该字的第一部分。
(2) 上下结构凡字能上下断开的结构。其断开有以下原则单笔不断(但能截然分开
的横笔例外)、两笔开取、截取到横、是断非取、单笔不留、字大优先、不拆整体、撇捺相随、 连"^"取等。
(3) 左右结构凡字能左右断开的结构。其中若字的左边也是个完整字,则取其为该字 的第一部分;字的左边若是一个整体结构的,取该整体为字的第一部分。
(4) 镶嵌结构两笔以上,形状相同的笔划对称镶嵌在同一部件内的结构。取被镶嵌部 分作为该字的第一部分。
(5) 独体字无法断开的字叫独体字。
3、 定首码进行汉字输入时,首先将汉字按字形结构断开分成两部分,定出该字的首码, 如果断开的第一部分是键面字根,则键面字根作为该字的首码。如果断开的第一部分不是键 面字根,则以第一部分的笔划数数目字作为首码,用0、 一、 二、三、四、五、六、七、八、
九中的一个表示即
A、 第一部分是几笔笔划,首码即为几。如军,第一部分是"^", 二划,首码为二;如 念,第一部分是"今",四笔,首码为四。
B、 第一部分笔划超过九笔,首码仍为九。如慰,第一部分为"尉",11划,首码仍为九; 如翻,第一部分为"番",12划,首码仍为九。
C、 无法断开的独体字,其首码定为0。
4、 利用上述键盘输入汉字的笔形码时,笔顺规则除了现有的从上到下、从左到右、从外 到内、先里头后封口、先中间后两边、先横后竖、先撇后捺等原则外,还包括新制定的以下 原则。
①先折后竖、②先主后附、③下档横收、④下通竖收、⑤先里头后包围、⑥先点先横先 写折、⑦后点后横后撇捺
5、 每个汉字的输入方法是,先根据汉字拆分原则定出汉字的第一部分,如果第一部分是 键面字根,则取该键面字根作为首码输入。如果第一部分不是键面字根,则第一部分需取两 个码元,取所述第一部分的笔划数数目字作为首码,第一部分前面是键面字根,则取键面字 根,如不是则取第一部分的前两个笔划组成的双码作为第二个码元。第二部分如果是键面字 根,则依序取键面字根,否则依笔顺组成双码输入。如果取单笔后是键面字根,则单笔重取 组成双码,再取键面字根,如果最后仅剩单笔,则重复笔划数字代码组成双码。第一部分是 键面字根的,该字第二部分依序最多再取三个码元,第一部分不是键面字根的,则第二部分 依序最多再取两个码元,当汉字输入中出现重码时,再以数字键选择完成汉字输入。
6、 采用本发明进行汉字输入时,可利用计算机的标准键盘上的英文字母键,分别代表 25个双码数键,每个字母键代表一个二位的数字键即
11:T12:R13:E14:w15:Q
21:Y22:u23-I24:025:p
31:G32:F33:D34:s35:A
41:H42:J43:K44:45:M
51:N52:B53:V54:c55:X
7、本发明还可用于常用汉字词组的输入,每个词组均需输入四码,双数码键计为一码。 其中
(1) 两字组每字各取前两个码元。
(2) 三字词前两字各取其首码,后一字取该字的前两个码元。
(3) 四字词按顺序取每字的首码。
(4) 多字词只取第一、二、三字及最后一字的首码。 二、以下结合汉字编码示例分步详述本发明
图l是笔形代码图。
图2是汉字部首偏旁及其引申义字和双数码与键盘对应设置关系的一种实施方案图。
图3是键面字根在标准键盘上对应分布的实际效果图。 釆用本发明在计算机上输入汉字时
1) 、按字形结构将汉字断开分成两部分,第一部分是键面字根的,则用对应的字母键作 首码。示例如下 a
说^i湖L、?呆旦口守=山好盒女进^;L庆^广岭虫山
代表第一部分笔划数的数目字也可代表键^字根作首码。 丽--" 示=二吾五五 衮^六
2) 、第一部分不是键面字根的,则用代表第一部分笔划数数目字作首码。第一部分需取
两个码元
a、 用f^表第一部分的笔划数数目字作首码
军二二春=五念念四凯皇六厅^二慰£九翻^九毯皇四
b、 第一部分第二个码元的取法
① 、取第一部分前面的键面字根作第二个码元。 拿盒六、人货^四、人凯皇六、山赶盒七、土
② 、取第一部分头两笔组成的双码数键。
军二二、g春=五、11慰暨九、li毯皇四、M
3) 、第一部分取码完成后,第二部分笔形码单笔重取的原则。
a、 单笔入字根若取单笔以后是字根则单笔重取一次,进入字根,如
柏i木、M、日住A人、44、王镪复金、11、 51、 口 铷i金、51、 il、 口
但笔画粘连、穿插不拆如谧# i 、心、j 蕺#朴、口、耳
应为谧h i 、 H、 41、蕺—卄、口、 12、
b、 余下单笔笔形两码取足,'余一笔下面无笔画,则余下单笔重取一次,有字根则取下 部字根的头一笔。如 、
扎t净、51 令厶人、4^、必 迭L i_、 li、 U、 M 啥=S 口、人、11、 22 骼量九、S、 M、 42
4) 、键面字根引申义字的输入
a、 键面字根引申义字代表的偏旁部首如下
水C )、金(,)、耳(卩P)、人Cf )、手(净)、心(个)、犬0 )、草("、丝(纟幺)、言(i )、之(;L)
b、 键面字根的助记词金木水火土,耳目人手心,犬月山王石,广(广)口禾a(穴)之, 日女言丝草,五区键名知。
C、键面字根引申义字的输入如手,偏旁"净"的引申义字,击"0"键一键输入。代
表第一部分笔画数的数目字,如"二",也可看作汉字,击F键一键输入。处于第二个位置的 偏旁"月"的引申义字月,击F键二次输入。同样的道理,代表部首的引申义字草, 击"X"键一键输入,处于第二个位置的"山",击"D"键二次输入。
同时,它们在作为词组输入时,引申义字所在的键击两次如水果,水字所在键"E"
键两次,果则取头两码,如水果=卫、g、乙、2 。如妇女,"妇"取头两码,女击所
在键"B"键两次,则妇女=女、51、 B、 B。如女人,"女"击所在键"B"键二次, "人"击所在键"I"键两次,则女人=B、 B、 I、 I 。如二月,"二"击所在键"F"键 两次,"月"击所在键"F"两次,则二月=F、 F、 F、 F。
5) 、重码处理当输入的汉字出现重码时,相同一组汉字可显示在屏幕上,每个汉字的 近旁同时显示出一个代表该汉字的数字,最后敲击代表欲输入汉字的数字键,即可完成对该 汉字的输入。
6) 、汉字输入和击键示范
要输入某个汉字,先判定该字结构,然后按结构断开分成两部分,它有如下两种情况。
(1) 、第一部分是键面字根的,则以其作首码,第二部分最多取三个码元。如
喝,左右结构,第一部分为"口",键面字根作首码,第二部分为"曷",取"日"、"勺"、
"人"多余的"t"笔舍去,其中"勺"不是键面字根,按书写笔顺编成双数码2i,艮P 喝H 口、日、n、人。
艺,上下结构,第一部分为第二部分为"乙",单笔重取,艺=卄、3。 庆,包围结构,第一部分为"广",第二部分为"大",取"一J",剩下"、"笔重取,
即庆C广、n、必。
痴,包围结构,第一部分为"广",第二部分为"知",取"戶"、"—乂"余下"、"笔
与下面的键面字根"□"的头笔"I "组成双数码,即痴^广、1L、 11、 42。
棉,左右结构,第一部分为"木",第二部分为"帛",第二部分取"J "、"日"、"门",
其中"j "笔以下是键面字根"日",单笔"j "重取,即棉i木、11、日、21
幽,镶嵌结构,第一部分为"山",第二部分为"幺"、"幺",即幽虫山、纟、纟
(2) 、如果第一部分不是键面字根,则第一部分取两个码元。取所述第一部分的笔划数
数目字作首码。第一部分前面是键面字根,则取键面字根,否则取第一部分的前两个笔划组
成的双数码作为第二个码元。第二部分最多取两个码元,如
鹃,左右结构,第一部分为"葛",不是键面字根,以"I"的笔划数"七"作为首码,第 一部分"l"的前面部分"口",是键面字根,取"口"作第二码。第二部分为"鸟",取"勺"、
"、v',即鹃1七、口、 M、並
得,左右结构,第一部分为"4 ",不是键面字根,以"4 "的笔划数"三"作首码,第 一部分"4 "的前面部分不是键面字根,则以第一部分"4 "的头两笔"j "、 " J ",组成双 数石,21作为第二个码元,第二部分为"1",取"日"、"一"、"一",艮P 得L三、S、日、ii。
爽,镶嵌结构,第一部分为"大",不是键面字根,则以"大"的笔划数"三"作为首码, 第一部分"大"的前面不是键面字根,则以第一部分"大"的头两笔"一"、"〗"组成双数 码S作为第二个码元,第二部分为"》"、""艮卩爽么三、U、 24、 M。
7) 、常用词组输入方法示例。
(1) 、两字词
军队=二、 45、 & 、人 思想=五、25、九、木 我们=0、 31、 4 、 42祖国=四、45、三、25
(2) 、三字词
湖南省=、? 、 二、三、23 国务院=三、三、、— 专利法=0、禾、? 、 土 创造性=四、i_、十、31
(3) 、四字词
五湖四海=五、?、四、?党纪国法=五、纟、三、?
(4) 、多字词 中华人民共和国=0、四、人、三
三、关于汉字结构的归类、拆分断开、笔顺规则及示例
这一部分与本申请人已申请的01117593.1号中国专利的相应内容基本相同,只在一些细 节上略有不同。
1、汉字字形结构的归类和拆分断开
汉字字形结构共有8种,全包围、半包围、上下、上中下、左右、左中右、镶嵌、独
体字等8种结构,现将它们合为以下五类。
(1)、上下结构凡字能上下截然断开的结构叫上下结构,断开取上部分作该作字的
第一部分。
a、 单笔不取字单笔不取,但能截然分开的横例外。如良、天、千、我单笔不取, 首码为0。即Z键
而豆、丽、亘其第一部分为"一"横, 一画,首码均为"一",即G键。
b、 两笔开取两笔作为部首或两笔以上笔画可断。如 羊^二 衣^二 弊魈九 翼翌六
C、,取到横对f横竖笔画相,的字以横,以上部分作为第一部分。如:
具=六 表=四 典=六 甚=六
d、 是断非取是断开而不是取出字根作第一部分。如 善^二 羌^二 养^二 而非取出"羊"字。
e、 单笔不留断开剩下单笔,粘连不留,算作独体字。如 广、亡、严、亟等。
f、 撇捺相随断^f横笔下,撇捺两笔,连同撇捺截取。如 恭4六基4八誉$六巷6六
g、 字大优先上部是字,可按字断开,但优先取笔画多的字。如 分^八盆盆分 慈羞九 拿盒合
h、不拆整体 i
兴 主 乂
益=五 贵=五 前=三 舞=八
如骨=五常-五学=五帝=六 璺=九
(2) 、左右结构凡字能左右截然断开的结构,取左边部分作第一部分。
a、 整体断开左边是整体的,取整体作第一部分。 如师2 二 疆4六 新4九
b、 字断开左边是字的,取字作第一部分。
如鹕邀九 雌^六 雠&八 邶^五
(3) 、包围结构凡字中两笔以上笔画被其他笔画两面以上包围,且被包围笔划不与包 围的笔划紧密粘连的结构叫包围结构。取包围部分作第一部分
a、 全包围四面包围。
如回S三 国S三 囱9四 囟台四
b、 半包围二面以上包围。
如厅[二 区^二 这^1_ 裁,六 C、字包围包围部分是字的。
如-毯皇四 彦^六麂塵九磨歷九 其中另有单笔不围,如马寸鸟与叉勺等作独体字,但也有例外如闩氕。还有笔划粘连不 围,如日月巨臣目田皿勿民等作独体字
(4) 、镶嵌结构两笔以上,形状相同的笔划对称镶嵌在同一部件上的结构。取被镶嵌部分 作第一部分
如巫工三 芈也三 爽么三噩£王
(5) 、独体字无法断开的字叫独体字,其首码定为0。 如大=0 中=0 事=0 我=0 2、笔顺规则
汉字笔顺自古以来就是一个无法统一、规范的难题。由于汉字的笔顺规则只有先横后 竖、先撇后捺等七条,而先横后竖对于"上"、"非"等字的先竖又不能解释,致使汉字笔划 书写无章可循。大家各凭爱好,使很多字出现了几种写法而又无法判定其对与错,缺乏规范 化。如"出"字写法有"屮出、"S出、I屮出等,因此在小学教学中不得不允许几种写 法,如车、皮、匠、五、肃等字也有同样问题,对汉字的教学带来很大的不便,也使得计算 机的汉字输入和汉字检索缺乏对笔顺规则的规范化,不利于迅速对汉字进行编码。本发明结 合汉字造字规律和现行约成俗定的正确写法,新制定了七条笔顺规则,加强了汉字书写的规 范性。
(1) 、先里头后包围对于"这、建、函、幽"等半包围形状的字先写里头再写包围部 分。如连车、1_、连; 函承U函
(2) 、先折后竖折笔与竖和竖撇等笔划相交时,先写折笔。 如队3 、 |5 、队; 报孑、^7、邪、报
(3)、先主后附 一个汉字或字的其中一个部分都有一个为主的笔划,称为主笔划,而 其它的笔划是依附在主笔划之上,称为附笔划。主笔划先写,如 匕乙为主,Z为附,写法L、匕; 飞乙为主, <为附,写法1、飞; 兆儿为主,写法乂、^、孔、兆; 隶f为主,写法,、隶; 上I为主, 一为附,写法I 、卜、上; 藏J为主,户为附,写法厂、!f、r、
(4) 、下挡横收竖笔底端被挡住,则封挡的笔划作为末笔,如 土十、土;生^t、冲、生;
由-8、南、由; 鹿广、/、户、鹿;
(5) 、下通竖收竖笔或竖钩下面是通的,则竖笔或竖钩作为末笔。如 中口、中 串吕、串
甲-日、甲 事多、事
(6) 、先点先横先写折。
a、 凡点的位置在字的左上、正中的字,先写点划。 如头、斗、为、主、永、良、义等字
b、 长横与竖划或单笔折相交的字,先写长横。 如十、丰、廿、甘、七、寸等字
C、折笔折的方向向左的字,先写折画。 如刀、力、乃、及等字
(7) 、后点后横后撇捺。
a、 点的位置在字的右上、右下、左下的字,后写点划。 如戈、书、甫、玉、刃、太等字。
b、 长横与多笔划相交,中有折笔,横笔后写。 如世、舟、母、册等字
C、凡在字或一个整笔形中,撇捺是最后两笔。 如火、夹、爽、木、来、臾等字 本发明是完全按照汉字的自然组合规律,根据字形结构将汉字一分为二,定出第一部分。 用一、二,三、四.五,六,七.八,九,0代表第一部分的笔划数数目字,选用41个常用的偏旁部 首及其引申义字作为键面字根,定出汉字的首码。其余是键面字根的,用键面字根代表,否 则用汉字的笔划依笔顺组成双数码。这样大大减轻了对键码的记忆负担,从而使汉字编码十 分轻松,至此,汉字编码依据汉字的结构和笔顺这两个与生俱来的固有特点,才真正使汉字 编码符合了汉字的自然规律,使汉字"万码奔腾"的局面,归于一码。
本发明在用于计算机汉字输入时,输入速度非常快,重码率很低,而且方法简单,易学
易记、易于推广普及,不需要任何专业培训,即可上机操作,在电脑上输入汉字。同时,本 发明还制定了汉字结构的拆分断开和笔顺的规则,解决了汉字以往在结构的拆分断开和笔顺 规则方面无法统一的问题,便于计算机汉字输入的规范化。本发明符合汉字规律,见字即能 出码,可广泛应用于汉字检索和计算机汉字输入。利用本发明可以制作汉卡,或通过软件手 段构成一个汉字输入及处理系统。同时,也可用于查字典、词典,将汉字电脑输入和査字典 融为一体。
权利要求
1、一种计算机汉字结构笔顺数字和部首偏旁混合编码输入法,包括如下步骤(1)、选择组成汉字的51个偏旁部首及其引申义字和代表首码部分笔划数目的0、一、二、三、四、五、六、七、八、九数目字作为汉字编码形码码元,并称之为键面字根,其与键盘的键位对应关系如下A(35)五、石B(52)女C(54)丝(纟、幺)D(33)三、山E(13)水(氵)F(32)二、月G(31)一、犬(犭)H(41)六、广、疒I(23)人(亻)J(42)七、口K(43)八、禾L(44)九、宀、穴M(45)之(辶)N(51)日O(24)手(扌)P(25)心(忄)Q(15)土、士R(12)木S(34)四、王T(11)金(钅)U(22)目V(53)言(讠)W(14)火X(55)草(艹)Y(21)耳(阝、卩)Z(0)的并利用数字1、2、3、4、5分别表示汉字的笔划横、竖、撇、点、折组成双码作为编码码元。(2)、在输入汉字时,按照汉字的五种结构,即包围结构、上下结构、左右结构、镶嵌结构和独体字结构,将汉字断开,分成两部分。如果第一部分是键面字根,则取该键面字根作为首码,如果第一部分不是键面字根,则第一部分需取两个码元,取所述第一部分的笔画数数目字作为首码,第一部分前面是键面字根,则取键面字根,如不是则取第一部分的前面两个笔画组成的双码作为第二个码元。第二部分如果是键面字根,则取该键面字根,否则依笔顺组成双码输入。如果取单笔后是键面字根,则单笔重复组成双码,再取键面字根。如果最后仅剩单笔划,则重复该笔划数字代码组成双码。
2、 根据权利要求1所述的计算机汉字输入法,其特征是汉字按结构断开定出第一部分有 以下原则单笔不取、单笔不留、两笔开取、截取到横、是断非取、撇捺相随、字大优先、 不拆整体、连"^"取、整体断开、字断开等。
3、 根据权利要求1所述的计算机汉字输入法,其特征是汉字按结构断开,如果第一部分不是键面字根,则其首码为第一部分的笔划数数目字,其法则是根据第一部分笔划,首码 用O和一、二、三、四、五、六、七、八、九数目字的一个表示。艮P:A、 第一部分有几笔笔划,首码即为几。如军、留、形其首码分别为二、五、四。B、 第一部分笔划超过九笔,首码仍为九。如慰、翻、其首码均为九。c、无法断开的独体字,其首码定为0。
4、 根据权利要求1所述的计算机汉字输入法,其特征是汉字按笔顺取码时,笔顺原则除了现有的从上到下,从左到右,从外到内,先里头后封口、先中间后两边、先横后竖、先撇后捺等原则外,还包括新制定的以下原则 ①先折后竖、②先主后附、③下档横收、④下通竖收、 ⑤先里头后包围、⑥先点先横先写折、⑦后点后横后撇捺。
5、根据权利要求1所述的计算机汉字输入法,其特征是输入汉字的词组的方法包括:(1) 、两字词每字各取前两个码元。(2) 、三字词前两字均各取其首码,后一字取该字的前两个码元。(3) 、四字词按顺序取每字的首码。(4) 、多字词只取第一、二、三字及最后一字的首码。
全文摘要
本发明涉及计算机汉字编码技术,具体是一种汉字结构笔顺数字和部首偏旁混合编码及其输入键盘。本发明根据汉字的五种字形结构,将汉字一分为二,定出汉字的第一部分。用一、二、三、四、五、六、七、八、九、○代表第一部分的笔划数,并选用41个常用的偏旁部首及其引申义字,对应放置在标准英文键盘的26个字母键上,作为键面字根,代表汉字的首码。其余编码是键面字根的,则用键面字根代表,否则用汉字的笔形代码,按照汉字的书写笔顺组成双数码,进行混合编码。方法简便,易学易记,从而提供了一种符合汉字自然规律,见字即能出码,输入速度快,重码率低,结构拆分及笔顺原则规范化的汉字编码方法。
文档编号G06F3/023GK101359253SQ200710035469
公开日2009年2月4日 申请日期2007年7月30日 优先权日2007年7月30日
发明者张善淼 申请人:张善淼
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1