数字式汉字心角处理系统的制作方法

文档序号:6603772阅读:358来源:国知局
专利名称:数字式汉字心角处理系统的制作方法
技术领域
本发明涉及一种汉字的笔形编码及其相应的数字电脑输入键盘。
汉字是中国特有的文字,是由一些基本的笔划构成的方框形图案。目前虽有许多汉字编码输入方法,但他们仍存在着学习较难或重码较多的缺点。如“四角号码”编码法,它虽然抓住了汉字四角这个外部特征,但忽略了汉字的内部特征,故重码太多。又如中国专利85101817公开的“安子介式汉字笔形电脑编码及其键盘”和清华大学出版社1995年6月出版的《纵横汉字系统》等,它们基本上是四角号码的基础上增加了偏旁的2位码,从四角码变到了六角码,但由于取码部位和方法未作根本改进,因而重码依然较多。在已公开的这类汉字输入方法中,有的虽无重码,但有一些字不是按规则编的码,使用学习不便,没达到易学易用的目的。
本发明的目的是提供一种数字式汉字心角处理系统。在“四角号码”的基础上,对汉字作进一步分解,即对取码部位和笔画的编码方法进行改进,使其既有四角号码易学易用、不易忘记的优点,又能克服重码多的缺点。
本发明的具体方案是把汉字笔画分成“撇、横、竖、点与捺叉、插、方、角、人、小”10类,依次用0至9这10个数作它们的代码,在汉字规定的部位上取码,并在数字键盘上输入相应的数码,其特征在于A.把10类汉字笔画分别用1位数码或2位数码或4位数码作代码;B.把汉字分为包围型、非包围型、交叉型三类结构,其中包围型分解为“框”和“心”,非包围型分解为“字旁”和“字身”或两个字身,交叉型不分解;C.把字身再分解为两字旁,但交叉型字身不分解;D.字旁取2码,字身取4码,按从“框”到“心”,从左上角到右下角、从上到下的顺序和部位取码,分别编为心角6位数字码,心角8位数字码。
下面结合笔画分类及编码表、汉字常见包围结构和字例表以及心角编码字例表对本发明进一步说明。
由笔画分类及编码表可知本发明借用“四角号码”的编码方法,把汉字笔画分成“撇、横、竖、点与捺叉、插、方、角、人、小”10类,依次用0至9这10个数作它们的代码,在汉字规定的部位上取码,并在数字键盘上输笔画分类及编码表
汉字常见包围结构和字例表
心角编码字例表
入相应的数码。前四类是单笔画,其余的是复笔画。
从笔画分类及编码表、汉字常见包围结构和字例表、心角编码字例表进一步得知本发明对汉字作了分类,A.把10类汉字笔画分别用1位数码或2位数码或4位数码作代码;B.把汉字分为包围型、非包围型、交叉型三类结构,其中包围型分解为“框”和“心”,非包围型分解为“字旁”和“字身”或两个字身,交叉型不分解;C.把字身再分解为两字旁,但交叉型字身不分解;D.字旁取2码,字身取4码,按从“框”到“心”,从左上角到右下角、从上到下的部位和顺序取码,分别编为心角6位数字码,心角8位数字码。
一.本发明在汉字笔画编码上作了新的规定当“撇、横、竖、点与捺”类笔画取2码或4码时,在它们的代码后面加1个0或3个0。例“旧”中的“丨”笔,取2码为20,取4码为2000。
当“叉”或“人”两类笔画取2码时,在其代码“4”或“8”后加上它们各自第二笔画的代码;当取4码时,在其2码后再加上第一、第二笔画的代码。如“全”中的“人”,在心角6位数码中取83,在心角8位数码中取8303。
在“插”类笔画中,与另两笔画相交的笔画叫作主笔画,当“插”类笔画取2码时,在其代码“5”后加上主笔画的代码,当取4码时,在其2码后依书写序顺加上另两笔画的代码。如“草”中的“艹”,在心角6位数码中取51,在心角8位数码中取5122。
当“方”与“角”类笔画取2码时,在其代码的前或后加一个0。
当“小”类笔画取2码时,在其代码9后加上中间笔画的代码,取4码时,在其2码后依书写顺序加上另两笔画的代码。如“系”中的“小”,在心角6位数码中取92,在心角8位数码中取9203。
本发明为了异化重码,作了几个特殊规定(1)“十”的2码取40,4码取4012;(2)左钩取2,如“刂”的2码取22,4码取2022;(3)“八”取一码时作8,取2码为03,4码为0030,(4)“讠”在6位数字码中取2码时,依“言”取为36;(5)若干个相同笔画并排在一起取2码时,第一码取相同笔画的个数,第二码取笔画的代码。例如“灬”取43,“彡”取30;如只取一码,则取笔画的个数。
二.本方法把汉字的结构分为三类1.包围型它又分为全包围、三面包围、两面包围、角包围、以及由两个不可分离的包围结构组成的相连包围。例如国、巨、王、这、庆、鸟、与。包围型结构的汉字在外包围的部分叫“框”,被包围的部分叫“心”。
2.非包围结构它又分为有不相连笔画的分离型和笔画全部相连的相连型,例如,合、鱼、千、克。
3.交叉型它又分为不含包围结构的纯交叉型和含有包围结构的包围交叉型。例如,十、车、内、甲、申、电。“内”和“甲”的内部的笔画只在上部或下部伸出框外,叫全包围交叉型;“申”和“电”的内部的笔画在上和下都伸出框外,叫半包围交叉型。“心”伸出框外的部分叫“外心”,在框内的部分叫“内心”。
本发明根据汉字的类型、部首,各部分的纵横排列的方向,按分离优先、交叉不拆的原则,把字分为若干个单元,小的单元叫字旁取2位数字作代码,大的单元叫字身取4码,字身一般又可分作两字旁。
当把一个汉字分解成一个字旁和一个字身时,用字旁的2码与字身的4码合起来表示一个汉字,即为心角6位数字码;当把汉字分解成两个字身各取4码时,即为心角8位数字码。
三.字旁和字身的分解规则如下1.在心角6位数字码中,包围型汉字的字旁和字身的划分是框作字旁,心作字身。例如“匡”的分解是“匚”作字旁、“王”作字身。
2.在心角6位数字码中,非包围型汉字的字旁和字身的划分是A.如能分解为两个并列的部分,那么当其中只有一部分的笔画超过3画时,笔画少的部分作字旁,另一部分作字身,例如“刚”中的“刂”作字旁;如这两部分的笔画都不超过3画,当笔画数相等时,取右面或上面的部分为字旁,当笔画数不相等时,取笔画少的作字旁。例如,“亿”中“乙”作字旁,“仃”中的“亻”作字旁;如这两部分都超过3画,则当笔画数相差不超过3画时,取左面或上面的部分作字旁,当笔画数相差超过3画时,取笔画少的部分作字旁。例如“耕”和“期”中的“耒”和“月”作字旁。
B.如汉字正好是分离或相连的并列三部分时,则把第一部分字旁,另两部分合作字身,如“糊”中的“米”作字旁,“胡”作字身。
3.在心角8位数字码中,包围型汉字的划分是“框”和“心”各作一字身,各取4码。
例如“街”中的框“彳”和心“圭”各作一字身取4码,其编码是08414112。
4.在心角8位数字码中,非包围型汉字的划分是A.如能分解为两个并列部分则各作一字身;B.如正好分解为并列的三部分,则两边的部分合作一包围型字身,中间部分作一字身。
例如“糊”中的“米…月”作一字身,“古”作一字身。
5.交叉型汉字和笔画数不超过3画的汉字皆只作字身取4码,不足6或8码的部分添0。
如“申”取6码时为564600;取8码为56460000;“于”取6码为104200,取8码为10420000;为异化重码在心角6位数字码中,下列部首只作字旁,但它们单独作字时照上述方法分解艹木竹酉页口齿鱼骨革金钅冖黑羽鸟皿心髟攵讠。
6.本发明将字身再分解为两字旁的规则是A.如字身是包围型的,则框和心各作一字旁,但如框的左上角附有一撇时,仍作包围结构看,把撇作为框的左上角的笔画;例如字旁“白”的取码为01;B.如字身是非包围型的,且能分作并列的两部分,则各作一字旁;如“覃”中的字身“早”,分为“日”和“十”两字旁;C.如字身刚好是分离或相连的并列3部分,则作为二面包围类型把框和心各作一字旁。
如“赢”中的下部刚好是月、贝、凡并列,把“月…凡”作框, “贝”作心。
四.字旁和字身的编码方法(一)字旁的编码1.包围型字旁的取码是角包围则取包围框的上一边的笔画代码和心的左上角的笔画代码;多层包围取最外框和最内的心的左上角代码;其他包围结构取框和心的左上角笔画的代码。
例如字旁“日”取码为61。
2.非包围型字旁的取码是取它的左上角和右下角的笔画代码,或取上下或取左右笔画的代码。例如字旁“欠”取左上角和右下角代码各为08,而字旁“文”的编码为34。
如果字旁分离为并列的三部分时,按两面包围结构取码。如“流”中的“ ”作字旁,编码为02。
如字旁是“叉、插、方、人、小”类笔画时,则取它们相对应的笔画的2码作为这个字旁的编码。如光的上部“ ”是“小”类笔画,取码为92。
如字旁的上部或下部含有包围结构时,则取其心的代码作为左上角或右下角的代码。例如“宿”中的字旁“百”的编码为81。
如“点”画在右上角时,则按右上角、左下角的部位次序取码。例如,犬38,戈35。
3.交叉型字旁的取码是如是纯交叉型,一般取左上角、右下角的笔画代码,当是叉、插、方、人、小等类笔画时,则按它们的2码取码。如“卅”取54,“艹取51”。
如是全包围交叉型,则按外心,左上角或左上角、内心的顺序取码。如由取56,“甲”取65。
如果是半包围交叉型时,取左上角、右下角笔画代码。例如“绳”中的字旁“电”取57。
(二)字身的编码1.包围型字身的取码是角包围分两种情况,当包围框的两边的笔画数相差不到2时,按上下顺序各取一码放在首和尾,心取2码放在中间,例如“沟”中的“勾”取0232;当框的两边的笔画数相差达2画时,或某一边是交叉结构时,则取笔画较多的一边为字旁,取2码放在前面,心取2码放在后面,例如“波”中的“皮”取4714;其他包围型字身,按框左上角、框右下角的部位和次序各取一码放在首和尾,心作字旁取2码放在中间;如汉字的框作字身码不足时,在框角代码的前面各添一个0。例如“国”的“口”作字身在左上和右下角各取2码,但它们都只能取一码6,故在这两个6前各添一个0,故“国”的心角8位数字码为06143106;又如“风”的8位数字编码是07430307。
2.非包围型字身的取码是按分得的字旁各自取码;当“点”画在右上角时,取右上角的码放在前面。
如“犬”作字身时,取码为3048。
3.交叉型字身的取码是A.纯交叉型,按左上角和右下角各取2码,左上角第2码取主笔画代码,右下角取码从左上角末取完的部位开始,末尾码不足时添0;例“耒”取5249,“木”取4090。
B.金包围交叉型,按外心、框左上角、内心、框右下角或框左上角、内心、框右下角、外心的顺序和部位取码,末尾码不足时添0;例“油”中的“由”其内心已被外心取完,故内心取0,码为5606。
C.半包围交叉型,按在上的外心、框左上角、内心、内心的延伸部分等4个顺序和部位取码;例“申”取5640,“曳”取5657。
D.半包围交叉型字身的左上角不构成“方”或“角”,则框的左上角取0。
例“隶”取5049,“巾”4702,“束”取5649。
4.异化重码的取码规则是交换首二码位置或交换末二码位置。
例“荭”和“蕴”的编码都是512112,若改“荭”的编码为512121,则可使两码区别开。
5.非汉字的符号一律按字身取码规则取4码放在末尾,前面的码一律取0。
例区位码为6019的“艹”取005122,区位码为6760的“丬”取008120。
本发明的优点是抓住了汉字包围结构的重要特点,把汉字的外部和内部特征统一在编码中,故重码很少。由于无字根、规则性强,所以易学难忘。字符集可扩充至大汉字集,且重码少。
权利要求
1.一种数字式汉字心角处理系统,把汉字笔画分成“撇、横、竖、点与捺叉、插、方、角、人、小”10类,依次用0至9这10个数作它们的代码,在汉字规定的部位上取码,并在数字键盘上输入相应的数码,其特征在于A.把10类汉字笔画分别用1位数码或2位数码或4位数码作代码;B.把汉字分为包围型、非包围型、交叉型三类结构,其中包围型分解为“框”和“心”,非包围型分解为“字旁”和“字身”或两个字身,交叉型不分解;C.把字身再分解为两字旁,但交叉型字身不分解;D.字旁取2码,字身取4码,按从“框”到“心”,从左上角到右下角、从上到下的顺序和部位取码,分别编为心角6位数字码,心角8位数字码。
2.根据权利要求1所述的数字式汉字心角处理系统,其特征在于汉字笔画中“撇、横、竖、点与捺”类笔画取2码或4码时,在它们的代码后面加1个0或3个0;“叉”和“人”类笔画取2码时,在其代码“4”或“8”后加上它们各自第二笔画的代码;当取4码时,在其2码后再加上第一、第二笔画的代码;“插”类笔画中,与另两笔画相交的笔画为主笔画;在“插”类笔画取7码时,在其代码“5”后加上主笔画的代码,当取4码时,在其2码后依书写序顺加上另两笔画的代码,当取4码时,在其2码后依书写顺序加上另两笔画的代码;“方”与“角”类笔画取2码时,在其代码的前或后加一个0;“小”类笔画取2码时,在其代码“9”后加上中间笔画代码,取4码时,在其2码后依书写顺序加上另两笔画的代码。
3.根据权利要求1所述的数字式汉字心角处理系统,其特征在于当把一个汉字分解成一个字旁和一个字身时,用字旁的2码与字身的4码合起来表示一个汉字,即为心角6位数字码;当把汉字分解成两个字身各取4码时,即为心角8位数字码。
4.根据权利要求1或权利要求3所述的数字式汉字心角处理系统,其特征在于在心角6位数字码中包围型汉字的字旁和字身的划分是字框作字旁,字心作字身。
5.根据权利要求1或权利要求3所述的数字式汉字心角处理系统,其特征在于在心角6位数字码中,非包围型汉字的字旁和字身的划分是A.如能分解为两个并列的部分,那么,当其中只有一部分笔画超过3画时,笔画少的部分作字旁,另一部分作字身;如这两部分的笔画都不超过3画,当笔画数相等时,取右面或上面的部分为字旁,当笔画数不相等时,取笔画少的作字旁;如这两部分都超过3画,当笔画数相差不超过3画时,取左面或上面的部分作字旁,当笔画数相差超过3画时取笔画少的部分作字旁;B.如汉字正好是分离或相连的并列三部分,则把第一部分作字旁,另两部分合作字身。
6.根据权利要求1或权利要求3所述的数字式汉字心角处理系统,其特征在于在心角8位数字码中,包围型汉字的划分是“框”和“心”各作一字身,各取4码。
7.根据权利要求1或权利要求3所述的数字式汉字心角处理系统,其特征在于在心角8位数字码中,非包围型汉字的划分是A.如能分解为两个并列部分则各作一字身;B.如正好分解为并列的三部分,则两边的部分合作一包围型字身,中间部分作一字身。
8.根据权利要求1所述的数字式汉字心角处理系统,其特征在于交叉型汉字和笔画数不超过3画的汉字皆只作字身取4码,不足6或8码的部分添0。
9.根据权利要求1所述的数字式汉字心角处理系统,其特征在于字身再分解为两字旁的规则是A.如字身是包围型的,则框和心各作一字旁,但如框的左上角附有一撇时,仍作包围结构看,把撇作为框的左上角的笔画;B.如字身是非包围型的,且能分作并列的两部分,则各作一字旁;C.如字身刚好是分离或相连的并列3部分,则作为二面包围类型把框和心各作一字旁。
10.根据权利要求1所述的数字式汉字心角处理系统,其特征在于包围型字旁的取码是;角包围则取包围框的上一边的笔画代码和心的左上角的笔画代码;多层包围取最外框和最内的心的左上角代码;其他包围结构取框和心的左上角笔画的代码。
11.根据权利要求1所述的数字式汉字心角处理系统,其特征在于非包围型字旁的取码是取它的左上角和右下角笔画的代码,或取上下或取左右笔画的代码;如字旁分离为并列的三部分,按两面包围结构取码;如字旁是“叉、插、方、人、小”类笔画时,则取它们相对应的笔画的7码作为这个字旁的编码;如字旁的上部或下部含有包围结构时,则取其心的代码作为左上角或右下角的代码;如“点”画在右上角时,则按右上角、左下角的部位次序取码。
12.根据权利要求1所述的数字式汉字心角处理系统,其特征在于交叉型字旁的取码是一般取左上角和右下角的代码,当是叉、插、方、人、小等类笔画时,则按它的2码取码;如字旁是全包围交叉型,则按外心、左上角或左上角、内心的顺序取码;如字旁是半包围交叉型时,则取左上角、右下角的笔画代码。
13.根据权利要求1或权利要求9所述的数字式汉字心角处理系统,其特征在于包围型字身的取码是;角包围分两种情况,当包围框的两边的笔画数相差不到2时,按上下顺序各取一码放在首和尾,心取2码放在中间;当框的两边的笔画数相差达2画时,或某一边是交叉结构时,则取笔画较多的一边为字旁,取2码放在前面,心取2码放在后面;其他包围型字身按框左上角、框右下角的部位和次序各取一码放在首和尾,心作字旁取2码放在中间;如汉字的框作字身码不足时,在框角代码的前面各添一个0。
14.根据权利要求1或权利要求9所述的数字式汉字心角处理系统,其特征在于非包围型字身取码是按分得的字旁各自取码;当“点”画在右上角时,取右上角的码放在前面。
15.根据权利要求1或权利要求3所述的数字式汉字心角处理系统,其特征在于交叉型字身取码分下列几种情况A.纯交叉型,按左上角和右下角各取2码,左上角第2码取主笔画代码,右下角取码从左上角末取完的部位开始,末尾码不足时添0;B.全包围交叉型,按外心、框左上角、内心、框右下角或框左上角、内心、框右下角、外心的顺序和部位取码,末尾码不足时添0;C.半包围交叉型,按在上的外心、框左上角、内心、内心的延伸部分等4个部位和顺序取码;D.半包围交叉型字身的左上角不构成“方”或“角”时,则框的左上角取0。
全文摘要
本发明涉及一种数字式汉字心角处理系统,它在四角号码的基础上,改进了笔画代码和取码部位,仍用10个数字给汉字编码,由于它码元少、规则性强、无字根、重码少、故易学易用,可用于计算机输入汉字。
文档编号G06F3/023GK1189645SQ97107350
公开日1998年8月5日 申请日期1997年1月28日 优先权日1997年1月28日
发明者谢力 申请人:谢力
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1